JP3606555B2 - システム・リソースのスケジューリングのためのシステムおよび方法 - Google Patents

システム・リソースのスケジューリングのためのシステムおよび方法 Download PDF

Info

Publication number
JP3606555B2
JP3606555B2 JP2000070538A JP2000070538A JP3606555B2 JP 3606555 B2 JP3606555 B2 JP 3606555B2 JP 2000070538 A JP2000070538 A JP 2000070538A JP 2000070538 A JP2000070538 A JP 2000070538A JP 3606555 B2 JP3606555 B2 JP 3606555B2
Authority
JP
Japan
Prior art keywords
user
time
dispatch
priority
limit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2000070538A
Other languages
English (en)
Other versions
JP2000284975A (ja
Inventor
ジョン・エフ・ハリス
マーク・ジェイ・ローレンス
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of JP2000284975A publication Critical patent/JP2000284975A/ja
Application granted granted Critical
Publication of JP3606555B2 publication Critical patent/JP3606555B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5027Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
    • G06F9/505Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals considering the load
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/48Program initiating; Program switching, e.g. by interrupt
    • G06F9/4806Task transfer initiation or dispatching
    • G06F9/4843Task transfer initiation or dispatching by program, e.g. task dispatcher, supervisor, operating system
    • G06F9/4881Scheduling strategies for dispatcher, e.g. round robin, multi-level priority queues

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Multi Processors (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Diaphragms For Electromechanical Transducers (AREA)
  • Luminescent Compositions (AREA)
  • Saccharide Compounds (AREA)
  • Hardware Redundancy (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、システム・スケジューラに関する。より詳細には、ユーザがディスパッチ主導型マルチプロセッサ・システムにおいてそれに対する資格を有するリソースをユーザに対してスケジューリングすることに関する。
【0002】
【従来の技術】
オペレーティング・システムには、ユーザが消費するシステム・リソースの量を制御するためにスケジューラが設けられている。G.A.デヴィソン(Davison)により1994年6月2日に出願された同時係属の米国特許出願第08/252864号には、このようなシステムが記載されている。
【0003】
多くの場合、コンピュータ・システムでは、多くのプログラムまたはユーザが並行して実行することが必要になる。複数のプログラムを実行するために1つまたは複数のプロセッサが使用可能になる場合もある。どのような1つのプロセッサも一度に1つのプログラムまたはトランザクションしか実行することができない。2つまたはそれ以上のプログラムが同時に実行することを要求し、1つのプロセッサまたは実行を必要とするプログラムの数より少ないプロセッサしかない場合、オペレーティング・システムは、どのプログラムが一度に1つのプロセッサまたは各プロセッサを使用できるかを決定しなければならない。通常、この決定は、それぞれのプログラムの相対的優先順位に基づいて行われる。通常、低速入出力動作が完了するのを待っているものなど、待機状態にあるプログラムは、「中断」され、したがって、その優先順位にかかわらず、そのプロセッサを求めて競合する資格はない。
【0004】
どのプログラムが特定の時点で1つのプロセッサまたは各プロセッサを使用できるかを決定することに加え、オペレーティング・システムは、優先順位が等しい(またはおそらくそれより低い)他のプログラムがそれぞれの順番を獲得できるように、実行を開始した後で、どのくらいの間、選択したプログラムがそれぞれのプロセッサを使用できるかも決定しなければならない。実行を開始した後で、どのくらいの間、各プログラムがプロセッサを使用できるかを決定するための既知の技法はいくつか存在する。最も単純な技法では、優先順位が最も高いプログラムが完了(または中断)までプロセッサの使用を維持する。しかし、これにより、このプログラムがそのプロセッサを「ホグ」し、他のプログラムを「飢えさせる」場合もある。他の既知の技法では、実行のために選択された各プログラムに対し、全プロセッサ時間のうちのシェアまたは「スライス」が与えられる。プログラムの全シェアは等しいものにするかまたは好ましいことに様々な要因に基づいて重み付けすることができる。全シェアに重み付けするための既知の技法の1つは以下の通りである。一部のプログラムは全プロセッサ時間のうちの「絶対」または確定シェアを指揮するよう定義され、他のプログラムは残りのプロセッサ時間のうちの「相対」シェアを指揮するよう定義される。絶対シェアは「先頭から取られ」、相対シェアはそれぞれの相対シェアに比例して残りを分割する。たとえば、第1のプログラムは40パーセントの絶対シェアで定義され、第2のプログラムは100の相対シェアで定義され、第3のプログラムは300の相対シェアで定義される。このシナリオでは、第1のプログラムが全プロセッサ時間の40パーセントを指揮し、第2のプログラムが全プロセッサ時間の15パーセントを指揮し、第3のプログラムが全プロセッサ時間の45パーセントを指揮することになる。
【0005】
1つのプログラムは、その絶対または相対シェア全体を必要としない場合がある。この絶対/相対シェア環境で超過分を割り振るための既知の技法は、最高絶対または相対シェアを伴うプログラムに超過分をすべて与えることである。超過分が全プロセッサ時間のうちのわずかな割合である場合、この既知の技法で十分であると思われる。しかし、多くの場合、全プロセッサ時間の半分など、超過分は相当な量であり、超過分をすべて1つのプログラムに割り振ることが最適ではない場合もある。
【0006】
システムのうち、ユーザがそれに対する資格を有する相対シェアは、現在、システム・リソースを求めて競合しているすべての相対シェア・ユーザの優先順位の割合に基づくものである。しかし、相対シェア・ユーザにとって必ずしもすべてのシステム・リソースが使用可能であるわけではない。リソースを求めて競合する複数の絶対シェア・ユーザが存在する場合、このような絶対シェア・ユーザには、システムの残りのシェアが相対シェア・ユーザ間で比例分割される前に、先にシステムの一部が与えられる。このような関係は一般に以下のように表すことができる。
残りのシェア=システムの100%−すべての絶対シェアの合計
【0007】
次に、残りのシェアは以下のように相対シェア・ユーザ間で比例分割される。
相対ユーザのシェア=残りのシェア*(ユーザの相対シェア/すべての相対ユーザの合計シェア)
【0008】
マイナー・タイム・スライスとは、スケジューラによる再検査のための割込みなしに所与のユーザが所有できるプロセッサ時間の量である。マイナー・タイム・スライスのサイズは、マシン速度と、あるいは顧客設定とに依存する。ユーザがディスパッチされると、CPUタイマはマイナー・タイム・スライスの時間の量で設定される。このタイマは、時間切れになると、減分して割込みを提示し、その結果、ユーザのマイナー・タイム・スライスが終了したことをスケジューラに通知する。
【0009】
限定ユーザ、すなわち、「リミットハード」ユーザとは、ユーザがそれに対する資格を有するプロセッサ・リソースの最大量を表すものとして限界値が定義されたユーザである。この限界値は、最大使用率シェアを表し、そのユーザのディスパッチ優先順位を計算するために使用する。通常、プロセッサ・リソースのうち、それぞれの最大許容シェアを超過するかまたは超過しそうなリミットハード・ユーザが掲載された限界リストが用意される。あるユーザが限界リストに掲載されている(またはそれ以外の方法で限界状況によって特徴づけられている)間、その使用のためにリソースがディスパッチされることはない。
【0010】
ユーザ作業をディスパッチする際に、人工時刻(ATOD)クロックが使用される。このATOD値は、マシンの時刻(TOD)クロックと同じ速度で増加するが、そのユーザ作業(オペレーティング・システム作業などの非ユーザ作業とは区別される)がマシンによって実行されている間に限られる。システム・リソースをスケジューリングするために少なくとも一部はATODに依存する現行システムでは、限定シェア・ユーザは、CPUリソースが使用可能であっても、その最大使用率シェアに達することが許されない場合がある。明らかなことに、アイドル・プロセッサ・リソース時間を含む低ロード状況では、アイドル時間の間、人工時刻(ATOD)値が十分な速さで移行するわけではない。したがって、実行中のリミットハード・ユーザのディスパッチ優先順位はATODに対して本来あるべき速度より速く移行し、時期尚早に限界リストに入る(すなわち、限界状況が与えられる)。さらに、活動状態の(非アイドル)プロセッサだけがそのリストを監視するので、ユーザが不必要に限界リスト上に保持される場合もある。低ロード状況(すべてのプロセッサを使用中として維持するのに十分な作業がない時間)では、活動状態のプロセッサの数が減少し、したがって、限界リストの監視頻度が低下する。このため、ユーザが限界リストから出なければならない時期からそれが出なければならないことをプロセッサが検出する時期までの時間が増加する。これまでは、プロセッサが活動待機状態にある間にこのユーザを限界リストから除去するためのメカニズムはまったく存在しなかった。このような状況では、プロセッサが実行すべきユーザ作業を一切持たず、したがって、活動待機メカニズムでループしている時間があり、限界リストの検査を行わせるような何かが他のプロセッサ上で発生するまで、限界リスト上のユーザはそこに存続する。
【0011】
その結果、上記のデヴィソン出願に記載されているような現行システムがそのうえに有するユーザが非常に少ない場合、または現行システムが使用中ではない場合、そのスケジューラは、ハード限界までの使用率を有することができるはずであるときにそのハード限界より少ないCPU時間をユーザに与える。コンピュータ・システム上のユーザが非常に少ない場合、不思議なことに、ユーザは資格を有するものより20%減以内の著しく少ないCPU時間を獲得する。その結果、特にCPU時間が売却される場合に、支払っただけのCPU時間のすべてを獲得できないユーザから苦情が出る可能性がある。逆に、請求できるときに、CPU時間が請求されないこともある。
【0012】
【発明が解決しようとする課題】
本発明の一目的は、低ロード状況でそのハード限界に極めて近いかまたは等しいシステム・リソースへのユーザ・アクセスの許可を容易にするためのスケジューラ・システムおよび方法を提供することにある。
【0013】
本発明の他の目的は、システム・リソースに関する最適請求を容易にし、請求の総額またはこのようなリソースの可用性に対するユーザの不快感を低減する、改良されたスケジューラを提供することにある。
【0014】
本発明の他の目的は、ユーザの優先順位を決定し、どのユーザが次に実行できるかを決定するためにシステムが使用するスケジューリング・アルゴリズムへのフィードバック・メカニズムとしてモニタ・データが使用される、システムおよび方法を提供することにある。
【0015】
本発明の他の目的は、限定アクセス権を有するユーザを早すぎない時期に限界リストに掲載し、遅すぎない時期に限界リストから除去することにより、このようなユーザに対してシステム・リソースをスケジューリングするためのシステムおよび方法を提供することにある。
【0016】
本発明の他の目的は、遅すぎない時期にリソースのスケジューリングを可能にし、早すぎない時期にリソースのスケジューリングを禁止することにより、限定アクセス権を有するユーザに対してシステム・リソースをスケジューリングするためのシステムおよび方法を提供することにある。
【0017】
【課題を解決するための手段】
第1のクロックを維持し、第2のクロックを維持し、ディスパッチ・プロセス中に実行すべき作業がある場合、ユーザが待機状況になっていないときのみ、他のユーザとともにディスパッチ優先順位順にユーザに対してシステム・リソースの使用をスケジューリングし、それ以外の場合にユーザ時間分だけ第1のクロックを前進し、ユーザ時間および待機時間分だけ第2のクロックを前進し、待機プロセス中に実行すべき作業がある場合、ディスパッチ・プロセスを呼び出し、それ以外の場合に待機時間の時間的調節を行い、待機時間が所定の値を超過したときに待機状況にあるユーザが存在する場合、待機時間分だけ第1のクロックを増分し、ディスパッチ・プロセスを呼び出すことにより、システム・リソースはユーザによる使用のためにスケジューリングされる。
【0018】
【発明の実施の形態】
上記の同時係属特許出願第08/252864号に記載されているシステムに対する改良である本発明の好ましい実施の形態によれば、オペレーティング・システムは、限定アクセス権を有するユーザを早すぎない時期に限界リストに掲載し、遅すぎない時期に限界リストから除去することにより、このようなユーザに対してシステム・リソースをスケジューリングする。
【0019】
したがって、活動待機ルーチンに組み込まれたモニタの使用により「ディスパッチ主導型」マルチプロセッシング・システムにおいて特定のユーザのCPU使用率をある絶対値に制限するためのシステムおよび方法が提供される。使用するメカニズムは、ユーザのリストであって、そのCPUリソースはそれぞれの消費量が限界値を超過しないように制限されなければならない。このようなユーザは「限界状況」を有するものとして特徴づけられる。あるユーザを低ロード状況でリストから除去しなければならない(このため、「ディスパッチ状況」に復元される)時期を決定し、その結果、それが使用可能であれば最大CPU使用率をそのユーザに供給するために、限界リストは活動待機監視される。本発明の好ましい実施の形態によれば、この活動待機ルーチン(プロセスまたはプロシージャとも言う)は、ユーザの優先順位を決定し、どのユーザが次に実行(ディスパッチ)できるかを決定する際にその有効性を強化するようスケジューリング・ルーチンを動的に調整するために監視されフィードバックされたパフォーマンス・データを使用して、限界リストからユーザを除去するためにディスパッチ・ルーチンを呼び出す時期を決定するために、限界リスト上のユーザを監視する。ユーザの限界リスト優先順位の1つのマイナー・タイム・スライス内に入るようATOD2が計算されたときに、ユーザはディスパッチ・ルーチンによって限界リストから除去される。
【0020】
ユーザ・タスクは、あるユーザのタイム・スライスの終わりを表すディスパッチ優先順位値に応じて実行されるようスケジューリングされる。この値は、時刻(TOD)フォーマットになっており、以下に詳述する。
【0021】
図1を参照すると、システム図は本発明の好ましい実施の形態のプログラミング(データおよび方法)構造を示している。このようなプログラミング構造としては、システム・リソース20、実時間クロック22、ユーザ最小シェア割当て24、ユーザ最大シェア割当て26、活動待機連続モニタ30、着信タスク32、ディスパッチャ40、スケジューラ44、ATOD2 21、ATOD23、オフセット25、限界リスト27、限界リスト上の存続持続時間(存続時間とも言う)29、ユーザの優先順位境界35、ディスパッチ・リスト37、最大降下18、TOD−TIED28を含む。以下に説明するように、このような構造間の連係によって本発明の方法の好ましい実施の形態が実現される。
【0022】
もう一度、図1を参照すると、動作に当たっては、線81が表すように、ディスパッチャ40は、着信作業32を探し、実行すべき何らかの作業がある場合にスケジューラ44によって設定された優先順位に基づいてそれを実行させる。線82が表すように、実行すべき作業がまったくない場合、ディスパッチャ40は活動待機連続モニタ30を呼び出す。線83が表すように、活動待機プロセス30は、着信作業32がないかどうかシステムを連続的に監視し、線82がさらに表すように、何らかの作業が到着したときにそれを実行するためにディスパッチャ40を呼び出す。線84が表すように、ディスパッチャ40は、ユーザがマイナー・タイム・スライスの終わりに達したときにユーザのディスパッチ優先順位を再計算するためにスケジューラ44を呼び出す。線85、86、87、88がそれぞれ表すように、スケジューラ44は、ディスパッチ優先順位計算への入力として、システム・リソース20、実時間クロック22、ユーザの最小シェア割当て24、ユーザの最大シェア割当て26を使用する。線89が表すように、スケジューラ44は、最後にATOD2が更新されてから実際にユーザを実行するために使用したCPU時間に待機時間(実行すべき作業がまったく使用可能になっていない場合)を加えた量だけATOD2を前進することにより、ATOD2 21を更新する。線90が表すように、スケジューラ44は、最後にATODが更新されてから実際にユーザを実行するために使用したCPU時間の量だけATODを前進し、本発明にとって重要な所与の状況下では待機時間分も前進することにより、ATOD23を更新する。更新されたATOD=前のATOD+最後にATODが再計算されてからのユーザCPU時間になる。線91が表すように、スケジューラ44は、優先順位計算に使用されるそのユーザのオフセット25を計算する。オフセット25は、ユーザのディスパッチ優先順位35を計算するときにATOD23の現行値からの変位として使用される。線92および93が表すように、ユーザのディスパッチ・リスト優先順位35(締切り優先順位または予測完了時間とも言う)は、スケジューラ44の計算に基づいて設定され、ATOD23の現行値とユーザのオフセット25のサイズに基づく境界内にある。線31および33が表すように、ユーザのディスパッチ・リスト優先順位35は、ディスパッチャ40がそれを実行を必要とする着信タスク32と見なすように、他の作業による優先順位順にユーザの作業をディスパッチ・リスト37に掲載するために使用される。スケジューラ44は、そのユーザをディスパッチ・リスト37に掲載するためにATOD23を使用してユーザのディスパッチ・リスト優先順位35を計算し、そのユーザを限界リスト27に掲載することによりそのユーザのリソース消費量を制限する必要があるときにATOD2 21を使用して限界リスト27の優先順位を計算する。線95が表すように、計算された上部境界はTOD−TIED28と呼ばれる。線94が表すように、計算された下部境界は最大降下18と呼ばれる。線96が表すように、最大降下境界18の外側になるようにスケジューラによってそのディスパッチ優先順位35が計算される限定シェア・ユーザは、限界リスト27に追加される。線97および98が表すように、限界リスト27上の存続持続時間29の予測は、ATOD2 21に基づいて行われる。線99が表すように、ユーザは、スケジューラ44によって除去すべき時期になるまで、限界リスト27上に存続する。線120が表すように、低ロード状況では、活動待機プロセス30は、ユーザを除去しなければならない可能性のある時期を決定するために限界リスト27を監視する。
【0023】
ATOD、TOD−TIED、ディスパッチ優先順位、オフセットを決定するために必要な計算ならびにユーザに対してリソースをスケジューリングする際のその使い方について、以下に説明する。最大降下を計算するための式は以下の通りである。
最大降下=ATOD+4*オフセット
【0024】
オフセットを計算するための式は以下の通りである。
オフセット=(マイナー・タイム・スライス−オーバラン)/(CPUの数*シェア)
【0025】
式中、オーバラン=ユーザが優先順位がより高い作業によって先取りされた場合にユーザの前のマイナー・タイム・スライス上に残っている時間の量である。
【0026】
ユーザのディスパッチ優先順位は、優先順位境界である最大降下とTOD−TIEDの範囲内で計算された整数値である。TOD−TIEDメカニズムに関するより完全な説明を以下に示す。
【0027】
ATOD23およびATOD2 21は、システム上のすべてのユーザのユーザ時間とシステムの待機時間を全体として累積するために使用するデータ構造(フィールド)である。個々のユーザ時間または待機時間あるいはその両方は追跡する必要はない。このような累積は、システムの活動と比較して、ユーザのマイナー・タイム・スライスの終わりなど、発生すべき所与の事象を予測する際に使用する。
【0028】
図2〜図8およびそれらに関する以下の説明は、デヴィソンによる同時係属特許出願第08/252864号から適応され、本発明の理解にとって重要な基本概念のチュートリアルを構成し、これは主に、実質的に早すぎない時期にユーザを限界リストに追加し、遅すぎない時期にそのユーザを除去するという目標に改良を加えるように待機時間を含むようにATODおよびATOD2を調整するために提供されたメカニズムの改良である。
【0029】
図2は、オペレーティング・システム38がディスパッチャ40と、スタッカ42と、スケジューラ44と、残りの諸機能46とを含むことを示している。スタッカは、スケジューラとディスパッチャならびにディスパッチャおよびスケジューラとオペレーティング・システムの残りの部分とのインタフェースである。処理の流れに関する高レベル説明を以下に示す。典型的なシナリオでは、ユーザは何らかの作業を実行するようオペレーティング・システムの「残りの部分」46に要求する。この作業要求は、ユーザの状況を「作動可能」として記録するスタッカ42に渡される。スタッカは、ユーザがその作業に対して異なる視点を有する可能性があっても、ユーザから到着する作業を1つまたは複数の「トランザクション」として見る。ユーザが完全アイドルの状態(「アイドル」)から実行準備ができている状態(「作動可能」)に移行したときに、「新しい」トランザクションが開始される。また、ユーザが依然として進行中の作業(トランザクション)を持っているが、完了すべき仮想入出力要求を待っており、したがって、一時的に実行準備ができていないときに存在する「中断」という第3の状態もある。中断の期間は、新しいトランザクションを宣言するのに十分な根拠にならない。次に、スタッカはこのユーザに関する作業待ち行列に要求を渡す。また、スタッカは、ディスパッチ・リスト37上の他のユーザに対するこのユーザのディスパッチ優先順位35を示す情報を入手するためにスケジューラも呼び出す。次に、スタッカは、このユーザ(実際にはユーザのVMDBK)をディスパッチ・リスト37に掲載し、オペレーティング・システムの「残りの部分」に戻る。ディスパッチ優先順位はディスパッチ・リスト上のユーザの順序付けを実施する。オペレーティング・システムの残りの部分は、その現行作業部片を完了すると、ディスパッチャ40に制御を移して、実行すべき次のユーザおよび作業部片を決定する。次にディスパッチャは、ディスパッチ・リスト37内の第1の作動可能ユーザと、次にディスパッチすべきユーザの作業待ち行列内の第1の作業部片を選択する。次に、ディスパッチャ40は、オペレーティング・システムの残りの部分に制御を移して、この作業の実行を開始する。次に、ディスパッチされた作業は所定の持続時間のタイム・スライス、たとえば、1ミリ秒の間、実行される。1ミリ秒のタイム・スライスが終了する前にこの作業項目が完了した場合、ディスパッチャは実行すべき同じユーザの作業待ち行列から他の作業部片を選択する。このタイム・スライスの終了時に、ユーザが依然として実行すべき作業を持っている場合、ディスパッチャは、このユーザ用の次のタイム・スライスの新しい優先順位を入手するために、もう一度スケジューラ44を呼び出す。この新しい優先順位によりユーザはディスパッチ・リスト内で位置変更され、次にこれが、同じユーザのためにこの次のタイム・スライスが始まる時期を決定する。同じユーザ用の連続タイム・スライス間の時間は、一部分ではこのユーザ用のプロセッサ時間のシェアを決定する。
【0030】
すべてのユーザは、それぞれの絶対または相対シェアにかかわらず、均一持続時間の個別タイム・スライスについてディスパッチされ実行される。前述の例では、各タイム・スライスは1ミリ秒である。タイム・スライスは一般にプロセッサの速度に基づくものであり、この実施の形態のために選択された1ミリ秒は一例に過ぎず、システムに合わせるために指定変更することができる。各ユーザ(VMDBKによって表される)は、タイム・スライスを完了した後、割込みが行われ、ディスパッチ・リスト内の下の方に移動する(再優先順位付けが行われる)。これにより一般に他のユーザがこのプロセッサを使用できるようになる。プロセッサの各ユーザのシェアは、そのユーザに割り振られたタイム・スライス間の間隔と、ユーザが各タイム・スライスを使用するために必要とする時間によって決定され、各ユーザは必ずしも1連続ミリ秒で単一のタイム・スライスを消費するわけではない。ユーザが入出力動作を待たなければならない場合、入出力動作が完了するのを待つ時間がこのユーザのタイム・スライスにカウントされないように、一時的に中断され、プロセッサから外される(しかし、ディスパッチ・リスト37内に存続する)。たとえば、ある入出力動作では数ミリ秒が完了する必要がある可能性があっても、入出力制約のユーザは、単一タイム・スライスを使い果たす前に10回またはそれ以上の入出力動作を開始し、その完了を待つことができる場合が多いだろう。また、優先順位がより高い他のユーザ用の作業が到着した場合、ディスパッチャは、そのユーザのタイム・スライスの終了前にそのプロセスから実行中のユーザを除去し、ある期間の間、それを中断することができる。オペレーティング・システムは、タイム・スライス間の間隔を制御することにより、各ユーザのプロセッサ時間の実際のシェアを制御することができる。あるユーザのためのタイム・スライス間の間隔は逆に、瞬間ごとのディスパッチ・リスト内の他のユーザのシェアと比較して、ディスパッチ・リスト37内のユーザのシェアの大きさに対応する。VMDBKが1つのタイム・スライスを完了するたびに、その1つのVMDBKについてのみディスパッチ・リスト37内で再優先順位付けおよび位置変更が行われる。単一タイム・スライスがばらばらに使用される場合、累積された時間が1ミリ秒のタイム・スライスと等しくなるまで、スケジューラはそのユーザのタイム・スライス間の間隔を再計算しない。タイム・スライス間の公称間隔を決定するための技法については、以下に詳述する。
【0031】
NウェイMPシステム内の各CPUは、時刻(TOD)クロック22とCPUタイマとを有する。TODクロックは、マイクロ秒ごとに増分される52ビットのハードウェア・レジスタを含む。TODクロックは、オペレーティング・システムが初期設定され(ブートされ)、その後まったく変更されないときに設定される。NウェイMPシステムでは、TODクロックのすべてのNが互いに正確にマイクロ秒に同期している。TODクロックは、時間ゼロが1900年1月1日の夜中の12時になるように設定される。52ビットのTODクロック(すなわち、ビット0〜51)がマイクロ秒をカウントする場合、このクロックは繰り返す前に140年以上の間動作することができる。TODクロックは、決して停止せず、必ず増加し、実時間を示す信頼でき正確なタイム・スタンプかつ基準である。
【0032】
CPUタイマは、各タイム・スライスの時間的調節を行うためにオペレーティング・システム38が使用する、もう1つの52ビットのハードウェア・レジスタを含む。CPUタイマは、システム・オペレータがCPUを停止した場合に動作を停止し、オペレータがCPUを再始動すると直ちにもう一度開始する(これに対してTODクロックは連続的に動作する)。CPUタイマおよびタイム・スライスの前進は、CPUがもう一度始動されたときに再開する。各ユーザがそのタイム・スライスを開始すると、CPUタイマから開始時間が明記される。同様に、ユーザが中断状態になるたびに、それがもう一度実行するときにこのユーザのためにタイム・スライスのうちのどの程度が残っているかを決定するために、CPUタイマの時間が明記される。したがって、CPUが停止したときに処理中であり、CPUタイマと比較されるユーザは、そのタイム・スライスの資格を一切失うことはない。
【0033】
また、スケジューラは、人工時刻(ATOD)クロックとして知られるソフトウェア・クロック(および後述する第2の人工時刻クロックATOD2)も有する。ATODクロックはハードウェアTODクロックと同様であるが、(CPUあたり1つずつではなく)1つしか存在せず、わずかに遅く動作する。CPUの全使用可能処理能力のうちの所与の量は、特定のユーザに帰することができないオペレーティング・システム・オーバヘッドに費やされる。したがって、全処理時間のうちのこの量はユーザのシェアとして分割するために使用可能なものではない。全処理のうち、システム・オーバヘッドである割合は瞬間ごとに変動し、100%未満のうちのどの程度がユーザのシェアのために使用可能であるかを把握することが難しい。このような困難は、オペレーティング・システムがオーバヘッド機能を実行している間は停止するようにATODクロックを定義し、ユーザにシェアを供給する計算においてTOD時間ではなくATOD時間を使用することによって回避される。次にATODクロックでは、オーバヘッドが実行されている間、時間が停止する。したがって、ATODクロックが測定する時間の100%は使用可能な処理に対応する。シェアを供給するための計算は、ATODクロックに基づくものであり、したがって、処理の100%がユーザのシェアのために使用可能である場合と同様に計算することができる。
【0034】
オペレーティング・システム38では、優先順位番号が低ければ低いほど、実際の優先順位が高くなる。優先順位番号は各ユーザごとに変化し続け、ディスパッチ順序は作動可能ユーザ間の相対優先順位番号に基づくものである。優先順位番号は、ユーザ/VMDBKがディスパッチ・リスト37に掲載されたときにそれぞれの絶対または相対シェアに基づいてスケジューラによって計算される。ディスパッチ・リストに入ったばかりのユーザについて計算する場合、優先順位番号は通常、ATODクロックの現行値よりわずかに(数ミリ秒だけ)大きくなる。(しかし、実際上、最初のいくつかのタイム・スライスの場合、非常に短いトランザクションの場合にユーザに対して迅速応答を行うために、より小さい優先順位が使用される。このような変更はユーザのシェアに著しく影響しないように非常に短時間のものである。)ATODはいつでも前進しているので、古く未完了のタスクは、新しいタスクよりも、通常、より低い優先順位番号を有し、それ故に高い優先順位を有し、且つディスパッチ・リストの最上部付近に位置する傾向がある。以下に詳述するように、ディスパッチャは、実行リスト(非作動可能または中断ユーザを除くディスパッチ・リスト37のコピーであり、したがって、実行状況を有するユーザの集合またはリストである)上で最上部から下にサーチし、実行すべきユーザを突き止める。時間が進むにつれて、作動可能タスクの方が優先順位がより高いためにユーザがディスパッチされない場合、またはユーザがディスパッチされたが入出力制約を受け、そのタイム・スライスを完了せずに「中断された」多くの時間を費やす場合、ユーザの優先順位は、(1)より最近、トランザクションを開始するユーザと、(2)入出力制約を受けないユーザに関して増加する。このような2つの点はそれぞれ真実である。というのは、(1)そのタイム・スライスが完了するまでユーザの優先順位番号が固定されたままになるのに対し、新しいトランザクションを開始する他のユーザには、ATODが増加するにつれて累進的により高い優先順位番号が割り当てられ、(2)より多くのCPU制約のユーザが多くのタイム・スライスを使用し、それぞれの後で下に移動するからである。したがって、入出力制約のユーザは、非入出力制約のユーザより高い相対優先順位を有する傾向にあり、一般に、ディスパッチおよび実行リストの最上部付近に位置決めされ、実行準備ができているときに、すなわち、各入出力動作が完了した後で、迅速にCPUが提供される。
【0035】
各ユーザごとに、絶対または相対シェア24、26(システム・ディレクトリ内に指定され、時にはシステム・オペレータによって変更される)が存在する。また、各ユーザごとに、指定の「ソフト限界」、「ハード限界」、または「限界なし」も存在する。未使用処理時間が使用可能になると、すべてのユーザは、未使用処理時間がまったくない場合と同様に計算されたそれぞれの絶対シェアおよび相対シェアに比例して超過処理時間を受け取り始める。しかし、いずれかのハード限界ユーザがそのハード限界に達すると、それ以上の割振りは一切行われない。いずれのハード限界ユーザに対しても、ハード限界を超過する処理時間のシェアを割り振ることはできない。いずれかのソフト限界ユーザがそのソフト限界に達すると、他のいずれかのソフト限界ユーザがまだそのソフト限界に達しなければならないかまたは他のいずれかのハード限界ユーザがまだそのハード限界に達しなければならない場合、あるいは超過処理時間を使用できる無制限ユーザが存在する場合、このソフト限界ユーザに対してそれ以上の割振りは一切行われない。まだそれぞれの限界に達していない他のソフト限界ユーザおよびハード限界ユーザは、それぞれの限界にも達するまで、超過シェアを受け取り続ける。他のすべてのソフト限界ユーザがそれぞれのソフト限界に達し、すべてのハード限界ユーザがそれぞれのハード限界に達したときに、超過処理時間を使用できる無制限ユーザがまったく存在しない場合、最も大きい絶対シェアまたは相対シェア(未使用処理時間がまったくない場合と同様に計算されたもの)を備えたソフト限界ユーザは残りの未使用処理時間をすべて受け取る。あるいは、すべてのソフト限界ユーザがそれぞれのソフト限界に達し、すべてのハード限界ユーザがそれぞれのハード限界に達したときに、超過処理時間を使用できる無制限ユーザがまったく存在しない場合、すべてのソフト限界ユーザは、未使用処理時間がまったくない場合と同様に計算されたそれぞれの絶対シェアまたは相対シェアに比例して、残りの未使用処理時間を分担する。
【0036】
以下に詳述するように、シェア割振り技法は、ユーザが各タイム・スライスを完了した後で各ユーザをディスパッチ・リスト内で位置変更するかまたは下にオフセットすることによって実現される。オフセットの量は、絶対または相対シェアの大きさに基づくものである。各ユーザの入出力制約の相対量は、タイム・スライスを完了する直前にそのユーザの位置からオフセットを開始することにより、タイム・スライスを完了した後にディスパッチ・リスト内でそのユーザを位置変更するときに考慮される。その結果、ユーザは、非常に入出力制約を受ける場合、そのタイム・スライスを完了する前にディスパッチ・リストの最上部付近に位置することになり、したがって、タイム・スライスを完了し、下方オフセットを経験した後でもディスパッチ・リスト内の高い位置に位置変更される。(あるユーザが最初にディスパッチ・リストに入ると、オフセットはATODの付近から開始される。)
【0037】
ディスパッチャ40は図4〜図6に示すように実現される。ステップ100では、CPUは、あるユーザ用の作業部片の実行を完了し、それをディスパッチャに通知する。応答として、ディスパッチャの第1のレベルは、そのユーザが現行の1ミリ秒タイム・スライスを完了したかどうかを判定する(判断102)。完了していない場合、第1のレベルのディスパッチャは、優先順位がより高いユーザがプロセッサを待っているかどうかを判定する(判断104)。待っていない場合、第1レベルのディスパッチャは、1つの作業部片を完了したばかりのユーザが実行すべき他の作業部片、すなわち、その作業待ち行列内の他の作業部片を有するかどうかを判定する(判断106)。有する場合、第1のレベルのディスパッチャは、ディスパッチャの第2のレベルを呼び出して、この同じユーザ用の他の作業部片を完了したばかりの同じCPU上で実行するためにこのユーザの待ち行列から次の作業部片をディスパッチする(ステップ110)。応答として、第2のレベルのディスパッチャは、このユーザの作業待ち行列上の第1の作業部片を選択し、この特定の作業部片を処理するためにオペレーティング・システム内の適切なルーチンに制御を移す(ステップ112)。
【0038】
もう一度、判断102、104、106を参照すると、判断102がYESであるか、判断104がYESであるか、または判断106がNOである場合、第1のレベルのディスパッチャは、判断120に移行して、以下に説明するようにスケジューラのATODクロック(およびATOD2クロック)を更新する時期であるかどうかを判定する。この判断は、クロックの最後の更新以来、少なくとも1ミリ秒が経過したかどうかに基づいて行われる。経過した場合、ディスパッチャは、スタッカを呼び出して、ATODクロックおよびATOD2クロックを更新するようスケジューラに通知する(ステップ122)。次に、第1のレベルのディスパッチャは、未使用のものがある場合にユーザのタイム・スライスのうちのどの程度が未使用のまま存続しているかをまず記録することにより、ユーザを「アンディスパッチ」する(ステップ130)。判断102の結果としてステップ130に到達した場合、このタイム・スライスのうちのいずれも存続していない。しかし、ステップ130の前に判断104または判断106のいずれかが行われた場合、ある程度のタイム・スライスが存続している。次に、第1のレベルのディスパッチャは、そのタイム・スライスが完了されたかどうか(ならびにそのユーザを適格リストに循環して戻すべきかなどの他のいくつかのスケジューラ条件のいずれかを検査したかどうか)を判定する(判断132)。完了された場合、第1のレベルのディスパッチャは、スタッカを呼び出して、タイム・スライスの終了または他のスケジューラ条件を処理するようスケジューラに通知する(ステップ134)。次に、第1のレベルのディスパッチャは、トランザクションの実行を完了したばかりのCPUの実行リストから優先順位が最も高いユーザを選択する(ステップ136)。このようなユーザが存在する場合(判断140)、第1のレベルのディスパッチャは、このユーザをディスパッチ済みとしてマークし、このユーザ用のタイム・スライスの時間的調節を行うためにそのタイム・スライス(またはその残りの部分)をCPUタイマにロードし、第2のレベルのディスパッチャに移行する(ステップ142)。応答として、第2のレベルのディスパッチャは、ユーザの作業待ち行列からこのユーザ用の第1の作業部片を選択し、この特定の作業部片を処理するためにオペレーティング・システム部分46内の適切なルーチンに制御を移す(ステップ144)。
【0039】
もう一度、判断140を参照すると、トランザクションの実行を完了したばかりのCPUに関するユーザが一切見つからなかった場合、第1のレベルのディスパッチャは、他のCPUの実行リストから優先順位が最も高いユーザを選択する(ステップ150)。このようなユーザが見つかった場合(判断152)、第1のレベルのディスパッチャは、ステップ142に移行して、他のCPUの実行リストからこのユーザをディスパッチする。しかし、他のCPUの実行リスト上でこのようなユーザが一切見つからない場合、第1のレベルのディスパッチャは待機状態に移行する(ステップ154)。
【0040】
図7はスケジューラ44の一部分を示している。スケジューリングすべき新しいユーザの識別子を第2のレベルのディスパッチャから(スタッカを介して)受け取った後、スケジューラは、以下の通り、「ディスパッチ・リスト・シェア」を決定する(ステップ200)。ステップ202では、スケジューラは、従来技術のVM/ESAオペレーティング・システムに関して前述したようにユーザの絶対または相対シェアをシステムの処理時間の分数に変換する。すなわち、すべての絶対シェアは先頭から取られ(また、合計が99パーセントを上回る場合は比例して削減され)、残りはそれぞれの相対シェアに比例してディスパッチ・リスト上の他のユーザ間で分割される。各ユーザごとの結果はプロセッサ時間の分数(0と1の間)であり、すべてのユーザの値を合計すると1になる。次に、スケジューラは、「適格」リストで待機して費やす時間についてユーザに補償するために、このユーザの「必須分数」(R’)を決定する(ステップ204)。ユーザは実行準備ができると適格リストに掲載されるが、そのユーザの作業を実行するために使用可能なメモリが不十分である。必須分数は、ステップ202で決定したシェアの分数に(ディスパッチ・リスト内の時間+適格リスト内の時間)/(ディスパッチ・リスト内の時間)を掛けることによって決定される。各ユーザごとの必須分数は、適格リスト内に存続するたびにその後で再計算され、結果はディスパッチ・リスト内の次の期間に使用する。しかし、通常、すべてのユーザのために十分なメモリがあるので、適格リストへの「トリップ」はまれなことであり、通常、ステップ204はステップ202の結果に1を掛ける単純な乗算になる。次に、ディスパッチ・リスト内のすべてのユーザの必須分数を合計すると1になるように、スケジューラはこのユーザの必須分数R’を正規化する(ステップ206)。このユーザの正規化必須分数は「ディスパッチ・リスト・シェア」(または実行リスト・シェア)であり、以下に詳述する。このユーザのディスパッチ・リスト・シェアから、スケジューラはディスパッチ・リストおよび実行リストの下方への「オフセット」を決定する。大ざっぱに言えば、ユーザのオフセットは、ディスパッチ・リスト・シェアにタイム・スライスの長さを掛けて実CPUの数で割ったものの逆数である。オフセットが小さくなればなるほど、ユーザからCPUへのアクセス数が増し、その逆も同様である。ユーザのオフセットの正確な値については以下に詳述する。
【0041】
図8は、ある瞬間におけるディスパッチ・リスト300を示している。このディスパッチ・リストは、実行準備ができているユーザと、中断されているユーザを含む。上記の通り、ディスパッチ・リスト300上にあって実行準備ができているユーザは、サーチ時間を短縮するために実行リストにも掲載されているが、説明のためにはディスパッチ・リスト300の図解の方が適当である。ディスパッチ・リストは一番上から下にサーチされ、最も高い優先順位(および最低優先順位番号)を備えたユーザが順序の先頭に掲載される。各ユーザがそのタイム・スライスを完了したときに、実行すべき作業をそれ以上有している場合、スケジューラはディスパッチ・リスト300上(および間接的に実行リスト上)でその現行位置から下にこのユーザ用のオフセット25に等しい量だけそのユーザを位置変更する。したがって、2つの要因がディスパッチ・リスト300上のユーザの分布を実施する。第1の要因はオフセット25の大きさである。上記の通り、各ユーザごとのオフセットの大きさは、ディスパッチ・リスト上の他のユーザのシェアに対するそのシェアに反比例し、異なるシェアを備えた他のユーザとは異なっている。したがって、シェアが小さければ小さいほど、オフセットは大きくなる。これは、ほとんどの場合、ディスパッチ300の最下部付近に低シェア・ユーザを位置決めする傾向がある。第2の要因は、そのタイム・スライスを完了するためにユーザが必要とする実時間の量である。「入出力制約」のユーザは、1つのタイム・スライスを完了するために相当な入出力時間を必要とする。というのは、ユーザが入出力動作を開始した後でその入出力動作が完了するまで待っている相当な時間の間、そのユーザおよびそのタイム・スライス時間が中断されるからである。したがって、入出力制約のユーザは、そのタイム・スライスの実行を完了するために1ミリ秒のタイム・スライスよりかなり長い実時間を必要とし、入出力制約のユーザが実行リスト300の最上部まで上昇すると、そのユーザは相当な時間そこに存続してから、そのタイム・スライスを完了し、下にオフセットされることになる。逆に、「CPU制約」のユーザは、入出力時間をほとんど必要とせず、1ミリ秒またはそれよりわずかに長い時間でほとんど連続的にそのタイム・スライスを完了する。したがって、CPU制約のユーザは、頻繁に下にオフセットされ、一般にディスパッチ・リストの最下部付近に常駐する。
【0042】
したがって、どのような瞬間でも、入出力制約のユーザと、非常に大きいシェアを備えた他のユーザは、ディスパッチ・リストの最上部付近に位置する傾向があり、CPU制約のユーザと、非常に小さいシェアを備えたユーザは、ディスパッチ・リストの最下部付近に位置する傾向がある。シェアおよび入出力対CPU制約という2つの要因のうち、入出力の量対CPU制約の方がディスパッチ・リスト内の位置に及ぼす影響が大きい(通常範囲のシェアの場合)。上記のような実行リスト上のユーザの位置決めは高いスループットをもたらす。というのは、入出力制約のユーザが実行準備ができたときに、すなわち、最後の入出力動作が完了したときに、ユーザは実行リスト300の最上部付近に位置する可能性があり、迅速にCPUを獲得することになるからである。
【0043】
図8では、このようなオフセットは下方に曲線を描いて延びる矢印として左側に示されている。異なるユーザが異なるシェアを備えているので、オフセットによっては他のオフセットより長かったり短かったりする。典型的な状況では、現行(瞬時)ATODマークより下にあるすべてのユーザはCPU制約のユーザであり、現行ATODマークより上にあるすべてのユーザは入出力制約のユーザである。ユーザは、上記の効果により、そのようにソートされている。また、ディスパッチャは一般に、作動可能ユーザを見つけるために現行ATODマークより下にある多くのものをサーチする必要はなくなるだろう。というのは、その付近にあるCPU制約のユーザはほとんどいつでもディスパッチすることができるからである。したがって、ATODマーク位置およびそれより下の図8の左側にある「オフセット」矢印は一般にATODマーク位置またはそれよりわずかに下にあるユーザから発生することになる。しかし、ATODマークより上のディスパッチ・リストの上部部分では、矢印がどこでも発生する傾向がある。ただし、入出力制約のユーザがタイム・スライスを完了すると、前のタイム・スライスの時点におけるその典型的な高優先順位および高位置のために、そのユーザは通常はリストの最下部に移動せず、通常は依然としてATODマークより上に存続することに留意されたい。したがって、入出力制約のユーザは、入出力待機を完了した直後にもう一度ディスパッチされる可能性があり、高スループットが維持される。
【0044】
上記のスケジューラは、自分のシェアを吸収できないユーザを「非常に激しく急き立てる」。このようなユーザの1人がその割当て済みシェアについてますます後れをとるので、このユーザがその全シェアを占める見込みがある場合に最終的にそのようにするまで、そのユーザはディスパッチ・リスト内をますます上昇する。したがって、上記のスケジューラは、単に各ユーザにCPUへの所望のACCESSを与えるのではなく、CPUの各ユーザに所望のSHARESのうちの多くを与える際に効果的である。所望のシェアは、各ユーザの消費の履歴を計算せずに提供される。これは、「履歴」がそのユーザのディスパッチ・リスト位置に常駐しているからである。ATODマークに対するディスパッチ・リスト内のユーザの位置は、ユーザが受けるに値するものに対して、ユーザが過去に受け取ったプロセッサ時間のシェアを表している。ユーザがそれまでに受けるに値するものを正確に獲得している場合、そのユーザはATODマークの位置に正確に位置する。ユーザがATODマークより上にある場合、そのユーザは受けるに値するものより受け取ったものの方が少ない。ユーザがATODマークより下にある場合、そのユーザは受けるに値するものより受け取ったものの方が多い。
【0045】
ステップ204で決定した必須分数R’は、以下のようにステップ206で正規化される。3通りの正規化のケースと、それぞれのケースの2通りの変形が存在する。3通りのすべてのケースでは、ディスパッチ・リスト上のすべてのユーザ(SRMRTHRU)またはATODマークより下にあるユーザ(SRMCTHRU)の必須分数の合計に基づいて計算が行われる。第2および第3のケースでは、前述のように限界を実施するために、その(ハードまたはソフト)限界に達していると判断されるかどうかに応じて、VMDBKは異なる方法で検討される。ディスパッチ・リスト内のすべてのユーザのR’の合計は以下の式で表される。
SRMRTHRU=SRMRTHRN+SRMRTHRL+R’
【0046】
式中、SRMRTHRNはディスパッチ・リスト内にあって無制限であるかまたは自分の限界に達していないすべてのユーザの必須分数の合計であり、SRMRTHRLはディスパッチ・リスト内にあって自分の限界に達したすべてのユーザの必須分数の合計であり、加算されるものとして示されているR’は現在検討中であって計算時にまだSRMRTHNまたはSRMRTHL内に加えられていない1人のユーザのR’を表す。同様に、ATODマークより下にあるユーザの合計については以下の通りである。
SRMCTHRU=SRMCTHRN+SRMCTHRL+R’
【0047】
式中、SRMCTHRNはATODマークより下にあって無制限であるかまたは自分の限界に達していないユーザの必須分数の合計であり、SRMCTHRLはATODマークより下にあって自分の限界に達したユーザの必須スループットの合計である。(それぞれの変数内の文字「C」は、ATODマークより下にあるユーザをCPU制約のユーザとして見なすことができるという合図である。)以下の計算では(3通りのケースの場合)、SRMRTHRN変数およびSRMRTHRL変数のみを示すが、検査中のユーザがATODマークより下にあるユーザの1人である場合にSRMCTHRN変数およびSRMCTHRL変数を代用する予定であることに注目することに留意されたい。これは、3通りのケースのそれぞれについて前述したように2通りの変形があることを反映している。
【0048】
第1のケース:
((SRMRTHRL+SRMRTHRN+R’)>1かつSRMRTHRL>0.5)である場合、一部のユーザのシェアはより小さいものにしなければならず、自分の限界に達しているユーザは大きい部分(>0.5)を構成するので、この時間の短縮にすべて含まれる。その場合、現行ユーザは以下のように正規化される。
正規化R’=R’/(SRMRTHRL+SRMRTHRN+R’)
【0049】
したがって、現行ユーザのシェアはより小さいものになる。
【0050】
第2のケース:
((SRMRTHRL+SRMRTHRN+R’)>1であるがSRMRTHRL<0.5)である場合、一部のユーザのシェアはより小さいものにしなければならない。しかし、自分の限界に達しているユーザは大したものにはならない(それぞれのR’の合計<0.5)ので、正規化されない。その場合、現行ユーザがその限界に達していない場合のみ、現行ユーザのシェアは以下のように調整される。
正規化R’=R’*(1−SRMRTHRL)/(SRMRTHRN+R’)
【0051】
したがって、その限界に達していないユーザのシェアはより小さいものになる。しかし、その限界に達している現行ユーザは以下の式を使用する。
正規化R’=R’(限界)
【0052】
式中、R’(限界)は、指定のハード限界またはソフト限界の正規化分数、すなわち、適格リスト時間の効果に応じて調整されたハード限界またはソフト限界である。正規化分数はその限界に達しているユーザ向けに限定されるので、これは、まだその限界に達していない少なくとも1人のユーザまたは少なくとも1人の無制限ユーザが存在する限り、それぞれの限界にあるこのようなユーザのシェアを制限する。
【0053】
第3のケース:
((SRMRTHRL+SRMRTHRN+R’)<1.0)である場合、一部のユーザのシェアはより大きいものにしなければならない。その限界に達しているユーザのシェアはより大きいものにする必要がないので、その限界に達していないユーザについてのみ調整が行われる。現行ユーザがその限界に達していない場合、そのシェアは以下のように調整される。
正規化R’=(上記のケース(2)と同じ)
【0054】
この時点では、通常のユーザのシェアはより大きいものになる(上記のケース(2)とは異なる)。しかし、現行ユーザがその限界に達している場合、そのシェアは以下のように調整される。
正規化R’=R’(限界)
【0055】
正規化分数はその限界に達しているユーザ向けに限定されるので、これは、まだその限界に達していない少なくとも1人のユーザまたは少なくとも1人の無制限ユーザが存在する限り、それぞれの限界にあるこのようなユーザのシェアを制限する。
【0056】
第1のケースと第2のケースが異なる理由は、可能であれば、限定ユーザのシェアは決して増加しないので、このようなユーザのシェアを低減しないことが好ましいからである(第3のケースを参照)。対照的に、他の時点でより大きいシェアを獲得することにより、無制限ユーザ用のシェアの損失が統計的に構成されることになる。
【0057】
第1のケースと第2のケースとを区別する際に、SRMRTHRL>0.5であるかどうかのテストが行われる。現行ユーザのシェアはより大きいものではなくより小さいものになるので、上記のどちらのケースでも現行ユーザのR’は考慮されない。したがって、その限界に達する見込みはない。したがって、このようなユーザの合計が>0.5になるかどうかを確認するためにテストする場合、このようなユーザはその限界に達していると見なされない。
【0058】
第1のケースでは、各R’ごとにすべてのR’の合計で割る。したがって、結果の値(正規化R’)の合計は1になる。式(SRMRTHRL+SRMRTHRN+R’)はすべてのR’の合計を表す。
【0059】
SRMRTHRLおよびSRMRTHRNがSRMRTHRUの構成要素部分(またはアレイ要素)であり、SRMRTHRUがR’の合計であることを想起されたい。上記の各種ケースで計算を行う時点を除き、現行ユーザのR’はたまたまSRMRTHRUから引かれており、どの要素を新しいR’に加えるべきかを決定することはできないだろう。したがって、式(SRMRTHRL+SRMRTHRN+R’)はR’が明示的に加えられることを示している。
【0060】
第2のケースでは、それぞれの限界に達していないユーザについてのみR’が調整されるのに対し、それぞれの限界に達しているユーザのR’は一定のままになる。したがって、その限界に達していないユーザのR’は、その限界に達していないすべてのユーザのR’の合計(SRMRTHRN+R’)で割り、次にその結果に(1−SRMRTHRL)を掛けることによって正規化される。その限界に達しているユーザも存在するので、その限界に達していないユーザの正規化シェアの合計は1になる必要がないので、後者の要因は必要である。また、(SRMRTHRN+R’)で割り、乗数を省くことによって得られる正規化R’は合計が1になる値を示すものと思われるので、当然の結果として、その正規化R’に(1−SRMRTHRL)を掛けた後で合計が(1−SRMRTHRL)になるだろう。事実、SRMRTHRLに含まれるR’値はその限界であるR’(限界)に等しく設定されている。
【0061】
以下の理由により、そのソフト限界またはハード限界にまだ達していないすべてのユーザにとって、その絶対または相対シェアに比例した超過プロセッサ時間が使用可能になる。図表では、これは、ディスパッチ・リスト内のユーザが(理論的には)ATODマークと同じ速度で進むことによって発生する。一般に、上記のメカニズムは、それに応じてオフセットを設定(または調整)することにより、絶対および相対シェアに比例してプロセッサ時間を分担しようと試みる。
【0062】
ATODマークより下にあるユーザについては、このような比例は、ステップ206におけるR’の上記の正規化の2通りの特性によって発生する。ステップ206の説明で前述したように、ATODマークより下にある各ユーザごとの必須分数R’の正規化は、ATODマークより上にあるものを除き、ATODマークより下にあるユーザのセットに関する合計SRMCTHRUに基づいて行われる。したがって、これはATODマークより下にあるユーザにより高い優先順序を与える傾向があり、それはオフセットがより小さいものであることによるものである。というのは、「正規化R’式」の分母はより小さく、すなわち、合計がATODマークより下にあるユーザのみに限定されているときに各ユーザのシェアは合計のうちのより大きい割合を占めると思われるからである。また、ATODより上にある入出力制約のユーザはなかなかそのタイム・スライスを使用しないが、プロセッサ時間の一部を使用する。したがって、CPUサービスのうちの100%未満のものがATODマークより下にあるユーザに供給されることになり、そのオフセットは100%を獲得するものに基づくことになるので、ATODマークより下にあるユーザは低速で上に移動する傾向があり、事実、ATODマークより遅れ始める。しかし、ATODマークより遅れることは、以下の理由によりディスパッチ・リスト内でこのようなユーザをもう一度下に移動させる傾向がある。ユーザがATODマークより上に移動すると直ちにそれはATODマークより下にあるユーザのセット内に入らなくなり、したがって、SRMCTHRUではなくSRMRTHRUが「正規化R’」式の分母で使用されることになる。このようにATODマークより上に移動することは、ディスパッチ・リスト内でこのようなユーザをもう一度下に移動させる傾向がある。というのは、「正規化R’」式の分母がより大きいものになるからである(その結果、正規化R’はより小さいものになるが、オフセットはより大きいものになる)。ATODマークより上および下に移動する際のこのような2通りの傾向の正味の影響は、インストール定義の絶対および相対シェアに比例して「過剰」サービスが(それを使用できるユーザに)割り当てられることである。このようなユーザは、より速くではなく、ATODマークと同じ速度で前進する。
【0063】
ATODマークより上の高い位置に位置するユーザには、そのユーザが使用できるのと同じ程度のプロセッサ時間が提供されるが、そのユーザは、自分の元のシェアの全量ではない場合であっても、一般に超過分のうちの自分のシェアの多くを使用することができない。しかし、それらがCPU制約のユーザになるようにそれぞれの条件が変化した場合、上記の理由により速やかにATODマークより下に低下し、そのインストール定義シェアに比例して超過プロセッサ時間を与える前記原理によって支配されることになる。
【0064】
ステップ206のシェアの正規化に関する上記の説明では、その限界に達していない少なくとも1人の他のユーザまたは少なくとも1人の無制限ユーザが(ATODマークより下に)存在する場合に、ハードまたはソフト限定ユーザがそれぞれの限界に制限される方法について説明している。また、上記の説明には、ハード限界ユーザがそのハード限界より大きいシェアを受け取ることができないようにする方法、ならびにすべてのユーザがそれぞれの限界に達した後に残っているすべての超過プロセッサ時間を最も大きいシェアを備えたソフト限定ユーザに割り振る方法が記載されている。
【0065】
上記のように、あるユーザがマイナー・タイム・スライスを完了すると、そのユーザはステップ160で計算した1つのオフセット分だけディスパッチ・リスト内で下に移動する。しかし、移動する前に、これによりMAXFALL限界を超えてそれが移動するかどうかの判断が行われる。各ユーザのMAXFALL限界はそのユーザのオフセットの4倍、すなわち、ATODマークより上の4つのオフセットに等しい。無制限ユーザまたはソフト限定ユーザがそれぞれのオフセットのためにMAXFALL限界を超えて移動する場合、そのユーザはそのMAXFALL限界を超えずにその限界まで下に移動する。MAXFALL限界により、無制限ユーザおよびソフト限定ユーザは自分のシェアより多くのものを獲得することができる。というのは、その結果、ディスパッチ・リスト内でそのシェアが本来示すものより高い位置に位置決めされるからである。事実、すべてのユーザがその限界に達しており、無制限ユーザがまったく存在しない場合、最も大きいシェアを備えたソフト限定ユーザは最も小さいオフセットを有し、したがって、最も小さいMAXFALL限界を有することになるので、このようなユーザは実質的に残りのすべての超過プロセッサ時間を入手することになる。これにより、このようなユーザはディスパッチ・リスト内で他のソフト限定ユーザより上に位置決めされ、このようなユーザが使用できるすべての超過プロセッサ時間が与えられることになる。
【0066】
しかし、ハード限定ユーザはMAXFALL限界によって制限されないが、MAXFALL限界より下に低下すると、ハード限定ユーザは実行リストから限界リストに移動することになる。限界リストはユーザの優先順序(VMDLPRTY)に応じて順序付けられる。したがって、ハード限定ユーザがMAXFALL限界より下に低下すると、そのユーザは一般にそれ以上のマイナー・タイム・スライスを完了しなくなるかまたはディスパッチ・リスト内でそれ以上下に移動しなくなる。このため、ハード限定ユーザはその指定の限界を超過するプロセッサ時間を入手できなくなる。というのは、ディスパッチャは限界リストに入っているユーザをディスパッチしないからである(ユーザは限界リストに掲載されている間、実行リストに入ることができない)。
【0067】
ユーザはもはやスケジュールより早くならないようにそこで十分な時間を費やした後、限界リストから除去される。これは以下のように実施される。第2の「人工時刻」クロック「ATOD2」が形成される。このATOD2時間は、ユーザに与えられる生産的CPUサービスと待機時間の両方に比例して前進する。ATOD2が限界リストの先頭にあるユーザの限界リスト締切りに達すると、そのユーザは限界リストから除去され、実行リストに戻される。締切りに達する時間までにタイム・スライスを完了する時間をユーザに与えるために、そのユーザはその締切りより1タイム・スライス前に限界リストを離れる資格を有する。同時に、ディスパッチ・リストに入るユーザのために開始ディスパッチ・リスト優先順位を確立し、MAXFALL限界を計算するために、既存のATODを使用し続けることになる。言い換えると、ATODはディスパッチ・リストおよび実行時リスト用の「締切り」として機能する。
【0068】
時にはユーザは、たとえば、それが続行する前に人間の介入を必要とする入出力装置のために、過度に長い入出力待機を経験することになる。その結果、ユーザは、ディスパッチ・リスト上で他のユーザより十分上の過度に高い位置に位置することになる。これは、ユーザがもう一度実行を開始するときに問題を含む。というのは、ユーザがCPU制約のユーザになった場合、そのユーザが他のすべてのユーザを超えて下に移動するまで他のすべてのユーザが実行できなくなり、そのユーザが非常に高い場合ならびにユーザを下に移動するために通常のオフセット機構に依存している場合に時間がかかりすぎる可能性があるからである。したがって、以下のメカニズムを使用して、このようなユーザを検出し、ディスパッチ・リスト上で高い位置にあるが、このような過度の入出力待機を経験したことがない他のユーザの付近に位置決めするのに十分なほど下にそれをオフセットする。「疑わしくない」ユーザ(すなわち、過度に入出力制約を受けているとまだ疑われていないユーザ)がタイム・スライスを完了する場合、そのユーザは必ず前述のように1つのオフセット分だけ下に移動する。しかし、ユーザがこの移動中に他の「疑わしくない」ユーザを通過しない場合、移動中のユーザは「疑わしい」ものとして指定される。(これは、移動中のユーザに関連するビットを設定することによって行われる。)この疑わしいユーザが次にタイム・スライスを完了するときに、疑わしいユーザは通常のオフセット分だけ下に移動し、そのユーザがこの移動中に「疑わしくない」ユーザを通過する場合、移動中のユーザはもう一度「疑わしくない」ものとしてマークされ、通過しない場合、移動中のユーザは、移動中のユーザが最初に遭遇する「疑わしくない」ユーザのすぐ上まで、さらに下に移動する。そのうえ、ATODマークより下にあるすべてのユーザは「疑わしくない」ものである。
【0069】
「疑わしい」ユーザは、TOD−TIED(TT)属性が与えられたユーザである。TOD−TIEDメカニズムの目的は、優先順位を再配列することではなく、むしろユーザの相対順序を通常通り維持し、高く上昇しすぎたことによって発生するギャップを低減することである。TOD−TIED(TT)属性は、ATODの位置またはATODより下にあるすべてのユーザに属す。また、それは、あるVMDBKの位置変更によってそれがTTを備えたVMDBKを通過するときには必ず、あるVMDBKから他のVMDBKへ(ATODから)上に伝播される。ATODより上にあるVMDBKがTTを備えた他のVMDBKを通過しない場合、そのVMDBKは属性を失う。その次のマイナー・タイム・スライスの後、あるVMDBKがTTを取り戻せない場合、それはTT属性を備えた次のVMDBKの直前(または、介在ユーザがまったくいない場合はATOD)まで強制的に下ろされる。
【0070】
過度に入出力制約のユーザは、入出力が完了するのを待っているので、スケジュール通りにそのマイナー・タイム・スライスを終了することは滅多にない可能性がある。システムが忙しすぎてユーザに対して十分なCPUリソースを与えることができないためではなく、それが入出力動作を要求したために、そのユーザはスケジュールより遅れているように見える。本来、スケジューラ44は、スケジュールより遅れているように見えるので、より高い優先順位によってこのユーザをスケジュールする傾向があるものと思われる。TOD−TIED28境界の目的は、過度に入出力制約のユーザが高すぎるディスパッチ優先順位35を獲得できないようにすることである。あるユーザがしばらくの間、過度に入出力制約のものとして存続する場合、その優先順位はますます高くなるだろう。そうである場合、そのユーザの優先順位は非常に高くなり、このユーザは、次にディスパッチされるときにCPU制約にならなければならない場合、システムのCPUリソースを独占できるだろう。このようなシナリオを回避するため、ユーザはそのディスパッチ優先順位35が高い優先順位であるATOD23より遅れているときにTOD−TIED属性を取得する。その後、このTOD−TIED属性を備えたユーザには、それがCPU制約になった場合にシステムを引き継ぐことができなくなるように、優先順位の点でATODにかなり近いディスパッチ・リスト上にまとめて密集するように制限されている優先順位が与えられることになる。このTOD−TIEDまたは「疑わしい」メカニズムは、ユーザのディスパッチ優先順位を高優先順位側のATODから妥当な変位内に維持するために使用されるが、最大降下は、ユーザをATODの低優先順位側に制限された状態に維持するために使用するメカニズムである。
【0071】
ATODクロックは用意されている使用可能CPU時間に比例して前進する。システム時間(オーバヘッド)はユーザのタスクまたはシェアのために使用可能なものではなく、したがって、ATODを前進するためにカウントするわけではない。各実行CPUは定期的にATODを増分し、待機中のCPUは増分しない。これは、ステップ120および122でディスパッチャによって駆動される。ATODは、最後の増分以来、複数の実CPUによってどの程度のユーザ時間が供給されたかに応じて前進する。すなわち、各CPUは、そのCPUの実際のユーザ実行時間アキュムレータ(PFXUTIME)の前進に比例してATODを増分する。その意図(すべてのCPUが生産的に動作している場合)は、ATODがほぼ実時間(壁掛け時計時間またはTOD)で前進することである。N個のすべてのCPUが動作している場合、各CPUは一般にほぼ実時間でそれ自体のPFXUTIMEを前進している。したがって、以下のようにN個のCPUによる寄与をNで割る。
ATOD=ATOD+(PFXUTIMEのデルタ)/N
【0072】
式中、「PFXUTIMEのデルタ」は、最後にそれが検査されてからこのCPUのPFXUTIMEアキュムレータにおける変化である。
【0073】
ATOD2は、以下のように各CPUのユーザ時間(PFXUTIME)および各CPUの待機時間(PFXTOTWT)とを含む。
ATOD2=ATOD2+(PFXUTIMEのデルタ+PFXTOTWTのデルタ)/N
【0074】
式中、PFXUTIMEおよびPFXTOTWTはどちらもCPUタイマと同様のダブルワード・クロックである。
【0075】
しかし、いずれかのCPUが複数の連続間隔を待っている場合、他の実行CPUがそれに代わって動作し、ATOD2に対して(および何らかの状況ではATODに対しても)待ち時間の寄与をすることになる。このような待機CPUはその時間のすべてを待機状態で費やしており、待機状態の場合、ATOD2に対するその寄与は実時間(TODクロックによって測定されたもの)の前進と同じでなければならないと想定する。しかし、待機CPUの実行時間については、いかなる想定または寄与も他のCPUによってなされない。このような待機CPUがもう一度実行を開始すると、それは通常通りATODに対して、また実時間による最終的なおそらくわずかな間隔についてはATOD2に対して、寄与することになる。(他のCPUは前の間隔を処理済みである。)
【0076】
上記のように、1つまたは複数のCPUが複数の連続タイム・スライス間隔を待っており、同時に現行CPUがその実行リスト内の作業(VMDBK)を持っていない場合、ATODのために何らかの待ち時間がカウントされる。現行CPUがその実行リスト内に作業を持っていた場合、待機CPUがその作業を実行するために「使用可能」なものではない可能性があり、持っていなかった場合、たぶん、すでにその作業を実行しているものと思われる。逆に、現行CPUが実行リスト内にいずれの作業も持っていない場合、その待機時間が使用可能時間である場合と同様に待機CPUをカウントすることが本当に安全なことになるだろう。したがって、拡張待機モードの1つまたは複数のCPUが存在し、同時に現行CPUがその実行リスト内にいずれの作業も持っていない場合、現行CPUは以前の式の代わりに以下の式を使用する。
ATOD=ATOD+(デルタ/N)+(デルタ/N)*TRKCT/(N−TRKCT)
【0077】
式中、ATOD=ATOD+(デルタ/N)は、「デルタ」が「PFXUTIMEのデルタ」の省略形である元の式を表し、「(デルタ/N)*TRKCT/(N−TRKCT)」は、待機時間を反映するために追加される項であり、この場合も「デルタ」は「PFXUTIMEのデルタ」の省略形である(また、「PFXTOTWTのデルタ」ではない)。TRKCTはSRMTRKCTであり、現在依然として拡張待機モードになっているCPUのカウントである。
【0078】
待機CPUが(結局)それ自体の待機時間に対して寄与できた場合、その寄与は大きい固まりで到着するだろう。しかし、上記の式を使用すると、動作中のCPUはそれ自体の(CPUベースの)寄与程度のサイズの待機CPUに代わって寄与する。したがって、第2項の寄与の基本サイズはデルタ/Nによって表され、複数の拡張待機モードCPUに対して寄与するためにSRMTRKCTが掛けられる。しかし、動作中のもののように動作中のCPUと同様に寄与することになる現行のもの(すなわち、拡張待機モードになっていないもの)のように他に多くのCPUが存在するので、その結果を(N−SRMTRKCT)で割る。
【0079】
SRMTODSVタイムスタンプは現行TODの良好な近似値であるが、すべてのマイナー・タイム・スライスの終了(および他のスケジューリング・ポイント)時と、VMDBKが作動可能になった場合、すなわち、ほとんどの入出力動作後に、間欠的に更新されるだけである。SRMTODSVは、ATODを更新する時期であるかどうかを判断するために十分なほど正確であるが、その判断が行われると、より正確なTOD値が使用される。
【0080】
上記のように、CPUの待機時間はいつでもATODに含まれるわけではない。というのは、本来、ATODはユーザより速く前進でき、前述の「疑わしい/疑わしくない」メカニズム(ユーザがディスパッチ・リスト内でどの程度の高さに位置することができるかを制限するよう機能する)はそれぞれのシェアにかかわらず、すべてのユーザを均一に前進させるものと思われるからである。にもかかわらず、ATODから待機時間を完全に除外すると、システムの複数のCPUのうちの1つ(または少数)だけが動作し、残りのものが通常は待機している場合に問題が発生する。このような場合、ATODは実時間に比例して遅れ、前進しなくなる。それは、無制限ユーザおよびソフト限定ユーザまたは小さいシェアのハード限定ユーザの場合は問題にならないが、大きいシェアのハード限定ユーザの場合は顕著な矛盾を引き起こす恐れがある。これは、ATODとTODとの適度な差が重要ではないようなタイム・スライスを完了した後、小さいシェアのユーザがディスパッチ・リスト内で下に向かってこのように大きく踏み出すからである。しかし、大きいシェア(および対応する小さいオフセット)を備えたハード限定ユーザの場合、ATODの正確な動きが重要である。ATODは、そのユーザが非常に迅速にそれを超え、MAXFALL限界に達し、時期尚早に限界リストに掲載されないように、比較的速いペースで大きいSHAREを備えたユーザの後に続かなければならない。このような事態の発生が許されている場合、システムは、使用中のシステム上のハード限定ユーザがそのシェアを獲得するが、非使用中のシステム上では(特にそれが単独でそのシステム上に存在する場合)そのシェアより少ない量を獲得するだろうという望ましくない特性を示すだろう。これは、相当な待機時間があり、その待機時間が既存の作業のために「使用可能」であると証明できる場合にATODに待機時間(またはその一部)を含めることにより発生が防止される。上記のように、待機中のCPUが存在し、現行CPUがその実行リスト内にいかなる作業も持っていない場合、待機時間の一部分がATODに含まれる。現行CPUは、待機中のCPUに代わって待機時間に寄与する。
【0081】
デヴィソンの同時係属特許出願第08/252864号では、待機時間の過剰寄与がそれぞれのシェアを無視して「疑わしい/疑わしくない」メカニズムによってすべてのユーザを均一に前進させる恐れがあるので、有害なものになりうることが認識されている。寄与を現行CPUが使用しているCPU時間の量(PFXUTIMEのデルタ)程度と等しいものにすることにより、それがカウントする場合、すなわち、CPU制約の作業ならびにユーザが限界リストに掲載される見込みがある場合には完全な寄与がなされ、CPUがそれほど使用されていない場合にはより小さい寄与がなされることをデヴィソンは教示している。デヴィソンによって加えられた待機時間によるこのように「より小さい寄与」は、本発明によれば、後述するように、より一層頻繁に発生する諸事情により実質的に待機時間のすべてによって増大し、したがって、著しく良好な結果を達成する。
【0082】
実行リストおよび限界リスト内のユーザは異なる速度で動作する様々なクロック(ATODおよびATOD2)によって時間的調節が行われるので、あるユーザが限界リスト27内にまたは限界リスト27外に移動するときに変換が行われる。あるユーザが限界リスト内にある間、そのユーザは、ディスパッチ・リスト優先順位(VMDDPRTY)35と限界リスト優先順位(VMDLPRTY)29という2通りの優先順位を有する。限界リスト優先順位はそのユーザのディスパッチ・リスト優先順位から導き出される。その意図は、ユーザが限界リスト27内でその「遅延」を開始したときにユーザがATOD23から持っているものと同じ程度のATOD2 21からの変位を持っていなければならないということである。その変位は、ユーザがもう一度実行する予定になる前に経過しなければならない遅延の量を表すが、(「待機時間」を完全にカウントできるようにするために)その遅延はATOD2クロックで測定する必要がある。したがって、その変換は以下の通りである。
VMDLPRTY=ATOD2+(VMDDPRTY−ATOD)
【0083】
このVMDLPRTYの計算は、ユーザが限界リストに入ったときに行われる。ユーザが限界リストを離れるときは、ユーザは、そのユーザの締切りより1マイナー・タイム・スライス前に実行リストに入らなければならない。したがって、(定義により)ユーザが限界リストから実行リストに移動すると、ユーザのVMDDPRTYは(ATOD+TS)に設定され、ユーザに通知し、ユーザを移動させる前に限界リストの締切りを超えるわずかな遅延について下記の補正が行われる。
VMDDPRTY=(ATOD+TS)−((ATOD2+TS)−VMDLPRTY)=VMDLPRTY+ATOD−ATOD2
【0084】
図1に関連して図9を参照すると、ユーザが早すぎない時期に待機され、遅すぎない時期に待機から除去されるように、相対シェアおよび絶対シェア・ユーザ間で中央処理装置使用率をスケジューリングするために、本発明の方法の好ましい実施の形態を実現するための以下ステップともいうプログラミング要素の図解表現が示されている。これらのステップ間の関係は、必ずしも図9に示すように順次ではなく、表1に示す本発明の好ましい実施の形態の疑似コード表現に関連して以下に説明する。
【0085】
中央処理装置または他のシステム・リソース20の消費に関するユーザのシェアは絶対値に制限することができ、その値は正確な最大量26、たとえば、CPUリソース20の20%である。この使用率における絶対値は、一般にこの用語に関連する数学的定義を指すのではなく、相対シェアおよび絶対シェアというIBMのVMスケジューラ概念によるものである。たとえば、5人のユーザがそれぞれ100という相対シェアで定義され、5人全員が活動状態である場合、スケジューラ44はシステムCPUリソース20の1/5をそれぞれに与えようと試みる。そのうちの4人だけが活動状態である場合、スケジューラ44はシステム・リソース20の1/4をそれぞれに与えようと試みる。それぞれは、自分の優先順位と、その時点で活動状態のすべての相対シェア・ユーザの全優先順位とに基づいてシステムの相対シェアを獲得する。システムの絶対シェアも1人のユーザに与えることができる。たとえば、あるユーザには、システムの20%という絶対シェアを与えることができる。これは、何人の相対シェア・ユーザが活動状態であっても、このユーザがシステム・リソースの20%を獲得することを意味する。相対シェア・ユーザには残りの部分、この場合、CPUリソースの80%の比例シェアが与えられる。
【0086】
ステップ50では、(a)ユーザ最小シェア割当て24、(b)ユーザが中央演算処理装置(CPU)リソース20を消費しているときに前進する第1の人工時刻クロック(ATOD)23、(c)高ディスパッチ優先順位限界(TOD−TIED)28、(d)低ディスパッチ優先順位限界(最大降下)18によって定義される境界内で決定される値35によって、プロセッサ使用率に関する優先順位がユーザに付けられる。
【0087】
システム・リソースのシェアに関するユーザ限界は、指定の絶対または相対値としてシステム・ディレクトリに定義される。たとえば、VMディレクトリは、システムに対してユーザを定義するために使用する。各ユーザごとに、システム・リソースのうち、相対シェアまたは絶対シェアのどちらのシェアをこのユーザが持つことができるかを指定するためにSHAREステートメント24、26を含むことができる項目が存在する。このシェアは、SET SHAREコマンドを使用することにより、システムが動作している間に動的に変更することもできる。
【0088】
ユーザには「境界内で優先順位を付ける」ことによりシステム・リソースが与えられるが、これにより、その優先順位35に基づいて、しかし、新たに計算した優先順位によってシステムに関するユーザのシェアがその定義済み最小シェア28より低下するかまたはその定義済み最大シェア26を超えない場合に限り、CPUリソース20などのシステム・リソースがユーザに与えられることを意味する。たとえば、VMスケジューラ44の場合、ユーザは、最小相対または絶対シェア24および最大相対または絶対シェア26によって定義することができる。このような定義は、あるユーザに関するディスパッチ優先順位値35を計算するときに考慮される境界を形成する。たとえば、あるユーザに200という相対シェア24と20%という「リミットハード」絶対最大シェア26が割り当てられ、このユーザと他の相対200ユーザだけが活動状態である場合、「リミットハード」ユーザは、最大境界が指定されていない場合にそのユーザがシステムCPUリソース20の50%を受け取れるとしても、20%の最大境界26内で優先順位が付けられることになる。
【0089】
それに関する「ユーザ最小シェア」24が定義されているユーザは、すべての活動ユーザの全相対シェアの一部分としてそのユーザの指定の相対シェアに基づいてシステム・リソースのシェアに対する資格を有する。ユーザ最小シェアは、そのユーザに関するVMディレクトリに指定され、残りのシェア(上記の通り)と同じように計算されるが、そのディレクトリからの指定の最小シェアを使用する。また、ユーザ最大シェアも同じ計算であるが、これはVMディレクトリ内のユーザの指定の最大シェア26に基づくものである。
【0090】
「人工時刻」(ATOD)23は、システム全体の時刻クロック・フォーマット・フィールドである。特定のCPUリソースは、同時に作業中(すなわち、消費中)と待機中の両方になることはできず、値ATOD23は、システム・オーバヘッドとは区別されるように、そのユーザ(任意のユーザ)作業がシステム上で実行されている間に増加する。システムのディスパッチ優先順位計算は、ATOD値23に基づき、それと比較される。「ATOD」23および「ATOD2」21はどちらも人工時刻クロックである。ATODまたはATOD2はどちらも実際のクロックではないが、ソフトウェアで管理されるフィールドであって、TODクロック・フォーマットになっており、時間値が累積されるフィールドである。このソフトウェアはこれらのフィールドを適宜更新する。ATOD2は、システムが実際にユーザ作業を実行しているすべての時間とシステムが待機している時間を累積する。ATODはシステムが実際にユーザ作業を実行しているすべての時間を累積し、所与の状況では待機時間も累積する。したがって、ATODは実際には、ATOD2に累積される時間のサブセットの累積である。
【0091】
(デヴィソンによる同時係属特許出願第08/252864号の場合と同様に)待機時間によるATODの更新がディスパッチャ経路内のみではなく活動待機プロセスで発生することは、本発明の好ましい実施の形態の本質的な特徴である。以下に述べるように、通常のディスパッチャ経路(前述のように待機時間の小さい部分のみを加えるもの)内ではなく活動待機プロセス内のすべての待機時間によりATODを更新する理由は、活動待機が少なくともたとえば250ミリ秒であったことなど、ある種の状況で待機時間全体をATODに含めることが望ましいからである。したがって、一般にATODはユーザ作業時間を累積する。ほとんどのシステムではそのようになるだろう。しかし、何らかの待機時間がATODに含まれることになるような所与の状況が存在する。これまで、このような状況は極めて制限されてきたかまたはまれなことであり、ATODに含まれる待機時間の量はごくわずかであった。本発明によれば、より頻繁に発生する状況ではより多くの待機時間がATODの累積に含まれる。すなわち、低ロード状況中(活動待機ルーチン中)に、限定ユーザが存在し、中央処理装置がたとえば250ミリ秒またはそれ以上の間、連続的に活動待機になっていた場合である。
【0092】
優先順位限界35は「高ディスパッチ」値および「低ディスパッチ」値によって定義される。特定のユーザのディスパッチ優先順位35が現行ATOD値23から外れすぎないようにするため、スケジューラ44はたとえば、現行ATOD23とユーザの優先順位35との差を高ディスパッチ優先順位限界(TOD−TIED)28という最大値と低ディスパッチ優先順位限界(最大降下)18に制限する。あるユーザのディスパッチ優先順位35は、そのユーザに関する常軌を逸した応答時間を防止するために、このような限界の外側に設定されることはないだろう。
【0093】
ステップ52では、リソース20の消費は、(a)選択されたユーザに割り当てられるユーザ最大限定シェア割当て26を確立し、(b)限界リスト27を設け、(c)ユーザがCPUリソース20を消費している場合およびCPUが待機している場合に前進する第2の人工時刻クロック(ATOD2)21を設けることにより、ユーザのために境界18、28内の指定の絶対値に制限される。
【0094】
限界リストは、リソースに関するその消費がシステム・ディレクトリ内のそのSHAREステートメント24、26によってまたはSET SHAREコマンドにより許される最大絶対シェアに達するかまたはそれを超えたユーザのリスト27である。このリスト27上にある間、ユーザはスケジューラ44によってディスパッチされず、したがって、そのリソース20の消費は制限される。ユーザは最大絶対シェアまたは最大相対シェアによって指定することができ、これらのうちのいずれか一方はリミットハードにすることができる。いずれかのタイプの最大シェア(絶対または相対)を備えたリミットハード・ユーザは、限界リスト上に置くことによって制限することができる。また、リミットハード機能とは異なる働きをするリミットソフト機能も存在する。リミットソフト・ユーザは、限界リスト上に置くことによって制限されることはない。
【0095】
本発明によれば、リミットハード・ユーザが早すぎない時期に限界リストに掲載され、遅すぎない時期に限界リストから除去されることを保証するために、あるユーザが限定ユーザであり、しかもそのディスパッチ優先順位が最大降下(現行ATOD+N*オフセット)を超える新しいディスパッチ優先順位に再計算され、しかもそのユーザがその限界に達した場合に、そのユーザは限界リストに加えられる。ATOD2があるユーザの限界リスト優先順位の1つのマイナー・タイム・スライス内になるように計算された場合に、そのユーザは限界リストから除去されるが、ただし、Nは何らかの事前選択値であり、一例としてN=4である。
【0096】
ステップ54では、そのユーザの限界リスト27の優先順位が決定され、第2の人工時刻クロック(ATOD2)21の前進に基づいて限界リストからユーザを除去すべきかどうかも決定される。
【0097】
ステップ56では、CPUがアイドルであるときに、着信タスク32の活動待機連続モニタ30が用意される。この「活動待機ルーチン」または「活動待機メカニズム」は、マルチプロセッシング・システムで使用される方法であり、それにより実行すべき作業を持たないプロセスがループし、使用不可能の待機状態をロードするのではなく使用可能になる作業を活動的に探す。これは、作業をスタックするプロセッサからその作業がスタックされているプロセッサに作業がその上にスタックされていることを認識しなければならないという負担からプロセッサを解放するものである。
【0098】
ステップ58では、ディレクトリ内のそのシェア定義26によって制限されるユーザにとって使用可能なCPUリソースの最大シェアである最大使用率シェア26に基づいてユーザに優先順位が割り当てられる。そのユーザのみに使用可能なシステムのシェアに基づいてスケジューラ44が優先順位を割り当てる時期があり、それが限定シェア・ユーザであるために使用可能なシェアがユーザに許されているものより大きくなる時期がある。ユーザが(限界リスト27内に存在することにより)制限され、使用可能なシェアがユーザに許されているシェア26より大きくなる場合、「最大使用率シェア」26を使用してそのユーザのディスパッチ優先順位35を計算する。
【0099】
ステップ60では、そのユーザのディスパッチ優先順位35について計算された新しい値分だけ低ディスパッチ優先順位限界(最大降下)18を超える場合、ユーザは限界リスト27に掲載される。ディスパッチ優先順位35は1人のユーザについて様々な時期に計算される。あるユーザを限界リスト27に掲載すべきかどうかを判定するための検査は、そのユーザのディスパッチ優先順位35が再計算されるときに行われる。
【0100】
ステップ62では、限界リスト上の存続持続時間29はATOD23およびATOD2 21を参照することによって決定される。あるユーザのディスパッチ優先順位35が計算される場合、それはある事象が今後発生するときのATOD23の値の予測であり、その事象はユーザのマイナー・タイム・スライスの終了になる。ATOD23のこの予測値はユーザのディスパッチ優先順位35として使用される。そのユーザを限界リスト27上に掲載しなければならないと判定された場合、そのユーザをリストから除去するための基礎として、ATOD23ではなくATOD2 21を使用する。その場合、ATOD23に基づくそのユーザのディスパッチ優先順位は、ATOD2 21から離れて基礎としなければならない限界リスト優先順位35(限界リスト27から離れるべき予測時間)に変更しなければならない。これを行うために使用する計算は、限界リスト優先順位=ATOD2+(ディスパッチ優先順位−ATOD)である。
【0101】
ステップ64では、限界シェア・ユーザがCPUを求めて競合する時期が決定される。
【0102】
ステップ66では、中央演算処理装置(CPU)などのシステム・リソースが連続的に、定義された実時間間隔の間、活動待機状況(割込みなしに動作中、すなわち、いずれのユーザ作業32の検出も実行もなし)になっていた時期が決定される。この決定は、活動待機状態に入ったときに実システムTODクロックの値を保管し、それを現行TOD値と比較することによって行われる。
【0103】
ステップ68では、ATOD23が増分され、ATOD2 21が更新される。
【0104】
本発明の好ましい実施の形態によれば、ATOD23のこの増分は活動待機プロセス30中に行われる。活動待機コードのループを通るたびに、限界リスト27上にユーザが存在するかどうかを判定するための検査が行われる。存在し、活動待機プロセス30が指定の時間間隔(たとえば、2.5ミリ秒)の間、連続的に実行中であった場合、最後にATOD23が更新されてから活動待機で経過した時間の全量分だけ、ATOD23値が増加する。したがって、システムが低ロード状態(新しい作業が一切使用可能にならずに、少なくとも250ミリ秒の間、活動待機になっているプロセッサによって定義される)になっており、限界リスト上に限定ユーザが存在する場合、待機時間間隔全体がATOD23に追加される。
【0105】
ATOD2 21のこの更新もディスパッチャへのその呼出しにより活動待機プロセス30中に行われる。活動待機30コードのループを通るたびに、限界リスト27上にユーザが存在するかどうかを判定するための検査が行われる。存在し、活動待機プロセス30が指定の時間間隔(たとえば、2.5ミリ秒)の間、連続的に実行中であった場合、活動待機ルーチンがディスパッチャを呼び出し、それが最後にATOD2 21が更新されてから活動待機で経過した時間の量だけ、ATOD2 21の値を増加する。低ロード状態にあるときに活動待機処理中にATOD2を更新するためにディスパッチャを呼び出すことにより、限界リストからユーザを除去する必要性についてより頻繁に検査が行われる。
【0106】
ステップ70では、ATOD2値21が限界リスト優先順位35の1マイナー・タイム・スライス内にあり、CPUの連続的活動待機状況時間がATOD2 21に含まれる場合に、ユーザが限界リスト27から除去される。
【0107】
したがって、本発明の好ましい実施の形態によれば、CPU待機時間をATOD23に追加すると、ユーザが低ロード(アイドルCPU)状況で時期尚早に限界リスト27に掲載されないことが保証され、活動待機ルーチンからディスパッチャへの呼出しにより限界リスト27からユーザを除去するかどうかの検査の細分性が増加するので限界リスト存続に関するより良い精度が得られる。このようにして、ユーザを除去すべきかどうかについて限界リスト27を検査する時期と次にそれを検査する時期との間隔のサイズが低減される。時間間隔が小さくなるということは、細分性が増加することを意味する。
【0108】
限界リスト27は、ユーザがそれに許されているもの(26)より多くのCPUリソース20を受け取るときにそのユーザを抑えるために使用する。このような事態が発生する場合、ユーザは一時的に限界リスト27に掲載される。スケジューラ44は、そのユーザを限界リスト27から取り除く時期であるかどうかを判定するために検査を行う。これらの検査は、限界リストからの「除去の検査」と呼ばれるものである。この「検査」は事象主導型である。本発明以前は、限界リストはこのユーザ作業をスケジューリングしディスパッチするプロセス中に活動プロセッサ(実行すべきユーザ作業を備えたもの)によって検査されていた。本発明によれば、活動待機メカニズムでもこれらの検査が行われる。
【0109】
表1は、本発明の好ましい実施の形態の方法の疑似コード説明を示している。この疑似コードは、括弧[]内の図2の諸ステップへの参照で注釈が付けられている。表1に関連して図1を参照すると、ディスパッチャ40(HCPDSPCHという)は行2から始まるディスパッチャ・ループによって実現され、モニタ30は行18から始まる活動待機ルーチンによって実現され、スケジューラ44は行36から始まるスケジュール優先順位再計算コードによって実現される。行20には、実行すべき新しい作業が存在し、たとえば、着信タスク32は空ではない。行25では、250ミリ秒への参照を他のシステムの適切な事前選択時間値に合わせることができるだろう。行11と行27の両方では、最後に待機時間が追加されてからの待機時間がATODに追加され、行32のディスパッチャへの呼出しにより、ATOD2にも追加される。ディスパッチャを呼び出すことにより待機ルーチン中に待機時間が追加される理由は本発明にとって重要なことである。以前は、行11の処理が行われるまで、待機時間は決してATOD2に追加されなかった。低ロード状況では、その処理が行われるまでかなりの時間がある可能性がある。この結果、これまでは限界リスト27上のユーザが非常に長い間そこに存続していた。本発明では、低ロード状況では待機時間のより小さい増分がより頻繁に追加され、同時に限界リストが検査され、それに値するユーザがそうすべきときに限界リストから除去される。表1の行35は図1の線82によって表されるが、これは、活動待機連続モニタ30が待機時間をATODに追加するときに活動待機連続モニタ30がディスパッチャ40に移行してATOD2を更新するという追加の意味を有する。表1の行50に記載されている新しい優先順位は、そのユーザがもう一度ディスパッチされる時期を決定するために使用するそのユーザの再計算ディスパッチ(すなわち、締切り)優先順位である。このディスパッチ優先順位は、最大降下およびTOD−TIEDという限界によって制限される。スケジューラ44は行58のこの優先順位を使用して、そのユーザを優先順位順にディスパッチ・リスト37に掲載する。表1の行54に示す式内の数字「4」は経験的に定義された最適数を表し、本発明の範囲から逸脱せずに変更できるはずである。表1の行61では、そのユーザは、その新たに再計算されたディスパッチ・リスト優先順位35に基づいてディスパッチ・リスト37上で再順序付けが行われる。
【表1】
Figure 0003606555
【表2】
Figure 0003606555
【表3】
Figure 0003606555
【0110】
従来技術を超える利点
本発明の1つの利点は、低ロード状況でそのハード限界に極めて近いかまたは等しいシステム・リソースへのユーザ・アクセスの許可を容易にするためのスケジューラ・システムおよび方法が提供されることである。
【0111】
本発明の他の利点は、システム・リソースに関する最適請求を容易にし、請求の総額またはこのようなリソースの可用性に対するユーザの不快感を低減する、改良されたスケジューラが提供されることである。
【0112】
本発明の他の利点は、ユーザの優先順位を決定し、どのユーザが次に実行できるかを決定するためにシステムが使用するスケジューリング・アルゴリズムへのフィードバック・メカニズムとしてモニタ・データが使用される、システムおよび方法が提供されることである。
【0113】
本発明の他の利点は、限定アクセス権を有するユーザを早すぎない時期に限界リストに掲載し、遅すぎない時期に限界リストから除去することにより、このようなユーザに対してシステム・リソースをスケジューリングするためのシステムおよび方法が提供されることである。
【0114】
本発明の他の利点は、遅すぎない時期にリソースのスケジューリングを可能にし、早すぎない時期にリソースのスケジューリングを禁止することにより、限定アクセス権を有するユーザに対してシステム・リソースをスケジューリングするためのシステムおよび方法が提供されることである。
【0115】
代替実施の形態
例示のために本発明の具体的な実施の形態についてここで説明してきたが、本発明の精神および範囲から逸脱せずに様々な変更が可能であることが分かるだろう。特に、本発明の方法によりコンピュータの動作を制御するためにマシンによって読取り可能な信号を記憶するための固体または流体伝送媒体、磁気または光学ワイヤ、テープ、ディスクなどのプログラム記憶装置またはメモリ・デバイスを提供することまたは本発明のシステムによりその構成要素を構築することあるいはその両方は、本発明の範囲内である。
【0116】
さらに、この方法の各ステップは、IBMのシステム390、AS/400、PCなどの汎用コンピュータのいずれでも、C++、Java、Pl/1、Fortranなどのいずれかのプログラミング言語から生成されたプログラム・モジュールまたはオブジェクトの1つまたは複数あるいは1つまたは複数のうちの一部により実行することができる。さらに、前記各ステップまたは前記各ステップを実現するファイルまたはオブジェクトなどは、そのために設計された専用ハードウェアまたは回路モジュールによって実行することができる。
【0117】
まとめとして、本発明の構成に関して以下の事項を開示する。
【0118】
(1)ユーザによるシステム・リソースの使用をスケジューリングする方法であって、
第1のクロックを維持するステップと、
第2のクロックを維持するステップと、
ディスパッチ・プロセス中に
実行すべき作業がある場合、前記ユーザが待機状況になっていないときのみ、他のユーザとともにディスパッチ優先順位順に前記ユーザに対してシステム・リソースの使用をスケジューリングするステップと、
それ以外の場合に、
ユーザ時間分だけ前記第1のクロックを進めるステップと、
ユーザ時間および待機時間分だけ前記第2のクロックを進めるステップと、
待機プロセス中に
実行すべき作業がある場合、前記ディスパッチ・プロセスを呼び出すステップと、
それ以外の場合に待機時間の時間的調節を行うステップと、
前記待機時間が所定の値を超過したときに待機状況にあるユーザが存在する場合、前記待機時間分だけ前記第1のクロックを増分し、前記ディスパッチ・プロセスを呼び出すステップを
含む方法。
(2)スケジューラ・プロセス中に
前記ユーザのユーザ・シェアを決定するステップと、
前記ユーザ・シェアが所定の最大許容シェアを超過した場合、前記ユーザ・シェアと、前のタイム・スライス上のオーバランに応じて調整されたタイム・スライスとに基づいてユーザ・オフセットを計算するステップと、
前記ユーザ・オフセットを加えた現行ディスパッチ優先順位に等しい前記ユーザの新しいディスパッチ優先順位を計算するステップと、
前記新しいディスパッチ優先順位が前記ユーザ・オフセットの関数分だけ前記第1のクロックを超過した場合、前記ユーザを待機状況にして前記ディスパッチ・プロセスを呼び出し、それ以外の場合に前記ディスパッチ・プロセスを呼び出すステップと、
前記ディスパッチ・プロセス中に、前記ユーザがタイム・スライスを完了したときに、前記スケジューラ・プロセスを呼び出すステップを
さらに含む上記(1)に記載の方法。
(3)さらに前記ディスパッチ・プロセス中に
前記ユーザが前記第2のクロックの1つのタイム・スライス内の限界優先順位で待機状況になっている場合、限界状況から前記ユーザを除去するステップを
さらに含む上記(2)に記載の方法。
(4)複数の限定ユーザ間でシステム・リソースの使用をスケジューリングする方法であって、
第1の時刻クロックを維持するステップと、
第2の時刻クロックを維持するステップと、
ディスパッチ・ルーチンを実行するステップと、
活動待機ルーチンを実行するステップと、
優先順位再計算ルーチンを実行するステップを
含み、
前記優先順位再計算ルーチンが
第1のユーザのユーザ・シェアを計算するステップと、
前記ユーザ・シェアが所定の最大許容シェアを超過した場合、前記ユーザ・シェアと、前のマイナー・タイム・スライス上のオーバランに応じて調整されたマイナー・タイム・スライスのサイズとに基づいてユーザ・オフセットを計算するステップと、
前記ユーザ・オフセットを加えた古い優先順位に等しいユーザ・ディスパッチ優先順位を計算するステップと、
前記ユーザ・ディスパッチ優先順位が前記ユーザ・オフセットの関数を加えた前記第1のクロックに等しい最大降下値を超過し、これが限定ユーザであり、このユーザがその最大シェアでスケジューリングされる場合、前記ユーザを限界リストに追加するステップと、
それ以外の場合に前記ユーザをディスパッチ・リスト上に優先順位順に再順序付けするステップと、
前記ディスパッチャ・ルーチンを実行するステップを
含み、
前記ディスパッチャ・ルーチンが
ディスパッチすべき作業がない場合、前記活動待機ルーチンを実行し、それ以外の場合にいずれかの優先順位システム作業を実行するステップと、
前記ユーザのマイナー・タイム・スライスが終了したばかりの場合、前記スケジューラ・ルーチンを実行するステップと、
それ以外の場合にユーザ時間によって前記第1の時刻クロックを進めるステップと、
ユーザ時間および待機時間によって第2の時刻クロックを進めるステップと、
前記限界リスト上のユーザが前記第2の時刻クロックの1つのマイナー・タイム・スライス内にある場合、前記限界リストから前記ユーザを除去するステップと、
ディスパッチ・リスト優先順位に基づいてユーザをディスパッチするステップを
含み、
前記活動待機ルーチンが
実行すべき新しい作業がある場合、前記ディスパッチャ・ルーチンを実行するステップと、
それ以外の場合に前記限界リスト上にユーザが存在し、活動待機処理が所定の限界を超過した場合、
前記第1の時刻クロックに待機時間を追加するステップと、
前記ディスパッチャ・ルーチンを実行するステップを
含み、
それにより、ユーザが早すぎない時期に前記限界リストに追加され、遅すぎない時期に前記限界リストから除去される方法。
(5)システム・リソースをスケジューリングする方法において、
(1)(a)ユーザ最小シェア割当て、(b)ユーザがシステム・リソースを消費しているときに前進する第1の人工時刻クロック、(c)高ディスパッチ優先順位限界、(d)低ディスパッチ優先順位限界によって定義される境界内でプロセッサ使用率に関する優先順位をユーザに付けるステップと、
(2)(a)選択されたユーザに割り当てられるユーザ最大限定シェア割当てを確立し、(b)限界リストを設け、(c)ユーザがシステム・リソースを消費している場合および前記システム・リソースが待機している場合に前進する第2の人工時刻クロックを設けることにより、ユーザによる中央演算処理装置の消費を前記境界内の指定の絶対値に制限するステップと、
(3)限界リスト優先順序を決定し、前記第2の人工時刻クロックの前進に基づいて前記限界リストから除去すべき時期を決定するステップと、
(4)前記CPUがアイドルであるときに、着信タスクの活動待機対話式連続モニタを用意するステップと、
(5)最大使用率シェアに基づいてユーザに優先順位を割り当てるステップと、
(6)前記低ディスパッチ優先順位限界を超過したときに、前記限界リストにユーザを掲載するステップと、
(7)前記限界リスト上の存続持続時間を決定するために前記第1の人工時刻クロックの時間を前記第2の人工時刻クロックの時間に変換するステップと、
(8)限界シェア・ユーザがCPUリソースを求めて競合する時期を認識するステップと、
(9)前記システム・リソースが定義された実時間間隔の間、連続活動待機状況になっていた時期を認識し、それに対する応答として、前記第1の人工時刻クロックおよび前記第2の人工時刻クロックを待機時間分だけ更新するステップと、
(10)それに関する前記第2の人工時刻クロック値が低ロード条件下で前記第2の人工時刻クロックに含まれる前記待機時間の実質的にすべてによって前記限界リスト優先順位を超過するユーザを前記限界リストから除去するステップを
含む方法。
(6)ユーザによるシステム・リソースの使用をスケジューリングするための方法ステップを実行するためにマシンによって実行可能な命令からなるプログラムを具体的に実施する、マシンによって読取り可能なプログラム記憶装置において、前記方法ステップが、
第1のクロックを維持することと、
第2のクロックを維持することと、
ディスパッチ・プロセス中に
実行すべき作業がある場合、前記ユーザが待機状況になっていないときのみ、他のユーザとともにディスパッチ優先順位順に前記ユーザに対してシステム・リソースの使用をスケジューリングすることと、
それ以外の場合にユーザ時間分だけ前記第1のクロックを前進することと、
ユーザ時間および待機時間分だけ前記第2のクロックを前進することと、
待機プロセス中に
実行すべき作業がある場合、前記ディスパッチ・プロセスを呼び出すことと、
それ以外の場合に待機時間の時間的調節を行うことと、
前記待機時間が所定の値を超過したときに待機状況にあるユーザが存在する場合、前記待機時間分だけ前記第1のクロックを増分し、前記ディスパッチ・プロセスを呼び出すこととを含む、プログラム記憶装置。
(7)ユーザによるシステム・リソースの使用をスケジューリングするためにそこで実施されるコンピュータ可読プログラム・コード手段を有するコンピュータ使用可能媒体を含む製品において、前記製品における前記コンピュータ可読プログラム手段が、
第1のクロックを維持することをコンピュータに実施させるためのコンピュータ可読プログラム・コード手段と、
第2のクロックを維持することをコンピュータに実施させるためのコンピュータ可読プログラム・コード手段と、
ディスパッチ・プロセス中に
実行すべき作業がある場合、前記ユーザが待機状況になっていないときのみ、他のユーザとともにディスパッチ優先順位順に前記ユーザに対してシステム・リソースの使用をスケジューリングすることと、
それ以外の場合にユーザ時間分だけ前記第1のクロックを前進することと、ユーザ時間および待機時間分だけ前記第2のクロックを前進することをコンピュータに実施させるためのコンピュータ可読プログラム・コード手段と、
待機プロセス中に
実行すべき作業がある場合、前記ディスパッチ・プロセスを呼び出すことと、
それ以外の場合に待機時間の時間的調節を行うことと、
前記待機時間が所定の値を超過したときに待機状況にあるユーザが存在する場合、前記待機時間分だけ前記第1のクロックを増分し、前記ディスパッチ・プロセスを呼び出すことをコンピュータに実施させるためのコンピュータ可読プログラム・コード手段とを含む製品。
(8)ユーザによるシステム・リソースの使用をスケジューリングするためのシステムにおいて、
第1のクロックと、
第2のクロックと、
ディスパッチ・プロセスであって
実行すべき作業がある場合、前記ユーザが待機状況になっていないときのみ、他のユーザとともにディスパッチ優先順位順に前記ユーザに対してシステム・リソースの使用をスケジューリングし、
それ以外の場合にユーザ時間分だけ前記第1のクロックを前進し、
ユーザ時間および待機時間分だけ前記第2のクロックを前進するためのディスパッチ・プロセスと、
待機プロセスであって
実行すべき作業がある場合、前記ディスパッチ・プロセスを呼び出し、
それ以外の場合に待機時間の時間的調節を行い、
前記待機時間が所定の値を超過したときに待機状況にあるユーザが存在する場合、前記待機時間分だけ前記第1のクロックを増分し、前記ディスパッチ・プロセスを呼び出すための待機プロセスとを含むシステム。
(9)スケジューラ・プロセスであって
前記ユーザのユーザ・シェアを決定し、
前記ユーザ・シェアが所定の最大許容シェアを超過した場合、前記ユーザ・シェアと、前のタイム・スライス上のオーバランに応じて調整されたタイム・スライスとに基づいてユーザ・オフセットを計算し、
前記ユーザ・オフセットを加えた現行ディスパッチ優先順位に等しい前記ユーザの新しいディスパッチ優先順位を計算し、
前記新しいディスパッチ優先順位が前記ユーザ・オフセットの関数分だけ前記第1のクロックを超過した場合、前記ユーザを待機状況にして前記ディスパッチ・プロセスを呼び出し、それ以外の場合に前記ディスパッチ・プロセスを呼び出すためのスケジューラ・プロセスと、
前記ユーザがタイム・スライスを完了したときに、前記スケジューラ・プロセスを呼び出す前記ディスパッチ・プロセスをさらに含む、上記(8)に記載のシステム。
(10)前記ディスパッチ・プロセスであって
前記ユーザが前記第2のクロックの1つのタイム・スライス内の限界優先順位で待機状況になっている場合、限界状況から前記ユーザを除去するための前記ディスパッチ・プロセスをさらに含む、上記(9)に記載のシステム。
【図面の簡単な説明】
【図1】本発明の好ましい実施の形態を実現する方法およびデータ構造のシステム図である。
【図2】コンピュータ・オペレーティング・システムの流れ図である。
【図3】ディスパッチャの流れ図の関係を示す図である。
【図4】ディスパッチャの流れ図である。
【図5】ディスパッチャの流れ図である。
【図6】ディスパッチャの流れ図である。
【図7】図2のオペレーティング・システム内のスケジューラの(小さい部分の)流れ図である。
【図8】ディスパッチ・リストを示す図である。
【図9】本発明の方法の好ましい実施の形態を実現するプログラミング・モジュールの図解表現である。
【符号の説明】
18 最大降下
20 システム・リソース
21 ATOD2
22 実時間クロック
23 ATOD
24 ユーザ最小シェア割当て
25 オフセット
26 ユーザ最大シェア割当て
27 限界リスト
28 TOD−TIED
29 限界リスト上の存続時間(限界リスト優先順位)
30 活動待機連続モニタ
32 着信タスク
35 ユーザのディスパッチ・リスト優先順位
37 ディスパッチ・リスト
40 ディスパッチャ
44 スケジューラ

Claims (10)

  1. ユーザによるシステム・リソースの使用をスケジューリングする方法であって、
    ユーザ・ディスパッチ優先順位に関連付けられている第1の人工時刻クロックを維持するステップと、
    限界リスト優先順位に関連付けられている第2の人工時刻クロックを維持するステップと、
    ディスパッチ・プロセス中に
    実行すべき作業がある場合、前記ユーザが待機状況になっていないときのみ、他のユーザとともにディスパッチ優先順位順に前記ユーザに対してシステム・リソースの使用をスケジューリングするステップと、
    それ以外の場合に、
    ユーザ時間分だけ前記第1の人工時刻クロックを進めるステップと、
    ユーザ時間および待機時間分だけ前記第2の人工時刻クロックを進めるステップと、
    待機プロセス中に、
    実行すべき作業がある場合、前記ディスパッチ・プロセスを呼び出すステップと、
    それ以外の場合に前記待機時間が所定の値を超過したときに活動待機状況にあるCPUが存在する場合、前記待機時間分だけ前記第1の人工時刻クロックを増分し、前記ディスパッチ・プロセスを呼び出すステップと
    を含む方法。
  2. スケジューラ・プロセス中に
    前記ユーザのユーザ・シェアを決定するステップと、
    前記ユーザ・シェアが所定の最大許容シェアを超過した場合、前記ユーザ・シェアと、前のタイム・スライス上のオーバランに応じて調整されたタイム・スライスとに基づいてユーザ・オフセットを計算するステップと、
    前記ユーザ・オフセットを加えた現行ディスパッチ優先順位に等しい前記ユーザの新しいディスパッチ優先順位を計算するステップと、
    前記新しいディスパッチ優先順位が前記ユーザ・オフセットの関数分だけ前記第1の人工時刻クロックを超過した場合、前記ユーザを待機状況にして前記ディスパッチ・プロセスを呼び出し、それ以外の場合に前記ディスパッチ・プロセスを呼び出すステップと、
    前記ディスパッチ・プロセス中に、前記ユーザがタイム・スライスを完了したときに、前記スケジューラ・プロセスを呼び出すステップと
    をさらに含む請求項1に記載の方法。
  3. さらに前記ディスパッチ・プロセス中に
    前記ユーザが前記第2の人工時刻クロックの1つのタイム・スライス内の限界優先順位で待機状況になっている場合、限界状況から前記ユーザを除去するステップを
    さらに含む請求項2に記載の方法。
  4. 複数の限定ユーザ間でシステム・リソースの使用をスケジューリングする方法であって、
    ユーザ・ディスパッチ優先順位に関連付けられている第1の人工時刻クロックを維持するステップと、
    限界リスト優先順位に関連付けられている第2の人工時刻クロックを維持するステップと、
    ディスパッチ・ルーチンを実行するステップと、
    活動待機ルーチンを実行するステップと、
    優先順位再計算ルーチンを実行するステップを
    含み、
    前記優先順位再計算ルーチンが
    第1のユーザのユーザ・シェアを計算するステップと、
    前記ユーザ・シェアが所定の最大許容シェアを超過した場合、前記ユーザ・シェアと、前のマイナー・タイム・スライス上のオーバランに応じて調整されたマイナー・タイム・スライスのサイズとに基づいてユーザ・オフセットを計算するステップと、
    前記ユーザ・オフセットを加えた古い優先順位に等しいユーザ・ディスパッチ優先順位を計算するステップと、
    前記ユーザ・ディスパッチ優先順位が前記ユーザ・オフセットの関数を加えた前記第1の人工時刻クロックに等しい最大降下値を超過し、これが限定ユーザであり、このユーザがその最大シェアでスケジューリングされる場合、前記ユーザを限界リストに追加するステップと、
    それ以外の場合に前記ユーザをディスパッチ・リスト上に優先順位順に再順序付けするステップと、
    前記ディスパッチャ・ルーチンを実行するステップと
    を含み、
    前記ディスパッチャ・ルーチンが
    ディスパッチすべき作業がない場合、前記活動待機ルーチンを実行し、それ以外の場合にいずれかの優先順位システム作業を実行するステップと、
    前記ユーザのマイナー・タイム・スライスが終了したばかりの場合、前記スケジューラ・ルーチンを実行するステップと、
    それ以外の場合にユーザ時間によって前記第1の人工時刻クロックを進めるステップと、
    ユーザ時間および待機時間によって第2の人工時刻クロックを進めるステップと、
    前記限界リスト上のユーザが前記第2の人工時刻クロックの1つのマイナー・タイム・スライス内にある場合、前記限界リストから前記ユーザを除去するステップと、
    ディスパッチ・リスト優先順位に基づいてユーザをディスパッチするステップと
    を含み、
    前記活動待機ルーチンが
    実行すべき新しい作業がある場合、前記ディスパッチャ・ルーチンを実行するステップと、
    それ以外の場合に前記限界リスト上にユーザが存在し、活動待機処理が所定の限界を超過した場合、
    前記第1の人工時刻クロックに待機時間を追加するステップと、
    前記ディスパッチャ・ルーチンを実行するステップと
    を含み、
    それにより、ユーザが早すぎない時期に前記限界リストに追加され、遅すぎない時期に前記限界リストから除去される方法。
  5. システム・リソースをスケジューリングする方法において、
    (1)(a)ユーザ最小シェア割当て、(b)ユーザがシステム・リソースを消費しているときに前進する第1の人工時刻クロック、(c)高ディスパッチ優先順位限界、(d)低ディスパッチ優先順位限界によって定義される境界内でプロセッサ使用率に関する優先順位をユーザに付けるステップであって、前記第1の人工時刻クロックは、ユーザ・ディスパッチ優先順位に関連付けられている、前記ステップと、
    (2)(a)選択されたユーザに割り当てられるユーザ最大限定シェア割当てを確立し、(b)限界リストを設け、及び(c)ユーザがシステム・リソースを消費している場合および前記システム・リソースが待機している場合に前進する第2の人工時刻クロックを設けることにより、ユーザによる中央演算処理装置の消費を前記境界内の指定の絶対値に制限するステップであって、前記第の人工時刻クロックは、限界リスト優先順位に関連付けられている、前記ステップと
    (3)限界リスト優先順序を決定し、前記第2の人工時刻クロックの前進に基づいて前記限界リストから除去すべき時期を決定するステップと、
    (4)前記CPUがアイドルであるときに、着信タスクの活動待機対話式連続モニタを用意するステップと、
    (5)最大使用率シェアに基づいてユーザに優先順位を割り当てるステップと、
    (6)前記低ディスパッチ優先順位限界を超過したときに、前記限界リストにユーザを掲載するステップと、
    (7)前記限界リスト上の存続持続時間を決定するために前記第1の人工時刻クロックの時間を前記第2の人工時刻クロックの時間に変換するステップと、
    (8)限界シェア・ユーザがCPUリソースを求めて競合する時期を認識するステップと、
    (9)前記システム・リソースが定義された実時間間隔の間、連続活動待機状況になっていた時期を認識し、それに対する応答として、前記第1の人工時刻クロックおよび前記第2の人工時刻クロックを待機時間分だけ更新するステップと、
    (10)ユーザを前記限界リストから除去する(図9符号70)ステップであって、前記ユーザは、前記第2の人工時刻クロック値が低ロード条件下で前記第2の人工時刻クロックに含まれる実質的にすべての前記待機時間を有する前記限界リスト優先順位を超過する、前記除去するステップと
    を含む方法。
  6. ユーザによるシステム・リソースの使用をスケジューリングするための方法ステップを実行するためにマシンによって実行可能な命令からなるプログラムを具体的に実施する、マシンによって読取り可能なプログラム記憶装置において、前記方法ステップが、
    ユーザ・ディスパッチ優先順位に関連付けられている第1の人工時刻クロックを維持することと、
    限界リスト優先順位に関連付けられている第2の人工時刻クロックを維持することと、
    ディスパッチ・プロセス中に
    実行すべき作業がある場合、前記ユーザが待機状況になっていないときのみ、他のユーザとともにディスパッチ優先順位順に前記ユーザに対してシステム・リソースの使用をスケジューリングすることと、
    それ以外の場合にユーザ時間分だけ前記第1の人工時刻クロックを前進することと、
    ユーザ時間および待機時間分だけ前記第2の人工時刻クロックを前進することと、
    待機プロセス中に
    実行すべき作業がある場合、前記ディスパッチ・プロセスを呼び出すことと、
    それ以外の場合に前記待機時間が所定の値を超過したときに活動待機状況にあるCPUが存在する場合、前記待機時間分だけ前記第1の人工時刻クロックを増分し、前記ディスパッチ・プロセスを呼び出すことと
    を含む、プログラム記憶装置。
  7. ユーザによるシステム・リソースの使用をスケジューリングするプログラムを記録したコンピュータ読み取り可能な記録媒体であって、
    コンピュータに、
    ユーザ・ディスパッチ優先順位に関連付けられている第1の人工時刻クロックを維持することを実施させる手段と、
    限界リスト優先順位に関連付けられている第2の人工時刻クロックを維持することをコンピュータに実施させる手段と、
    ディスパッチ・プロセス中に
    実行すべき作業がある場合、前記ユーザが待機状況になっていないときのみ、他のユーザとともにディスパッチ優先順位順に前記ユーザに対してシステム・リソースの使用をスケジューリングすることと、
    それ以外の場合にユーザ時間分だけ前記第1の人工時刻クロックを前進することと、
    ユーザ時間および待機時間分だけ前記第2の人工時刻クロックを前進することを実施させる手段と、
    待機プロセス中に
    実行すべき作業がある場合、前記ディスパッチ・プロセスを呼び出すことと、
    それ以外の場合に前記待機時間が所定の値を超過したときに待機状況にあるユーザが存在する場合、前記待機時間分だけ前記第1の人工時刻クロックを増分し、前記ディスパッチ・プロセスを呼び出すこととを実施させる手段として機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
  8. ユーザによるシステム・リソースの使用をスケジューリングするためのシステムにおいて、
    ユーザ・ディスパッチ優先順位に関連付けられている第1の人工時刻クロックと、
    限界リスト優先順位に関連付けられている第2の人工時刻クロックと、
    ディスパッチ・プロセスであって
    実行すべき作業がある場合、前記ユーザが待機状況になっていないときのみ、他のユーザとともにディスパッチ優先順位順に前記ユーザに対してシステム・リソースの使用をスケジューリングし、
    それ以外の場合にユーザ時間分だけ前記第1の人工時刻クロックを前進し、
    ユーザ時間および待機時間分だけ前記第2の人工時刻クロックを前進するためのディスパッチ・プロセスと、
    待機プロセスであって
    実行すべき作業がある場合、前記ディスパッチ・プロセスを呼び出し、
    それ以外の場合に前記待機時間が所定の値を超過したときに待機状況にあるユーザが存在する場合、前記待機時間分だけ前記第1の人工時刻クロックを増分し、前記ディスパッチ・プロセスを呼び出すための待機プロセスと
    を含むシステム。
  9. スケジューラ・プロセスであって
    前記ユーザのユーザ・シェアを決定し、
    前記ユーザ・シェアが所定の最大許容シェアを超過した場合、前記ユーザ・シェアと、前のタイム・スライス上のオーバランに応じて調整されたタイム・スライスとに基づいてユーザ・オフセットを計算し、
    前記ユーザ・オフセットを加えた現行ディスパッチ優先順位に等しい前記ユーザの新しいディスパッチ優先順位を計算し、
    前記新しいディスパッチ優先順位が前記ユーザ・オフセットの関数分だけ前記第1の人工時刻クロックを超過した場合、前記ユーザを待機状況にして前記ディスパッチ・プロセスを呼び出し、それ以外の場合に前記ディスパッチ・プロセスを呼び出すためのスケジューラ・プロセスと、
    前記ユーザがタイム・スライスを完了したときに、前記スケジューラ・プロセスを呼び出す前記ディスパッチ・プロセス
    をさらに含む、請求項8に記載のシステム。
  10. 前記ディスパッチ・プロセスが、
    前記ユーザが前記第2の人工時刻クロックの1つのタイム・スライス内の限界優先順位で待機状況になっている場合、限界状況から前記ユーザを除去するための前記ディスパッチ・プロセスをさらに含む、請求項9に記載のシステム。
JP2000070538A 1999-03-25 2000-03-14 システム・リソースのスケジューリングのためのシステムおよび方法 Expired - Fee Related JP3606555B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US09/276525 1999-03-25
US09/276,525 US6438704B1 (en) 1999-03-25 1999-03-25 System and method for scheduling use of system resources among a plurality of limited users

Publications (2)

Publication Number Publication Date
JP2000284975A JP2000284975A (ja) 2000-10-13
JP3606555B2 true JP3606555B2 (ja) 2005-01-05

Family

ID=23056982

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000070538A Expired - Fee Related JP3606555B2 (ja) 1999-03-25 2000-03-14 システム・リソースのスケジューリングのためのシステムおよび方法

Country Status (7)

Country Link
US (1) US6438704B1 (ja)
EP (1) EP1039383B1 (ja)
JP (1) JP3606555B2 (ja)
KR (1) KR100352668B1 (ja)
AT (1) ATE395663T1 (ja)
DE (1) DE60038837D1 (ja)
TW (1) TW526452B (ja)

Families Citing this family (59)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7020878B1 (en) 1998-08-28 2006-03-28 Oracle International Corporation System for allocating resource using the weight that represents a limitation on number of allowance active sessions associated with each resource consumer group
US7451448B1 (en) * 1998-08-28 2008-11-11 Oracle International Corporation Methods for selectively quiescing a computer system
US7526767B1 (en) * 1998-08-28 2009-04-28 Oracle International Corporation Methods for automatic group switching according to a resource plan
JP3739610B2 (ja) * 1999-09-24 2006-01-25 松下電器産業株式会社 訪問計画生成装置
US7627694B2 (en) * 2000-03-16 2009-12-01 Silicon Graphics, Inc. Maintaining process group membership for node clusters in high availability computing systems
US20020198996A1 (en) * 2000-03-16 2002-12-26 Padmanabhan Sreenivasan Flexible failover policies in high availability computing systems
US20010049710A1 (en) * 2000-05-16 2001-12-06 Curey Randall K. Partitioned executive structure for real-time programs
US7849463B2 (en) 2000-06-02 2010-12-07 Microsoft Corporation Dynamically variable idle time thread scheduling
US7137117B2 (en) * 2000-06-02 2006-11-14 Microsoft Corporation Dynamically variable idle time thread scheduling
JP2004502235A (ja) * 2000-06-27 2004-01-22 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ スケジュール決定方法、スケジューラ及びシステム
US6795873B1 (en) * 2000-06-30 2004-09-21 Intel Corporation Method and apparatus for a scheduling driver to implement a protocol utilizing time estimates for use with a device that does not generate interrupts
KR100487543B1 (ko) * 2000-09-01 2005-05-03 엘지전자 주식회사 시피유 스케쥴링 방법
US7096469B1 (en) * 2000-10-02 2006-08-22 International Business Machines Corporation Method and apparatus for enforcing capacity limitations in a logically partitioned system
US7032222B1 (en) * 2000-10-13 2006-04-18 Hewlett-Packard Development Company, L.P. Method and system for determining resource allocation to users by granting request based on user associated different limits and resource limit
US6671658B2 (en) * 2000-12-23 2003-12-30 Hewlett-Packard Development Company, L.P Method for service level estimation in an operating computer system
US20020147966A1 (en) * 2001-02-14 2002-10-10 Ncr Corporation Operating software performance monitor
US7170862B1 (en) * 2001-07-31 2007-01-30 Cisco Technology, Inc. Partitioning a network element into multiple virtual network elements
US7143411B2 (en) * 2002-03-15 2006-11-28 Hewlett-Packard Development Company, L.P. Capping processor utilization
KR100471746B1 (ko) * 2002-07-26 2005-03-16 재단법인서울대학교산학협력재단 연성 실시간 태스크 스케줄링 방법 및 그 기록매체
AU2002360777A1 (en) * 2002-12-27 2004-07-22 Unisys Corporation Improving the accuracy of the estimation of computer resource usage
US20060179136A1 (en) * 2002-12-27 2006-08-10 Loboz Charles Z Accuracy of the estimation of computer resource usage
US7191320B2 (en) * 2003-02-11 2007-03-13 Via Technologies, Inc. Apparatus and method for performing a detached load operation in a pipeline microprocessor
JP4107155B2 (ja) * 2003-05-12 2008-06-25 日本電気株式会社 ネットワークセッション制御システム、ネットワーク管理装置およびプログラム
US7751315B1 (en) * 2003-07-15 2010-07-06 Microsoft Corporation Shared network path contention reduction
US7562143B2 (en) * 2004-01-13 2009-07-14 International Business Machines Corporation Managing escalating resource needs within a grid environment
US7406691B2 (en) * 2004-01-13 2008-07-29 International Business Machines Corporation Minimizing complex decisions to allocate additional resources to a job submitted to a grid environment
US7552437B2 (en) * 2004-01-14 2009-06-23 International Business Machines Corporation Maintaining application operations within a suboptimal grid environment
US7266547B2 (en) * 2004-06-10 2007-09-04 International Business Machines Corporation Query meaning determination through a grid service
US7752415B2 (en) * 2004-12-22 2010-07-06 International Business Machines Corporation Method for controlling the capacity usage of a logically partitioned data processing system
US7668741B2 (en) * 2005-01-06 2010-02-23 International Business Machines Corporation Managing compliance with service level agreements in a grid environment
US7761557B2 (en) * 2005-01-06 2010-07-20 International Business Machines Corporation Facilitating overall grid environment management by monitoring and distributing grid activity
US7590623B2 (en) * 2005-01-06 2009-09-15 International Business Machines Corporation Automated management of software images for efficient resource node building within a grid environment
US7502850B2 (en) * 2005-01-06 2009-03-10 International Business Machines Corporation Verifying resource functionality before use by a grid job submitted to a grid environment
US7707288B2 (en) * 2005-01-06 2010-04-27 International Business Machines Corporation Automatically building a locally managed virtual node grouping to handle a grid job requiring a degree of resource parallelism within a grid environment
US7793308B2 (en) * 2005-01-06 2010-09-07 International Business Machines Corporation Setting operation based resource utilization thresholds for resource use by a process
US20060149652A1 (en) * 2005-01-06 2006-07-06 Fellenstein Craig W Receiving bid requests and pricing bid responses for potential grid job submissions within a grid environment
US7571120B2 (en) * 2005-01-12 2009-08-04 International Business Machines Corporation Computer implemented method for estimating future grid job costs by classifying grid jobs and storing results of processing grid job microcosms
US7562035B2 (en) * 2005-01-12 2009-07-14 International Business Machines Corporation Automating responses by grid providers to bid requests indicating criteria for a grid job
US7467196B2 (en) * 2005-01-12 2008-12-16 International Business Machines Corporation Managing network errors communicated in a message transaction with error information using a troubleshooting agent
US7472079B2 (en) * 2005-01-12 2008-12-30 International Business Machines Corporation Computer implemented method for automatically controlling selection of a grid provider for a grid job
US20060195845A1 (en) * 2005-02-28 2006-08-31 Rhine Scott A System and method for scheduling executables
US7908606B2 (en) * 2005-05-20 2011-03-15 Unisys Corporation Usage metering system
US7979460B2 (en) 2006-02-15 2011-07-12 Sony Computer Entainment America Inc. Systems and methods for server management
US8117614B2 (en) * 2006-05-19 2012-02-14 International Business Machines Corporation Extract CPU time facility
US7844970B2 (en) * 2006-08-22 2010-11-30 International Business Machines Corporation Method and apparatus to control priority preemption of tasks
US8286173B2 (en) * 2007-03-23 2012-10-09 Oracle America, Inc. Methods and apparatus for window-based fair priority scheduling
US8046766B2 (en) * 2007-04-26 2011-10-25 Hewlett-Packard Development Company, L.P. Process assignment to physical processors using minimum and maximum processor shares
US8276143B2 (en) * 2008-03-10 2012-09-25 Oracle America, Inc. Dynamic scheduling of application tasks in a distributed task based system
US8250579B2 (en) * 2008-06-27 2012-08-21 Oracle America, Inc. Method for stage-based cost analysis for task scheduling
WO2010032205A1 (en) * 2008-09-17 2010-03-25 Nxp B.V. Electronic circuit comprising a plurality of processing devices
TWI394027B (zh) * 2008-10-27 2013-04-21 Tatung Co 頻率調整方法及使用此方法的電腦程式產品
CN102955559A (zh) * 2011-08-24 2013-03-06 宏碁股份有限公司 节能系统以及节能方法
US9063795B2 (en) 2012-12-19 2015-06-23 International Business Machines Corporation Adaptive resource usage limits for workload management
WO2015101419A1 (en) * 2014-01-02 2015-07-09 Sky Atlas Iletisim Sanayi Ve Ticaret Anonim Sirketi Method and system for allocating resources to resource consumers in a cloud computing environment
US9411629B1 (en) * 2015-03-10 2016-08-09 International Business Machines Corporation Reducing virtual machine pre-emption in virtualized environment
US10931674B2 (en) * 2018-04-30 2021-02-23 Paypal, Inc. Detecting whether to implement one or more security measures on a shared resource
US10768981B2 (en) * 2018-06-21 2020-09-08 Microsoft Technology Licensing, Llc Dynamic time slicing for data-processing workflow
JP7363653B2 (ja) * 2020-04-15 2023-10-18 富士通株式会社 割当制御プログラム、割当制御方法および情報処理装置
CN117376423B (zh) * 2023-12-08 2024-03-12 西南民族大学 一种深度学习推理服务调度方法、系统、设备及存储介质

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4183083A (en) 1972-04-14 1980-01-08 Duquesne Systems, Inc. Method of operating a multiprogrammed computing system
US4551812A (en) 1981-06-17 1985-11-05 Cyborex Laboratories, Inc. Energy controller and method for dynamic allocation of priorities of controlled load curtailment to ensure adequate load sharing
US4481583A (en) 1981-10-30 1984-11-06 At&T Bell Laboratories Method for distributing resources in a time-shared system
US4388688A (en) 1981-11-10 1983-06-14 International Business Machines Corp. Shared TOD clock modification bit
US4989133A (en) 1984-11-30 1991-01-29 Inmos Limited System for executing, scheduling, and selectively linking time dependent processes based upon scheduling time thereof
US4631674A (en) 1985-02-05 1986-12-23 International Business Machines Corporation Active wait
US4736318A (en) 1985-03-01 1988-04-05 Wang Laboratories, Inc. Data processing system having tunable operating system means
CA1329432C (en) * 1988-11-02 1994-05-10 William Davy Method of memory and cpu time allocation for a multi-user computer system
IE61336B1 (en) 1989-10-02 1994-11-02 Sportables Limited A method for controlling the operation of a computer to handle interrupts
US5193187A (en) 1989-12-29 1993-03-09 Supercomputer Systems Limited Partnership Fast interrupt mechanism for interrupting processors in parallel in a multiprocessor system wherein processors are assigned process ID numbers
US5325525A (en) * 1991-04-04 1994-06-28 Hewlett-Packard Company Method of automatically controlling the allocation of resources of a parallel processor computer system by calculating a minimum execution time of a task and scheduling subtasks against resources to execute the task in the minimum time
JPH0774984B2 (ja) 1991-06-10 1995-08-09 インターナショナル・ビジネス・マシーンズ・コーポレイション システム資源利用率測定方法とデータ処理システム
US5291599A (en) 1991-08-08 1994-03-01 International Business Machines Corporation Dispatcher switch for a partitioner
US5375202A (en) * 1993-01-04 1994-12-20 Xerox Corporation Dispatching and scheduling memory operations in an electronic printing system
US5623404A (en) * 1994-03-18 1997-04-22 Minnesota Mining And Manufacturing Company System and method for producing schedules of resource requests having uncertain durations
AU2364095A (en) 1994-05-12 1995-12-05 Ast Research, Inc. Cpu activity monitoring through cache watching
JP3588485B2 (ja) 1994-08-26 2004-11-10 富士通株式会社 プロセススケジューリング方式
US5615121A (en) * 1995-01-31 1997-03-25 U S West Technologies, Inc. System and method for scheduling service providers to perform customer service requests
US5668942A (en) * 1995-06-07 1997-09-16 Xerox Corporation Generic system for describing and using resources for print engine scheduling
JPH0954699A (ja) * 1995-08-11 1997-02-25 Fujitsu Ltd 計算機のプロセススケジューラ
US5987492A (en) * 1997-10-31 1999-11-16 Sun Microsystems, Inc. Method and apparatus for processor sharing

Also Published As

Publication number Publication date
EP1039383A2 (en) 2000-09-27
DE60038837D1 (de) 2008-06-26
KR100352668B1 (ko) 2002-09-13
EP1039383B1 (en) 2008-05-14
KR20010006756A (ko) 2001-01-26
JP2000284975A (ja) 2000-10-13
US6438704B1 (en) 2002-08-20
TW526452B (en) 2003-04-01
EP1039383A3 (en) 2006-08-23
ATE395663T1 (de) 2008-05-15

Similar Documents

Publication Publication Date Title
JP3606555B2 (ja) システム・リソースのスケジューリングのためのシステムおよび方法
JP6386165B2 (ja) 分散コンピュータシステムへの電力割り振りに変更がある場合に中断され得るジョブ及び中断され得ないジョブを管理するための方法並びに装置
EP1474744B1 (en) Method of setting priority levels in a multiprogramming computer system with priority scheduling, multiprogramming computer system and program therefor
US8510741B2 (en) Computing the processor desires of jobs in an adaptively parallel scheduling environment
US6714960B1 (en) Earnings-based time-share scheduling
US9348628B2 (en) Computer system
US20080086734A1 (en) Resource-based scheduler
US20040123297A1 (en) Performance level setting of a data processing system
US6430592B1 (en) System for sharing CPU time amongst multiple users
AU2002230272A1 (en) Method of setting priority levels in a multiprogramming computer system with priority scheduling, multiprogramming computer system and program therefor
JPH07141305A (ja) 並列計算機の実行制御方法
KR20090024256A (ko) 비파괴 시간에 실행하도록 컴퓨터 마이크로-작업을 스케쥴링하는 방법, 시스템 및 장치
US20140137122A1 (en) Modified backfill scheduler and a method employing frequency control to reduce peak cluster power requirements
AU2007261607B2 (en) Resource-based scheduler
CN114661415A (zh) 调度方法及计算机系统
US11449502B1 (en) Calculating a throttle limit for requests in a database system
EP2595057B1 (en) Modified backfill scheduler and a method employing frequency control to reduce peak cluster power requirements
CN117290114B (zh) 一种基于cpu积分的负载均衡方法及系统
Rooney et al. Intelligent resource director
Al Hakeem et al. An adaptive scheduling policy for staged applications
Ellis Dynamic Voltage Scheduling (DVS)
Hui et al. A delay scheduling strategy for dynamic load balancing schedulers
JPH01177638A (ja) ジョブスケジューリング方式

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040120

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20040409

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20040414

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20040720

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040720

RD12 Notification of acceptance of power of sub attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7432

Effective date: 20040720

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20040720

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20040913

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20040913

RD14 Notification of resignation of power of sub attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7434

Effective date: 20040913

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20041004

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071015

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081015

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081015

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091015

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091015

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101015

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101015

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111015

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121015

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121015

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131015

Year of fee payment: 9

LAPS Cancellation because of no payment of annual fees