JPWO2007017932A1

JPWO2007017932A1 - スケジュール制御プログラム及びスケジュール制御方法

Info

Publication number: JPWO2007017932A1
Application number: JP2007529429A
Authority: JP
Inventors: 中村　和浩; 和浩中村
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 2005-08-09
Filing date: 2005-08-09
Publication date: 2009-02-19
Anticipated expiration: 2025-08-09
Also published as: WO2007017932A1; EP1914632B1; CN101238442A; JP4651671B2; EP1914632A1; US20080109817A1; US8479205B2; CN100573458C; EP1914632A4; KR100942740B1; KR20080023358A

Abstract

効率的にキャッシュを使用可能なようにスレッドをＣＰＵに割り当てる。スレッド（２０）の実行時に実行開始時刻及び実行するＣＰＵ（１０ａ）のＣＰＵ番号を記憶し、中断中のスレッド（２０）を次に実行させるＣＰＵ（１０ａ）〜（１０ｄ）へ割り当てる際に、実行開始時刻からの経過時間ｔを算出し、ＣＰＵ（１０ａ）〜（１０ｄ）で使用するキャッシュに対して次数が高いほど大きな時間パラメータ（Ｔ１）、（Ｔ２）、（Ｔ３）（Ｔ１＜Ｔ２＜Ｔ３）を設定し、経過時間ｔがｎ次（ｎは２以上の自然数）のキャッシュに設定された時間パラメータ未満であり、（ｎ−１）次のキャッシュに設定された時間パラメータ以上の場合には、前回実行したＣＰＵ（１０ａ）と共にｎ次のキャッシュを共有するＣＰＵ（１０ａ）〜（１０ｄ）の中で、負荷の最も少ないＣＰＵにスレッド（２０）を割り当てる。

Description

本発明はスケジュール制御プログラム及びスケジュール制御方法に関し、特に、複数のプロセッサ装置に、実行させるスレッドを割り当てる処理をコンピュータに機能させるスケジュール制御プログラム及び複数のプロセッサ装置に、実行させるスレッドを割り当てるスケジュール制御方法に関する。

複数のＣＰＵ（Central Processing Unit）を用いてプログラムを実行するマルチプロセッサシステム対応のＯＳ（Operating System）では、実行するプログラムを複数の実行単位（以下スレッドという。）に分割し、スレッドをＯＳのスケジューラにより各ＣＰＵに割り当てることによってプログラムを実行している。このように、１つのプログラムを複数のＣＰＵにより並列処理することで、プログラムの処理時間の節約と、ＣＰＵにかかる負荷の分散を実現している。

スケジューラは、ＣＰＵごとに、これから実行させるスレッドが繋がった待ち行列（以下ランキューと呼ぶ。）から最も優先度の高いスレッドを選び出し、そのスレッドを選び出したランキューに対応するＣＰＵで実行させる。また、実行開始時刻をスレッドごとに記録していた。

図７は、従来のスケジューラによるスレッドの割り当ての様子を模式的に示した図であり、（Ａ）はあるスレッドの実行時のキャッシュメモリのデータを示し、（Ｂ）は一定時間経過後にそのスレッドを再び割り当てる際のキャッシュメモリのデータの様子を示す図である。

ここでは、ＣＰＵ５００ａ、５００ｂ、５００ｃ、５００ｄのそれぞれに対し１次のキャッシュメモリ（以下１次キャッシュという。）５０１ａ、５０１ｂ、５０１ｃ、５０１ｄが接続されており、ＣＰＵ５００ａ、５００ｂとで２次のキャッシュメモリ（以下２次キャッシュという。）５０２ａを共有し、ＣＰＵ５００ｃ、５００ｄとで２次キャッシュ５０２ｂを共有しているコンピュータの一部の構成を示している。なお、斜線部はデータを示している。

図７（Ａ）において、ＣＰＵ５００ａはスレッド５１０を実行している。このとき、１次キャッシュ５０１ａ及び２次キャッシュ５０２ａでは、スレッド５１０で用いるデータが、例えば図示しないメインメモリから読み出されて記憶される。なお、スレッド５１１、５１２、５１３はランキューに接続されており、実行待ちの状態となっている。

ところで、シングルプロセッサシステムの場合と異なり、マルチプロセッサシステムでは、スレッドは常に同一のＣＰＵで実行されるのではなく、例えば一定時間で中断され、そのＣＰＵに別のスレッドを実行させることでマルチタスクを実現している。そして、例えば、中断したスレッド５１０を再開するときには、図７（Ｂ）のようにスケジューラはそのスレッド５１０を繋げるランキューを有するＣＰＵを以下のように選択していた。

（１）スレッド５１０が前回に実行権を得た時刻（実行開始時刻）から今回ランキューに繋げる時刻までの経過時間が、ある一定時間以内であれば、前回、スレッド５１０を実行したＣＰＵ５００ａを選択する。

（２）ある一定時間外であれば、全てのＣＰＵ５００ａ〜５００ｄの中から最も負荷が少ないＣＰＵを選択する。
これは、ある一定時間内であれば、前回スレッド５１０を実行したＣＰＵ５００ａが使用したキャッシュに、図７（Ｂ）に示すように、スレッド５１０が前回使用したデータがまだ残っていることが期待できるためである。この制御により、キャッシュヒット率を向上させ、性能向上を実現していた。なお、各ＣＰＵの負荷は、ランキューに繋がっているスレッド５１４、５１５、５１６の数やその優先度から決定する。

また、マルチプロセッサシステムにおけるキャッシュのミスヒットを少なくするための技術として、各スレッド（タスク）が各プロセッサのキャッシュ中に確保しているブロック数を計数して、この計数結果を複数のプロセッサで共有しているメモリに記憶しておき、スレッドの再開時、この計数結果を元に、キャッシュに、より多くのブロック数を有するプロセッサに、そのスレッドを実行させる手法が知られている（例えば、特許文献１参照。）。

また、２次キャッシュのミスヒットを少なくするための技術として、２次キャッシュを共有しているＣＰＵのグループが複数接続されたマルチプロセッサシステムにおいて、プロセスが、常に特定のＣＰＵのグループで実行されるようにした技術もあった（例えば、特許文献２参照。）。
特開平８−３０５６２号公報（段落番号〔００２０〕〜〔００３９〕，第１〜第５図）特開平１０−１４３３８２号公報

しかし、中断していたスレッドのＣＰＵへの割り当てを、前回の実行開始時刻からの一定の経過時間を基準として行う従来のスケジュール制御方法では、以下のような問題があった。

図７（Ｂ）のように、経過時間によっては１次キャッシュ５０１ａにはスレッド５１０の前回実行時に記憶したデータは残っていないが、２次キャッシュ５０２ａにそのデータが残っている場合がある。また、２次キャッシュ５０２ａにはデータが残っていないが、図示しない３次キャッシュにデータが残っている場合もある。すなわち次数の大きいキャッシュほど、経過時間が長くてもデータが残っている可能性が高い。しかし、従来のスケジュール制御では、このことを考慮せず、経過時間がある一定時間外の場合には、全てのＣＰＵの中から最も負荷の少ないＣＰＵを選ぶので、キャッシュに残っているデータを無駄にすることがあり、効率的なキャッシュの使用が行われていないという問題があった。

本発明はこのような点に鑑みてなされたものであり、効率的にキャッシュを使用可能なようにスレッドをＣＰＵに割り当てるスケジュール制御プログラムを提供することを目的とする。

また、本発明の他の目的は、効率的にキャッシュを使用可能なようにスレッドをＣＰＵに割り当てるスケジュール制御方法を提供することである。

本発明では上記問題を解決するために、複数のプロセッサ装置に、実行させるスレッドを割り当てる処理をコンピュータに機能させるスケジュール制御プログラムにおいて、図１に示すように、コンピュータを、スレッド２０の実行時に実行開始時刻及び実行するプロセッサ装置（図１では例えばＣＰＵ１０ａ）の識別情報（ＣＰＵ番号）を記憶するスレッド情報記憶手段１、中断中のスレッド２０を次に実行させるプロセッサ装置（ＣＰＵ１０ａ、１０ｂ、１０ｃ、１０ｄ）へ割り当てる際に、実行開始時刻からの経過時間ｔを算出する経過時間算出手段２、プロセッサ装置（ＣＰＵ１０ａ、１０ｂ、１０ｃ、１０ｄ）で使用するキャッシュメモリ（１次キャッシュ１１ａ、１１ｂ、１１ｃ、１１ｄ、２次キャッシュ１２ａ、１２ｂ、３次キャッシュ１３）に対して次数が高いほど大きな時間パラメータＴ１、Ｔ２、Ｔ３（Ｔ１＜Ｔ２＜Ｔ３）を設定し、経過時間ｔがｎ次（ｎは２以上の自然数）のキャッシュメモリに設定された時間パラメータ未満であり、（ｎ−１）次のキャッシュメモリに設定された時間パラメータ以上の場合には、前回実行したプロセッサ装置（ＣＰＵ１０ａ）及び前回実行したプロセッサ装置（ＣＰＵ１０ａ）と共にｎ次のキャッシュメモリを共有するプロセッサ装置の中で、負荷の最も少ないプロセッサ装置にスレッド２０を割り当てるスレッド割り当て手段３、として機能させることを特徴とするスケジュール制御プログラムが提供される。

上記の構成によれば、スレッド情報記憶手段１は、スレッド２０の実行時に実行開始時刻及び実行するプロセッサ装置（図１では例えばＣＰＵ１０ａ）の識別情報（ＣＰＵ番号）を記憶し、経過時間算出手段２は、中断中のスレッド２０を次に実行させるプロセッサ装置（ＣＰＵ１０ａ、１０ｂ、１０ｃ、１０ｄ）へ割り当てる際に、実行開始時刻からの経過時間ｔを算出し、スレッド割り当て手段３は、プロセッサ装置（ＣＰＵ１０ａ、１０ｂ、１０ｃ、１０ｄ）で使用するキャッシュメモリ（１次キャッシュ１１ａ、１１ｂ、１１ｃ、１１ｄ、２次キャッシュ１２ａ、１２ｂ、３次キャッシュ１３）に対して次数が高いほど大きな時間パラメータ（Ｔ１＜Ｔ２＜Ｔ３）を設定し、経過時間ｔがｎ次（ｎは２以上の自然数）のキャッシュメモリに設定された時間パラメータ未満であり、（ｎ−１）次のキャッシュメモリに設定された時間パラメータ以上の場合には、前回実行したプロセッサ装置（ＣＰＵ１０ａ）及び、前回実行したプロセッサ装置（ＣＰＵ１０ａ）と共にｎ次のキャッシュメモリを共有するプロセッサ装置の中で、負荷の最も少ないプロセッサ装置にスレッド２０を割り当てる。

本発明は、スレッドの実行時に実行開始時刻及び実行するプロセッサ装置の識別情報を記憶し、中断中のスレッドを次に実行させるプロセッサ装置へ割り当てる際に、実行開始時刻からの経過時間を算出し、プロセッサ装置で使用するキャッシュに対して次数が高いほど大きな時間パラメータを設定し、経過時間がｎ次（ｎは２以上の自然数）のキャッシュに設定された時間パラメータ未満であり、（ｎ−１）次のキャッシュに設定された時間パラメータ以上の場合には、前回実行したプロセッサ装置及び、前回実行したプロセッサ装置と共にｎ次のキャッシュを共有するプロセッサ装置の中で、負荷の最も少ないプロセッサ装置にスレッドを割り当てるので、経過時間に応じて、前回実行時に記憶したデータが残っている可能性が高いキャッシュを使用するプロセッサ装置が、中断中のスレッドの割り当て対象として選択される。これにより、キャッシュのヒット率が上がり、キャッシュを効率的に使用することができる。

また、キャッシュを共有するプロセッサ装置の中で最も少ない負荷のプロセッサ装置に割り当てる処理を行うので、中断中のスレッドの割り当てと同時に負荷分散処理が行えることになる。これにより、スレッド割り当て後に負荷分散処理を行うことに起因して、キャッシュに記憶されていたスレッドのデータが追い出されてキャッシュヒット率が下がることを防止できる。

本発明の上記および他の目的、特徴および利点は本発明の例として好ましい実施の形態を表す添付の図面と関連した以下の説明により明らかになるであろう。

複数のＣＰＵに実行させるスレッドを割り当てるためのスケジュール制御の概略を説明する図である。本実施の形態のスケジュール制御を実行するコンピュータの一例のハードウェア構成図である。ハードウェアの構成情報を示す図である。本実施の形態のスケジュール制御に係るＯＳの機能を模式的に示す図である。スレッド実行時の処理の流れを説明するフローチャートである。中断中のスレッドをいずれかのＣＰＵのランキューに繋げる処理の流れを説明する図である。従来のスケジューラによるスレッドの割り当ての様子を模式的に示した図であり、（Ａ）はあるスレッドの実行時のキャッシュメモリのデータを示し、（Ｂ）は一定時間経過後にそのスレッドを再び割り当てる際のキャッシュメモリのデータの様子を示す図である。

以下、本発明の実施の形態を図面を参照して詳細に説明する。
まず、本発明の実施の形態の概略を説明する。
図１は、複数のＣＰＵに実行させるスレッドを割り当てるためのスケジュール制御の概略を説明する図である。

なお、ここでは複数のＣＰＵ１０ａ、１０ｂ、１０ｃ、１０ｄのそれぞれに対し１次キャッシュ１１ａ、１１ｂ、１１ｃ、１１ｄが接続されており、ＣＰＵ１０ａ、１０ｂとで２次キャッシュ１２ａを共有し、ＣＰＵ１０ｃ、１０ｄとで２次キャッシュ１２ｂを共有しており、ＣＰＵ１０ａ〜１０ｄとで３次キャッシュ１３を共有しているコンピュータにおけるスケジュール制御を例にして説明する。また、各ＣＰＵ１０ａ〜１０ｄで実行されるスレッド２０、２１、２２、２３、２４、２５、２６を模式的に示している。

複数のＣＰＵ１０ａ〜１０ｄに実行させるスレッドを割り当てるスケジュール制御は、スレッド情報記憶手段１、経過時間算出手段２、スレッド割り当て手段３にて行われる。
以下、各処理手段の機能を説明する。

スレッド情報記憶手段１は、スレッド２０〜２６のそれぞれの実行時に実行開始時刻及び、実行するＣＰＵ１０ａ〜１０ｄの識別情報（以下ＣＰＵ番号）を記憶する。
経過時間算出手段２は、中断中のスレッド（例えばスレッド２０）を、次に実行させるＣＰＵ１０ａ〜１０ｄに割り当てる際に、スレッド情報記憶手段１に記憶した実行開始時刻からの経過時間ｔを算出する。

スレッド割り当て手段３は、ＣＰＵ１０ａ〜１０ｄへのスレッド２０〜２６の割り当てを行う。このとき、ＣＰＵ１０ａ〜１０ｄが使用するキャッシュメモリ（１次キャッシュ１１ａ、１１ｂ、１１ｃ、１１ｄ、２次キャッシュ１２ａ、１２ｂ、３次キャッシュ１３）に対して次数が高いほど大きな時間パラメータＴ１、Ｔ２、Ｔ３（Ｔ１＜Ｔ２＜Ｔ３）を設定する。この時間パラメータは、それぞれの次数のキャッシュに、中断中のスレッドが前回実行時に使用したデータが残っている可能性がある時間を目安に設定される。次数の高いキャッシュほど容量が大きいため、経過時間ｔが長くてもデータが残っている可能性が高い。そのため、次数が高いほど大きな時間パラメータが設定される。具体的には、時間パラメータは、キャッシュの容量や、ベンチマークなどによって決定する。そして、スレッド割り当て手段３は、中断中のスレッドの経過時間ｔがｎ次（ｎは２以上の自然数）のキャッシュに設定された時間パラメータ未満であり、（ｎ−１）次のキャッシュに設定された時間パラメータ以上の場合には、前回実行したＣＰＵ及び、前回実行したＣＰＵと共にｎ次のキャッシュを共有するＣＰＵの中で、負荷の最も少ないものに中断中のスレッドを割り当てることを特徴としている。

以下、中断中のスレッド２０を、再びＣＰＵ１０ａ〜１０ｄのいずれかに割り当てる場合を例にして、本実施の形態のスケジュール制御方法の概略を説明する。
中断中のスレッド２０を、ＣＰＵ１０ａ〜１０ｄのいずれかに割り当てる際、経過時間算出手段２は、スレッド情報記憶手段１で記憶された、スレッド２０の前回の実行時の実行開始時刻を参照して、現時刻までの経過時間ｔを算出する。スレッド割り当て手段３は、算出された経過時間ｔを基に、以下のようなスレッド２０の割り当てを行う。

まず、経過時間ｔがｔ＜Ｔ１の場合には、スレッド情報記憶手段１で記憶したＣＰＵ番号を参照して、スレッド２０を前回実行したＣＰＵ１０ａを選択して、再度スレッド２０を割り当てる（ＣＰＵ１０ａのランキューに繋げる）。

Ｔ１≦ｔ＜Ｔ２の場合には、前回実行したＣＰＵ１０ａ及び、ＣＰＵ１０ａと共に２次キャッシュ１２ａを共有するＣＰＵ１０ｂの中で、負荷の少ないほうにスレッド２０を割り当てる。図１の場合、ＣＰＵ１０ａのランキューには、３つのスレッド２１、２２、２３が存在する。一方、ＣＰＵ１０ｂのランキューには、２つのスレッド２４、２５がある。そのため、スレッド割り当て手段３は、負荷の少ないＣＰＵ１０ｂのランキューにスレッド２０を繋げる。

Ｔ２≦ｔ＜Ｔ３の場合には、前回実行したＣＰＵ１０ａ及び、ＣＰＵ１０ａと共に３次キャッシュ１３を共有するＣＰＵ１０ｂ、１０ｃ、１０ｄの中で、負荷の最も少ないものにスレッド２０を割り当てる。図１の場合、ＣＰＵ１０ｃにはスレッドは存在せず、ＣＰＵ１０ｄには１つのスレッド２６が存在するため、スレッド２０は、ＣＰＵ１０ｃに割り当てられる。

なお、ｔ≧Ｔ３の場合には、従来と同様に、全てのＣＰＵ１０ａ、１０ｂ、１０ｃ、１０ｄの中で最も負荷の少ないものに、スレッド２０が割り当てられる。図１の場合では、ＣＰＵ１０ｃが選択され、スレッド２０が割り当てられる。

このようにすることで、経過時間に応じて前回実行時に記憶したデータが残っている可能性が高いキャッシュを使用するＣＰＵ１０ａ〜１０ｄが、中断中のスレッド２０の割り当て対象として選択されるので、キャッシュのヒット率が上がり、キャッシュを効率的に使用することができる。

また、キャッシュを共有するＣＰＵ１０ａ〜１０ｄの中で最も少ない負荷のＣＰＵに割り当てる処理を行うので、スレッド２０の割り当てと同時に負荷分散処理が行えることになる。これにより、スレッド割り当て後に負荷分散処理を行うことに起因して、キャッシュに記憶されていたスレッドのデータが追い出されてキャッシュヒット率が下がることを防止できる。

次に、実施の形態の詳細を説明する。
図２は、本実施の形態のスケジュール制御を実行するコンピュータの一例のハードウェア構成図である。

ここで示すコンピュータ３０は、例えば、ＵＮＩＸ（登録商標）のサーバコンピュータである。
コンピュータ３０は、それぞれ１次キャッシュを内蔵している８つのＣＰＵ３１ａ、３１ｂ、３１ｃ、３１ｄ、３１ｅ、３１ｆ、３１ｇ、３１ｈと、２次キャッシュ３２ａ、３２ｂ、３２ｃ、３２ｄ、３次キャッシュ３３ａ、３３ｂ、３次キャッシュ３３ａ、３３ｂとシステムバス３４を介して接続されるメモリ３５、Ｉ／Ｏ３６などから構成されている。

また、２次キャッシュ３２ａはＣＰＵ３１ａ、３１ｂで共有され、２次キャッシュ３２ｂは、ＣＰＵ３１ｃ、３１ｄで共有され、２次キャッシュ３２ｃはＣＰＵ３１ｅ、３１ｆで共有され、２次キャッシュ３２ｄはＣＰＵ３１ｇ、３１ｈで共有されている。さらに、３次キャッシュ３３ａは、ＣＰＵ３１ａ、３１ｂ、３１ｃ、３１ｄで共有され、３次キャッシュ３３ｂは、ＣＰＵ３１ｅ、３１ｆ、３１ｇ、３１ｈで共有されている。

このような、ハードウェアの構成情報は以下のようなファームウェアで記述されている。
図３は、ハードウェアの構成情報を示す図である。

例えば、ＣＰＵ（ｃｐｕｎｏｄｅ）については、それぞれの識別情報“ｉｄ：〜”が記述され、さらに、そのＣＰＵが用いるキャッシュの識別情報がキャッシュの次数ごとに記述されている。例えば、図２のＣＰＵ３１ａは、識別情報が“ｉｄ＝０”で記述され、ＣＰＵ３１ａに内蔵された１次キャッシュは“ｌｅｖｅｌ１ｃａｃｈｅｉｄ：０”で、ＣＰＵ３１ａで用いる２次キャッシュ３２ａは“ｌｅｖｅｌ２ｃａｃｈｅｉｄ：０”で、３次キャッシュ３３ａは“ｌｅｖｅｌ３ｃａｃｈｅｉｄ：０”でそれぞれ記述されている。また、例えば、ＣＰＵ３１ｈは、識別情報が“ｉｄ＝７”で記述され、ＣＰＵ３１ｈに内蔵された１次キャッシュの識別情報は“ｌｅｖｅｌ１ｃａｃｈｅｉｄ：７”で、ＣＰＵ３１ｈで用いる２次キャッシュ３２ｄの識別情報は“ｌｅｖｅｌ２ｃａｃｈｅｉｄ：３”で、３次キャッシュ３３ｂの識別情報は“ｌｅｖｅｌ３ｃａｃｈｅｉｄ：１”でそれぞれ記述されている。また、ハードウェアの構成情報には、図示を省略したがメモリ３５や、Ｉ／Ｏ３６などの構成を示す記述も含まれる。このようなハードウェアの構成情報は、ＯＳに渡される。

図４は、本実施の形態のスケジュール制御に係るＯＳの機能を模式的に示す図である。
ファームウェアからのハードウェア構成情報により、図２のＣＰＵ３１ａ〜３１ｈの情報を示すＣＰＵ管理構造体４０−１、４０−２、４０−３、…、４０−８が生成される。スレッド４１はスレッド管理構造体で表され、そのスレッド４１の実行開始時刻“ｄｉｓｐ＿ｔｉｍｅ”と、そのスレッド４１を実行したＣＰＵ番号“ｃｐｕ”が記憶される。スレッド４１は、スケジューラ４２によって、ＣＰＵ３１ａ〜３１ｈのいずれかに割り当てられる。

ＯＳのスケジューラ４２は、スレッド管理構造体を参照して、経過時間に応じて中断中のスレッドを割り当てるＣＰＵを選択する。また、前述したようにキャッシュの次数に応じて時間パラメータＴ１、Ｔ２、Ｔ３を設定する。

このような機能を有するＯＳにより、図１で示した各手段が、図２で示すようなハードウェアのコンピュータ３０上で実現される。
以下、図２、図３、図４を用いて本実施の形態のスケジュール制御方法を説明する。

まず、スレッド実行時の処理を説明する。
図５は、スレッド実行時の処理の流れを説明するフローチャートである。
スレッド実行処理が開始すると、スケジューラ４２は、各ＣＰＵ３１ａ〜３１ｈのランキューを確認し、待機中のスレッド４１の存在を確認する。スレッド４１がある場合にはステップＳ２の処理に進み、スレッド４１がない場合には、スレッド４１がランキューに出現するまでステップＳ１の処理を繰り返す（ステップＳ１）。

スケジューラ４２は、スレッド４１がランキューに存在した場合には、ランキューからスレッド４１を抜き、実行状態とする。以下、図４で示すように、ＣＰＵ管理構造体４０−２で表されるＣＰＵ３１ｂのランキューに繋がったスレッド４１ａを例にして説明する。図４の矢印Ａで示しているように、ＣＰＵ管理構造体４０−２で示されるＣＰＵ３１ｂのランキューからスレッド４１ａが抜かれ、スレッド４１ａはＣＰＵ３１ｂによる実行権を得る（ステップＳ２）。

さらに、実行権を得たスレッド４１ａのスレッド管理構造体に、実行開始時刻“ｄｉｓｐ＿ｔｉｍｅ”となる現時刻と、実行するＣＰＵ３１ｂのＣＰＵ番号（例えば、ＣＰＵ３１ｂの識別情報である“ｉｄ＝１”）を記憶する（ステップＳ３）。

その後、ＣＰＵ３１ｂにより、実行権を得たスレッド４１ａが実行される（ステップＳ４）。
このようなスレッド４１ａは、処理が終われば消滅するが、Ｉ／Ｏ３６を介した外部機器からの応答待ちや、別スレッドが獲得中の排他資源待ちの場合や、スレッド４１ａの処理が一定時間を越えたときなど、処理を終える前に中断されることがある（図４の矢印Ｂ）。その場合、スケジューラ４２は、スレッド４１ａを一旦中断状態にし、ＣＰＵ３１ｂのランキューにある別のスレッドに実行権を与える。Ｉ／Ｏ３６を介した外部機器からの応答があったときや、別スレッドが獲得中だった排他資源が解放されたとき、その他スレッド４１ａの処理が一定時間を越えて一旦別スレッドに実行権を譲渡した後など、スレッド４１ａの実行を再開させる場合、スレッド４１ａを再びいずれかのＣＰＵ３１ａ〜３１ｈに割り当てる処理を行う。

図６は、中断中のスレッドをいずれかのＣＰＵのランキューに繋げる処理の流れを説明する図である。
なお、以下でも図４で示したスレッド４１ａを用いて説明する。

まず、スケジューラ４２は、中断中のスレッド４１ａのスレッド管理構造体に記録されている、実行開始時刻“ｄｉｓｐ＿ｔｉｍｅ”と現時刻との差より経過時間ｔを算出する（ステップＳ５）。

そして経過時間ｔが、ｔ＜Ｔ１の場合、前回と同じＣＰＵ３１ｂを選択する（ステップＳ６）。
Ｔ１≦ｔ＜Ｔ２の場合には、前回動作したＣＰＵ３１ｂと２次キャッシュ３２ａを共有するＣＰＵ３１ａ、３１ｂの中から最も負荷の少ないＣＰＵを選択する。図４の例では、ＣＰＵ管理構造体４０−１で表されるＣＰＵ３１ａのランキューに繋がっているスレッド４１の数が、ＣＰＵ管理構造体４０−２で表されるＣＰＵ３１ｂのランキューに繋がっているスレッド４１の数よりも多く、負荷が大きいのでＣＰＵ３１ｂが選択される（ステップＳ７）。

Ｔ２≦ｔ＜Ｔ３の場合には、前回動作したＣＰＵ３１ｂと３次キャッシュ３３ａを共有するＣＰＵ３１ａ、３１ｂ、３１ｃ、３１ｄの中から最も負荷の少ないＣＰＵを選択する。図４の例では、ＣＰＵ管理構造体４０−３で表されるＣＰＵ３１ｃが選択された場合を示している（ステップＳ８）。

ｔ≧Ｔ３の場合には、全ＣＰＵ３１ａ〜３１ｈの中から最も負荷の少ないＣＰＵを選択する。図４の例は、ＣＰＵ管理構造体４０−８で表されるＣＰＵ３１ｈが選択された場合を示している（ステップＳ９）。

そして最後に、スケジューラ４２は、選択されたＣＰＵのランキューにスレッド４１ａを繋げる（ステップＳ１０）。
以上のように、本実施の形態のスケジュール制御方法によれば、経過時間に応じて、前回実行時に記憶したデータが残っている可能性が高いキャッシュを使用するＣＰＵが、中断中のスレッドの割り当て対象として選択されるので、キャッシュのヒット率が上がり、キャッシュを効率的に使用することができる。

また、キャッシュを共有するＣＰＵの中で最も少ない負荷のＣＰＵに割り当てる処理を行うので、中断中のスレッドの割り当てと同時に負荷分散処理が行えることになる。これにより、スレッド割り当て後に負荷分散処理を行うことに起因して、キャッシュに記憶されていたスレッドのデータが追い出されてキャッシュヒット率が下がることを防止できる。

なお、前述したように、上記の処理内容は、コンピュータによって実現することができる。その場合、コンピュータが有すべき機能の処理内容を記述したプログラムが提供される。そのプログラムをコンピュータで実行することにより、上記処理機能がコンピュータ上で実現される。処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリなどがある。磁気記録装置には、ハードディスク装置（ＨＤＤ）、フレキシブルディスク（ＦＤ）、磁気テープなどがある。光ディスクには、ＤＶＤ（Digital Versatile Disc）、ＤＶＤ−ＲＡＭ、ＣＤ−ＲＯＭ、ＣＤ−Ｒ（Recordable）／ＲＷ（ReWritable）などがある。光磁気記録媒体には、ＭＯ（Magneto-Optical disk）などがある。

プログラムを流通させる場合には、たとえば、そのプログラムが記録されたＤＶＤ、ＣＤ−ＲＯＭなどの可搬型記録媒体が販売される。また、プログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することもできる。

プログラムを実行するコンピュータは、たとえば、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、自己の記憶装置に格納する。そして、コンピュータは、自己の記憶装置からプログラムを読み取り、プログラムに従った処理を実行する。なお、コンピュータは、可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することもできる。また、コンピュータは、サーバコンピュータからプログラムが転送される毎に、逐次、受け取ったプログラムに従った処理を実行することもできる。

以上、本発明を実施例に基づいて説明したが、本発明は上記に限定されるものではなく、特許請求の範囲に記載の範囲内で様々な変形が可能である。例えば、上記では３次キャッシュまでのコンピュータを例にして説明したが、３次以上のキャッシュがあるコンピュータについても同様に適用できる。

上記については単に本発明の原理を示すものである。さらに、多数の変形、変更が当業者にとって可能であり、本発明は上記に示し、説明した正確な構成および応用例に限定されるものではなく、対応するすべての変形例および均等物は、添付の請求項およびその均等物による本発明の範囲とみなされる。

符号の説明

１スレッド情報記憶手段
２経過時間算出手段
３スレッド割り当て手段
１０ａ、１０ｂ、１０ｃ、１０ｄＣＰＵ
１１ａ、１１ｂ、１１ｃ、１１ｄ１次キャッシュ
１２ａ、１２ｂ２次キャッシュ
１３３次キャッシュ
２０、２１、２２、２３、２４、２５、２６スレッド
Ｔ１、Ｔ２、Ｔ３時間パラメータ
ｔ経過時間

Claims

複数のプロセッサ装置に、実行させるスレッドを割り当てる処理をコンピュータに機能させるスケジュール制御プログラムにおいて、
コンピュータを、
スレッドの実行時に実行開始時刻及び実行するプロセッサ装置の識別情報を記憶するスレッド情報記憶手段、
中断中の前記スレッドを次に実行させるプロセッサ装置へ割り当てる際に、前記実行開始時刻からの経過時間を算出する経過時間算出手段、
前記プロセッサ装置で使用するキャッシュメモリに対して次数が高いほど大きな時間パラメータを設定し、前記経過時間がｎ次（ｎは２以上の自然数）のキャッシュメモリに設定された前記時間パラメータ未満であり、（ｎ−１）次のキャッシュメモリに設定された前記時間パラメータ以上の場合には、前回実行したプロセッサ装置及び、前記前回実行したプロセッサ装置と共に前記ｎ次のキャッシュメモリを共有するプロセッサ装置の中で、負荷の最も少ないプロセッサ装置に前記スレッドを割り当てるスレッド割り当て手段、
として機能させることを特徴とするスケジュール制御プログラム。
前記時間パラメータは、前記キャッシュメモリの容量に応じて設定されることを特徴とする請求の範囲第１項記載のスケジュール制御プログラム。
複数のプロセッサ装置に、実行させるスレッドを割り当てるスケジュール制御方法において、
スレッド情報記憶手段に、スレッドの実行時に実行開始時刻及び実行するプロセッサ装置の識別情報を記憶するステップと、
経過時間算出手段で、中断中の前記スレッドを次に実行させるプロセッサ装置へ割り当てる際に、前記実行開始時刻からの経過時間を算出するステップと、
スレッド割り当て手段により、前記プロセッサ装置で使用するキャッシュメモリに対して次数が高いほど大きな時間パラメータを設定し、前記経過時間がｎ次（ｎは２以上の自然数）のキャッシュメモリに設定された前記時間パラメータ未満であり、（ｎ−１）次のキャッシュメモリに設定された前記時間パラメータ以上の場合には、前回実行したプロセッサ装置及び、前記前回実行したプロセッサ装置と共に前記ｎ次のキャッシュメモリを共有するプロセッサ装置の中で、負荷の最も少ないプロセッサ装置に前記スレッドを割り当てるステップと、
を有することを特徴とするスケジュール制御方法。
前記時間パラメータは、前記キャッシュメモリの容量に応じて設定されることを特徴とする請求の範囲第３項記載のスケジュール制御方法。