WO2004044745A1

WO2004044745A1 - マルチスレッディングプロセッサにおけるスケジューリング方法およびマルチスレッディングプロセッサ

Info

Publication number: WO2004044745A1
Application number: PCT/JP2002/011818
Authority: WO
Inventors: Hideki Okawara
Original assignee: Fujitsu Limited
Priority date: 2002-11-13
Filing date: 2002-11-13
Publication date: 2004-05-27
Also published as: JP4086846B2; JPWO2004044745A1

Abstract

マルチスレッディングプロセッサにおけるスケジューリング方法に関し、マルチスレッディングプロセッサの動作状態に応じてコンテキストユニットに割り当てられたスレッドから実行するスレッドを動的に選択し、同時実行するスレッド数または組み合わせを動的に変化させる。また、コンテキストスイッチの際にマルチスレッディングプロセッサの動作状態に応じてコンテキストユニットに割り当てるスレッドを動的に選択する。動作状態を判断する一例としては、スレッドごとに所定の期間内のフェッチストール回数、キャッシュミス回数、メモリアクセスレーテンシまたはＩＰＣカウンタなどが設定された基準値を超えるかどうかで判断する。組み合わせの選択法の一例としては、スレッドを同時実行する際マルチスレッディングプロセッサ内の特定ユニットへの処理集中を避けるように、負荷の高いものと少ないものを明示的に選択する方法がある。

Description

明細書

マルチスレツディングプロセッサにおけるスケジユーリング方法およびマルチスレツディングプロセヅサ技術分野

本発明は、マルチスレツディングプロセッサにおけるスケジューリング方法およびマルチスレツディングプロセッサに関し、特に、実行するスレッドをマルチスレツディングプロセヅザの動作状態に応じて動的に選択するスケジューリング方法およびマルチスレツディングプロセッサに関する。背景技術

テキストエディ夕などで作成される命令手順書であるプログラムがプロセッサで実行される状態をプロセスと呼ぶ。プロセスにより行われる処理を複数に分割したものがスレツドである。各スレツドに対し、そのスレツドが使用するレジス夕、プログラムカウン夕などの情報が存在する。この情報をコンテキストと呼ぶ。近年複数のスレッド（またはプロセス）を 1つのプロセッサ上で同時に実行可能な S M T (Simultaneous Multi Threading) プロセヅサが注目されている。マルチスレツディングプロセッサには、スレツド毎のコンテキストを保存するための複数のコンテキストュニヅ卜が実装されている。マルチスレヅディングプロセッサは、コンテキストユニット毎にスレッドを割り当て、複数スレッドを同時実行する。

マルチスレツディングプロセヅサは、各スレッドに対応するプログラムカウン夕により指定されるアドレスから命令を読み込み（これをフェッチと呼ぶ）、複数スレツドを同時実行する。同時に実行可能なスレツド数は実装されたコンテキストユニット数に制限されるため、マルチスレツディングプロセッサは、コンテキストュニッ卜に割り当てられていない待機状態のスレツドから次に実行するスレッドを選択し、実行可能なスレッドを切り替える（これをコンテキストスィヅチと呼ぶ）。本明細書においては、実行スレッドの選択やコンテキストスイッチによるスレツドの切り替えをスケジユーリングと呼ぶ。しかしながら、従来のスケジューリングでは、マルチスレヅデイングプロセヅサは、実装されたコンテキストユニットをすベて使用し、コンテキストスィッチの際に選択された実行可能な全スレツドの命令を同時フェッチしていた。また、コンテキストスィツチの際に選択されるスレツドは、マルチスレツディングプロセッサの動作状態を反映したものではなかった。

従って、選択されたスレッドの組み合わせによっては、マルチスレヅデイングプロセッサ内の特定ュニットに処理が集中することで、効率的なスレツドの実行を妨げる資源競合による遅延が生じ、実装されたコンテキストユニットをすベて使用してスレツドを実行してもマルチスレツディングプロセッサの処理効率が向上しないでいた。

例えば、命令フェッチやメモリアクセス命令でアクセスされるデ一夕が高速な転送レートのキャッシュ上になく、キャッシュミスが発生した場合には、低速な転送レー卜のメインメモリにアクセスすることで遅延が生じるが、マルチスレツデイングプロセッサにおいても同様に複数スレヅドの命令が同時フェッチ、実行されることでキャッシュ競合が発生してキャッシュミスが増加し、メモリァクセスによる遅延によってマルチスレツディングプロセッサの処理効率が向上しないことがある。

マルチスレッディングプロセッサにおける処理効率の向上を図る一手法としては、文献 (Quinn A. Jacobson, "Mult ithreadi n g processor with thread predict or' , 米国特許番号 6, 247, 121 Jun. 12, 2001 ) がある。この特許は、マルチスレツディングプロセッサにおいて、分岐命令の実行を待たずに分岐予測に基づき投機的スレヅドを生成し、マルチスレツディングプロセッサ上で実行するものであるが、同一または別プロセスが複数存在する場合のスケジュ一リングについての提案はされていない。発明の開示

本発明の目的は、資源競合による遅延が生じないように、実行するスレッドを選択するスケジュ一リング方法およびマルチスレツディングプロセッサを提供することにある。

上記目的は、本発明第 1の発明によれば、マルチスレツディングプロセッサにおけるスケジューリング方法であって、実行可能な複数のスレツドを割り当て、実行するスレツド数を前記マルチスレツディングプロセッサの動作状態に応じて動的に決定し、前記割り当てられた複数スレッドから前記決定された数のスレツドを選択し、同一期間内に前記選択されたスレヅドの命令をフエヅチし実行することを特徴とするスケジューリング方法を提供することで達成される。

また、上記目的は、本発明第 2の発明によれば、マルチスレツディングプロセッサにおけるスケジユーリング方法であって、コンテキストスィツチするスレツド数を前記マルチスレツディングプロセッサの動作状態に応じて動的に決定し、実行可能な複数のスレッドから前記決定された数のスレッドを割り当て、同一期間内に前記割り当てられたスレツドの命令をフエツチし実行することを特徴とするスケジユーリング方法を提供することで達成される。

また、上記目的は、本発明第 8の発明によれば、本発明第 1の発明または第 2 の発明において、所定の条件で少なくとも 1つのスレッドを選択し、前記選択されたスレツドの命令をフヱツチして実行し、前記実行の際の資源競合度を記録し、前記所定の条件を変更し、所定の回数前記資源競合度の記録を繰り返す第 1の期間と、前記第 1の期間で記録された資源競合度が最も低くなる条件に基づきスレッドを選択し、前記選択されたスレツドの命令をフェッチし実行する第 2の期間を有することを特徴とするスケジユーリング方法を提供することで達成される。また、上記目的は、本発明第 9の発明によれば、実行可能な複数のスレッドを割り当て、同一期間内に前記複数スレッドの命令を同時フェッチし、実行するマルチスレツディングプロセッサにおけるスケジューリング方法であって、同一プロセスから複数のスレツドを優先的に選択し、前記選択されたスレツドの命令をフヱツチし実行することを特徴とするスケジューリング方法を提供することで達成される。

また、上記目的は、本発明第 1 0の発明によれば、それそれが 1つのスレッドに対応付けられる複数のコンテキストュニットと、スレツドを実行する際の資源競合度を測定する資源競合測定ュニッ卜と、前記測定された資源競合度に応じて前記コンテキストュニットに対応付けられたスレツドのうち少なくとも 1つのスレツドを選択するとともに選択されたスレヅドの命令をフェッチするフェッチュニットと、前記フヱツチされた命令をデコードするデコードユニットと、デコードされた命令を実行する命令実行ュニットを備えたマルチスレツディングプロセッサを提供することで達成される。

上記発明の実施の一形態によれば、各スレヅドのフェッチストール回数を基に、同時実行するスレツドの数や組み合わせを動的に選択し、選択されたスレツドが実行される。また、別の実施の形態によれば、同一プロセスからのスレッドを優先的に選択し、選択されたスレッドが実行される。さらに別の実施の形態によれば、所定の条件を変更しながら、マルチスレツディングプロセッサの資源競合度を測定する第 1の期間と、前記フェーズで測定された資源競合度が最も低くなる条件でスレツドが選択される第 2の期間を有し、選択されたスレツドが実行される。

このように、マルチスレヅディングプロセッサの動作状態に応じてコンテキストユニットに割り当てられたスレッドから実行するスレッドを動的に選択し、同時実行するスレツド数または組み合わせを動的に変化させることにより、資源競合による遅延を避け、マルチスレツディングプロセッサの処理効率を向上させることが可能になる。図面の簡単な説明

図 1は、本発明の実施の形態におけるマルチスレツディングプロセッサの構成例である。

図 2は、第 1の実施の形態を説明する図である。

図 3は、フヱツチスト一ル回数による動作状態判定を説明するフローチヤ一卜である。

図 4は、メモリアクセスレーテンシによる動作状態判定を説明するフローチヤ —トである。

図 5は、第 2の実施の形態を説明する図である。

図 6は、各スレツドと対応するフェッチストール回数の例である。図 7は、各スレヅドと対応するキャッシュミス回数の例である。

図 8は、各スレッドと対応する I P C値の例である。

図 9は、第 3の実施の形態を説明する図である。

図 1 0は、第 4の実施の形態を説明する図である。発明を実施するための最良の形態

以下、本発明の実施の形態について図面に従って説明する。しかしながら、本発明の技術的範囲はかかる実施の形態によって限定されるものではなく、特許請求の範囲に記載された発明とその均等物に及ぶものである。

図 1は、本発明の実施の形態におけるマルチスレツディングプロセッサの構成例である。マルチスレヅデイングプロセッサ 1は、各スレッドのコンテキストを保存するためのコンテキストュニヅトを同時実行するスレヅド数分有する。図 1 の例ではコンテキストュニット 1 0〜 1 3の 4つである。各コンテキストュニットは、演算結果を格納するためのレジス夕 1 4と、次に命令を読み出すべきアドレスを格納するプログラムカウン夕 1 5と、読み出された命令を格納する命令バヅファ 1 6とを有する。

マルチスレツディングプロセッサにおける命令実行の流れは次のようなものである。まず、フェッチュニット 1 7は、各スレツドのプログラムカウン夕 1 5により指定されるアドレスの命令をフェッチするため、キャッシュメモリ 2 2を検索する。キヤヅシュメモリ 2 2に指定されたアドレスが無ければ（これをキヤヅシュミスと呼ぶ）メインメモリ 2から、キャッシュメモリ 2 2に指定されたアドレスがあればキャッシュメモリ 2 2から、指定されたアドレスの命令を対応するコンテキストュニヅ卜の命令バッファ 1 6に格納する。デコードュニヅト 1 9は、命令バッファ 1 6に格納された命令をデコードし、命令実行ュニット 2 0がデコ —ドされた命令を実行する。

また、マルチスレツディングプロセッサ 1は、その動作状態を判断するために以下のカウン夕を備えている。フェッチの際に何らかの原因で命令取得に失敗し (例えば、キャッシュミスの発生など）デコード処理が行えない場合がある（これをフェッチストールと呼ぶ）。フェッチユニット 1 7は、スレッドごとにフエツチストール回数を記録するフェッチストールカウン夕 18を備える。

命令実行ュニット 20は、 1サイクルあたりに実行した命令数をスレッド毎に記録する IPC (Inst ruct ionPerCycle) カウン夕 21を備える。 1サイクルとは、マルチスレツディングプロセッサの内部周波数の逆数で (示される単位時間で）ある。キヤヅシュメモリ 22は、キヤヅシュミス回数をスレツド毎に記録するキャッシュミスカウン夕 23と、キャッシュミスの際にメィンメモリにアクセスし命令やデータが読み出されるまでの時間を記録するメモリアクセスレーテンシカウン夕 24を有する。

図 2は、第 1の実施の形態を説明する図である。第 1の実施の形態は、同時実行するスレツドのフェッチストール回数からマルチスレツディングプロセッサの動作状態を判断し、同時実行するスレツド数をマルチスレツディングプロセッサの動作状態に応じて動的に変更することで、資源競合による遅延を避ける例である。あらかじめフェッチストール基準値が設定されるものとする。

図 2には、コンテキストュニヅトとそのコンテキストュニットに割り当てられたスレッド I D、そのスレッドのプロセス I Dおよびスレッドの実行状態が描かれている。図 2 aは、プロセス ID 0から 4スレッド（スレッド ID0〜3) がコンテキストュニット 10〜13に割り当てられ、 4スレツドとも実行されている状態である。

図 3のフェッチストール回数による動作状態の判定を行った結果、所定期間のフェッチストール回数がフェッチストール基準値より大きければ、図 2 aで 4スレツドが同時実行されていた状態から、図 2bの 2スレツドの同時実行状態に遷移する。新たな動作状態の判定によって、フェッチストール回数がフェッチスト —ル基準値より大きければ、図 2bの 2スレツド実行状態から図 2 cの 1スレツド実行状態になり、フェッチストール回数がフェッチストール基準値以下であれば、図 2 bの 2スレツド実行状態から図 2aの 4スレッド同時実行状態に遷移する。このように、図 2 aと図 2 b、図 2 bと図 2 cの間で状態遷移が起こる。図 3は、フヱツチストール回数による動作状態判定を説明するフローチャートである。まず所定期間が経過したか判定する（S31)。所定期間が経過していなければ、所定期間が経過するまでステップ 31を繰り返す。所定期間が経過していれば、その期間内のフェッチストール回数が設定されたフエヅチストール基準値より大きいかを判定する（S 3 2 ) 。ステップ S 3 2の判定は、例えば、コンテキストュニットに割り当てられたスレツドの所定期間内のフェッチストール回数の合計をフェッチストール基準値と比較すればよい。

ステップ S 3 2で、フェッチストール回数がフェッチストール基準値より大きい場合、同時実行するスレッド数を減らす（S 3 3 ) 。これは、多数のスレッドを実行することによる資源競合が発生し、処理効率を下げていると考えられるためであり、スレツド数を減少させることで資源競合を回避する。

逆に、ステップ S 3 2で、フェッチストール回数がフェッチストール基準値以下であれば、同時実行するスレッドを増やす（S 3 4 ) 。これは、使用されていないコンテキストュニットが存在し、さらに現在実行しているスレツドで資源競合が発生していないことから、処理効率を向上させる余地が残されていると考えられるからである。ステップ S 3 3、 S 3 4が終了すると、再び所定の期間が経過まで待ちステップ S 3 1からの処理を繰り返す。

第 1の実施の形態によれば、フェッチストール回数により、マルチスレツディングプロセッサの動作状態を判定し、それに合わせて同時実行するスレツド数を変更することで資源競合による遅延をさけ、処理性能を向上させることが可能となる。なお、第 1の実施の形態は、フェッチストール回数による動作状態判定を行ったが、メモリアクセスレーテンシによる動作状態判定を行うことも可能である。メモリアクセスレーテンシにより判定を行うために、レーテンシ基準値が設定されているものとする。

図 4は、メモリアクセスレーテンシによる動作状態判定を説明するフローチヤ —トである。まず所定期間が経過したか判定する（S 4 1 ) 。所定期間が経過していなければ、所定期間が経過するまでステップ S 4 1を繰り返す。所定期間が経過していれば、その期間内のメモリアクセスレ一テンシが設定されたレ一テンシ基準値より大きいかを判定する（S 4 2 ) 。

ステップ S 4 2で、メモリアクセスレーテンシがレーテンシ基準値より大きい場合、同時実行するスレッド数を減らす（S 4 3 ) 。これは、多数のスレッドを実行することによる資源競合が発生し、処理効率を下げていると考えられるためであり、スレッド数を減少させることで資源競合を回避する。

逆に、ステップ S 4 2で、メモリアクセスレーテンシが基準値以下であれば、同時実行するスレッドを増やす（S 4 4 ) 。これは、使用されていないコンテキストュニヅ卜が存在し、さらに現在実行しているスレツドで資源競合が発生していないことから、処理効率を向上させる余地が残されていると考えられるからである。ステップ S 4 3、 S 4 4が終了すると、再び所定の期間が経過まで待ちステヅプ S 4 1からの処理を繰り返す。

同様に、キャッシュミスカウン夕を使用し、マルチスレツディングプロセッサの動作状態を判定することも可能である。さらに、 I P Cカウンタを使用し、マルチスレツディングプロセッサの動作状態を判定することも可能である。この場合は、測定された I P C値が I P C用に設定された基準値より大きい場合スレッド数を増加させ、少ない場合スレッド数を減少させるように選択する点が、図 3 や図 4と異なる。

図 5は、第 2の実施の形態を説明する図である。第 2の実施の形態は、コンテキストスィツチの際にフェッチストール回数の多いスレツドと少ないスレツドを組み合わせて、同時実行するスレツドを動的に選択することで資源競合による遅延を避ける例である。なお、コンテキストスィッチ以外のタイミングにおいて、第 1の実施の形態が適用されるものとする。

図 5の縦軸は時間経過を表し、横軸は実行対象のスレツドを表す。実線はそのスレッドがコンテキストユニットに割り当てられていることを示し、色付きの部分はそのスレツドが実行されていることを示す。

図 5のコンテキストスィツチ 5 1は、実行対象のスレツドとしてスレツド 0〜 1 1まで 1 2スレツド存在し、スレッド 0〜3の 4スレツドが 4つのコンテキストユニットに割り当てられている状態を表す。コンテキストスィッチ 5 1では、最初スレッド 0〜 3がすべて実行状態にある。図 5では、第 1の実施の形態が適用され、コンテキストスイッチ 5 1から 5 2までの間に同時実行されるスレツド数が動的に変化している。

コンテキス卜スィッチ 5 2の夕イミングにおいて、フェッチストール回数の上位 2つのスレツドと下位 2つのスレツドが選択された結果（図 6を参照）、スレヅド 4、 5、 7、 8が 4つのコンテキストユニットに割り当てられる。さらに第 1の実施の形態が適用された結果、コンテキストスィツチ 5 2においてまずスレッド 4が実行され、その後第 1の実施の形態が適用されスレッド数が動的に変化している。

図 6は、コンテキストスイッチ 5 2における各スレッドと対応するフェッチストール回数の例である。第 2の実施の形態においては、スレツドごとのフェッチストール回数が累積されて記録されており、上位 2つのスレツドとしてスレツド 5と 8、下位 2つのスレツドとしてスレツド 4と 7が選択される。

同様に、コンテキストスィッチ 5 3のタイミングにおいて、フェッチストール回数の上位 2つのスレッドと下位 2つのスレッドが選択された結果、スレッド 2、 3、 7、 1 0がコンテキストユニットに割り当てられる。さらに第 1の実施の形態が適用された結果、コンテキストスィッチ 5 3において最初スレッド 2、 3、 7、 1 0の 4スレッドが実行され、その後も第 1の実施の形態が適用されスレツド数が動的に変化している。

第 2の実施の形態によれば、マルチスレツディングプロセッサの動作状態を反映したフェッチストール回数のうち、上位 2つと下位 2つのスレツドを選択することにより、資源競合による遅延を避け、マルチスレツディングプロセッサの処理効率を向上させることができる。好ましくは、第 1の実施の形態と合わせて実施し、動的に同時実行するスレツドを選択することにより更なる性能向上を図ることが可能である。

なお、スレッドの選択法としては、上位 1つと下位 3つや、上位 3つと下位 1 つとすることも可能である。また、実装されたコンテキストユニットが 4つ以外の場合の上位と下位の数の組み合わせは何通りもあるが、明示的に上位のスレヅドと下位のスレッドを組み合わせて選択することにより第 2の実施の形態が適用可能である。

また、第 2の実施の形態は、フェッチストール回数によりスレッドを選択したが、キャッシュミス回数による選択を行うことも可能である。図 7は、各スレツドと対応するキャッシュミス回数の例である。図 7の例において、例えばキヤッシュミス回数の上位 2つと下位 2つを選択すればスレッド 1、 2、 5、 1 1が選択される。

同様に、 I P C値によるスレッド選択を行うことも可能である。図 8は、各スレツドと対応する I P C値の例である。図 8の例において、例えば I P C値の上位 2つと下位 2つを選択すれば、スレッド 2、 3、 8、 1 0が選択される。

図 9は、第 3の実施の形態を説明する図である。第 3の実施の形態は、フェツチの際またはコンテキストスィッチにおいて、同一プロセスのスレツドを実行スレッドとして優先的に選択することによって、資源競合による遅延を避ける例である。同一プロセスのスレッドは同一のメモリ空間を共有し動作するため、別メモリ空間で動作する異なるプロセスのスレツドを選択するよりキャッシュミスの増加（キャッシュ競合）が少なく、キャッシュメモリより低速なメインメモリにアクセスすることによる遅延が避けられる。

図 9 aは、プロセス 0からの 4スレッド（スレッド 0〜3 ) が優先的にコンテキストュニッ卜に割り当てられ、 4スレツドとも実行される状態を示している。図 9 bは、コンテキストに割り当てられたプロセス 0のスレッド 0と 3、プロセス 4のスレツド 4と 5のうちプロセス 4からの 2スレツド（スレッド 4と 5 ) が実行される状態を示している。

第 3の実施の形態によれば、別メモリ空間で動作する異なるプロセスのスレツドを選択するのではなく、同一のメモリ空間を共有し動作する同一プロセスのスレッドを優先的に選択するため、複数スレッド間で悪影響を及ぼすことなく、資源競合による遅延を避け、マルチスレツディングプロセッサの処理効率を向上させることが可能である。好ましくは、第 1または第 2の実施の形態と組み合わせて実施し、より処理効率のよいスレツドを選択することが望ましい。

図 1 0は、第 4の実施の形態を説明する図である。第 4の実施の形態は、条件を変えて動作状態を測定するサンプリングフェーズとサンプリングフェーズで測定された動作状態で最も処理効率のよい条件で実行スレツドを選択する実行フエ —ズに分けてスレツドを実行することで、資源競合による遅延を避ける例である。まずサンプリングフェーズ 1 0 2では、例えば、図 2 aの 4スレッド（スレツド 0〜3 ) を実行する。次に図 2 bの 2スレツドとしてスレツド 0、 1とスレヅド 2、 3の 2通りを実行する。そして、図 2 cの 1スレヅドとしてスレツド 0、スレッド 1、スレッド 2、スレヅド 3の 4通りを実行する。なお、サンプリングフェ一ズにて実行されるスレヅドの組み合わせは、上記以外にも存在し、例えば、 2スレヅド実行時にスレツド 0、 2の組を追加することも可能である。

この様にして各スレヅドの統計情報を収集し、最適なスレツド数を決定する。最適なスレッドを選択するための統計情報としては、例えば、スレッドあたりのフェッチスト一ル回数を使用することができる。実行フェーズ 1 0 3では、サンプリングフエ一ズ 1 0 2で決定された最適な組み合わせのスレツドを実行する。第 4の実施の形態によれば、様々な組み合わせの動作状態を実際に測定してから最適な組み合わせを決定するため、資源競合による遅延を避け、マルチスレツデイングプロセッザの処理効率を向上させることが可能である。

なお、第 4の実施の形態において動作状態の判定にフヱツチストール回数を用いたが、 I P C値、キャッシュミス回数、メモリアクセスレーテンシなどを使用することも可能である。さらに、最適な組み合わせの決定方法としては、あるスレッドに注目し、そのスレッドの処理効率が最も高くなる条件で選択する方法を適用することも可能である。

また、本発明の実施の形態において実施される方法を各ュニットが機能として実現することも可能である。一例を挙げれば、図 3の判定をフェッチユニット 1 7で実施することが可能である。産業上の利用の可能性

以上説明したように本発明によれば、マルチスレツディングプロセッサの動作状態を計測することによって同時実行するスレツド数ゃ組み合わせを動的に選択し、資源競合による遅延を避けるスケジューリングを行うことで、マルチスレツディングプロセッサの処理効率を向上させることができる。

Claims

請求の範囲

1 . マルチスレツディングプロセッサにおけるスケジュ一リング方法であって、実行可能な複数のスレッドを割り当て、

実行するスレッド数を前記マルチスレッディングプロセッサの動作状態に応じて動的に決定し、

前記割り当てられた複数スレッドから前記決定された数のスレッドを選択し、

同一期間内に前記選択されたスレッドの命令をフエツチし実行することを特徴とするスケジューリング方法。

2 . マルチスレツデイングプロセッサにおけるスケジュ一リング方法であって、コンテキストスィツチするスレツド数を前記マルチスレツディングプロセッザの動作状態に応じて動的に決定し、

実行可能な複数のスレツドから前記決定された数のスレツドを割り当て、同一期間内に前記割り当てられたスレツドの命令をフェッチし実行することを特徴とするスケジューリング方法。

3 . 請求項 1または請求項 2において、

さらにフヱツチストール基準値を設定し、

所定の期間内のフエヅチストール回数を記録し、

前記フェッチストール回数が前記フェッチストール基準値を超える場合スレツド数を減少させ、

前記フ Xツチストール回数が前記フェッチストール基準値を超えない場合スレツド数を増加させるようにスレツド数を決定することを特徴とするスケジユーリング方法。

4 . 請求項 1または請求項 2において、

さらにレーテンシ基準値を設定し、

所定の期間内のメモリアクセスレーテンシを言己録し、

前記メモリアクセスレーテンシが前記レーテンシ基準値を超える場合スレッド数を減少させ、前記メモリアクセスレーテンシが前記レーテンシ基準値を超えない場合スレツド数を増加させるようにスレツド数を決定することを特徴とするスケジユーリング方法。

請求項 1または請求項 2において、

さらに所定の期間内のフェッチストール回数を記録し、

前記フェッチストール回数が多いスレツドと少ないスレツドを組み合わせて選択することを特徴とするスケジユーリング方法。

請求項 1または請求項 2において、

さらに所定の期間内のキヤッシュミス回数を記録し、

前記キャッシュミス回数の多いスレッドと少ないスレヅドを組み合わせて選択することを特徴とするスケジユーリング方法。

請求項 1または請求項 2において、

さらに所定の期間内の 1サイクルあたりに実行した命令数を記録し、前記 1サイクルあたり実行できる命令数の多いスレッドと少ないスレッドを組み合わせて選択することを特徴とするスケジユーリング方法。

請求項 1または請求項 2において、

所定の条件で少なくとも 1つのスレッドを選択し、

前記選択されたスレッドの命令をフヱツチして実行し、

前記実行の際の資源競合度を記録し、

前記所定の条件を変更し、

所定の回数前記資源競合度の記録を繰り返す第 1の期間と、

前記第 1の期間で記録された資源競合度が最も低くなる条件に基づきスレツドを選択し、

前記選択されたスレッドの命令をフェッチし実行する第 2の期間を有することを特徴とするスケジューリング方法。

実行可能な複数のスレッドを割り当て、同一期間内に前記複数スレッドの命令を同時フェッチし、実行するマルチスレヅディングプロセヅサにおけるスケジユーリング方法であって、

同一プロセスから複数のスレツドを優先的に選択し、前記選択されたスレッドの命令をフェヅチし実行することを特徴とするスケジユーリング方法。

. それそれが 1つのスレツドに対応付けられる複数のコンテキストュニッ卜と、

スレツドを実行する際の資源競合度を測定する資源競合測定ユニットと、前記測定された資源競合度に応じて前記コンテキストユニットに対応付けられたスレツドのうち少なくとも 1つのスレツドを選択するとともに選択されたスレツドの命令をフェッチするフェッチュニヅトと、

前記フェツチされた命令をデコ一ドするデコードュニットと、

デコードされた命令を実行する命令実行ュニットを備えたマルチスレツディングプロセッサ。

. それそれが 1つのスレッドに対応付けられる複数のコンテキストュニ

V卜と、

スレツドを実行する際の資源競合度を測定する資源競合測定ユニットと、前記コンテキストュニッ卜に対応付けられるスレツドを前記測定された資源競合度に応じて少なくとも 1つ選択するとともに選択されたスレツドの命令をフェッチするフェッチュニッ卜と、

前記フェッチされた命令をデコードするデコードュニッ卜と、

前記デコ一ドされた命令を実行する命令実行ュニットを備えたマルチスレツディングプロセッサ。

. 請求項 1 0または請求項 1 1において、

前記マルチスレツディングプロセッサは、さらに所定の期間内のフェツチストール回数を記録するフェッチストールカウン夕を有し、フェッチストール基準値が設定され、

前記フヱツチストール回数が前記フヱツチストール基準値を超えない場合スレツド数を増加させるようにスレツドが選択されることを特徴とするマルチスレツディングプロセッサ。

1 3 . 請求項 1 0または請求項 1 1において、

前記マルチスレツディングプロセッサは、さらに所定の期間内のメモリアクセスレーテンシを言己録するメモリアクセスレ一テンシカウンタを有し、レ一テンシ基準値が設定され、

前記メモリアクセスレーテンシが前記レーテンシ基準値を超える場合スレツド数を減少させ、

前記メモリアクセスレーテンシが前記レーテンシ基準値を超えない場合スレツド数を増加させるようにスレツドが選択されることを特徴とするマルチスレツディングプロセッサ。

1 4 . 請求項 1 0または請求項 1 1において、

前記マルチスレツディングプロセッサは、さらに所定の期間内のフェツチストール回数を記録するフェッチストールカウン夕を有し、

前記フェッチストール回数の多いスレツドと少ないスレツドを組み合わせて選択することを特徴とするマルチスレツデイングプロセヅサ。

1 5 . 請求項 1 0または請求項 1 1において、

前記マルチスレツディングプロセッサは、所定の期間内のキヤヅシユミス回数を記録するキャッシュミスカウン夕を有し、

前記キヤッシュミス回数の多いスレッドと少ないスレッドを組み合わせて選択することを特徴とするマルチスレツディングプロセッサ。

1 6 . 請求項 1 0または請求項 1 1において、

前記マルチスレツディングプロセッサは、さらに所定の期間内の 1サイクルあたり実行できる命令数を記録する I P Cカウン夕を有し、

前記 1サイクルあたり実行できる命令数の多いスレッドと少ないスレッドを組み合わせて選択することを特徴とするマルチスレツディングプロセッサ。

1 7 . 請求項 1 0または請求項 1 1において、

前記マルチスレツディングプロセヅサは、所定の条件で少なくとも 1つのスレツドを選択し、

前記選択されたスレッドの命令をフェッチして実行し、前記実行の際の資源競合度を記録し、

前記所定の条件を変更し、

前記第 1の期間で記録された資源競合度が最も低くなる条件に基づきスレッドを選択し、

前記選択されたスレッドの命令をフヱツチし、

前記フヱツチされた命令をデコ一ドし、

前記デコードされた命令を実行する第 2の期間を有することを特徴とするマルチスレツディングプロセッサ。

それそれが 1つのスレッドに対応付けられる複数のコンテキストュニッ卜と、

同一プロセスから少なくとも 1つのスレツドを優先的に選択するとともに選択されたスレツドの命令をフェッチするフヱツチュニッ卜と、前記フェツチされた命令をデコードするデコードュニットと、前記デコ一ドされた命令を実行する命令実行ュニットを備えたマルチスレツディングプロセッサ。