JP2014149868A - マルチスレッドプロセッサ - Google Patents

マルチスレッドプロセッサ Download PDF

Info

Publication number
JP2014149868A
JP2014149868A JP2014090595A JP2014090595A JP2014149868A JP 2014149868 A JP2014149868 A JP 2014149868A JP 2014090595 A JP2014090595 A JP 2014090595A JP 2014090595 A JP2014090595 A JP 2014090595A JP 2014149868 A JP2014149868 A JP 2014149868A
Authority
JP
Japan
Prior art keywords
thread
instruction
hardware
processor
slot
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2014090595A
Other languages
English (en)
Other versions
JP5770333B2 (ja
Inventor
Koji Adachi
浩次 安達
Kazunori Miyamoto
和納 宮本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Renesas Electronics Corp
Original Assignee
Renesas Electronics Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Renesas Electronics Corp filed Critical Renesas Electronics Corp
Priority to JP2014090595A priority Critical patent/JP5770333B2/ja
Publication of JP2014149868A publication Critical patent/JP2014149868A/ja
Application granted granted Critical
Publication of JP5770333B2 publication Critical patent/JP5770333B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Advance Control (AREA)

Abstract

【課題】マルチスレッドプロセッサにおいて、ハードウェアスレッドの最低実行時間を保証しながら、柔軟なハードウェアスレッドの選択を出来るようにする。
【解決手段】複数のハードウェアスレッドと、ハードウェアスレッドを選択するスレッド選択信号TSELを出力するスレッドスケジューラ19と、スレッド選択信号TSELに応じて選択したハードウェアスレッドにより生成された命令を出力する第1のセレクタと、命令を実行する演算回路とを有するマルチスレッドプロセッサにおいて、スレッドスケジューラ19は、第1の実行期間において固定的にハードウェアスレッドを選択し、第2の実行期間において任意のハードウェアスレッドを選択し、第1の実行期間と第2の実行期間の比率、及び第1の実行期間に実行されるハードウェアスレッドの比率は、演算回路で実行される管理プログラムにより任意に設定される。
【選択図】図2

Description

本発明にかかるマルチスレッドプロセッサに関し、特に複数のハードウェアスレッドの実行順序をスケジュールするスレッドスケジューラを有するマルチスレッドプロセッサに関する。
近年、プロセッサの処理能力を向上させるためにマルチスレッドプロセッサが提案されている。マルチスレッドプロセッサは、それぞれが独立した命令流を生成するスレッドを有する。そして、マルチスレッドプロセッサは、パイプライン処理により命令を処理する演算回路に対していずれのスレッドにより生成された命令流を処理させるかを切り替えながら演算処理を実行する。このとき、マルチスレッドプロセッサは、1つのスレッドにより生成された命令をパイプライン中の1つの実行ステージで実行しながら、他の実行ステージにおいて他のスレッドにより生成された命令を処理することができる。つまり、マルチスレッドプロセッサの演算回路では、互いに独立関係にある命令がそれぞれ異なる実行ステージで実行されることになる。これにより、マルチスレッドプロセッサは、それぞれの命令流を円滑に処理しながら、パイプラインの実行ステージが何も処理しない時間を削減し、プロセッサの処理能力を向上させる。
このようなマルチスレッドプロセッサの一例が特許文献1に開示されている。特許文献1に記載のマルチスレッドプロセッサでは、複数のプロセッサエレメントと、各プロセッサエレメントのスレッドを切り替える並列プロセッサ制御部とを備える。そして、並列プロセッサ制御部は、プロセッサエレメントにおいて実行されているスレッドの実行時間をカウントし、カウントした時間がスレッドの割り当て時間に達したときにタイムアウト信号を出力し、タイムアウト信号と実行順序レジスタに保持された実行順序情報とに基づきプロセッサエレメントが実行すべきスレッドを切り替える。
このようにマルチスレッドプロセッサでは、演算回路においていずれのスレッドが生成する命令流を処理させるかをスケジュールに従って切り替える。このレッドのスケジュール方法の一例が特許文献2において開示されている。特許文献2に記載のマルチスレッドプロセッサでは、複数のスレッドを巡回的に、そのスレッドに割り当てられた時間ずつ実行する。つまり、特許文献2では、固定的に定められたスケジュールを巡回的に実行することで所定の実行時間比で各スレッドが実行される。
また、スレッドの別のスケジュール方法が特許文献3に開示されている。特許文献3では、スレッドのスケジューリングの方法としてラウンドロビン方式とプライオリティ方式とが記載されている。ラウンドロビン方式では、待ち行列に入っているスレッドを一定時間毎に順番に選んで実行する。そのため、ラウンドロビン方式では、待ち行列にあるスレッドが一定時間ごとに公平にCPUに割り当てられて実行される。また、プライオリティ方式は、スレッドの優先度の順にスレッドを実行する。より具体的には、プライオリティ方式では、優先度毎に設けられた待ち行列に各優先度のスレッドがキューイングされ、優先度の高い待ち行列から順にスレッドが選択されCPUに割り当てられて実行される。
特開2007−317171号公報 特開2008−52750号公報 特開2006−155480号公報
しかしながら、ラウンドロビン方式及びプライオリティ方式に共通する問題として、スレッドの最低実行時間を保証しながら、柔軟にスレッドの実行時間を設定できない問題がある。例えば、ラウンドロビン方式では、スレッド数が増加した場合、各スレッドの実行時間が均等に減少し、優先度の高いスレッドに十分な実行時間が割り当てられない問題がある。また、プライオリティ方式では、優先度の高いスレッドの処理が続いた場合、優先度の低いスレッドが処理できない問題がある。
本発明にかかるマルチスレッドプロセッサの一態様は、それぞれが独立した命令流を生成する複数のハードウェアスレッドと、スケジュールに従って、前記複数のハードウェアスレッドのうち次実行サイクルにおいて使用するハードウェアスレッドを選択するスレッド選択信号を出力するスレッドスケジューラと、前記スレッド選択信号に応じて前記複数のハードウェアスレッドのいずれか1つを選択して、選択したハードウェアスレッドにより生成された命令を出力する第1のセレクタと、前記第1のセレクタから出力される命令を実行する演算回路と、を有し、前記スレッドスケジューラは、第1の実行期間において前記複数のハードウェアスレッドのうちから固定的に選択された少なくとも1つの前記ハードウェアスレッドを選択し、第2の実行期間において任意の前記ハードウェアスレッドを選択し、前記第1の実行期間と前記第2の実行期間の比率、及び前記第1の実行期間に実行されるハードウェアスレッドの比率は、前記演算回路で実行される管理プログラムにより任意に設定されるものである。
本発明にかかるマルチスレッドプロセッサによれば、第1の実行期間において実行されるハードウェアスレッドは、他のハードウェアスレッドの優先度にかかわらず実行される。また、第2の実行期間には、任意のハードウェアスレッドを実行することができる。これにより、本発明にかかるマルチスレッドプロセッサによれば、第1の実行期間に最低実行時間を保証したいハードウェアスレッドを定義し、第2の実行期間にはそのときの処理状況に応じた任意のハードウェアスレッドを定義することができる。
本発明にかかるマルチスレッドプロセッサによれば、ハードウェアスレッドの最低実行時間を保証しながら、柔軟にハードウェアスレッドの実行時間を設定できる。
実施の形態1にかかるマルチスレッドプロセッサのブロック図である。 実施の形態1にかかるスレッドスケジューラのブロック図である。 実施の形態1にかかるスロットの構成を示す模式図である。 実施の形態1にかかるマルチスレッドプロセッサの起動時の動作手順を示すフローチャートである。 実施の形態1にかかるスレッドスケジューラの動作を示す表である。 実施の形態1にかかるマルチスレッドプロセッサの動作を示すタイミングチャートである。
実施の形態1
以下、図面を参照して本発明の実施の形態について説明する。図1に本実施の形態にかかるマルチスレッドプロセッサ1を含むプロセッサシステムのブロック図を示す。本実施の形態にかかるプロセッサシステムでは、システムバスを介してマルチスレッドプロセッサ1とメモリ2が接続される。なお、図示はしていないが、システムバスには、入出力インタフェースなどの他の回路も接続されるものとする。
まず、本実施の形態にかかるマルチスレッドプロセッサ1について説明する。マルチスレッドプロセッサ1は、複数のハードウェアスレッドを備える。ハードウェアスレッドは、スレッドプログラムカウンタ、命令メモリ、汎用レジスタ、及び制御レジスタ(本実施の形態ではパイプライン制御回路16に内蔵されるものとする)等の回路群により構成される。そして、ハードウェアスレッドとは、マルチスレッドプロセッサ1に内蔵されるスレッドプログラムカウンタにより出力される命令フェッチアドレスに従って命令メモリから読み出される一連の命令群により構成される命令流を生成する系のことをいう。つまり、1つのハードウェアスレッドにより生成される命令流に含まれる命令は、互いに関連性の高い命令である。本実施の形態では、マルチスレッドプロセッサ1が複数のスレッドプログラムカウンタを備えることでその数に応じた数のハードウェアスレッドが実装される。以下では、マルチスレッドプロセッサ1についてさらに詳細に説明する。
図1に示すようにマルチスレッドプロセッサ1は、演算回路10、割り込みコントローラ11、PC生成回路12、スレッドプログラムカウンタTPC0〜TPC3、セレクタ13、18、命令メモリ14、命令バッファ15、パイプライン制御回路16、命令フェッチコントローラ17、スレッドスケジューラ19を有する。
演算回路10は、セレクタ18によって選択されたハードウェアスレッドが生成する命令に基づき演算処理を実行する。より具体的には、演算回路10は、命令デコーダ21、実行ユニット22、データレジスタ23を有する。命令デコーダ21は受信した命令をデコードして、実行ユニット22に対して演算制御信号SCを出力する。また、命令デコーダ21は、命令のデコード結果に基づきデータの格納位置を示すデータレジスタアドレスRaddの出力を行う。実行ユニット22は、演算制御信号SCに応じて各種の演算を実行する。なお、実行ユニット22は、複数の実行ステージを有し、パイプライン処理により演算を行う。また、実行ユニット22において実行された演算結果は、その演算結果の種類に応じてPC生成回路12、メモリ2、データレジスタ23に送信される。データレジスタ23は、実行ユニット22において用いられるデータが格納される。そして、データレジスタ23は、データレジスタアドレスRaddにより指定したアドレスのデータを出力する。図1に示す例では、データレジスタ23は、データレジスタアドレスRaddに応じてデータaとデータbとを出力する形態となる。また、データレジスタ23は、データレジスタアドレスRaddにより指定されるアドレスに実行ユニット22が出力する演算結果を格納する。
割り込みコントローラ11は、割り込み要求信号を受けて、マルチスレッドプロセッサ1内に割り込み処理の実行を指示する割り込み指示信号を出力する。より具体的には、割り込みコントローラ11は、割り込み要求信号を受信すると、割り込み要因や割り込み処理の優先度等を判定し、当該割り込み要因に関連した処理を行うようにPC生成回路12及びパイプライン制御回路16に割り込み処理の実行を指示する。この割り込み要求は、マルチスレッドプロセッサ1が出力するものの他に、マルチスレッドプロセッサ1以外の回路からも出力される。
PC生成回路12は、システムバスを介して入力される新たなプログラム命令信号、割り込みコントローラ11が出力する割り込み指示信号及び実行ユニット22における処理に基づき出力される分岐指示信号を受けて、プログラムカウント更新値を生成する。そして、PC生成回路12は、プログラムカウント更新値をスレッドプログラムカウンタTPC0〜TPC3のいずれかに与える。なお、PC生成回路12は、生成したプログラムカウント更新値をいずれのスレッドプログラムカウンタに与えるかを判断する機能も有する。
スレッドプログラムカウンタTPC0〜TPC3は、処理すべき命令が格納される命令メモリ14のアドレス(このアドレスを命令フェッチアドレスIMaddと称す)を生成する。また、スレッドプログラムカウンタTPC0〜TPC3は、PC生成回路12からプログラムカウント更新値が与えられた場合は、命令フェッチアドレスIMaddをプログラムカウント更新値に応じて更新する。一方、スレッドプログラムカウンタTPC0〜TPC3は、プログラムカウント更新値の入力がない場合は、アドレスを昇順に計算し、連続する次の命令フェッチアドレスを算出する。なお、図1においては、スレッドプログラムカウンタの数を4つとしたが、プログラムスレッドカウンタの数は、マルチスレッドプロセッサの仕様に応じて任意に設定することができる。
セレクタ13は、命令フェッチコントローラが出力するスレッド指定信号に応じてスレッドプログラムカウンタTPC0〜TPC3のうちいずれか1つを選択し、選択したスレッドプログラムカウンタが出力する命令フェッチアドレスIMaddを出力する。なお、図1のセレクタ13において入力端子に0〜4の数字を付したが、この数字は、ハードウェアスレッドの番号を示すものである。
命令メモリ14は、複数のハードウェアスレッドにより共通して用いられるメモリ領域である。命令メモリ14は、マルチスレッドプロセッサ1において実行される演算で用いられる各種命令が格納される。そして、命令メモリ14は、セレクタ13を介して入力される命令フェッチアドレスIMaddにより指定された命令を出力する。このとき、命令メモリ14は、セレクタ13がスレッドプログラムカウンタTPC0〜TPC3のいずれが出力した命令フェッチアドレスIMaddであるかを判別し、判別結果に応じて命令の出力先を振り分ける。本実施の形態では、命令バッファ15は、スレッドプログラムカウンタTPC0〜TPC3に対応した命令バッファ領域BUF0〜BUF3を有する。そこで、命令メモリ14は、命令フェッチアドレスIMaddの出力元に応じて命令バッファ領域BUF0〜BUF3のいずれかに読み出された命令を振り分ける。なお、命令メモリ14は、メモリ2に含まれる所定のメモリ領域であっても良い。また、命令バッファ領域BUF0〜BUF3は、FIFO(First In First Out)形式のバッファ回路である。また、命令バッファ領域BUF0〜BUF3は、1つのバッファ内において領域分割されたものでも良く、分離された領域に形成されたものであっても良い。
パイプライン制御回路16は、命令バッファ15の先頭に格納された命令と実行ユニット22において実行されている命令とをモニタする。そして、パイプライン制御回路16は、割り込みコントローラ11から割り込み指示信号が入力された場合には、割り込み処理に関係するハードウェアスレッドに属する命令を廃棄する指示を命令バッファ15及び実行ユニット22に対して行う。
命令フェッチコントローラ17は、命令バッファ15に格納されている命令の個数に応じていずれのハードウェアスレッドに属する命令をフェッチすべきかを判断し、その判断結果に基づきスレッド指定信号を出力する。例えば、命令フェッチコントローラ17は、命令バッファ領域BUF0に格納される命令キューの数が他の命令バッファ領域に格納される命令キューの数よりも少なければ、0番のハードウェアスレッドに属する命令をフェッチすべきと判断し、0番のハードウェアスレッドを示すスレッド指定信号を出力する。これにより、セレクタ13は、スレッドプログラムカウンタTPC0を選択する。なお、命令フェッチコントローラ17は、ラウンドロビン方式による手順で選択するハードウェアスレッドを決定しても良い。
セレクタ18は、第1のセレクタとして機能するセレクタである。セレクタ18は、スレッドスケジューラ19が出力するスレッド選択信号TSELに応じて命令バッファ領域BUF0〜BUF3のいずれか1つを選択し、選択した命令バッファ領域から読み出した命令を演算回路10に出力する。つまり、セレクタ18は、スレッド選択信号TSELに応じて複数のハードウェアスレッドから1つのハードウェアスレッドを選択し、選択したハードウェアスレッドが出力する命令を演算回路10に出力する。なお、セレクタ18においても、入力端子に0〜4の数字を付したが、この数字は、ハードウェアスレッドの番号を示すものである。
スレッドスケジューラ19は、予め設定されたスケジュールに従って、複数のハードウェアスレッドのうち次の実行サイクルにおいて実行される1つのハードウェアスレッドを指定するスレッド選択信号TSELを出力する。つまり、スレッドスケジューラ19は、複数のハードウェアスレッドのどのような順序で処理するかをスケジュールにより管理し、そのスケジュールに沿った順序でハードウェアスレッドにより生成される命令が実行されるようにスレッド選択信号TSELを出力する。なお、本実施の形態にかかるマルチスレッドプロセッサ1では、このスケジュールをマルチスレッドプロセッサ1の起動の直後に実行される管理プログラムにより設定する。
本実施の形態にかかるマルチスレッドプロセッサ1では、特にスレッドスケジューラ19において行われるハードウェアスレッドのスケジューリング方法に特徴を有する。以下では、スレッドスケジューラ19及びそのスケジューリングの方法について説明を行う。
図2にスレッドスケジューラ19のブロック図を示す。図2に示すように、スレッドスケジューラ19は、第2のセレクタ(例えば、セレクタ30)、第1のスケジューラ31、第2のスケジューラ32を有する。セレクタ30は、実時間ビット信号の信号レベルに応じて第1のスケジューラ31が出力するスレッド番号Aと第2のスケジューラ32が出力するスレッド番号Bとのいずれか一方を選択して、選択したスレッド番号をスレッド選択信号TSELとして出力する。このスレッド選択信号TSELにおいて示されるスレッド番号が次の実行サイクルにおいて実行されるハードウェアスレッドの番号となる。
第1のスケジューラ31は、第1の実行期間と第2の実行期間とを切り替える選択信号(例えば、実時間ビット信号)を出力すると共に、実時間ビット信号が第1の実行期間を指定している期間において予め設定された実行順序で実行されるハードウェアスレッドを指定する第1のハードウェアスレッド番号(例えばスレッド番号A)を出力する。ここで、第1の実行期間とは、後述する実時間ビット信号が1である期間であり、第2の実行期間とは、後述する実時間ビット信号が0である期間をいう。また、第1の実行期間においては、選択されるハードウェアスレッド番号が予め設定されており、第2の実行期間においては、選択されるハードウェアスレッド番号が例えば、第2のスケジューラ32により任意に設定される。この第1のスケジューラ31は、スレッド制御レジスタ33、カウンタ34、カウント最大値格納部35、一致比較回路36、第3のセレクタ(例えば、セレクタ37)を有する。
スレッド制御レジスタ33は、複数のスロット(例えば、スロットSLT0〜SLT7)を備える。このスロットの構成を図3に示す。図3に示すように、スロットSLT0〜SLT7は、それぞれハードウェアスレッド番号が格納される番号格納部と、当該スロットが選択された場合における実時間ビット信号の論理レベルを決定する期間属性設定フラグが格納される実時間ビット格納部とを有する。
カウンタ34は、所定の間隔でカウント値CNTを更新する。より具体的には、本実施の形態におけるカウンタ34は、図示しないマルチスレッドプロセッサ1の動作クロックに同期してカウント値CNTをカウントアップする。カウント最大値格納部35は、カウンタ34のカウント値CNTの上限値を定めるカウント最大値CNTMを格納する。一致比較回路36は、カウント値CNTとカウント最大値CNTMとを比較し、カウント値CNTとカウント最大値CNTMが一致した場合に、カウンタ34のカウント値をリセットするリセット信号RSTを出力する。つまり、カウンタ34は、所定の周期でカウント値CNTを初期化しながら、カウントアップ動作を繰り返すことで、循環的に値が更新されるカウント値CNTを出力する。
セレクタ37は、カウント値CNTに応じてスレッド制御レジスタ33内のスロットの1つを選択し、選択したスロットに格納される値に基づき実時間ビット信号とスレッド番号Aを出力する。より具体的には、セレクタ37は、カウント値CNTが0であればスロットSLT0を選択し、スロットSLT0の番号格納部に格納されたハードウェアスレッド番号をスレッド番号Aとし、スロットSLT0の実時間ビット格納部に格納される期間属性設定フラグの値を実時間ビット信号の論理レベルとする。
なお、第1のスケジューラ31のスレッド制御レジスタ33のスロットに格納される値、カウンタ34のカウント値CNTの初期値、カウント最大値格納部35のカウント最大値CNTMは、マルチスレッドプロセッサ1の起動時に実行される管理プログラムにより設定される。また、管理プログラムは、メモリ2からこれら設定値を読み込むものとする。
第2のスケジューラ32は、例えば、ラウンドロビン方式やプライオリティ方式の手順に従って任意のハードウェアスレッドを選択する。この第2のスケジューラ32が出力するハードウェアスレッド番号をスレッド番号Bと称する。
続いて、スレッドスケジューラ19を用いたマルチスレッドプロセッサ1の動作について説明する。図4に、マルチスレッドプロセッサ1の電源投入時から通常処理の開始までの動作の手順を示すフローチャートを示す。図4に示すように、マルチスレッドプロセッサ1は、電源が投入されるとまずハードウェアリセットにより回路の状態を初期化する(ステップS1)。続いて、マルチスレッドプロセッサ1は、シングルスレッドモードにおいて動作を開始する(ステップS2)。このシングルスレッドモードでは、例えば、スレッドプログラムカウンタTPC0、命令メモリ14、命令バッファ領域BUF0が活性化され、他のスレッドプログラムカウンタTPC1〜TPC3及び命令バッファ領域BUF1〜BUF3はスタンバイ状態のまま待機する。
そして、マルチスレッドプロセッサ1は、管理プログラムをメモリ2又は図示しない他の記憶装置から読み出し、管理プログラムを実行する(ステップS3)。その後、管理プログラムに従って、マルチスレッドプロセッサ1は、スレッド制御レジスタ33内のスロットへの値の設定(ステップS4)、カウンタ34のカウント値CNTの初期化(ステップS5)、カウント最大値CNTMの設定(ステップS6)を行う。これらの各種レジスタの設定が完了すると、マルチスレッドプロセッサ1はマルチスレッドモードにて動作を開始する(ステップS7)。このシングルスレッドモードでは、例えば、スレッドプログラムカウンタTPC0〜TCP3、命令メモリ14、命令バッファ領域BUF0〜BUF3が活性化される。そして、マルチスレッドプロセッサ1は、マルチスレッドモードにて通常動作を開始する。
次に、通常動作開始後のマルチスレッドプロセッサ1の動作について説明する。以下の説明では、特に、スレッドスケジューラ19の動作について説明する。なお、以下の説明では、設定の一例として、カウンタ34のカウント値CNTの初期値を0、カウント最大値CNTMを4とする。また、スレッド制御レジスタ33のスロットの各値は、スロットSLT0〜SLT2、SLT4、SLT5、SLT7の実時間ビットを1とし、スロットSLT3、SLT6の実時間ビットを0とする。さらに、スロットSLT0、SLT2、SLT5、SLT7のハードウェアスレッド番号を0、スロットSLT1、SLT4のハードウェアスレッド番号を1、スロットSLT3のハードウェアスレッド番号を2とする。
上記条件においてスレッドスケジューラ19が出力するスレッド選択信号TSELが選択するハードウェアスレッド番号を図5の表に示す。図5の表では、スレッドスケジューラ19が選択するハードウェアスレッドを切り替える一タイミングを一時刻とし、時刻の経過と共にスレッド選択信号TSELがどのように切り替わるかを示した。
図5に示すように、まず時刻t1におけるカウント値CNTが0とすると、セレクタ37は、スロットSLT0を選択する。従って、セレクタ37は、実時間ビット信号の論理レベルを1とし、スレッド番号Aを0番とする。これにより、セレクタ30は、スレッド選択信号TSELとしてスレッド番号Aの0番を出力する。
続いて、時刻t2ではカウント値CNTが1にカウントアップされる。そのため、セレクタ37は、スロットSLT1を選択する。従って、セレクタ37は、実時間ビット信号の論理レベルを1とし、スレッド番号Aを1番とする。これにより、セレクタ30は、スレッド選択信号TSELとしてスレッド番号Aの1番を出力する。
次いで、時刻t3ではカウント値CNTが2にカウントアップされる。そのため、セレクタ37は、スロットSLT2を選択する。従って、セレクタ37は、実時間ビット信号の論理レベルを0とし、スレッド番号Aを1番とする。これにより、セレクタ30は、スレッド選択信号TSELとしてスレッド番号Bとして出力されるハードウェアスレッド番号の番号(例えばn番)を出力する。
次いで、時刻t4ではカウント値CNTが3にカウントアップされる。そのため、セレクタ37は、スロットSLT3を選択する。従って、セレクタ37は、実時間ビット信号の論理レベルを1とし、スレッド番号Aを2番とする。これにより、セレクタ30は、スレッド選択信号TSELとしてスレッド番号Aの2番を出力する。
次いで、時刻t5ではカウント値CNTが4にカウントアップされる。そのため、セレクタ37は、スロットSLT4を選択する。従って、セレクタ37は、実時間ビット信号の論理レベルを1とし、スレッド番号Aを1番とする。これにより、セレクタ30は、スレッド選択信号TSELとしてスレッド番号Aの1番を出力する。
そして、時刻t5では、カウント値CNTがカウント最大値CNTMに達するため、時刻t6の経過後にカウント値CNTはリセットされる。これにより、時刻t6〜t10の期間のスレッドスケジューラ19は、時刻t1〜t5の動作を繰り返すことになる。マルチスレッドプロセッサ1では。カウント値CNTがリセットされる周期をスレッド選択処理の一周期とする。
続いて、上記スレッドスケジューラ19が出力するスレッド選択信号TSELに基づくマルチスレッドプロセッサ1の動作のタイミングチャートを図6に示す。この図6において選択されるハードウェアスレッド及び時刻は、図5において説明したスレッド選択信号TSEL及び時刻に基づくものである。
図6に示すように、マルチスレッドプロセッサ1は、時刻t1においては、スレッド選択信号TSELが0番のハードウェアスレッドを選択するため、0番のハードウェアスレッドに属する命令0を実行する。次いで、時刻t2においては、スレッド選択信号TSELが1番のハードウェアスレッドを選択するため、1番のハードウェアスレッドに属する命令0を実行する。次いで、時刻t3においては、スレッド選択信号TSELが第2のスケジューラ32が選択した任意のハードウェアスレッド(例えばn番)を選択するため、n番のハードウェアスレッドに属する命令0を実行する。次いで、時刻t4においては、スレッド選択信号TSELが2番のハードウェアスレッドを選択するため、2番のハードウェアスレッドに属する命令0を実行する。次いで、時刻t5においては、スレッド選択信号TSELが1番のハードウェアスレッドを選択するため、1番のハードウェアスレッドに属する命令1を実行する。そして、マルチスレッドプロセッサ1は、時刻t5が経過する時点でスレッド選択の周期を1つ終了させ、次のスレッド選択処理の周期を開始する。
次のスレッド選択処理の周期(時刻t6〜t10)では、時刻t1〜t5の周期と同様の順序でハードウェアスレッドを選択するが、選択されたハードウェアスレッドにおいて処理される命令は、前の周期の続きの命令群となる。
例えば、時刻t6においては、スレッド選択信号TSELが0番のハードウェアスレッドを選択するため、0番のハードウェアスレッドに属する命令1を実行する。次いで、時刻t7においては、スレッド選択信号TSELが1番のハードウェアスレッドを選択するため、1番のハードウェアスレッドに属する命令2を実行する。次いで、時刻t8においては、スレッド選択信号TSELが第2のスケジューラ32が選択した任意のハードウェアスレッド(例えばn番)を選択するため、n番のハードウェアスレッドに属する命令1を実行する。次いで、時刻t9においては、スレッド選択信号TSELが2番のハードウェアスレッドを選択するため、2番のハードウェアスレッドに属する命令1を実行する。次いで、時刻t10においては、スレッド選択信号TSELが1番のハードウェアスレッドを選択するため、1番のハードウェアスレッドに属する命令3を実行する。
このように、スレッドスケジューラ19が循環的に選択するハードウェアスレッドを切り替えた場合、1つのスレッド選択処理周期において処理されるハードウェアスレッドの実行時間は所定の比率となる。図6に示す例では、第1の実行期間において0番のハードウェアスレッドは1回、1番のハードウェアスレッドは2回、2番のハードウェアスレッドは1回実行される。また、第2の実行期間において任意(n番)のハードウェアスレッドが1回実行されることになる。つまり、第1の実行期間と第2の実行期間とのプロセッサ占有時間の比率は80:20である。また、0番のハードウェアスレッドは少なくとも20%のプロセッサ占有時間を確保し、1番のハードウェアスレッドは少なくとも40%のプロセッサ占有時間を確保し、2番のハードウェアスレッドは少なくとも20%のプロセッサ占有時間を確保する。また、第2の実行期間として割り当てられた20%のプロセッサ占有時間の間は、マルチスレッドプロセッサ1におけるスレッドの処理状況に応じた任意のハードウェアスレッドを実行される。
上記説明より、本実施の形態にかかるマルチスレッドプロセッサ1では、スレッドスケジューラ19が実時間ビット信号の論理レベルが1となる第1の実行期間において予め設定された順序により予め設定されたハードウェアスレッドを選択し、実時間ビット信号の論理レベルが0となる第2の実行期間は、任意のハードウェアスレッドを選択する。これにより、マルチスレッドプロセッサ1は、第1の実行期間において選択されるハードウェアスレッドのプロセッサ占有時間の最低時間を保証する。また、第2の実行期間において任意のハードウェアスレッドを選択することで、マルチスレッドプロセッサ1は、その処理状況に応じて任意のハードウェアスレッドのプロセッサ占有時間を増加させることができる。
また、本実施の形態におけるマルチスレッドプロセッサ1では、第1の実行期間と第2の実行期間との比率、及び、第1の実行期間の間に実行されるハードウェアスレッドの比率を管理プログラムにより任意に設定することができる。つまり、管理プログラムにより設定されるスレッド制御レジスタ33内のスロットへの値及びカウント最大値CNTMの値を、マルチスレッドプロセッサ1に対する処理要求に応じて変更することで柔軟なハードウェアスレッドの選択方法を選ぶことが可能になる。より具体的には、スレッド制御レジスタ33内のスロットの実時間ビットの値及びハードウェアスレッド番号の値を変更することで第1の実行時間中に実行されるべきハードウェアスレッドを選択することができ、さらに、第1の実行時間と第2の実行時間との比率を変更することができる。また、カウント最大値CNTMにどのような値を設定するかにより、一スレッド選択処理周期の長さを変更することができる。
なお、本発明は上記実施の形態に限られたものではなく、趣旨を逸脱しない範囲で適宜変更することが可能である。例えば、第2のスケジューラにおけるスレッドのスケジューリング方法は、マルチスレッドプロセッサの仕様に応じて適宜変更することが可能である。
1 マルチスレッドプロセッサ
2 メモリ
10 演算回路
11 割り込みコントローラ
12 PC生成回路
13、18、30、37 セレクタ
14 命令メモリ
15 命令バッファ
16 パイプライン制御回路
17 命令フェッチコントローラ
19 スレッドスケジューラ
21 命令デコーダ
22 実行ユニット
23 データレジスタ
31 第1のスケジューラ
32 第2のスケジューラ
33 スレッド制御レジスタ
34 カウンタ
35 カウント最大値格納部
36 一致比較回路
a、b データ
BUF0〜BUF0 命令バッファ領域
IMadd 命令フェッチアドレス
Radd データレジスタアドレス
SC 演算制御信号
TSEL スレッド選択信号
CNT カウント値
CNTM カウント最大値
RST リセット信号
SLT0〜SLT7 スロット
TPC0〜TCP3 スレッドプログラムカウンタ

Claims (6)

  1. それぞれが独立した命令流を生成する複数のハードウェアスレッドと、
    前記複数のハードウェアスレッドのうち次実行サイクルにおいて使用するハードウェアスレッドを選択するスレッド選択信号を出力するスレッドスケジューラと、
    前記スレッド選択信号に応じて前記複数のハードウェアスレッドのいずれか1つを選択して、選択したハードウェアスレッドにより生成された命令を出力するセレクタと、
    前記セレクタから出力される命令を実行する演算回路と、
    を有し、
    前記スレッドスケジューラは、
    各スロットが第1の情報を保持し、この第1の情報を書き換え可能とする複数のスロットを含むスレッド制御レジスタと、
    前記複数のスロットのうち1つを指定する第2の情報を格納し、この第2の情報を書き換え可能とする格納部と、を有し、
    前記スレッド制御レジスタの前記複数のスロットの第1のスロットからスロットを順々に選択し、
    前記第2の情報により指定されたスロットを選択したときには、前記第1のスロットに戻ってスロットを再び順次選択し、
    順次選択されたスロットが保持する前記第1の情報に基づき、ハードウェアスレッドを前記セレクタに選択させるマルチスレッドプロセッサ。
  2. 前記第1の情報、及び前記第2の情報は、前記演算回路で実行される管理プログラムにより前記スロット及び前記格納部に設定される請求項1に記載のマルチスレッドプロセッサ。
  3. 前記スレッドスケジューラは、前記スロットの番号を示すカウント値を所定の周期でカウントアップし、前記カウント値が前記第2の情報で示される値に達したことに応じて前記カウント値がリセットされるカウンタを有する請求項1又は2に記載のマルチスレッドプロセッサ。
  4. 前記第1の情報が、ハードウェアスレッド番号を含む請求項1乃至3のいずれか1項に記載のマルチスレッドプロセッサ。
  5. 前記管理プログラムは、前記マルチスレッドプロセッサの起動後に実行される請求項2に記載のマルチスレッドプロセッサ。
  6. 命令メモリと、
    命令バッファと、
    命令フェッチコントローラと、をさらに有し、
    前記命令バッファには、
    前記命令フェッチコントローラにより指定された前記ハードウェアスレッドが生成する命令が前記命令メモリよりフェッチされ、
    当該フェッチされた命令が格納され、
    前記命令フェッチコントローラは、
    前記命令バッファに格納された命令の個数に応じていずれの前記ハードウェアスレッドが生成する命令をフェッチすべきかを判断し、
    当該判断結果に基づき前記命令バッファに格納する命令を生成する前記ハードウェアスレッドを決定する請求項1乃至5のいずれか1項に記載のマルチスレッドプロセッサ。
JP2014090595A 2014-04-24 2014-04-24 マルチスレッドプロセッサ Active JP5770333B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014090595A JP5770333B2 (ja) 2014-04-24 2014-04-24 マルチスレッドプロセッサ

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014090595A JP5770333B2 (ja) 2014-04-24 2014-04-24 マルチスレッドプロセッサ

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2012284004A Division JP5536863B2 (ja) 2012-12-27 2012-12-27 マルチスレッドプロセッサ

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2015126242A Division JP5946566B2 (ja) 2015-06-24 2015-06-24 マルチスレッドプロセッサにおけるハードウェアスレッドのスケジュール方法

Publications (2)

Publication Number Publication Date
JP2014149868A true JP2014149868A (ja) 2014-08-21
JP5770333B2 JP5770333B2 (ja) 2015-08-26

Family

ID=51572718

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014090595A Active JP5770333B2 (ja) 2014-04-24 2014-04-24 マルチスレッドプロセッサ

Country Status (1)

Country Link
JP (1) JP5770333B2 (ja)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007317171A (ja) * 2006-04-27 2007-12-06 Matsushita Electric Ind Co Ltd マルチスレッド計算機システム、マルチスレッド実行制御方法
JP2008123045A (ja) * 2006-11-08 2008-05-29 Matsushita Electric Ind Co Ltd プロセッサ

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007317171A (ja) * 2006-04-27 2007-12-06 Matsushita Electric Ind Co Ltd マルチスレッド計算機システム、マルチスレッド実行制御方法
JP2008123045A (ja) * 2006-11-08 2008-05-29 Matsushita Electric Ind Co Ltd プロセッサ

Also Published As

Publication number Publication date
JP5770333B2 (ja) 2015-08-26

Similar Documents

Publication Publication Date Title
JP5173711B2 (ja) マルチスレッドプロセッサ及びそのハードウェアスレッドのスケジュール方法
JP5173712B2 (ja) マルチスレッドプロセッサ
JP5173713B2 (ja) マルチスレッドプロセッサ及びそのハードウェアスレッドのスケジュール方法
US10467053B2 (en) Multi-thread processor with rescheduling when threads are nondispatchable
JP5173714B2 (ja) マルチスレッドプロセッサ及びその割り込み処理方法
JP5946566B2 (ja) マルチスレッドプロセッサにおけるハードウェアスレッドのスケジュール方法
JP5770333B2 (ja) マルチスレッドプロセッサ
JP5536863B2 (ja) マルチスレッドプロセッサ
JP5536862B2 (ja) マルチスレッドプロセッサ
JP5838237B2 (ja) マルチスレッドプロセッサ
JP5536864B2 (ja) マルチスレッドプロセッサ
JP5770334B2 (ja) マルチスレッドプロセッサ
JP2014067248A (ja) プロセッサ、割り込み処理方法及び割り込み制御装置
JP2015064861A (ja) マルチスレッドプロセッサ
JP2014211890A (ja) マルチスレッドプロセッサ及びその割り込み処理方法
JP2013058265A (ja) マルチスレッドプロセッサ及びその割り込み処理方法
JP2006146641A (ja) マルチスレッドプロセッサ及びマルチスレッドプロセッサの割込み方法

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150109

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150120

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150320

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150526

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150624

R150 Certificate of patent or registration of utility model

Ref document number: 5770333

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

R370 Written measure of declining of transfer procedure

Free format text: JAPANESE INTERMEDIATE CODE: R370