WO2016185599A1

WO2016185599A1 - 計算機システム及び計算機

Info

Publication number: WO2016185599A1
Application number: PCT/JP2015/064590
Authority: WO
Inventors: 裕治佐伯
Original assignee: 株式会社日立製作所
Priority date: 2015-05-21
Filing date: 2015-05-21
Publication date: 2016-11-24
Also published as: US20170371395A1; US10481671B2

Abstract

複数の計算機を備える計算機システムであって、複数の計算機の各々は、複数のプロセッサコアを含むプロセッサチップを一つ以上有し、プロセッサチップは、一つ以上のプロセッサコアから構成される複数の領域を構成し、複数のプロセッサコアは、所定のプログラムを実行する演算処理、プロセッサコア間の通信であるコア間通信処理を実行し、計算機システムは、複数の領域の各々に供給する電圧及び周波数を制御する調整部と、複数の領域の各々の電力モードを決定し、調整部に指示を出力する決定部と、を備える。

Description

計算機システム及び計算機

　本発明は、メニーコアプロセッサチップを有する計算機システムの省電力技術に関する。

　大規模な科学技術シミュレーションを行うために、数十万から数百万個のプロセッサコアを相互に接続した並列計算機システムが開発されている。近年の並列計算機システムには、半導体チップの集積度の向上によって、構造を単純化した数千個の同種のプロセッサコアが実装されるメニーコアプロセッサチップが用いられる。その代表的な構成としては、汎用ＣＰＵチップ及び主記憶装置に対して、入出力デバイスとしてＰＣＩ　Ｅｘｐｒｅｓｓを介して接続され、かつ、独立したメモリを備えるメニーコアプロセッサチップのサブシステムと、高速ネットワークアダプタを備えた計算ノード群で構成される。

　数万の計算ノードを相互に接続する大規模なシステムにおいては、全体の消費電力が１０メガワットを超えるため、電力を抑制する機構が必要となる。またプロセッサチップ単体においても、全てのコアを高負荷で動作させた場合、電力及び温度が設計上限を超えてしまうため、演算速度を調整する必要がある。

　そこで、コア単位の消費電力管理を行う省電力機能を用いた電力制御が知られている（例えば、特許文献１、特許文献２参照）。

　特許文献１には、「各ＶＲは電力をコア、又はコアの一部に供給することができる。別々のＶＲが、複数の電圧を多コア・プロセッサ内のコア／一部に供給することができる。ＶＲの出力電圧の値は、電圧調節器が電力を供給する先のコア／一部の方向下で調節することができる。一実施例では、複数のＶＲをコアと単一のダイに一体化することができる。別の実施例では、複数のＶＲを備えた電力管理システムは、多コア・プロセッサのダイとは別個のダイ（「ＶＲダイ」）上にあり得る。ＶＲダイは、多コア・プロセッサ・ダイと同じパッケージに含めることができる。」ことが記載されている。これによって、各コアに割り当てられた演算量に応じた電力制御を行うことができる。

　また、特許文献２には、「複数のプロセッサコアと、タスクについての第１タスク群の識別番号と、タスク処理時間と、第１タスク群に含まれるタスクを実行する上限期間を記憶するレジスタと、第１タスク群に含まれるタスクの内、並列に処理される複数のタスクからなる第２タスク群を抽出し、第２タスク群を処理する第１処理時間を、第２タスク群を処理するプロセッサコアの消費電力に応じて第２処理時間として設定する設定回路と、タスク処理時間と、第２処理時間との比率に応じて、各タスクを処理するプロセッサコアへ供給する動作クロックの周波数又は電源電圧を変更する駆動回路と、を備えるマルチコアプロセッサが提供される。」ことが記載されている。

特開２０１２－０３８３４７号公報特開２０１０－２１１５４４号公報

　メニーコアプロセッサチップにおいて、各コアに割り当てられたタスクの負荷情報に基づいて、電源電圧及び動作周波数を調整する、従来の電力制御を適用した場合、電圧及び周波数を制御する調整器の配置、及び各コアの電力モードの選択が難しい。

　また、大規模な科学技術シミュレーションでは、一般的に、計算対象のデータを均等に分割して全てのコアに対して割り当て、同じプログラムを用いて処理する。このとき、各コアの演算負荷は均等であるため、コア単位に電力制御を行う必要はない。しかし、並列計算機システム全体を一つのプログラムが占有して使用する場合は少ないため、一つのプログラムが使用するプロセッサチップのグループごとに負荷のバランスが均一にならならず、システム全体としての電力管理を行うことが課題となる。

　一方、メニーコアプロセッサチップを相互接続して構成された並列計算機の場合、チップ内のコア間の通信性能とチップ間の通信性能とに大きな差があるという問題があり、アルゴリズム又は計算順序の変更によって、チップ間通信と演算とを同時に行う等の工夫が必要となる。

　本発明は、メニーコアプロセッサチップ内のプロセッサコアに対する電力制御によって、メニーコアプロセッサチップの電力効率を向上させることを目的とする。

　本願において開示される発明の代表的な一例を示せば以下の通りである。すなわち、複数の計算機を備える計算機システムであって、前記複数の計算機の各々は、複数のプロセッサコアを含むプロセッサチップを一つ以上有し、前記プロセッサチップは、一つ以上のプロセッサコアから構成される複数の領域を構成し、前記複数のプロセッサコアは、所定のプログラムを実行する演算処理、プロセッサコア間の通信であるコア間通信処理を実行し、前記計算機システムは、前記複数の領域の各々に供給する電圧及び周波数を制御する調整部と、前記複数の領域の各々に供給する電圧及び周波数の組合せである電力モードを決定し、前記調整部に指示を出力する決定部と、を備え、前記決定部は、前記複数の領域の各々に含まれる一つ以上のプロセッサコアにおける演算処理の演算量及び通信処理の通信データ量に基づいて、前記複数の領域の各々の前記電力モードを決定することを特徴とする。

　本発明によれば、複数の領域に分割されたプロセッサチップにおいて、領域毎に電力モードを調整することによって、各プロセッサコアの処理の待ち時間を削減し、プロセッサチップの電力効率を向上できる。前述した以外の課題、構成及び効果は、以下の実施例の説明によって明らかにされる。

実施例１のメニーコアプロセッサチップの構成を示す説明図である。実施例１のメニーコアプロセッサチップを有する計算機システムの構成例を示す説明図である。実施例１の計算機システムのインターコネクトの構成例を示す説明図である。実施例１のメニーコアプロセッサチップ内の領域単位の電力モードの制御方法を示す説明図である。実施例１のメニーコアプロセッサチップ内の領域単位の電力モードの制御方法を示す説明図である。実施例１のメニーコアプロセッサチップ内の領域単位の電力モードの制御方法を示す説明図である。実施例１の調整器が保持する電力モード管理情報の一例を示す説明図である。実施例１のジョブ管理ノードが実行する処理を説明するフローチャートである。実施例１のジョブの投入を指示するジョブ記述の一例を示す説明図である。実施例２のジョブ管理ノードが実行する処理を説明するフローチャートである。実施例３のメニーコアプロセッサチップの構成を示す説明図である。実施例４のメニーコアプロセッサチップの構成を示す説明図である。実施例４の計算機システムのインターコネクトの構成例を示す説明図である。

　図１は、実施例１のメニーコアプロセッサチップ１の構成を示す説明図である。

　メニーコアプロセッサチップ１は、複数のプロセッサコア２（図１においてはｎ×ｎ個のプロセッサコア２１１、２１２～２ｎｎとして図示される）、メモリコントローラ１０、パフォーマンスカウンタ１１、及び通信バッファ１２を備える。なお、メニーコアプロセッサチップ１は、図示しない、各プロセッサコア２とローカルに接続されるメモリを備える。

　プロセッサコア２は、プログラムにしたがって各種演算処理を実行する演算装置である。また、プロセッサコア２は、他のプロセッサコア２との間でデータを参照等するための通信処理を実行する。実施例１のメニーコアプロセッサチップ１は、ｎ×ｎ個のプロセッサコア２を備える。

　各プロセッサコア２は、２次元メッシュ構造のチップ内ネットワーク３を介して相互に接続する。チップ内ネットワーク３は、メニーコアプロセッサチップ１内のプロセッサコア２間を直接接続するパスから構成される。

　また、メニーコアプロセッサチップ１の境界に配置されたプロセッサコア２は、通信バッファ１２に直接接続するパスを有する。通信バッファ１２には、メニーコアプロセッサチップ１間の通信に用いられるパスが接続される。メニーコアプロセッサチップ１は、当該パスから構成されるチップ間ネットワーク４を介して他のメニーコアプロセッサチップ１と接続する。

　プロセッサコア２は、他のプロセッサコア２との間でコア間通信を行う。コア間通信には、メニーコアプロセッサチップ１内のプロセッサコア２間の通信であるチップ内通信と、異なるメニーコアプロセッサチップ１に含まれるプロセッサコア２間の通信であるチップ間通信とがある。

　実施例１では、メニーコアプロセッサチップ１内のプロセッサコア２は、前述したような接続関係であるためプロセッサコア２の配置は論理的な２次元平面によって表現できる。実施例１では、論理的な２次元平面におけるプロセッサコア２の配置と、メニーコアプロセッサチップ１内のプロセッサコア２の配置は一致する。ここで、論理的な２次元平面（ｘｙ平面）におけるプロセッサコア２の配置を座標ｘを表す数字、及び座標ｙを表す数字を用いて表記する。例えば、プロセッサコア２１３は、座標ｘが「１」、座標ｙが「３」の位置に配置されたプロセッサコア２であることを表す。プロセッサコア２１３は、メニーコアプロセッサチップ１の境界に配置されたプロセッサコア２であり、通信バッファ１２及びチップ間ネットワーク４を経由して、他のメニーコアプロセッサチップ１内の境界に配置されたプロセッサコア２と通信する。すなわち、プロセッサコア２１３は、チップ間通信を行う。

　メモリコントローラ１０は、主記憶装置１３に対するアクセスを制御する。パフォーマンスカウンタ１１は、プログラムの実行時に、プロセッサコア２の演算量、チップ間ネットワーク４を介して送受信されたデータ量を計測する。通信バッファ１２は、メニーコアプロセッサチップ１間の通信において送受信されるデータを一時的に格納する。

　実施例１のメニーコアプロセッサチップ１は、一つ以上のプロセッサコア２から構成される複数の領域に分割された構成となっている。より具体的には、メニーコアプロセッサチップ１は、コア間通信の属性に基づいて定められた複数の領域に、物理的に分割された構成となっている。ここで、コア間通信の属性とは、メニーコアプロセッサチップ１間を接続するパス、すなわち、チップ間通信を行うためのパスの数を示す。

　図１に示すメニーコアプロセッサチップ１は、領域６－１１、領域６－２１、６－２２、６―２３、６―２４及び、領域６―３１、６―３２、６―３３、６―３４の三種類の領域６に分割された構成である。なお、メニーコアプロセッサチップ１上の通信バッファ１２、メモリコントローラ１０、パフォーマンスカウンタ１１は、プロセッサコア２とは別の領域（入出力領域７）として分割された構成となっている。

　領域６－１１は、通信バッファ１２と直接接続するパスを有さないプロセッサコア２から構成される領域である。領域６－１１に含まれるプロセッサコア２は、チップ間通信を行わない。

　領域６－２１、６－２２、６―２３、６―２４は、ｘ方向又はｙ方向のいずれか方向のチップ間ネットワーク４と接続する通信バッファ１２と直接接続するパスを有するプロセッサコア２から構成される領域である。領域６－２１、６－２２、６―２３、６―２４に含まれるプロセッサコア２は、一方向のチップ間通信を行う。

　領域６―３１、６―３２、６―３３、６―３４は、ｘ方向のチップ間ネットワーク４と接続する通信バッファ１２及びｙ方向のチップ間ネットワーク４と接続する通信バッファ１２と直接接続するパスを有するプロセッサコア２から構成される領域である。領域６―３１、６―３２、６―３３、６―３４に含まれるプロセッサコア２は、二方向のチップ間通信を行う。

　実施例１では、調整器１５は、各領域６及び入出力領域７に接続され、所定の電力モードにしたがって領域６ごとに電源電圧及び周波数を供給し、また、入出力領域７に電源電圧を供給する。ここで、電力モードとは、電源電圧及び周波数の値の組み合わせを示す。調整器１５は、複数の電力モードを管理する情報を保持し、後述する決定部１０４からの指示に基づいて各領域６の電力モードを設定することによって、各領域６に含まれるプロセッサコア２に電源電圧及び周波数を供給する。後述するように、領域６の種類に応じて、異なった電力モードが設定される。

　なお、複数のメニーコアプロセッサチップ１を相互接続した計算機システムの場合、メニーコアプロセッサチップ１間のデータ入出力は高速で行う必要があるため、調整器１５は、入出力領域７に対しては一定の電源電圧を供給するものとする。

　図２は、実施例１のメニーコアプロセッサチップ１を有する計算機システムの構成例を示す説明図である。図３は、実施例１の計算機システムのインターコネクトの構成例を示す説明図である。

　計算機システムは、ジョブ管理ノード１００及び計算ノード群１１０から構成され、ジョブ管理ノード１００及び計算ノード群１１０はネットワーク１３０を介して互いに接続される。ネットワーク１３０は、ＬＡＮ（Ｌｏｃａｌ　Ａｒｅａ　Ｎｅｔｗｏｒｋ）、ＷＡＮ（Ｗｉｄｅ　Ａｒｅａ　Ｎｅｔｗｏｒｋ）等が考えられるが、本実施例はネットワーク１３０の種別に限定されない。

　ジョブ管理ノード１００は、計算ノード群１１０に含まれる計算ノード１２０に対してジョブを割り当てる。ジョブ管理ノード１００は、プロセッサチップ１０１、主記憶装置１０２、及びインタフェース１０３を備える。

　プロセッサチップ１０１は、汎用的なプロセッサチップであり、一つ以上のプロセッサコアを含む。主記憶装置１０２は、プロセッサコアによって実行されるプログラム及び当該プログラムに必要な情報を格納する。本実施例の主記憶装置１０２は、決定部１０４を実現するプログラムを格納する。決定部１０４は、各領域６の電力モードを決定し、調整器１５に対して電力モードの設定を指示する。インタフェース１０３は、ネットワーク１３０を介して計算ノード群１１０に接続するためのインタフェースである。

　計算ノード群１１０は、複数の計算ノード１２０を含む。計算ノード１２０は、メニーコアプロセッサチップ１、主記憶装置１３、調整器１５、及びインタフェース１２１を備える。なお、計算ノード１２０は、二つ以上のメニーコアプロセッサチップ１を備えてもよい。

　複数の計算ノード１２０、すなわち、複数のメニーコアプロセッサチップ１は、例えば、図３に示すような構成のチップ間ネットワーク４を介して、互いに接続される。図１に示すように、メニーコアプロセッサチップ１内の各プロセッサコア２はメッシュ構造のチップ内ネットワーク３を介して互いに接続する。各メニーコアプロセッサチップ１は、チップ内ネットワーク３と同一次元のトーラス構造のチップ間ネットワーク４を介して互いに接続する。

　メッシュ構造のチップ内ネットワーク３と同一の次元のトーラス構造のチップ間ネットワーク４を構成することによって、論理的には全てのプロセッサコア２がトーラス構造で相互接続されたシステムとなる。しかし、メニーコアプロセッサチップ１間の入出力スループットの制限によって、異なるメニーコアプロセッサチップ１に含まれるプロセッサコア２間の通信、すなわち、チップ間通信の通信性能は、チップ内通信の通信性能より大幅に低い。

　ここで、大規模な科学技術計算の一例として格子上の問題に対応した並列プログラムを計算ノード群１１０に実行させることを考える。この場合、ジョブ管理ノード１００は、並列ジョブを各計算ノード１２０に配布する。並列ジョブは、各プロセッサコア２が実行する演算処理が同一、かつ、演算量が均一になるように領域分割された格子点を各プロセッサコア２に均等に割り当てるように、並列化されたプログラムに対応する。

　このような並列プログラムでは、プロセッサコア２は、当該プロセッサコア２に割り当てられた格子点に隣接する格子点のデータを参照し、当該格子点のデータを更新する場合に、プロセッサコア２間の通信が行われることが多い。したがって、図３に示すようなチップ間ネットワーク４で構成される計算機システムにおいて、各プロセッサコア２に格子点を割り当てて並列ジョブを実行させる場合、隣接するプロセッサコア２間の通信の頻度が最も高くなる。

　前述したように、チップ間通信の通信性能と、チップ内通信の通信性能との間には大きな差がある。そのため、あるプロセッサコア２が、隣接するプロセッサコア２に割り当てられた格子点のデータを参照する場合、チップ内通信におけるアクセスタイムに対して、チップ間通信におけるアクセスタイムが大きくなる。したがって、メニーコアプロセッサチップ１の境界に配置されたプロセッサコア２、すなわち、他のメニーコアプロセッサチップ１のプロセッサコア２と直接通信を行うプロセッサコア２は、チップ間通信による待ち時間の分だけ処理に遅延が発生する。

　格子点のデータを繰り返し更新する演算処理では、全ての格子点のデータが更新されないと次の回に進めないため、最も処理が遅いプロセッサコア２に並列処理全体の処理速度が律速される。

　前述したような問題を解決するために、図１に示すような複数の領域６に分割されたメニーコアプロセッサチップ１を用いて、プロセッサコア２の待ち時間を最小にして、メニーコアプロセッサチップ１の電力効率を向上させる。具体的には、調整器１５が、決定部１０４からの指示に基づいて各領域６の電力モードを設定し、設定された電力モードにしたがって、各領域６に電源電圧及び周波数を供給する。

　ここで、図４、図５、及び図６を用いて、格子上の問題に対応した並列プログラムの実行時における電力モードの制御方法について説明する。

　図４、図５、及び図６は、実施例１のメニーコアプロセッサチップ１内の領域単位の電力モードの制御方法を示す説明図である。なお、図４及び図５は、メニーコアプロセッサチップ１の１次元の接続に着目した図である。

　図４では、調整器１５が全ての領域６に同一の電力モードを設定した場合のプロセッサコア２の演算時間及びコア間通信時間を示す。各プロセッサコア２は、同一内容の演算処理を実行し、演算処理によって更新されたデータを参照するために他のプロセッサコア２との間でコア間通信を行う。図４では、演算処理の実行時間である演算時間２００、及びプロセッサコア間通信時間２１０、２２０を示す。なお、プロセッサコア間通信時間２１０は、チップ内通信の実行時間を示し、プロセッサコア間通信時間２２０は、チップ間通信の実行時間を示す。

　同一の電源電圧及び同一の周波数が各プロセッサコア２に供給された場合、各プロセッサコア２に割り当てられる演算量は同一であるため、各プロセッサコア２の演算時間２００は同一となる。

　プロセッサコア２間で送受信されるデータのデータ量は同一であるが、チップ内通信、及びチップ間通信は通信性能が大きく異なる。したがって、メニーコアプロセッサチップ１の境界に配置されたプロセッサコア２１、２ｎのコア間通信の通信時間（チップ間通信時間２２０）は、メニーコアプロセッサチップ１の内部に配置されたプロセッサコア２２、２３、２ｍのコア間通信の通信時間（チップ内通信時間２１０）より大きくなる。

　そのため、メニーコアプロセッサチップ１内に配置されたプロセッサコア２２、２３、２ｍは、プロセッサコア２１、２ｎのチップ間通信が終了するまで待ち状態となる。すなわち、待ち時間が発生する。

　図５では、調整器１５が、プロセッサコア２１、２ｎの電源電圧及び周波数を上げるように電力モードを設定し、また、プロセッサコア２２、２３、２ｍの電源電圧及び周波数を下げるように電力モードを設定した場合のプロセッサコア２の演算時間及びコア間通信時間を示す。

　プロセッサコア２１、２ｎに供給される電源電圧及び周波数は高く設定されるため、演算時間２００が短くなる。一方、プロセッサコア２２、２３、２ｍに供給される電源電圧及び周波数は低く設定されるため、演算時間２００が長くなる。これによって、プロセッサコア２１、２ｎのチップ間通信の実行中にプロセッサコア２２、２３、２ｍの演算処理が実行されるように、演算性能が調整される。このように、調整器１５が、各領域６の電力モードを制御することによって、図４に示すような待ち時間を削減できる。

　ここで、決定部１０４は、以下のような三つの条件に基づいて各領域６の電力モードを決定する。
（条件１）熱設計電力の範囲内の電力モード
（条件２）各領域に含まれるプロセッサコア２の演算時間及びコア間通信時間の合計値の最大値を最小とする電力モード
（条件３）各領域に含まれるプロセッサコア２の演算時間及びコア間通信時間の合計値の差が小さくなる電力モード

　（条件１）は、メニーコアプロセッサチップ１全体の消費電力の上限を超えないための条件である。（条件２）は、チップ間通信を行うため、多くのサイクル数を要するチップ境界に配置されたプロセッサコア２の演算処理を高速化するために電源電圧及び周波数を上げるための条件である。また、（条件３）は、チップ内通信のみを行うため、少ないサイクル数で通信が可能なプロセッサコア２の演算時間を延ばすために電源電圧及び周波数を下げるための条件である。

　決定部１０４が、前述の三つの条件に基づいて各領域６の電力モードを決定することによって、メニーコアプロセッサチップ１及び計算機システムの電力効率を向上することができる。

　図６では、２方向のメニーコアプロセッサチップ１と接続するパスを有するプロセッサコア２１１、２ｎ１と、１方向のメニーコアプロセッサチップ１と接続するパスを有するプロセッサコア２１１、２２１、２３１、２ｍ１、２ｎ１とが存在する。二方向のチップ間通信では、一方向のチップ間通信の２倍のデータ量を送受信されるため、二方向のチップ間通信の通信時間は、一方向のチップ間通信の通信時間より大きい。

　そのため、決定部１０４は、チップ間通信のパスの数が多いプロセッサコア２を含む領域６から順に、電源電圧及び周波数が高くなるように電力モードを決定する。すなわち、決定部１０４は、領域６－３１、６－３２、６－３３、６－３４、領域６－２１、６－２２、６－２３、６－２４、領域６－１１の順に、電源電圧及び周波数が低くなるような電力モードを決定する。これによって、プロセッサコア２における通信処理の待ち時間を最小にし、かつ、電力効率を向上できる。

　具体的には、決定部１０４は、プロセッサコア２１１及びプロセッサコア２ｎ１を含む領域６については、演算時間２００が短くなる電源電圧及び周波数の組み合わせ（電力モード）を決定する。また、決定部１０４は、プロセッサコア２１２、２２１、２３１、２ｍ１、２ｎ１、２ｎ２を含む領域６については、当該プロセッサコア２が行うチップ間通信以外のチップ間通信の実行中に演算処理が実行されるように電力モードを決定する。また、決定部１０４は、プロセッサコア２２１、２３２、２ｍ２、２ｘｙを含む領域６については、他の領域６のプロセッサコア２のチップ間通信の実行中に演算処理が実行されるように電力モードを決定する。

　これによって、各プロセッサコア２の処理時間の合計値の差が最小となる。したがって、メニーコアプロセッサチップ１の電力効率を向上することができる。

　次に、前述したような制御を実現するための具体的な処理について説明する。

　図７は、実施例１の調整器１５が保持する電力モード管理情報３００の一例を示す説明図である。実施例１では、決定部１０４も同様の電力モード管理情報３００を保持する。

　電力モード管理情報３００は、調整器１５が領域単位に設定する電力モードを管理するための情報である。電力モード管理情報３００は、モードＩＤ３０１、電圧３０２、及び周波数３０３を含む。

　モードＩＤ３０１は、電力モードを一意に識別するための識別子である。電圧３０２及び周波数３０３は、モードＩＤ３０１に対応する電力モードの具体的な電源電圧及び周波数の組み合わせである。

　図８は、実施例１のジョブ管理ノード１００が実行する処理を説明するフローチャートである。図９は、実施例１のジョブの投入を指示するジョブ記述４００の一例を示す説明図である。

　実施例１では、ジョブ管理ノード１００の決定部１０４が、予め、計算ノード１２０の並列プログラムの処理性能を解析することによって、各領域６に設定する電力モードを決定する。実施例１では、ジョブスケジューラを用いて決定部１０４の機能を実現するものとする。

　ジョブ管理ノード１００は、ジョブの投入を受け付ける（ステップＳ１００）。ジョブ管理ノード１００は、メニーコアプロセッサチップ１の各プロセッサコア２に並列ジョブを配布し、所定のスケジュールにしたがって並列ジョブの実行を指示する（ステップＳ１０１）。このとき、メニーコアプロセッサチップ１のパフォーマンスカウンタ１１は、並列ジョブの実行中にメニーコアプロセッサチップ１の消費電力と、各プロセッサコア２の演算量及び通信データ量とを計測する。

　ジョブ管理ノード１００は、並列プログラムの実行結果に基づいて処理性能を解析し（ステップＳ１０２）、解析の結果に基づいて各領域６に設定する電力モードを決定する。

　具体的には、ジョブ管理ノード１００は、並列プログラムにおいて電力モードを制御する必要のある主要部分を特定する。例えば、演算時間が長い処理に対応する部分が主要部分となる。ジョブ管理ノード１００は、また、パフォーマンスカウンタ１１によって計測されたメニーコアプロセッサチップ１の消費電力と、プロセッサコア２の演算量及び通信データ量とに基づいて、各領域６に設定する電力モードを決定する。なお、一つの領域６に複数のプロセッサコア２が含まれる場合、少なくとも一つのプロセッサコア２の演算量及び通信データ量が計測される。

　各領域６に設定する電力モードは、例えば、並列ジョブを実行するプロセッサコア２の演算量及びチップ間通信の通信データ量に基づいて決定される。ここで、演算量を表す変数を「Ａ」とし、また、チップ間通信の通信データ量を表す変数を「Ｃ」とする。また、チップ間通信のスループットを表す変数を「ｂ」とし、メニーコアプロセッサチップ１の境界に配置されたプロセッサコア２の周波数を表す変数を「ｆ１」とする。

　このとき、演算時間は下式（１）、チップ間通信時間は下式（２）に示す数式を用いて算出することができる。また、チップ内通信のスループットがｂより十分大きい場合、チップ内通信のみを行うプロセッサコア２のみを含む領域６－１１における最適な周波数ｆ２は下式（３）で与えられる。

　一般に、電源電圧が与えられた場合に安定して動作する周波数の上限値は下式（４）に示すような関係があり、下式（４）から電源電圧を求めることができる。

　調整器１５が設定可能な電力モードが離散的な電源電圧及び周波数の値の組み合わせである場合、決定部１０４は、前述した式に基づいて算出された値の近似値の組み合わせであり、かつ、チップ全体の消費電力が上限値を超えない電力モードを決定する。

　また、決定部１０４は、並列プログラム、並列プログラムにおける主要部分、及び各領域６の電力モードを対応付けた制御情報を主記憶装置１０２に格納する。なお、当該制御情報は、他の装置に出力されてもよい。

　オペレータは、並列プログラムの実行を要求する場合、制御情報に基づいて、ジョブの投入するためのスクリプト、すなわち、並列プログラムの実行要求であるジョブ記述４００に、主要部分における各領域６の電力モード、又は、演算量及び通信データ量を指定する。図９に示すジョブ記述４００には、演算量及び通信データ量を指定する行が含まれる。

　ジョブ管理ノード１００は、当該ジョブ記述４００を介してジョブの投入を受け付けた場合、決定部１０４が、各領域６の識別情報、各領域６に設定する電力モードの識別子を調整器１５に出力する。調整器１５は、決定部１０４からの指示にしたがって、各領域６の電力モードを制御する。

　なお、ジョブ管理ノード１００の決定部１０４が、各領域６の電力モードを選択していたが、メニーコアプロセッサチップ１が同様の機能を有してもよい。例えば、主記憶装置１３に決定部１０４を実現するプログラムを格納し、メニーコアプロセッサチップ１の少なくとも一つのプロセッサコア２が当該プログラムを実行することによって、メニーコアプロセッサチップ１上で決定部１０４を実現できる。

　なお、複数の主要部分が存在する場合、コンパイラが、主要部分と、演算量及び通信データ量とを指定するコメント文が挿入された並列プログラムを解釈し、調整器１５に対して各領域６の電力モードを設定するための命令を並列プログラムに挿入する。この場合、決定部１０４に対応するプロセッサコア２が、当該命令に基づいて、各領域６の電力モードを決定し、調整器１５に対して各領域６の電力モードの設定を指示する。これによって、各主要部分に適した電力制御が可能となる。

　実施例１によれば、メニーコアプロセッサチップ１上のプロセッサコア２は、メニーコアプロセッサチップ１間を接続するパスの数に基づいて複数の領域６に分割された構成であり、各領域６に他の領域とは異なる電力モードを設定することができる。これによって、各プロセッサコア２の待ち時間が削減され、また、メニーコアプロセッサチップ１の電力効率を向上できる。

　実施例２では、並列プログラムの実行中に各領域６の電力モードが設定される。以下、実施例１との差異を中心に、実施例２について説明する。

　実施例２のメニーコアプロセッサチップ１、計算機システムの構成は実施例１と同一であるため説明を省略する。実施例２では、領域６に対する電力モードの設定方法が異なる。

　図１０は、実施例２のジョブ管理ノード１００が実行する処理を説明するフローチャートである。

　ジョブ管理ノード１００は、ジョブの投入を受け付ける（ステップＳ２００）。ジョブ管理ノード１００は、調整器１５に、全ての領域６に同一の電力モードの設定を指示する（ステップＳ２０１）。また、ジョブ管理ノード１００は、メニーコアプロセッサチップ１のパフォーマンスカウンタ１１を初期化する（ステップＳ２０２）。その後、ジョブ管理ノード１００は、メニーコアプロセッサチップ１の各プロセッサコア２にジョブを配布し、所定のスケジュールにしたがってジョブの実行を指示する（ステップＳ２０３）。

　ジョブ管理ノード１００は、周期的に、パフォーマンスカウンタ１１からメニーコアプロセッサチップ１の消費電力、プロセッサコア２の演算量、及びプロセッサコア２の通信データ量を取得する（ステップＳ２０４）。ジョブ管理ノード１００は、パフォーマンスカウンタ１１から取得された値に基づいて、各領域６の電力モードを決定する（ステップＳ２０５）。電力モードの決定方法は、実施例１と同一の方法であるため説明を省略する。ジョブ管理ノード１００は、領域６の識別子、及び選択された電力モードの識別子を含む電力モードの設定命令を調整器１５に出力することによって、各領域６の電力モードの変更を指示する（ステップＳ２０６）。

　ジョブ管理ノード１００は、並列プログラムによる処理が完了したか否かを判定する（ステップＳ２０７）。並列プログラムによる処理が完了していないと判定された場合、ジョブ管理ノード１００は、ステップＳ２０４に戻り、同様の処理を繰り返し実行する。並列プログラムによる処理が完了したと判定された場合、ジョブ管理ノード１００は処理を終了する。

　実施例２によれば、並列プログラムの実行中に、動的に電力モードが設定できるため、より詳細な電力制御を実現できる。そのため電力効率をより向上できる。

　実施例３では、メニーコアプロセッサチップ１が、領域６毎に外部電源及びクロックジェネレータを備える。以下、実施例１との差異を中心に説明する。

　図１１は、実施例３のメニーコアプロセッサチップ１の構成を示す説明図である。なお、メニーコアプロセッサチップ１の構成、及び計算機システムの構成は実施例１と同一であるため説明を省略する。

　実施例１の調整器１５は、離散的な電源電圧及び周波数の組み合わせとして電力モードを管理する。一方、最適な電源電圧及び周波数は、連続的な値をとる。したがって、実施例１では、決定部１０４は、調整器１５が設定可能な電力モードしか選択できない。そのため、メニーコアプロセッサチップ１の電力効率を最大化することが困難である。

　同一の並列ジョブを実行するプロセッサコア２は、メニーコアプロセッサチップ１内において同じ動作をすることが多い。そのため、計算機システム又はメニーコアプロセッサチップ１のグループ単位に、各領域６の電源電圧及び周波数を連続的な値の組み合わせとして設定することによって、電力効率を向上する。

　そこで、実施例３のメニーコアプロセッサチップ１の各領域６には、外部電源５００及びクロックジェネレータ５１０が接続される。具体的には、領域６－１１には、外部電源５００－１及びクロックジェネレータ５１０－１が接続され、領域６－２１、６－２２、６－２３、６－２４には外部電源５００－２及びクロックジェネレータ５１０－２が接続され、領域６－３１、６－３２、６－３３、６－３４には外部電源５００－３及びクロックジェネレータ５１０－３が接続され、入出力領域７には外部電源５００－４及びクロックジェネレータ５１０－４が接続される。また、メニーコアプロセッサチップ１の領域６についても同様の接続関係を有する。

　実施例３では、ジョブ管理ノード１００が、調整器１５に対応する機能を有する。この場合、ジョブ管理ノード１００は、当該機能を介して、各外部電源５００及び各クロックジェネレータ５１０と接続する。なお、調整器１５に対応する機能は、ハードウェア又はソフトウェアの何れを用いて実現してもよい。

　実施例３では、決定部１０４が各領域６の電源電圧及び周波数の連続的な値の組み合わせを決定し、調整器１５が決定された電源電圧及び周波数を供給するように外部電源５００及びクロックジェネレータ５１０を制御する。実施例３では、メニーコアプロセッサチップ１に備わる調整器１５よりも精密な電源電圧及び周波数の調整が可能となる。

　実施例３によれば、各領域６の電源電圧及び周波数をより精密に調整できるため、メニーコアプロセッサチップ１の電力効率をより向上できる。

　実施例４では、メニーコアプロセッサチップ１の構造が実施例１とは異なる。以下実施例１との差異を中心に実施例４について説明する。なお、計算機システムの構成は実施例１と同一であるため説明を省略する。

　図１２は、実施例４のメニーコアプロセッサチップ１の構成を示す説明図である。図１３は、実施例４の計算機システムのインターコネクトの構成例を示す説明図である。

　実施例４のメニーコアプロセッサチップ１は、ｎ×ｎ×ｎ個のプロセッサコア２を備える。各プロセッサコア２は、３次元メッシュ構造のチップ内ネットワーク３ｘ、３ｙ、３ｚを介して相互に接続する。

　実施例４では、メニーコアプロセッサチップ１内のチップ内ネットワーク３ｘ、３ｙ、３ｚにおけるプロセッサコア２の配置を３次元座標（ｘ，ｙ，ｚ）を用いて表記する。座標ｘ及び座標ｙの値が同一であるｎ個のプロセッサコア２は、物理的に隣接した位置に配置される。例えば、図１２において、ｘ＝１、ｙ＝ｍである平面上には１６個のプロセッサコア２が領域６１ｍに配置される。

　ｚ方向のチップ内ネットワーク３ｚは、例えば、領域６１ｍ内部において、プロセッサコア２０１からプロセッサコア２０ｎまでのプロセッサコア２を順に接続する。プロセッサコア２０１、２０ｎは、チップ内ネットワーク３ｚを介してｚ方向の通信バッファ１２－５、１２－６と接続し、メニーコアプロセッサチップ１の外部と通信する。

　ｘ方向のチップ内ネットワーク３ｘは、例えば、領域６１ｍと領域６２ｍとの間で、領域内の相対位置が同一であるプロセッサコア２間を接続する。領域６１１、６１２、６１ｍ、６１ｎは、チップ内ネットワーク３ｘを介してｘ方向の通信バッファ１２－１と接続し、メニーコアプロセッサチップ１の外部と通信する。また、領域６ｎ１、６ｎ２、６ｎｍ、６ｎｎは、チップ内ネットワーク３ｘを介してｘ方向の通信バッファ１２－２と接続し、メニーコアプロセッサチップ１の外部と通信する。

　ｙ方向のチップ内ネットワーク３ｙは、例えば、領域６１ｍと領域６１ｎとの間で、領域内の相対位置が同一であるプロセッサコア２間を接続する。領域６１１、６２１、６ｍ１、６ｎ１は、チップ内ネットワーク３ｙを介してｙ方向の通信バッファ１２－３と接続し、メニーコアプロセッサチップ１の外部と通信する。また、領域６１ｎ、６２ｎ、６ｍｎ、６ｎｎは、チップ内ネットワーク３ｙを介してｙ方向の通信バッファ１２－４と接続し、メニーコアプロセッサチップ１の外部と通信する。

　通信バッファ１２に接続するパスに着目した場合、領域６１１、６１２、６１ｍ、６１ｎ及び領域６ｎ１、６ｎ２、６ｎｍ、６ｎｎに含まれるプロセッサコア２は、ｘ方向のチップ間通信のためのパスを有する。領域６１１、６２１、６ｍ１、６ｎ１及び領域６１ｎ、６２ｎ、６ｍｎ、６ｎｎに含まれるプロセッサコア２は、ｙ方向のチップ間通信のためのパスを有する。また各領域６には、プロセッサコア２０１、２０ｎに示すようなｚ方向のチップ間通信のためのパスを有する。

　以上の特性から、実施例４のメニーコアプロセッサチップ１内のプロセッサコア２は、３次元メッシュ構造のチップ内ネットワーク３ｘ、３ｙ、３ｚにおけるプロセッサコア２の論理的な位置（３次元メッシュの位置）から、内部領域、境界面領域、境界線領域、及び頂点領域の四種類の領域に分割された構成となる。

　ここで、ｎ×ｎ×ｎの格子点を含む立方体の格子点上にプロセッサコア２が配置される論理的なメニーコアプロセッサチップ１のモデルを考える。立方体の境界に配置されたプロセッサコア２は、パスを介して、他のメニーコアプロセッサチップ１と接続する。

　具体的には、立方体の辺に配置されたプロセッサコア２は二つのパスと接続する。また、立方体の頂点に配置されたプロセッサコア２は三つのパスと接続する。また、立方体の辺及び頂点に配置されたプロセッサコア２を除く、立方体の面に配置されたプロセッサコア２は、一つのパスと接続する。立方体の内部に配置されたプロセッサコア２は、外部と接続するパスを有さない。

　以上の考察から、各領域６は以下のような構成であることが分かる。内部領域は、チップ間通信のパスを有さないプロセッサコア２から構成される領域である。境界面領域は、チップ間通信のパスを一つ有するプロセッサコア２から構成される領域である。境界線領域は、チップ間通信のパスを二つ有するプロセッサコア２から構成される領域である。さらに、頂点領域は、チップ間通信のパスを三つ有するプロセッサコア２から構成される領域である。

　また、実施例１と同様に、メニーコアプロセッサチップ１上の通信バッファ１２、メモリコントローラ１０、パフォーマンスカウンタ１１は、プロセッサコア２とは別の領域（入出力領域７）として分割された構成となっている。

　複数のメニーコアプロセッサチップ１は、図１３に示すような構成のチップ間ネットワーク４を介して、互いに接続される。図１２に示すように、メニーコアプロセッサチップ１内の各プロセッサコア２はメッシュ構造のチップ内ネットワーク３ｘ、３ｙ、３ｚを介して互いに接続する。各メニーコアプロセッサチップ１は、メニーコアプロセッサチップ１内のチップ内ネットワーク３と同一次元のトーラス構造のチップ間ネットワーク４ｘ、４ｙ、４ｚを介して互いに接続する。

　メッシュ構造のチップ内ネットワーク３ｘ、３ｙ、３ｚと同一の次元のトーラス構造のチップ間ネットワーク４ｘ、４ｙ、４ｚを構成することによって、論理的には全てのプロセッサコア２がトーラス構造で相互接続されたシステムとなる。

　実施例１と同様の格子上の問題に対応した並列プログラムを計算ノード群１１０に実行させることを考える。この場合、他のメニーコアプロセッサチップ１のプロセッサコア２と直接通信を行うプロセッサコア２は、チップ間通信による待ち時間の分だけ処理に遅延が発生する。

　例えば、３次元メッシュ構造における頂点に配置された８個のプロセッサコア２は、すなわち、頂点領域に含まれるプロセッサコア２の通信データ量は、境界面領域に含まれるプロセッサコア２の通信データ量の３倍となる。そのため、チップ間通信の通信時間が長い。

　したがって、格子上の問題に対応した並列プログラムを計算ノード群１１０に実行させる場合、最も処理が遅いプロセッサコア２に並列処理全体の処理速度が律速される。

　そのため、決定部１０４は、頂点領域、境界線領域、境界面領域、及び内部領域の順に、電源電圧及び周波数が低くなるような電力モードを決定する。これによって、チップ間通信による待ち時間が最小になるように各プロセッサコア２の演算速度が調整される。これによって、メニーコアプロセッサチップ１の電力効率を向上できる。

　また、メニーコアプロセッサチップ１の実装に依存した電力モードの調整も可能である。例えば、ラック単位でｚ座標が決まっておりｚ方向のチップ間通信がラック間の通信となる場合、ｘ方向のチップ間通信の通信性能及びｙ方向のチップ間通信の通信性能は同一であるが、z方向のチップ間通信性能はｘ方向及びｙ方向のチップ間通信の通信性能より低い。

　前述したようにチップ間通信の通信性能に違いがある場合、決定部１０４は、ｚ方向のチップ間通信を行うプロセッサコア２を含む境界線領域、又は境界面領域の電力モードについては、他の境界線領域又は境界面領域の電力モードとは異なる電力モードに決定する。これによって、チップ間通信の通信性能の違いに伴う待ち時間を削減できる。なお、設定する電力モードの決定方法等は、実施例１と同一であるため説明を省略する。

　なお、本発明は上記した実施例に限定されるものではなく、様々な変形例が含まれる。また、例えば、上記した実施例は本発明を分かりやすく説明するために構成を詳細に説明したものであり、必ずしも説明した全ての構成を備えるものに限定されるものではない。また、各実施例の構成の一部について、他の構成に追加、削除、置換することが可能である。

　また、上記の各構成、機能、処理部、処理手段等は、それらの一部又は全部を、例えば集積回路で設計する等によりハードウェアで実現してもよい。また、本発明は、実施例の機能を実現するソフトウェアのプログラムコードによっても実現できる。この場合、プログラムコードを記録した記憶媒体をコンピュータに提供し、そのコンピュータが備えるＣＰＵが記憶媒体に格納されたプログラムコードを読み出す。この場合、記憶媒体から読み出されたプログラムコード自体が前述した実施例の機能を実現することになり、そのプログラムコード自体、及びそれを記憶した記憶媒体は本発明を構成することになる。このようなプログラムコードを供給するための記憶媒体としては、例えば、フレキシブルディスク、ＣＤ－ＲＯＭ、ＤＶＤ－ＲＯＭ、ハードディスク、ＳＳＤ（Ｓｏｌｉｄ　Ｓｔａｔｅ　Ｄｒｉｖｅ）、光ディスク、光磁気ディスク、ＣＤ－Ｒ、磁気テープ、不揮発性のメモリカード、ＲＯＭなどが用いられる。

　また、本実施例に記載の機能を実現するプログラムコードは、例えば、アセンブラ、Ｃ／Ｃ＋＋、ｐｅｒｌ、Ｓｈｅｌｌ、ＰＨＰ、Ｊａｖａ等の広範囲のプログラム又はスクリプト言語で実装できる。

　さらに、実施例の機能を実現するソフトウェアのプログラムコードを、ネットワークを介して配信することによって、それをコンピュータのハードディスクやメモリ等の記憶手段又はＣＤ－ＲＷ、ＣＤ－Ｒ等の記憶媒体に格納し、コンピュータが備えるＣＰＵが当該記憶手段や当該記憶媒体に格納されたプログラムコードを読み出して実行するようにしてもよい。

　上述の実施例において、制御線や情報線は、説明上必要と考えられるものを示しており、製品上必ずしも全ての制御線や情報線を示しているとは限らない。全ての構成が相互に接続されていてもよい。

Claims

　複数の計算機を備える計算機システムであって、
　前記複数の計算機の各々は、複数のプロセッサコアを含むプロセッサチップを一つ以上有し、
　前記プロセッサチップは、一つ以上のプロセッサコアから構成される複数の領域を構成し、
　前記複数のプロセッサコアは、所定のプログラムを実行する演算処理、プロセッサコア間の通信であるコア間通信処理を実行し、
　前記計算機システムは、
　前記複数の領域の各々に供給する電圧及び周波数を制御する調整部と、
　前記複数の領域の各々に供給する電圧及び周波数の組合せである電力モードを決定し、前記調整部に指示を出力する決定部と、
　を備え、
　前記決定部は、前記複数の領域の各々に含まれる一つ以上のプロセッサコアにおける演算処理の演算量及び通信処理の通信データ量に基づいて、前記複数の領域の各々の前記電力モードを決定することを特徴とする計算機システム。
　請求項１に記載の計算機システムであって、
　前記プロセッサチップに含まれる前記複数のプロセッサコアは、チップ内ネットワークを介して互いに接続され、
　複数のプロセッサチップは、チップ間ネットワークを介して互いに接続され、
　前記複数の領域の各々は、プロセッサコアのコア間通信の属性に基づいて定められ、
　前記コア間通信は、前記プロセッサチップに含まれる前記プロセッサコア間の通信であるチップ内通信と、異なるプロセッサチップに含まれる前記プロセッサコア間の通信であるチップ間通信と、を含み、
　前記決定部は、
　前記所定のプログラムにおいて前記電力モードを制御する演算部分を示す情報と、当該演算部分における前記複数の領域の各々に含まれる前記一つ以上のプロセッサコアの前記演算量及び前記通信データ量とを含む、プログラムの実行要求を受け付け、
　前記プログラムの実行要求に基づいて、前記複数の領域の各々の前記電力モードを決定することを特徴とする計算機システム。
　請求項１に記載の計算機システムであって、
　前記プロセッサチップに含まれる前記複数のプロセッサコアは、チップ内ネットワークを介して互いに接続され、
　複数のプロセッサチップは、チップ間ネットワークを介して互いに接続され、
　前記複数の領域の各々は、プロセッサコアのコア間通信の属性に基づいて定められ、
　前記コア間通信は、前記プロセッサチップに含まれる前記プロセッサコア間の通信であるチップ内通信と、異なるプロセッサチップに含まれる前記プロセッサコア間の通信であるチップ間通信と、を含み、
　前記所定のプログラムには、前記電力モードを制御する演算部分毎に、当該演算部分における前記複数の領域の各々の前記電力モードを制御するための命令が含まれ、
　前記決定部は、前記所定のプログラムを実行する場合に、前記命令に基づいて前記複数の領域の各々の前記電力モードを決定することを特徴とする計算機システム。
　請求項１に記載の計算機システムであって、
　前記プロセッサチップに含まれる前記複数のプロセッサコアは、チップ内ネットワークを介して互いに接続され、
　複数のプロセッサチップは、チップ間ネットワークを介して互いに接続され、
　前記複数の領域の各々は、プロセッサコアのコア間通信の属性に基づいて定められ、
　前記コア間通信は、前記プロセッサチップに含まれる前記プロセッサコア間の通信であるチップ内通信と、異なるプロセッサチップに含まれる前記プロセッサコア間の通信であるチップ間通信と、を含み、
　前記決定部は、
　前記所定のプログラムの実行中に、前記複数の領域の各々に含まれる前記一つ以上のプロセッサコアから前記演算量及び前記通信データ量を取得し、
　前記複数の領域の各々に含まれる前記一つ以上のプロセッサコアから取得された前記演算量及び前記通信データ量に基づいて、前記複数の領域の各々の前記電力モードを決定することを特徴とする計算機システム。
　請求項２から請求項４のいずれか一つに記載の計算機システムであって、
　前記複数の領域は、前記チップ内通信のみを行う第１の領域と、前記チップ内通信及び前記チップ間通信を行う第２の領域と、を含み、
　前記決定部は、前記第１の領域に含まれる一つ以上のプロセッサコアの前記演算処理の処理時間及び前記コア間通信処理の通信時間の合計値と、前記第２の領域に含まれる一つ以上のプロセッサコアの前記演算処理の処理時間及び前記コア間通信処理の通信時間の合計値との差が小さくなるように、前記第１の領域及び前記第２の領域の各々の前記電力モードを決定することを特徴とする計算機システム。
　請求項５に記載の計算機システムであって、
　前記決定部は、
　前記演算処理の処理時間が短くなるように前記第２の領域の前記電力モードを決定し、
　前記演算処理の処理時間が長くなるように前記第１の領域の前記電力モードを決定することを特徴とする計算機システム。
　請求項６に記載の計算機システムであって、
　前記決定部は、前記プロセッサコアに接続される前記チップ間通信のパスの数が多い順に、当該プロセッサコアを含む前記第２の領域に供給される前記電圧及び前記周波数が高くなるように前記電力モードを決定することを特徴とする計算機システム。
　請求項５に記載の計算機システムであって、
　前記調整部は、前記複数の領域の各々に接続されることを特徴とする計算機システム。
　請求項５に記載の計算機システムであって、
　前記複数の領域の各々には、前記プロセッサコアに前記電圧を供給する電源、及び前記プロセッサコアに前記周波数を供給するクロックジェネレータが接続され、
　前記調整部は、前記複数の領域の各々に接続される前記電源及び前記クロックジェネレータに接続されることを特徴とする計算機システム。
　複数のプロセッサコアを含む、複数のプロセッサチップを備える計算機であって、
　前記複数のプロセッサチップの各々は、一つ以上のプロセッサコアから構成される複数の領域を構成し、
　前記複数のプロセッサコアは、所定のプログラムを実行する演算処理、プロセッサコア間の通信であるコア間通信処理を実行し、
　前記計算機は、
　前記複数の領域の各々に供給する電圧及び周波数を制御する調整部と、
　前記複数の領域の各々に供給する電圧及び周波数の組合せである電力モードを決定し、前記調整部に指示を出力する決定部と、
　を備え、
　前記決定部は、前記複数の領域の各々に含まれる一つ以上のプロセッサコアにおける演算処理の演算量及び通信処理の通信データ量に基づいて、前記複数の領域の各々の前記電力モードを決定することを特徴とする計算機。
　請求項１０に記載の計算機であって、
　前記プロセッサチップに含まれる前記複数のプロセッサコアは、チップ内ネットワークを介して互いに接続され、
　前記複数のプロセッサチップは、チップ間ネットワークを介して互いに接続され、
　前記複数の領域の各々は、プロセッサコアのコア間通信の属性に基づいて定められ、
　前記コア間通信は、前記プロセッサチップに含まれる前記プロセッサコア間の通信であるチップ内通信と、異なるプロセッサチップに含まれる前記プロセッサコア間の通信であるチップ間通信と、を含み、
　前記所定のプログラムには、前記電力モードを制御する演算部分毎に、当該演算部分における前記複数の領域の各々の前記電力モードを制御するための命令が含まれ、
　前記決定部は、前記所定のプログラムを実行する場合に、前記命令に基づいて前記複数の領域の各々の前記電力モードを決定することを特徴とする計算機。
　請求項１０に記載の計算機であって、
　前記プロセッサチップに含まれる前記複数のプロセッサコアは、チップ内ネットワークを介して互いに接続され、
　前記複数のプロセッサチップは、チップ間ネットワークを介して互いに接続され、
　前記複数の領域の各々は、プロセッサコアのコア間通信の属性に基づいて定められ、
　前記コア間通信は、前記プロセッサチップに含まれる前記プロセッサコア間の通信であるチップ内通信と、異なるプロセッサチップに含まれる前記プロセッサコア間の通信であるチップ間通信と、を含み、
　前記決定部は、
　前記所定のプログラムの実行中に、前記複数の領域の各々に含まれる前記一つ以上のプロセッサコアから前記演算量及び前記通信データ量を取得し、
　前記複数の領域の各々に含まれる前記一つ以上のプロセッサコアから取得された前記演算量及び前記通信データ量に基づいて、前記複数の領域の各々の前記電力モードを決定することを特徴とする計算機。
　請求項１１又は請求項１２のいずれかに記載の計算機であって、
　前記複数の領域は、前記チップ内通信のみを行う第１の領域と、前記チップ内通信及び前記チップ間通信を行う第２の領域と、を含み、
　前記決定部は、前記第１の領域に含まれる一つ以上のプロセッサコアの前記演算処理の処理時間及び前記コア間通信処理の通信時間の合計値と、前記第２の領域に含まれる一つ以上のプロセッサコアの前記演算処理の処理時間及び前記コア間通信処理の通信時間の合計値との差が小さくなるように、前記第１の領域及び前記第２の領域の各々の前記電力モードを決定することを特徴とする計算機。
　請求項１３に記載の計算機であって、
　前記決定部は、前記プロセッサコアに接続される前記チップ間通信のパスの数が多い順に、当該プロセッサコアを含む前記第２の領域に供給される前記電圧及び前記周波数が高くなるように前記電力モードを決定することを特徴とする計算機。
　請求項１４に記載の計算機であって、
　前記複数の領域の各々には、前記プロセッサコアに前記電圧を供給する電源、及び前記プロセッサコアに前記周波数を供給するクロックジェネレータが接続され、
　前記調整部は、前記複数の領域の各々に接続される前記電源及び前記クロックジェネレータに接続されることを特徴とする計算機。