JP4868012B2 - コンピュータシステム、コンピュータシステムの制御方法、及びプログラム - Google Patents

コンピュータシステム、コンピュータシステムの制御方法、及びプログラム Download PDF

Info

Publication number
JP4868012B2
JP4868012B2 JP2009054678A JP2009054678A JP4868012B2 JP 4868012 B2 JP4868012 B2 JP 4868012B2 JP 2009054678 A JP2009054678 A JP 2009054678A JP 2009054678 A JP2009054678 A JP 2009054678A JP 4868012 B2 JP4868012 B2 JP 4868012B2
Authority
JP
Japan
Prior art keywords
node
power saving
saving state
cpu
special node
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2009054678A
Other languages
English (en)
Other versions
JP2010211358A (ja
Inventor
康之 那須
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2009054678A priority Critical patent/JP4868012B2/ja
Priority to US12/698,578 priority patent/US8522060B2/en
Publication of JP2010211358A publication Critical patent/JP2010211358A/ja
Application granted granted Critical
Publication of JP4868012B2 publication Critical patent/JP4868012B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/32Means for saving power
    • G06F1/3203Power management, i.e. event-based initiation of a power-saving mode

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Power Sources (AREA)

Description

本発明はコンピュータシステム、制御方法、及びプログラムに関し、特に、複数のノードで構成されるコンピュータシステムにおいて消費電力を低減させる技術に関する。
特許文献1の図1に主記憶共有型マルチプロセッサシステムの構成の一例が示されている。特許文献1のシステムは複数の同じ構成のノードで構成される。ノードは、複数のCPU(Central Processing Unit)とキャッシュモジュールと主記憶モジュールと入出力モジュールとクロスバスイッチモジュール等のモジュールを含み、クロスバスイッチモジュールを介して各ノードが接続される。
また、省電力化志向の高まりにより、コンピュータにおいてハードウェアとソフトウェアの連携による省電力機能が実現されるようになってきている。その機能のひとつに、アイドル状態となったCPUを通常状態から省電力状態に遷移させる機能がある。
特許文献1のようなシステムは複数のCPUで構成されるため、負荷状態に応じてCPUをアイドルとした後省電力状態に遷移させてもシステムの処理を継続することができる。ここでいう省電力状態とは、例えば、CPUに対して電源やクロック信号の供給を停止することにより実現される。
特開2000−348000号公報
特許文献1では、CPU単位で省電力状態へ遷移させて消費電力を低減させているが、ノード単位で省電力状態へ遷移させることは記載されていない。しかし、ノード内に搭載される全てのCPUが省電力状態に遷移した場合、ノード内のCPU以外のモジュールについても、省電力状態に遷移させることで、より大きな省電力効果を得ることができる。
一方で、ノード内のモジュールを省電力状態にした後に、ノードに対してアクセスがあるとノード内のモジュールを通常状態に復旧してアクセスを処理しなければならない。従って、通常状態のノードから省電力状態のノードにアクセスが発生する度に、省電力状態を解除しなければならない。
特許文献1の構成では、各ノードにシステムで共有される主記憶装置や入出力装置が接続されているため、全てのCPUが省電力状態に遷移しても、主記憶装置や入出力装置に対するアクセスが発生するので、ノード単位で省電力状態に遷移させたとしても、ノードの省電力状態が長時間持続しないため消費電力が十分削減できないという課題がある。
本発明の目的は、上述の省電力状態が長時間持続しないため消費電力が十分削減できないという課題を解決したコンピュータシステム、コンピュータシステムの制御方法、及びプログラムを提供することにある。
本発明のコンピュータシステムは、CPUを搭載し互いに接続される複数のノードと、前記ノード間で共有され前記いずれかのノードと接続する主記憶装置及び入出力装置を有するコンピュータシステムであって、
前記主記憶装置および前記入出力装置のいずれとも接続しないノードである特別ノードと、前記特別ノード以外のノードである通常ノードと、消費電力を低減した省電力状態に前記特別ノードを遷移させる電力制御機能を有することを特徴とする。
本発明のコンピュータシステムの制御方法は、CPUを搭載し互いに接続される複数のノードと、前記ノード間で共有され前記いずれかのノードと接続する主記憶装置及び入出力装置を有するコンピュータシステムの制御方法であって、
前記主記憶装置および前記入出力装置のいずれとも接続しないノードである特別ノードに搭載される前記CPUを、消費電力を低減した省電力状態に遷移させるステップと、
前記特別ノードに搭載される前記全てのCPUが省電力状態に遷移しているか否かを確認するステップと、
前記特別ノードに搭載される前記全てのCPUが省電力状態に遷移していた場合に、前記特別ノードを省電力状態に遷移させるステップを有することを特徴とする。
本発明のプログラムは、主記憶装置および入出力装置のいずれとも接続しないノードである特別ノードに搭載されるCPUを、消費電力を低減した省電力状態に遷移させるステップと、
前記特別ノードに搭載される前記全てのCPUが省電力状態に遷移しているか否かを確認するステップと、
前記特別ノードに搭載される前記全てのCPUが省電力状態に遷移していた場合に、前記特別ノードを省電力状態に遷移させるステップをコンピュータに実行させる。
本発明は、ノードの消費電力を低減させる省電力状態を長時間持続させ消費電力を十分削減できるという効果がある。
本発明の第1の実施の形態の構成を示したブロック図である。 本発明の第2の実施の形態の構成を示したブロック図である。 本発明の制御回路25の構成を示したブロック図である。 本発明の状態表26の内容を示したブロック図である。 本発明の省電力状態への遷移動作を示したフローチャートである。 本発明の省電力状態からの復旧動作を示したフローチャートである。 本発明の第3の実施の形態の1つの構成を示したブロック図である。 本発明の第3の実施の形態の1つの構成を示したブロック図である。
次に、本発明の第1の実施の形態について図面を参照して詳細に説明する。
図1は本発明のコンピュータシステム10の基本的な構成を示した図である。コンピュータシステム10は、通常ノード20と特別ノード30と主記憶装置41と入出力装置42と電力制御機能43を有する。なお、図1では1つの通常ノード20と1つの特別ノード30を接続する構成を示しているが、通常ノード20と特別ノード30は2つ以上接続されてもよく、接続数は制限されない。
通常ノード20と特別ノード30はそれぞれCPU21を搭載し、互いに接続される。主記憶装置41と入出力装置42は通常ノード20に接続され、通常ノード20と特別ノード30とで共有される。特別ノード30は主記憶装置41と入出力装置42と接続されない。入出力装置42は通常様々な種類の入出力装置で構成される。主記憶装置41も複数の主記憶装置で構成されることがある。
図1の構成では、通常ノード20は主記憶装置41と入出力装置42の両方が接続されるが、通常ノード20はどちらか一方のみを接続する構成であっても、コンピュータシステム10全体で主記憶装置41と入出力装置42がそれぞれ1つ以上接続されればよい。
このような構成において、電力制御機能43は消費電力を低減した省電力状態に特別ノード30を遷移させる。特別ノード30は、主記憶装置41とも入出力装置42とも接続されないため、省電力状態に遷移した特別ノード30に対し通常のアクセスは発生しない。通常のアクセスとはノード省電力状態の解除指示のようなアクセスを除くアクセスである。従って、本発明は、特別ノード30の消費電力を低減する省電力状態を長時間持続させ消費電力を十分削減できるという効果がある。
また、省電力状態からの復旧には長時間を要する。従って、省電力状態のノードへアクセスするとその応答時間が著しく大きくなり性能が低下してしまう。ところが、本発明は、通常ノード20を省電力状態とはしないため、通常ノード20へのアクセスに対して復旧による応答時間の遅れが発生することを回避できる。特別ノード30は通常のアクセスが発生しないので応答時間の遅れも発生せず、本発明は性能低下を回避することもできる。
次に、本発明の第2の実施の形態について図面を参照して詳細に説明する。
図2は本発明のコンピュータシステム11の構成を示した図である。コンピュータシステム11は図1のコンピュータシステム10のより具体的な構成を示している。コンピュータシステム11は、主記憶装置41と入出力装置42が接続されている通常ノード20と、主記憶装置41も入出力装置42も接続されない特別ノード30を含む。なお、図1のコンピュータシステム10と同じものは同じ符号を付している。
主記憶装置41と入出力装置42はコンピュータシステム11の共有資源であり、全てのノード(図2では通常ノード20と特別ノード30)で共有される。図2のコンピュータシステム11は、通常ノード20と特別ノード30の2つのノードで構成されるが、ノード数に制限はなく、通常ノード20や特別ノード30を任意に追加して構成することが可能である。
通常ノード20は、2つのCPU(Central Processing Unit)21−1(CPU21−1AとCPU21−1B)と、キャッシュメモリ22−1と、主記憶装置41との間のインターフェースを制御する主記憶制御部24−1と、キャッシュメモリ22−1と主記憶制御部24−1と入出力装置42と他のノード(この場合特別ノード30のみ)との接続を切り換えるクロスバスイッチ23−1を含む。通常ノード20は、主記憶装置41と入出力装置42と接続する。
特別ノード30は、2つのCPU21−3(図1ではCPU21−3AとCPU21−3B)と、キャッシュメモリ22−3と、キャッシュメモリ22−3と他のノード(この場合通常ノード20のみ)との接続を切り換えるクロスバスイッチ23−3と、ノードへの電源供給やリセットを制御する制御回路25−3を含む。特別ノード30は、主記憶装置41とも入出力装置42とも接続しない。
CPU21−1とCPU21−3は機能・構成が同じため同じ符号“21”を付している。CPU21−1とCPU21−3を区別せずに説明する場合は“CPU21”と記載する。キャッシュメモリ22、クロスバスイッチ23、主記憶制御部24等も同様である。また、CPU21−1AとCPU21−1Bを区別せずに説明する場合は“CPU21−1”と記載する。CPU21−3も同様である。また、通常ノード20と特別ノード30を区別せずに説明する場合は“ノード”と記載する。
CPU21は、主記憶装置41に記憶されるプログラムを実行するプロセッサである。CPU21−1A、CPU21−1B、CPU21−3A、CPU21−3Bは全て同じ仕様であるとする。ただし、異なる仕様のCPUを組み合わせて構成してもよい。CPU21−1は、キャッシュメモリ22−1とクロスバスイッチ23−1と主記憶制御部24−1を介して主記憶装置41にアクセスする。また、CPU21−1は、キャッシュメモリ22−1とクロスバスイッチ23−1を介して、入出力装置42や特別ノード30にアクセスする。なお、アクセス内容によってはキャッシュメモリ22はバイパスされることもある。
一方、CPU21−3は、キャッシュメモリ22−3とクロスバスイッチ23−3とクロスバスイッチ23−1と主記憶制御部24−1を介して主記憶装置41にアクセスする。また、CPU21−1は、キャッシュメモリ22−3とクロスバスイッチ23−3とクロスバスイッチ23−1を介して、入出力装置42や特別ノード30にアクセスする。
キャッシュメモリ22は、主記憶装置41のデータを一時的に記憶するキャッシュメモリであり、CPU21に1次キャッシュが搭載される場合は2次キャッシュとして機能する。通常、キャッシュメモリ22は主記憶装置41より高速にアクセスできるように高速のRAM(Random Access Memory)を用いて実現される。また、特別ノード30は、主記憶装置41までのアクセスが通常ノード20に比べて遅くなるが、キャッシュメモリ22−3を設けることにより、遅れを改善している。
クロスバスイッチ23は、接続を切り換える回路であり、1回の切換により1つの予め決められた転送単位を転送することができる。ここで転送単位は固定長でも可変長でも良く、通信で用いられるパケットのような形式でも良い。例えば、クロスバスイッチ23−1はキャッシュメモリ22−1と主記憶制御部24−1を接続するように切り換えることで、CPU21−1A(又はCPU21−1B)から主記憶装置41へのアクセスを可能とする。クロスバスイッチ23−1は、キャッシュメモリ22−1とクロスバスイッチ23−3とを接続するように切り換えることで、CPU21−1A(又はCPU21−1B)から特別ノード30へのアクセスを可能とする。
また、クロスバスイッチ23は、特別ノード30が省電力状態のときでも、電源やクロック信号の供給を受けて動作可能な復旧回路(図示せず)を搭載している。復旧回路は、他のノードから省電力状態への遷移指示や省電力状態からの復旧指示を受信して解読し、制御回路25へ指示を送る。この復旧回路と制御回路25を合わせた機能がコンピュータシステム10(図1)の電力制御機能43に相当する。
主記憶制御部24はクロスバスイッチ23と主記憶装置41と接続し、主記憶装置41との間のインターフェースを制御する。
制御回路25は特別ノード30のみに搭載される。制御回路25は特別ノード30が省電力状態のときでも、電源やクロック信号の供給を受けて、クロスバスイッチ23から出力される指令信号Xn(n=2、3、4)に従ってノードに供給する電源のオン/オフを制御する。
図3は制御回路25の構成を示したブロック図である。図3を参照すると、制御回路25は指令信号Xnを解読する解読回路43とスイッチ44を含む。スイッチ44は解読回路43の指示に従ってノードへ電源を供給するか停止するかを切り換える。図2では、制御回路25は、ノード上に独立して搭載しているが、クロスバスイッチ23の内部に搭載したり、CPU21の内部に搭載したり、それ以外に搭載するようにしてもよい。
主記憶装置41は、プログラムやプログラムでアクセスされるデータや各種制御情報を記憶する装置であり、通常、DRAM(Dynamic Random access Memory)のような揮発性の半導体デバイスで構成される。図2では主記憶装置41は1つのみ接続されるが、接続数を限定するものではなく、複数接続する構成でもかまわない。
状態表26は、コンピュータシステム11内の各要素(CPU21とノード)が通常状態か省電力状態かを示すテーブルである。図4に状態表26の内容の一例が示されているが、詳細は以降の動作説明で記載する。状態表26は、主記憶装置41上に設けられるものとして説明するが、状態表26は、CPU21からアクセスできれば、主記憶装置41以外の記憶手段に設けるようにしてもよい。
入出力装置42は、磁気ディスク装置等の補助記憶装置や、キーボードやマウスなどの入力装置や、印刷装置のような出力装置や、表示装置や、システム外部との通信を行う通信装置などの入出力装置を含んだ入出力サブシステムである。通常、入出力サブシステムは入出力装置毎に制御するための制御装置を含み、制御装置を介してクロスバスイッチ23と接続するが、制御装置を通常ノード20に搭載するようにしてもよい。
CPU21は、省電力機能を含んでおり、省電力機能によって消費電力を低減する状態である省電力状態を実現する。また、CPU21は、外部からの指示に従って通常状態と省電力状態との間を遷移する。省電力機能とは、例えば、いずれかのCPU21の指示により、省電力機能を実行する一部の回路を除いたほとんどの回路に対して、電源やクロックの供給を停止する機能や、通常状態と省電力状態の間の状態遷移を制御する機能である。
CPU21−1Aのみが省電力状態に遷移した状態を個別省電力状態といい、このときノードは通常状態である。ノード全体が省電力状態に遷移した状態をノード省電力状態という。ノード省電力状態とは、例えば、ノードへの電源供給を停止させた状態であるが状態の具体的な内容を限定するものではない。ただし、以降、ノード省電力状態とは、ノードへの電源供給を停止させた状態として説明する。
サービスプロセッサや診断プロセッサと呼ばれ、システムの立ち上げや保守診断を制御する診断制御装置が知られている。診断制御装置は、通常備えるシステム立ち上げ機能の中に、装置や部品単位に電源供給を制御する電源制御機能やリセット機能などを備える。従って診断制御装置を備えるコンピュータシステムでは診断制御装置を電力制御機能43として使用することもできる。本発明では、電力制御機能43をどのように構成するかは限定しない。
次に、本発明の第2の実施の形態の動作について図面を参照して説明する。
CPU21を省電力状態に遷移させるのは、OS(Operating System)のようにプロセスをCPU21に割り当てる機能を有するソフトウェアである。プロセスとはプログラムを実行する際の処理単位である。また、仮想計算機システムでは仮想計算機をCPU21に割り当てる機能を有する仮想計算機モニタがCPU21を省電力状態に遷移させる。通常、OSや仮想計算機モニタ自身も複数のプロセスで構成される。OSや仮想計算機モニタの中で、プロセスや仮想計算機の割り当てを制御する部分を割り当て制御部とし、割り当て制御部がCPU21−1A上で動作するものとして、以降説明する。
割り当て制御部はプロセスをCPU21に割り当てる際に、特別ノード30のCPU21−3より通常ノード20上のCPU21−1へ優先してより多くのプロセスを割り当てるようにする。すなわち、割り当て制御部は通常ノード20のCPU21−1で動作するプロセス数に比べて、特別ノード30のCPU21−3で動作するプロセス数が少なくなるように割り当てる。
コンピュータシステム11全体で動作するプロセス数が少なくなると、処理すべきプロセス数が“0”(アイドル状態という)となるCPU21が発生する。この状態でCPU21を省電力状態へ遷移させることにより、コンピュータシステム11は消費電力を大幅に低減することができる。なお、割り当て制御部やアイドル状態で動作する一部のプログラムはプロセス数としてはカウントしない。
割り当て制御部は通常ノード20のCPU21−1で動作するプロセス数に比べて、特別ノード30のCPU21−3で動作するプロセス数が少なくなるように割り当てる。このように割り当てることにより、割り当て制御部は特別ノード30上のCPU21−3の方を通常ノード20上のCPU21−1より先にアイドル状態にすることができる。
次に、省電力状態への遷移動作について詳細に説明する。図5はCPU21、特別ノード30を省電力状態へ遷移させる動作を示したフローチャートである。
割り当て制御部は、例えば、プロセスが1つ終了したことを契機に、特別ノード30内に省電力状態へ遷移可能なCPU21があるか否か調べる(S51)。ただし、ステップ51の実行を開始する契機はプロセス終了以外の契機でもよい。例えば、割り当て制御部は一定時間毎に図5の動作を実行するようにしてもよい。
割り当て制御部は、CPU21がアイドル状態なら遷移可能と判断する。CPU21−3AかCPU21−3Bの少なくとも一方がアイドル状態であれば、割り当て制御部は省電力状態へ遷移可能なCPU21があると判断する。なお、割り当て制御部は一定時間毎にステップ51の実行を開始するようにしてもよい。
特別ノード30内に省電力状態へ遷移可能なCPU21−3があった場合(S51/Yes)、割り当て制御部は特別ノード30内の遷移可能なCPU21−3に対して省電力状態への遷移指示を送る(S52)。このとき、割り当て制御部は省電力状態へ遷移したCPU21−3の状態を通常状態から省電力状態へ変更するように状態表26を更新する。
割り当て制御部がCPU21−1Aから省電力状態への遷移指示を送ると、キャッシュメモリ22−1、クロスバスイッチ23−1、クロスバスイッチ23−3、キャッシュメモリ22−3を介してCPU21−3Aへ到着する。CPU21−3Aは省電力状態への遷移指示を受信し、内蔵する省電力機能を起動して通常状態から省電力状態へ遷移する。この場合、アクセス内容は遷移指示なので、実際には、キャッシュメモリ22−1とキャッシュメモリ22−3はバイパスされる。
次に、割り当て制御部は特別ノード30内の全てのCPU21−3が省電力状態となったか否かを確認する(S53)。特別ノード30内の全てのCPU21−3が省電力状態となっていなければ(S53/No)、割り当て制御部は図5の処理を終了し、元に戻る。特別ノード30内の全てのCPU21−3が省電力状態となっていれば(S53/Yes)、割り当て制御部は特別ノード30に対しノード省電力状態への遷移指示を送る(S54)。
このとき、割り当て制御部はノード省電力状態へ遷移した特別ノード30の状態を通常状態からノード省電力状態へ変更するように状態表26を更新する。また、割り当て制御部は特別ノード30内の全てのCPU21−3が省電力状態となったか否かを、状態表26を参照することにより判断する。
ノード省電力状態への遷移指示は、CPU21−1A上の割り当て制御部から特別ノード30宛に出力される。キャッシュメモリ22−1、クロスバスイッチ23−1を介して、クロスバスイッチ23−3はノード省電力状態への遷移指示を受信する。この場合、アクセス内容が遷移指示なので、実際には、キャッシュメモリ22−1はバイパスされる。
クロスバスイッチ23−3に搭載される復旧回路は、受信した転送単位がノード省電力状態への遷移指示であることを解読すると、制御回路25−3に対して電源の供給を停止するように指示する。制御回路25−3の解読回路43は、電源供給停止指示を受けると、スイッチ44を制御して、特別ノード30へ供給される電源を全て停止する。
このようにして、特別ノード30への電源供給が停止され、特別ノード30はCPU21−3だけでなく、キャッシュメモリ22−3やクロスバスイッチ23−3の電源も停止するので、より大きな消費電力の低減ができる。
一方、特別ノード30内に省電力状態へ遷移可能なCPU21−3がなかった場合(S51/No)、割り当て制御部は通常ノード20内に省電力状態へ遷移可能なCPU21があるか否か調べる(S55)。通常ノード20内に省電力状態へ遷移可能なCPU21がない場合(S55/No)、割り当て制御部は図5の処理を終了し、元に戻る。
通常ノード20内に省電力状態へ遷移可能なCPU21−1があった場合(S55/Yes)、割り当て制御部は通常ノード20内の遷移可能なCPU21−1に対して省電力状態への遷移を指示する(S56)。このとき、割り当て制御部は省電力状態へ遷移したCPU21−1の状態を通常状態から省電力状態へ変更するように状態表26を更新する。
例えば、CPU21−1Bがアイドル状態になったとすると、割り当て制御部は省電力状態への遷移指示をCPU21−1B宛に送信する。CPU21−1Bは、省電力状態への遷移指示を受信し、内蔵する省電力機能を起動して通常状態から省電力状態へ遷移する。
割り当て制御部は、通常ノード20については、ノード省電力状態への遷移を実行しないので、ステップS53、S54に相当する動作は実行しない。その理由は、通常ノード20は、主記憶装置41や入出力装置42が接続されるため、他のノードからのアクセスが頻繁に発生しノード省電力状態が長時間継続しないためである。
ただし、例えば、通常ノード20が複数接続される場合で、通常ノードに接続される主記憶装置41や入出力装置42の動作を停止して特別ノード30と同様な状態にできれば、その通常ノード20をノード省電力状態とすることもできる。それは、特別ノード30と同様にステップS53、S54に相当する動作を実行することで容易に実現できる。
次に、省電力状態への遷移動作について具体例を用いて説明する。CPU21−3AとCPU21−3Bが順にアイドル状態となり、特別ノード30がノード省電力状態となる動作を具体例として説明する。なお、最初の状態は図4−(a)に示した状態表26の状態とする。すなわち、全てのCPU21とノードが通常状態である。
CPU21−3A上で動作するプロセスが終了して、CPU21−3Aがアイドル状態となると、割り当て制御部はCPU21−3Aを省電力状態へ遷移可能なCPU21と判断し(S51/Yes)、CPU21−3Aに対して省電力状態への遷移を指示する(S52)。CPU21−3Aは省電力状態への遷移指示を受けて、自身を省電力状態へと遷移させる。
このとき、割り当て制御部はCPU21−3Aの状態を通常状態から省電力状態へ変更するように状態表26を更新する。この結果、状態表26の内容は図4−(b)となる。CPU21−3Bは通常状態なので、割り当て制御部は全てのCPU21が省電力状態ではないと判断し(S53/No)、図5の処理を終了する。
この後、さらに、プロセス数が減りCPU21−3Bがアイドル状態となると、割り当て制御部はCPU21−3Bを省電力状態へ遷移可能なCPU21と判断し(S51/Yes)、CPU21−3Bに対して省電力状態への遷移を指示する(S52)。CPU21−3Bは省電力状態への遷移指示を受けて、自身を省電力状態へと遷移させる。
このとき、割り当て制御部はCPU21−3Bの状態を通常状態から省電力状態へ変更するように状態表26を更新する。この結果、状態表26の内容は図4−(c)となる。この状態では、CPU21−3AもCPU21−3Bも省電力状態なので、割り当て制御部は全てのCPU21が省電力状態になったと判断する(S53/Yes)。
続いて、割り当て制御部は特別ノード30に対しノード省電力状態への遷移を指示する(S54)。特別ノード30上のクロスバスイッチ23−3はノード省電力状態への遷移指示を受信する。クロスバスイッチ23−3に搭載される復旧回路が遷移指示を解読し、制御回路25−3に対して電源の供給を停止する指示を指令信号X3で通知する。制御回路25−3は指令信号X3により電源供給停止指示を受けると、スイッチ44を制御して、特別ノード30へ供給される電源を全て停止する。
このとき、割り当て制御部は特別ノード30の状態を通常状態からノード省電力状態へ変更するように状態表26を更新する。この結果、状態表26は図4−(d)となる。このようにして、特別ノード30が、ノード省電力状態へ遷移し、特別ノード30の消費電力は大幅に低減される。
なお、ノード省電力状態として、ノード上の各要素の電源をオフした状態を例として説明した。しかし、ノード省電力状態として電源をオンのままで、電圧を下げた状態とかクロック信号を停止した状態とすることもできる。その場合、制御回路25は、電源をオフするスイッチ44を、各要素に供給する電圧を制御したり、各要素に供給するクロックを停止したりする回路に置き換えることにより実現できる。
次に、省電力状態から通常状態への復旧動作について簡単に説明する。コンピュータシステム11でプロセス数が増加し、予め決められた条件を満足すると、割り当て制御部はCPU21の省電力状態の解除条件が成立したと判断する(S61)。予め決められた条件とは例えば、省電力状態のCPU21が少なくとも1つ有り、かつ、通常状態のCPU21の負荷が所定値を越えたという条件である。すなわち、省電力状態のCPU21を通常状態に復旧させないとプロセスの処理が遅延したり遅延が予測されたりする場合に省電力状態の解除条件が成立するものとする。なお、省電力状態の解除条件は上記のケースに限定するものではなく、他の条件としてもよい。
省電力状態の解除条件が成立すると(S61/Yes)、割り当て制御部は予め決められた手順により通常状態に復旧させるCPU21を決定する(S62)。この手順は詳細には限定しないが、通常ノード20のCPU21を特別ノード30のCPU21より優先して解除し、通常状態の特別ノード30のCPU21をノード省電力状態の特別ノード30のCPU21より優先して解除するものとする。
割り当て制御部は状態表26を参照して、復旧させるCPU21が搭載されるノードがノード省電力状態か否か調べる(S63)。復旧させるCPU21が搭載されるノードがノード省電力状態であれば(S63/Yes)、割り当て制御部は復旧させるCPU21が搭載されるノードに対してノード省電力状態の解除指示を送る(S64)。
ノード省電力状態の解除指示を受けると、クロスバスイッチ23−3に搭載される復旧回路は解除指示を解読して、復旧指示を指令信号X3にて制御回路25に通知する。制御回路25は、指令信号X3により通知された復旧指示を解読回路で解読しスイッチ44を制御して電源の供給を再開し、リセット信号を出力してノードを通常状態にする。
このとき、CPU21は自身の状態が通常状態か省電力状態かを省電力機能内部の不揮発性の記憶手段に記憶しており、電源の供給を受けリセット信号を受けると電源停止前の状態に復旧する。CPU21に不揮発性の記憶手段がない場合、制御回路25は、例えば、状態を記憶する回路に対してだけ、ノード省電力状態でも電源を供給しておくようにしてもよい。CPU21の状態を制御回路25のようなCPU21の外部の回路に記憶しておき、復旧時に元の状態をCPU21に通知するようにすることもできる。
次に、割り当て制御部はノード省電力状態の解除の完了を確認した後(S65/Yes)、復旧させるCPU21に対して省電力状態の解除指示を送る(S66)。CPU21は省電力状態の解除指示を受信すると、内蔵する省電力機能を動作させて、自身を通常状態へと復旧させる。
また、復旧させるCPU21が搭載されるノードがノード省電力状態でなければ(S63/No)、復旧させるCPU21に対して省電力状態の解除指示を送る(S66)。CPU21は省電力状態の解除指示を受信すると、内蔵する省電力機能を動作させて、自身を通常状態へと復旧させる。
このようにして、CPU21が通常状態へと復旧するので、その後割り当て制御部は復旧したCPU21に対してプロセスを割り当てることができる。割り当て制御部は新たに生成されたプロセスを復旧したCPU21に割り当てることにより、負荷の高いCPU21の負荷を軽減することができる。
このように、本発明の特別ノード30は、主記憶装置41と入出力装置42を接続しないため、ノード省電力状態の特別ノード30に対する通常のアクセスは発生しない。従って、本発明は、特別ノード30のノード省電力状態を長時間持続できるという効果がある。
また、省電力状態からの復旧には長時間を要する。従って、ノード省電力状態のノードへアクセスするとその応答時間が著しく大きくなり性能が低下してしまう。ところが、本発明は、通常ノード20を省電力状態とはしないため、通常ノード20へのアクセスに対して復旧による応答時間の遅れが発生することを回避できる。特別ノード30は通常のアクセスが発生しないので応答時間の遅れも発生せず、本発明は性能低下を回避することもできる。
次に、本発明の第3の実施の形態について説明する。図7は第3の実施の形態の一例であるコンピュータシステム12の構成を示した図である。コンピュータシステム11と同じ機能の要素については同じ符号を付している。以降は、コンピュータシステム11との差分について説明する。
コンピュータシステム12は、コンピュータシステム11に対して、通常ノード20を通常ノード21に置き換え、特別ノード30を特別ノード31に置き換えている。コンピュータシステム12は通常ノード21と特別ノード31の内部構成が共通化されている点に特長がある。
通常ノード21は、通常ノード20と比べて、制御回路25−2が追加されているが、他の構成要素は同じなので説明は省略する。制御回路25−2は制御回路25−3と同じである。通常ノード21は制御回路25−2を備えるが、ノード省電力状態への遷移は指示されないので、通常ノード20と同様に動作する。ノード省電力状態への遷移を抑止するように設定しておいてもよい。
特別ノード31は特別ノード30に主記憶制御部24−4が追加されているが、他の構成要素は同じであるので説明は省略する。特別ノード31は主記憶制御部24−4を備えるが主記憶装置41とは接続しないため主記憶制御部24−4は動作しないので、特別ノード30と同様に動作する。
通常ノード21は通常ノード20と同様に動作し、特別ノード31は特別ノード30と同様に動作するので、コンピュータシステム12はコンピュータシステム11と同様に動作する。従って動作説明は省略する。
本発明の第3の実施の形態のコンピュータシステム12は、通常ノード21と特別ノード31のハードウェアを共通化したので、保守部品を共通化することができ、保守コストを低減できるという効果がある。
なお、特別ノード31と通常ノード21の共通ハードウェアに切り換え手段を設けて、特別ノード31として利用する場合は主記憶制御部24−4への電源供給を停止させ、通常ノード21として利用する場合は制御回路25−2への電源供給を停止させることもできる。そうすることによりさらに消費電力を削減できる。
また、図8に、通常ノード20と通常ノード21と特別ノード30と特別ノード31を混在させたコンピュータシステム13を示す。これらを混在させても、動作はコンピュータシステム11と同じであることは容易に理解できるので、説明は省略する。コンピュータシステム13は、通常ノードが2つ搭載されるので、例えば、通常ノード21に接続する主記憶装置41−2と入出力装置42−2を論理的に切り離して、通常ノード21を特別ノード31と置き換えて制御することもできる。
このように、第3の実施の形態においても、本発明は、第2の実施の形態と同様の効果を得られることは明らかである。また、特別ノード31と通常ノード20を共通部品とすることにより、保守コストを低減できるという効果もある。
また、上記の説明では、ステップS51〜S55、S61〜S66の動作を全て割り当て制御部というプログラムで実行するものとしたが、一部をハードウェア回路で実現してもかまわない。例えば、各ノード内に搭載される各CPU21の状態を監視して、搭載される全てのCPU21が省電力状態になったら、ノード省電力状態に遷移させる回路(自動遷移回路という)により、実現できる。自動遷移回路は、例えば、制御回路51やCPU21の1つに搭載することもできる。この場合、CPU21の状態はCPU21の省電力機能により取得できるものとする。
また、第3の実施例のように、通常ノード20と特別ノード30の内部を共通化した場合は、上記自動遷移回路を有効にするか否かを切り換える手段を設けることにより、共通ハードウェアを通常ノード20と特別ノード30のいずれとしても使用できる。共通ハードウェアの切り換え手段は、ハードウェアのスイッチを利用してもよいし、BIOS(Basic Input Output System)の指示により切り換えるようにしてもよい。
10 コンピュータシステム
11 コンピュータシステム
12 コンピュータシステム
13 コンピュータシステム
20 通常ノード
21 CPU
22 キャッシュメモリ
23 クロスバスイッチ
24 主記憶制御部
25 制御回路
26 状態表
30 特別ノード
31 特別ノード
41 主記憶装置
42 入出力装置
43 解読回路
44 スイッチ

Claims (12)

  1. CPUを搭載し互いに接続される複数のノードと、前記ノード間で共有され前記いずれかのノードと接続する主記憶装置及び入出力装置を有するコンピュータシステムであって、
    前記主記憶装置および前記入出力装置のいずれとも接続しないノードである特別ノードと、前記特別ノード以外のノードである通常ノードと、消費電力を低減した省電力状態に前記特別ノードを遷移させる電力制御機能を有することを特徴とするコンピュータシステム。
  2. 前記特別ノードに搭載される前記CPUを省電力状態に遷移させた後に、前記特別ノードに搭載される前記全てのCPUが省電力状態に遷移していた場合に、前記特別ノードを省電力状態に遷移させることを特徴とする請求項1のコンピュータシステム。
  3. 前記通常ノードに搭載されたCPUの1つであるマスタCPU上で動作する制御ソフトウェアが、前記CPUと前記特別ノードの状態遷移を制御し、前記特別ノードに搭載されるCPUが前記通常ノードに搭載されるCPUより先行して省電力状態に遷移させるようにプロセスを割り当てることを特徴とする請求項2のコンピュータシステム。
  4. 前記特別ノードに搭載される前記CPUを省電力状態から通常状態に復旧させる際に、前記特別ノードが省電力状態であった場合、前記特別ノードを省電力状態から通常状態に復旧させた後に前記CPUを省電力状態から通常状態に復旧させることを特徴とする請求項3のコンピュータシステム。
  5. 前記特別ノードは前記電力制御機能を備え、前記通常ノードは前記電力制御機能を備えないことを特徴とする請求項1乃至4のいずれかのコンピュータシステム。
  6. 前記通常ノードは、前記CPUと接続し前記主記憶装置のデータを一時的に記憶するキャッシュメモリと、前記主記憶装置との間のインターフェースを制御する主記憶制御部と、前記キャッシュメモリと前記主記憶制御部と他の前記ノードとの間の接続を切り換えるクロスバスイッチを有し、前記主記憶装置と前記入出力装置と接続し、
    前記特別ノードは、前記CPUと接続し前記主記憶装置のデータを一時的に記憶するキャッシュメモリと、前記キャッシュメモリと他の前記ノードとの間の接続を切り換えるクロスバスイッチを有することを特徴とする請求項1乃至5のいずれかのコンピュータシステム。
  7. CPUを搭載し互いに接続される複数のノードと、前記ノード間で共有され前記いずれかのノードと接続する主記憶装置及び入出力装置を有するコンピュータシステムの制御方法であって、
    前記主記憶装置および前記入出力装置のいずれとも接続しないノードである特別ノードに搭載される前記CPUを、消費電力を低減した省電力状態に遷移させるステップと、
    前記特別ノードに搭載される前記全てのCPUが省電力状態に遷移しているか否かを確認するステップと、
    前記特別ノードに搭載される前記全てのCPUが省電力状態に遷移していた場合に、前記特別ノードを省電力状態に遷移させるステップを有することを特徴とするコンピュータシステムの制御方法。
  8. 前記特別ノードに搭載されるCPUを、前記特別ノード以外のノードである通常ノードに搭載されるCPUより先行して省電力状態に遷移させるようにプロセスを割り当てることを特徴とする請求項7のコンピュータシステムの制御方法。
  9. 前記特別ノードに搭載される前記CPUを省電力状態から通常状態に復旧させる際に、前記特別ノードが省電力状態か否か確認するステップと、
    前記特別ノードが省電力状態であった場合、前記特別ノードを省電力状態から通常状態に復旧させるステップと、前記特別ノードが通常状態に復旧した後に前記CPUを省電力状態から通常状態に復旧させるステップを有することを特徴とする請求項8のコンピュータシステムの制御方法。
  10. 主記憶装置および入出力装置のいずれとも接続しないノードである特別ノードに搭載されるCPUを、消費電力を低減した省電力状態に遷移させるステップと、
    前記特別ノードに搭載される前記全てのCPUが省電力状態に遷移しているか否かを確認するステップと、
    前記特別ノードに搭載される前記全てのCPUが省電力状態に遷移していた場合に、前記特別ノードを省電力状態に遷移させるステップをコンピュータに実行させるプログラム。
  11. 前記特別ノードに搭載されるCPUを、前記特別ノード以外のノードである通常ノードに搭載されるCPUより先行して省電力状態に遷移させるようにプロセスを割り当てるステップを有することを特徴とする請求項10のプログラム。
  12. 前記特別ノードに搭載される前記CPUを省電力状態から通常状態に復旧させる際に、前記特別ノードが省電力状態か否か確認するステップと、
    前記特別ノードが省電力状態であった場合、前記特別ノードを省電力状態から通常状態に復旧させるステップと、
    前記特別ノードが通常状態に復旧した後に前記CPUを省電力状態から通常状態に復旧させるステップを有することを特徴とする請求項11のプログラム。
JP2009054678A 2009-03-09 2009-03-09 コンピュータシステム、コンピュータシステムの制御方法、及びプログラム Expired - Fee Related JP4868012B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2009054678A JP4868012B2 (ja) 2009-03-09 2009-03-09 コンピュータシステム、コンピュータシステムの制御方法、及びプログラム
US12/698,578 US8522060B2 (en) 2009-03-09 2010-02-02 Computer system, method for controlling the same, and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009054678A JP4868012B2 (ja) 2009-03-09 2009-03-09 コンピュータシステム、コンピュータシステムの制御方法、及びプログラム

Publications (2)

Publication Number Publication Date
JP2010211358A JP2010211358A (ja) 2010-09-24
JP4868012B2 true JP4868012B2 (ja) 2012-02-01

Family

ID=42679297

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009054678A Expired - Fee Related JP4868012B2 (ja) 2009-03-09 2009-03-09 コンピュータシステム、コンピュータシステムの制御方法、及びプログラム

Country Status (2)

Country Link
US (1) US8522060B2 (ja)
JP (1) JP4868012B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102013105097A1 (de) * 2013-05-17 2014-11-20 Wago Verwaltungsgesellschaft Mbh Steuerungseinrichtung und Verfahren zum Umschalten von Ein-/Ausgabeeinheiten einer Steuerungseinrichtung
JP2018118477A (ja) * 2017-01-26 2018-08-02 キヤノン株式会社 画像処理装置とその制御方法、及びプログラム
JP2019047425A (ja) 2017-09-06 2019-03-22 キヤノン株式会社 画像処理装置及びその制御方法、並びにプログラム

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0991254A (ja) * 1995-09-20 1997-04-04 Nec Corp 消費電力低減制御システム及びその方法
JPH10283082A (ja) * 1997-04-04 1998-10-23 Nec Corp マルチプロセッサのスリープ制御方式
JP3721283B2 (ja) * 1999-06-03 2005-11-30 株式会社日立製作所 主記憶共有型マルチプロセッサシステム
JP2002197047A (ja) * 2000-10-31 2002-07-12 Hewlett Packard Co <Hp> 入力/出力読出しデータがプロセッサローカルキャッシュに直接配置されるコンピュータシステム
JP4196333B2 (ja) * 2003-05-27 2008-12-17 日本電気株式会社 並列処理システム及び並列処理プログラム
JP3843116B2 (ja) * 2005-05-26 2006-11-08 株式会社日立製作所 ネットワーク
US7568115B2 (en) * 2005-09-28 2009-07-28 Intel Corporation Power delivery and power management of many-core processors
JP4833734B2 (ja) 2006-05-19 2011-12-07 株式会社日立製作所 データベースシステム、ストレージ装置、初期コピー方法及びログ適用方法
JP4800837B2 (ja) * 2006-05-22 2011-10-26 株式会社日立製作所 計算機システム、その消費電力低減方法、及びそのプログラム
JP4370336B2 (ja) * 2007-03-09 2009-11-25 株式会社日立製作所 低消費電力ジョブ管理方法及び計算機システム
JP2009026135A (ja) * 2007-07-20 2009-02-05 Nec Electronics Corp マルチプロセッサ装置
KR101459140B1 (ko) * 2007-12-26 2014-11-07 엘지전자 주식회사 전원관리 제어 장치 및 방법
JP2009289193A (ja) * 2008-05-30 2009-12-10 Toshiba Corp 情報処理装置
US8051309B2 (en) * 2008-08-29 2011-11-01 Hewlett-Packard Development Company, L.P. Method and apparatus to combine power and control signals in a mobile computing device
US7930519B2 (en) * 2008-12-17 2011-04-19 Advanced Micro Devices, Inc. Processor with coprocessor interfacing functional unit for forwarding result from coprocessor to retirement unit

Also Published As

Publication number Publication date
JP2010211358A (ja) 2010-09-24
US20100229010A1 (en) 2010-09-09
US8522060B2 (en) 2013-08-27

Similar Documents

Publication Publication Date Title
JP4938080B2 (ja) マルチプロセッサ制御装置、マルチプロセッサ制御方法及びマルチプロセッサ制御回路
JP5405320B2 (ja) 仮想計算機制御装置、仮想計算機制御方法及び仮想計算機制御プログラム
US8935510B2 (en) System structuring method in multiprocessor system and switching execution environment by separating from or rejoining the primary execution environment
WO2016165304A1 (zh) 一种实例节点管理的方法及管理设备
US20060085794A1 (en) Information processing system, information processing method, and program
US9195553B2 (en) Redundant system control method
WO2019160030A1 (ja) サービス提供システム、資源割り当て方法、及び資源割り当てプログラム
WO2009150815A1 (ja) マルチプロセッサシステム
US8381003B2 (en) Memory relocation in computer for power saving
JP6694138B2 (ja) プログラマブルロジックデバイスの制御プログラム、制御方法及び情報処理装置
WO2009092322A1 (zh) 一种多处理器系统故障恢复的方法及装置
JP4927784B2 (ja) ネットワーク中継装置およびネットワーク中継システム
JP2011164971A (ja) Biosとbmcとの間の通信パス強化方法、その装置及びそのプログラム
CN110874261A (zh) 可用性系统、方法和存储有程序的存储介质
JP2004272899A (ja) コンピュータシステムにおけるリセット方法
JP4868012B2 (ja) コンピュータシステム、コンピュータシステムの制御方法、及びプログラム
JP2007304845A (ja) 仮想計算機システムおよびソフトウェア更新方法
US20130254446A1 (en) Memory Management Method and Device for Distributed Computer System
JP2009069963A (ja) マルチプロセッサシステム
CN107861763A (zh) 一种面向飞腾处理器休眠过程的中断路由环境恢复方法
JP4985512B2 (ja) 分散共有メモリ型マルチプロセッサシステム及びマルチプロセッサシステムにおける負荷分散方法
JP5783348B2 (ja) 制御装置、制御プログラム、画像形成装置
JP6074932B2 (ja) 演算処理装置及び演算処理方法
JP2017016219A (ja) 電子機器および給電制御プログラム
JP2008165318A (ja) 計算機システム

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110113

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110125

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20110705

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20111018

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20111031

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20141125

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees