JP4959280B2 - マルチプロセッサシステムのプロセッサに電源を供給する方法および装置 - Google Patents

マルチプロセッサシステムのプロセッサに電源を供給する方法および装置 Download PDF

Info

Publication number
JP4959280B2
JP4959280B2 JP2006273490A JP2006273490A JP4959280B2 JP 4959280 B2 JP4959280 B2 JP 4959280B2 JP 2006273490 A JP2006273490 A JP 2006273490A JP 2006273490 A JP2006273490 A JP 2006273490A JP 4959280 B2 JP4959280 B2 JP 4959280B2
Authority
JP
Japan
Prior art keywords
processor
voltage
processors
voltage regulator
vrm
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2006273490A
Other languages
English (en)
Other versions
JP2008090760A5 (ja
JP2008090760A (ja
Inventor
ウォレン、ディー、べイリー
スリニバス、チーマラパティ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Priority to JP2006273490A priority Critical patent/JP4959280B2/ja
Publication of JP2008090760A publication Critical patent/JP2008090760A/ja
Publication of JP2008090760A5 publication Critical patent/JP2008090760A5/ja
Application granted granted Critical
Publication of JP4959280B2 publication Critical patent/JP4959280B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Power Sources (AREA)

Description

本発明は、一般に、複数のマイクロプロセッサを有するコンピュータシステムに関する。さらに詳細には、本発明は、マルチプロセッサシステムのプロセッサに電源を供給する方法および装置に関する。
我々の社会は、我々の日々の活動の多くでコンピュータシステムに負うところが大きい。プロセッサを使用するコンピュータシステムは、我々の家庭で、我々の事務所で、我々の生産設備で、我々の自動車で、ならびに宇宙のスペースシャトル内および静止衛星内でさえ、機器を制御する。デスクトップおよびラップトップコンピュータ、メインフレームコンピュータシステムのような機器の中に、ならびに携帯電話およびパームヘルドコンピュータのような携帯機器の中に、コンピュータおよびプロセッサを見出すことができる。
これらの既存の用途に加えて、人々は絶えずコンピュータシステムの新規の用途を見つけている。用途の多くは、プロセッサ性能の改善を要求し、現代のコンピュータシステムに負担を課している。コンピュータ設計者が絶えず改善しようと努力しているプロセッサ性能の改善例としては、プロセッサ速度の向上、およびデータ処理能力の高速化などがある。改善されたプロセッサ性能を要求する用途の例は、画像および音声認識、気候または気象のモデル化、流体乱流のモデル化、ヒトゲノムマッピング、オイルリザーバのモデル化、および海洋循環のモデル化である。これらの用途すべては、多数の数学的計算のために膨大な量の計算能力を必要とする。
これらの用途の要求を満たすために、コンピュータシステム設計者は、プロセッサ、主としてマイクロプロセッサのアーキテクチャを大幅に変更した。例えば、1980年代および1990年代前半のコンピュータシステムは、一般に直線方式または順次方式でデータを扱う単一の中央演算処理装置を有していた。残念ながらこのような順次アーキテクチャは、マイクロプロセッサの物理的限界のために、限定された計算能力を提供するのみである。したがって、一般的に今日のコンピュータは並列アーキテクチャのような様々なプロセッサアーキテクチャで同時に計算する複数のプロセッサを使用する。
上述したように、今日の多数のコンピュータシステムは複数のプロセッサを含む。また、コンピュータのプロセッサ数の増加と共に、これらのマルチプロセッサシステムを作成する設計者は、これらのコンピュータシステムからさらなる計算処理能力を引き出すため様々な技術および設計方法を使用する傾向がある。このような技術および設計方法としては、パイプライン処理、ベクトル処理、およびスーパースケーラアーキテクチャの使用などがある。これらの技術および設計方法を使用するコンピュータシステムは、一般にチップ上のトランジスタおよび抵抗器の個数が18カ月毎に倍増するとするムーアの法則に従っている。今日では、何百万個ものトランジスタを含む、あるいは何十億個ものトランジスタを含む最新式コンピュータシステムチップでさえ、珍しいことではない。
残念ながら、コンピュータシステムおよびコンピュータチップが使用するトランジスタおよび他の集積回路要素が多いほど、要素のより少ないシステムおよび装置よりも頻繁に故障する傾向がある。こういった増加する故障率に対処するため、計算機メーカーはこれらのシステムの連続稼働時間(アップタイム)および信頼性を向上させる傾向がある様々な設計技術を使用する。例えば、複数のプロセッサを有するコンピュータシステムで現在使用されている連続稼働時間を向上させる1つの技術は、内部故障を有するプロセッサを無効にすることを含む。プロセッサが内部故障を有することを検知すると、プロセッサはリセット状態に保持される。故障したプロセッサをリセット状態に保持することは、故障したプロセッサの出力を実効的にトライステート(tri-state)して、コモンバスに取り付けられた他のプロセッサが作動し続けることを可能とする。
しかしながら、複数のプロセッサを有するコンピュータシステムが、この技術を用いて作動することを可能とする試みには重大な問題がある。プロセッサはプロセッサ自体の中の問題のために故障する場合があり、または、プロセッサは、プロセッサに電源を提供する電圧調節器にかかわる問題のために故障しうる。問題がプロセッサ内部にある場合、上述したリセット状態でプロセッサを保持する技術は、そのプロセッサを無効にして、マルチプロセッサシステムが作動し続けることを可能とすることができる。しかしながら、プロセッサが、プロセッサに電源を供給する電圧調節器にかかわる問題のために故障すると、リセット状態でプロセッサを保持する単純な試みでは、プロセッサ無しでシステムが作動し続けることを可能とすることができない。
プロセッサの入力および出力を正確にトライステートするために、プロセッサは電源を必要とするため、問題がプロセッサに電源を供給する電圧調節器と関連する場合、リセット状態でプロセッサを保持する技術はうまく作動できない。他のプロセッサが、同じデータ、制御、およびアドレスバスに接続されているという事実のために、故障したプロセッサの入力および出力は、トライステートされる必要がある。正常にトライステートを行わなければ、故障したプロセッサの入力および出力により、バスの信号ラインを不良状態となり、他のプロセッサが正常に機能することを妨げるであろう。
多くのマルチプロセッサシステムのアーキテクチャは、正常動作時に、他のプロセッサ用のコア電圧から独立している各プロセッサ用のコア電圧を必要とする。その結果、問題のプロセッサ用の電圧供給または電圧調節器が故障すると、電圧不足のために、プロセッサを正常にトライステートすることができない。多くの場合、コア電源層(plane)は他の電源層から隔離されており、コア電圧の他の電源は利用できない。最終的に、複数のプロセッサを有するコンピュータの中の単一の電圧調節器の故障が、コンピュータが動作することを妨げることになるであろう。したがって、電圧調節器のうちの1つが故障しても、複数のプロセッサコンピュータが作動することを可能とする方法および装置に対する必要性がある。
上で特定された問題は、主に、電圧調節器のような電圧源に欠陥がある場合、プロセッサに電圧を提供するための方法および装置により対処される。1つの実施形態は、複数のプロセッサを有するコンピュータシステムのプロセッサに電源を供給する方法を含む。一般に、この方法は、プロセッサに結合された第1の電圧電位に関連するパラメータをモニタすることを含む。モニタされたパラメータまたは状態が、第1の電圧が不良であるか、または障害があることを示す場合、この方法は、プロセッサから電圧を分離し、プロセッサを無効にするか、またはリセットして、プロセッサに第2の電圧電位を結合する。また、この方法は、プロセッサが無効にされた状態で、コンピュータシステムが作動し続けることを可能としうる。様々な実施形態では、第1の電圧電位の分離、プロセッサの無効、および第2の電圧電位の結合は、スイッチ、トランジスタ、およびリレー接点のような装置を使用することにより達成されうる。
他の実施形態は、複数のプロセッサを有するコンピュータシステムのプロセッサに電圧を供給する装置を含む。この装置は、第1の電圧調節器に関連するエラーを検出するエラー検出回路、エラーに呼応して第1の電圧調節器を無効にする無効化回路、プロセッサ分離回路、およびプロセッサに第2の電圧調節器から電圧を供給する電圧スイッチング回路を含むことができる。この装置のすべての要素は、サービスプロセッサと呼ばれる単一の装置の中に存在しうる。この装置は、電圧調節器を分離し、プロセッサを分離して、かつ第2の電圧調節器にプロセッサを切り替えるために、トランジスタ、スイッチ、およびリレー接点を利用できる。
さらなる実施形態は、2つ以上のプロセッサを含むマルチプロセッサ・コンピュータシステム、プロセッサに電圧を供給する2つ以上の電圧調整装置、電圧調整モジュールにかかわる問題を検知する電圧エラー検出モジュール、問題のある電圧調整モジュールを分離する電圧分離モジュール、および問題のある電圧調整モジュールに影響を受けている任意のプロセッサに、残りの電圧調整モジュールのうちの少なくとも1つを結合する電圧スイッチングモジュールを含む。また、他の実施形態では、コンピュータシステムは、問題のある電圧調整モジュールに影響を受けているプロセッサのうちの1つ以上を無効にするプロセッサ無効化モジュールを含むことができる。
本発明の他の目的および利点は、添付図面を参照するとともに以下の詳細な説明を読むことにより明らかになるであろう。添付図面において、同様の参照番号は同様の要素を示しうる。
下記は、添付図面に示された本発明の実施形態例の詳細な説明である。実施形態例は、本発明を明確に知らせるために、このように詳細に示される。しかしながら、提供された詳細全体は、実施形態の予想される変形を制限するものではなく、反対に、添付クレームで定義されるとおり本発明の要旨および範囲内にあるすべての変更、均等物、および代替物を含むことを意図するものである。下記の詳細な説明は、このような実施形態が当業者にとって明白になるように意図されている。
概括して言えば、マルチプロセッサ・コンピュータシステムのプロセッサに電源を供給する方法、装置、およびシステムが開示される。電圧エラーを検出した後に、プロセッサ間の電源を切り替える新技法について論ずる。実施形態は、複数の電圧源により電力を供給されている複数のプロセッサを有するコンピュータシステムをモニタして、電圧エラーが検出されると、プロセッサ間の電源を切り換える方法を含む。これらの実施形態では、装置ソフトウェアまたはハードウェアもしくはその両方が、1つ以上のプロセッサに対する電圧が許容範囲をはずれていることを検出でき、これに呼応して他の電源からの電圧を切り替え、かつ影響を受けたプロセッサを分離することができる。
いくつかの実施形態では、電圧は、独立した2つの電圧調節器を使用する2つのプロセッサ間で切り換えられる。他の実施形態では、電圧は、3、4、8、またはそれ以上といった任意の個数のプロセッサ間で切り換えられうる。同様に、プロセッサに対する電圧は、多数の異なる電源から得られうる。多数の実施形態では、電圧は、電界効果トランジスタのような半導体素子を用いて切り替えられうる。他の実施形態では、プロセッサに対する電圧は、リレー、または他のスイッチング装置を用いて切り替えられうる。
種々の電圧問題の検知および応答の方法は、種々の実施形態において異なる。いくつかの実施形態では、電圧制御ユニットは、単に、電圧調節器からの電圧の消失を検出できる。他の実施形態では、電圧制御ユニットは、電圧が所定のしきい値に達しないといったより微妙な電圧エラー状態をモニタできる。さらなる実施形態では、サービスプロセッサは、電圧調節器からの、または調節器により電力を供給されているプロセッサからの、単一の状態ビットをモニタすることにより、電圧エラーをモニタできる。様々なエラーに対する呼応については、いくつかの実施形態の電圧制御ユニットは、電圧エラーにより影響を受けているプロセッサに、影響を受けていない電圧源から供給して、かつプロセッサをリセット状態に保持することにより、呼応しうる。他の実施形態では、電圧制御ユニットは異なる方法で呼応でき、例えば、プロセッサに対する状態入力を、プロセッサがその入力および出力を浮動させうる高レベルに保持するように呼応しうる。
以下の詳細な論議の一部では、複数のマイクロプロセッサを有するコンピュータシステムのマイクロプロセッサに電源を供給する新技法を含む多数の実施形態について説明するが、当業者は、以下の発明が、様々なプロセッサベースのコンピュータシステムにおける、例えば、複数ボードコンピュータに実装されたプロセッサ、およびメインフレームシステムに実装されたプロセッサにおいてさえ、多数の異なった種類のプロセッサを用いて実施されうることを認識するであろう。実施形態は、データバスまたはメモリアクセスバスのような単一のバスに結合されたプロセッサを有するように説明されているが、様々な実施形態では、同時に、複数バスに結合されうる。さらに、実施形態では、トランジスタおよびリレーを用いてプロセッサ間の電圧の切り替えを行うことについて説明するが、当業者は、本明細書に開示された技術が、スイッチング装置のほとんど無限の変形を利用できることを認識するであろう。本発明を実施するすべての構成および方法は、同様の制約条件に基づいて実質的に同等な機能を実行するために使用されるとき、他の実施形態に対して交換可能である。
ここで、2つのプロセッサ、2つの電圧調節器モジュール、および2つの調節器モジュールの間を切り替える装置を有するマルチプロセッサ・コンピュータシステム100を示す図1を参照する。さらに具体的に述べると、図1に示されたコンピュータシステム100は、第1のマイクロプロセッサ118、および単一のバスセグメント128を介してバスコントローラ154に並列に結合された第2のマイクロプロセッサ120を有する。様々な実施形態では、バスセグメント128は、プロセッサ118および120を様々な幅のバスに結合できる。例えば、いくつかのシステムでは、バスセグメント128は、8ビットバスセグメントを含むことができる。他の実施形態では、バスセグメント128は、16、32、またはさらに大きいビット数のバスを含むことができる。
バスコントローラ154に結合されているのは、AGP(acceleratedgraphics port)バス158、PCI(peripheral component interconnect)バス150、およびランダムアクセスメモリ(RAM)124のバンクである。この実施形態では、マイクロプロセッサ118およびマイクロプロセッサ120は、RAM124のバンクを共同利用し、共用メモリコンピュータシステムを含むが、他の実施形態では、他の方法で配置されたマイクロプロセッサを有することができる。例えば、メモリの1つのバンクを共同利用するマイクロプロセッサ118およびマイクロプロセッサ120の代わりに、他の実施形態では、分散メモリコンピュータシステムの場合のように、個別の専用メモリバンクを有するマイクロプロセッサ118および120を配置できる。
マイクロプロセッサ118および120は連絡し合って作動でき、AGPバス158およびAGPビデオカード160を用いて、ブラウン管モニタによりコンピュータシステム100のユーザに情報を表示することができる。他の実施形態では、表示装置は、液晶ディスプレイ画面または薄膜トランジスタフラットパネルモニタでもよい。さらに、様々な実施形態では、レガシー業界標準アーキテクチャ(ISA)カードのような、AGPビデオカード160とは異なる他の種類のディスプレイアダプタを用いてユーザに情報を表示できる。さらなる実施形態では、ディスプレイを全く有しない計算機器に、マイクロプロセッサ118および120を埋め込むことができる。
コンピュータシステム100は、BIOSモジュール190に格納された基本的入出力システム(BIOS)プログラムを有することができる。コンピュータシステム100の電源投入後に、マイクロプロセッサ118および120に、システムハードウェアについての多数の所定のテストを実行させる、パワーオン・セルフテスト(Power On Self Test)コードまたはプログラムが、BIOSモジュール190に含まれうる。例えば、POSTプログラムは、コンピュータシステムを検査できるとともに、キーボードおよびマウスのような入出力装置用の様々なポートおよびUSBポートを点検できる。
図1に示されているように、コンピュータシステム100は、キャッシュメモリ116に結合されたマイクロプロセッサ118を有することができる。同様に、コンピュータシステム100は、キャッシュメモリ122に結合されたマイクロプロセッサ120を有することができる。このようなキャッシュメモリ装置は、様々な実施形態において個々のプロセッサの動作性能の向上を促進しうる。しかしながら、いくつかの実施形態では、マイクロプロセッサ118および120と同様の1つ以上のプロセッサは、個々のマイクロプロセッサに結合された複数のキャッシュメモリ装置を有してもよく、複数のマイクロプロセッサに結合されたキャッシュメモリ装置を有してもよく、およびキャッシュメモリ装置を備えていない1つ以上のマイクロプロセッサを有することさえ可能である。
また、図1に示されているように、コンピュータシステム100は、スイッチングモジュール114を介して、マイクロプロセッサ118に電源を提供する電圧調整モジュール(VRM:Voltage Regulation Module)108、およびマイクロプロセッサ120に電源を供給する別のVRM112を有することができる。正常動作時に、スイッチングモジュール114は、VRM108およびVRM112からの電圧を分離でき、VRM108がマイクロプロセッサ118に電圧を供給して、他方でVRM112がマイクロプロセッサ120に電圧を供給するようにできる。VRM108またはVRM112が故障すると、電圧調節器制御ユニット102は、状態入力ライン104および106のそれぞれから、このような故障を検出できて、出力スイッチング制御ライン110を介して、スイッチングモジュール114を作動させることができる。スイッチングモジュール114を作動させることにより、正常時にはその故障しているVRMから供給されているプロセッサに、故障していないVRMからの電圧を結合できる。このようにバックアップ電圧を結合することにより、影響を受けているプロセッサが、迂回モードに置かれることを可能とすることができ、影響を受けているプロセッサが正常動作を停止して、かつバスコントローラ154に結合された他のプロセッサおよび装置が、正常に動作することを可能とするようになされる。
例えば、マイクロプロセッサ118がVRM108から電圧を受電している状態で、コンピュータシステム100が正常モードで作動していると想定してみよう。同様に、マイクロプロセッサ120がVRM112から電圧を受電している。2つの状態入力ライン104および106それぞれの状態をモニタすることにより、VRM制御ユニット102は、VRM108およびVRM112が正常に作動していることを検出できる。VRM108およびVRM112が正常に作動していることを検知すると、VRM制御ユニット102は、スイッチングモジュール114にVRM108およびVRM112の出力を分離させることができて、各VRM出力が、他の出力から分離されるようになされる。この正常な動作モードでは、スイッチングモジュール114は、VRM108からの電圧をマイクロプロセッサ118のみに結合でき、かつVRM112からの電圧をマイクロプロセッサ120のみに結合できる。しかしながら、VRM108が故障して、出力電圧の供給を停止すると想定してみよう。VRM108により供給される動作電圧の欠如にともない、マイクロプロセッサ118は、動作を停止する。残念ながら、マイクロプロセッサ118に印加される動作電圧の完全な欠如にともない、バスセグメント128の出力信号ラインは、低レベルに保持され、バスコントローラ154を有するマイクロプロセッサ120の正常な動作を妨げうる。この問題を改善するために、マイクロプロセッサ118は、迂回モードに置かれることができ、十分な電圧がマイクロプロセッサ118に印加されるようになされうる。このような電圧は、まだ正常に作動しているVRM112のような他のVRMモジュールから提供されうる。
VRM制御ユニット102は、状態入力ライン104における現在の電圧の欠如を検知することにより、VRM108が故障したことを検出できる。したがって、VRM制御ユニット102は、スイッチング制御ライン110を作動状態にして、スイッチングモジュール114を介してVRM112の出力をマイクロプロセッサ118に結合することができる。十分な電圧がVRM112からマイクロプロセッサ118に供給されることにより、マイクロプロセッサ118は、リセットされて、かつ迂回状態に保持されることができ、その結果、マイクロプロセッサ120は、バスコントローラ154と正常に相互作用できる。逆の状況も起こりうることは明らかである。すなわち、VRM112が故障して、マイクロプロセッサ120に影響を与えうる。そのとき、VRM制御ユニット102がスイッチングモジュール114を作動させて、VRM108からの電圧をマイクロプロセッサ120に結合でき、その結果、マイクロプロセッサ120が迂回されて、かつマイクロプロセッサ118が作動し続けることを可能とすることができる。
電圧および電源が、マルチプロセッサシステムのプロセッサにどのように供給されうるのかについてより良く説明するために、ここで我々は、様々な実施形態において、どのように電圧エラーを検出でき、どのように電圧エラーを分離でき、どのようにシステムのプロセッサを無効にできるのかについてのより詳細な議論を続ける。図2は、2つのコア電圧、すなわちコア電圧230およびコア電圧260を制御する装置200を示す。いくつかの実施形態では、装置200は、完全に半導体基板の中に実装されて、かつ単一の集積回路を含むことができる。他の実施形態では、装置200の1つ以上の構成要素は、1つ以上のプリント基板上の電気トレースのような、金属線または他の導電性材料で結合された個別の電子装置として存在できる。
図2に示されているように、コア電圧230は、マイクロプロセッサ240に動作電圧および電流を提供できる。同様に、コア電圧260は、マイクロプロセッサ270に動作電圧および電流を提供できる。正常動作時に、VRM220はコア電圧230を出力または供給でき、他方でVRM250はコア電圧260を供給できる。マイクロプロセッサ240および270は、共用メモリアーキテクチャのような、様々な異なったコンピュータアーキテクチャで構成されたマルチプロセッサ・コンピュータシステムの2つのプロセッサでありうる。さらに、マイクロプロセッサ240および270は、パイプライニング、タイムシェアリング、マルチスレッディング、インタリービング、およびオーバーラッピングのようなデータ処理の様々な技術を利用できる。
電圧およびマイクロプロセッサ制御ユニット210は、マイクロプロセッサ240、マイクロプロセッサ270、およびVRM220およびVRM250により供給された電圧に関連する多数のパラメータをモニタできる。例えば、制御ユニット210は、VRM220およびVRM250により供給された電圧をモニタすることができ、両方の電圧が正常電圧範囲内にあることを確認する。いくつかの実施形態では、制御ユニット210は、何らかの最小動作しきい値を下回っていないことを確認するために、このような電圧をモニタすることができる。他の実施形態では、制御ユニット210は、単に、VRM220およびVRM250内の内部診断回路により生成された状態ビットをモニタすることができる。換言すれば、各VRMは、それ自身の診断回路を有することができ、電圧レベル、電圧低下、電圧低下持続時間、電圧雑音、リップル、および他の電圧品質の尺度のような電圧パラメータをモニタする。このような電圧パラメータのモニタは、実施形態に応じて、VRMまたは制御ユニット210で実行されうる。
VRM220またはVRM250に関連した電圧エラーを検出すると、制御ユニット210は、実施形態に応じて、様々な異なった方法で呼応しうる。いくつかの実施形態では、制御ユニット210は、最初に、障害のあるまたは異常のあるVRMにより影響を受けたプロセッサを無効にして、障害のあるVRMを無効にして、作動中のVRMからの電圧を、マイクロプロセッサ240およびマイクロプロセッサ270の両方に結合して、正常時にはその障害のあるVRMに結合されているプロセッサを、見えない状態に保持することができる。このようにプロセッサを見えない状態に保持することにより、コンピュータシステムのうちの1つ以上の残りのプロセッサが、作動し続けることを可能としうる。いくつかの実施形態では、個別のVRMモジュールの各々は、マイクロプロセッサ240およびマイクロプロセッサ270の両方に供給するための十分な電流発生能力を有することができ、影響を受けたマイクロプロセッサが、簡単に制御ユニット210によりリセットされることを可能とし、また、影響を受けたマイクロプロセッサが作動し続けることを可能とする。
他の実施形態では、制御ユニット210は、異なった方法で電圧エラーを検出して、かつ呼応しうる。例えば、制御ユニット210は、マイクロプロセッサ240および270からの状態ビットをモニタでき、どちらかのビットの消失は、異常な電圧がプロセッサに供給されていることに相当するであろう。換言すれば、マイクロプロセッサは電圧モニタを実行できる。どちらかの状態ビットが消失すると、制御ユニット210は、障害のあるVRMを無効にして、影響を受けたプロセッサに他のVRMを結合して、かつ影響を受けたプロセッサをリセット状態に保持することにより呼応でき、同一の入出力ラインに接続された他の任意のシステムプロセッサまたは装置が、機能し続けることができるようにするために、影響を受けたプロセッサの入出力ラインを実効的にトライステートする。さらなる実施形態では、制御ユニット210は、直接、コア電圧230および260をモニタすることができて、制御ユニット210で電圧エラーを検出する。
マルチプロセッサ・コンピュータシステムのプロセッサにどのように電源を再分配できるのかについて、より明白な例を提供するために、図3に移動する。図3は、2つのマイクロプロセッサ375および380に電源を供給する、2つの電圧調節器モジュールVRM350およびVRM365からの電圧を制御するサービスプロセッサ315を有するコンピュータシステム300を示す。マイクロプロセッサ375が、RAM385専用であり、マイクロプロセッサ380が、RAM390専用であってもよい。マイクロプロセッサ375および380は、単一のシステムバス395に結合されることができ、分散メモリマルチプロセッサ・コンピュータシステム300でありうるものを形成する。
正常動作時に、VRM350は、マイクロプロセッサ375に安定化されかつフィルタリングされたコア電圧355を供給できる。同様に、VRM365は、マイクロプロセッサ380にコア電圧370を供給できる。コア電圧355およびコア電圧370は、共に、マイクロプロセッサ375および380に銅平面を介して分配されうる。VRM350およびVRM365の両方が正常に機能している状態では、マイクロプロセッサ375および380の両方は、それぞれコア電圧355および370を利用できて、RAM385および390とデータを送受信しながら、連絡し合って作動する。さらに、各マイクロプロセッサは、システムバス395によりコンピュータシステム300の中の他の機器とデータを通信できる。また、正常動作時に、サービスプロセッサ315は、独立した状態ライン325および335それぞれを介して、VRM350およびVRM365の状態をモニタできる。
電圧調節器モジュールのうちの1つが不良となり、エラーを生じる場合には、サービスプロセッサ315は、状態ライン325または状態ライン335からエラーを検出できるとともに、影響を受けたマイクロプロセッサをリセットし、不良である電圧調節器を無効にし、出力接続ライン345を作動状態にし、スイッチ360を閉じることで、コア電圧355および375を連結することにより呼応できる。換言すれば、電圧調節器がエラーを有するときはいつでも、サービスプロセッサ315が検出できるとともに、調節器を無効にし、作動中の調節器から影響を受けたプロセッサに電圧を供給することにより呼応できて、その結果、コンピュータシステム300が作動し続けることができるようにするために、プロセッサが迂回されうる。プロセッサ315が予備電圧305のような予備電圧源から供給されていれば、サービスプロセッサ315は、VRM350またはVRM365が消失しても、作動し続けることができる。
例えば、コンピュータシステム300が、マイクロプロセッサ375およびマイクロプロセッサ380のそれぞれに電源を供給するVRM350およびVRM365の両方とともに、正常に作動していると仮定する。サービスプロセッサ315は、出力接続ライン345を非作動状態にして、スイッチ360を開くことができる。VRM365が内部故障を生じると、状態ライン335は、論理的な0に変化しうる。サービスプロセッサ315は、状態ライン335のこの変化を検出できるとともに、制御出力340を論理的な1から論理的な0に変化させることで、VRM365を無効にすることにより呼応できて、最終的に、VRM365を無効にする。また、サービスプロセッサ315は、制御出力320を論理的な0から論理的な1に変化させることにより、マイクロプロセッサ380をリセット状態に設定できる。さらに、サービスプロセッサ315は、出力接続ライン345を作動状態にして、スイッチ360を閉じることにより、VRM350からマイクロプロセッサ380に電源を供給できる。スイッチ360を閉じることにより、VRM350にコア電圧355からコア電圧370に電源を過不足なく提供させることができ、その結果、マイクロプロセッサ380が、入出力ラインを正常にトライステートすることができる。この方法で、制御出力320を論理的な1に保持された状態のサービスプロセッサ315を有することにより、マイクロプロセッサ380入出力ラインをトライステートすることは、マイクロプロセッサ380をシステムバス395から分離できて、マイクロプロセッサ375が、作動してかつシステムバス395に結合された他の機器と通信し続けることを可能とする。
VRM365を無効にして、VRM350からマイクロプロセッサ380に電源を供給するのと同様に、サービスプロセッサ315は、制御出力330、制御出力310、および出力接続ライン345を用いて、VRM350を無効にして、VRM365からマイクロプロセッサ375に電源を供給することができる。さらに、サービスプロセッサ315は、VRM350、VRM365、マイクロプロセッサ375、およびマイクロプロセッサ380の構成に応じて、制御出力を、低レベルから高レベルへ、または高レベルから低レベルへ変化させることにより、異なった実施形態でこれらの機能を達成できる。換言すれば、電圧調節器、マイクロプロセッサ、およびスイッチング装置の構成に応じて、高レベルから低レベルへ、または低レベルから高レベルへ、ラインをなすことにより、制御出力は作動状態にされうる。
様々な実施形態では、電圧調節器を迂回してマイクロプロセッサを無効にする際のサービスプロセッサ315により実行処理される正確な手順は、変更されうるが、同じタスクを達成できる。例えば、いくつかの実施形態では、サービスプロセッサは、最初に欠陥があるVRMを無効にし、マイクロプロセッサを設定して、その後電源層を連結することができる。さらに他の実施形態では、サービスプロセッサは、最初にマイクロプロセッサをリセット状態に設定して、次に欠陥があるVRMを無効にして、最後に電圧スイッチを閉じることができる。様々な出力制御ラインを制御する正確な順序は重要ではなく、コンピュータシステム300の構成要素に応じて変わりうる。
ここで図4を参照すると、マルチプロセッサ・コンピュータシステム400が示されている。図4に示されているように、コンピュータシステム400は、異なる個数の電圧調節器から電源を供給された、異なる個数のプロセッサを有することができる。さらに具体的に述べると、コンピュータシステム400は、第1のVRM430により電源を供給された2つのマイクロプロセッサ、マイクロプロセッサ435およびマイクロプロセッサ440を有することができる。同様に、第2のVRM455は、マイクロプロセッサ485およびマイクロプロセッサ490に電源を供給することができる。図4のコンピュータシステム400が、図1のコンピュータシステム100、図3のコンピュータシステム300、および図2の装置200と、どのように異なっているかに注意する。前者のシステムおよび装置は、2つのマイクロプロセッサおよび2つの電圧調節器モジュールだけを有したが、コンピュータシステム400は、4つのマイクロプロセッサ、マイクロプロセッサ435、440、485、および490に電源を供給する2つのVRM、430および455を使用する。上述したように、異なる実施形態では、用途からの要求、プロセッサの電力需要、および調節器の出力定格などに応じて、異なる個数の電圧調節器およびマイクロプロセッサを含むことができる。
コンピュータシステム400では、正常動作時に、VRM430は、マイクロプロセッサ435およびマイクロプロセッサ440に電源を提供できる。同様に、VRM455は、マイクロプロセッサ485および490に正常動作電源を提供できる。サービスプロセッサ410は、状態ライン420でVRM430の状態をモニタでき、状態ライン465でVRM455の状態をモニタできる。説明のために、仮にVRM455で電圧エラーが発生するとした場合、サービスプロセッサ410は、状態ライン465によりエラーを検出できるとともに、制御出力470および480それぞれを出力することで、マイクロプロセッサ485およびマイクロプロセッサ490を無効にすることにより呼応することができる。その後、サービスプロセッサ410は、制御出力460の状態を変更することにより、VRM455を無効にすることができ、リレー445を励磁することにより、マイクロプロセッサ485および490に電源を結合することができる。リレー445を励磁することにより、リレー接点450を閉じることができて、マイクロプロセッサ485および490にVRM430からの電圧および電源を結合することができる。
他の実施形態では、サービスプロセッサ410は、電圧調節器と関連するすべてのマイクロプロセッサを無効にするか、または迂回する必要がないかもしれない。例えば、VRM430が故障すると想定しよう。サービスプロセッサ410は、制御出力425を作動状態にして、かつリレー445を励磁してリレー接点450を閉じることで、VRM430を無効にすることにより呼応できる。さらに、VRM455が、3つのマイクロプロセッサに電源を供給するのに十分大きい出力定格を有するが、4つのマイクロプロセッサに電源を供給するには十分ではないと想定しよう。サービスプロセッサ410は、マイクロプロセッサ435およびマイクロプロセッサ440の両方を無効にする必要はないかもしれない。代わりに、サービスプロセッサ410は、コンピュータシステム400で動作するプロセッサの個数を最大にすることを試みることができ、制御出力405を用いてマイクロプロセッサ440を無効にするか、または制御出力415を用いてマイクロプロセッサ435を無効にすることができるのみである。
ここで、より柔軟でかつ詳細な構成を検討するために、サービスプロセッサが、数個のプロセッサに対する数個の電圧調節器からの電圧をどのように制御しうるかについての他の技術を示す図5を参照する。コンピュータシステム500は、正常時には、4つの電圧調節器モジュール、550、556、560、および564のそれぞれから電源を供給されている4つのプロセッサ、プロセッサ586、588、590、および592を有する。正常動作時に、サービスプロセッサ502は、スイッチ566、570、572、および574のそれぞれを閉じるために、制御出力508、514、528、および532を作動状態にすることができ、VRMからの電圧を個々のプロセッサに結合する。サービスプロセッサ502は、VRM状態ライン504、518、524、および536のそれぞれを介して、VRM550、556、560、および564をモニタできる。
図5に示されたコンピュータシステム500の構成は、1つ以上のVRMが故障した場合、切り替え操作のさらなる柔軟性を提供できる。例えば、VRM550およびVRM560の両方が故障すると仮定しよう。サービスプロセッサ502は、状態ライン504および524を介してこれらの故障を検出できるとともに、制御出力ライン506および526を作動状態にしてVRMを無効にすることにより、かつ制御出力508および528を変更してスイッチ566および572を開いて、マイクロプロセッサ586、マイクロプロセッサ590、およびすべてのVRMの出力における相互接続配線から、VRMの出力を分離することにより呼応できる。サービスプロセッサ502は、引き続いて制御出力510を作動状態にすることによりプロセッサ586を無効にすることができ、かつ制御出力530を作動状態にすることによりプロセッサ590を無効にすることができる。次に、サービスプロセッサ502は、制御出力552を作動状態にしてスイッチ568を閉じることにより、VRM556からマイクロプロセッサ586に電源を供給できる。同様に、サービスプロセッサ502は、制御出力562を作動状態にしてスイッチ584を閉じることにより、VRM564からマイクロプロセッサ590に電源を供給できる。あるいは、サービスプロセッサ502は、制御出力520を作動状態にしてスイッチ580を閉じることにより、VRM556からマイクロプロセッサ590に電源を供給できるとともに、制御出力512を作動状態にしてスイッチ578を閉じることにより、VRM564からマイクロプロセッサ586に電源を供給できる。
他の実施形態では、図5のコンピュータシステム500で採用されたスイッチング回路は、コンピュータシステム500が既に経験したかもしれない任意の先行する故障に応じて、いくつかの他の実施形態よりもさらに柔軟性および冗長性を提供できる。例えば、マイクロプロセッサ588が、以前に内部故障を経験したと仮定しよう。サービスプロセッサ502は、既にこの故障を検出して、制御出力558を作動状態にすることによりプロセッサ588を無効にしたかもしれない。しかしながら、また、サービスプロセッサ502は、状態ライン518から、VRM556がまだ良好な電圧状態を有することを検出したかもしれない。その結果、制御出力514はまだ作動状態であり、かつスイッチ570はまだ閉じられているかもしれない。しかしながら、コンピュータシステム500がVRM564の故障を経験して、この故障を、サービスプロセッサ502が状態入力536を介して検出すると想定しよう。サービスプロセッサ502は、制御出力540を作動状態にすることによりマイクロプロセッサ592を無効にすることができ、制御出力534を作動状態にして、かつ制御出力532を作動状態にしてスイッチ574を開けることでVRM564を分離することにより、VRM564を無効にすることができる。
その後、サービスプロセッサ502は、制御出力512を作動状態にしてスイッチ578を閉じることで、VRM550からマイクロプロセッサ592に単に電源を供給することにより続行でき、あるいはまた、制御出力562を作動状態にしてスイッチ584を閉じることにより、VRM560から電源を供給することにより続行できる。しかしながら、サービスプロセッサ502は、マイクロプロセッサ588が既に無効にされたことを認識するように構成されることが可能であり、そのことは、無効にされたマイクロプロセッサ588に対する電源ドレインが十分低いことが可能であるため、VRM556が他のマイクロプロセッサに電源を供給するために利用可能でありうることを意味しうる。その場合、サービスプロセッサ502は、制御出力522を作動状態にしてスイッチ582を閉じることができ、それによって、VRM556からの電源をマイクロプロセッサ592に結合することができる。その後、サービスプロセッサ502は、制御出力540からの無効コマンドを非作動状態にすることにより、マイクロプロセッサ592を使用状態に戻すことができる。
各VRMの出力が、他のVRMの他の出力のいずれとも結合されうることは強調する価値のある事実である。VRM550は、制御出力552を作動状態にし、かつスイッチ568を閉じることによりマイクロプロセッサ588と、制御出力554を作動状態にし、かつスイッチ576を閉じることによりマイクロプロセッサ590と、制御出力512を作動状態にし、かつスイッチ578を閉じることによりマイクロプロセッサ592と、それぞれ結合されうる。同様に、制御出力552、554、512、520、522、および562を作動状態にしてスイッチ568、576、578、580、582、および584のそれぞれを閉じることにより、VRM556、VRM560、およびVRM564は、各マイクロプロセッサに個別に結合されうる。
図6は、8つのマイクロプロセッサを有し、かつマイクロプロセッサ間の電圧を切り替える2つのサービスプロセッサを使用する、より大きなコンピュータシステム600でありうるものを示す。コンピュータシステム600は、二元的サービスプロセッサの利用により、先に議論された単一のサービスプロセッサまたは電圧制御ユニットを有する実施形態と異なっていることに気づくであろう。この対比を行うことにより、異なる実施形態が、異なる個数の電圧調整モジュール、および異なる個数のマイクロプロセッサで構成された異なる個数のサービスプロセッサをどのように有することができるかを示すのに役立つ。
さらに具体的に述べると、コンピュータシステム600は、対応するコア電圧、670、672、678、および680を有する4つのVRM、610、612、614、および616をモニタする第1のサービスプロセッサ602を有する。また、サービスプロセッサ602は、スイッチングトランジスタ630、632、634、636、638、640、および642で、4つのマイクロプロセッサ668、674、676、および682に供給された電圧を制御する。鏡に映したように、第2のサービスプロセッサ604は、対応するコア電圧686、688、694、および696を有する4つのVRM618、620、622、および624をモニタできる。また、サービスプロセッサ604は、スイッチングトランジスタ644、645、646、648、650、652、および654で、4つのマイクロプロセッサ684、690、692、および698に供給された電圧を制御することができる。
1つのサービスプロセッサの代わりに2つのサービスプロセッサを用いてコンピュータシステム600を実現することにより、より単純なサービスプロセッサ設計のような多数の好ましい便益を有することができる。あるいは、このような方法でプロセッサおよび電圧調節器を分割することが、ハードウェア要件から必要とされるかもしれない。例えば、コンピュータシステム600は、サーバネットワークの中のコンピュータシステムを含むことができる。様々なサーバプロセッサの中で複数のプロセッサを分割することが、スペーシングおよび熱負荷要件からサーバシステムで必要とされるかもしれない。すなわち、サービスプロセッサ602、ならびにすべての関連するVRMおよびマイクロプロセッサは、1つのプリント基板上にあるとともに、ラックマウント式コンピュータシステムハードウェアに装入できる。用途またはハードウェア格納装置寸法により決定された最大許容回路寸法は、サービスプロセッサ604、ならびにすべての関連するVRMおよびマイクロプロセッサが、別々のプリント基板上にあることを要求するかもしれない。
前述の例と同様に、サービスプロセッサ602および604は、それらと結合された様々なVRM、トランジスタ、およびマイクロプロセッサをモニタしてかつ制御できる。例えば、正常動作時に、サービスプロセッサ604は、VRM618、620、622、および624からの出力電圧を各コア電圧686、688、694、および696に結合できる。サービスプロセッサ604は、P型電界効果トランジスタ(P−fet)644、646、650、および654のゲートを地電位に付勢してそれらのトランジスタをオンにすることにより、電圧を結合できるとともに、P−fet645、648、および652のゲートをVddなどの正電圧供給に結合してそれらのトランジスタをオフにし、異なるVRMの出力を接続するクロスカップリングラインを分離することができる。
VRMのうちの1つに故障を検知すると、サービスプロセッサ604は、故障したVRMにより影響を受けたプロセッサに、他の機能しているVRMからの電圧を結合するために、1つまたはいくつかのトランジスタの状態を切り替えることができ、それにより、影響を受けたプロセッサは、前述した技術と同様に、リセット状態に保持され、迂回され、または使用状態に戻されうる。例えば、VRM622が故障して、コア電圧694およびマイクロプロセッサ692に対する電源層に影響すると想定しよう。サービスプロセッサ604は、マイクロプロセッサおよび他のVRM出力から、VRM622の電圧出力を分離するために、P−fet650のゲートをVddに付勢することにより呼応できる。その後、サービスプロセッサ604は、コア電圧694およびマイクロプロセッサ692に供給するために他のVRMのうちの1つからの出力を結合できる。可能な結合状況のひとつは、P−fet648のゲートをアースに付勢することにより、VRM620の出力をコア電圧694およびマイクロプロセッサ692と結合することを含みうる。一目瞭然であるが、VRM624の電圧出力もまた、P−fet652を切り替えることにより、コア電圧694およびマイクロプロセッサ692と結合されうる。
サービスプロセッサ602は、サービスプロセッサ604に対して説明されたのと同様の方法で作動しうる。また、他の実施形態では、サービスプロセッサは、P−fet以外の装置を用いてVRMの電圧出力を結合できる。例えば、いくつかの実施形態では、N型fetのみ、またはP−fetおよびN−fetの組み合わせを利用できる。また、さらなる実施形態では、他の回路装置が、fet、スイッチ、または接点と共に作動しうる。例えば、図6に示されたコンピュータシステム600用のスイッチングP−fetは、デバウンシング、より滑らかな切り替え操作、および誘導性キックバック(inductive kick-back)の低減のような便益を提供するために、トランジスタと結合された容量素子および抵抗素子を有することができる。また、前述の実施形態に対する説明の中では具体的に言及されていないが、様々な実施形態構成要素にスイッチング回路網のような他の回路装置を付加することも、同様に適用可能である。
さらに、様々な実施形態に対するサービスプロセッサおよび電圧制御ユニットは、論理ゲートの比較的小規模の、かつ簡単な配置のように、比較的簡単なものでありうる。しかしながら、他の実施形態では、サービスプロセッサおよび電圧制御ユニットは、内部クロック発振器、メモリ、コード化された処理命令、および無効および電圧切り替えのプロセッサ機能を実行するソフトウェアプログラムを有する比較的複雑なプロセッサを含むことができる。
ここで、プロセッサ電圧調節器がエラーを経験するときの、マルチプロセッサコンピュータを作動する方法を示す図7および図8を参照する。図7は、マルチプロセッサを有するシステムを作動することから始まる(要素705)。異なる実施形態は、共用メモリコンピュータアーキテクチャ、分散メモリアーキテクチャ、および両者の組み合わせまたは派生のような異なるコンピュータアーキテクチャで配置されたマルチプロセッサを有することができる。すべてのプロセッサは、単一のバスで共に結合されることができ、または、プロセッサのクラスタが、より小さくかつ個別的なプロセッサグループバスを介して、共に結合されうる。
図7の方法は、電圧エラー状態に対してマルチプロセッサ・コンピュータシステムをモニタすることにより継続できる(要素710)。モニタされたエラー状態は、異なる実施形態に対しては変化しうる。例えば、いくつかの実施形態では、エラー状態は、マイクロプロセッサが必要とするVRMのうちの1つ以上の欠如でありうる。他の実施形態では、エラー状態は、良好なコア電圧の不足でありうる。エラー状態が検出されない間は、この方法により要求される動作は何も無いが、ただ、エラー状態に対するモニタを継続することを含みうる(要素715および710)。しかしながら、エラー状態が検出されると、図7の方法に基づくシステムは、電圧エラー状態を分離し、または無効にすることにより続行できる(要素715および720)。例えば、図7の方法に基づいて機能するコンピュータシステムは、分離でき、または欠陥がある電圧調節器の入力に対して電圧が供給されることを禁止できる。あるいは、実施形態は、調節器出力と調節器負荷の間に連結されたスイッチを開けることにより、不良の電圧調節器を分離できる。
図7に基づく実施形態は、電圧エラー状態により影響を受けたプロセッサをリセットし(要素725)、他の電源からの電圧を影響を受けたプロセッサに供給するために、スイッチを作動させること(要素730)により続行できる。いくつかの実施形態では、他の電源は、システムの他の電圧調節器でありうる。しかしながら、他の実施形態では、他の電圧源は、フィルタリングされておらず、かつ安定化されていない電圧源でありうる。
影響を受けたプロセッサがリセットされると(要素725)、プロセッサは、リセット状態で保持されて(要素735)、影響を受けたプロセッサと関連する入出力を、アドレスバスからトライステートすることができ(要素745)、コンピュータシステムの中の他のプロセッサが、無効にされたまたは迂回されたプロセッサにより妨げられずに、作動することを可能とする(要素750)。様々な実施形態では、影響を受けたプロセッサは、システムの他のバスから分離されうる。例えば、プロセッサは、データバス、制御バス、または3つのすべての種類のバスの組み合わせから分離されうる。
本発明の他の実施形態は、サービスプロセッサ用のプロセッサ、コア電圧プロセッサ、または、例えば、図5に示されるようなコンピュータシステム500に基づく様々な電圧源により電源を供給されるシステムプロセッサでさえ、それらのような回路部品デバイス用のプログラム製品として実現される。プログラム製品のプログラムは、実施形態の機能(本明細書で説明された方法を含む)を定義するとともに、様々なデータ保持媒体または信号保持媒体もしくはその両方に格納されうる。例としてのデータ保持媒体または信号保持媒体もしくはその両方は、(i)非書き込み可能記憶媒体上に永久保存された情報(例えば、コンピュータシステムの中の読み取り専用メモリ装置)、および(ii)書き込み可能記憶媒体上に保存された可変情報(例えば、磁気媒体)を含むが、これらに限定されない。このようなデータ保持媒体または信号保持媒体もしくはその両方は、本発明の機能を指示するマイクロプロセッサ読み込み可能命令を提供するとき、本発明の実施形態を表す。
一般に、本発明の実施形態を実現するために実行処理されるルーチンは、オペレーティングシステムの一部分、または特定の構成要素、プログラム、モジュール、オブジェクト、または回路基板装置のメモリの中に収納された一連の命令でありうる。本発明のマイクロプロセッサプログラムは、マイクロプロセッサで、機械可読フォーマットに、つまり実行可能命令に変換されるであろう多数の命令からなりうる。また、プログラムは、プログラムに対してローカルに常駐するか、もしくはメモリまたは他の記憶装置の中に見つけられる変数およびデータ構造からなりうる。さらに、以下に説明された様々なプログラムは、それらの様々なプログラムが本発明の特定の実施形態で実行される、その用途に基づいて特定されうる。しかしながら、前述のいかなる特定のプログラム専門用語も、単に便宜のために使用されているに過ぎず、したがって、本発明は、このような専門用語で特定され、示されるいかなる特定用途においても、その特定用途にのみ使用を限定されるものではないことが理解されるべきである。
コンピュータ計算およびマルチプロセッサ・コンピュータシステム設計の当業者は、マルチプロセッサ・コンピュータシステムのプロセッサに電源を供給する様々な実施形態が、マルチプロセッサ・コンピュータシステムの分野に提供する柔軟性および機会について容易に理解するであろう。これらの例は、可能な事例のうちのほんのいくつかに過ぎず、マルチプロセッサシステムのプロセッサに電源を供給する方法、または実質的に同じものを達成する機械および媒体は、マルチプロセッサ・コンピュータシステム設計の分野を提供する。
本発明が、構成要素が故障した場合にマルチプロセッサ・コンピュータシステムのプロセッサに電源を提供、かつ迂回する方法、装置、および媒体を想定することは、本開示の便益を有する当業者にとって明らかであろう。詳細な説明および図面で示されかつ説明された本発明の形態は、あくまで例として解釈されるべきであると理解される。クレームは、開示された実施形態例のすべての変形を含むように幅広く解釈されるべきである。
本発明およびそのいくつかの利点が、いくつかの実施形態に対して詳述されたが、クレームで明示された本発明の要旨および範囲を逸脱することなく、様々な変更、置換、および改変が本明細書においてなされうることが理解されるべきである。また、実施形態は、複数の目的を実現できるが、クレームの範囲内のあらゆる実施形態が、すべての目的を実現するわけではない。さらに、本願の範囲は、プロセス、機械、製品、合成物、手段、方法、および本明細書で説明されたステップの特定の実施形態に限定されるものではない。本明細書で説明された対応する実施形態と、実質的に同一機能を実行するか、または実質的に同一結果を実現する、既存の、または後に開発されるであろうプロセス、機械、製品、合成物、手段、方法、またはステップが、本発明に従って利用されうることを、当業者は、本発明の開示から容易に理解するであろう。したがって、クレームは、その範囲の中に、このようなプロセス、機械、製品、合成物、手段、方法、またはステップを含むものである。
2つのプロセッサ、2つの電圧調節器モジュール、および2つの調節器モジュールの間を切り替える装置を有するマルチプロセッサ・コンピュータシステムを示す図である。 2つのプロセッサに対するコア電圧を制御する装置を示す図である。 2プロセッサのコンピュータシステムの2つの電圧調節器モジュールからの電圧を制御するサービスプロセッサを有するシステム図をである。 プロセッサに対する電圧を制御するサービスプロセッサを備えた、4つのプロセッサおよび2つの電圧調節器モジュールを有するマルチプロセッサ・コンピュータシステムを示す図である。 サービスプロセッサが、4つのプロセッサに対する4つの電圧調節器からの電圧をどのように制御しうるかを示す図である。 8つのマイクロプロセッサ、8つの電圧調節器モジュール、およびマイクロプロセッサ間の電圧を切り替える2つのサービスプロセッサを有するコンピュータシステムを示す図である。 プロセッサ電圧調節器のうちの1つがエラーを生じた場合のマルチプロセッサコンピュータを作動する方法を示す図である。 プロセッサ電圧調節器のうちの1つがエラーを生じた場合のマルチプロセッサコンピュータを作動する方法を示す図である。

Claims (19)

  1. 制御ユニットと複数のプロセッサを有するコンピュータシステムのプロセッサに電源を供給する方法であって、
    前記制御ユニットが、前記複数のプロセッサのうちの第1のプロセッサに電圧を供給する第1の電圧調節器モジュールに関連するエラー状態検知するステップと、
    前記制御ユニットが、前記エラー状態が検知されたことに応答して、
    前記第1の電圧調節器モジュールを前記第1のプロセッサから分離するステップと、
    前記第1のプロセッサの1以上のプロセッサ入出力が前記コンピュータシステムのバスから分離される分離状態に前記第1のプロセッサを置くステップと、
    前記第1のプロセッサに第2の電圧調節器モジュールから電圧を供給するように切り替えるステップと、
    前記コンピュータシステムが、前記第1のプロセッサが前記第2の電圧調節器モジュールから電圧の供給を受けかつ前記分離状態に置かれているまま、前記複数のプロセッサのうちの他のプロセッサを作動させるステップと
    を含む、方法。
  2. 前記エラー状態を検知するステップが、前記第1の電圧調節器モジュールが供給する電圧電位が許容値より小さいかどうかを検出するステップを含む、請求項1に記載の方法。
  3. 前記エラー状態を検知するステップが、前記第1のプロセッサからの状態信号を検出するステップを含む、請求項1に記載の方法。
  4. 前記エラー状態を検知するステップが、前記第1の電圧調節器モジュールからの状態信号を検出するステップを含む、請求項1に記載の方法。
  5. 前記分離するステップが、前記第1の電圧調節器モジュールを無効にするステップを含む、請求項1に記載の方法。
  6. 前記分離するステップが、前記第1の電圧調節器モジュールの電圧電位を前記第1のプロセッサに結合するトランジスタをオフにするステップを含む、請求項1に記載の方法。
  7. 前記分離状態に前記第1のプロセッサを置くステップが、前記第1のプロセッサに無効信号を送信するステップを含み、それによって、前記第1のプロセッサに前記1以上のプロセッサ入出力をトライステートさせる、請求項1に記載の方法。
  8. 前記分離状態に前記第1のプロセッサを置くステップが、前記第1のプロセッサにリセット信号を送信するステップを含み、それによって、前記第1のプロセッサをリセット状態にさせ、かつ前記第1のプロセッサに前記1以上のプロセッサ入出力をトライステートさせる、請求項1に記載の方法。
  9. 前記切り替えるステップが、リレー接点を閉じて前記第1のプロセッサに前記第2の電圧調節器モジュールの電圧電位を結合するステップを含む、請求項1に記載の方法。
  10. 前記切り替えるステップが、トランジスタを作動状態にして前記第1のプロセッサに前記第2の電圧調節器モジュールの電圧電位を結合するステップを含む、請求項1に記載の方法。
  11. 複数のプロセッサを有するコンピュータシステムのプロセッサに電圧を供給する装置であって、
    前記複数のプロセッサのうちの第1のプロセッサに電圧を供給する第1の電圧調節器モジュールに関連するエラー状態を検出するエラー検出回路と、
    前記エラー検出回路が前記エラーを検出した場合、前記第1の電圧調節器モジュールを無効にする無効化回路と、
    前記エラー検出回路が前記エラーを検出した場合、前記第1のプロセッサの1以上のプロセッサ入出力が前記コンピュータシステムのバスから分離される分離状態に前記第1のプロセッサを置く、プロセッサ分離回路と、
    前記エラー検出回路が前記エラーを検出した場合、前記第1のプロセッサに第2の電圧調節器モジュールから電圧を供給するよう切り替える電圧スイッチング回路
    を含み、前記第1のプロセッサが前記第2の電圧調節器モジュールから電圧の供給を受けかつ前記分離状態に置かれているまま、前記複数のプロセッサのうちの他のプロセッサを作動させることを特徴とする、装置。
  12. 前記エラー検出回路、前記無効化回路、前記プロセッサ分離回路および前記電圧スイッチング回路が、サービスプロセッサの中に存在する、請求項11に記載の装置。
  13. 前記第1の電圧調節器モジュールを無効にするために、前記無効化回路に結合された無効出力をさらに含む、請求項12に記載の装置。
  14. 前記第1のプロセッサに前記第2の電圧調節器モジュールを結合するトランジスタを作動状態にするために、前記電圧スイッチング回路に結合された電圧スイッチング出力をさらに含む、請求項12に記載の装置。
  15. 前記エラー検出回路が、前記第1の電圧調節器モジュールからの電圧の欠如を検出するようになされている、請求項11に記載の装置。
  16. 前記無効化回路が、前記第1のプロセッサから前記第1の電圧調節器を電気的に分離するためのトランジスタを含む、請求項11に記載の装置。
  17. 前記プロセッサ分離回路が、前記第1のプロセッサをリセット状態に保持するようになされている、請求項11に記載の装置。
  18. 前記電圧スイッチング回路が、前記第1のプロセッサに前記第2の電圧調節器を結合するトランジスタを含む、請求項11に記載の装置。
  19. マルチプロセッサ・コンピュータシステムであって、
    2つ以上のプロセッサと、
    前記2つ以上のプロセッサに電圧を供給する2つ以上の電圧調節器モジュールと、
    前記2つ以上の電圧調節器モジュールのうちの少なくとも1つにおいて、問題を検知する電圧エラー検出モジュールと、
    前記電圧エラー検出モジュールが前記問題を検出したことに対応して、前記問題により影響を受けた前記2つ以上のプロセッサのうちの少なくとも1つから、前記少なくとも1つの電圧調節器モジュールを分離する電圧分離モジュールと、
    前記電圧エラー検出モジュールが前記問題を検出したことに対応して、前記問題により影響を受けた前記2つ以上のプロセッサのうちの前記少なくとも1つの1以上のプロセッサ入出力が前記マルチプロセッサ・コンピュータシステムのバスから分離される分離状態に該問題により影響を受けた前記2つ以上のプロセッサのうちの前記少なくとも1つを置くプロセッサ分離回路と、
    前記問題により影響を受けていない前記2つ以上の電圧調節器モジュールのうちの少なくとも1つを、前記問題により影響を受けた前記2つ以上のプロセッサのうちの前記少なくとも1つと結合する電圧スイッチングモジュール
    を含み、前記問題により影響を受けた前記2つ以上のプロセッサのうちの前記少なくとも1つが前記問題により影響を受けていない前記2つ以上の電圧調節器モジュールのうちの少なくとも1つから電圧の供給を受けかつ前記分離状態に置かれているまま、前記問題により影響を受けていない前記2つ以上のプロセッサのうちの他のプロセッサを作動させることを特徴とする、システム。
JP2006273490A 2006-10-04 2006-10-04 マルチプロセッサシステムのプロセッサに電源を供給する方法および装置 Active JP4959280B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006273490A JP4959280B2 (ja) 2006-10-04 2006-10-04 マルチプロセッサシステムのプロセッサに電源を供給する方法および装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006273490A JP4959280B2 (ja) 2006-10-04 2006-10-04 マルチプロセッサシステムのプロセッサに電源を供給する方法および装置

Publications (3)

Publication Number Publication Date
JP2008090760A JP2008090760A (ja) 2008-04-17
JP2008090760A5 JP2008090760A5 (ja) 2008-12-04
JP4959280B2 true JP4959280B2 (ja) 2012-06-20

Family

ID=39374810

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006273490A Active JP4959280B2 (ja) 2006-10-04 2006-10-04 マルチプロセッサシステムのプロセッサに電源を供給する方法および装置

Country Status (1)

Country Link
JP (1) JP4959280B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8566618B2 (en) * 2009-10-05 2013-10-22 International Business Machines Corporation Reliable setting of voltage and frequency in a microprocessor
JP5502789B2 (ja) * 2011-03-16 2014-05-28 トヨタ自動車株式会社 マルチプロセッサ装置
US9882383B2 (en) * 2014-12-23 2018-01-30 Intel Corporation Smart power delivery network

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6051741U (ja) * 1983-09-13 1985-04-11 株式会社東芝 電源切換装置
JP2833460B2 (ja) * 1993-12-27 1998-12-09 株式会社日立製作所 電源システム
JPH08123583A (ja) * 1994-10-27 1996-05-17 Oki Electric Ind Co Ltd 内部状態確定装置
JPH08221375A (ja) * 1995-02-17 1996-08-30 Hitachi Ltd 情報処理システム
JPH1031531A (ja) * 1996-07-12 1998-02-03 Ricoh Co Ltd 電子装置
JP2000112581A (ja) * 1998-10-05 2000-04-21 Toyota Motor Corp 電子制御装置
JP2001034502A (ja) * 1999-07-23 2001-02-09 Hitachi Ltd 情報処理装置およびその電圧制御方法
JP2001245088A (ja) * 2000-03-01 2001-09-07 Konica Corp 画像形成装置
JP2002236527A (ja) * 2001-02-08 2002-08-23 Hitachi Ltd マルチプロセッサシステムおよびプロセッサ制御方法
JP2004240509A (ja) * 2003-02-03 2004-08-26 Mitsubishi Electric Corp 電子制御装置への電源供給制御方式及び電子制御システム

Also Published As

Publication number Publication date
JP2008090760A (ja) 2008-04-17

Similar Documents

Publication Publication Date Title
US7526674B2 (en) Methods and apparatuses for supplying power to processors in multiple processor systems
US4176258A (en) Method and circuit for checking integrated circuit chips
US7519854B2 (en) Internal failover path for SAS disk drive enclosure
US9317366B2 (en) Protocol checking logic circuit for memory system reliability
CN105378587B (zh) 优化的电源架构
US7725762B2 (en) Implementing redundant memory access using multiple controllers on the same bank of memory
US7290128B2 (en) Fault resilient boot method for multi-rail processors in a computer system by disabling processor with the failed voltage regulator to control rebooting of the processors
US6154845A (en) Power failure safe computer architecture
US20210148968A1 (en) Self-test circuitry
JP4959280B2 (ja) マルチプロセッサシステムのプロセッサに電源を供給する方法および装置
US5159273A (en) Tri-state bus driver to support reconfigurable fault tolerant logic
US7882479B2 (en) Method and apparatus for implementing redundant memory access using multiple controllers on the same bank of memory
EP3039506B1 (en) Power management in a circuit
US9690347B2 (en) Electronic device
JPH04114221A (ja) コンピュータに於けるキースイツチ入力部の異常検出方法
US7321948B1 (en) Highly available system test mechanism
US4558447A (en) Self-testing facilities of off-chip drivers for processor and the like
CN107210937A (zh) 在数据总线中的总线监控器
US7469199B2 (en) Apparatus and method for selectively monitoring multiple voltages in an IC or other electronic chip
US8020019B2 (en) Managing voltage supply in multiple linked systems
EP4286988A1 (en) Server device capable of being stably operated in spite of power loss and method of operating the same
US11493982B2 (en) Microcontroller and power management integrated circuit application clustering for safe state management
KR100400902B1 (ko) 다중층 시스템에서 전원 오프시 레벨 제로화 회로
US20040030952A1 (en) Rambus based hot plug memory
CN114114059A (zh) 异常电源电压检测设备以及用于检测异常电源电压的方法

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20081022

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090618

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110614

RD12 Notification of acceptance of power of sub attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7432

Effective date: 20110624

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20110624

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110912

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120306

RD14 Notification of resignation of power of sub attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7434

Effective date: 20120306

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120321

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150330

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4959280

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250