JP4213415B2 - 共有リソースを有し、区画に分割されたシステムにおけるエラー抑制及びエラー処理 - Google Patents

共有リソースを有し、区画に分割されたシステムにおけるエラー抑制及びエラー処理 Download PDF

Info

Publication number
JP4213415B2
JP4213415B2 JP2002190699A JP2002190699A JP4213415B2 JP 4213415 B2 JP4213415 B2 JP 4213415B2 JP 2002190699 A JP2002190699 A JP 2002190699A JP 2002190699 A JP2002190699 A JP 2002190699A JP 4213415 B2 JP4213415 B2 JP 4213415B2
Authority
JP
Japan
Prior art keywords
resource
domain
definition table
allocated
system manager
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2002190699A
Other languages
English (en)
Other versions
JP2003076671A (ja
Inventor
和則 増山
靖 梅澤
ジェイ.ファレル ジェレミー
ミルヤラ サディール
剛 清水
ヒトシ 大井
エヌ.コンウェイ パトリック
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US10/150,618 external-priority patent/US7380001B2/en
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Publication of JP2003076671A publication Critical patent/JP2003076671A/ja
Application granted granted Critical
Publication of JP4213415B2 publication Critical patent/JP4213415B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Multi Processors (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、一般にコンピュータシステムのドメインへの区画の分割に関し、特に共有リソースを有する分割コンピュータシステムにおける障害の抑制及びエラー処理に関する。
【0002】
【従来の技術】
マルチノード・コンピュータ・システムは、しばしばドメインに分割され、各ドメインが独自にアドレス空間を有する独立した機械として機能する。分割することで、コンピュータシステムのリソースを異なるタスクに効果的に割り当てることができる。分割されたコンピュータシステムにおけるドメインは、動的にリソースを共有し得る。ドメイン内でパケット処理の決定的な障害が生じた場合は、システムで処理を継続することができない。その結果、共有リソース全体が中間状態に置かれる。システム内の障害ドメインをリセットし、再起動するためには、共有リソース全体をリセットしなければならない。たとえ他のドメインが障害なく動作していても、全てのドメインをリセットしなければならない。
【0003】
分割されたシステムにおけるエラー抑制及び復旧の解決法の1つは、各ドメインに専用のリソースを使用し、あるドメインで障害が起きた場合でも障害の起きていないドメインは影響を受けないようにすることである。しかし、分割されたシステムにおいて、各ドメインに専用リソースを使用してエラー抑制及び復旧を行うには、共有リソースを使用する場合よりも多くのリソースを必要とする。なぜなら、リソース量は、システムの全ドメインの最大要求に対応しなければならないからである。
【0004】
【発明が解決しようとする課題】
従って、システムが障害ドメインにエラーを含んでいても、他の障害のないドメインは影響を受けないような機構を提供することが望まれる。
【0005】
本発明は、相互接続によって結合された複数のコンピュータノードを有する論理的に分割されたコンピュータシステムにおける、障害抑制及びエラー処理のためのシステム及び方法である。
【0006】
【課題を解決するための手段】
システムは、幾つかの或いは全てのドメインによって動的に共有される少なくとも1つのリソースを含む。リソース定義テーブルは各リソースの状態に関する情報、例えばリソースがドメインに割り当てられているかどうか、を格納する。リソース定義テーブルはリソースとそのリソースが割り当てられているドメインとの間の関連も管理する。
【0007】
システムは、リソース定義テーブルに読み出し及び書き込みのアクセス権を有するシステムマネージャを更に含む。ドメインにパケット処理障害が起きた場合、システムマネージャはシステムを休止状態にすることにより、システムの新たなパケットの開始を強制的に一時延期する。システムマネージャは共有リソースのステータス情報を監視する。例えば、中間状態におかれている割り当てリソースを識別する。リソース定義テーブルに格納されるドメイン識別子を利用して、システムマネージャはその割り当てリソースに関連する障害ドメインも検出する。システムマネージャは関連するリソースがリソース定義テーブルにない1つ或いはそれ以上の障害のないドメインの検出も行う。その後、システムマネージャは障害のないドメインの休止状態を終了し、障害のないドメインは動作を再開し、これによりエラーを障害ドメイン内に抑制する。その後、システムマネージャは障害ドメイン内のエラーを処理する。例えば、他のドメインが将来使用するために割り当てられたリソースの割り当てを解除し、障害ドメインをリセットする。この結果、障害は障害ドメイン内に抑制され、障害のないドメインはリセットされることなく継続して動作する。
【0008】
【発明の実施の形態】
図1を参照すると、複数のドメインに分割されたマルチノード・コンピュータ・システム100のブロック線図が示されている。図1に示される各ドメイン131、135及び137は複数のノード、即ち中央制御装置(CPU)ノード105、メモリノード110及び入力/出力(I/O)ノード115を含み、相互接続120を介して接続されている。CPUノード105は従来の処理装置、例えばインテル又はインテル対応のPentiumTMクラス又はそれ以上のプロセッサ、サンのSPARCTMクラス又はそれ以上のプロセッサ、或いはIBM/モトローラのPowerPCTMクラス又はそれ以上のプロセッサである。I/Oノード115は従来のI/Oシステム、例えば記憶装置、入力装置、周辺装置等である。メモリノード110は従来のメモリシステム、例えば動的ランダムアクセスメモリシステム、静的ランダムアクセスメモリシステム等である。各ノードは別々のコンピュータチップ、コンピュータ基盤或いは独立型ユニットで実施してもよい。CPUノード105、メモリノード110及びI/Oノード115はパケットを使用し、相互接続120を介して互いに通信する。相互接続120は、例えば、従来のグローバル相互接続でもよく、またはルータを含む。各ドメイン131、135及び137は各ローカルドメインの状態を制御するローカルドメインレジスタを有する。一例としてドメインレジスタ145を図1に示す。各ローカルドメインレジスタは、好ましくは、制御レジスタ、ステータスレジスタ、エラー記録レジスタ(図示しない)等の様々な異なる型のローカルレジスタを含む。
【0009】
システム100は、システム100内の少なくとも1つのドメインによって動的に使用される1つ又はそれ以上の共有リソース130を更に含む。システム100はリソース定義テーブル155を更に含み、リソースの状態及びリソースとそのリソースが割り当てられるドメインとの関係を、たとえそのリソースがそのドメインにすでに割り当てられていなくても、格納する。リソース定義テーブル155をアドレス復号論理を含むレジスタ配列として実現し、エントリの読み出し又は書き込みを許可する。リソース定義テーブル155は別々の読み出し、書き込みポートを有する静的RAM配列で実現されてもよい。リソース定義テーブル155は図2から5に関連づけて、以下により詳しく述べる。
【0010】
システム100は、相互接続120と接続され、システムマネージャ140と呼ばれる外部エージェントを更に含む。好ましい実施態様においては、システムマネージャ140はリソース定義テーブル155へ読み出し及び書き込みアクセス権を有する。これは、システムマネージャ140が中間状態に置かれている割り当てリソースを識別するのに有効である。ドメインIDを利用することにより、システムマネージャ140はその割り当てリソースに関連する障害ドメインを識別する。システムマネージャ140はシステム100内の全ドメインのリストと障害ドメインのリストを管理する。これにより、システムマネージャ140はリソース定義テーブル155において関連リソースを持たない、障害のないドメインを識別することができる。
【0011】
システムマネージャ140は1つ或いはそれ以上のローカルドメインレジスタ、例えばドメインレジスタ145に対し読み取り及び書き込みアクセス権を有する。この権利により、システムマネージャ140は、再設定プロセスの一部としてドメイン131、135及び137を休止させる等、各個別ドメインの状態を監視及び制御することができる。ドメイン内にハードウエア障害が生じた場合、相互接続120がデッドロックされるためドメインがデッドロックされる。従来のコンピュータシステムにおいては、リソースがドメイン間で共有されているため、デッドロックされたドメインが他のドメインの動作にエラーを起こす可能性がある。システムマネージャ140はローカルドメインレジスタ、例えばレジスタ145、に対して書き込み及び読み出しアクセス権を有するので、デッドロックされたドメインのドメイン状態をリセットすることができる。システムマネージャ140は、あらゆる個別ドメイン上で動作するハードウエアやソフトウエアから独立して動作する。従って、コンピュータシステム100内のどの個別ドメインのハードウエア又はソフトウエア障害の影響も受けない。システムマネージャ140はハードウエア、ソフトウエア、ファームウエア及びこれらの組み合わせで実現されて良い。システムマネージャ140はシステム管理者(図示しない)用の制御インタフェイス(図示しない)を有するシステムコントローラ(図示しない)の一部であっても良い。
【0012】
図2を参照すると、システム100における未処理トランザクションの状態を常に把握しているリソース定義テーブル155が示されている。図2に示されるリソース定義テーブル155は8エントリを含む。リソース定義テーブル155は幾つのエントリを含んでもよいことに留意すべきである。パケットがノードから相互接続120に送られるときに、各共有リソースエントリ40はドメインに割り当てられる。共有リソースエントリ40の状態情報は、更なる処理が実行された場合には更新される。共有リソースエントリ40は一連のパケット処理が完了すると、割り当て解除される。リソース定義テーブル155は好ましくは有効ビット10、ドメインID20及びリソースエントリ30のフィールドを含む。有効ビットフィールド10は、特定の値を有し、リソースがドメインに割り当てられたかどうかを示す。本発明のある実施態様では、リソースが割り当てられている場合には有効ビットフィールド10は「1」であり、リソースが割り当て解除された場合には有効ビットフィールド10は「0」である。ドメインIDフィールド20はリソースが割り当てられたドメインを識別する。ドメインID20があるので、システム100はリソースとそれに対応するドメインの関係を管理することができ、そのため、システム100内に障害が生じた場合にシステムマネージャ140は1つあるいはそれ以上の障害のないドメインを識別することができる。図2に示すように、リソース0及び1はドメイン0に割り当てられ、リソース2はドメイン3に割り当てられ、リソース4及び7はドメイン2に割り当てられる。
【0013】
図3は、リソース定義テーブル155のリソース割り当て解除プロセスを示す。例えば、リソース4は一連のパケット処理が完了したときに割り当て解除される。そして、リソース4に対する有効ビットフィールド10は1から0へクリアされる。ドメインIDフィールド20は、リソース4がドメイン2へ割り当てられた時の値を保持していることに留意すべきである。この情報は、リソース4をどのドメインが前回使ったかを識別するのに有効である。
【0014】
図4は、割り当てのためのリソース選択プロセスを示す。割り当て用にリソースを選択するために、優先符号器(図示しない)はリソース定義テーブル155内の全リソースの有効ビット10を復号化し、最も番号の小さい、未使用リソースを選択する。図4では、リソース3が、最小番号の割り当てられていないリソースである。リソース3はパケットがノード、例えばCPUノード105、から相互接続120へ送られたときに割り当てられ、パケット処理の状態を保持する。共有リソースの状態情報は、更なる処理が実行された場合に更新される。
【0015】
図5に示すように、リソース定義テーブル155はドメイン1によるリソース3の割り当てをたどっている。ドメインがリソースを割り当てると、そのドメインまたはシステムマネージャ140のみがそのリソースの修正又は割り当て解除を許可される。図示する例では、ドメイン1又はシステムマネージャ140のみがリソース3の修正又は割り当て解除を許可される。これにより、システム100はリソース分離を維持できる。リソース分離は、リソース定義テーブル155へアクセスした全メッセージのドメインIDをチェックすることによって実現する。あるメッセージが、修正しようとしているリソースのドメインIDフィールド20内のドメインIDと異なるドメインから発せられている場合は、エラー状態を意味し、それは記録され、システムマネージャ140に報告されなければならない。
【0016】
図6は、共有リソースを有し論理的に分割されたシステムにおけるエラー抑制及び復旧の方法を示すフローチャートである。プロセスは、パケット処理障害がドメイン内で生じ、そのドメインがデッドロックされた時に開始10する。システムマネージャ140はシステム100内の全ドメインの全ノードを休止20し、新たなトランザクションを受け入れず、全ドメイン内の全未処理トランザクションは完了まで動作する。
【0017】
システムマネージャ140は、システム100を「休止」状態にするのに、好ましくは「バスロック」と呼ばれる機構を使用する。これは、ノード、例えばCPUノード105、が分割されたシステム内の全リソースをロックする必要があるときに発行される。システムマネージャ140はロック取得要求を全ドメインの各ノードへ一斉送信する。要求を受け取ったシステム100の各ノードは、システム100への新たなプロセッサ要求の発行を中止する。各ノードは、システム100からそのノードへのあらゆる未処理要求へ十分なリソースを保証してその未処理要求を完了させ、全未処理要求への返答が受信されるのを待つ。その後、ロック取得要求に対して生成された返答が各ノードによりシステムマネージャ140へ送信される。全ノードからの返答が受信されると、システム100は全未処理要求を排出し、「休止」状態に入る。
【0018】
パケット処理エラーにより要求が完了できなかった場合、その特定のノードからはロック取得要求への返答が受信されない。この状況は、単にシステムマネージャ140のタイムアウトによって検出される。タイムアウト時間が終わると、システムマネージャ140はリソース定義テーブル155を調査30し、中間状態にある割り当てリソースを識別する。ドメインIDを使用して、システムマネージャ140はその割り当てリソースに関連する障害ドメインを検出40する。また、リソース定義テーブル内で割り当てリソースを有さない1つ或いはそれ以上の障害のないドメインの検出50も行う。例えば、図2に示されるように、ドメイン0は関連するドメインを持たない障害のないドメインである。システムマネージャ140は障害のないドメインを識別すると、そのドメインの休止状態を終了する。例えば、システムマネージャ140はロック開放要求を全ドメインの全ノードに発行し、相互接続120へ新たな要求の発行を継続できるようにする。これにより、システムマネージャ140は障害を障害ドメイン内に抑制することができ、障害のないドメインは再起動しなくてもよい。
【0019】
その後、システムマネージャ140は障害ドメイン内のエラーを処理する。例えば、障害ドメインに関連するリソースの割り当て解除70を行い、他の障害のないドメインがそのリソースを利用できるようにする。このように、図3において、ドメイン2がリソース4を割り当てられた障害ドメインであった場合、システムマネージャ140はリソース4を割り当て解除し、リソース定義テーブル155の有効ビットフィールド10をクリアし、有効ビットフィールド10の値を「1」から「0」に変えることにより、そのリソースは他の障害のないドメインが使えるようにする。ドメインIDフィールド20はリソース4が割り当てられた時の値を保持していることに留意すべきである。システムマネージャ140は、この情報を使って、ドメイン「2」が前回リソース4を使用したことを識別する。
【0020】
【発明の効果】
本発明の好ましい実施態様によれば、チャネル165はシステムマネージャ140がシステムを再初期化又は再起動することにより、デッドロックされたドメイン内のハードウエア状態を選択的にリセット80するのに有効である。障害ドメインがリセットされると、プロセスは終了90する。結果として、障害は障害ドメイン内に抑制され、障害のないドメインはリセットされることなく動作を継続し、障害ドメインはリセットされる。
【0021】
付記
(付記1) パケット処理障害を障害ドメイン内に抑制して処理する分割コンピュータシステムであって、
少なくとも1つのドメインによって動的に共有される少なくとも1つの割り当てリソースの状態を格納するリソース定義テーブルを含み、各リソースは割り当てられているドメインを識別するドメインIDと関連づけられおり、
リソース定義ファイルへの書き込み及び読み出しアクセス権を有し、ドメインIDを使用して割り当てリソースとその割り当てリソースに関連する障害ドメインを識別できるシステムマネージャ、を含むコンピュータシステム。
(付記2) 相互接続を介して接続される複数のコンピュータノードを更に有し、システムマネージャは更に各ドメインの各ノードを休止状態にできる付記1に記載のシステム。
(付記3) システムマネージャが少なくとも1つ障害のないドメインを識別し、その少なくとも1つの障害のないドメインの休止状態を終えることを更に含む、付記2に記載のシステム。
(付記4) システムマネージャが、リソース定義テーブルに示されるリソースの状態を変えることにより障害ドメインに関連する割り当てリソースを割り当て解除を行うことを更に含む、付記1に記載のシステム。
(付記5) リソース定義テーブルの各リソースが、リソースが割り当てられているかどうかを示す特定値を有する有効ビットと関連づけられている、付記1に記載のシステム。
(付記6)有効ビットが0であると、前記特定値がリソースが割り当てられたことを示す、付記5に記載のシステム。
(付記7)有効ビットが1であると、前記特定値がリソースが割り当てられたことを示す、付記5に記載のシステム。
(付記8)少なくとも2つのドメインに分割され、各ドメインが複数のコンピュータノードを有するコンピュータシステムにおける、パケット処理障害を障害ドメイン内に抑制して処理する方法であって、
システムのパケット処理障害に対応して各ドメインの各ノードを休止状態に入れること、
リソース定義テーブルの割り当てリソースを識別すること、
リソース定義テーブルの割り当てリソースに関連する障害ドメインを識別すること、
リソース定義テーブルで割り当てリソースを有さない少なくとも1つの障害のないドメインを識別すること、
障害のないドメインの休止状態を終了すること、及び
リソース定義テーブルの障害リソースと関連する割り当てリソースの割り当て解除をすること、を含む方法。
(付記9) 障害ドメインをリセットするステップを更に含む、付記8に記載の方法。
(付記10) 障害ドメインをリセットするステップが、障害ドメインの状態を変えることを更に含む、付記8に記載の方法。
(付記11) 休止状態に入れるステップが、各ドメインの各ノードにロック取得要求を発行することを含む、付記8に記載の方法。
(付記12) 休止状態を終了するステップが、各ドメインの各ノードにロック開放要求を発行することを含む、付記8に記載の方法。
(付記13) コンピュータノードがCPUノードである、付記2に記載のシステム。
(付記14) コンピュータノードがI/Oノードである、付記2に記載のシステム。
(付記15) コンピュータノードがメモリノードである、付記2に記載のシステム。
(付記16) システムマネージャがハードウエアで実現される、付記1に記載のシステム。
(付記17) システムマネージャがソフトウエアで実現される、付記1に記載のシステム。
(付記18) システムマネージャがシステム外部のコンピュータにあるソフトウエアによって実現される、付記1に記載のシステム。
【図面の簡単な説明】
【図1】本発明のマルチノード・コンピュータ・システムの全体のアーキテクチャのブロック線図である。
【図2】図1の実施態様によるリソース定義テーブルのブロック線図である。
【図3】図2のリソース定義テーブル内のリソース割り当て解除プロセスを示すブロック線図である。
【図4】図2のリソース定義テーブル内の最小番号リソースを割り当てるよう選択するプロセスを示すブロック線図である。
【図5】ドメイン1によるリソース3の割り当てをたどるリソース定義テーブルを示すブロック線図である。
【図6】図1の実施態様によって実行される方法のフローチャートである。

Claims (8)

  1. パケット処理障害を障害ドメイン内に抑制して処理する分割コンピュータシステムであって、
    少なくとも1つのドメインによって動的に共有される少なくとも1つの割り当てリソースの状態を格納するリソース定義テーブルを含み、各リソースは割り当てられているドメインを識別するドメインIDと関連づけられており、
    リソース定義テーブルへの書き込み及び読み出しアクセス権を有するシステムマネージャ、を含み、
    システムマネージャは、
    ステムにパケット処理障害があると、各ドメインの各ノードによる新しいトランザクションを受け入れない休止状態に入ること、
    タイムアウト時間経過後、リソース定義テーブル中の割り当てリソースを識別すること、
    リソース定義テーブル中の割り当てリソースに関連するドメインを障害ドメイン識別すること、
    リソース定義テーブル中でそれに関連する割り当てリソースを持たないとして、少なくとも1つの障害のないドメインを識別すること、
    障害のないドメインのために休止状態を終えること、
    リソース定義テーブル中の障害ドメインに関連する割り当てリソースを割り当て解除すること、そして
    システムを再初期化することによりデッドロックされたドメイン中のハードウェア状態を選択的にリセットすること、ができる、コンピュータシステム。
  2. システムマネージャが、リソース定義テーブルに示されるリソースの状態を変えることにより障害ドメインに関連する割り当てリソースを割り当て解除を行うことを更に含む、請求項1に記載のシステム。
  3. リソース定義テーブルの各リソースが、リソースが割り当てられているかどうかを示す特定値を有する有効ビットと関連づけられている、請求項1に記載のシステム。
  4. 有効ビットが0であると、前記特定値がリソースが割り当てられたことを示す、請求項3に記載のシステム。
  5. 有効ビットが1であると、前記特定値がリソースが割り当てられたことを示す、請求項3に記載のシステム。
  6. 少なくとも2つのドメインに分割され、各ドメインが複数のコンピュータノードを有するコンピュータシステムにおける、パケット処理障害を障害ドメイン内に抑制して処理する方法であって、
    システムマネージャは、システムのパケット処理障害に対応して、各ノードによる新しいトランザクション受け入れない休止状態に入ること、
    システムマネージャは、タイムアウト時間経過後リソース定義テーブルの割り当てリソースを識別すること、
    システムマネージャは、リソース定義テーブルの割り当てリソースに関連するドメインを障害ドメイン識別すること、
    システムマネージャは、リソース定義テーブルそれに関連する割り当てリソースを有さないとして、少なくとも1つの障害のないドメインを識別すること、
    システムマネージャは、休止状態を終了すること、及び
    システムマネージャは、リソース定義テーブルの障害リソースと関連する割り当てリソースの割り当て解除をすること、を含む方法。
  7. システムマネージャにより障害ドメインをリセットするステップを更に含む、請求項6に記載の方法。
  8. 障害ドメインをリセットするステップは、システムマネージャにより障害ドメインの状態を変化させることを更に含む、請求項6に記載の方法。
JP2002190699A 2001-06-29 2002-06-28 共有リソースを有し、区画に分割されたシステムにおけるエラー抑制及びエラー処理 Expired - Fee Related JP4213415B2 (ja)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US30196901P 2001-06-29 2001-06-29
US60/301969 2001-06-29
US10/150618 2002-05-17
US10/150,618 US7380001B2 (en) 2001-05-17 2002-05-17 Fault containment and error handling in a partitioned system with shared resources

Publications (2)

Publication Number Publication Date
JP2003076671A JP2003076671A (ja) 2003-03-14
JP4213415B2 true JP4213415B2 (ja) 2009-01-21

Family

ID=26847856

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002190699A Expired - Fee Related JP4213415B2 (ja) 2001-06-29 2002-06-28 共有リソースを有し、区画に分割されたシステムにおけるエラー抑制及びエラー処理

Country Status (1)

Country Link
JP (1) JP4213415B2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4723470B2 (ja) * 2006-12-28 2011-07-13 株式会社日立製作所 計算機システムおよびそのチップセット
JP4495248B2 (ja) * 2007-03-29 2010-06-30 富士通株式会社 情報処理装置、障害処理方法
WO2009147716A1 (ja) * 2008-06-02 2009-12-10 富士通株式会社 データ処理システム、データ処理方法およびデータ処理プログラム
JP5974720B2 (ja) 2012-08-09 2016-08-23 富士通株式会社 演算処理装置、情報処理装置および情報処理装置の制御方法
JP5930046B2 (ja) * 2012-08-17 2016-06-08 富士通株式会社 情報処理装置、及び情報処理装置の制御方法

Also Published As

Publication number Publication date
JP2003076671A (ja) 2003-03-14

Similar Documents

Publication Publication Date Title
JP4181554B2 (ja) 論理区画化データ処理システムでの電力消費を削減する方法」と補正する。
US8209692B2 (en) Deallocation of computer data in a multithreaded computer
US7246187B1 (en) Method and apparatus for controlling exclusive access to a shared resource in a data storage system
US7380001B2 (en) Fault containment and error handling in a partitioned system with shared resources
US7480911B2 (en) Method and apparatus for dynamically allocating and deallocating processors in a logical partitioned data processing system
JP5102901B2 (ja) データセンタにわたる複数データサーバ間のデータ完全性を保持する方法およびシステム
JP5828348B2 (ja) 試験サーバ、情報処理システム、試験プログラムおよび試験方法
Jann et al. Dynamic reconfiguration: Basic building blocks for autonomic computing on IBM pSeries servers
US7444335B1 (en) System and method for providing cooperative resource groups for high availability applications
US20050216696A1 (en) Multi-processor system and memory accessing method
JP2003506788A (ja) 冗長システム・コントローラを試験する診断ケージ・モード
JP2004318885A (ja) 故障プロセッサを置き換える方法、媒体およびシステム
JP2004220218A (ja) 情報処理装置
JP2006178969A (ja) 動作不能なマスタ作業負荷管理プロセスを代替するシステムおよび方法
JP2004240970A (ja) 無効な論理区画の資源を動的に割り振る装置および方法
US8031637B2 (en) Ineligible group member status
US20140067771A2 (en) Management of a Scalable Computer System
JP4213415B2 (ja) 共有リソースを有し、区画に分割されたシステムにおけるエラー抑制及びエラー処理
JP2001022599A (ja) フォールトトレラント・システム,フォールトトレラント処理方法およびフォールトトレラント制御用プログラム記録媒体
JP2005135409A (ja) セルをテストするシステムおよび方法
JP2003330737A (ja) 計算機システム
US20070083867A1 (en) Method and system to recover from control block hangs in a heterogenous multiprocessor environment
JPH09282291A (ja) 共通記憶装置のロックフラグ解除方式および方法
CN116560827A (zh) 一种数据处理方法及装置
JPS6315334A (ja) 並列処理装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050520

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20070308

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070327

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070528

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20071106

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080107

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080930

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20081030

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111107

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4213415

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111107

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121107

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121107

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131107

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees