JP4001877B2 - 入出力ファブリックにおけるハードウェア・エラーからの自動回復 - Google Patents
入出力ファブリックにおけるハードウェア・エラーからの自動回復 Download PDFInfo
- Publication number
- JP4001877B2 JP4001877B2 JP2004142836A JP2004142836A JP4001877B2 JP 4001877 B2 JP4001877 B2 JP 4001877B2 JP 2004142836 A JP2004142836 A JP 2004142836A JP 2004142836 A JP2004142836 A JP 2004142836A JP 4001877 B2 JP4001877 B2 JP 4001877B2
- Authority
- JP
- Japan
- Prior art keywords
- endpoint
- fabric
- resources
- error
- resource
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0793—Remedial or corrective actions
-
- F—MECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
- F41—WEAPONS
- F41G—WEAPON SIGHTS; AIMING
- F41G1/00—Sighting devices
- F41G1/32—Night sights, e.g. luminescent
- F41G1/34—Night sights, e.g. luminescent combined with light source, e.g. spot light
- F41G1/35—Night sights, e.g. luminescent combined with light source, e.g. spot light for illuminating the target, e.g. flash lights
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0706—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
- G06F11/0712—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a virtual computing platform, e.g. logically partitioned systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0706—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
- G06F11/0745—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in an input/output transactions management context
-
- F—MECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
- F41—WEAPONS
- F41G—WEAPON SIGHTS; AIMING
- F41G11/00—Details of sighting or aiming apparatus; Accessories
- F41G11/001—Means for mounting tubular or beam shaped sighting or aiming devices on firearms
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Quality & Reliability (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Optics & Photonics (AREA)
- Debugging And Monitoring (AREA)
Description
12 システム・プロセッサ
14 メモリ
16 バス
18 ハードウェア/スレッド
20 IOファブリック
22 ネットワーク・アダプタ
24 ネットワーク
26 記憶制御装置
28 ワークステーション・コントローラ
32 ワークステーション
34 区画
36 区画マネージャ
38 区画マネージャ(ディスパッチ不可部)
40 区画マネージャ(ディスパッチ可能部)
42 オペレーティング・システム
44 ユーザ・アプリケーション
46 仮想LAN
52 IOファブリック
54 メモリ
56 スロット
58 プロセッサ
60 メモリ
68 RIOハブ
70 RIOブリッジ
72 PCIホスト・ブリッジ
74 PCI−PCIブリッジ
Claims (41)
- 論理区画化されたコンピュータにおいて、複数のプロセッサと、複数のIOアダプタ・スロットと、前記複数のプロセッサに結合され、前記複数のIOアダプタ・スロットへのプロセッサ・アクセスを可能にするように構成された入出力(IO)ファブリックであって、
各前記IOアダプタ・スロットと前記複数のプロセッサとの間の複数のハードウェア経路を規定する複数のIOファブリック要素を有し、前記複数のIOファブリック要素が前記複数のIOアダプタ・スロットのサブセットへのアクセスを可能にする第1のIOファブリック要素を含む、入出力(IO)ファブリックと、
前記複数のプロセッサのうちの少なくとも1つのプロセッサ上で実行される複数の論理区画と、
前記複数の論理区画のうちの1つの論理区画内に存在し、前記複数のIOアダプタ・スロットのうちの第1のIOアダプタ・スロットにアクセスするように構成されたデバイス・ドライバと、
前記複数のプロセッサのうちの少なくとも1つのプロセッサ上で実行され、前記複数の論理区画を管理するように構成された区画マネージャと、
前記区画マネージャ内に存在し、前記区画マネージャに、前記第1のIOファブリック要素内で検出されたエラーに応答させてIOアダプタの各サブセットについてエラー状態を設定させ、前記複数のIOアダプタ・スロットのそれぞれについて前記エラー状態を設定させた後で、前記第1のIOファブリック要素における一連のハードウェア動作を行わせ前記エラーから回復させるように構成された第1のプログラム・コードと、
前記区画マネージャ内に存在し、前記区画マネージャに、前記デバイス・ドライバが所定の手順を実行しないことにより回復不能なデバイス・ドライバであることを、検出させ、その検出に応答させて、前記第1のIOアダプタ・スロットと前記複数のプロセッサとの間のハードウェア経路内に規定された各IOファブリック要素においてマシン・チェック通知を動的に有効にさせるように構成された第2のプログラム・コードと、
を有する論理区画化コンピュータ。 - 複数の論理区画を含む論理区画化コンピュータ内に配置された、少なくとも1つのプロセッサに結合され、複数のエンドポイントIO資源へのアクセスを可能にする少なくとも1つのIOファブリック要素を含む入出力(IO)ファブリックにおけるエラー処理において、前記複数のエンドポイントIO資源が割り振られる前記論理区画を管理する区画マネージャによる方法であって、
前記IOファブリック要素において検出されたエラーに応答して、前記エンドポイントIO資源についてエラー状態を設定するステップと、
前記IOファブリック要素における一連のハードウェア動作を行わせ前記エラーから回復するステップと、
前記IOファブリック要素における前記エラーからの回復後に、前記論理区画に割り振られている前記エンドポイントIO資源ごとの回復プロトコルにより前記エラー状態から回復するステップと、
を有する方法。 - 前記IOファブリック要素における前記エラーからの回復後に、前記複数のエンドポイントIO資源のうちの第1のエンドポイントIO資源にアクセスすることができるオペレーティング・システム内で、
前記第1のエンドポイントIO資源の前記エラー状態を検出し、前記第1のエンドポイントIO資源ごとの回復プロトコルにより前記オペレーティング・システム内のエラー回復を実行するステップと、
前記第1のエンドポイントIO資源について前記エラー状態をリセットするステップと、
をさらに有する、請求項2に記載の方法。 - 前記IOファブリック要素における前記エラーからの回復後に、前記複数のエンドポイントIO資源のそれぞれについて前記エラー状態を前記論理区画ごとに非同期でリセットするステップをさらに有する、請求項2に記載の方法。
- 前記複数のエンドポイントIO資源のそれぞれについて前記エラー状態を前記論理区画ごとに非同期でリセットする前記ステップは、前記複数のエンドポイントIO資源のそれぞれを対象とするアクセス要求に応答して実行される、請求項4に記載の方法。
- 前記IOファブリック要素における前記エラーからの回復後に、前記複数のエンドポイントIO資源のうちの第1のエンドポイントIO資源において前記エラー状態の通知を生成するステップをさらに有し、前記第1のエンドポイントIO資源について前記エラー状態を前記論理区画ごとに非同期でリセットする前記ステップは、前記通知に応答して実行される、請求項4に記載の方法。
- 前記IOファブリック要素は、ペリフェラル・コンポーネント・インターコネクト(Peripheral Component Interconnect:PCI)ホスト・ブリッジと、多機能PCI−PCIブリッジ装置と、リモート入出力(RIO)ブリッジと、RIOハブと、スイッチ装置とから成るグループから選択される、請求項2に記載の方法。
- 前記複数のエンドポイントIO資源はIOアダプタ・スロットを含む、請求項2に記載の方法。
- 前記IOファブリックはメモリ・マップ入出力(MMIO)ファブリックである、請求項2に記載の方法。
- 前記IOファブリック要素における前記エラーからの回復後に、エンドポイントIO資源の前記エラー状態を示す情報を、該エンドポイントIO資源が割り振られている論理区画内のデバイス・ドライバによって生成されたアクセス要求に応答して、該デバイス・ドライバに返すステップと、
前記IOファブリック要素における前記エラー状態からの復帰に応答して、前記デバイス・ドライバを使用して前記エンドポイントIO資源における前記エラー状態から回復するステップと、
をさらに有する、請求項2に記載の方法。 - 前記複数のエンドポイントIO資源のうちの1つのエンドポイント資源を対象とするロード動作の結果から、前記IOファブリック要素における前記エラーを検出するステップをさらに有する、請求項2に記載の方法。
- 前記IOファブリック要素がエラー状態になることに応答して生成された割込みから、前記IOファブリック要素における前記エラーを検出するステップをさらに有する、請求項2に記載の方法。
- 複数の論理区画を含む論理区画化コンピュータ内に配置された、少なくとも1つのプロセッサと、
少なくとも1つの前記プロセッサに結合され、複数のエンドポイントIO資源へのプロセッサ・アクセスを可能にする少なくとも1つのIOファブリック要素を有するIOファブリックと、
前記複数のエンドポイントIO資源が割り振られる前記論理区画を管理する区画マネージャと、
前記区画マネージャ内に存在し、前記区画マネージャに、
前記IOファブリック要素において検出されたエラーに応答させて、前記エンドポイントIO資源について、エラー状態を設定させ、
前記IOファブリック要素における一連のハードウェア動作を行わせ前記エラーから回復させた後に、前記論理区画に割り振られている前記エンドポイントIO資源ごとの回復プロトコルにより前記エラー状態から回復させるように構成されたプログラム・コードと、
を有する装置。 - 前記プログラム・コードの少なくとも一部は、前記複数のエンドポイントIO資源のうちの第1のエンドポイントIO資源にアクセスすることができるオペレーティング・システム内に存在し、前記プログラム・コードの少なくとも一部は、前記第1のエンドポイントIO資源のエラー状態を検出し、前記第1のエンドポイントIO資源ごとの回復プロトコルにより前記オペレーティング・システム内のエラー回復を実行し、前記IOファブリック要素における前記エラーからの回復後に、前記第1のエンドポイントIO資源について前記エラー状態をリセットするように構成された、請求項13に記載の装置。
- 前記プログラム・コードは、前記IOファブリック要素における前記エラーからの回復後に、前記複数のエンドポイントIO資源のそれぞれについて前記エラー状態を前記論理区画ごとに非同期でリセットするようにさらに構成された、請求項13に記載の装置。
- 前記プログラム・コードは、前記複数のエンドポイントIO資源のそれぞれを対象とするアクセス要求に応答して、前記複数のエンドポイントIO資源のそれぞれについて前記エラー状態を前記論理区画ごとに非同期でリセットするように構成された、請求項15に記載の装置。
- 前記プログラム・コードは、前記IOファブリック要素における前記エラーからの回復後に、前記複数のエンドポイントIO資源のうちの第1のエンドポイントIO資源において前記エラー状態の通知を生成するようにさらに構成され、前記プログラム・コードは、前記通知に応答して前記第1のエンドポイントIO資源の前記エラー状態を前記論理区画ごとに非同期でリセットするように構成された、請求項15に記載の装置。
- 前記IOファブリック要素は、ペリフェラル・コンポーネント・インターコネクト(PCI)ホスト・ブリッジと、多機能PCI−PCIブリッジ装置と、リモート入出力(RIO)ブリッジと、RIOハブと、スイッチ装置とから成るグループから選択される、請求項13に記載の装置。
- 前記プログラム・コードは、前記IOファブリック要素における前記エラーの回復後に、エンドポイントIO資源が割り振られている論理区画内のデバイス・ドライバによって生成されたアクセス要求に応答して、該エンドポイントIO資源のエラー状態を該デバイス・ドライバに返し、前記エラー状態に応答して、該デバイス・ドライバを使用して該エンドポイントIO資源における前記エラー状態から回復するようにさらに構成された、請求項13に記載の装置。
- 複数の論理区画を含む論理区画化コンピュータ内に配置された、少なくとも1つのプロセッサに結合され、複数のエンドポイントIO資源へのアクセスを可能にする少なくとも1つのIOファブリック要素を含む入出力(IO)ファブリックにおけるエラー処理において、前記複数のエンドポイントIO資源が割り振られる前記論理区画を管理する区画マネージャに実行させるプログラムであって、
前記区画マネージャ内に存在し、前記区画マネージャに、
前記IOファブリック要素において検出されたエラーに応答させて、前記エンドポイントIO資源について、エラー状態を設定させ、
前記IOファブリック要素における一連のハードウェア動作を行わせ前記エラーから回復させた後に、前記論理区画に割り振られている前記エンドポイントIO資源ごとの回復プロトコルにより前記エラー状態から回復させるように構成されたプログラム - 請求項20に記載のプログラムを記録したコンピュータ読取可能な記録媒体。
- 複数の論理区画を含む論理区画化コンピュータ内に配置された、少なくとも1つのプロセッサに結合され、複数のエンドポイントIO資源へのアクセスを可能にする少なくとも1つのIOファブリック要素を含む入出力(IO)ファブリックにおけるエラー処理において、前記複数のエンドポイントIO資源が割り振られる前記論理区画を管理する区画マネージャによる方法であって、
前記複数のエンドポイントIO資源のうちの第1のエンドポイントIO資源が所定の手順を実行しないことにより回復不能な資源であることを、検出するステップと、
前記検出に応答して、前記プロセッサと前記第1のエンドポイントIO資源との間のハードウェア経路内に規定された各IOファブリック要素においてマシン・チェック通知を動的に有効にするステップと、
を有する方法。 - 前記第1のエンドポイントIO資源が所定の手順を実行しないことにより回復不能資源であることを検出する前記ステップは、前記第1のエンドポイントIO資源にアクセスを試みるデバイス・ドライバにより、前記第1のエンドポイントIO資源がマシン・チェック通知を無効にする要求の手順を実行していないこと、を検出するステップを有する、請求項22に記載の方法。
- 前記第1のエンドポイントIO資源についてマシン・チェック通知が許可されているか否かを判断するステップをさらに有し、前記第1のエンドポイントIO資源についてマシン・チェック通知が許可されている場合にのみ、マシン・チェック通知を動的に有効にする、請求項22に記載の方法。
- 前記第1のエンドポイントIO資源についてマシン・チェック通知が許可されているか否かを判断する前記ステップは、前記第1のエンドポイントIO資源が同じ論理区画にバインドされたエンドポイントIO資源のみに対するアクセスを可能にするファブリック領域に配置されているか否かを判断するステップの後に許可されているか否かを判断する、請求項24に記載の方法。
- 前記ファブリック領域は、複数のPCI−PCIブリッジを介して前記複数のエンドポイントIO資源のサブセットに結合されたPCIホスト・ブリッジを有する、請求項25に記載の方法。
- ファブリック領域によってアクセスすることができるエンドポイントIOに回復不能なエンドポイントIOがないことを検出するとそれに応答して、前記ファブリック領域内の各IOファブリック要素におけるマシン・チェック通知を動的に無効にするステップをさらに有する、請求項25に記載の方法。
- 前記ファブリック領域内に配置された第2のエンドポイントIO資源を他の論理区画に割り振ることができないようにするステップをさらに有する、請求項25に記載の方法。
- 前記複数のIOファブリック要素は、少なくとも1つのリモート入出力(RIO)ハブと、少なくとも1つのRIOブリッジと、少なくとも1つのPCIホスト・ブリッジと、少なくとも1つのPCI−PCIブリッジとを有し、前記プロセッサと前記第1のエンドポイントIO資源との間のハードウェア経路は、前記RIOハブと、前記RIOブリッジと、前記PCIホスト・ブリッジと、前記PCI−PCIブリッジとを有する、請求項22に記載の方法。
- マシン・チェック通知を無効にするように前記IOファブリックを初期設定するステップをさらに有する、請求項22に記載の方法。
- 複数の論理区画を含む論理区画化コンピュータ内に配置された、少なくとも1つのプロセッサと、
複数のIOファブリック要素を有し、前記少なくとも1つのプロセッサを複数のエンドポイントIO資源に結合するように構成されたIOファブリックと、
前記複数のエンドポイントIO資源が割り振られる前記論理区画を管理する区画マネージャと、
前記区画マネージャ内に存在し、前記区画マネージャに、
前記IOファブリックに結合された第1のエンドポイントIO資源が所定の手順を実行しないことにより回復不能な資源であることを検出させ、
その検出に応答させて、前記プロセッサと前記第1のエンドポイントIO資源との間のハードウェア経路内に規定された各IOファブリック要素においてマシン・チェック通知を動的に有効にさせ、エラーから回復させるように構成されたプログラム・コードと、
を有する装置。 - 前記プログラム・コードは、前記第1のエンドポイントIO資源にアクセスを試みるデバイス・ドライバにより、前記第1のエンドポイントIO資源がマシン・チェック信号の無効化要求の手順を実行していないこと、を検出させることによって、前記第1のエンドポイントIO資源が回復不能な資源であることを検出させるように構成された、請求項31に記載の装置。
- 前記プログラム・コードは、前記第1のエンドポイントIO資源についてマシン・チェック通知が許可されているか否かを判断させるようにさらに構成され、前記プログラム・コードは、前記第1のエンドポイントIO資源についてマシン・チェック通知が許可されている場合にのみマシン・チェック通知を動的に有効にさせるように構成された、請求項31に記載の装置。
- 前記プログラム・コードは、前記第1のエンドポイントIO資源が、同じ論理区画にバインドされたエンドポイントIO資源のみに対するアクセスを可能にするファブリック領域内に配置されているか否かを判断させることによって、前記第1のエンドポイントIO資源についてマシン・チェック通知が許可されているか否かを判断させるように構成された、請求項33に記載の装置。
- 前記ファブリック領域は、複数のPCI−PCIブリッジを介して前記複数のエンドポイントIO資源のサブセットに結合されたPCIホスト・ブリッジを有する、請求項34に記載の装置。
- 前記プログラム・コードは、ファブリック領域によってアクセスすることができるエンドポイントIO資源に回復不能なエンドポイントIO資源がないと判断させるとそれに応答させて、前記ファブリック領域内の各IOファブリック要素においてマシン・チェック通知を動的に無効にさせるように構成された、請求項34に記載の装置。
- 前記プログラム・コードは、前記ファブリック領域内に配置された第2のエンドポイントIO資源を他の論理区画に割り振ることを禁止させるように構成された、請求項34に記載の装置。
- 前記複数のIOファブリック要素は、少なくとも1つのリモート入出力(RIO)ハブと、
少なくとも1つのRIOブリッジと、
少なくとも1つのPCIホスト・ブリッジと、
少なくとも1つのPCI−PCIブリッジとを有し、
前記プロセッサと前記第1のエンドポイントIO資源との間のハードウェア経路は、前記RIOハブと、前記RIOブリッジと、前記PCIホスト・ブリッジと、前記PCI−PCIブリッジとを有する、請求項31に記載の装置。 - 前記プログラム・コードは、前記IOファブリックを初期設定してマシン・チェック通知を無効にするように構成された、請求項31に記載の装置。
- 複数の論理区画を含む論理区画化コンピュータ内に配置された、少なくとも1つのプロセッサに結合され、複数のエンドポイントIO資源へのアクセスを可能にする少なくとも1つのIOファブリック要素を含む入出力(IO)ファブリックにおけるエラー処理において、前記複数のエンドポイントIO資源が割り振られる前記論理区画を管理する区画マネージャに実行させるプログラムであって、
区画マネージャ内に存在し、前記区画マネージャに、
前記複数のエンドポイントIO資源のうちの第1のエンドポイントIO資源が所定の手順を実行しないことにより回復不能資源であることを検出させ、その検出に応答させて、前記プロセッサと前記第1のエンドポイントIO資源との間のハードウェア経路内に規定された前記IOファブリック内の複数のIOファブリック要素のそれぞれにおいてマシン・チェック通知を動的に有効にさせるように構成されたプログラム。 - 請求項40に記載のプログラムを記録したコンピュータ読取可能な記録媒体。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US10/438,392 US7134052B2 (en) | 2003-05-15 | 2003-05-15 | Autonomic recovery from hardware errors in an input/output fabric |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2004342109A JP2004342109A (ja) | 2004-12-02 |
JP4001877B2 true JP4001877B2 (ja) | 2007-10-31 |
Family
ID=33417559
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004142836A Expired - Fee Related JP4001877B2 (ja) | 2003-05-15 | 2004-05-12 | 入出力ファブリックにおけるハードウェア・エラーからの自動回復 |
Country Status (3)
Country | Link |
---|---|
US (2) | US7134052B2 (ja) |
JP (1) | JP4001877B2 (ja) |
KR (1) | KR100612715B1 (ja) |
Families Citing this family (105)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7934020B1 (en) * | 2003-09-19 | 2011-04-26 | Vmware, Inc. | Managing network data transfers in a virtual computer system |
US7430691B2 (en) * | 2003-10-09 | 2008-09-30 | International Business Machines Corporation | Method, system, and product for providing extended error handling capability in host bridges |
US7355358B2 (en) * | 2003-10-23 | 2008-04-08 | Hewlett-Packard Development Company, L.P. | Configurable H-bridge circuit |
US7130982B2 (en) * | 2004-03-31 | 2006-10-31 | International Business Machines Corporation | Logical memory tags for redirected DMA operations |
TW200537305A (en) * | 2004-05-04 | 2005-11-16 | Quanta Comp Inc | Communication system, transmission device and the control method thereof |
US7487403B2 (en) * | 2004-11-12 | 2009-02-03 | International Business Machines Corporation | Method for handling a device failure |
US20060143544A1 (en) * | 2004-12-17 | 2006-06-29 | Michael Ho | Remote status forwarding in a distributed cross-connection system |
TWI263143B (en) * | 2004-12-31 | 2006-10-01 | Inventec Corp | World wide port name embedding method and interface for network transmission control chip |
US7496790B2 (en) * | 2005-02-25 | 2009-02-24 | International Business Machines Corporation | Method, apparatus, and computer program product for coordinating error reporting and reset utilizing an I/O adapter that supports virtualization |
TWI277873B (en) * | 2005-05-03 | 2007-04-01 | Via Tech Inc | IDE control system and redundant array of independent disks system with a hot plug function therein |
US7496045B2 (en) | 2005-07-28 | 2009-02-24 | International Business Machines Corporation | Broadcast of shared I/O fabric error messages in a multi-host environment to all affected root nodes |
JP2007058439A (ja) * | 2005-08-23 | 2007-03-08 | Sharp Corp | 画像処理システム |
JP2007094996A (ja) * | 2005-09-30 | 2007-04-12 | Fujitsu Ltd | データストレージシステム、データストレージ制御装置及びその障害箇所診断方法 |
US7631050B2 (en) * | 2005-10-27 | 2009-12-08 | International Business Machines Corporation | Method for confirming identity of a master node selected to control I/O fabric configuration in a multi-host environment |
US7363404B2 (en) * | 2005-10-27 | 2008-04-22 | International Business Machines Corporation | Creation and management of destination ID routing structures in multi-host PCI topologies |
US7430630B2 (en) * | 2005-10-27 | 2008-09-30 | International Business Machines Corporation | Routing mechanism in PCI multi-host topologies using destination ID field |
US7395367B2 (en) * | 2005-10-27 | 2008-07-01 | International Business Machines Corporation | Method using a master node to control I/O fabric configuration in a multi-host environment |
US7474623B2 (en) * | 2005-10-27 | 2009-01-06 | International Business Machines Corporation | Method of routing I/O adapter error messages in a multi-host environment |
TWI291101B (en) * | 2005-12-05 | 2007-12-11 | Ibm | Bus adapter, method thereof, and computer system thereof |
US20070136458A1 (en) * | 2005-12-12 | 2007-06-14 | Boyd William T | Creation and management of ATPT in switches of multi-host PCI topologies |
US20070240018A1 (en) * | 2005-12-29 | 2007-10-11 | Intel Corporation | Functional level reset on a per device/function basis |
US20070165596A1 (en) * | 2006-01-18 | 2007-07-19 | Boyd William T | Creation and management of routing table for PCI bus address based routing with integrated DID |
US7707465B2 (en) * | 2006-01-26 | 2010-04-27 | International Business Machines Corporation | Routing of shared I/O fabric error messages in a multi-host environment to a master control root node |
US7380046B2 (en) * | 2006-02-07 | 2008-05-27 | International Business Machines Corporation | Method, apparatus, and computer program product for routing packets utilizing a unique identifier, included within a standard address, that identifies the destination host computer system |
US7484029B2 (en) * | 2006-02-09 | 2009-01-27 | International Business Machines Corporation | Method, apparatus, and computer usable program code for migrating virtual adapters from source physical adapters to destination physical adapters |
US7631206B2 (en) * | 2006-02-10 | 2009-12-08 | Intel Corporation | Method and apparatus to support enhanced energy efficiency in a processing system |
JP4728896B2 (ja) * | 2006-07-13 | 2011-07-20 | エヌイーシーコンピュータテクノ株式会社 | コンピュータシステム |
US20080133962A1 (en) * | 2006-12-04 | 2008-06-05 | Bofferding Nicholas E | Method and system to handle hardware failures in critical system communication pathways via concurrent maintenance |
US7571273B2 (en) * | 2006-12-06 | 2009-08-04 | International Business Machines Corporation | Bus/device/function translation within and routing of communications packets in a PCI switched-fabric in a multi-host environment utilizing multiple root switches |
WO2008099453A1 (ja) * | 2007-02-09 | 2008-08-21 | Fujitsu Limited | 縮退方法および情報処理装置 |
US7926069B2 (en) * | 2007-02-26 | 2011-04-12 | International Business Machines Corporation | Apparatus, system, and method for extending a device driver to facilitate a network connection to a remote event manager |
WO2008120383A1 (ja) * | 2007-03-29 | 2008-10-09 | Fujitsu Limited | 情報処理装置、障害処理方法 |
US20080240134A1 (en) * | 2007-03-30 | 2008-10-02 | International Business Machines Corporation | Multi-node, peripheral component switch for a computer system |
US8141093B2 (en) * | 2007-11-15 | 2012-03-20 | International Business Machines Corporation | Management of an IOV adapter through a virtual intermediary in an IOV management partition |
US8141092B2 (en) * | 2007-11-15 | 2012-03-20 | International Business Machines Corporation | Management of an IOV adapter through a virtual intermediary in a hypervisor with functional management in an IOV management partition |
US8141094B2 (en) * | 2007-12-03 | 2012-03-20 | International Business Machines Corporation | Distribution of resources for I/O virtualized (IOV) adapters and management of the adapters through an IOV management partition via user selection of compatible virtual functions |
US9298568B2 (en) * | 2008-02-07 | 2016-03-29 | International Business Machines Corporation | Method and apparatus for device driver state storage during diagnostic phase |
US8359415B2 (en) * | 2008-05-05 | 2013-01-22 | International Business Machines Corporation | Multi-root I/O virtualization using separate management facilities of multiple logical partitions |
JP5161696B2 (ja) * | 2008-08-07 | 2013-03-13 | 株式会社日立製作所 | 仮想計算機システムおよび仮想計算機システムにおけるエラー回復方法ならびに仮想計算機制御プログラム |
US20100107148A1 (en) * | 2008-10-28 | 2010-04-29 | International Business Machines Corporation | Check-stopping firmware implemented virtual communication channels without disabling all firmware functions |
US8010838B2 (en) * | 2008-11-20 | 2011-08-30 | International Business Machines Corporation | Hardware recovery responsive to concurrent maintenance |
US8144582B2 (en) * | 2008-12-30 | 2012-03-27 | International Business Machines Corporation | Differentiating blade destination and traffic types in a multi-root PCIe environment |
JPWO2010084529A1 (ja) * | 2009-01-23 | 2012-07-12 | 株式会社日立製作所 | 情報処理システム |
US8112674B2 (en) * | 2009-04-01 | 2012-02-07 | International Business Machines Corporation | Device activity triggered device diagnostics |
TW201041336A (en) * | 2009-05-07 | 2010-11-16 | Jmicron Technology Corp | Network control circuit having pseudo hot plug function and pseudo hot plug method for network control circuit |
US8510592B1 (en) * | 2009-09-15 | 2013-08-13 | Netapp, Inc. | PCI error resilience |
JP4873073B2 (ja) * | 2009-12-16 | 2012-02-08 | 日本電気株式会社 | 情報処理装置及び情報処理装置の障害復旧方法 |
US8151147B2 (en) * | 2009-12-17 | 2012-04-03 | Hewlett-Packard Development Company, L.P. | Synchronize error handling for a plurality of partitions |
US8234515B2 (en) * | 2010-04-01 | 2012-07-31 | Accenture Global Services Limited | Repurposable recovery environment |
US8504754B2 (en) | 2010-06-23 | 2013-08-06 | International Business Machines Corporation | Identification of types of sources of adapter interruptions |
US8645767B2 (en) | 2010-06-23 | 2014-02-04 | International Business Machines Corporation | Scalable I/O adapter function level error detection, isolation, and reporting |
US8645606B2 (en) | 2010-06-23 | 2014-02-04 | International Business Machines Corporation | Upbound input/output expansion request and response processing in a PCIe architecture |
US8745292B2 (en) | 2010-06-23 | 2014-06-03 | International Business Machines Corporation | System and method for routing I/O expansion requests and responses in a PCIE architecture |
US8478922B2 (en) | 2010-06-23 | 2013-07-02 | International Business Machines Corporation | Controlling a rate at which adapter interruption requests are processed |
US8566480B2 (en) | 2010-06-23 | 2013-10-22 | International Business Machines Corporation | Load instruction for communicating with adapters |
US8683108B2 (en) | 2010-06-23 | 2014-03-25 | International Business Machines Corporation | Connected input/output hub management |
US8615645B2 (en) | 2010-06-23 | 2013-12-24 | International Business Machines Corporation | Controlling the selectively setting of operational parameters for an adapter |
US8510599B2 (en) | 2010-06-23 | 2013-08-13 | International Business Machines Corporation | Managing processing associated with hardware events |
US8572635B2 (en) | 2010-06-23 | 2013-10-29 | International Business Machines Corporation | Converting a message signaled interruption into an I/O adapter event notification |
US8468284B2 (en) | 2010-06-23 | 2013-06-18 | International Business Machines Corporation | Converting a message signaled interruption into an I/O adapter event notification to a guest operating system |
US8626970B2 (en) | 2010-06-23 | 2014-01-07 | International Business Machines Corporation | Controlling access by a configuration to an adapter function |
US8505032B2 (en) | 2010-06-23 | 2013-08-06 | International Business Machines Corporation | Operating system notification of actions to be taken responsive to adapter events |
US8650335B2 (en) | 2010-06-23 | 2014-02-11 | International Business Machines Corporation | Measurement facility for adapter functions |
US9342352B2 (en) | 2010-06-23 | 2016-05-17 | International Business Machines Corporation | Guest access to address spaces of adapter |
US9195623B2 (en) | 2010-06-23 | 2015-11-24 | International Business Machines Corporation | Multiple address spaces per adapter with address translation |
US8549182B2 (en) | 2010-06-23 | 2013-10-01 | International Business Machines Corporation | Store/store block instructions for communicating with adapters |
US9213661B2 (en) * | 2010-06-23 | 2015-12-15 | International Business Machines Corporation | Enable/disable adapters of a computing environment |
US8615622B2 (en) | 2010-06-23 | 2013-12-24 | International Business Machines Corporation | Non-standard I/O adapters in a standardized I/O architecture |
US8650337B2 (en) | 2010-06-23 | 2014-02-11 | International Business Machines Corporation | Runtime determination of translation formats for adapter functions |
US8635430B2 (en) | 2010-06-23 | 2014-01-21 | International Business Machines Corporation | Translation of input/output addresses to memory addresses |
US8621112B2 (en) | 2010-06-23 | 2013-12-31 | International Business Machines Corporation | Discovery by operating system of information relating to adapter functions accessible to the operating system |
US8639858B2 (en) | 2010-06-23 | 2014-01-28 | International Business Machines Corporation | Resizing address spaces concurrent to accessing the address spaces |
US8918573B2 (en) | 2010-06-23 | 2014-12-23 | International Business Machines Corporation | Input/output (I/O) expansion response processing in a peripheral component interconnect express (PCIe) environment |
US8261128B2 (en) * | 2010-08-04 | 2012-09-04 | International Business Machines Corporation | Selection of a domain of a configuration access |
EP2635972A4 (en) * | 2010-10-13 | 2016-10-26 | Zte Usa Inc | SYSTEM AND METHOD FOR MULTIMEDIA MULTICULTURE PEERING (M2P2) |
US8645755B2 (en) * | 2010-12-15 | 2014-02-04 | International Business Machines Corporation | Enhanced error handling for self-virtualizing input/output device in logically-partitioned data processing system |
JP5548647B2 (ja) * | 2011-04-25 | 2014-07-16 | 株式会社日立製作所 | 計算機システムでの部分障害処理方法 |
US8719626B2 (en) | 2011-09-28 | 2014-05-06 | International Business Machines Corporation | Proactively removing channel paths in error from a variable scope of I/O devices |
US9288161B2 (en) * | 2011-12-05 | 2016-03-15 | International Business Machines Corporation | Verifying the functionality of an integrated circuit |
WO2014209251A2 (en) * | 2012-06-06 | 2014-12-31 | Intel Corporation | Recovery after input/ouput error-containment events |
US9372786B1 (en) * | 2012-06-13 | 2016-06-21 | Amazon Technologies, Inc. | Constructing state-transition functions for mobile devices |
US9160472B2 (en) * | 2012-09-07 | 2015-10-13 | National Instruments Corporation | Clock synchronization over a switched fabric |
CN104756081B (zh) * | 2013-09-11 | 2016-08-17 | 华为技术有限公司 | 一种故障处理的方法、计算机系统和装置 |
US9766916B2 (en) | 2014-05-05 | 2017-09-19 | International Business Machines Corporation | Implementing coherent accelerator function isolation for virtualization |
US9632854B2 (en) | 2014-11-05 | 2017-04-25 | International Business Machines Corporation | Electronic system configuration management |
US9792171B2 (en) | 2015-10-26 | 2017-10-17 | International Business Machines Corporation | Multiple reset modes for a PCI host bridge |
US10591977B2 (en) * | 2015-12-10 | 2020-03-17 | Arm Limited | Segregated power state control in a distributed cache system |
US10042720B2 (en) | 2016-02-22 | 2018-08-07 | International Business Machines Corporation | Live partition mobility with I/O migration |
US10002018B2 (en) | 2016-02-23 | 2018-06-19 | International Business Machines Corporation | Migrating single root I/O virtualization adapter configurations in a computing system |
US10042723B2 (en) | 2016-02-23 | 2018-08-07 | International Business Machines Corporation | Failover of a virtual function exposed by an SR-IOV adapter |
US10025584B2 (en) | 2016-02-29 | 2018-07-17 | International Business Machines Corporation | Firmware management of SR-IOV adapters |
WO2017158666A1 (ja) * | 2016-03-14 | 2017-09-21 | 株式会社日立製作所 | 計算機システム、計算機システムのエラー処理方法 |
US9785451B1 (en) * | 2016-10-21 | 2017-10-10 | International Business Machines Corporation | Migrating MMIO from a source I/O adapter of a computing system to a destination I/O adapter of the computing system |
US9715469B1 (en) | 2016-10-21 | 2017-07-25 | International Business Machines Corporation | Migrating interrupts from a source I/O adapter of a source computing system to a destination I/O adapter of a destination computing system |
US9720863B1 (en) | 2016-10-21 | 2017-08-01 | International Business Machines Corporation | Migrating MMIO from a source I/O adapter of a source computing system to a destination I/O adapter of a destination computing system |
US9720862B1 (en) | 2016-10-21 | 2017-08-01 | International Business Machines Corporation | Migrating interrupts from a source I/O adapter of a computing system to a destination I/O adapter of the computing system |
US10235310B2 (en) | 2016-11-29 | 2019-03-19 | International Business Machines Corporation | Deallocation of memory buffer in multiprocessor systems |
US10248485B2 (en) | 2016-12-16 | 2019-04-02 | International Business Machines Corporation | Dual physical-channel systems firmware initialization and recovery |
US10929232B2 (en) | 2017-05-31 | 2021-02-23 | Intel Corporation | Delayed error processing |
CN109086081B (zh) * | 2018-06-29 | 2020-11-03 | 深圳市同泰怡信息技术有限公司 | 一种即时提示SATA和NVMe设备在位变化的方法、系统及介质 |
US20200019412A1 (en) * | 2018-07-12 | 2020-01-16 | Dell Products L.P. | Systems and methods for optimal configuration of information handling resources |
EP3837608A2 (en) * | 2018-08-13 | 2021-06-23 | Stratus Technologies Ireland Limited | High reliability fault tolerant computer architecture |
US10922203B1 (en) * | 2018-09-21 | 2021-02-16 | Nvidia Corporation | Fault injection architecture for resilient GPU computing |
CN109933464B (zh) * | 2019-02-28 | 2021-04-30 | 深圳市伟文无线通讯技术有限公司 | mifi软件自我修复方法 |
US11249872B1 (en) * | 2020-06-26 | 2022-02-15 | Xilinx, Inc. | Governor circuit for system-on-chip |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4228496A (en) * | 1976-09-07 | 1980-10-14 | Tandem Computers Incorporated | Multiprocessor system |
US5394542A (en) * | 1992-03-30 | 1995-02-28 | International Business Machines Corporation | Clearing data objects used to maintain state information for shared data at a local complex when at least one message path to the local complex cannot be recovered |
US6032271A (en) * | 1996-06-05 | 2000-02-29 | Compaq Computer Corporation | Method and apparatus for identifying faulty devices in a computer system |
US5978938A (en) * | 1996-11-19 | 1999-11-02 | International Business Machines Corporation | Fault isolation feature for an I/O or system bus |
US5991900A (en) * | 1998-06-15 | 1999-11-23 | Sun Microsystems, Inc. | Bus controller |
US6643727B1 (en) * | 2000-06-08 | 2003-11-04 | International Business Machines Corporation | Isolation of I/O bus errors to a single partition in an LPAR environment |
US20020184576A1 (en) * | 2001-03-29 | 2002-12-05 | International Business Machines Corporation | Method and apparatus for isolating failing hardware in a PCI recoverable error |
US6829729B2 (en) * | 2001-03-29 | 2004-12-07 | International Business Machines Corporation | Method and system for fault isolation methodology for I/O unrecoverable, uncorrectable error |
US6901537B2 (en) * | 2002-02-27 | 2005-05-31 | International Business Machines Corporation | Method and apparatus for preventing the propagation of input/output errors in a logical partitioned data processing system |
US6934888B2 (en) * | 2002-03-07 | 2005-08-23 | International Business Machines Corporation | Method and apparatus for enhancing input/output error analysis in hardware sub-systems |
US6976191B2 (en) * | 2002-03-07 | 2005-12-13 | International Business Machines Corporation | Method and apparatus for analyzing hardware errors in a logical partitioned data processing system |
-
2003
- 2003-05-15 US US10/438,392 patent/US7134052B2/en not_active Expired - Fee Related
-
2004
- 2004-04-14 KR KR1020040025747A patent/KR100612715B1/ko not_active IP Right Cessation
- 2004-05-12 JP JP2004142836A patent/JP4001877B2/ja not_active Expired - Fee Related
-
2006
- 2006-08-22 US US11/466,290 patent/US7549090B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
US20040230861A1 (en) | 2004-11-18 |
US7549090B2 (en) | 2009-06-16 |
KR20040098520A (ko) | 2004-11-20 |
JP2004342109A (ja) | 2004-12-02 |
US7134052B2 (en) | 2006-11-07 |
US20060281630A1 (en) | 2006-12-14 |
KR100612715B1 (ko) | 2006-08-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4001877B2 (ja) | 入出力ファブリックにおけるハードウェア・エラーからの自動回復 | |
JP4256693B2 (ja) | 計算機システム、i/oデバイス及びi/oデバイスの仮想共有方法 | |
JP3954088B2 (ja) | 論理分割された(lpar)計算機でシステム・ファームウェア更新を安全に実行する機構 | |
US8359415B2 (en) | Multi-root I/O virtualization using separate management facilities of multiple logical partitions | |
JP5305848B2 (ja) | データ処理システム内で入出力(i/o)仮想化を管理するための方法およびデータ処理システムならびにコンピュータ・プログラム | |
JP3697178B2 (ja) | ハードウェア・デバイスを管理する方法、システムおよびコンピュータ・プログラム・プロダクト | |
JP5585844B2 (ja) | 仮想計算機の制御方法及び計算機 | |
US8141093B2 (en) | Management of an IOV adapter through a virtual intermediary in an IOV management partition | |
JP4123942B2 (ja) | 情報処理装置 | |
US7484029B2 (en) | Method, apparatus, and computer usable program code for migrating virtual adapters from source physical adapters to destination physical adapters | |
US7882206B2 (en) | Storage device system and storage device system activating method | |
KR100773004B1 (ko) | 시스템 부팅시 하드웨어를 구성하는 동안 사용자의 상호작용을 없애기 위한 시스템 및 장치 | |
US10289564B2 (en) | Computer and memory region management method | |
KR20040102074A (ko) | 데이터 관리 방법, 데이터 처리 시스템 및 컴퓨터 프로그램 | |
JP2004318885A (ja) | 故障プロセッサを置き換える方法、媒体およびシステム | |
JP4366336B2 (ja) | 論理パーティション・データ処理システムにおいてトレース・データを管理するための方法、トレース・データを管理するための論理パーティション・データ処理システム、コンピュータにトレース・データを管理させるためのコンピュータ・プログラム、論理パーティション・データ処理システム | |
WO2007109476A1 (en) | Error management topologies | |
US7500051B2 (en) | Migration of partitioned persistent disk cache from one host to another | |
US20060010277A1 (en) | Isolation of input/output adapter interrupt domains | |
US20080313378A1 (en) | Method And System To Determine Device Criticality For Hot-Plugging In Computer Configurations | |
US20220391254A1 (en) | Information processing device, operation control method, and computer-readable recording medium storing operation control program | |
US20240241728A1 (en) | Host and dpu coordination for dpu maintenance events | |
KR20240062498A (ko) | 독립적으로 운용되는 계층적인 구조의 도메인들에 대한 에러 처리를 수행하는 시스템온칩 및 그 동작 방법 | |
CN118170571A (zh) | 一种故障处理方法及计算设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20061002 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20061024 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070119 |
|
RD12 | Notification of acceptance of power of sub attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7432 Effective date: 20070126 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20070129 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20070814 |
|
RD14 | Notification of resignation of power of sub attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7434 Effective date: 20070814 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20070815 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100824 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100824 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110824 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120824 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130824 Year of fee payment: 6 |
|
LAPS | Cancellation because of no payment of annual fees |