JP5281942B2 - 計算機およびその障害処理方法 - Google Patents
計算機およびその障害処理方法 Download PDFInfo
- Publication number
- JP5281942B2 JP5281942B2 JP2009076274A JP2009076274A JP5281942B2 JP 5281942 B2 JP5281942 B2 JP 5281942B2 JP 2009076274 A JP2009076274 A JP 2009076274A JP 2009076274 A JP2009076274 A JP 2009076274A JP 5281942 B2 JP5281942 B2 JP 5281942B2
- Authority
- JP
- Japan
- Prior art keywords
- pci express
- failure
- route
- cpu
- bios
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/14—Error detection or correction of the data by redundancy in operation
- G06F11/1402—Saving, restoring, recovering or retrying
- G06F11/1415—Saving, restoring, recovering or retrying at system level
- G06F11/1441—Resetting or repowering
Description
Claims (12)
- BIOSを記憶するメモリと、前記BIOSを実行するCPUと、プライマリバスを介して前記CPUに接続され、セカンダリバスを介してPCIエクスプレス・ルートに接続され、PCIエクスプレス・ブリッジとして機能するルートポートとを有する計算機において、
前記PCIエクスプレス・ルート上の障害を検出して前記CPUにSMI(システム・メンテナンス・インタラプト)を発行する前記ルートポートと、
前記SMIを受け付け、前記BIOSを実行することによって、前記ルートポートを介して障害の発生した前記PCIエクスプレス・ルートにPCIエクスプレス・リセットを発行する前記CPUとを有することを特徴とする計算機。 - 前記メモリはPCIエクスプレス・デバイスを制御するためのデバイス・ドライバを記憶し、前記CPUは、前記デバイス・ドライバを実行することによって、前記PCIエクスプレス・リセットを受けた前記PCIエクスプレス・ルート上のPCIエクスプレス・デバイスを検出し、検出されたデバイスを閉塞することを特徴とする請求項1記載の計算機。
- 前記PCIエクスプレス・ルート上の障害は、PCIエクスプレス・トリーに亘る致命的障害であることを特徴とする請求項1記載の計算機。
- 前記PCIエクスプレス・ルート上の障害は、単一のPCIエクスプレス・デバイスに係わる致命的でない障害であることを特徴とする請求項1記載の計算機。
- 前記PCIエクスプレス・ルート上の障害は、致命的でない回復不可能な障害であることを特徴とする請求項1記載の計算機。
- BIOSを記憶するメモリと、前記BIOSを実行するCPUと、プライマリバスを介して前記CPUに接続され、セカンダリバスを介してPCIエクスプレス・ルートに接続され、PCIエクスプレス・ブリッジとして機能するルートポートとを有するブレード計算機を複数台備え、前記PCIエクスプレス・ルートを構成するPCIエクスプレス・スイッチ及びPCIエクスプレス・デバイスを具備する計算機システムにおいて、
前記ブレード計算機の各々は、
前記PCIエクスプレス・ルート上の障害を検出して前記CPUにSMI(システム・メンテナンス・インタラプト)を発行する前記ルートポートと、
前記SMIを受け付け、前記BIOSを実行することによって、前記ルートポートを介して障害の発生した前記PCIエクスプレス・ルートにPCIエクスプレス・リセットを発行する前記CPUとを有することを特徴とする計算機システム。 - 前記メモリはPCIエクスプレス・デバイスを制御するためのデバイス・ドライバを記憶し、前記CPUは、前記デバイス・ドライバを実行することによって、前記PCIエクスプレス・リセットを受けた前記PCIエクスプレス・ルート上のPCIエクスプレス・デバイスを検出し、検出されたデバイスを閉塞することを特徴とする請求項6記載の計算機システム。
- 前記PCIエクスプレス・ルート上の障害は、前記PCIエクスプレス・スイッチを含むPCIエクスプレス・トリーに亘る致命的障害であることを特徴とする請求項6記載の計算機システム。
- 前記PCIエクスプレス・ルート上の障害は、単一のPCIエクスプレス・デバイスに係わる致命的でない障害であることを特徴とする請求項6記載の計算機システム。
- 前記PCIエクスプレス・ルート上の障害は、致命的でない回復不可能な障害であることを特徴とする請求項6記載の計算機システム。
- BIOSとPCIエクスプレス・デバイスを制御するためのデバイス・ドライバとを記憶するメモリと、前記BIOSと前記デバイス・ドライバとを実行するCPUと、プライマリバスを介して前記CPUに接続され、セカンダリバスを介してPCIエクスプレス・ルートに接続され、PCIエクスプレス・ブリッジとして機能するルートポートとを有する計算機の障害処理方法において、
前記ルートポートは、前記PCIエクスプレス・ルート上の障害を検出して前記CPUにSMI(システム・メンテナンス・インタラプト)を発行し、
前記CPUは、前記SMIを受け付け、前記BIOSを実行することによって、前記ルートポートを介して障害の発生した前記PCIエクスプレス・ルートにPCIエクスプレス・リセットを発行し、
前記CPUは、前記デバイス・ドライバを実行することによって、前記PCIエクスプレス・リセットを受けた前記PCIエクスプレス・ルート上のPCIエクスプレス・デバイスを検出し、検出されたデバイスを閉塞することを特徴とする計算機の障害処理方法。 - 前記PCIエクスプレス・ルート上の障害は、致命的でない回復不可能な障害であることを特徴とする請求項11記載の計算機システム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009076274A JP5281942B2 (ja) | 2009-03-26 | 2009-03-26 | 計算機およびその障害処理方法 |
US12/685,760 US8122285B2 (en) | 2009-03-26 | 2010-01-12 | Arrangements detecting reset PCI express bus in PCI express path, and disabling use of PCI express device |
US13/371,608 US8365012B2 (en) | 2009-03-26 | 2012-02-13 | Arrangements detecting reset PCI express bus in PCI express path, and disabling use of PCI express device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009076274A JP5281942B2 (ja) | 2009-03-26 | 2009-03-26 | 計算機およびその障害処理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010231340A JP2010231340A (ja) | 2010-10-14 |
JP5281942B2 true JP5281942B2 (ja) | 2013-09-04 |
Family
ID=42785794
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009076274A Expired - Fee Related JP5281942B2 (ja) | 2009-03-26 | 2009-03-26 | 計算機およびその障害処理方法 |
Country Status (2)
Country | Link |
---|---|
US (2) | US8122285B2 (ja) |
JP (1) | JP5281942B2 (ja) |
Families Citing this family (29)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8782461B2 (en) * | 2010-09-24 | 2014-07-15 | Intel Corporation | Method and system of live error recovery |
US8589723B2 (en) * | 2010-12-22 | 2013-11-19 | Intel Corporation | Method and apparatus to provide a high availability solid state drive |
WO2012114463A1 (ja) * | 2011-02-23 | 2012-08-30 | 株式会社日立製作所 | 計算機、ファームウェア実行方法 |
US9882737B2 (en) * | 2011-03-09 | 2018-01-30 | Nec Corporation | Network system |
CN102393838B (zh) * | 2011-07-04 | 2015-03-11 | 华为技术有限公司 | 数据处理方法及装置、pci-e总线系统、服务器 |
JP5682829B2 (ja) * | 2011-09-01 | 2015-03-11 | 日本電気株式会社 | 情報処理装置 |
GB2495313B (en) * | 2011-10-05 | 2013-12-04 | Micron Technology Inc | Connection method |
US9086965B2 (en) | 2011-12-15 | 2015-07-21 | International Business Machines Corporation | PCI express error handling and recovery action controls |
CN103078747B (zh) * | 2012-12-28 | 2015-08-19 | 华为技术有限公司 | PCIe交换机及其工作方法 |
US9703744B2 (en) * | 2013-01-23 | 2017-07-11 | Hitachi, Ltd. | Storage device employing PCI-express connection solid-state drive |
US9389940B2 (en) | 2013-02-28 | 2016-07-12 | Silicon Graphics International Corp. | System and method for error logging |
JP6357879B2 (ja) * | 2014-05-28 | 2018-07-18 | 富士ゼロックス株式会社 | システムおよび障害処理方法 |
CN104601684A (zh) * | 2014-12-31 | 2015-05-06 | 曙光云计算技术有限公司 | 云服务器系统 |
JP2016197360A (ja) * | 2015-04-06 | 2016-11-24 | 富士通株式会社 | 情報処理装置、情報処理装置の制御プログラム及び情報処理装置の制御方法 |
JP6455302B2 (ja) * | 2015-04-30 | 2019-01-23 | 富士通株式会社 | バス通信システム |
CN105512007B (zh) * | 2015-12-17 | 2018-12-04 | 英业达科技有限公司 | 一种pcie硬盘状态灯的控制方法及系统 |
WO2017158666A1 (ja) | 2016-03-14 | 2017-09-21 | 株式会社日立製作所 | 計算機システム、計算機システムのエラー処理方法 |
CN106502952B (zh) * | 2016-10-24 | 2019-08-02 | 郑州云海信息技术有限公司 | 一种pcie设备安全掉线设计方法 |
CN108228374B (zh) * | 2017-12-28 | 2021-08-20 | 华为技术有限公司 | 一种设备的故障处理方法、装置及系统 |
JP6962243B2 (ja) * | 2018-03-08 | 2021-11-05 | 日本電気株式会社 | コンピュータシステム |
CN108897666A (zh) * | 2018-06-29 | 2018-11-27 | 郑州云海信息技术有限公司 | 服务器故障日志生成方法及相关设备 |
JP6579255B1 (ja) * | 2018-12-28 | 2019-09-25 | 富士通クライアントコンピューティング株式会社 | 情報処理システム、および中継装置 |
US11126420B2 (en) * | 2019-01-08 | 2021-09-21 | Dell Products L.P. | Component firmware update from baseboard management controller |
US11194589B2 (en) * | 2019-01-08 | 2021-12-07 | Dell Products L.P. | Information handling system adaptive component reset |
US11314578B2 (en) * | 2019-03-06 | 2022-04-26 | Dell Products L.P. | Information handling system and method to detect and recover from spurious resets of PCIe devices |
JP6659989B1 (ja) * | 2019-08-09 | 2020-03-04 | 富士通クライアントコンピューティング株式会社 | 情報処理システム、中継装置、及びプログラム |
CN116724297A (zh) * | 2021-01-22 | 2023-09-08 | 华为技术有限公司 | 一种故障处理方法、装置及系统 |
US11640335B2 (en) | 2021-06-15 | 2023-05-02 | Western Digital Technologies, Inc. | Multiple function level reset management |
CN116582471B (zh) * | 2023-07-14 | 2023-09-19 | 珠海星云智联科技有限公司 | Pcie设备、pcie数据捕获系统和服务器 |
Family Cites Families (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH01283655A (ja) * | 1988-05-11 | 1989-11-15 | Fujitsu Ltd | 非同期割込み機能のチェック方式 |
JPH0784899A (ja) * | 1993-09-10 | 1995-03-31 | Fujitsu Ltd | Scsi機器の選択リセット方式 |
JPH09319467A (ja) * | 1996-05-29 | 1997-12-12 | Hitachi Ltd | バス接続システム |
US6523140B1 (en) * | 1999-10-07 | 2003-02-18 | International Business Machines Corporation | Computer system error recovery and fault isolation |
JP4580528B2 (ja) * | 2000-09-25 | 2010-11-17 | 株式会社東芝 | コンピュータシステムおよびそのレジューム処理方法 |
US20020184576A1 (en) * | 2001-03-29 | 2002-12-05 | International Business Machines Corporation | Method and apparatus for isolating failing hardware in a PCI recoverable error |
JP3838992B2 (ja) * | 2003-05-21 | 2006-10-25 | エヌイーシーシステムテクノロジー株式会社 | 障害検出方法及び情報処理システム |
JP4066950B2 (ja) * | 2004-01-05 | 2008-03-26 | 日本電気株式会社 | コンピュータシステムおよびその保守方法 |
US7447934B2 (en) * | 2005-06-27 | 2008-11-04 | International Business Machines Corporation | System and method for using hot plug configuration for PCI error recovery |
US7496045B2 (en) * | 2005-07-28 | 2009-02-24 | International Business Machines Corporation | Broadcast of shared I/O fabric error messages in a multi-host environment to all affected root nodes |
US20070240018A1 (en) * | 2005-12-29 | 2007-10-11 | Intel Corporation | Functional level reset on a per device/function basis |
US20070234118A1 (en) * | 2006-03-30 | 2007-10-04 | Sardella Steven D | Managing communications paths |
US20070233821A1 (en) * | 2006-03-31 | 2007-10-04 | Douglas Sullivan | Managing system availability |
US8214541B2 (en) * | 2006-06-07 | 2012-07-03 | Dell Products L.P. | Method and system for uniquely identifying peripheral component devices |
JP4728896B2 (ja) * | 2006-07-13 | 2011-07-20 | エヌイーシーコンピュータテクノ株式会社 | コンピュータシステム |
US7596648B2 (en) * | 2007-03-08 | 2009-09-29 | Dell Products L.P. | System and method for information handling system error recovery |
US7574551B2 (en) * | 2007-03-23 | 2009-08-11 | International Business Machines Corporation | Operating PCI express resources in a logically partitioned computing system |
US20080256400A1 (en) * | 2007-04-16 | 2008-10-16 | Chih-Cheng Yang | System and Method for Information Handling System Error Handling |
US7774638B1 (en) * | 2007-09-27 | 2010-08-10 | Unisys Corporation | Uncorrectable data error containment systems and methods |
US7669000B2 (en) * | 2007-10-23 | 2010-02-23 | Brocade Communication Systems, Inc. | Host bus adapter with multiple hosts |
US8103810B2 (en) * | 2008-05-05 | 2012-01-24 | International Business Machines Corporation | Native and non-native I/O virtualization in a single adapter |
JP5332000B2 (ja) * | 2008-12-17 | 2013-10-30 | 株式会社日立製作所 | 複合型計算機装置、複合型計算機の管理方法及び管理サーバ |
-
2009
- 2009-03-26 JP JP2009076274A patent/JP5281942B2/ja not_active Expired - Fee Related
-
2010
- 2010-01-12 US US12/685,760 patent/US8122285B2/en not_active Expired - Fee Related
-
2012
- 2012-02-13 US US13/371,608 patent/US8365012B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
US8122285B2 (en) | 2012-02-21 |
US20120144231A1 (en) | 2012-06-07 |
US20100251014A1 (en) | 2010-09-30 |
US8365012B2 (en) | 2013-01-29 |
JP2010231340A (ja) | 2010-10-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5281942B2 (ja) | 計算機およびその障害処理方法 | |
JP6427979B2 (ja) | 原因特定方法、原因特定プログラム、情報処理システム | |
US7865782B2 (en) | I/O device fault processing method for use in virtual computer system | |
US9143416B2 (en) | Expander device | |
KR101581608B1 (ko) | 프로세서 시스템 | |
JP2008090375A (ja) | 割込み制御システム、およびこれを利用した記憶制御システム | |
WO2012063358A1 (ja) | エラー箇所特定方法、エラー箇所特定装置およびエラー箇所特定プログラム | |
US10817369B2 (en) | Apparatus and method for increasing resilience to faults | |
JP5451087B2 (ja) | 障害処理装置および方法 | |
JPH0375834A (ja) | パリティの置換装置及び方法 | |
US20170052841A1 (en) | Management apparatus, computer and non-transitory computer-readable recording medium having management program recorded therein | |
US20110179316A1 (en) | Data processing system comprising a monitor | |
TWI772024B (zh) | 減少停機時間的方法及系統 | |
WO2008004330A1 (fr) | Système à processeurs multiples | |
JP2005215809A (ja) | コンピュータシステム、バスコントローラ及びそれらに用いるバス障害処理方法 | |
JP6256087B2 (ja) | ダンプシステムおよびダンプ処理方法 | |
US20180089012A1 (en) | Information processing apparatus for analyzing hardware failure | |
JP2007265157A (ja) | I/o装置の障害検出システム、及び、方法 | |
JP5440673B1 (ja) | プログラマブルロジックデバイス、情報処理装置、被疑箇所指摘方法およびプログラム | |
JP6024742B2 (ja) | 情報処理装置、情報処理方法、情報処理プログラム、及び記録媒体 | |
US20240095208A1 (en) | External quiesce of a core in a multi-core system | |
JP5768434B2 (ja) | 相互監視システム | |
JP2011134261A (ja) | 演算処理装置、情報処理装置および演算処理装置の制御方法 | |
US7523358B2 (en) | Hardware error control method in an instruction control apparatus having an instruction processing suspension unit | |
CN114416436A (zh) | 基于SoC芯片面向单粒子翻转效应的可靠性方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110506 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130507 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130527 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 Ref document number: 5281942 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |