JP6357879B2 - システムおよび障害処理方法 - Google Patents
システムおよび障害処理方法 Download PDFInfo
- Publication number
- JP6357879B2 JP6357879B2 JP2014110314A JP2014110314A JP6357879B2 JP 6357879 B2 JP6357879 B2 JP 6357879B2 JP 2014110314 A JP2014110314 A JP 2014110314A JP 2014110314 A JP2014110314 A JP 2014110314A JP 6357879 B2 JP6357879 B2 JP 6357879B2
- Authority
- JP
- Japan
- Prior art keywords
- switch
- failure
- communication standard
- information
- communication
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Debugging And Monitoring (AREA)
- Bus Control (AREA)
Description
動的再構成可能なプロセッサ)28−1〜DRP28−NおよびDDRメモリ30−1〜DDRメモリ30−Nを含んで構成されている。なお、以下においては、DRP28−1〜DRP−Nの各々を区別しない場合には「DRP28」と表記し、DDRメモリ30−1〜DDRメモリ30−Nの各々を区別しない場合には「DDRメモリ30」と表記する。
PCIeの通信規格のオプションとして規格化された32ビットのレジスタであり、上記コンフィグレーションレジスタの一部を構成している。
PCIeインタフェースを介する通信および上記伝送路による信号伝送とは別の経路で通信がなされる。I2Cの通信規格による通信路の詳細に関しては後述する。
[2]:CPLD32がDRP28にFan−Failを通知する。
[3]:DRP28のFWがメインCPU12に、つまり上位システムとしてのOSにFan−Failを通知する。
[4]:CPLD32がDRP28をリセットする、すなわち動作を停止させる。ファン34の動作が停止したのでDRP28の温度制御が不能となり、DRP28の温度が異常に上昇する恐れがあるからである。
[5]:メインCPU12が訂正不可能なエラー(以下、「Uncorrectable Error」という場合がある)を内容とするパケットを受信することにより、OSがハングアップする(メインCPU12が停止し、システムダウンが発生する)。
また処理方法も不明であるためOSがハングアップする。
12 メインCPU
14、30 DDRメモリ
16 ルートコンプレックス
20、20a、22 アクセラレータ基板
18、24 PCIeスイッチ
28 DRP
32 CPLD
34 ファン
36 温度センサ
40 I2Cインタフェース
C1、C2、C3 コンフィグレーションレジスタ
P1、P2、P3 ポート
Claims (7)
- システム全体を制御する制御手段と、
前記制御手段とPCI Expressの通信規格で通信がなされるスイッチと、
前記スイッチとPCI Expressの通信規格で通信がなされるデバイスと、
前記スイッチと予め定められた通信規格で通信がなされ、かつ前記デバイスの障害の有無を監視するとともに、障害が検知された場合に前記予め定められた通信規格による通信を介して前記スイッチを制御するための情報を前記スイッチに送信することにより、前記スイッチからPCI Expressの通信規格による通信を介して前記制御手段に前記障害に関する情報が転送されることを抑止する監視部と、
を含むシステム。 - 前記監視部と前記デバイスとは予め定められた信号を伝送する伝送路で接続され、
前記監視部は、前記予め定められた通信規格による通信を介して前記スイッチを制御するための情報を前記スイッチに送信した後前記伝送路を介して前記デバイスを停止させる信号を送信する
請求項1に記載のシステム。 - 前記監視部が前記予め定められた通信規格による通信を介して前記スイッチを制御するための情報を前記スイッチに送信した後前記伝送路を介して前記デバイスを停止させる信号を送信する前に、前記監視部は予め定められたログ情報を前記デバイスに収集させPCI Expressの通信規格による通信を介して前記制御手段に送信させる
請求項2に記載のシステム。 - 前記スイッチを制御するための情報は、前記スイッチのレジスタ情報を記憶するPCI Expressで規格化されているコンフィグレーションレジスタに記憶されているAERレジスタのUncorrectable Error MASKを有効にするための情報である
請求項1〜請求項3のいずれか1項に記載のシステム。 - 前記予め定められた通信規格がI2Cの通信規格である
請求項1〜請求項4のいずれか1項に記載のシステム。 - 前記デバイスは自己の温度を制御する温度制御部を備え、前記デバイスの障害が前記温度制御部の障害である
請求項1〜請求項5のいずれか1項に記載のシステム。 - スイッチとPCI Expressの通信規格で通信がなされるデバイスの障害の有無を監視するとともに前記スイッチと予め定められた通信規格で通信がなされる監視部により前記デバイスの障害を検知するステップと、
前記監視部が前記予め定められた通信規格による通信を介して前記スイッチを制御するための情報を前記スイッチに送信するステップと、
前記スイッチを制御するための情報により、前記スイッチからPCI Expressの通信規格による通信を介して、システム全体を制御する制御手段に前記障害に関する情報が転送されることを抑止するステップと、
を含む障害処理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014110314A JP6357879B2 (ja) | 2014-05-28 | 2014-05-28 | システムおよび障害処理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014110314A JP6357879B2 (ja) | 2014-05-28 | 2014-05-28 | システムおよび障害処理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015225522A JP2015225522A (ja) | 2015-12-14 |
JP6357879B2 true JP6357879B2 (ja) | 2018-07-18 |
Family
ID=54842213
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014110314A Active JP6357879B2 (ja) | 2014-05-28 | 2014-05-28 | システムおよび障害処理方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6357879B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109032062A (zh) * | 2018-08-29 | 2018-12-18 | 郑州云海信息技术有限公司 | 一种pcie切换芯片 |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109726055B (zh) * | 2017-10-31 | 2021-01-12 | 华为技术有限公司 | 检测PCIe芯片异常的方法及计算机设备 |
CN116932274B (zh) * | 2023-09-19 | 2024-01-09 | 苏州元脑智能科技有限公司 | 异构计算系统和服务器系统 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5151580B2 (ja) * | 2008-03-14 | 2013-02-27 | 日本電気株式会社 | コンピュータシステムおよびバス制御装置 |
JP5281942B2 (ja) * | 2009-03-26 | 2013-09-04 | 株式会社日立製作所 | 計算機およびその障害処理方法 |
US9086945B2 (en) * | 2011-09-01 | 2015-07-21 | Dell Products, Lp | System and method to correlate errors to a specific downstream device in a PCIe switching network |
-
2014
- 2014-05-28 JP JP2014110314A patent/JP6357879B2/ja active Active
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109032062A (zh) * | 2018-08-29 | 2018-12-18 | 郑州云海信息技术有限公司 | 一种pcie切换芯片 |
Also Published As
Publication number | Publication date |
---|---|
JP2015225522A (ja) | 2015-12-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4558519B2 (ja) | 情報処理装置およびシステムバス制御方法 | |
JP5953573B2 (ja) | ペリフェラル・コンポーネント・インターコネクト・エクスプレス・エンドポイントデバイスにアクセスするためのコンピュータシステム、方法、および装置 | |
JP6427979B2 (ja) | 原因特定方法、原因特定プログラム、情報処理システム | |
JP5915086B2 (ja) | 切替制御装置、切替制御方法、情報処理装置および切替制御プログラム | |
JP4961997B2 (ja) | ストレージ装置、ストレージ装置の制御方法、及びストレージ装置の制御プログラム | |
JP2006195821A (ja) | 情報処理システムの制御方法、情報処理システム、ダイレクトメモリアクセス制御装置、プログラム | |
JP6007152B2 (ja) | 通信システム及び通信システムの冗長化の方法 | |
RU2614569C2 (ru) | Стойка с функцией автоматического восстановления и способ автоматического восстановления для этой стойки | |
JP6357879B2 (ja) | システムおよび障害処理方法 | |
WO2024113818A1 (zh) | 交换机的复位系统及方法、非易失性可读存储介质、电子设备 | |
CN114880266B (zh) | 故障处理的方法、装置、计算机设备和存储介质 | |
JP5332257B2 (ja) | サーバシステム、サーバ管理方法、およびそのプログラム | |
CN114296995B (zh) | 一种服务器自主修复bmc的方法、系统、设备及存储介质 | |
JP2009217435A (ja) | 制御方法、情報処理装置及びストレージシステム | |
US9454452B2 (en) | Information processing apparatus and method for monitoring device by use of first and second communication protocols | |
JP6962243B2 (ja) | コンピュータシステム | |
CN113434324A (zh) | 异常信息获取方法、系统、设备及存储介质 | |
JP6709510B2 (ja) | 電子機器 | |
JP2015053555A (ja) | データ転送装置、およびデータ転送方法 | |
US10291582B2 (en) | System and method of supporting more than 256 sensors by intelligent platform management interface (IPMI) based server management controller | |
US9740641B2 (en) | Information processing device, I/O system, and I/O control method | |
WO2018156438A1 (en) | Securing an unprotected hardware bus | |
JP6112205B2 (ja) | 情報処理システム、装置、方法及びプログラム | |
US20210064108A1 (en) | Information processing system | |
JP6579255B1 (ja) | 情報処理システム、および中継装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20170328 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20180228 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20180313 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180509 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20180522 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180604 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6357879 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |