JP6897145B2 - 情報処理装置、情報処理システム及び情報処理装置制御方法 - Google Patents
情報処理装置、情報処理システム及び情報処理装置制御方法 Download PDFInfo
- Publication number
- JP6897145B2 JP6897145B2 JP2017032628A JP2017032628A JP6897145B2 JP 6897145 B2 JP6897145 B2 JP 6897145B2 JP 2017032628 A JP2017032628 A JP 2017032628A JP 2017032628 A JP2017032628 A JP 2017032628A JP 6897145 B2 JP6897145 B2 JP 6897145B2
- Authority
- JP
- Japan
- Prior art keywords
- information
- failure
- unit
- failure information
- read
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/079—Root cause analysis, i.e. error or fault diagnosis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0766—Error or fault reporting or storing
- G06F11/0769—Readable error formats, e.g. cross-platform generic formats, human understandable formats
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0706—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
- G06F11/0709—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a distributed system consisting of a plurality of standalone computer nodes, e.g. clusters, client-server systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0751—Error or fault detection not based on redundancy
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0766—Error or fault reporting or storing
- G06F11/0784—Routing of error reports, e.g. with a specific transmission path or data flow
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0766—Error or fault reporting or storing
- G06F11/0787—Storage of error reports, e.g. persistent data storage, storage using memory protection
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Quality & Reliability (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Networks & Wireless Communication (AREA)
- Computer Hardware Design (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Debugging And Monitoring (AREA)
Description
3 光ケーブル
10,20 メインボード
11,21 ハードディスク
12,22 電源
100 分散処理システム
101,201 AOC
102,202 制御IC
103,104,203,204 CPU
111 通信制御部
112 アラーム検出部
113 障害情報送信部
114 アラームレジスタ
121 情報取得部
122 障害情報バッファ
123 情報通知部
Claims (7)
- 複数の演算器と、
各前記演算器が実行する通信において発生した障害に関する第1サイズの障害情報を記憶する第1格納部と、
前記第1サイズの前記障害情報を複数含む第2サイズの単位で前記障害情報を前記第1格納部から読み出し、読み出した前記障害情報を前記第1格納部から削除する管理部と、
前記管理部により前記第2サイズの単位で読み出された前記障害情報を第2格納部に格納する情報取得部と、
前記第2格納部から前記第1サイズの単位で前記障害情報を読み出し、読み出した前記障害情報が示す障害が発生した通信に対応する前記演算器に、読み出した前記障害情報を通知する情報通知部と
を備えたことを特徴とする情報処理装置。 - 前記情報通知部は、読み出した前記障害情報を前記第2格納部から削除することを特徴とする請求項1に記載の情報処理装置。
- 各前記演算器による前記通信を制御し、且つ、前記障害情報を含む前記通信に関する情報を前記第1格納部に格納する通信制御部をさらに備えたことを特徴とする請求項1又は2に記載の情報処理装置。
- 前記演算器は、自己が行う通信において障害が発生した場合に前記障害情報の読出要求を前記情報取得部へ送信し、
前記情報取得部は、前記演算器から前記読出要求を受信した場合に、前記読出要求の送信元の前記演算器が行った通信に関する前記障害情報の読み出しを前記管理部へ指示し、
前記管理部は、前記情報取得部からの前記障害情報の読み出しの指示を受けた場合、前記読出要求の送信元の前記演算器が行った通信に関する前記障害情報を前記第1格納部から読み出す
ことを特徴とする請求項1〜3のいずれか一つに記載の情報処理装置。 - 前記演算器による通信における障害の発生を検出した場合、障害が発生した通信を行った前記演算器に障害の発生を通知する検出部をさらに備え、
前記演算器は、自己が行う通信における障害の発生を検出した場合及び前記検出部からの障害発生の通知を受信した場合、前記障害情報の読出要求を前記情報取得部へ送信する
ことを特徴とする請求項1〜4のいずれか一つに記載の情報処理装置。 - 複数の情報処理装置を有する情報処理システムであって、
各前記情報処理装置は、
他の情報処理装置の演算器と通信を行う複数の演算器と、
各前記演算器による通信において発生した障害に関する第1サイズの障害情報を記憶する第1格納部と、
前記第1サイズの前記障害情報を複数含む第2サイズの単位で前記障害情報を前記第1格納部から読み出し、読み出した前記障害情報を前記第1格納部から削除する管理部と、
前記管理部により前記第2サイズの単位で読み出された前記障害情報を第2格納部に格納する情報取得部と、
前記第2格納部から前記第1サイズの単位で前記障害情報を読み出し、読み出した前記障害情報が示す障害が発生した通信に対応する前記演算器に、読み出した前記障害情報を通知する情報通知部と
を備えたことを特徴とする情報処理システム。 - 各演算器による通信において発生した障害に関する第1サイズの障害情報を第1記憶装置に記憶させ、
前記第1サイズの前記障害情報を複数含む第2サイズの単位で前記障害情報を前記第1記憶装置から読み出し、
読み出した前記障害情報を前記第1記憶装置から削除し、
前記第2サイズの単位で読み出された前記障害情報を第2記憶装置に格納させ、
前記第2記憶装置から前記第1サイズの単位で前記障害情報を読み出し、
読み出した前記障害情報が示す障害が発生した通信に対応する前記演算器に、読み出した前記障害情報を通知する
処理をコンピュータに実行させることを特徴とする情報処理装置制御方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017032628A JP6897145B2 (ja) | 2017-02-23 | 2017-02-23 | 情報処理装置、情報処理システム及び情報処理装置制御方法 |
US15/876,261 US10664339B2 (en) | 2017-02-23 | 2018-01-22 | Information processing apparatus, information processing system, and information processing apparatus control method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017032628A JP6897145B2 (ja) | 2017-02-23 | 2017-02-23 | 情報処理装置、情報処理システム及び情報処理装置制御方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018136882A JP2018136882A (ja) | 2018-08-30 |
JP6897145B2 true JP6897145B2 (ja) | 2021-06-30 |
Family
ID=63167231
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017032628A Active JP6897145B2 (ja) | 2017-02-23 | 2017-02-23 | 情報処理装置、情報処理システム及び情報処理装置制御方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US10664339B2 (ja) |
JP (1) | JP6897145B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7367495B2 (ja) * | 2019-11-29 | 2023-10-24 | 富士通株式会社 | 情報処理装置および通信ケーブルログ情報採取方法 |
CN113454613B (zh) * | 2020-10-30 | 2022-08-09 | 华为技术有限公司 | 信息传输方法、控制装置、电磁信号收发装置及信号处理设备 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3263323B2 (ja) * | 1996-11-15 | 2002-03-04 | 富士通株式会社 | 伝送装置の監視方法 |
JP4308695B2 (ja) * | 2004-03-30 | 2009-08-05 | 富士通株式会社 | インタフェース収容ボード |
JP2008090505A (ja) | 2006-09-29 | 2008-04-17 | Fujitsu Ltd | イベント保持回路 |
JP4573884B2 (ja) * | 2008-06-18 | 2010-11-04 | 三菱電機株式会社 | 車載電子制御装置の電源異常検出回路 |
JP6056509B2 (ja) * | 2013-01-30 | 2017-01-11 | 富士通株式会社 | 情報処理装置および情報処理装置の制御方法 |
WO2014147802A1 (ja) * | 2013-03-21 | 2014-09-25 | 富士通株式会社 | 情報処理装置、資源割当方法、及びプログラム |
JP6023388B2 (ja) * | 2014-10-15 | 2016-11-09 | 株式会社フジクラ | 光受信器、アクティブ光ケーブル、及び、光受信器の制御方法 |
JP6458494B2 (ja) * | 2014-12-26 | 2019-01-30 | 富士通株式会社 | 情報処理装置、情報処理システムおよび通信装置 |
-
2017
- 2017-02-23 JP JP2017032628A patent/JP6897145B2/ja active Active
-
2018
- 2018-01-22 US US15/876,261 patent/US10664339B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
US20180239663A1 (en) | 2018-08-23 |
US10664339B2 (en) | 2020-05-26 |
JP2018136882A (ja) | 2018-08-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7844866B2 (en) | Mechanism to report operating system events on an intelligent platform management interface compliant server | |
JP6333410B2 (ja) | 障害処理方法、関連装置、およびコンピュータ | |
US9043527B2 (en) | PCI express channel implementation in intelligent platform management interface stack | |
US9971640B2 (en) | Method for error logging | |
US9697167B2 (en) | Implementing health check for optical cable attached PCIE enclosure | |
US20140281758A1 (en) | On-site visualization of component status | |
US9806959B2 (en) | Baseboard management controller (BMC) to host communication through device independent universal serial bus (USB) interface | |
US20190180791A1 (en) | Chassis monitoring system and chassis monitoring method | |
CN117389790B (zh) | 可恢复故障的固件检测系统、方法、存储介质及服务器 | |
JP6897145B2 (ja) | 情報処理装置、情報処理システム及び情報処理装置制御方法 | |
US20100064164A1 (en) | Autonomic Component Service State Management for a Multiple Function Component | |
US9916273B2 (en) | Sideband serial channel for PCI express peripheral devices | |
JP2014048782A (ja) | 情報処理装置、及び情報処理装置の障害処理方法 | |
US8819484B2 (en) | Dynamically reconfiguring a primary processor identity within a multi-processor socket server | |
US9430306B2 (en) | Anticipatory protection of critical jobs in a computing system | |
CN115543872A (zh) | 一种设备管理方法、装置及计算机存储介质 | |
US8886888B2 (en) | Storage system | |
US10452464B1 (en) | Automatic human configuration error detection for reoccurring events | |
US9838285B2 (en) | Connection monitoring device and connection monitoring method | |
EP2851801B1 (en) | Computer system, control method for computer system and coupling module | |
US9639438B2 (en) | Methods and systems of managing an interconnection | |
CN114020561B (zh) | 故障上报方法、系统、装置、计算机设备及存储介质 | |
US20180012042A1 (en) | Banner notification in locked host monitor | |
JP2006235665A (ja) | コマンドテスタ | |
US8606973B1 (en) | Managing monitored conditions in adaptors in a multi-adaptor system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20191112 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20201027 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20201201 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210127 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210511 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210524 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6897145 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |