JP6674387B2 - 致命的なエラーの発生の直後のコンピュータの処理モジュールレジスタに格納された情報の取得方法 - Google Patents
致命的なエラーの発生の直後のコンピュータの処理モジュールレジスタに格納された情報の取得方法 Download PDFInfo
- Publication number
- JP6674387B2 JP6674387B2 JP2016568563A JP2016568563A JP6674387B2 JP 6674387 B2 JP6674387 B2 JP 6674387B2 JP 2016568563 A JP2016568563 A JP 2016568563A JP 2016568563 A JP2016568563 A JP 2016568563A JP 6674387 B2 JP6674387 B2 JP 6674387B2
- Authority
- JP
- Japan
- Prior art keywords
- management controller
- processing module
- cgj
- mtj
- reset
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 claims description 23
- 238000004590 computer program Methods 0.000 claims description 3
- 230000001360 synchronised effect Effects 0.000 claims description 3
- 230000001427 coherent effect Effects 0.000 description 18
- 238000004891 communication Methods 0.000 description 8
- 238000004422 calculation algorithm Methods 0.000 description 4
- 244000309464 bull Species 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 101150039033 Eci2 gene Proteins 0.000 description 2
- 102100021823 Enoyl-CoA delta isomerase 2 Human genes 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/14—Error detection or correction of the data by redundancy in operation
- G06F11/1402—Saving, restoring, recovering or retrying
- G06F11/1415—Saving, restoring, recovering or retrying at system level
- G06F11/1441—Resetting or repowering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F1/00—Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
- G06F1/24—Resetting means
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0706—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
- G06F11/0721—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment within a central processing unit [CPU]
- G06F11/0724—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment within a central processing unit [CPU] in a multiprocessor or a multi-core unit
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0766—Error or fault reporting or storing
- G06F11/0778—Dumping, i.e. gathering error/state information after a fault for later diagnosis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2201/00—Indexing scheme relating to error detection, to error correction, and to monitoring
- G06F2201/805—Real-time
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2201/00—Indexing scheme relating to error detection, to error correction, and to monitoring
- G06F2201/82—Solving problems relating to consistency
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Quality & Reliability (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Hardware Redundancy (AREA)
- Retry When Errors Occur (AREA)
- Debugging And Monitoring (AREA)
Description
リストは、リセットの前に読み出されるべきレジスタを含む第1の部分、およびリセットの後に読み出されるべきレジスタを含む第2の部分を含むことが出来る。
それぞれの処理モジュールの管理コントローラはそのファイルの生成に関してマスタ処理モジュールの管理コントローラに報告をすることが可能であり、かつマスタ処理モジュールの管理コントローラは、処理モジュールのそれぞれのプログラム可能論理回路に対して、それぞれのプログラム可能論理回路が処理モジュールのそれぞれの管理コントローラからファイル生成の報告を受信した時にリセットをトリガすることを許可される、ということを通知することが可能であり、次にマスタ処理モジュールの管理コントローラはコンピュータのリスタートをトリガすることが出来る。
コンピュータのリスタートをトリガする前に、マスタ処理モジュールの管理コントローラは、ファイルがマスタおよびスレーブ処理モジュールのそれぞれに格納されたということを報告するためにアラートメッセージを生成することが出来る。
Claims (10)
- コンピュータ(CA)の少なくとも1つの処理モジュール(MTj)のレジスタ(Rij)に格納されている情報を取得する方法であって、それぞれの処理モジュール(MTj)が、関連するレジスタ(Rij)内に格納されている情報を読み出すことが出来る管理コントローラ(CGj)、および致命的なエラーに引き続く要求されたリセットをトリガすることが出来るプログラム可能論理回路(CLj)をさらに含み、処理モジュール(MTj)のプログラム可能論理回路(CLj)によりリセット要求を受信した場合には、このプログラム可能論理回路(CLj)は、このリセットのトリガを一旦停止し、関連する管理コントローラ(CGj)に致命的なエラーの発生をアラートし、管理コントローラ(CGj)は、可能であれば、関連する選択されたレジスタ(Rij)に格納されている情報を読み出して次にこの読み出された情報をファイルに格納し、次に前記関連するプログラム可能論理回路(CLj)は前記要求されたリセットをトリガすることを許可されることを特徴とする、方法。
- 前記管理コントローラ(CGj)が関連する選択されたレジスタ(Rij)に格納されている情報を読み出すことが出来ない場合、前記関連するプログラム可能論理回路(CLj)は前記要求されたリセットをトリガすることを許可され、かつリセットフェーズは前記管理コントローラ(CGj)と前記処理モジュール(MTj)の基本入力/出力システムとの間の同期ポイントでブロックされ、次に前記管理コントローラ(CGj)は関連する選択されたレジスタ(Rij)に格納されている情報を読み出し次にこの読み出された情報をファイルに格納し、次に前記コンピュータ(CA)がリスタートされることを特徴とする、請求項1に記載の方法。
- それぞれの管理コントローラ(CGj)が、自身が格納するレジスタのリストから関連するレジスタ(Rij)を選択することを特徴とする、請求項1または2に記載の方法。
- 前記リストが、リセットの前に読み出されるべきレジスタを含む第1の部分、およびリセットの後に読み出されるべきレジスタを含む第2の部分を含むことを特徴とする、請求項3に記載の方法。
- マスタ処理モジュール(MT1)および少なくとも1つのスレーブ処理モジュール(MTj’)が存在する状態で、スレーブ処理モジュール(MTj’)がリセット要求を受信したプログラム可能論理回路(CLj’)を含む場合、関連する管理コントローラ(CGj’)がそのスレーブ処理モジュール(MTj’)内での致命的なエラーの発生について前記マスタ処理モジュール(MT1)の管理コントローラ(CG1)にアラートし、次にマスタ処理モジュール(MT1)の前記管理コントローラ(CG1)は、それぞれの処理モジュール(MTj)の管理コントローラ(CGj)に、関連する選択されたレジスタ(Rij)に格納されている情報の同期読出しに対する許可ならびに管理コントローラ(CGj)がこの読み出した情報を格納しなければならないファイルに対するインスタンス名を送信することを特徴とする、請求項1から4のいずれか一項に記載の方法。
- それぞれの処理モジュール(MTj)の管理コントローラ(CGj)がそのファイルの生成に関してマスタ処理モジュール(MT1)の前記管理コントローラ(CG1)に報告し、かつマスタ処理モジュール(MT1)の前記管理コントローラ(CG1)が、処理モジュール(MTj)のそれぞれのプログラム可能論理回路(CLj)に対して、それぞれのプログラム可能論理回路(CLj)が処理モジュール(MTj)のそれぞれの管理コントローラ(CGj)からファイル生成の報告を受信した時にリセットをトリガする許可を与えられる、ということを通知し、次にマスタ処理モジュール(MT1)の前記管理コントローラ(CG1)が前記コンピュータ(CA)のリスタートをトリガすることを特徴とする、請求項5に記載の方法。
- コンピュータ(CA)の前記リスタートをトリガする前に、マスタ処理モジュール(MTj)の前記管理コントローラ(CGj)が、ファイルは前記マスタおよびスレーブ処理モジュール(MTj)のそれぞれに格納されたということを報告するためにアラートメッセージを生成することを特徴とする、請求項6に記載の方法。
- 処理手段によって実行されると、致命的なエラーに引き続いてコンピュータ(CA)の少なくとも1つの処理モジュール(MTj)のレジスタ(Rij)に格納されている情報を取得するために、請求項1から7のいずれか一項による方法を実施することが出来る、命令のセットを含むコンピュータプログラム。
- 情報を格納するレジスタ(Rij)、前記レジスタ(Rij)に格納されている情報を読み出すことが出来る管理コントローラ(CGj)および致命的なエラーに引き続く要求されたリセットをトリガすることが出来るプログラム可能論理回路(CLj)を含む、少なくとも1つの処理モジュール(MTj)を含む、コンピュータ(CA)であって、処理モジュール(MTj)のプログラム可能論理回路(CLj)によりリセット要求を受信した場合には、このプログラム可能論理回路(CLj)がこのリセットのトリガを一旦停止しかつ関連する前記管理コントローラ(CGj)に致命的なエラーの発生についてアラートするように構成されており、ならびに後者(CGj)が、許可されている場合は、関連する前記プログラム可能論理回路(CLj)が前記要求されたリセットをトリガすることを許可される前に、関連する選択されたレジスタ(Rij)に格納されている情報を読み出して次にこの読み出された情報をファイルに格納するように構成されていることを特徴とする、コンピュータ(CA)。
- 前記管理コントローラ(CGj)が関連する選択されたレジスタ(Rij)に格納されている情報を読み出すことが出来ない場合、前記関連するプログラム可能論理回路(CLj)は、許可されていれば、前記要求されたリセットをトリガするように構成され、前記管理コントローラ(CGj)は、この管理コントローラ(CGj)とその処理モジュール(MTj)の基本入力/出力システムとの間の同期ポイントにおけるリセットフェーズのブロックに引き続いて、関連する選択されたレジスタ(Rij)に格納されている情報を読み出し、次にこの読み出された情報をファイルに格納するように構成されることを特徴とする、請求項9に記載のコンピュータ。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FR1454504A FR3021430B1 (fr) | 2014-05-20 | 2014-05-20 | Procede d'obtention d'informations stockees dans des registres de module(s) de traitement d'un calculateur juste apres la survenue d'une erreur fatale |
FR1454504 | 2014-05-20 | ||
PCT/FR2015/051242 WO2015177436A1 (fr) | 2014-05-20 | 2015-05-12 | Procédé d'obtention d'informations stockées dans des registres de module(s) de traitement d'un calculateur juste après la survenue d'une erreur fatale |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017517808A JP2017517808A (ja) | 2017-06-29 |
JP6674387B2 true JP6674387B2 (ja) | 2020-04-01 |
Family
ID=51570541
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016568563A Expired - Fee Related JP6674387B2 (ja) | 2014-05-20 | 2015-05-12 | 致命的なエラーの発生の直後のコンピュータの処理モジュールレジスタに格納された情報の取得方法 |
Country Status (5)
Country | Link |
---|---|
US (1) | US10467101B2 (ja) |
EP (1) | EP3146432B1 (ja) |
JP (1) | JP6674387B2 (ja) |
FR (1) | FR3021430B1 (ja) |
WO (1) | WO2015177436A1 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11204821B1 (en) * | 2020-05-07 | 2021-12-21 | Xilinx, Inc. | Error re-logging in electronic systems |
Family Cites Families (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH04312111A (ja) * | 1991-04-11 | 1992-11-04 | Nec Eng Ltd | データ処理装置 |
US5345583A (en) * | 1992-05-13 | 1994-09-06 | Scientific-Atlanta, Inc. | Method and apparatus for momentarily interrupting power to a microprocessor to clear a fault state |
US6697973B1 (en) * | 1999-12-08 | 2004-02-24 | International Business Machines Corporation | High availability processor based systems |
US6643802B1 (en) * | 2000-04-27 | 2003-11-04 | Ncr Corporation | Coordinated multinode dump collection in response to a fault |
US7447146B2 (en) * | 2001-12-19 | 2008-11-04 | Hewlett-Packard Development Company, L.P. | Method and apparatus for supporting multiple independent failure domains |
US7181510B2 (en) * | 2002-01-04 | 2007-02-20 | Hewlett-Packard Development Company, L.P. | Method and apparatus for creating a secure embedded I/O processor for a remote server management controller |
US7313717B2 (en) * | 2003-04-17 | 2007-12-25 | Sun Microsystems, Inc. | Error management |
US7308609B2 (en) * | 2004-04-08 | 2007-12-11 | International Business Machines Corporation | Method, data processing system, and computer program product for collecting first failure data capture information |
US7337367B2 (en) * | 2005-01-06 | 2008-02-26 | International Business Machines Corporation | Management of memory controller reset |
US7406624B2 (en) * | 2005-02-15 | 2008-07-29 | General Motors Corporation | Method for responding to a control module failure |
US7594144B2 (en) * | 2006-08-14 | 2009-09-22 | International Business Machines Corporation | Handling fatal computer hardware errors |
US20080270827A1 (en) * | 2007-04-26 | 2008-10-30 | International Business Machines Corporation | Recovering diagnostic data after out-of-band data capture failure |
FR2952731B1 (fr) * | 2009-11-13 | 2011-11-04 | Bull Sas | Procede et dispositif d'optimisation d'execution d'applications logicielles dans une architecture multiprocesseur comprenant plusieurs controleurs d'entree/sortie et unites de calcul secondaires |
US8504875B2 (en) * | 2009-12-28 | 2013-08-06 | International Business Machines Corporation | Debugging module to load error decoding logic from firmware and to execute logic in response to an error |
FR2972548B1 (fr) * | 2011-03-08 | 2013-07-12 | Thales Sa | Dispositif pour l'amelioration de la tolerance aux fautes d'un processeur |
JP6003350B2 (ja) * | 2012-07-30 | 2016-10-05 | 富士通株式会社 | 監視装置、情報処理装置、及び監視方法 |
US9141493B2 (en) * | 2013-07-12 | 2015-09-22 | International Business Machines Corporation | Isolating a PCI host bridge in response to an error event |
US9342422B2 (en) * | 2013-11-07 | 2016-05-17 | International Business Machines Corporation | Selectively coupling a PCI host bridge to multiple PCI communication paths |
-
2014
- 2014-05-20 FR FR1454504A patent/FR3021430B1/fr active Active
-
2015
- 2015-05-12 WO PCT/FR2015/051242 patent/WO2015177436A1/fr active Application Filing
- 2015-05-12 EP EP15732024.3A patent/EP3146432B1/fr active Active
- 2015-05-12 US US15/312,782 patent/US10467101B2/en active Active
- 2015-05-12 JP JP2016568563A patent/JP6674387B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2017517808A (ja) | 2017-06-29 |
US20170185487A1 (en) | 2017-06-29 |
EP3146432A1 (fr) | 2017-03-29 |
US10467101B2 (en) | 2019-11-05 |
WO2015177436A1 (fr) | 2015-11-26 |
FR3021430A1 (fr) | 2015-11-27 |
EP3146432B1 (fr) | 2021-11-24 |
FR3021430B1 (fr) | 2016-05-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10585755B2 (en) | Electronic apparatus and method for restarting a central processing unit (CPU) in response to detecting an abnormality | |
CN100489805C (zh) | 运行时间安全保证的自动存储器检测器及其方法 | |
US11294749B2 (en) | Techniques to collect crash data for a computing system | |
JP5726340B2 (ja) | プロセッサシステム | |
US20110185153A1 (en) | Simultaneous execution resumption of multiple processor cores after core state information dump to facilitate debugging via multi-core processor simulator using the state information | |
CN109298962B (zh) | 定时任务的监控方法、计算机可读存储介质和终端设备 | |
US10229077B2 (en) | Method for data transfer between real-time tasks using a DMA memory controller | |
CN105683921B (zh) | 多处理器装置及其引导加载程序更新方法 | |
US8122176B2 (en) | System and method for logging system management interrupts | |
US20200033928A1 (en) | Method of periodically recording for events | |
US20190121985A1 (en) | Detecting vulnerabilities in applications during execution | |
JP6674387B2 (ja) | 致命的なエラーの発生の直後のコンピュータの処理モジュールレジスタに格納された情報の取得方法 | |
JP5034979B2 (ja) | 起動装置、起動方法、及び、起動プログラム | |
JP5561791B2 (ja) | 情報処理装置、情報処理方法、及び情報処理プログラム | |
CN114091110A (zh) | 一种完整性度量方法和完整性度量装置 | |
US20170052841A1 (en) | Management apparatus, computer and non-transitory computer-readable recording medium having management program recorded therein | |
US10228882B2 (en) | Semiconductor device and memory access control method | |
JP2010176345A (ja) | マルチノードシステム、ノード、メモリダンプ処理方法、及びプログラム | |
US20140019093A1 (en) | Incrementally increasing system test workload | |
US20180121087A1 (en) | Register-based communications interface | |
CN109358903B (zh) | 数据访问设备和访问错误通知方法 | |
CN110781517A (zh) | 一种bios与bmc沟通实现数据交互的方法 | |
CN108415788B (zh) | 用于对无响应处理电路作出响应的数据处理设备和方法 | |
JP7298694B2 (ja) | 異常検出装置、制御方法、及びプログラム | |
US20230281063A1 (en) | Global Event Aggregation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180328 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20190228 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190305 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20190530 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190903 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200212 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200306 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6674387 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |