JP2006039678A - 情報処理装置およびエラー検出方法 - Google Patents
情報処理装置およびエラー検出方法 Download PDFInfo
- Publication number
- JP2006039678A JP2006039678A JP2004214787A JP2004214787A JP2006039678A JP 2006039678 A JP2006039678 A JP 2006039678A JP 2004214787 A JP2004214787 A JP 2004214787A JP 2004214787 A JP2004214787 A JP 2004214787A JP 2006039678 A JP2006039678 A JP 2006039678A
- Authority
- JP
- Japan
- Prior art keywords
- error
- calculation
- calculation means
- board
- information processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0766—Error or fault reporting or storing
- G06F11/0772—Means for error signaling, e.g. using interrupts, exception flags, dedicated error registers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0706—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
- G06F11/0721—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment within a central processing unit [CPU]
- G06F11/0724—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment within a central processing unit [CPU] in a multiprocessor or a multi-core unit
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0793—Remedial or corrective actions
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Quality & Reliability (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Debugging And Monitoring (AREA)
- Executing Machine-Instructions (AREA)
Abstract
【解決手段】複数の機能ボードB1〜Bnを有するコンピュータシステム1において、機能ボードB1を代表機能ボードに設定し、機能ボードBmに障害が発生した場合には、機能ボードBmが代表機能ボードである機能ボードB1に通知し、エラーボードレジスタD1にエラーボードを特定して記録する。機能ボードB1は全ての機能ボードB1〜Bnに対して割り込みを実行し、エラー解析処理部2がエラーボードレジスタD1に示されたエラーボードに対して選択的にエラー解析処理を実行する。
【選択図】 図1
Description
前記複数の演算手段のうち少なくともいずれか一つは、前記複数の演算手段のそれぞれについてエラーの発生の有無を記録するエラー演算手段記録手段を備え、
前記複数の演算手段の各々は、自演算手段にエラーが発生した場合に、前記エラー演算手段記憶手段を備えた演算手段のうち、少なくともいずれか一つにエラーの発生を通知するエラー通知手段を備えたことを特徴とする情報処理装置。
前記演算手段が自演算手段におけるエラーを検出するエラー検出工程と、
前記エラー検出工程によってエラーを検出した演算手段が、他の演算手段にエラー通知を送信するエラー通知工程と、
前記エラー通知を受けた演算手段が、前記複数の演算手段のそれぞれについてエラーの発生の有無を記録するエラー演算手段記録手段に前記エラーを記録する記録工程と、
前記エラー通知を受けた演算手段が、当該エラーに基づく割り込み処理を実行する割り込み工程と、
を含んだことを特徴とするエラー検出方法。
2,3 エラー解析処理部
5,6 接続処理部
10,20,30,40 LSI
11,21,31,41 演算処理部
12,22,32,42 エラーLSIレジスタ
B1〜Bn,B01〜B0m,B11〜B1n 機能ボード
C1〜Cn 演算ユニット
D1〜Dn エラーボードレジスタ
E1〜En,13,23,33,43 エラーレジスタ
P1,P2 パーティション
Claims (10)
- 複数の演算手段を有する情報処理装置であって、
前記複数の演算手段のうち少なくともいずれか一つは、前記複数の演算手段のそれぞれについてエラーの発生の有無を記録するエラー演算手段記録手段を備え、
前記複数の演算手段の各々は、自演算手段にエラーが発生した場合に、前記エラー演算手段記憶手段を備えた演算手段のうち、少なくともいずれか一つにエラーの発生を通知するエラー通知手段を備えたことを特徴とする情報処理装置。 - 前記エラー演算手段記録手段にエラーの発生が記録された演算手段に対してエラー解析処理を実行するエラー解析手段をさらに備えたことを特徴とする請求項1に記載の情報処理装置。
- 前記エラー通知手段からエラー通知を受けた演算手段は、他の演算手段に対して割り込み処理を実行することを特徴とする請求項1または2に記載の情報処理装置。
- 前記複数の演算手段から代表となる演算手段を定め、前記エラー通知手段は、前記代表となる演算手段にエラーの発生を通知することを特徴とする請求項3に記載の情報処理装置。
- 前記エラー通知手段は、他の全ての演算手段に対してエラー通知を実行し、該エラー通知を受けた演算手段は自らの演算処理に割り込みを発生させることを特徴とする請求項1または2に記載の情報処理装置。
- 前記複数の演算手段の各々は、自演算手段にエラーが発生した場合に当該エラーを記録するエラー記録手段を備え、前記エラー通知手段は、前記エラー記録手段におけるエラー記録結果に基づいて他の演算手段に対するエラー通知を実行することを特徴とする請求項1〜5のいずれか一つに記載の情報処理装置。
- 複数の演算手段を有する情報処理装置のエラーを検出するエラー検出方法であって、
前記演算手段が自演算手段におけるエラーを検出するエラー検出工程と、
前記エラー検出工程によってエラーを検出した演算手段が、他の演算手段にエラー通知を送信するエラー通知工程と、
前記エラー通知を受けた演算手段が、前記複数の演算手段のそれぞれについてエラーの発生の有無を記録するエラー演算手段記録手段に前記エラーを記録する記録工程と、
前記エラー通知を受けた演算手段が、当該エラーに基づく割り込み処理を実行する割り込み工程と、
を含んだことを特徴とするエラー検出方法。 - 前記エラー演算手段記録手段の記録内容に基づいてエラー解析処理を実行するエラー解析手段をさらに備えたことを特徴とする請求項7に記載のエラー検出方法。
- 前記エラー通知工程は、前記複数の演算手段のうち代表となる演算手段にエラーの発生を通知し、前記代表となる演算手段は、他の演算手段に対して割り込み処理を実行することを特徴とする請求項7または8に記載のエラー検出方法。
- 前記エラー通知工程は、他の全ての演算手段に対してエラー通知を実行し、該エラー通知を受けた演算手段は自らの演算処理に割り込み処理を実行することを特徴とする請求項7または8に記載のエラー検出方法。
Priority Applications (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004214787A JP2006039678A (ja) | 2004-07-22 | 2004-07-22 | 情報処理装置およびエラー検出方法 |
US10/985,042 US7502956B2 (en) | 2004-07-22 | 2004-11-10 | Information processing apparatus and error detecting method |
EP04257225A EP1628219A3 (en) | 2004-07-22 | 2004-11-22 | Information processing apparatus and error detecting method |
CNB2004100961109A CN100429626C (zh) | 2004-07-22 | 2004-11-26 | 信息处理设备和错误检测方法 |
KR1020040098453A KR100692452B1 (ko) | 2004-07-22 | 2004-11-29 | 정보 처리 장치 및 에러 검출 방법 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004214787A JP2006039678A (ja) | 2004-07-22 | 2004-07-22 | 情報処理装置およびエラー検出方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2006039678A true JP2006039678A (ja) | 2006-02-09 |
Family
ID=35448174
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004214787A Pending JP2006039678A (ja) | 2004-07-22 | 2004-07-22 | 情報処理装置およびエラー検出方法 |
Country Status (5)
Country | Link |
---|---|
US (1) | US7502956B2 (ja) |
EP (1) | EP1628219A3 (ja) |
JP (1) | JP2006039678A (ja) |
KR (1) | KR100692452B1 (ja) |
CN (1) | CN100429626C (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008084080A (ja) * | 2006-09-28 | 2008-04-10 | Nec Computertechno Ltd | 障害情報格納システム、サービスプロセッサ、障害情報格納方法、及びプログラム |
JP2009294881A (ja) * | 2008-06-04 | 2009-12-17 | Fujitsu Ltd | 情報処理装置および情報処理方法 |
JP2014182720A (ja) * | 2013-03-21 | 2014-09-29 | Fujitsu Ltd | 情報処理システム、情報処理装置及び障害処理方法 |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006155488A (ja) * | 2004-12-01 | 2006-06-15 | Sony Corp | データ処理装置およびデータ処理方法 |
US7467325B2 (en) | 2005-02-10 | 2008-12-16 | International Business Machines Corporation | Processor instruction retry recovery |
US20060184771A1 (en) * | 2005-02-11 | 2006-08-17 | International Business Machines | Mini-refresh processor recovery as bug workaround method using existing recovery hardware |
FR2884818B1 (fr) * | 2005-04-25 | 2007-07-13 | Arkema Sa | Procede de preparation d'acide acrylique a partir de glycerol |
WO2008104927A2 (en) | 2007-03-01 | 2008-09-04 | Philips Intellectual Property & Standards Gmbh | Computer-controlled lighting system |
US20080270827A1 (en) * | 2007-04-26 | 2008-10-30 | International Business Machines Corporation | Recovering diagnostic data after out-of-band data capture failure |
US9389940B2 (en) * | 2013-02-28 | 2016-07-12 | Silicon Graphics International Corp. | System and method for error logging |
JP6590754B2 (ja) * | 2016-04-28 | 2019-10-16 | キヤノン株式会社 | 通信装置、制御方法およびプログラム |
CN106835232B (zh) * | 2016-12-29 | 2018-08-31 | 中国工程物理研究院化工材料研究所 | 用于1064mm激光驱动飞片系统的飞片结构及制备方法 |
KR102542115B1 (ko) * | 2021-04-01 | 2023-06-12 | 엘에스일렉트릭(주) | 제어보드 시스템 |
Family Cites Families (37)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS57101954A (en) | 1980-12-18 | 1982-06-24 | Nec Corp | Error information system of logical device |
US5023779A (en) * | 1982-09-21 | 1991-06-11 | Xerox Corporation | Distributed processing environment fault isolation |
JPS6063641A (ja) | 1983-09-19 | 1985-04-12 | Hitachi Ltd | コンピユ−タシステムのエラ−処理回路 |
JPS621040A (ja) | 1985-06-26 | 1987-01-07 | Fuji Electric Co Ltd | コンピユ−タの障害解析装置 |
JPH01295344A (ja) | 1988-05-24 | 1989-11-29 | Nec Corp | 障害データ収集方式 |
JPH0219958A (ja) * | 1988-06-27 | 1990-01-23 | Internatl Business Mach Corp <Ibm> | 同報通信機能を備えたマルチプロセツサシステム及びその同報通信方法 |
US4982402A (en) * | 1989-02-03 | 1991-01-01 | Digital Equipment Corporation | Method and apparatus for detecting and correcting errors in a pipelined computer system |
DE69027491T2 (de) * | 1989-08-01 | 1997-02-06 | Digital Equipment Corp | Verfahren zur Softwarefehlerbehandlung |
US5649090A (en) * | 1991-05-31 | 1997-07-15 | Bull Hn Information Systems Inc. | Fault tolerant multiprocessor computer system |
US5283891A (en) * | 1991-08-08 | 1994-02-01 | Kabushiki Kaisha Toshiba | Error information saving apparatus of computer |
JPH05134998A (ja) | 1991-11-15 | 1993-06-01 | Mitsubishi Electric Corp | マルチプロセツサシステム |
JPH05224964A (ja) | 1992-02-13 | 1993-09-03 | Fujitsu Ltd | バス異常通知方式 |
JP2760367B2 (ja) | 1992-03-23 | 1998-05-28 | 日本電気株式会社 | マイクロ診断装置付情報処理装置 |
JPH05282167A (ja) | 1992-04-03 | 1993-10-29 | Hitachi Ltd | 障害処理方法 |
JPH07175765A (ja) | 1993-10-25 | 1995-07-14 | Mitsubishi Electric Corp | 計算機の障害回復方法 |
US5812757A (en) | 1993-10-08 | 1998-09-22 | Mitsubishi Denki Kabushiki Kaisha | Processing board, a computer, and a fault recovery method for the computer |
US5513346A (en) * | 1993-10-21 | 1996-04-30 | Intel Corporation | Error condition detector for handling interrupt in integrated circuits having multiple processors |
JPH07200460A (ja) | 1994-01-05 | 1995-08-04 | Fujitsu Ltd | 割込制御装置 |
JPH07219812A (ja) | 1994-01-28 | 1995-08-18 | Meidensha Corp | 異常監視方式 |
JP2800673B2 (ja) | 1994-01-31 | 1998-09-21 | 日本電気株式会社 | 障害情報収集装置 |
JPH07319836A (ja) | 1994-05-30 | 1995-12-08 | Hitachi Ltd | 障害監視方式 |
JPH0836554A (ja) | 1994-07-21 | 1996-02-06 | Mitsubishi Electric Corp | マルチプロセッサシステム |
JPH08190492A (ja) | 1995-01-11 | 1996-07-23 | Yaskawa Electric Corp | マルチプロセッサシステム |
US5535164A (en) | 1995-03-03 | 1996-07-09 | International Business Machines Corporation | BIST tester for multiple memories |
JPH09212470A (ja) | 1996-01-31 | 1997-08-15 | Toshiba Corp | マルチプロセッサシステム |
JPH09212388A (ja) | 1996-01-31 | 1997-08-15 | Hitachi Cable Ltd | Cpuの動作監視方法 |
JPH1091543A (ja) | 1996-09-19 | 1998-04-10 | Nec Eng Ltd | 障害情報記録方法及び情報処理装置 |
JP3325785B2 (ja) | 1996-10-28 | 2002-09-17 | 三菱電機株式会社 | 計算機の故障検出・回復方式 |
US6233680B1 (en) | 1998-10-02 | 2001-05-15 | International Business Machines Corporation | Method and system for boot-time deconfiguration of a processor in a symmetrical multi-processing system |
US6360333B1 (en) * | 1998-11-19 | 2002-03-19 | Compaq Computer Corporation | Method and apparatus for determining a processor failure in a multiprocessor computer |
US6675324B2 (en) * | 1999-09-27 | 2004-01-06 | Intel Corporation | Rendezvous of processors with OS coordination |
US20020029358A1 (en) * | 2000-05-31 | 2002-03-07 | Pawlowski Chester W. | Method and apparatus for delivering error interrupts to a processor of a modular, multiprocessor system |
JP2002091799A (ja) | 2000-09-14 | 2002-03-29 | Hitachi Kokusai Electric Inc | 状態監視システム |
US6931564B2 (en) * | 2001-07-13 | 2005-08-16 | International Business Machines Corporation | Failure isolation in a distributed processing system employing relative location information |
JP2003114811A (ja) | 2001-10-05 | 2003-04-18 | Nec Corp | 自動障害復旧方法及びシステム並びに装置とプログラム |
US6944788B2 (en) * | 2002-03-12 | 2005-09-13 | Sun Microsystems, Inc. | System and method for enabling failover for an application server cluster |
US20050273653A1 (en) * | 2004-05-19 | 2005-12-08 | Honeywell International Inc. | Single fault tolerance in an architecture with redundant systems |
-
2004
- 2004-07-22 JP JP2004214787A patent/JP2006039678A/ja active Pending
- 2004-11-10 US US10/985,042 patent/US7502956B2/en not_active Expired - Fee Related
- 2004-11-22 EP EP04257225A patent/EP1628219A3/en not_active Withdrawn
- 2004-11-26 CN CNB2004100961109A patent/CN100429626C/zh not_active Expired - Fee Related
- 2004-11-29 KR KR1020040098453A patent/KR100692452B1/ko active IP Right Grant
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008084080A (ja) * | 2006-09-28 | 2008-04-10 | Nec Computertechno Ltd | 障害情報格納システム、サービスプロセッサ、障害情報格納方法、及びプログラム |
JP2009294881A (ja) * | 2008-06-04 | 2009-12-17 | Fujitsu Ltd | 情報処理装置および情報処理方法 |
JP2014182720A (ja) * | 2013-03-21 | 2014-09-29 | Fujitsu Ltd | 情報処理システム、情報処理装置及び障害処理方法 |
Also Published As
Publication number | Publication date |
---|---|
US20060020851A1 (en) | 2006-01-26 |
CN100429626C (zh) | 2008-10-29 |
EP1628219A2 (en) | 2006-02-22 |
US7502956B2 (en) | 2009-03-10 |
CN1725184A (zh) | 2006-01-25 |
KR20060008211A (ko) | 2006-01-26 |
KR100692452B1 (ko) | 2007-03-09 |
EP1628219A3 (en) | 2010-05-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5579354B2 (ja) | 関連アプリケーションに対するトラック・データ・クロスリファレンスを保存する方法及び装置 | |
US7503039B2 (en) | Preprocessor to improve the performance of message-passing-based parallel programs on virtualized multi-core processors | |
JP2006039678A (ja) | 情報処理装置およびエラー検出方法 | |
US20120218268A1 (en) | Analysis of operator graph and dynamic reallocation of a resource to improve performance | |
US10216518B2 (en) | Clearing specified blocks of main storage | |
US9436539B2 (en) | Synchronized debug information generation | |
US20180137002A1 (en) | Thread based dynamic data collection | |
US8904360B2 (en) | Automated identification of redundant method calls | |
JP2011145824A (ja) | 情報処理装置、障害解析方法及び障害解析プログラム | |
US7954012B2 (en) | Hierarchical debug information collection | |
US9092333B2 (en) | Fault isolation with abstracted objects | |
US20200004546A1 (en) | Shared compare lanes for dependency wake up in a pair-based issue queue | |
CN113934566A (zh) | 异常处理方法、装置和电子设备 | |
US11182316B2 (en) | Program interrupt code conversion | |
KR20150089570A (ko) | 동적 분석 방법 및 장치 | |
US11294753B2 (en) | Information processing apparatus and method for collecting communication cable log | |
CN114780283B (zh) | 一种故障处理的方法及装置 | |
US9298381B2 (en) | Data integrity monitoring among sysplexes with a shared direct access storage device (DASD) | |
JP6111731B2 (ja) | 並列デバッグシステム、並列デバッグ方法、及び、並列デバッグプログラム | |
RU2292075C1 (ru) | Синергическая вычислительная система | |
JP5467172B1 (ja) | 情報処理システム、および情報処理方法 | |
JPS58217063A (ja) | プログラム・イベント・レコ−デイング多重管理処理方式 | |
JP5872975B2 (ja) | ソフトウェア実行状況検証装置、ソフトウェア実行状況検証方法、及びソフトウェア実行状況検証プログラム | |
CN116414514A (zh) | 一种模型训练方法、扰邻源定位方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070528 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080924 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20081125 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20090331 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090601 |