KR970066876A - 계산기 시스템 및 그 소프트웨어 고장 회복 방법 - Google Patents
계산기 시스템 및 그 소프트웨어 고장 회복 방법 Download PDFInfo
- Publication number
- KR970066876A KR970066876A KR1019970009258A KR19970009258A KR970066876A KR 970066876 A KR970066876 A KR 970066876A KR 1019970009258 A KR1019970009258 A KR 1019970009258A KR 19970009258 A KR19970009258 A KR 19970009258A KR 970066876 A KR970066876 A KR 970066876A
- Authority
- KR
- South Korea
- Prior art keywords
- software
- failure
- software failure
- estimating
- avoidance method
- Prior art date
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/14—Error detection or correction of the data by redundancy in operation
- G06F11/1402—Saving, restoring, recovering or retrying
- G06F11/1405—Saving, restoring, recovering or retrying at machine instruction level
- G06F11/1407—Checkpointing the instruction stream
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Quality & Reliability (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Retry When Errors Occur (AREA)
- Debugging And Monitoring (AREA)
- Test And Diagnosis Of Digital Computers (AREA)
Abstract
본 발명은 소프트웨어 장해의 발생을 인식했을때 해당 인식 시점의 상태정보 및 채취를 유효하게 활용하여 소프트웨어 장해의 발생 요인을 추정하거나 시스템 환경을 변화시키는 등의 수단을 이용하여 체크포인트 시점까지 롤백한 후 시스템을 재실행시켜 소프트웨어 장해를 회피한다. 장해 식별 수단(103)에 의해 해당 고장이 소프트웨어 장해로 판단된 경우에, 장해 발생시의 시스템의 상황을 기록하는 시스템 상황 기록 수단(104)과, 해당 소프트웨어 장해에 관한 발생 요인을 추정하는 소프트웨어 장해 발생 요인 추정 수단(105)과, 해당 소프트웨어 장해를 회피하는 방법을 추정하는 소프트웨어 장해 회피 방법 추정 수단(106)과, 시스템 재실행 전에 소프트웨어 장해 회피 방법 추정 수단(106)에 의해 추정된 해당 소프트웨어 장해회피 방법을 실시하는 소프트웨어 장해회피방법 실시수단(107)을 구비한다.
Description
본 내용은 요부공개 건이므로 전문내용을 수록하지 않았음
제1도는 본 발명의 실시 형태에 관한 계산기 시스템 전체의 구성을 나타내는 블록도, 제2도는 본 발명의 제1실시 형태에 관한 계산기 시스템의 동작의 흐름을 설명하기 위한 흐름도, 제3도는 본 발명의 제2실시 형태에 관한 계산기 시스템의 동작의 흐름을 설명하기 위한 흐름도.
Claims (20)
- 시스템에 장해가 발생했을때 장해 발생전의 상태로부터 데이타 처리를 재실행함으로써 내장해성을 실현하는 체크포인트 롤백 방식에 의한 고장 회복 기구를 포함하는 계산기 시스템에 있어서, 시스템에 장해가 발생했을때 해당 장해가 소프트웨어 버그에 기인하여 발생하는 소프트웨어 장해인지를 식별하는 장해 식별 단계와 : 상기 장해 식별 단계에서 소프트웨어 장해의 발생을 인식했을때 장해 발생시의 시스템의 상황을 기록하는 시스템 상황 기록 단계와; 상기 시스템 상황 기록 단계에 의해 기록된 정보를 바탕으로 소프트웨어 장해에 관한 발생 요인을 추정하는 소프트웨어 장해 발생 요인 추정 단계와 : 상기 소프트웨어 장해 발생 요인 추정 단계에 의해 추정된 소프트웨어 장해 발생 요인에 관한 회피 방법을 추정하는 소프트웨어 장해 회피 방법 추정 단계와; 상기 소프트웨어에 장해 회피 방법 추정 단계에 의해 추정된 상기 소프트웨어 장해 발생 요인에 관한 회피 방법에 따른 장해 회피 동작을 롤백한 후에 실시하는 소프트웨어 장해 회피 방법 실시 단계를 포함하는 것을 특징으로 하는 계산기 시스템.
- 시스템에 장해가 발생했을때 장해 발생전의 상태로부터 데이타 처리를 재실행함으로써 내장해성을 실현하는 체크포인트 롤백 방식에 의한 고장 회복 기구를 포함하는 계산기 시스템에 있어서, 소프트웨어 버그에 기인하여 발생하는 소프트웨어 장해가 발생했을때 해당 소프트웨어 장해를 식별하는 장해 식별 단계와 : 상기 장해 식별 단계에서 소프트웨어 장해의 발생을 인식했을때 장해 발생시의 시스템의 상황을 기록하는 시스템 상황 기록 단계와; 상기 시스템 상황 기록 단계에 의해 기록된 정보를 기초로 롤백 후의 재실행시에 있어서의 프로그램 실행 환경을 변화시키는 소프트웨어 실행 환경 조작 단계를 포함하며, 시스템에 소프트웨어 장해가 발생했을때 시스템을 재실행하여 소프트웨어버그 등에 기인하여 발생하는 소프트웨어 장해를 회피하는 고장 회복 기능을 갖는 것을 특징으로 하는 계산기 시스템.
- 시스템에 장해가 발생했을때 장해 발생전의 상태로부터 데이타 처리를 재실행함으로써 내장해성을 실현하는 체크포인트 롤백 방식에 의한 고장 회복 기구를 포함하는 계산기 시스템에 있어서, 시스템에 장해가 발생했을때 해당 장해가 소프트웨어 버그에 기인하여 발생하는 소프트웨어 장해인지를 식별하는 장해 식별 단계와; 상기 장해 식별 단계에서 소프트웨어 장해의 발생을 인식했을때 장해 발생시의 시스템의 상황을 기록하는 시스템 상황 기록 단계와; 상기 시스템 상황 기록 단계에 의해 기록된 정보를 기초로 소프트웨어 장해에 관한 발생 요인을 추정하는 소프트웨어는 장해 발생 추정 단계와; 상기 소프트웨어 장해 발생 요인 추정 단계에 의해 추정된 소프트웨어 장해 발생 요인에 관한 회피 방법을 추정하는 소프트웨어 장해 회피 방법 추정 단계와; 상기 소프트웨어 장해 회피 방법 추정 단계에 의해 추정된 상기 소프트웨어 장해 발생 요인에 관한 회피 방법을 롤백 후에 실시하는 소프트웨어 장해 회피 방법 실시 단계와; 상기 시스템 상황 기록 단계에 의해 기록된 정보를 기초로 롤백 후의 재실행시에 있어서의 프로그램 실행 환경을 변화시키는 소프트웨어 실행 환경 조작 단계를 포함하며, 소프트웨어 장해의 발생시에 상기 소프트웨어 장해에 관한 발생 요인의 추정에 의한 회피 방법의 추정이 곤란한 경우, 상기 소프트웨어 실행 환경 조작 단계에 의해 소프트웨어 실행 환경을 조작한 후 시스템을 재실행하여 소프트웨어 버그에 기인하여 발생하는 소프트웨어 장해를 회피하는 것을 특징으로 하는 계산기 시스템.
- 제1항, 제2항 또는 제3항에 있어서, 적어도 소프트웨어 장해 회피 방법 실시 단계 또는 소프트웨어 실행 환경 조작 단계에 의한 동작을 소프트웨어 장해가 회피될때까지 규정 회수내에서 반복 실시하는 것을 특징으로 하는 계산기 시스템.
- 제1항, 제2항, 제3항 또는 제4항에 있어서, 소프트웨어 장해 회피 방법 실시 단계 또는 소프트웨어 실행 환경 조작 단계를 실시하여 시스템을 재실행한 후에 다시 소프트웨어가 출현한 경우, 장해 요인을 갖는 소프트웨어 모듈을 시스템으로부터 분리한 후 시스템을 재실행하는 것을 특징으로 하는 계산기 시스템.
- 제1항, 제2항, 제3항 또는 제4항에 있어서, 소프트웨어 장해 회피 방법 실시 단계 또는 소프트웨어 실행 환경 조작 단계를 실시하여 시스템을 재실행한 후에 다시 소프트웨어 장해가 출현한 경우, 소프트웨어 장해를 유발시킨 프로세스 혹은 스레드를 시스템으로부터 말소한 후 시스템을 재실행하는 것을 특징으로 하는 계산기 시스템.
- 제5항에 있어서, 시스템으로부터 분리된 소프트웨어 모듈은 시스템 가동 상태에서 장해 요인을 갖는 소프트웨어 모듈로부터 장해 요인을 제거한 소프트웨어 모듈로 동적이고 또한 시스템 정지를 수반하는 일없이 전환 가능한 것을 특징으로 하는 계산기 시스템.
- 제1항, 제2항, 제3항 또는 제4항에 있어서, 적어도 소프트웨어 장해 회피 방법 실시 수단 또는 소프트웨어 실행 환경 조작 수단에 의한 동작을 소프트웨어 장해가 회피될때까지 규정회수내에서 반복 실시한 후에 다시 소프트웨어 장해가 출현한 경우, 시스템의 재기동을 실시하는 것을 특징으로 하는 계산기 시스템.
- 제1항, 제2항 또는 제3항에 있어서, 시스템 상황 기록 단계는 소프트웨어 장해 발생시의 시스템의 상황을 소프트웨어 장해 발생 요인을 해석하기 위한 제공 정보로서 롤백되지 않은 메모리 영역 혹은 불휘발성의 기억 장치에 기록하는 것을 특징으로 하는 계산기 시스템.
- 제1항, 제2항 또는 제3항에 있어서,소프트웨어 장해 발생 요인 추정 단계는 추정한 장해 발생 요인을 장해 발생 요인을 해석하기 위한 제공 정보로서 롤백되지 않은 메모리 혹은 불휘발성의 기억 장치에 기록하는 것을 특징으로 하는 계산기 시스템.
- 제1항 또는 제3항에 있어서, 소프트웨어 장해 회피 방법 추정 단계는 추정한 소프트웨어 장해 발생 요인에 관한 회피 방법을 장해 회피 방법을 실시하기 위한 제공 정보로서 롤백되지 않은 메모리 혹은 불휘발성의 기억 장치에 기록하는 것을 특징으로 하는 계산기 시스템.
- 제1항, 제2항 또는 제3항에 있어서, 시스템 상황 기록 수단은 소프트웨어 장해 발생시의 시스템의 메모리 및 각종 장치에 관한 데이타 등의 덤프를 이용자의 요구에 따라서 외부 기억 장치에 기록하고, 소프트웨어 장해 발생 요인을 해석하기 위한 정보로서 제공하는 것을 특징으로 하는 계산기 시스템.
- 제2항 또는 제3항에 있어서, 소프트에어 실행 환경 조작 단계는 가동하는 프로세서수를 소프트웨어 실행 환경 조작의 하나로서 변경하는 것을 특징으로 하는 계산기 시스템.
- 제2항 또는 제3항에 있어서, 소프트웨어 실행 환경 조작 단계는 소프트웨어 장해를 유발시킨 프로세스 혹은 스레드에 관한 스택상의 자동 변수 영역을 소프트웨어 실행 환경 조작의 하나로서 클리어하는 것을 특징으로 하는 계산기 시스템.
- 제2항 또는 제3항에 있어서, 소프트웨어 실행 환경 조작 단계는 소프트웨어 실행 환경 조작의 하나로서 시스템에서 사용하는 자원을 동적으로 보충하는 것을 특징으로 하는 계산기 시스템.
- 제2항 또는 제3항에 있어서, 소프트웨어 실행 환경 조작 단계는 소프트웨어 실행 환경 조작의 하나로서 입출력 요구의 발행 타이밍을 조정하는 것을 특징으로 하는 계산기 시스템.
- 제1항 또는 제3항에 있어서, 소프트웨어 장해 회피 방법 실시 단계는 소프트웨어 장해 발생 요인이 물리 메모리상에 로드되어 있지 않은 가상 메모리로의 액세스이면 소프트웨어 장해 발생 요인 추정 단계에 의해 추정되고, 소프트웨어는 장해 회피 방법 추정 단계에 의해 해당 소프트웨어 장해 발생 요인에 관한 회피 방법으로서 가상 메모리에 관한 물리 메모리를 확보하는 것으로 추정되었을때, 상기 추정된 회피 방법을 실시하는 것을 특징으로 하는 계산기 시스템.
- 제1항 또는 제3항에 있어서, 소프트웨어 장해 회피 방법 실시 단계는 소프트웨어 장해 발생 요인이 멀티프로세서 환경에서의 배타 제어에 관한 데드로크이면 소프트웨어 장해 발생요인 추정 단계에 의해 추정되며, 소프트웨어 장해 회피 방법 추정 단계에 의해 해당 소프트웨어 장해 발생 요인에 관한 회피 방법으로서 가동하는 프로세서수의 변경 및 배타 제어를 실시하는 코드를 변경하는 것으로 추정되었을때, 상기 추정된 회피 방법을 실시하는 것을 특징으로 하는 계산기 시스템.
- 제18항에 있어서, 멀티프로세서 환경에 있어서의 배타 제어에 관한 데드로크에 관한 회피 방법을 실시하여 시스템의 재실행 후 소프트웨어 장해의 회피가 이루어진 경우,그 후의 체크포인트 채취 수단의 일환으로 가동하는 프로세서수 및 배타 제어를 실시하는 코드를 원래의 상태로 복귀하여 시스템을 소프트웨어 장해 발생전의 시스템의 운영 상태로 하는 것을 특징으로 하는 계산기 시스템.
- 제9항, 제10항 또는 제11항에 있어서, 롤백되지 않은 메모리 혹은 불휘발성의 기억 장치에 기재된 정보는 소프트웨어 장해 회피 후 체크포인트 채취 수단의 일환으로서 계산기 시스템이 갖는 시스템의 로그 기구를 통해 기억되는 것을 특징으로 하는 계산기 시스템.※ 참고사항 : 최초출원 내용에 의하여 공개하는 것임.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP8062840A JP3072048B2 (ja) | 1996-03-19 | 1996-03-19 | 計算機システムおよび計算機システムのソフトウェア故障回復方法 |
JP96-62840 | 1996-03-19 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR970066876A true KR970066876A (ko) | 1997-10-13 |
Family
ID=13211916
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1019970009258A KR970066876A (ko) | 1996-03-19 | 1997-03-19 | 계산기 시스템 및 그 소프트웨어 고장 회복 방법 |
Country Status (4)
Country | Link |
---|---|
US (1) | US5948112A (ko) |
JP (1) | JP3072048B2 (ko) |
KR (1) | KR970066876A (ko) |
CN (1) | CN1164708A (ko) |
Families Citing this family (82)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3253883B2 (ja) * | 1997-01-31 | 2002-02-04 | 株式会社東芝 | プロセスリスタート方法及びプロセス監視装置 |
US6275955B1 (en) * | 1997-05-14 | 2001-08-14 | Steeplechase Software, Inc. | Diagnostic software for facilitating flowchart programming |
US6134566A (en) * | 1997-06-30 | 2000-10-17 | Microsoft Corporation | Method for controlling an electronic mail preview pane to avoid system disruption |
JP3593241B2 (ja) | 1997-07-02 | 2004-11-24 | 株式会社日立製作所 | 計算機の再起動方法 |
US6662358B1 (en) | 1997-12-12 | 2003-12-09 | International Business Machines Corporation | Minimizing profiling-related perturbation using periodic contextual information |
US6513155B1 (en) | 1997-12-12 | 2003-01-28 | International Business Machines Corporation | Method and system for merging event-based data and sampled data into postprocessed trace output |
US6732357B1 (en) | 1997-12-12 | 2004-05-04 | International Business Machines Corporation | Determining and compensating for temporal overhead in trace record generation and processing |
US6546548B1 (en) | 1997-12-12 | 2003-04-08 | International Business Machines Corporation | Method and system for compensating for output overhead in trace data using initial calibration information |
US6158024A (en) * | 1998-03-31 | 2000-12-05 | International Business Machines Corporation | Method and apparatus for structured memory analysis of data processing systems and applications |
US6751789B1 (en) | 1997-12-12 | 2004-06-15 | International Business Machines Corporation | Method and system for periodic trace sampling for real-time generation of segments of call stack trees augmented with call stack position determination |
US6560773B1 (en) | 1997-12-12 | 2003-05-06 | International Business Machines Corporation | Method and system for memory leak detection in an object-oriented environment during real-time trace processing |
US6308270B1 (en) * | 1998-02-13 | 2001-10-23 | Schlumberger Technologies, Inc. | Validating and certifying execution of a software program with a smart card |
FR2784475B1 (fr) * | 1998-10-12 | 2000-12-29 | Centre Nat Etd Spatiales | Procede de traitement d'un systeme electronique soumis a des contraintes d'erreurs transitoires |
US6401216B1 (en) * | 1998-10-29 | 2002-06-04 | International Business Machines Corporation | System of performing checkpoint/restart of a parallel program |
US6393583B1 (en) | 1998-10-29 | 2002-05-21 | International Business Machines Corporation | Method of performing checkpoint/restart of a parallel program |
JP2001027951A (ja) | 1999-07-14 | 2001-01-30 | Fujitsu Ltd | マルチプロセッサ構成の情報処理システムにおけるファイルロード装置と記録媒体 |
US7761857B1 (en) | 1999-10-13 | 2010-07-20 | Robert Bedichek | Method for switching between interpretation and dynamic translation in a processor system based upon code sequence execution counts |
US7111307B1 (en) | 1999-11-23 | 2006-09-19 | Microsoft Corporation | Method and system for monitoring and verifying software drivers using system resources including memory allocation and access |
JP2001249828A (ja) * | 1999-12-28 | 2001-09-14 | Toshiba Lsi System Support Kk | 情報処理装置、不具合解析プログラムを格納したコンピュータ読み取り可能な記憶媒体、不具合解析方法、及びアプリケーションプログラム開発支援システム |
US6594821B1 (en) | 2000-03-30 | 2003-07-15 | Transmeta Corporation | Translation consistency checking for modified target instructions by comparing to original copy |
US6728907B1 (en) * | 2000-04-14 | 2004-04-27 | Microsoft Corporation | System and method for self-diagnosing system crashes |
US6785848B1 (en) * | 2000-05-15 | 2004-08-31 | Microsoft Corporation | Method and system for categorizing failures of a program module |
US6629267B1 (en) * | 2000-05-15 | 2003-09-30 | Microsoft Corporation | Method and system for reporting a program failure |
US6701454B1 (en) * | 2000-06-05 | 2004-03-02 | Microsoft Corporation | Method and system for recovering information during a program failure |
US6691250B1 (en) | 2000-06-29 | 2004-02-10 | Cisco Technology, Inc. | Fault handling process for enabling recovery, diagnosis, and self-testing of computer systems |
US7149878B1 (en) * | 2000-10-30 | 2006-12-12 | Mips Technologies, Inc. | Changing instruction set architecture mode by comparison of current instruction execution address with boundary address register values |
US6681348B1 (en) * | 2000-12-15 | 2004-01-20 | Microsoft Corporation | Creation of mini dump files from full dump files |
US7107439B2 (en) * | 2001-08-10 | 2006-09-12 | Mips Technologies, Inc. | System and method of controlling software decompression through exceptions |
US7168008B2 (en) * | 2002-01-18 | 2007-01-23 | Mobitv, Inc. | Method and system for isolating and protecting software components |
US6961874B2 (en) * | 2002-05-20 | 2005-11-01 | Sun Microsystems, Inc. | Software hardening utilizing recoverable, correctable, and unrecoverable fault protocols |
US7058849B2 (en) * | 2002-07-02 | 2006-06-06 | Micron Technology, Inc. | Use of non-volatile memory to perform rollback function |
US7318171B2 (en) * | 2003-03-12 | 2008-01-08 | Intel Corporation | Policy-based response to system errors occurring during OS runtime |
JP4345334B2 (ja) * | 2003-03-28 | 2009-10-14 | 日本電気株式会社 | 耐障害計算機システム、プログラム並列実行方法およびプログラム |
US7310723B1 (en) | 2003-04-02 | 2007-12-18 | Transmeta Corporation | Methods and systems employing a flag for deferring exception handling to a commit or rollback point |
US7308584B2 (en) * | 2003-08-14 | 2007-12-11 | International Business Machines Corporation | System and method for securing a portable processing module |
US7225448B2 (en) * | 2003-08-14 | 2007-05-29 | Lenovo (Singapore) Pte. Ltd. | System and method for hibernating application state data on removable module |
US20050038879A1 (en) * | 2003-08-14 | 2005-02-17 | International Business Machines Corporation | System and method for discovery of remote device driver functionality and interface |
US7356665B2 (en) * | 2003-12-17 | 2008-04-08 | International Business Machines Corporation | Method and system for machine memory power and availability management in a processing system supporting multiple virtual machines |
US20050204199A1 (en) * | 2004-02-28 | 2005-09-15 | Ibm Corporation | Automatic crash recovery in computer operating systems |
US7684654B2 (en) * | 2004-06-30 | 2010-03-23 | General Electric Company | System and method for fault detection and recovery in a medical imaging system |
US7263631B2 (en) * | 2004-08-13 | 2007-08-28 | Seakr Engineering, Incorporated | Soft error detection and recovery |
US7984220B2 (en) * | 2004-09-02 | 2011-07-19 | International Business Machines Corporation | Exception tracking |
CN100343816C (zh) * | 2004-09-24 | 2007-10-17 | 华为技术有限公司 | 恢复单板软件版本的方法 |
US8332826B2 (en) * | 2005-05-26 | 2012-12-11 | United Parcel Service Of America, Inc. | Software process monitor |
US7558986B2 (en) * | 2005-05-26 | 2009-07-07 | United Parcel Service Of America, Inc. | Software process monitor |
US7823021B2 (en) * | 2005-05-26 | 2010-10-26 | United Parcel Service Of America, Inc. | Software process monitor |
US8078919B2 (en) * | 2005-06-14 | 2011-12-13 | Hitachi Global Storage Technologies Netherlands B.V. | Method, apparatus and program storage device for managing multiple step processes triggered by a signal |
US8413162B1 (en) * | 2005-06-28 | 2013-04-02 | Guillermo J. Rozas | Multi-threading based on rollback |
EP1902368B1 (en) * | 2005-07-12 | 2015-10-14 | International Business Machines Corporation | Method and system for reconfiguring functional capabilities in a data processing system with dormant resources |
US8568226B2 (en) * | 2005-07-20 | 2013-10-29 | Wms Gaming Inc. | Master control program for a gaming device |
US7823029B2 (en) * | 2005-09-07 | 2010-10-26 | International Business Machines Corporation | Failure recognition, notification, and prevention for learning and self-healing capabilities in a monitored system |
US7702966B2 (en) * | 2005-09-07 | 2010-04-20 | Intel Corporation | Method and apparatus for managing software errors in a computer system |
US20070174484A1 (en) * | 2006-01-23 | 2007-07-26 | Stratus Technologies Bermuda Ltd. | Apparatus and method for high performance checkpointing and rollback of network operations |
US7962798B2 (en) * | 2006-04-17 | 2011-06-14 | The Trustees Of Columbia University In The City Of New York | Methods, systems and media for software self-healing |
US8924782B2 (en) | 2007-01-26 | 2014-12-30 | The Trustees Of Columbia University In The City Of New York | Systems, methods, and media for recovering an application from a fault or attack |
US8209417B2 (en) * | 2007-03-08 | 2012-06-26 | Oracle International Corporation | Dynamic resource profiles for clusterware-managed resources |
CN101290577A (zh) * | 2007-04-20 | 2008-10-22 | 鸿富锦精密工业(深圳)有限公司 | 嵌入式设备及其加载方法 |
JP4838226B2 (ja) * | 2007-11-20 | 2011-12-14 | 富士通株式会社 | ネットワークロギング処理プログラム,情報処理システムおよびネットワークロギング情報自動退避方法 |
US8281185B2 (en) * | 2009-06-30 | 2012-10-02 | Oracle America, Inc. | Advice-based feedback for transactional execution |
JP2011060055A (ja) * | 2009-09-11 | 2011-03-24 | Fujitsu Ltd | 仮想計算機システム、仮想マシンの復旧処理方法及びそのプログラム |
JP4945663B2 (ja) | 2010-06-30 | 2012-06-06 | 株式会社東芝 | 情報処理装置およびデータの復旧方法 |
US9038048B2 (en) | 2010-07-22 | 2015-05-19 | The Trustees Of Columbia University In The City Of New York | Methods, systems, and media for protecting applications from races |
JP5736757B2 (ja) * | 2010-12-10 | 2015-06-17 | セイコーエプソン株式会社 | 印刷装置、及び、印刷方法 |
CN103493021B (zh) * | 2011-04-21 | 2016-06-22 | 国际商业机器公司 | 用于故障监视和修复的方法和系统 |
US9489251B2 (en) * | 2011-12-06 | 2016-11-08 | Bio-Rad Laboratories, Inc. | Supervising and recovering software components associated with medical diagnostics instruments |
JP2014119964A (ja) * | 2012-12-17 | 2014-06-30 | Hitachi Ltd | 計算機システムおよびプログラム |
US9251002B2 (en) | 2013-01-15 | 2016-02-02 | Stratus Technologies Bermuda Ltd. | System and method for writing checkpointing data |
CN103150222B (zh) * | 2013-01-28 | 2016-02-10 | 中兴通讯股份有限公司 | 嵌入式系统异常恢复的方法和装置 |
TWI528173B (zh) * | 2013-10-25 | 2016-04-01 | 緯創資通股份有限公司 | 自動除錯與防錯方法、裝置與電腦程式產品 |
EP3090336A1 (en) | 2013-12-30 | 2016-11-09 | Paul A. Leveille | Checkpointing systems and methods of using data forwarding |
EP3090345B1 (en) | 2013-12-30 | 2017-11-08 | Stratus Technologies Bermuda Ltd. | Method of delaying checkpoints by inspecting network packets |
US9652338B2 (en) | 2013-12-30 | 2017-05-16 | Stratus Technologies Bermuda Ltd. | Dynamic checkpointing systems and methods |
US9645879B2 (en) * | 2014-02-27 | 2017-05-09 | International Business Machines Corporation | Salvaging hardware transactions with instructions |
CN103914523A (zh) * | 2014-03-24 | 2014-07-09 | 小米科技有限责任公司 | 页面回退控制方法及装置 |
US9679076B2 (en) | 2014-03-24 | 2017-06-13 | Xiaomi Inc. | Method and device for controlling page rollback |
GB2542370B (en) * | 2015-09-16 | 2020-05-27 | Arm Ip Ltd | A system for monitoring a plurality of distributed devices |
JP6866724B2 (ja) * | 2017-03-28 | 2021-04-28 | 日本電気株式会社 | 分散コンピューティングシステム、処理選択装置、処理選択方法及びプログラム |
JP6853883B2 (ja) * | 2017-06-15 | 2021-03-31 | 株式会社日立製作所 | コントローラ |
CN109032022B (zh) * | 2018-08-08 | 2021-01-15 | 江苏拓米洛环境试验设备有限公司 | 试验箱报警秒接续程序智能无缝衔接运转方法 |
CN109254877A (zh) * | 2018-09-11 | 2019-01-22 | 广州骏凯永卓信息科技有限公司 | 一种企业用计算机软件故障的监测维修系统 |
CN110083488B (zh) * | 2019-04-21 | 2023-03-17 | 哈尔滨工业大学 | 一种面向gpgpu的细粒度低开销的容错系统 |
CN113625696B (zh) * | 2021-08-31 | 2023-03-24 | 东风商用车有限公司 | 车载控制器过流保护的安全处理方法及系统 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06222952A (ja) * | 1993-01-27 | 1994-08-12 | Toshiba Corp | デバッグ支援装置 |
US5590277A (en) * | 1994-06-22 | 1996-12-31 | Lucent Technologies Inc. | Progressive retry method and apparatus for software failure recovery in multi-process message-passing applications |
US5630047A (en) * | 1995-09-12 | 1997-05-13 | Lucent Technologies Inc. | Method for software error recovery using consistent global checkpoints |
-
1996
- 1996-03-19 JP JP8062840A patent/JP3072048B2/ja not_active Expired - Fee Related
-
1997
- 1997-03-18 US US08/820,718 patent/US5948112A/en not_active Expired - Fee Related
- 1997-03-18 CN CN97104512A patent/CN1164708A/zh active Pending
- 1997-03-19 KR KR1019970009258A patent/KR970066876A/ko not_active Application Discontinuation
Also Published As
Publication number | Publication date |
---|---|
JPH09258995A (ja) | 1997-10-03 |
JP3072048B2 (ja) | 2000-07-31 |
CN1164708A (zh) | 1997-11-12 |
US5948112A (en) | 1999-09-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR970066876A (ko) | 계산기 시스템 및 그 소프트웨어 고장 회복 방법 | |
US8078854B2 (en) | Using register rename maps to facilitate precise exception semantics | |
US9298497B2 (en) | Computer processor providing exception handling with reduced state storage | |
US20160299760A1 (en) | Methods and systems for performing a replay execution | |
US7669078B2 (en) | Method and apparatus for debugging a program on a limited resource processor | |
US8959277B2 (en) | Facilitating gated stores without data bypass | |
US20100031084A1 (en) | Checkpointing in a processor that supports simultaneous speculative threading | |
US8930761B2 (en) | Test case result processing | |
US9086969B2 (en) | Establishing a useful debugging state for multithreaded computer program | |
RU2431182C2 (ru) | Способ, операционная система и вычислительное устройство для выполнения компьютерной программы | |
US9836386B2 (en) | Automatic switch to debugging mode | |
CN111133418B (zh) | 在例外屏蔽更新指令之后允许未中止的事务处理 | |
CN110998541A (zh) | 调试器中的代码的试验性执行 | |
US9697040B2 (en) | Software replayer for transactional memory programs | |
CN115935631A (zh) | 用于车机设备的测试系统和方法、存储介质 | |
CN106033368A (zh) | 一种多核虚拟机确定性重演的方法 | |
US5655072A (en) | Method and apparatus for testing a sytem component with test checkpointing | |
KR102052816B1 (ko) | 비휘발성 주기억장치 환경에서 에러 복구 방법 및 그 시스템 | |
KR970059900A (ko) | 검사복구기능을 가진 입출력장치 | |
US10678595B2 (en) | Dynamic saving of registers in transactions | |
JPS60142747A (ja) | 命令再実行制御方式 | |
Yeh et al. | Improving Fault Tolerance through Crash Recovery | |
JPH103403A (ja) | 計算機システムおよびデバッグ方法 | |
JP2695775B2 (ja) | コンピュータシステムの誤動作からの復帰方法 | |
JP2023525025A (ja) | 装置の状態情報を収集する技術 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E601 | Decision to refuse application |