KR970066876A - 계산기 시스템 및 그 소프트웨어 고장 회복 방법 - Google Patents

계산기 시스템 및 그 소프트웨어 고장 회복 방법 Download PDF

Info

Publication number
KR970066876A
KR970066876A KR1019970009258A KR19970009258A KR970066876A KR 970066876 A KR970066876 A KR 970066876A KR 1019970009258 A KR1019970009258 A KR 1019970009258A KR 19970009258 A KR19970009258 A KR 19970009258A KR 970066876 A KR970066876 A KR 970066876A
Authority
KR
South Korea
Prior art keywords
software
failure
software failure
estimating
avoidance method
Prior art date
Application number
KR1019970009258A
Other languages
English (en)
Inventor
도모후미 시마다
히데아키 히라야마
마사하루 노자키
Original Assignee
니시무로 타이조
가부시기가이샤 도시바
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 니시무로 타이조, 가부시기가이샤 도시바 filed Critical 니시무로 타이조
Publication of KR970066876A publication Critical patent/KR970066876A/ko

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1405Saving, restoring, recovering or retrying at machine instruction level
    • G06F11/1407Checkpointing the instruction stream

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Retry When Errors Occur (AREA)
  • Debugging And Monitoring (AREA)
  • Test And Diagnosis Of Digital Computers (AREA)

Abstract

본 발명은 소프트웨어 장해의 발생을 인식했을때 해당 인식 시점의 상태정보 및 채취를 유효하게 활용하여 소프트웨어 장해의 발생 요인을 추정하거나 시스템 환경을 변화시키는 등의 수단을 이용하여 체크포인트 시점까지 롤백한 후 시스템을 재실행시켜 소프트웨어 장해를 회피한다. 장해 식별 수단(103)에 의해 해당 고장이 소프트웨어 장해로 판단된 경우에, 장해 발생시의 시스템의 상황을 기록하는 시스템 상황 기록 수단(104)과, 해당 소프트웨어 장해에 관한 발생 요인을 추정하는 소프트웨어 장해 발생 요인 추정 수단(105)과, 해당 소프트웨어 장해를 회피하는 방법을 추정하는 소프트웨어 장해 회피 방법 추정 수단(106)과, 시스템 재실행 전에 소프트웨어 장해 회피 방법 추정 수단(106)에 의해 추정된 해당 소프트웨어 장해회피 방법을 실시하는 소프트웨어 장해회피방법 실시수단(107)을 구비한다.

Description

계산기 시스템 및 그 소프트웨어 고장 회복 방법
본 내용은 요부공개 건이므로 전문내용을 수록하지 않았음
제1도는 본 발명의 실시 형태에 관한 계산기 시스템 전체의 구성을 나타내는 블록도, 제2도는 본 발명의 제1실시 형태에 관한 계산기 시스템의 동작의 흐름을 설명하기 위한 흐름도, 제3도는 본 발명의 제2실시 형태에 관한 계산기 시스템의 동작의 흐름을 설명하기 위한 흐름도.

Claims (20)

  1. 시스템에 장해가 발생했을때 장해 발생전의 상태로부터 데이타 처리를 재실행함으로써 내장해성을 실현하는 체크포인트 롤백 방식에 의한 고장 회복 기구를 포함하는 계산기 시스템에 있어서, 시스템에 장해가 발생했을때 해당 장해가 소프트웨어 버그에 기인하여 발생하는 소프트웨어 장해인지를 식별하는 장해 식별 단계와 : 상기 장해 식별 단계에서 소프트웨어 장해의 발생을 인식했을때 장해 발생시의 시스템의 상황을 기록하는 시스템 상황 기록 단계와; 상기 시스템 상황 기록 단계에 의해 기록된 정보를 바탕으로 소프트웨어 장해에 관한 발생 요인을 추정하는 소프트웨어 장해 발생 요인 추정 단계와 : 상기 소프트웨어 장해 발생 요인 추정 단계에 의해 추정된 소프트웨어 장해 발생 요인에 관한 회피 방법을 추정하는 소프트웨어 장해 회피 방법 추정 단계와; 상기 소프트웨어에 장해 회피 방법 추정 단계에 의해 추정된 상기 소프트웨어 장해 발생 요인에 관한 회피 방법에 따른 장해 회피 동작을 롤백한 후에 실시하는 소프트웨어 장해 회피 방법 실시 단계를 포함하는 것을 특징으로 하는 계산기 시스템.
  2. 시스템에 장해가 발생했을때 장해 발생전의 상태로부터 데이타 처리를 재실행함으로써 내장해성을 실현하는 체크포인트 롤백 방식에 의한 고장 회복 기구를 포함하는 계산기 시스템에 있어서, 소프트웨어 버그에 기인하여 발생하는 소프트웨어 장해가 발생했을때 해당 소프트웨어 장해를 식별하는 장해 식별 단계와 : 상기 장해 식별 단계에서 소프트웨어 장해의 발생을 인식했을때 장해 발생시의 시스템의 상황을 기록하는 시스템 상황 기록 단계와; 상기 시스템 상황 기록 단계에 의해 기록된 정보를 기초로 롤백 후의 재실행시에 있어서의 프로그램 실행 환경을 변화시키는 소프트웨어 실행 환경 조작 단계를 포함하며, 시스템에 소프트웨어 장해가 발생했을때 시스템을 재실행하여 소프트웨어버그 등에 기인하여 발생하는 소프트웨어 장해를 회피하는 고장 회복 기능을 갖는 것을 특징으로 하는 계산기 시스템.
  3. 시스템에 장해가 발생했을때 장해 발생전의 상태로부터 데이타 처리를 재실행함으로써 내장해성을 실현하는 체크포인트 롤백 방식에 의한 고장 회복 기구를 포함하는 계산기 시스템에 있어서, 시스템에 장해가 발생했을때 해당 장해가 소프트웨어 버그에 기인하여 발생하는 소프트웨어 장해인지를 식별하는 장해 식별 단계와; 상기 장해 식별 단계에서 소프트웨어 장해의 발생을 인식했을때 장해 발생시의 시스템의 상황을 기록하는 시스템 상황 기록 단계와; 상기 시스템 상황 기록 단계에 의해 기록된 정보를 기초로 소프트웨어 장해에 관한 발생 요인을 추정하는 소프트웨어는 장해 발생 추정 단계와; 상기 소프트웨어 장해 발생 요인 추정 단계에 의해 추정된 소프트웨어 장해 발생 요인에 관한 회피 방법을 추정하는 소프트웨어 장해 회피 방법 추정 단계와; 상기 소프트웨어 장해 회피 방법 추정 단계에 의해 추정된 상기 소프트웨어 장해 발생 요인에 관한 회피 방법을 롤백 후에 실시하는 소프트웨어 장해 회피 방법 실시 단계와; 상기 시스템 상황 기록 단계에 의해 기록된 정보를 기초로 롤백 후의 재실행시에 있어서의 프로그램 실행 환경을 변화시키는 소프트웨어 실행 환경 조작 단계를 포함하며, 소프트웨어 장해의 발생시에 상기 소프트웨어 장해에 관한 발생 요인의 추정에 의한 회피 방법의 추정이 곤란한 경우, 상기 소프트웨어 실행 환경 조작 단계에 의해 소프트웨어 실행 환경을 조작한 후 시스템을 재실행하여 소프트웨어 버그에 기인하여 발생하는 소프트웨어 장해를 회피하는 것을 특징으로 하는 계산기 시스템.
  4. 제1항, 제2항 또는 제3항에 있어서, 적어도 소프트웨어 장해 회피 방법 실시 단계 또는 소프트웨어 실행 환경 조작 단계에 의한 동작을 소프트웨어 장해가 회피될때까지 규정 회수내에서 반복 실시하는 것을 특징으로 하는 계산기 시스템.
  5. 제1항, 제2항, 제3항 또는 제4항에 있어서, 소프트웨어 장해 회피 방법 실시 단계 또는 소프트웨어 실행 환경 조작 단계를 실시하여 시스템을 재실행한 후에 다시 소프트웨어가 출현한 경우, 장해 요인을 갖는 소프트웨어 모듈을 시스템으로부터 분리한 후 시스템을 재실행하는 것을 특징으로 하는 계산기 시스템.
  6. 제1항, 제2항, 제3항 또는 제4항에 있어서, 소프트웨어 장해 회피 방법 실시 단계 또는 소프트웨어 실행 환경 조작 단계를 실시하여 시스템을 재실행한 후에 다시 소프트웨어 장해가 출현한 경우, 소프트웨어 장해를 유발시킨 프로세스 혹은 스레드를 시스템으로부터 말소한 후 시스템을 재실행하는 것을 특징으로 하는 계산기 시스템.
  7. 제5항에 있어서, 시스템으로부터 분리된 소프트웨어 모듈은 시스템 가동 상태에서 장해 요인을 갖는 소프트웨어 모듈로부터 장해 요인을 제거한 소프트웨어 모듈로 동적이고 또한 시스템 정지를 수반하는 일없이 전환 가능한 것을 특징으로 하는 계산기 시스템.
  8. 제1항, 제2항, 제3항 또는 제4항에 있어서, 적어도 소프트웨어 장해 회피 방법 실시 수단 또는 소프트웨어 실행 환경 조작 수단에 의한 동작을 소프트웨어 장해가 회피될때까지 규정회수내에서 반복 실시한 후에 다시 소프트웨어 장해가 출현한 경우, 시스템의 재기동을 실시하는 것을 특징으로 하는 계산기 시스템.
  9. 제1항, 제2항 또는 제3항에 있어서, 시스템 상황 기록 단계는 소프트웨어 장해 발생시의 시스템의 상황을 소프트웨어 장해 발생 요인을 해석하기 위한 제공 정보로서 롤백되지 않은 메모리 영역 혹은 불휘발성의 기억 장치에 기록하는 것을 특징으로 하는 계산기 시스템.
  10. 제1항, 제2항 또는 제3항에 있어서,소프트웨어 장해 발생 요인 추정 단계는 추정한 장해 발생 요인을 장해 발생 요인을 해석하기 위한 제공 정보로서 롤백되지 않은 메모리 혹은 불휘발성의 기억 장치에 기록하는 것을 특징으로 하는 계산기 시스템.
  11. 제1항 또는 제3항에 있어서, 소프트웨어 장해 회피 방법 추정 단계는 추정한 소프트웨어 장해 발생 요인에 관한 회피 방법을 장해 회피 방법을 실시하기 위한 제공 정보로서 롤백되지 않은 메모리 혹은 불휘발성의 기억 장치에 기록하는 것을 특징으로 하는 계산기 시스템.
  12. 제1항, 제2항 또는 제3항에 있어서, 시스템 상황 기록 수단은 소프트웨어 장해 발생시의 시스템의 메모리 및 각종 장치에 관한 데이타 등의 덤프를 이용자의 요구에 따라서 외부 기억 장치에 기록하고, 소프트웨어 장해 발생 요인을 해석하기 위한 정보로서 제공하는 것을 특징으로 하는 계산기 시스템.
  13. 제2항 또는 제3항에 있어서, 소프트에어 실행 환경 조작 단계는 가동하는 프로세서수를 소프트웨어 실행 환경 조작의 하나로서 변경하는 것을 특징으로 하는 계산기 시스템.
  14. 제2항 또는 제3항에 있어서, 소프트웨어 실행 환경 조작 단계는 소프트웨어 장해를 유발시킨 프로세스 혹은 스레드에 관한 스택상의 자동 변수 영역을 소프트웨어 실행 환경 조작의 하나로서 클리어하는 것을 특징으로 하는 계산기 시스템.
  15. 제2항 또는 제3항에 있어서, 소프트웨어 실행 환경 조작 단계는 소프트웨어 실행 환경 조작의 하나로서 시스템에서 사용하는 자원을 동적으로 보충하는 것을 특징으로 하는 계산기 시스템.
  16. 제2항 또는 제3항에 있어서, 소프트웨어 실행 환경 조작 단계는 소프트웨어 실행 환경 조작의 하나로서 입출력 요구의 발행 타이밍을 조정하는 것을 특징으로 하는 계산기 시스템.
  17. 제1항 또는 제3항에 있어서, 소프트웨어 장해 회피 방법 실시 단계는 소프트웨어 장해 발생 요인이 물리 메모리상에 로드되어 있지 않은 가상 메모리로의 액세스이면 소프트웨어 장해 발생 요인 추정 단계에 의해 추정되고, 소프트웨어는 장해 회피 방법 추정 단계에 의해 해당 소프트웨어 장해 발생 요인에 관한 회피 방법으로서 가상 메모리에 관한 물리 메모리를 확보하는 것으로 추정되었을때, 상기 추정된 회피 방법을 실시하는 것을 특징으로 하는 계산기 시스템.
  18. 제1항 또는 제3항에 있어서, 소프트웨어 장해 회피 방법 실시 단계는 소프트웨어 장해 발생 요인이 멀티프로세서 환경에서의 배타 제어에 관한 데드로크이면 소프트웨어 장해 발생요인 추정 단계에 의해 추정되며, 소프트웨어 장해 회피 방법 추정 단계에 의해 해당 소프트웨어 장해 발생 요인에 관한 회피 방법으로서 가동하는 프로세서수의 변경 및 배타 제어를 실시하는 코드를 변경하는 것으로 추정되었을때, 상기 추정된 회피 방법을 실시하는 것을 특징으로 하는 계산기 시스템.
  19. 제18항에 있어서, 멀티프로세서 환경에 있어서의 배타 제어에 관한 데드로크에 관한 회피 방법을 실시하여 시스템의 재실행 후 소프트웨어 장해의 회피가 이루어진 경우,그 후의 체크포인트 채취 수단의 일환으로 가동하는 프로세서수 및 배타 제어를 실시하는 코드를 원래의 상태로 복귀하여 시스템을 소프트웨어 장해 발생전의 시스템의 운영 상태로 하는 것을 특징으로 하는 계산기 시스템.
  20. 제9항, 제10항 또는 제11항에 있어서, 롤백되지 않은 메모리 혹은 불휘발성의 기억 장치에 기재된 정보는 소프트웨어 장해 회피 후 체크포인트 채취 수단의 일환으로서 계산기 시스템이 갖는 시스템의 로그 기구를 통해 기억되는 것을 특징으로 하는 계산기 시스템.
    ※ 참고사항 : 최초출원 내용에 의하여 공개하는 것임.
KR1019970009258A 1996-03-19 1997-03-19 계산기 시스템 및 그 소프트웨어 고장 회복 방법 KR970066876A (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP8062840A JP3072048B2 (ja) 1996-03-19 1996-03-19 計算機システムおよび計算機システムのソフトウェア故障回復方法
JP96-62840 1996-03-19

Publications (1)

Publication Number Publication Date
KR970066876A true KR970066876A (ko) 1997-10-13

Family

ID=13211916

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019970009258A KR970066876A (ko) 1996-03-19 1997-03-19 계산기 시스템 및 그 소프트웨어 고장 회복 방법

Country Status (4)

Country Link
US (1) US5948112A (ko)
JP (1) JP3072048B2 (ko)
KR (1) KR970066876A (ko)
CN (1) CN1164708A (ko)

Families Citing this family (82)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3253883B2 (ja) * 1997-01-31 2002-02-04 株式会社東芝 プロセスリスタート方法及びプロセス監視装置
US6275955B1 (en) * 1997-05-14 2001-08-14 Steeplechase Software, Inc. Diagnostic software for facilitating flowchart programming
US6134566A (en) * 1997-06-30 2000-10-17 Microsoft Corporation Method for controlling an electronic mail preview pane to avoid system disruption
JP3593241B2 (ja) 1997-07-02 2004-11-24 株式会社日立製作所 計算機の再起動方法
US6662358B1 (en) 1997-12-12 2003-12-09 International Business Machines Corporation Minimizing profiling-related perturbation using periodic contextual information
US6513155B1 (en) 1997-12-12 2003-01-28 International Business Machines Corporation Method and system for merging event-based data and sampled data into postprocessed trace output
US6732357B1 (en) 1997-12-12 2004-05-04 International Business Machines Corporation Determining and compensating for temporal overhead in trace record generation and processing
US6546548B1 (en) 1997-12-12 2003-04-08 International Business Machines Corporation Method and system for compensating for output overhead in trace data using initial calibration information
US6158024A (en) * 1998-03-31 2000-12-05 International Business Machines Corporation Method and apparatus for structured memory analysis of data processing systems and applications
US6751789B1 (en) 1997-12-12 2004-06-15 International Business Machines Corporation Method and system for periodic trace sampling for real-time generation of segments of call stack trees augmented with call stack position determination
US6560773B1 (en) 1997-12-12 2003-05-06 International Business Machines Corporation Method and system for memory leak detection in an object-oriented environment during real-time trace processing
US6308270B1 (en) * 1998-02-13 2001-10-23 Schlumberger Technologies, Inc. Validating and certifying execution of a software program with a smart card
FR2784475B1 (fr) * 1998-10-12 2000-12-29 Centre Nat Etd Spatiales Procede de traitement d'un systeme electronique soumis a des contraintes d'erreurs transitoires
US6401216B1 (en) * 1998-10-29 2002-06-04 International Business Machines Corporation System of performing checkpoint/restart of a parallel program
US6393583B1 (en) 1998-10-29 2002-05-21 International Business Machines Corporation Method of performing checkpoint/restart of a parallel program
JP2001027951A (ja) 1999-07-14 2001-01-30 Fujitsu Ltd マルチプロセッサ構成の情報処理システムにおけるファイルロード装置と記録媒体
US7761857B1 (en) 1999-10-13 2010-07-20 Robert Bedichek Method for switching between interpretation and dynamic translation in a processor system based upon code sequence execution counts
US7111307B1 (en) 1999-11-23 2006-09-19 Microsoft Corporation Method and system for monitoring and verifying software drivers using system resources including memory allocation and access
JP2001249828A (ja) * 1999-12-28 2001-09-14 Toshiba Lsi System Support Kk 情報処理装置、不具合解析プログラムを格納したコンピュータ読み取り可能な記憶媒体、不具合解析方法、及びアプリケーションプログラム開発支援システム
US6594821B1 (en) 2000-03-30 2003-07-15 Transmeta Corporation Translation consistency checking for modified target instructions by comparing to original copy
US6728907B1 (en) * 2000-04-14 2004-04-27 Microsoft Corporation System and method for self-diagnosing system crashes
US6785848B1 (en) * 2000-05-15 2004-08-31 Microsoft Corporation Method and system for categorizing failures of a program module
US6629267B1 (en) * 2000-05-15 2003-09-30 Microsoft Corporation Method and system for reporting a program failure
US6701454B1 (en) * 2000-06-05 2004-03-02 Microsoft Corporation Method and system for recovering information during a program failure
US6691250B1 (en) 2000-06-29 2004-02-10 Cisco Technology, Inc. Fault handling process for enabling recovery, diagnosis, and self-testing of computer systems
US7149878B1 (en) * 2000-10-30 2006-12-12 Mips Technologies, Inc. Changing instruction set architecture mode by comparison of current instruction execution address with boundary address register values
US6681348B1 (en) * 2000-12-15 2004-01-20 Microsoft Corporation Creation of mini dump files from full dump files
US7107439B2 (en) * 2001-08-10 2006-09-12 Mips Technologies, Inc. System and method of controlling software decompression through exceptions
US7168008B2 (en) * 2002-01-18 2007-01-23 Mobitv, Inc. Method and system for isolating and protecting software components
US6961874B2 (en) * 2002-05-20 2005-11-01 Sun Microsystems, Inc. Software hardening utilizing recoverable, correctable, and unrecoverable fault protocols
US7058849B2 (en) * 2002-07-02 2006-06-06 Micron Technology, Inc. Use of non-volatile memory to perform rollback function
US7318171B2 (en) * 2003-03-12 2008-01-08 Intel Corporation Policy-based response to system errors occurring during OS runtime
JP4345334B2 (ja) * 2003-03-28 2009-10-14 日本電気株式会社 耐障害計算機システム、プログラム並列実行方法およびプログラム
US7310723B1 (en) 2003-04-02 2007-12-18 Transmeta Corporation Methods and systems employing a flag for deferring exception handling to a commit or rollback point
US7308584B2 (en) * 2003-08-14 2007-12-11 International Business Machines Corporation System and method for securing a portable processing module
US7225448B2 (en) * 2003-08-14 2007-05-29 Lenovo (Singapore) Pte. Ltd. System and method for hibernating application state data on removable module
US20050038879A1 (en) * 2003-08-14 2005-02-17 International Business Machines Corporation System and method for discovery of remote device driver functionality and interface
US7356665B2 (en) * 2003-12-17 2008-04-08 International Business Machines Corporation Method and system for machine memory power and availability management in a processing system supporting multiple virtual machines
US20050204199A1 (en) * 2004-02-28 2005-09-15 Ibm Corporation Automatic crash recovery in computer operating systems
US7684654B2 (en) * 2004-06-30 2010-03-23 General Electric Company System and method for fault detection and recovery in a medical imaging system
US7263631B2 (en) * 2004-08-13 2007-08-28 Seakr Engineering, Incorporated Soft error detection and recovery
US7984220B2 (en) * 2004-09-02 2011-07-19 International Business Machines Corporation Exception tracking
CN100343816C (zh) * 2004-09-24 2007-10-17 华为技术有限公司 恢复单板软件版本的方法
US8332826B2 (en) * 2005-05-26 2012-12-11 United Parcel Service Of America, Inc. Software process monitor
US7558986B2 (en) * 2005-05-26 2009-07-07 United Parcel Service Of America, Inc. Software process monitor
US7823021B2 (en) * 2005-05-26 2010-10-26 United Parcel Service Of America, Inc. Software process monitor
US8078919B2 (en) * 2005-06-14 2011-12-13 Hitachi Global Storage Technologies Netherlands B.V. Method, apparatus and program storage device for managing multiple step processes triggered by a signal
US8413162B1 (en) * 2005-06-28 2013-04-02 Guillermo J. Rozas Multi-threading based on rollback
EP1902368B1 (en) * 2005-07-12 2015-10-14 International Business Machines Corporation Method and system for reconfiguring functional capabilities in a data processing system with dormant resources
US8568226B2 (en) * 2005-07-20 2013-10-29 Wms Gaming Inc. Master control program for a gaming device
US7823029B2 (en) * 2005-09-07 2010-10-26 International Business Machines Corporation Failure recognition, notification, and prevention for learning and self-healing capabilities in a monitored system
US7702966B2 (en) * 2005-09-07 2010-04-20 Intel Corporation Method and apparatus for managing software errors in a computer system
US20070174484A1 (en) * 2006-01-23 2007-07-26 Stratus Technologies Bermuda Ltd. Apparatus and method for high performance checkpointing and rollback of network operations
US7962798B2 (en) * 2006-04-17 2011-06-14 The Trustees Of Columbia University In The City Of New York Methods, systems and media for software self-healing
US8924782B2 (en) 2007-01-26 2014-12-30 The Trustees Of Columbia University In The City Of New York Systems, methods, and media for recovering an application from a fault or attack
US8209417B2 (en) * 2007-03-08 2012-06-26 Oracle International Corporation Dynamic resource profiles for clusterware-managed resources
CN101290577A (zh) * 2007-04-20 2008-10-22 鸿富锦精密工业(深圳)有限公司 嵌入式设备及其加载方法
JP4838226B2 (ja) * 2007-11-20 2011-12-14 富士通株式会社 ネットワークロギング処理プログラム,情報処理システムおよびネットワークロギング情報自動退避方法
US8281185B2 (en) * 2009-06-30 2012-10-02 Oracle America, Inc. Advice-based feedback for transactional execution
JP2011060055A (ja) * 2009-09-11 2011-03-24 Fujitsu Ltd 仮想計算機システム、仮想マシンの復旧処理方法及びそのプログラム
JP4945663B2 (ja) 2010-06-30 2012-06-06 株式会社東芝 情報処理装置およびデータの復旧方法
US9038048B2 (en) 2010-07-22 2015-05-19 The Trustees Of Columbia University In The City Of New York Methods, systems, and media for protecting applications from races
JP5736757B2 (ja) * 2010-12-10 2015-06-17 セイコーエプソン株式会社 印刷装置、及び、印刷方法
CN103493021B (zh) * 2011-04-21 2016-06-22 国际商业机器公司 用于故障监视和修复的方法和系统
US9489251B2 (en) * 2011-12-06 2016-11-08 Bio-Rad Laboratories, Inc. Supervising and recovering software components associated with medical diagnostics instruments
JP2014119964A (ja) * 2012-12-17 2014-06-30 Hitachi Ltd 計算機システムおよびプログラム
US9251002B2 (en) 2013-01-15 2016-02-02 Stratus Technologies Bermuda Ltd. System and method for writing checkpointing data
CN103150222B (zh) * 2013-01-28 2016-02-10 中兴通讯股份有限公司 嵌入式系统异常恢复的方法和装置
TWI528173B (zh) * 2013-10-25 2016-04-01 緯創資通股份有限公司 自動除錯與防錯方法、裝置與電腦程式產品
EP3090336A1 (en) 2013-12-30 2016-11-09 Paul A. Leveille Checkpointing systems and methods of using data forwarding
EP3090345B1 (en) 2013-12-30 2017-11-08 Stratus Technologies Bermuda Ltd. Method of delaying checkpoints by inspecting network packets
US9652338B2 (en) 2013-12-30 2017-05-16 Stratus Technologies Bermuda Ltd. Dynamic checkpointing systems and methods
US9645879B2 (en) * 2014-02-27 2017-05-09 International Business Machines Corporation Salvaging hardware transactions with instructions
CN103914523A (zh) * 2014-03-24 2014-07-09 小米科技有限责任公司 页面回退控制方法及装置
US9679076B2 (en) 2014-03-24 2017-06-13 Xiaomi Inc. Method and device for controlling page rollback
GB2542370B (en) * 2015-09-16 2020-05-27 Arm Ip Ltd A system for monitoring a plurality of distributed devices
JP6866724B2 (ja) * 2017-03-28 2021-04-28 日本電気株式会社 分散コンピューティングシステム、処理選択装置、処理選択方法及びプログラム
JP6853883B2 (ja) * 2017-06-15 2021-03-31 株式会社日立製作所 コントローラ
CN109032022B (zh) * 2018-08-08 2021-01-15 江苏拓米洛环境试验设备有限公司 试验箱报警秒接续程序智能无缝衔接运转方法
CN109254877A (zh) * 2018-09-11 2019-01-22 广州骏凯永卓信息科技有限公司 一种企业用计算机软件故障的监测维修系统
CN110083488B (zh) * 2019-04-21 2023-03-17 哈尔滨工业大学 一种面向gpgpu的细粒度低开销的容错系统
CN113625696B (zh) * 2021-08-31 2023-03-24 东风商用车有限公司 车载控制器过流保护的安全处理方法及系统

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06222952A (ja) * 1993-01-27 1994-08-12 Toshiba Corp デバッグ支援装置
US5590277A (en) * 1994-06-22 1996-12-31 Lucent Technologies Inc. Progressive retry method and apparatus for software failure recovery in multi-process message-passing applications
US5630047A (en) * 1995-09-12 1997-05-13 Lucent Technologies Inc. Method for software error recovery using consistent global checkpoints

Also Published As

Publication number Publication date
JPH09258995A (ja) 1997-10-03
JP3072048B2 (ja) 2000-07-31
CN1164708A (zh) 1997-11-12
US5948112A (en) 1999-09-07

Similar Documents

Publication Publication Date Title
KR970066876A (ko) 계산기 시스템 및 그 소프트웨어 고장 회복 방법
US8078854B2 (en) Using register rename maps to facilitate precise exception semantics
US9298497B2 (en) Computer processor providing exception handling with reduced state storage
US20160299760A1 (en) Methods and systems for performing a replay execution
US7669078B2 (en) Method and apparatus for debugging a program on a limited resource processor
US8959277B2 (en) Facilitating gated stores without data bypass
US20100031084A1 (en) Checkpointing in a processor that supports simultaneous speculative threading
US8930761B2 (en) Test case result processing
US9086969B2 (en) Establishing a useful debugging state for multithreaded computer program
RU2431182C2 (ru) Способ, операционная система и вычислительное устройство для выполнения компьютерной программы
US9836386B2 (en) Automatic switch to debugging mode
CN111133418B (zh) 在例外屏蔽更新指令之后允许未中止的事务处理
CN110998541A (zh) 调试器中的代码的试验性执行
US9697040B2 (en) Software replayer for transactional memory programs
CN115935631A (zh) 用于车机设备的测试系统和方法、存储介质
CN106033368A (zh) 一种多核虚拟机确定性重演的方法
US5655072A (en) Method and apparatus for testing a sytem component with test checkpointing
KR102052816B1 (ko) 비휘발성 주기억장치 환경에서 에러 복구 방법 및 그 시스템
KR970059900A (ko) 검사복구기능을 가진 입출력장치
US10678595B2 (en) Dynamic saving of registers in transactions
JPS60142747A (ja) 命令再実行制御方式
Yeh et al. Improving Fault Tolerance through Crash Recovery
JPH103403A (ja) 計算機システムおよびデバッグ方法
JP2695775B2 (ja) コンピュータシステムの誤動作からの復帰方法
JP2023525025A (ja) 装置の状態情報を収集する技術

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application