KR970059931A - 컴퓨터 시스템 - Google Patents
컴퓨터 시스템 Download PDFInfo
- Publication number
- KR970059931A KR970059931A KR1019960043164A KR19960043164A KR970059931A KR 970059931 A KR970059931 A KR 970059931A KR 1019960043164 A KR1019960043164 A KR 1019960043164A KR 19960043164 A KR19960043164 A KR 19960043164A KR 970059931 A KR970059931 A KR 970059931A
- Authority
- KR
- South Korea
- Prior art keywords
- checkpoint
- computer system
- processor
- processing
- state
- Prior art date
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/22—Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/14—Error detection or correction of the data by redundancy in operation
- G06F11/1402—Saving, restoring, recovering or retrying
- G06F11/1405—Saving, restoring, recovering or retrying at machine instruction level
- G06F11/1407—Checkpointing the instruction stream
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Quality & Reliability (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Hardware Design (AREA)
- Hardware Redundancy (AREA)
- Retry When Errors Occur (AREA)
Abstract
본 발명은, 컴퓨터 시스템에 있어서 재시동 동작이 수행될 때 잠금-추방(lock-run-out) 시퀀스를 제거함으로써 구성비용을 크게 감소시키는 효과가 있는 인터럽션 저항을 가진 컴퓨터 시스템에 대한 것이다. 인터럽션 저항을 가진 컴퓨터 시스템에 있어서, 상기 시스템은 검사점(check point) 재시동 기능을 포함하며, 검사점 획득 특별프로세스가 상기 컴퓨터 시스템 내에 포함되어 있는 처리기들에 각각 제공된다. 임의의 검사점을 획득할 때, 상기 검사점획득 특별프로세스는 기상부에 의하여 준비상태로 된다. 검사점획득 특별프로세스가 검사점을 획득한 후, 상기 특별프로세스는 다시 수면상태로 된다. 이러한 방식에 있어서는, 검사점들은 임의의 프로세스가 수행될 때는 획득되지 않으므로, 재시동 동작이 수행될 때 잠금-추방 동작이 제거될 수 있다.
Description
본 내용은 요부공개 건이므로 전문내용을 수록하지 않았음
제4도는 교착상태(dead lock)의 발생을 설명하기 위한 개략도.
제5a도는 잠금-추방 시퀀스를 설명하기 위한 개략도.
제5b도는 잠금-추방 시퀀스를 설명하기 위한 개략도.
제5c도는 잠금-추방 시퀀스를 설명하기 위한 개략도.
Claims (21)
- 하나 이상의 처리기와; 고장에 의하여 인터럽트된 임의의 프로세스를 재시동하기 위하여 사용되는 검사점을 획득하기 위한, 상기 하나 이상의 처리기에 각각 대응하는, 하나 이상의 검사점 처리 수단(검사점획득 특별프로세스)과; 상기 프로세스가 실행되는 동안에 인터럽션을 수행하기 위한, 그리고 상기 검사점처리 수단을 수면상태로부터 준비상태로 깨우기 위한 인터럽션 수단과; 상기 인터럽션 수단에 의하여 준비상태로 깨워진 상기 검사점처리 수단을 디스패치하기 위한 디스패치 수단; 그리고 상기 디스패치 수단에 의하여 기스패치된 상기 검사점처리 수단이 검사점을 획득하고 난 후, 다시 상기 검사점처리 수단을 수면상태로 잠재우기 위한 수면상태전환 수단을 포함하는 것을 특징으로 하는 컴퓨터 시스템.
- 제1항에 있어서, 상기 인터럽션 수단의 인터럽션 처리는 검사점 획득 조건이 만족된 후에 수행되는 것을 특징으로 하는 컴퓨터 시스템.
- 제2항에 있어서, 상기 검사점 획득 조건은 상기 처리기의 코드형태로 검사점 획득이 지시되는 경우에 만족되는 것을 특징으로 하는 컴퓨터 시스템.
- 제2항에 있어서, 상기 검사점 획득 조건은 상기 검사점 처리 수단에 의하여 검사점이 획득된 이후 소정 시간이 경과한 때에 만족되는 것을 특징으로 하는 컴퓨터 시스템.
- 제2항에 있어서, 상기 검사점 획득 조건은 기억장치를 갱신하기 전 상 데이터를 모으기 위한 BIB(직전상버퍼) 내에 저장되는 데이터의 데이터량에 의하여 결정되는 것을 특징으로 하는 컴퓨터 시스템.
- 제2항에 있어서, 상기 검사점 획득 조건은 기억장치를 갱신한 후 상 데이터를 모으기 위한 AIB(직후상버퍼) 내에 저장되는 데이터의 데이터량에 의하여 결정되는 것을 특징으로 하는 컴퓨터 시스템.
- 제1항에 있어서, 상기 검사점 처리 수단을 상기 디스패치 수단은 시분할처리방식에 의하여 디스패치를 수행하는 것을 특징으로 하는 컴퓨터 시스템.
- 제1항에 있어서, 상기 하나 이상의 처리기 중 임의의 처리기 내에서 간헐적인 고장이 발생할 때, 상기 하나 이상의 처리기의 상태를 상기 검사점 처리 수단에 의하여 마지막으로 획득된 검사점으로 회복시키기 위한 회복 수단을 추가로 포함하는 것을 특징으로 하는 컴퓨터 시스템.
- 제8항에 있어서, 상기 회복 수단에 의하여 처리기의 상태가 회복된 후, 현재 프로세스로서 상기 검사점 처리 수단을 처리하기 위한 처리 수단을 추가로 포함하는 것을 특징으로 하는 컴퓨터 시스템.
- 제1항에 있어서, 상기 하나 이상의 처리기 중 임의의 처리기에 영구 고장이 발생하는 경우에, 영구 고장을 일으킨 처리기 외의 다른 처리기가 상기 검사점 처리수단에 의하여 마지막으로 획득된 검사점으로 상기 처리기의 상태를 회복하는 방식으로 회복을 수해하기 위한 회복 수단을 추가로 포함하는 것을 특징으로 하는 컴퓨터 시스템.
- 제10항에 있어서, 상기 회복 수단에 의하여 처리기의 상태가 회복된 후에, 영구 고장을 일으킨 프로세서 외의 다른 프로세서에 의하여 현재 프로세스로 간주되는 상기 검사점 처리 수단을 처리하기 위한 처리 수단을 추가로 포함하는 것을 특징으로 하는 컴퓨터 시스템.
- 하나 이상의 처리기와; 검사점 획득조건이 만족된 경우에 고장에 의하여 인터럽트된 임의의 프로세스를 재시동하기 위하여 검사점의 획득을 지시하기 위한 검사점획득 지시수단과; 상기 하나 이상의 처리기에 대응하는 하나 이상의 검사점을 획득하기 위하여, 운영 시스템의 디스패치 내에 제공되는 검사점 획득 수단과; 상기 검사점획득 지시 수단에 의하여 검사점 획득이 지시되는 경우에, 상기 검사점획득 수단을 수면상태로부터 실행 가능하도록 하는 실행준비 수단과; 상기 실행준비 수단에 의하여 실행가능하게 된 상기 검사점획득 수단을 디스패치하기 위한 디스패치 수단; 그리고 상기 디스패치 수단에 의하여 디스패치된 상기 검사점획득 수단이 검사점을 획득하고, 난 후, 다시 상기 검사점획득 수단을 수면 상태로 잠재우기 위한 수면상태 전환 수단을 포함하는 것을 특징으로 하는 컴퓨터 시스템.
- 제12항에 있어서, 상기 검사점 획득 조건은 상기 처리기의 코드형태로 검사점 획득이 지시되는 경우에 만족되는 것을 특징으로 하는 컴퓨터의 시스템.
- 제12항에 있어서, 상기 검사점 획득 조건은 상기 검사점 획득 수단에 의하여 검사점이 획득된 이후 소정시간이 경과한 때에 만족되는 것을 특징으로 하는 컴퓨터 시스템.
- 제12항에 있어서, 상기 검사점 획득 조건은 기억장치를 갱신하기 전 상 데이터를 모으기 위한 BIB 내에 저장되는 데이터의 데이터량에 의하여 결정되는 것을 특징으로 하는 컴퓨터 시스템.
- 제12항에 있어서, 사이 검사점 획득 조건은 기억장치를 갱신한 후 상 데이터를 모으기 위한 AIB 내에 저장되는 데이터의 데이터량에 의하여 결정되는 것을 특징으로 하는 컴퓨터 시스템.
- 제12항에 있어서, 상기 검사점 획득 수단을 상기 디스패치 수단은 시분할처리 방식에 의하여 디스패치를 수행하는 것을 특징으로 하는 컴퓨터 시스템.
- 제12항에 있어서, 상기 하나 이상의 처리기 중 임의의 처리기 내에서 간헐적인 고장이 발생할 때, 상기 하나 이상의 처리기를 상태를 상기 검사점 획득 수단에 의하여 마지막으로 획득된 검사점으로 회복시키기 위한 회복 수단을 추가로 포함하는 것을 특징으로 하는 컴퓨터 시스템.
- 제18항에 있어서, 상기 회복 수단에 의하여 처리기의 상태가 회복된 후, 현재 프로세스로서 상기 검사점 획득 수단을 처리하기 위한 처리 수단을 추가로 포함하는 것을 특징으로 하는 컴퓨터 시스템.
- 제12항에 있어서, 상기 하나 이상의 처리기 중 임의의 처리기에 영구 고장이 발생하는 경우에, 영구고장을 일으킨 처리기 외의 다른 처리가가 상기 검사점 획득 수단에 의하여 마지막으로 획득된 검사점으로 상기 처리기의 상태를 회복하는 방식으로 회복을 수행하기 위한 회복 수단을 추가로 포함하는 것을 특징으로 하는 컴퓨터 시스템.
- 제20항에 있어서, 상기 회복 수단에 의하여 처리기의 상태가 회복된 후에, 영구 고장을 일으킨 프로세서 외의 다른 프로세서에 의하여 현재 프로세스로 간주되는 상기 검사점 획득 수단을 처리하기 위한 처리 수단을 추가로 포함하는 것을 특징으로 하는 컴퓨터 시스템.※ 참고사항 : 최초출원 내용에 의하여 공개하는 것임.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP8-015660 | 1996-01-31 | ||
JP96-015660 | 1996-01-31 | ||
JP1566096 | 1996-01-31 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR970059931A true KR970059931A (ko) | 1997-08-12 |
KR100246120B1 KR100246120B1 (ko) | 2000-03-15 |
Family
ID=11894904
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1019960043164A KR100246120B1 (ko) | 1996-01-31 | 1996-09-30 | 컴퓨터 시스템 |
Country Status (5)
Country | Link |
---|---|
US (1) | US5884021A (ko) |
EP (1) | EP0788050B1 (ko) |
KR (1) | KR100246120B1 (ko) |
CN (1) | CN1101573C (ko) |
DE (1) | DE69625323T2 (ko) |
Families Citing this family (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3648892B2 (ja) * | 1996-12-16 | 2005-05-18 | 富士通株式会社 | 計算機システム |
US7200623B2 (en) * | 1998-11-24 | 2007-04-03 | Oracle International Corp. | Methods to perform disk writes in a distributed shared disk system needing consistency across failures |
US6338147B1 (en) * | 1998-10-29 | 2002-01-08 | International Business Machines Corporation | Program products for performing checkpoint/restart of a parallel program |
US6393583B1 (en) | 1998-10-29 | 2002-05-21 | International Business Machines Corporation | Method of performing checkpoint/restart of a parallel program |
US6401216B1 (en) | 1998-10-29 | 2002-06-04 | International Business Machines Corporation | System of performing checkpoint/restart of a parallel program |
US6594779B1 (en) * | 1999-03-30 | 2003-07-15 | International Business Machines Corporation | Method, system and program products for managing the checkpointing/restarting of resources of a computing environment |
US6658594B1 (en) * | 2000-07-13 | 2003-12-02 | International Business Machines Corporation | Attention mechanism for immediately displaying/logging system checkpoints |
US6802024B2 (en) * | 2001-12-13 | 2004-10-05 | Intel Corporation | Deterministic preemption points in operating system execution |
CN1967489A (zh) * | 2005-11-14 | 2007-05-23 | 鸿富锦精密工业(深圳)有限公司 | 防止计算机当机的系统及方法 |
CN101271413B (zh) * | 2007-03-21 | 2011-12-14 | 鸿富锦精密工业(深圳)有限公司 | 计算机运行状态侦测及处理方法和系统 |
US7950019B2 (en) * | 2007-05-21 | 2011-05-24 | International Business Machines Corporation | Method and apparatus for checkpoint and restarting a stream in a software partition |
US8527650B2 (en) * | 2007-05-21 | 2013-09-03 | International Business Machines Corporation | Creating a checkpoint for modules on a communications stream |
US7792983B2 (en) * | 2007-07-31 | 2010-09-07 | International Business Machines Corporation | Method and apparatus for checkpoint and restart of pseudo terminals |
GB202202815D0 (en) * | 2022-03-01 | 2022-04-13 | Graphcore Ltd | Reset of a multi-node syste |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0228559A1 (de) * | 1985-12-17 | 1987-07-15 | BBC Brown Boveri AG | Fehlertolerante Mehrrechneranordnung |
FR2602891B1 (fr) * | 1986-08-18 | 1990-12-07 | Nec Corp | Systeme de correction d'erreur d'un systeme a multiprocesseurs pour corriger une erreur dans un processeur en mettant le processeur en condition de controle apres achevement du redemarrage du microprogramme a partir d'un point de reprise |
US5146569A (en) * | 1986-10-24 | 1992-09-08 | Hitachi, Ltd. | System for storing restart address of microprogram, determining the validity, and using valid restart address to resume execution upon removal of suspension |
US5065311A (en) * | 1987-04-20 | 1991-11-12 | Hitachi, Ltd. | Distributed data base system of composite subsystem type, and method fault recovery for the system |
JPH02287858A (ja) * | 1989-04-28 | 1990-11-27 | Toshiba Corp | 分散処理システムのリスタート方式 |
-
1996
- 1996-09-17 US US08/710,403 patent/US5884021A/en not_active Expired - Lifetime
- 1996-09-18 EP EP96114979A patent/EP0788050B1/en not_active Expired - Lifetime
- 1996-09-18 DE DE69625323T patent/DE69625323T2/de not_active Expired - Fee Related
- 1996-09-27 CN CN96113090A patent/CN1101573C/zh not_active Expired - Lifetime
- 1996-09-30 KR KR1019960043164A patent/KR100246120B1/ko not_active IP Right Cessation
Also Published As
Publication number | Publication date |
---|---|
CN1156860A (zh) | 1997-08-13 |
DE69625323D1 (de) | 2003-01-23 |
EP0788050B1 (en) | 2002-12-11 |
DE69625323T2 (de) | 2003-10-16 |
KR100246120B1 (ko) | 2000-03-15 |
US5884021A (en) | 1999-03-16 |
EP0788050A1 (en) | 1997-08-06 |
CN1101573C (zh) | 2003-02-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR970059931A (ko) | 컴퓨터 시스템 | |
KR970059930A (ko) | 입출력 제어 장치 및 방법 | |
KR970066900A (ko) | 분산 메모리형 멀티프로세서 시스템 및 고장 회복 방법 | |
JPH096636A (ja) | チェックポイント取得システム | |
CN105045617B (zh) | 一种Android系统的应用恢复方法及系统 | |
CN101334751A (zh) | 虚拟机监视器识别客户操作系统中进程的方法及装置 | |
RU2010149275A (ru) | Восстановление управления ресурсом обработки, который исполняет внешний контекст исполнения | |
SE9504396L (sv) | Processorredundans i ett distrubuerat system | |
CN105938444B (zh) | 一种基于数据双备份机制的系统状态备份和恢复方法 | |
JP2000516745A (ja) | 機能停止しているマスタcpuのスレーブdspによる再ブート | |
JP2014170306A (ja) | 情報処理装置、起動障害からの自動復旧方法、及び起動障害からの自動復旧プログラム | |
KR970059900A (ko) | 검사복구기능을 가진 입출력장치 | |
JP3122371B2 (ja) | 計算機システム | |
FI943874A (fi) | Menetelmä vikaantuneen yksikön elvyttämiseksi sekä elvytysjärjestelmä | |
US20070005936A1 (en) | More flexible monitoring and recovery of processes on data processing systems | |
Wang | Reducing message logging overhead for log-based recovery | |
KR950009399A (ko) | 비휘발성 메모리를 이용한 재시동 시스템 및 방법 | |
JP3708891B2 (ja) | フォールトトレラントシステムにおけるプロセスペア実行制御方法、プロセスペア実行制御プログラム、及びフォールトトレラントシステム | |
JPH10260853A (ja) | 計算機システムおよびそのシステムにおける故障回復制御方法 | |
JP2009151636A (ja) | 業務継続システム | |
JP3338724B2 (ja) | データベースセーブ方式 | |
JPS63173139A (ja) | プログラムのデバツグ補助方式 | |
CN112579704A (zh) | 数据反向同步方法、装置、系统、镜像服务器和存储介质 | |
Jalote | Dynamic Reconfiguration of CSP Programs for Fault Tolerance. | |
CN116107809A (zh) | Dml语句记录方法、装置、服务器及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20071127 Year of fee payment: 9 |
|
LAPS | Lapse due to unpaid annual fee |