KR20000033963A - 프로세스 감시 및 장애 복구방법 - Google Patents

프로세스 감시 및 장애 복구방법 Download PDF

Info

Publication number
KR20000033963A
KR20000033963A KR1019980051047A KR19980051047A KR20000033963A KR 20000033963 A KR20000033963 A KR 20000033963A KR 1019980051047 A KR1019980051047 A KR 1019980051047A KR 19980051047 A KR19980051047 A KR 19980051047A KR 20000033963 A KR20000033963 A KR 20000033963A
Authority
KR
South Korea
Prior art keywords
information
monitoring
failure
processing
pid
Prior art date
Application number
KR1019980051047A
Other languages
English (en)
Other versions
KR100309678B1 (ko
Inventor
예병호
김현숙
김해숙
Original Assignee
이계철
한국전기통신공사
정선종
한국전자통신연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 이계철, 한국전기통신공사, 정선종, 한국전자통신연구원 filed Critical 이계철
Priority to KR1019980051047A priority Critical patent/KR100309678B1/ko
Publication of KR20000033963A publication Critical patent/KR20000033963A/ko
Application granted granted Critical
Publication of KR100309678B1 publication Critical patent/KR100309678B1/ko

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3024Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a central processing unit [CPU]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0721Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment within a central processing unit [CPU]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Hardware Redundancy (AREA)

Abstract

본 발명은 교환시스템의 제어계를 구성하는 프로세서에 실장되어 동작하는 다수개의 응용 기능들을 대상으로 이들 기능의 최소 구성단위인 프로세스의 장애가 발생될 때, 운영체계를 통하여 장애를 검출하고 프로세스 감시기능을 이용하여 응용 기능 자체적으로 해당 프로세스에 대한 복구기능을 수행할 수 있도록 하는 방법에 관한 것으로서, 본 발명을 수행하기 위해 상호 관련되는 기능의 구성은 기능 시작 시 프로세스 감시 필요 여부에 따라 감시 대상 프로세스 정보를 라이브러리를 통하여 등록하고, 장애발생 시 감시 기능으로부터 통보를 받아 재생성하는 절차를 수행하는 응용기능, 응용기능으로부터 호출되어 감시 대상 프로세스 정보를 등록하고 정보를 관리하는 라이브러리, 프로세스 장애발생 시 운영 체계로부터 해당 정보를 받아 라이브러리에 관리되는 정보를 이용하여 감시기능을 수행하고 최종 결과를 해당되는 응용기능으로 전달하는 감시 기능을 실행함으로써, 프로세스 장애로 인한 기능 이상 현상의 영향을 최소화하고 프로세서 전체적인 동작에 미치는 영향을 최소화할 수 있고, 자체적인 기능 오류로 인하여 반복적인 재생성이 이루어지는 경우 운용자의 확인절차에 따라 필요 시 재생성을 억제할 수 있으므로 프로세스 감시 기능을 융통성있게 활용할 수 있으며, 프로세스 감시 기능뿐만 아니라 감시 대상이 될 수 있는 여러가지 형태의 자원을 대상으로 적용이 가능한 효과를 가진다.

Description

프로세스 감시 및 장애 복구방법
본 발명은 라이브러리를 이용한 프로세스 장애 복구방법에 관한 것이다.
지금까지 교환시스템을 대상으로 이러한 구조의 프로세스 복구방법에서는 운영체계로부터 장애발생 통보를 받으면 프로세스 감시 기능을 통해 감시 대상 프로세스인지를 확인한 후, 시스템 시동 관리 기능을 통하여 해당 되는 프로세스가 속한 실행모듈 전체를 재시동하는 방법을 사용하였다.
이러한 방법에서는 그때까지 정상적인 동작상태의 다른 프로세스들도 동시에 재시동함으로써 시스템에 영향을 미칠 수 있을 뿐만 아니라 상호 연동되는 다른 기능과 공동으로 사용하는 데이터 등의 불일치를 초래할 수 있었다.
그리고 다른 하나의 방법으로써 운영 체계를 통한 자동적인 절차에 의한 프로세스 재생성 방법은 응용 기능에서 프로세스 생성시 사전에 재생성 여부를 등록함으로써 운영체계를 통하여 수행된다.
이러한 방법에서는 응용 기능과는 별개로 운영 체계에 의하여 재생성이 이루어지므로 프로세스 수행 중 장애로 인한 복구 절차가 정상적으로 이루어질 수 없다는 것과 결함을 내포하고 있는 프로세스의 경우 계속적인 재생성 과정을 반복하여 프로세서 전체적인 기능 동작에 악 영향을 미칠 수 있는 단점을 내포하고 있다.
상기 단점을 해결하기 위해 본 발명은, 교환시스템에서와 같이 하나의 프로세서에 호 처리, 운용 관리, 유지보수 등 여러 가지 응용 기능과 이를 수행하고 제어하기 위한 운용 체계가 상호 연동하면서 프로세서 고유의 기능을 수행하는 구조에서 임의의 프로세스에 장애가 발생되어 소멸되는 경우, 초기 프로세서 기동 시 해당 프로세스를 생성시키고 해당 응용 기능을 전체적으로 관리하는 기능에서 직접 판단하여 재생성하는 방법을 사용함으로써, 그때까지 동작 중이던 응용 기능에 미치는 영향을 최소화 하면서 기능을 복구할 수 있는 방법을 제공하는데 그 목적이 있다.
따라서 본 발명에서는 종래기술에서 문제점으로 나타난 장애가 발생된 프로세스가 속한 응용 기능의 전체 프로세스의 재시동과 운영체계에 의한 자동적인 프로세스 재생성 절차에 의한 장애 복구 기능의 미비 사항을 해결하기 위하여 해당 응용 기능의 판단에 따른 프로세스 복구 절차가 이루어질 수 있도록 한다.
이를 위해서는 해당 프로세스 감시를 위한 프로세스 정보를 라이브러리를 통해 등록함으로써 자동적인 절차에 의하여 프로세스 장애발생 시 통보되도록 하였으며, 장애발생을 통보받은 응용 기능에서는 해당 프로세스가 관리하는 데이터 및 자원의 복구, 관련 기능과의 동기를 수행한 후 재생성하는 과정을 통하여 복구되도록 한다.
또한 프로세스 자체적인 결함으로 인하여 반복적인 재생성이 이루어지는 경우에는 재생성을 억제하기 위한 방법을 이용하여 프로세서에 미치는 영향이 없도록 제어한다.
상기 목적을 달성하기 위해 본 발명은, 기능 시작 시 프로세스 감시 필요 여부에 따라 감시 대상 프로세스 정보를 라이브러리를 통하여 등록하고 장애발생 시 감시 기능으로부터 통보를 받아 재생성하는 절차를 수행하는 응용 기능, 응용 기능으로부터 호출되어 감시 대상 프로세스 정보를 등록하고 정보를 관리하는 라이브러리, 프로세스 장애발생 시 운영 체계로부터 해당 정보를 받아 상기 라이브러리에 관리되는 정보를 이용하여 감시 기능을 수행하고 최종 결과를 해당되는 응용 기능으로 전달하는 감시 기능을 구비한 프로세스 장애 복구방법으로, 상기 응용 기능에서 프로세스 감시를 위한 정보를 등록하고 장애발생 시 이를 복구하고, 장애 복구 후 프로세스 장애 감시 기능을 수행하는 것을 특징으로 한다.
도 1은 본 발명에 따른 관련 기능 구성 및 처리 흐름도,
도 2는 본 발명에 따른 프로세스 장애 감시 정보 등록 및 복구 처리 흐름도,
도 3은 본 발명에 따른 프로세스 감시 정보 등록을 위한 라이브러리 처리 흐름도,
도 4는 본 발명이 적용되는 프로세스 장애 감시 기능 처리 흐름도,
도 5는 본 발명에 따른 운용자 요구에 의한 프로세스 복구 제어 처리 흐름도,
도 6은 본 발명에 따른 운용자 요구에 의한 프로세스 감시정보 출력 처리 흐름도.
* 도면의 주요부분에 대한 부호의 설명
100 : 프로세서(OMP/CCCP) 10,20,30,40 : 응용 기능 A, B, C, D
50 : 프로세스 감시정보 라이브러리
60 : 프로세스 감시 기능부 70 : 운영 체계
이하 첨부된 도면을 참조하여 본 발명을 상세히 설명하면 다음과 같다.
본 발명은 교환시스템을 대상으로 감시 대상 프로세스 정보를 등록하고 장애발생 정보를 통보받아 재생성하는 응용 기능과 프로세스 장애발생시 운영 체계로부터 프로세스 정보를 받아 감시기능을 수행하는 기능 및 감시 대상 프로세스 정보를 등록 관리하는 라이브러리 기능으로 구성된다.
도 1은 본 발명을 구성하는 관련 기능들간의 상호 작용을 나타낸 것으로써 프로세서가 시동하는 시점에서 응용 기능 A, B, C, D(10, 20, 30, 40)가 시작되면 감시 대상 프로세스에 대하여 라이브러리(50)를 호출하여 프로세스 정보를 등록한다(S1, S2, S3, S4).
그리고 응용 기능에 속한 프로세스의 동작 과정에서 프로세스 장애가 발생되면 운영 체계(70)에서 검출(S5, S6, S7, S8)되어 프로세스 감시 기능부(60)로 통보된다(S9).
프로세스 감시 기능부(60)에서는 통보된 프로세스 정보를 대상으로 라이브러리로 관리되는 프로세스 정보를 읽어(S10) 감시 대상 프로세스인지를 확인하는 절차를 통해 응용 기능으로 전달한다(S11, S12, S13, S14).
프로세스 장애발생을 통보 받은 응용 기능에서는 관련되는 복구 절차를 수행한 후 해당 되는 프로세스에 대한 재생성을 수행한다.
감시 대상 프로세스의 관리 정보 구성
일련번호 프로세스 정의번호 감시대상 프로세스 Pid 수신 프로세스 Pid 프로세스 복구 회수 복구 여부
0 h’100011 h’1f800002 h’1f800000 1 FRUE
1 h’110023 h’00010010 h’00010002 4 FALSE
2
99
상기 표 1은 라이브러리를 이용하여 관리되는 감시 대상 프로세스에 대한 구성정보로써 일련 번호를 이용하여 프로세서 단위로 버퍼의 크기를 일정하게 정할 수 있다.
본 표에서는 0부터 99까지 100개만을 지정하였으나 이것은 프로세서의 동작 특징 등에 따라 수를 확장하여 사용할 수 있다.
그리고 프로세스 정의 번호는 해당 프로세스를 기능적으로 구분하기 위한 고유한 번호를 나타내며, 이것은 해당 응용 기능에 대한 실행 모듈이 제작되는 단계에서 정해진다.
감시 대상 프로세스 인스턴스 정의(Process Instance Definition, 이하 Pid라 칭함)은 해당 프로세스가 생성되는 시점에서 운영 체계로부터 할당 받는 고유번호에 해당되며, 이것은 프로세스 장애로 인하여 재생성되면 바뀌는 정보이다.
수신 프로세스 Pid는 등록된 감시 대상 프로세스의 장애가 발생된 경우 그 정보를 받고자 하는 프로세스의 고유 번호를 나타내며, 이 값이 정확하지 않으면 시그널을 통한 정보를 수신할 수 없다.
프로세스 복구 회수는 해당 프로세스 정의번호에 대하여 프로세스 장애발생으로 인하여 몇 번이나 재생성이 되었는지를 나타내는 회수 정보이며, 이 정보를 확인함으로써 해당 프로세스가 심각한 오류를 내포하고 있어 계속적인 재생성이 이루어지고 있는지를 간접적으로 판단할 수 있으며, 이로 인한 영향이 프로세서 기능 수행이 미칠 수 있다고 판단할 수 있는 정보가 된다.
복구 여부 정보는 응용 기능 자체적으로나 운용자 요구에 의하여 해당 프로세스에 대한 복구가 수행될 수 있는 해제 상태(TRUE)이거나 억제(FALSE)된 상태인지를 나타낸다.
도 2 는 응용 기능에서 프로세스 감시를 위한 정보를 등록하고 장애발생 시 복구하는 처리 흐름에 대한 과정을 설명한 것으로서, 프로세서 운영 체계에 의하여 응용 기능이 시동되며(S30) 응용 기능에서 수행하고자 하는 프로세스를 생성하고(S31), 감시 대상 프로세스인지를 확인한 후(S32), 감시 대상 프로세스이면 해당 프로세스에 대한 관리 정보를 읽어(S33) 복구 여부를 확인한다(S34).
이때 복구가 허가(TRUE)된 상태이면 프로세서 Pid를 저장하여(S35) 프로세스 감시를 위한 라이브러리를 수행한 후(S36) 정상적인 기능 처리를 위한 시그널 대기 상태로 천이하고(S37), 복구가 억제(FALSE)된 상태이면 다음 수행을 위한 시그널 접수 대기상태로 천이하고(S37).
시그널 접수 대기상태(S37)에서 프로세스 감시기능으로부터 프로세스 장애발생 정보를 접수하면(S38), 관련 데이터 복구 및 초기화 과정을 수행한 후(S39), 해당 프로세스를 재생성하고(S40) 프로세스 Pid를 저장하여(S41), 라이브러리를 통한 프로세스 감시 정보를 재등록하고(S42) 복구 회수를 1 증가한 후(S43) 다음 시그널을 접수하기 위한 대기상태로 천이한다(S44).
도 3은 프로세스 감시 정보를 등록 관리하기 위한 라이브러리의 처리 과정으로서, 상기 도 2에서 설명한 응용 기능에서의 처리 과정 중에서 프로세스를 생성한 후 라이브러리를 통해 감시 정보를 등록할 때 호출되어 수행되는 절차에 해당된다.
프로세스 감시 정보를 등록을 위하여 응용 기능으로부터 호출되면(S36a) 해당 프로세스 정보에 대하여 이미 등록되어 있는지를 확인하여(S36b), 등록되어 있지 않은 상태이면 감시 대상 Pid를 점검하는 절차를 수행하며(S36c), 이미 등록된 경우에는 비정상 등록 요구에 대한 장애메시지를 출력 요구하고(S36h) 종료한다(S36g).
감시 대상 Pid에 대한 확인 결과 정상이면 수신지 Pid를 점검하기 위한 절차를 수행하며(S36d), 감시 대상 Pid가 비정상 상태의 경우에는 이에 대한 장애메시지를 출력 요구하고(S36h) 종료한다.
수신지 Pid에 대한 확인 결과 정상이면 감시 버퍼에 대한 여유 상태를 점검하기 위한 절차를 수행하며(S36e), 수신지 Pid가 비정상 상태의 경우에는 이에 대한 장애메시지를 출력 요구하고(S36h) 종료한다(S36g).
감시 버퍼가 저장할 수 있는 상태이며 요구한 프로세스 정보를 감시 버퍼에 등록한 후(S36f) 종료한다(S36g).
도 4는 프로세스 장애 감시기능에 대한 처리 과정을 설명한 것으로서, 기능 수행이 시작되면 프로세스 감시를 위한 라이브러리 내 감시 버퍼에 대한 등록 정보 초기화 과정을 수행한 후(S45) 프로세스 장애 접수를 위한 대기 상태로 천이한다(S46).
대기상태에서 운용자 요구에 의한 프로세스 복구 제어를 위한 시그널을 접수하면(S47) 도 5의 처리과정을 수행하며, 운용자 요구에 의한 프로세스 감시 정보 출력을 위한 시그널을 접수하면(S48) 도 6의 처리과정을 수행한다.
그리고 대기상태에서 응용 기능이 수행되는 과정에서 프로세스 장애가 발생되면 운영체계를 통하여 프로세서 유실정보를 접수한다(S49).
라이브러리로 관리되는 감시 대상 프로세스 등록정보의 첫번째 값을 읽은 후(S50) 접수된 프로세스 장애정보가 수신지 프로세스 Pid인지를 확인하며(S51), 이때 장애가 발생된 프로세스가 수신지 Pid의 경우는 장애 발생정보를 수신할 프로세스가 없어진 경우에 해당 되므로, 감시 버퍼에서 해당되는 정보를 삭제한 후(S52) 프로세스 장애메시지를 출력요구하고(S53) 다음 처리를 위한 대기상태로 천이한다(S54).
수신지 Pid가 아닌 경우에는 감시 대상 프로세스의 정의번호를 확인한 후(S55), 다르면 등록된 전체 프로세스에 대한 처리가 완료되었는지를 확인하고(S56), 완료되지 않은 상태이면 다음 일련 번호를 지정한 후(S57) 반복과정을 수행한다.
전체 등록된 정보에 대한 처리가 완료된 상태이면 해당 프로세스에 대한 장애메시지를 출력요구하고(S53) 다음 처리를 위한 대기상태로 천이한다(S54).
감시 대상 프로세스 정의번호와 동일한 경우에는 감시 대상 프로세스 Pid와 일치하는지를 점검한 후(S58), 다르면 등록된 전체 프로세스에 대한 처리가 완료 되었는지를 확인하고(S56), 완료되지 않은 상태이면 다음 일련 번호를 지정한 후(S57) 반복과정을 수행한다.
전체 등록된 정보에 대한 처리가 완료된 상태이면 해당 프로세스에 대한 장애메시지를 출력요구하고(S53) 다음 처리를 위한 대기상태로 천이한다(S54).
감시 대상 프로세스 Pid와 동일한 경우에는 등록된 수신지로 프로세스 장애발생 정보 시그널을 전송한 후(S59) 이미 등록되어 있던 프로세스 감시 대상 프로세스 Pid 정보를 삭제하고(S60) 해당 프로세스에 대한 장애메시지를 출력요구하고(S53), 다음 처리를 위한 대기상태로 천이한다(S54).
이에 대한 감시 대상 프로세스 정보는 응용 기능에서 해당 프로세스를 재생성하는 시점에서 재등록된다.
도 5는 운용자 요구에 의한 프로세스 복구 제어를 위한 처리 과정을 설명한 것으로서, 감시 대상 프로세스 정보를 읽어(S47a) 요구한 프로세스 정의 번호의 존재 유무를 확인한 후(S47b), 존재하지 않으면 비정상 처리 결과메시지를 출력요구하고(S47c) 다음 처리를 위한 대기상태로 천이한다(S47d).
존재하는 프로세스인 경우에는 요구한 제어 형태를 확인하여(S47e), 해제인 경우에는 이미 해제 상태인지를 확인한 후(S47f) 해제 상태이면 비정상 처리 결과메시지를 출력요구하고(S47c) 다음 처리를 위한 대기상태로 천이한다(S47d).
해제 상태가 아니면 해당 프로세스에 대한 복구 해제(TRUE) 정보를 등록하고(S47g) 정상 처리 결과메시지를 출력요구하고(S47h) 다음 처리를 위한 대기상태로 천이한다(S47d).
제어형태가 억제인 경우에는 이미 억제 상태인지를 확인하여(S47i) 억제 상태이면 비정상 처리 결과메시지를 출력요구하고(S47c) 다음 처리를 위한 대기상태로 천이한다(S47d).
억제 상태가 아니면 해당 프로세스에 대한 복구 억제(FALSE) 정보를 등록하고(S47j) 정상 처리 결과메시지를 출력요구하고(S47h) 다음 처리를 위한 대기상태로 천이한다(S47d).
도 6은 운용자 요구에 의한 프로세스 감시 정보 출력을 위한 처리 과정을 설명한 것으로서, 요구한 형태를 확인 한 후(S48a), 개별 프로세스에 대한 출력 요구이면 감시 대상 프로세스 정보를 읽어(S48b) 요구한 프로세스 정의 번호의 존재 유무를 확인하여(S48c), 존재하지 않으면 비정상 처리 결과메시지를 출력요구하고(S48d) 다음 처리를 위한 대기상태로 천이한다(S48e).
프로세스 정의 번호가 존재하면 결과메시지를 구성한 후(S48f) 정상 처리 결과메시지를 출력요구하고(S48g) 다음 처리를 위한 대기상태로 천이한다(S48e).
요구 형태 확인결과 전체에 대한 경우이면 첫번째 감시 대상 프로세스 정보를 읽어(S48h) 결과메시지를 구성하고(S48i) 전체 처리가 완료되었는지를 점검 후(S48j), 완료되지 않은 상태이면 다음 프로세스 위치정보를 지정한 후(S48k) 감시대상 프로세스를 읽고 결과메시지를 구성하는 과정을 반복 수행한다.
전체에 대한 처리가 완료되면 정상 처리 결과메시지를 출력요구하고(S48l) 다음 처리를 위한 대기상태로 천이한다(S48e).
상술한 바와 같이 본 발명에서 제시한 프로세스 장애발생 감시에 의한 복구방법은 응용 기능의 필요에 따라 기능 동작 중인 상태에서 감시 정보를 등록할 수 있어 사용상의 편의성이 제공될 뿐만 아니라, 프로세스를 생성한 응용기능에서 장애발생 정보를 통보 받아 재생성하는 절차를 수행함으로써, 해당 프로세스가 갖는 기능적인 특징을 가장 정확하게 알 수 있는 기능에서 복구가 이루어진다는 점에서 프로세스 장애로 인한 비정상 상태를 가장 안전하고 최소의 범위 내에서 복구처리 절차가 이루어질 수 있다.
따라서 프로세스 장애로 인한 기능 이상 현상의 영향을 최소화하고 프로세서 전체적인 동작에 미치는 영향을 최소화할 수 있는 장점을 갖는다.
그리고 자체적인 기능 오류로 인하여 반복적인 재생성이 이루어지는 경우는 운용자의 확인절차에 따라 필요 시 재생성을 억제할 수 있으므로 프로세스 감시 기능을 융통성 있게 활용할 수 있다.
또한 이러한 형태의 기능 구성은 프로세스 감시 기능뿐만 아니라 감시 대상이 될 수 있는 여러 가지 형태의 자원을 대상으로 적용이 가능한 효과를 갖는다.

Claims (6)

  1. 기능 시작 시 프로세스 감시 필요 여부에 따라 감시 대상 프로세스 정보를 라이브러리를 통하여 등록하고 장애발생 시 감시 기능으로부터 통보를 받아 재생성하는 절차를 수행하는 응용 기능, 응용 기능으로부터 호출되어 감시 대상 프로세스 정보를 등록하고 정보를 관리하는 라이브러리, 프로세스 장애발생 시 운영 체계로부터 해당 정보를 받아 상기 라이브러리에 관리되는 정보를 이용하여 감시 기능을 수행하고 최종 결과를 해당되는 응용 기능으로 전달하는 감시 기능을 구비한 프로세스 장애 복구방법에 있어서,
    상기 응용 기능에서 프로세스 감시를 위한 정보를 등록하고 장애발생 시 이를 복구하는 제 1 과정과;
    제 1 과정 수행 후 프로세스 장애 감시 기능을 수행하는 제 2 과정을 포함하는 것을 특징으로 하는 프로세스 감시 및 장애 복구방법.
  2. 제 1 항에 있어서,
    상기 제 1 과정은,
    프로세서 운영체계로부터 시동되는 응용 기능에서 수행하고자 하는 프로세스를 생성하고 감시 대상 프로세스인지를 확인하여 감시대상 프로세스이면 해당 프로세스에 대한 관리 정보를 읽어 복구 여부를 확인하는 제 1 단계와;
    복구 여부 확인 후 복구가 억제 상태이면 다음 수행을 위한 시그널 접수 대기상태로 천이하는 제 2 단계와;
    복구가 허가된 상태이면 프로세서의 프로세스 인스턴스 정의(Pid)를 저장하여 프로세스 감시를 위한 라이브러리를 수행한 후 정상적인 기능 처리를 위한 시그널 대기상태로 천이하는 제 3 단계와;
    상기 시그널 접수 대기상태에서 프로세스 감시기능으로부터 프로세스 장애발생 정보를 접수하면 관련 데이터 복구 및 초기화 과정을 수행하는 제 4 단계와;
    프로세스 장애발생 관련 데이터 복구 및 초기화 과정 수행 후 해당 프로세스를 재생성하고 프로세스 Pid를 저장하여 라이브러리를 통한 프로세스 감시 대상 정보를 재등록하고 복구 회수를 증가한 후 시그널을 접수하기 위한 대기상태로 천이하는 제 5 단계로 이루어진 것을 특징으로 하는 프로세스 감시 및 장애 복구방법.
  3. 제 2 항에 있어서,
    프로세스 감시 정보 등록을 위한 라이브러리의 처리는,
    프로세스 감시 정보 등록을 위해 응용 기능으로부터 호출되면 해당 프로세스 정보에 대하여 이미 등록되어 있는지 확인하여 등록되어 있지 않은 상태이면 감시 대상 Pid를 점검하는 제 1 부단계와;
    이미 등록된 경우는 비정상 등록 요구에 대한 장애메시지 출력을 요구하고 종료하는 제 2 부단계와;
    감시 대상 Pid 확인 결과 정상이면 수신지 Pid 점검을 위한 절차를 수행하고, 비정상인 경우는 이에 대한 장애메시지 출력을 요구하고 종료하는 제 3 부단계와;
    수신지 Pid에 대한 확인 결과 정상이면 감시 버퍼에 대한 여유 상태를 점검하기 위한 절차로 수신지 Pid가 비정상 상태의 경우는 이에 대한 장애메시지를 출력 요구하고 종료하는 제 4 부단계와;
    감시 버퍼가 저장할 수 있는 상태이면 요구한 프로세스 정보를 감시 버퍼에 등록한 후 종료하는 제 5 부단계로 이루어진 것을 특징으로 하는 프로세스 감시 및 장애 복구방법.
  4. 제 1 항에 있어서,
    상기 제 2 과정은,
    프로세스 감시를 위한 라이브러리 내 감시 버퍼에 대한 등록 정보 초기화 과정을 수행한 후 프로세스 장애 접수를 위한 대기 상태로 천이하는 제 1 단계와;
    대기상태에서 운용자 요구에 의한 프로세스 복구 제어를 위한 시그널을 접수하면 운용자 요구에 대한 프로세스에 복구 제어 처리를 수행하는 제 2 단계와;
    운용자 요구에 의한 프로세스 감시 정보 출력을 위한 시그널을 접수하면 운용자 요구에 대한 프로세스 감시 정보 출력을 처리하는 제 3 단계와;
    상기 대기상태에서 응용 기능 수행 시 프로세스 장애가 발생되면 운영체계를 통하여 프로세서 유실정보를 접수하는 제 4 단계와;
    프로세스 유실 정보 접수 후 라이브러리로 관리되는 감시 대상 프로세스 등록정보의 첫번째 값을 읽어 접수된 프로세스 장애정보가 수신지 프로세스 Pid인지를 확인하여 장애가 발생된 프로세스가 수신지 Pid의 경우 감시 버퍼에서 해당되는 정보를 삭제한 후 프로세스 장애메시지를 출력요구하고 다음 처리를 위한 대기상태로 천이하는 제 5 단계와;
    수신지 Pid가 아닌 경우에는 감시 대상 프로세스의 정의번호를 확인한 후 다르면 등록된 전체 프로세스에 대한 처리가 완료되었는지를 확인하고, 완료되지 않은 상태이면 다음 일련 번호를 지정한 후 반복과정을 수행하는 제 6 단계와;
    전체 등록된 정보에 대한 처리가 완료된 상태이면 해당 프로세스에 대한 장애메시지를 출력요구하고 다음 처리를 위한 대기상태로 천이하는 제 7 단계와;
    감시 대상 프로세스 정의번호와 동일한 경우는 감시 대상 프로세스 Pid와 일치하는지를 점검한 후 다르면 등록된 전체 프로세스에 대한 처리가 완료되었는지를 확인하고, 완료되지 않은 상태이면 다음 일련 번호를 지정한 후 반복과정을 수행하는 제 8 단계와;
    전체 등록된 정보에 대한 처리가 완료된 상태이면 해당 프로세스에 대한 장애메시지를 출력요구하고 다음 처리를 위한 대기상태로 천이하는 제 9 단계와;
    감시 대상 프로세스 Pid와 동일한 경우에는 등록된 수신지로 프로세스 장애발생 정보 시그널을 전송한 후 이미 등록되어 있던 프로세스 감시 대상 프로세스 Pid 정보를 삭제하고 해당 프로세스에 대한 장애메시지를 출력요구한 후 다음 처리를 위한 대기상태로 천이하는 제 10 단계로 이루어진 것을 특징으로 하는 프로세스 감시 및 장애 복구방법.
  5. 제 4 항에 있어서,
    상기 제 2 단계는,
    감시 대상 프로세스를 읽어 요구한 프로세스 정의 번호의 존재 유무를 확인한 후 존재하지 않으면 비정상 처리 결과 메시지를 출력요구하고 다음 처리를 위한 대기상태로 천이하는 제 1 부단계와;
    확인 후 존재하는 경우는 요구한 제어 형태룰 확인하여 해제인 경우 이미 해제 상태인지를 확인한 후 해제 상태이면 비정상 처리 결과메시지를 출력요구하고 다음 처리를 위한 대기상태로 천이하는 제 2 부단계와;
    해제 상태가 아니면 해당 프로세스에 대한 복구 해제 정보를 등록하고 정상 처리결과 메시지를 출력요구한 후 다음 처리를 위한 대기상태로 천이하는 제 3 부단계와;
    제어 형태가 억제인 경우 이미 억제 상태인지를 확인하여 억제 상태이면 비정상 처리결과메시지를 출력요구하고 다음 처리를 위한 대기상태로 천이하는 제 4 부단계와;
    억제 상태가 아니면 해당 프로세스에 대한 복구 억제 정보를 등록하고 정상처리 결과메시지를 출력요구하고 다음 처리를 위한 대기상태로 천이하는 제 5 부단계로 이루어진 것을 특징으로 하는 프로세스 감시 및 장애 복구방법.
  6. 제 4 항에 있어서,
    상기 제 3 단계는,
    요구한 형태를 확인 한 후 개별 프로세스에 대한 출력 요구이면 감시 대상 프로세스 정보를 읽어 요구한 프로세스 정의 번호의 존재 유무를 확인한 후 존재하지 않으면 비정상 처리 결과메시지를 출력요구하고 다음 처리를 위한 대기상태로 천이하는 제 1 부단계와;
    프로세스 정의 번호가 존재하면 결과메시지를 구성한 후 정상 처리 결과메시지를 출력요구하고 다음 처리를 위한 대기상태로 천이하는 제 2 부단계와;
    요구 형태 확인결과 전체에 대한 경우이면 첫번째 감시 대상 프로세스 정보를 읽어 결과메시지를 구성하고 전체 처리가 완료되었는지를 점검한 후 완료되지 않은 상태이면 다음 프로세스 위치정보를 지정하고 감시대상 프로세스를 읽어 결과메시지를 구성하는 과정을 반복 수행하는 제 3 부단계와;
    전체에 대한 처리가 완료되면 정상 처리 결과메시지를 출력요구하고 다음 처리를 위한 대기상태로 천이하는 제 4 부단계로 이루어진 것을 특징으로 하는 프로세스 감시 및 장애 복구방법.
KR1019980051047A 1998-11-26 1998-11-26 프로세스감시및장애복구방법 KR100309678B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1019980051047A KR100309678B1 (ko) 1998-11-26 1998-11-26 프로세스감시및장애복구방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1019980051047A KR100309678B1 (ko) 1998-11-26 1998-11-26 프로세스감시및장애복구방법

Publications (2)

Publication Number Publication Date
KR20000033963A true KR20000033963A (ko) 2000-06-15
KR100309678B1 KR100309678B1 (ko) 2002-02-28

Family

ID=19559910

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019980051047A KR100309678B1 (ko) 1998-11-26 1998-11-26 프로세스감시및장애복구방법

Country Status (1)

Country Link
KR (1) KR100309678B1 (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100450868B1 (ko) * 2000-08-03 2004-10-01 인터내셔널 비지네스 머신즈 코포레이션 자원 복구를 통한 최적의 시스템의 가용성을 위한 방법
KR101345964B1 (ko) * 2006-08-18 2013-12-31 엘지전자 주식회사 복수의 코어가 구비된 프로세서 및 그 제어 방법

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100450868B1 (ko) * 2000-08-03 2004-10-01 인터내셔널 비지네스 머신즈 코포레이션 자원 복구를 통한 최적의 시스템의 가용성을 위한 방법
KR101345964B1 (ko) * 2006-08-18 2013-12-31 엘지전자 주식회사 복수의 코어가 구비된 프로세서 및 그 제어 방법

Also Published As

Publication number Publication date
KR100309678B1 (ko) 2002-02-28

Similar Documents

Publication Publication Date Title
KR100575497B1 (ko) 내고장성 컴퓨터 시스템
KR19990082867A (ko) 갱신 트랜잭션 완성 방법 및 장치
JP2006277205A (ja) 記憶装置システムおよびその制御方法、制御プログラム
US7373542B2 (en) Automatic startup of a cluster system after occurrence of a recoverable error
US8230254B2 (en) Redundant system using object-oriented program and method for rescuing object-oriented program
GB2317071A (en) Fault-tolerant ISDN PBX
CN101556542B (zh) 一种成对冗余结构中器件的升级方法及设备
KR100309678B1 (ko) 프로세스감시및장애복구방법
JP3164147B2 (ja) 網管理装置の構成情報管理方式および管理対象装置
JP2001154896A (ja) 計算機およびそのファイル更新方法
KR100194809B1 (ko) 비동기전달모드 교환시스템에서의 이중화 프로세서 기능검증방법
Cisco Operational Traps
Cisco Operational Traps
CN100490343C (zh) 一种通讯设备中主备用单元倒换的实现方法和装置
US7873941B2 (en) Manager component that causes first software component to obtain information from second software component
CN117971504B (zh) 一种故障倒换Bus资源分配方法、系统及装置
KR100407706B1 (ko) 비동기 전송 방식 교환기에서 대기측 로딩 후 상태 불일치 복구방법
US11507478B2 (en) Method for operating a redundant automation system
CN117435673A (zh) 分布式数据库的组件扩容方法、装置以及电子设备
KR19990052892A (ko) 전전자 교환기의 스탠바이측 프로세서 테스트 기능구현 방법
JPH0668034A (ja) オンラインシステム監視方式
CN111563010A (zh) 一种基于双机冗余系统的数据同步方法、系统及存储介质
CN115617911A (zh) 分布式数据库的主备切换方法和装置
CN117971504A (zh) 一种故障倒换Bus资源分配方法、系统及装置
JPH0553938A (ja) 二重化構成の中央制御装置切替え方式

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20100906

Year of fee payment: 10

LAPS Lapse due to unpaid annual fee