KR20040073800A

KR20040073800A - 실시간 장애 제어를 위한 데이터베이스 테이블 모델링 및이벤트 처리 방법

Info

Publication number: KR20040073800A
Application number: KR1020030009519A
Authority: KR
Inventors: 전응선
Original assignee: 삼성전자주식회사
Priority date: 2003-02-14
Filing date: 2003-02-14
Publication date: 2004-08-21
Also published as: US20040162810A1; US7136864B2; CN1311387C; CN1521663A; KR100489690B1

Abstract

본 발명은 네트워크 장비로부터 발생하는 장애(Alarm) 및 연관 이벤트(Event)를 실시간으로 장애 관리자(Alarm Manager)에게 전달하는 경우, 각각의 클라이언트(Client)들과 장애 시퀀스 번호(Alarm Sequence Number)간의 매핑(Mapping)과 이를 뒷받침하는 데이터베이스 모델링(Database Modeling)과 이벤트 관리 기법을 통하여 보다 효율적으로 이벤트를 처리할 수 있도록 한 실시간 장애 제어를 위한 데이터베이스 테이블 모델링 및 이벤트 처리 방법에 관한 것이다.

이러한 본 발명은, 장애관리 프로세서에서 네트워크 시스템 장비로부터 장애 이벤트가 발생하면 그 발생한 장애 정보를 장애 데이터베이스에 저장하고, 장애 관리자들은 상기 데이터베이스에 저장된 장애 정보를 장애 시퀀스 번호에 대응하여 폴링하고, 폴링이 종료되면 상기 클라이언트 리스트 테이블에 폴링 관련 정보를 저장하며, 데몬 프로세서에서 상기 대기자 테이블에 축적되는 일정량의 현재 장애 정보를 상기 클라이언트 리스트 테이블의 판독 장애 시퀀스 번호(Reading Alarm Sequence Number)와 매핑하여 상기 대기자 테이블내의 현재 장애 리스트를 관리하고, 상기 클라이언트 리스트 테이블의 상태를 최종 폴링 시간과 장애 시퀀스 번호로 파악하여 비정상 종료된 클라이언트를 관리하게 된다.

Description

실시간 장애 제어를 위한 데이터베이스 테이블 모델링 및 이벤트 처리 방법{Method for procesing event and controlling real error and modeling database table}

본 발명은 실시간 장애 제어를 위한 데이터베이스 테이블 모델링 및 이벤트 처리 방법에 관한 것으로, 특히 네트워크 장비로부터 발생하는 장애(Alarm) 및 연관 이벤트(Event)를 실시간으로 장애 관리자(Alarm Manager)에게 전달하는 경우, 각각의 클라이언트(Client)들과 장애 시퀀스 번호(Alarm Sequence Number)간의 매핑(Mapping)과 이를 뒷받침하는 데이터베이스 모델링(Database Modeling)과 이벤트 관리 기법을 통하여 보다 효율적으로 이벤트를 처리할 수 있도록 한 실시간 장애 제어를 위한 데이터베이스 테이블 모델링 및 이벤트 처리 방법에 관한 것이다.

일반적으로, 다수개의 시스템들이 연결된 네트웍을 관리하기 위해서는 네트워크 관리 시스템(Network Management System)을 사용하게 된다. 따라서 네트워크 관리 시스템에서는 네트워크를 이루는 각 시스템들과 직접 또는 간접적으로 연결되어 각 시스템의 상태정보를 수신하여 관리하게 된다.

또한 이러한 상태정보는 네트워크 관리 시스템에 연결된 각 운용자 컴퓨터에서 확인할 수 있다.

네트워크 관리 시스템에 연결되는 시스템들은 교환 시스템 및 전송 시스템 등이 있다. 네트워크 관리 시스템은 교환 시스템 및 전송 시스템과 연결되어 각 시스템으로부터 장애 데이터 및 유지보수를 위한 데이터를 수집하며 데이터베이스로 관리하게 된다.

네트워크 관리 시스템은, 통신 네트워크의 상태를 항상 감시하여 최적의 상태를 유지하며, 네트워크의 상태, 장애, 트래픽 데이터 등을 수집 및 축적한다. 특히 네트워크 장애관리 시스템은 네트워크에서 발생된 복수개의 장애정보를 저장하여 네트워크 장애관리 시스템에 연동된 복수개의 장애 관리자 컴퓨터에게 원하는 장애정보를 제공하게 된다.

도 1은 종래의 네트워크 장애관리 시스템을 나타낸 블록도이다.

도 1을 참조하면, 장애관리를 위한 호스트 컴퓨터(서버)는 네트워크 관리를 위한 워크 스테이션으로서, 장애관리 프로세서(10)와, 브로드캐스팅 리스트 테이블(20)과, 장애 데이터 베이스(30)와, 이벤트 데이터 베이스(40)와, 데몬 프로세서(50)와, 복수개의 대기자 테이블들(61 ∼ 63)과, 복수개의 장애 관리자들(71 ∼ 73)을 포함한다.

네트워크에서 발생되는 각종 상태 정보는 컴퓨터를 기반으로 하는 정보 시스템(Management Information System)(도면에는 도시되지 않음)에 의하여 취합된다. 정보 시스템은 컴퓨터 하드웨어(hardware), 소프트웨어(software), 데이터(Data), 절차(procedures), 그리고 사람(people)을 구성요소로 하는 시스템으로서 네트워크에서 발생되는 데이터를 처리하여 다양한 정보를 생산한다.

정보 시스템에 의하여 통지된 장애, 이벤트 정보는 장애관리 프로세서(10)에 전달된다. 장애관리 프로세서(10)는 데몬(daemon) 응용 프로그램인 장애관리 응용 프로그램에 의하여 동작한다. 알려진 바와 같이 데몬이란 시스템의 운영에 관련된 작업을 후선(background)상태로 동작하면서 실행하는 상주 프로그램을 말한다. 즉 장애관리 데몬 응용 프로그램은 후선 상태에 있다가 처리해야 할 작업 조건이 발생하면 자동으로 기동하여 필요한 작업을 실행한다.

다중 분산 테이블 구조를 가지는 장애 데이터베이스(30)는 미해제장애 테이블(uncleared alarm table)(31)과 해제장애 테이블(cleared alarm table)(32)을 포함한다. 장애관리 프로세서(10)는 네트워크에서 발생된 후 해제되지 않은 장애정보를 미해제장애 테이블(31)에 저장하고, 장애가 해제되면 해당하는 장애정보를 미해제장애 테이블(31)에서 삭제한 뒤 해제장애 테이블(32)로 이동하여 저장한다.

그리고 발생된 이벤트는 이벤트 데이터베이스(40)에 저장한다.

장애관리 서버는 복수명의 운영자들에 의한 분산 장애 관리를 지원하기 위하여 워크 스테이션이나 개인 컴퓨터 또는 장애관리 서버에서 동작하는 응용 프로그램 등으로 구현될 수 있는 복수개의 장애 관리자들(71 ∼ 73)과 연결되는 데, 만약 복수개의 장애 관리자들(71 ∼ 73)이 미해제장애 테이블(31)로부터 장애정보를 독출하는 시점이 동기되지 않는다면 먼저 독출하는 일부 장애 관리자들은 이미 해제된 장애정보를 독출하게 되고 나중에 독출하는 나머지 장애 관리자들은 해제되지 않은 장애정보만을 독출하게 될 수 있다. 이러한 경우 장애 관리자들이 가지는 장애정보들이 서로 일치하지 않게 된다.

이를 방지하기 위하여 복수개의 장애 관리자들(71 ∼ 73)은 각각 고유한 장애정보 인식공간인 대기자 테이블(61 ∼ 63)을 가진다. 대기자 테이블들(61 ∼ 63)의 이름들은 브로드캐스팅 리스트 테이블(20)에 등록되며, 네트워크에서 발생된 장애정보는 미해제장애 테이블(31)에 저장되는 동시에 복수개의 장애 관리자들(71 ∼ 73)에 각각 대응하는 복수개의 대기자 테이블들(61 ∼ 63)에 저장된다. 복수개의장애 관리자들(71 ∼ 73)은 각각 해당하는 대기자 테이블(61 ∼ 63)로부터 장애정보를 독출한다.

즉, 종래의 장애 관리자들은 실시간 이벤트를 처리하기 위하여 클라이언트가 장애 관리자를 구동하게 되면 서버(Server)에 의해 생성된 데이터베이스내의 대기자(Listener)라는 테이블을 할당받게 된다. 대기자 테이블은 구동된 장애 관리자들의 개수만큼 생성되게 되며, 이는 각각의 장애 관리자의 독립적인 작업수행 결과의 전달을 위함이다.

도 2는 종래의 네트워크 장애관리 시스템에서 장애 관리 동작을 나타낸 흐름도이다.

이에 도시된 바와 같이, 단계 81에서와 같이 장애 데이터가 장애관리 프로세서(10)로 입력되면, 장애관리 프로세서(10)는 해당 장애에 대하여 정해진 처리 프로세스를 수행하게 된다. 장애 처리 프로세스가 시작되면 단계 82에서 발생된 장애 자체의 정보를 장애 관리자에게 전달하기 위하여 브로드캐스팅 리스트 테이블에 등록되어 관리되고 있는 모든 대기자(Listener) 테이블을 조회하고, 단계 83에서 대기자 테이블에 장애 정보를 입력 저장하게 된다.

데몬 프로세서(50)는 단계 84에서 최종 검색 시간을 조회하게 되고, 단계 85에서 경과 시간을 예정치와 대비하게 된다. 단계 86에서는 대기자 테이블을 드롭(Drop)시키게 되고, 단계 87에서는 대기자 테이블에 기록된 정보를 삭제하게 되고, 단계 88에서는 다음 장애 정보가 발생할 때까지 대기하게 된다.

아울러 장애 관리자들(71)은 단계 91에서 장애 관리를 시작하고, 단계 92에서 대기자 테이블을 생성한다. 그리고 단계 93에서 폴링(Polling) 방식을 통하여 주기적으로 자신만의 대기자 테이블에 새로이 저장되어진 정보를 읽은 후, 대기자 테이블로부터 읽은 데이터를 실시간 장애 표시창에 디스플레이한다. 아울러 단계 94에서 다음 폴링 작업을 위하여 대기자 테이블에 있는 모든 실시간 데이터를 삭제하여 초기화한다. 단계 95에서는 최종 검색시간을 업데이트하고, 단계 96에서는 다음 폴링 기간 동안을 대기하게 된다. 단계 97에서 사용자가 장애 관리 접속을 종료하게 되면 단계 98에서 대기자 테이블을 드롭시키고, 단계 99에서 장애 관리를 종료하게 된다.

주지한 바와 같이, 네트워크의 크기와 관리 범위 영역의 기하급수적 팽창은 대용량 네트워크를 관리할 수 있는 네트워크 관리 시스템(NMS : Network Management System)을 요구하게 되며, 이 네트워크 관리 시스템을 운용하기 위해서는 대용량 처리가 가능한 서버와 무수히 많은 클라이언트들의 연결 구조가 예상되어진다.

그러나 종래의 장애 관리자의 실시간 장애 처리 방식은, 상대적으로 네트워크 크기가 작은 시스템을 대상으로 개발된 것이므로, 서버에서는 장애들을 처리하여 클라이언트에 전달하기 위하여 구동된 장애 관리자의 개수만큼 생성된 대기자 테이블에 쓰기 작업을 수행하여야 한다. 즉, 하나의 이벤트(장애 이벤트)를 처리하는 과정에 이벤트 개수 x 대기자 테이블 개수만큼의 불필요한 쓰기 작업이 수행되어진다.

따라서 종래의 장애 관리 시스템은, 접속한 클라이언트의 장애 관리자수가증가할수록 처리하여야 할 대기자 테이블의 수가 증가하게 되므로, 장애 처리 속도가 감소하게 되는 문제점을 발생하였다.

즉, 종래의 장애 처리 구조는 실시간(Real Time)을 반영하여야 하는 대용량 네트워크 관리 시스템의 장애 처리 성능 기준을 만족시키지 못하는 단점을 유발하였다.

이에 본 발명은 상기와 같은 종래 네트워크 장애관리 시스템에서 장애 처리시 발생하는 제반 문제점을 해결하기 위해서 제안된 것으로서,

본 발명의 목적은, 네트워크 장비로부터 발생하는 장애(Alarm) 및 연관 이벤트(Event)를 실시간으로 장애 관리자(Alarm Manager)에게 전달하는 경우, 각각의 클라이언트(Client)들과 장애 시퀀스 번호(Alarm Sequence Number)간의 매핑(Mapping)과 이를 뒷받침하는 데이터베이스 모델링(Database Modeling)과 이벤트 관리 기법을 통하여 보다 효율적으로 이벤트를 처리할 수 있도록 한 실시간 장애 제어를 위한 데이터베이스 테이블 모델링 및 이벤트 처리 방법을 제공하는 데 있다.

도 1은 종래의 네트워크 장애관리 시스템을 나타낸 블록도이고,

도 2는 종래의 네트워크 장애관리 시스템에서 장애 관리 동작을 나타낸 흐름도이고,

도 3은 본 발명에 의한 실시간 장애 제어를 위한 데이터베이스 테이블 모델링 및 이벤트 처리 방법이 적용된 네트워크 장애관리 시스템을 나타낸 블록도이다.

<도면의 주요 부분에 대한 부호의 설명>

110 : 장애관리 프로세서 121 : 클라이언트 리스트 테이블

122 : 장애 데이터 베이스 123 : 이벤트 데이터 베이스

124 : 대기자 테이블 130 : 데몬 프로세서

141 ∼ 143 : 장애 관리자

상기와 같은 목적을 달성하기 위한 본 발명에 의한 "실시간 장애 제어를 위한 데이터베이스 테이블 모델링 및 이벤트 처리 방법"은,

장애관리 프로세서와 클라이언트 리스트 테이블과 장애 데이터 베이스와 비정상 종료된 클라이언트를 관리하는 데몬 프로세서와 하나의 대기자 테이블 및 복수개의 장애 관리자들을 구비한 네트워크 장애관리 시스템에서의 실시간 장애 제어를 위한 데이터베이스 테이블 모델링 및 이벤트 처리 방법에 있어서,

상기 장애관리 프로세서에서 네트워크 시스템 장비로부터 장애 이벤트가 발생하면 그 발생한 장애 정보를 장애 데이터베이스에 저장하는 단계와;

상기 장애 관리자들은 상기 데이터베이스에 저장된 장애 정보를 장애 시퀀스 번호에 대응하여 폴링하고, 폴링이 종료되면 상기 클라이언트 리스트 테이블에 폴링 관련 정보를 저장하는 단계와;

상기 데몬 프로세서에서 상기 대기자 테이블에 축적되는 일정량의 현재 장애 정보를 상기 클라이언트 리스트 테이블의 판독 장애 시퀀스 번호(Reading Alarm Sequence Number)와 매핑하여 상기 대기자 테이블내의 현재 장애 리스트를 관리하고, 상기 클라이언트 리스트 테이블의 상태를 최종 폴링 시간과 장애 시퀀스 번호로 파악하여 비정상 종료된 클라이언트를 관리하는 단계를 수행함을 특징으로 한다.

상기에서 장애관리 프로세서는, 장애 정보가 도착하면, 장애 데이터 베이스의 미해제 장애 테이블 및 해제장애 테이블에 유효 적절하게 장애 정보를 저장하는 단계; 클라이언트 리스트 테이블을 검색하여 클라이언트 리스트에 접속된 클라이언트가 존재하는지를 확인하는 단계; 상기 확인 결과 클라이언트 리스트에 접속된 클라이언트가 없을 경우에는 대기자 테이블에 수행하는 장애 저장을 생략하고, 이와는 달리 상기 클라이언트 리스트에 접속된 클라이언트가 존재하는 경우에는 상기 대기자 테이블에 장애 정보를 저장하는 단계를 수행하는 것을 특징으로 한다.

또한 상기 장애 관리자들은, 초기 구동시, 자신의 구동 시간정보를 상기 클라이언트 리스트 테이블에 기록하는 단계; 자기 식별자인 클라이언트 고유번호(client_id)를 할당받아 상기 클라이언트 리스트 테이블에 기록하는 단계; 상기 클라이언트 리스트 테이블에서 자신이 폴링한 마지막 시퀀스 번호(last_seq no)를 읽어온 후 상기 대기자 테이블에 존재하는 장애 시퀀스 번호(seq_no)중 상기 마지막 시퀀스 번호보다 큰 값을 갖는 장애 정보를 폴링하는 단계; 상기 폴링이 끝남과 동시에 상기 클라이언트 리스트 테이블에 폴링 종료시간과 마지막 시퀀스 번호(last_sequence number)를 기록하는 단계; 접속이 종료되면 상기 클라이언트 리스트 테이블에 존재하는 자신의 정보를 삭제하는 단계를 수행하는 것을 특징으로 한다.

또한 상기 데몬 프로세서는, 주기적으로 상기 클라이언트 리스트 테이블을 모니터링하여 그 모니터링하는 시점과 클라이언트의 마지막 폴링 시간(Last Polling Time)을 비교하는 단계; 상기 비교 결과 모니터링한 시점의 시간과 클라이언트의 마지막 폴링 시간의 차이가 클라이언트 폴링 기간 또는 폴링 기간 임계치(Client's Polling Period or Polling Period Threshold Value)보다 클 경우에는 클라이언트 리스트에 존재하는 클라이언트 정보를 삭제하는 단계; 상기 클라이언트 리스트 테이블에 등록되어 있는 각각의 클라이언트들의 최소 장애 시퀀스 번호(min(last_seq))를 찾아, 상기 대기자 테이블에 저장된 장애 정보와 비교하는단계; 상기 최소 장애 시퀀스 번호(min(last_seq))와 상기 대기자 테이블에 저장된 장애 정보를 비교한 결과 상기 대기자 테이블에 저장된 장애 정보중 상기 최소 장애 시퀀스 번호보다 작은 장애 시퀀스 번호에 대응하는 장애 정보를 삭제하는 단계를 수행하는 것을 특징으로 한다.

이하 상기와 같은 기술적 사상에 따른 본 발명의 바람직한 실시 예를 첨부한 도면에 의거 상세히 설명하면 다음과 같다.

본 발명은, 대용량 네트워크 시스템을 관리할 경우 대량의 장애 이벤트 발생을 처리하기 위해서, 다중 대기자 테이블 구조로부터 단일 대기자 테이블 구조로 개선하고, 네트워크의 부하와 데이터베이스 트랜잭션 입/출력(Transaction I/O)처리를 최소화하여 기존 관리장비 대상 장애 처리 속도를 향상시키고, 대용량 네트워크 관리 시스템에서 요구되는 실시간 장애 처리 속도를 향상시키고자 한 것이다.

이에 도시된 바와 같이, 장애관리 프로세서(110)와, 장애 정보의 저장 및 처리를 위한 데이터 베이스(121 ∼ 124)와, 대기자 테이블에 축적되는 일정량의 현재 장애 정보를 클라이언트 리스트의 판독 장애 시퀀스 번호(Reading Alarm Sequence Number)와 매핑(Mapping)하여 대기자 테이블내의 현재 장애 리스트를 관리하고, 클라이언트 리스트의 상태를 최종 폴링(Polling) 시간과 장애 시퀀스 번호(Sequence Number)로 파악하여 비정상 종료된 클라이언트를 관리하는 대기자 서버 데몬 프로세서인 데몬 프로세서(130)와, 복수개의 장애 관리자들(141 ∼ 143)로 구성된다.

여기서 데이터 베이스(121 ∼ 124)는, 현재까지 해제되지 않은 장애 정보를 저장하는 미해제장애 테이블(122a)과 해제된 장애 정보만을 관리 저장하는 해제장애 테이블(122B)을 포함하는 장애 데이터 베이스(122)와, 장애 정보 이외의 이벤트성 정보를 저장 및 관리하는 이벤트 데이터 베이스(123)와, 클라이언트 장애 관리자의 폴링을 위한 대기자 테이블(124)과, 그리고 접속된 클라이언트 리스트를 관리하는 클라이언트 리스트 테이블(121)로 구성된다.

이와 같이 구성된 본 발명에 의한 실시간 장애 제어를 위한 데이터베이스 테이블 모델링 및 이벤트 처리 방법이 적용된 네트워크 장애관리 시스템의 동작을 좀 더 상세히 설명하면 다음과 같다.

시스템 장비(정보 시스템)로부터 장애 이벤트가 발생하면, 이 정보는 서버의 장애관리 프로세서(110)에 전달되고, 상기 장애관리 프로세서(110)는 발생한 장애 정보를 장애 데이터베이스(122)에 저장하게 된다.

즉, 장애관리 프로세서(110)는 장애 정보가 도착하면, 장애 데이터 베이스(122)의 미해제 장애 테이블(122a) 및 해제장애 테이블(122b)에 유효 적절하게 장애 정보를 저장하게 된다. 그리고 클라이언트 리스트 테이블(121)을 검색하여 클라이언트 리스트에 접속된 클라이언트가 존재하는지를 확인한다. 그 확인 결과 클라이언트 리스트에 접속된 클라이언트가 없을 경우에는 대기자 장애 저장을 생략하게 되고, 이와는 달리 클라이언트 리스트에 접속된 클라이언트가 존재하는 경우에는 대기자 테이블(1240에 장애 정보를 저장하게 된다.

다음으로 장애 관리자들(141 ∼ 143)은, 초기 구동시, 자신의 구동 시간정보를 상기 클라이언트 리스트 테이블(121)에 기록하며, 자기 식별자인 클라이언트 고유번호(client_id)를 할당받아 상기 클라이언트 리스트 테이블(121)에 기록하게 된다.

또한, 상기 클라이언트 리스트 테이블(121)에서 자신이 폴링한 마지막 시퀀스 번호(last_seq no)를 읽어온 후 상기 대기자 테이블(124)에 존재하는 장애 시퀀스 번호(seq_no)중 상기 마지막 시퀀스 번호보다 큰 값을 갖는 장애 정보를 폴링하게 된다(select * from listener where seq_no > (select last_seq from client_list where client_id = [my_id]).

또한, 폴링이 끝남과 동시에 상기 클라이언트 리스트 테이블(121)에 폴링 종료시간과 마지막 시퀀스 번호(last_sequence number)를 기록하게 된다.

그리고 접속이 종료되면 상기 클라이언트 리스트 테이블(121)에 존재하는 자신의 정보를 삭제하게 된다.

한편, 데몬 프로세서(130)는, 주기적으로 상기 클라이언트 리스트 테이블(121)을 모니터링하여 그 모니터링하는 시점과 클라이언트의 마지막 폴링 시간(Last Polling Time)을 비교하게 된다. 이때 모니터링한 시점의 시간 - 클라이언트의 마지막 폴링 시간이 클라이언트 폴링 기간 또는 폴링 기간 임계치(Client's Polling Period or Polling Period Threshold Value)보다 클 경우에는 클라이언트 리스트에 존재하는 클라이언트 정보를 삭제하게 된다.

또한, 상기 클라이언트 리스트 테이블(121)에 등록되어 있는 각각의 클라이언트들의 최소 장애 시퀀스 번호(min(last_seq))를 찾아, 상기 대기자 테이블(124)에 저장된 장애 정보와 비교하여, 상기 대기자 테이블(124)에 저장된 장애 정보중 상기 최소 장애 시퀀스 번호보다 작은 장애 시퀀스 번호에 대응하는 장애 정보를 삭제하게 된다.

이상에서 상술한 본 발명은, 데이터베이스 테이블 모델링을 통하여 장애 이벤트를 용이하게 핸들링(Handling)하도록 도모해주는 효과가 있다.

또한, 발생된 장애 정보를 클라이언트에게 폴링(Polling) 방식으로 전달할 수 있는 단일 대기자 테이블과 접속한 클라이언트의 상태를 관리하는 테이블, 그리고 대기자 데이터 관리 및 접속 클라이언트 리스트 관리를 주관하는 폴링 방식의 모니터링 데몬 프로세서(Monitoring Daemon Process) 기법을 이용함으로써, 장애 정보 처리 속도를 향상시킬 수 있는 효과가 있다.

또한, 실시간 장애를 모니터링하는 서버/클라이언트(Server/Client) 구조의 대용량 네트워크 관리 시스템에서 클라이언트 접속 수의 증가에 반비례적으로 급속히 저하되는 장애 관리자들의 실시간 모니터링 기능의 단점을 해결할 수 있는 효과가 있다.

Claims

장애관리 프로세서와 클라이언트 리스트 테이블과 장애 데이터 베이스와 비정상 종료된 클라이언트를 관리하는 데몬 프로세서와 하나의 대기자 테이블 및 복수개의 장애 관리자들을 구비한 네트워크 장애관리 시스템에서의 실시간 장애 제어를 위한 데이터베이스 테이블 모델링 및 이벤트 처리 방법에 있어서,

상기 장애관리 프로세서에서 네트워크 시스템 장비로부터 장애 이벤트가 발생하면 그 발생한 장애 정보를 장애 데이터베이스에 저장하는 단계와;

상기 장애 관리자들은 상기 데이터베이스에 저장된 장애 정보를 장애 시퀀스 번호에 대응하여 폴링하고, 폴링이 종료되면 상기 클라이언트 리스트 테이블에 폴링 관련 정보를 저장하는 단계와;

상기 데몬 프로세서에서 상기 대기자 테이블에 축적되는 일정량의 현재 장애 정보를 상기 클라이언트 리스트 테이블의 판독 장애 시퀀스 번호(Reading Alarm Sequence Number)와 매핑하여 상기 대기자 테이블내의 현재 장애 리스트를 관리하고, 상기 클라이언트 리스트 테이블의 상태를 최종 폴링 시간과 장애 시퀀스 번호로 파악하여 비정상 종료된 클라이언트를 관리하는 단계를 수행하는 것을 특징으로 하는 실시간 장애 제어를 위한 데이터베이스 테이블 모델링 및 이벤트 처리 방법.
제1항에 있어서, 상기 장애관리 프로세서는,

장애 정보가 도착하면, 장애 데이터 베이스의 미해제 장애 테이블 및 해제장애 테이블에 유효 적절하게 장애 정보를 저장하는 단계; 클라이언트 리스트 테이블을 검색하여 클라이언트 리스트에 접속된 클라이언트가 존재하는지를 확인하는 단계; 상기 확인 결과 클라이언트 리스트에 접속된 클라이언트가 없을 경우에는 대기자 테이블에 수행하는 장애 저장을 생략하는 단계를 수행하는 것을 특징으로 하는 실시간 장애 제어를 위한 데이터베이스 테이블 모델링 및 이벤트 처리 방법.
제1항 또는 제2항에 있어서, 상기 장애관리 프로세서는,

상기 클라이언트 리스트에 접속된 클라이언트가 존재하는 경우에는 상기 대기자 테이블에 장애 정보를 저장하는 단계를 더 포함하여 이루어짐을 특징으로 하는 실시간 장애 제어를 위한 데이터베이스 테이블 모델링 및 이벤트 처리 방법.
제1항에 있어서, 상기 장애 관리자들은,

초기 구동시, 자신의 구동 시간정보를 상기 클라이언트 리스트 테이블에 기록하는 단계; 자기 식별자인 클라이언트 고유번호(client_id)를 할당받아 상기 클라이언트 리스트 테이블에 기록하는 단계; 상기 클라이언트 리스트 테이블에서 자신이 폴링한 마지막 시퀀스 번호(last_seq no)를 읽어온 후 상기 대기자 테이블에 존재하는 장애 시퀀스 번호(seq_no)중 상기 마지막 시퀀스 번호보다 큰 값을 갖는장애 정보를 폴링하는 단계를 수행하는 것을 특징으로 하는 실시간 장애 제어를 위한 데이터베이스 테이블 모델링 및 이벤트 처리 방법.
제1항 또는 제4항에 있어서, 상기 장애 관리자들은,

상기 폴링이 끝남과 동시에 상기 클라이언트 리스트 테이블에 폴링 종료시간과 마지막 시퀀스 번호(last_sequence number)를 기록하는 단계; 접속이 종료되면 상기 클라이언트 리스트 테이블에 존재하는 자신의 정보를 삭제하는 단계를 더 포함하여 이루어짐을 특징으로 하는 실시간 장애 제어를 위한 데이터베이스 테이블 모델링 및 이벤트 처리 방법.
제1항에 있어서, 상기 데몬 프로세서는,

주기적으로 상기 클라이언트 리스트 테이블을 모니터링하여 그 모니터링하는 시점과 클라이언트의 마지막 폴링 시간(Last Polling Time)을 비교하는 단계; 상기 비교 결과 모니터링한 시점의 시간과 클라이언트의 마지막 폴링 시간의 차이가 클라이언트 폴링 기간 또는 폴링 기간 임계치(Client's Polling Period or Polling Period Threshold Value)보다 클 경우에는 클라이언트 리스트에 존재하는 클라이언트 정보를 삭제하는 단계를 수행하는 것을 특징으로 하는 실시간 장애 제어를 위한 데이터베이스 테이블 모델링 및 이벤트 처리 방법.
제1항 또는 제6항에 있어서, 상기 데몬 프로세서는,

상기 클라이언트 리스트 테이블에 등록되어 있는 각각의 클라이언트들의 최소 장애 시퀀스 번호(min(last_seq))를 찾아, 상기 대기자 테이블에 저장된 장애 정보와 비교하는 단계; 상기 최소 장애 시퀀스 번호(min(last_seq))와 상기 대기자 테이블에 저장된 장애 정보를 비교한 결과 상기 대기자 테이블에 저장된 장애 정보중 상기 최소 장애 시퀀스 번호보다 작은 장애 시퀀스 번호에 대응하는 장애 정보를 삭제하는 단계를 더 포함하여 이루어짐을 특징으로 하는 실시간 장애 제어를 위한 데이터베이스 테이블 모델링 및 이벤트 처리 방법.