KR20040073800A - 실시간 장애 제어를 위한 데이터베이스 테이블 모델링 및이벤트 처리 방법 - Google Patents

실시간 장애 제어를 위한 데이터베이스 테이블 모델링 및이벤트 처리 방법 Download PDF

Info

Publication number
KR20040073800A
KR20040073800A KR1020030009519A KR20030009519A KR20040073800A KR 20040073800 A KR20040073800 A KR 20040073800A KR 1020030009519 A KR1020030009519 A KR 1020030009519A KR 20030009519 A KR20030009519 A KR 20030009519A KR 20040073800 A KR20040073800 A KR 20040073800A
Authority
KR
South Korea
Prior art keywords
failure
client
fault
information
time
Prior art date
Application number
KR1020030009519A
Other languages
English (en)
Other versions
KR100489690B1 (ko
Inventor
전응선
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Priority to KR10-2003-0009519A priority Critical patent/KR100489690B1/ko
Priority to US10/754,059 priority patent/US7136864B2/en
Priority to CNB200410004851XA priority patent/CN1311387C/zh
Publication of KR20040073800A publication Critical patent/KR20040073800A/ko
Application granted granted Critical
Publication of KR100489690B1 publication Critical patent/KR100489690B1/ko

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/288Entity relationship models
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0695Management of faults, events, alarms or notifications the faulty arrangement being the maintenance, administration or management system
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/953Organization of data
    • Y10S707/959Network
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99941Database schema or data structure
    • Y10S707/99942Manipulating data structure, e.g. compression, compaction, compilation
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99941Database schema or data structure
    • Y10S707/99943Generating database or data structure, e.g. via user interface

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Computer And Data Communications (AREA)
  • Debugging And Monitoring (AREA)

Abstract

본 발명은 네트워크 장비로부터 발생하는 장애(Alarm) 및 연관 이벤트(Event)를 실시간으로 장애 관리자(Alarm Manager)에게 전달하는 경우, 각각의 클라이언트(Client)들과 장애 시퀀스 번호(Alarm Sequence Number)간의 매핑(Mapping)과 이를 뒷받침하는 데이터베이스 모델링(Database Modeling)과 이벤트 관리 기법을 통하여 보다 효율적으로 이벤트를 처리할 수 있도록 한 실시간 장애 제어를 위한 데이터베이스 테이블 모델링 및 이벤트 처리 방법에 관한 것이다.
이러한 본 발명은, 장애관리 프로세서에서 네트워크 시스템 장비로부터 장애 이벤트가 발생하면 그 발생한 장애 정보를 장애 데이터베이스에 저장하고, 장애 관리자들은 상기 데이터베이스에 저장된 장애 정보를 장애 시퀀스 번호에 대응하여 폴링하고, 폴링이 종료되면 상기 클라이언트 리스트 테이블에 폴링 관련 정보를 저장하며, 데몬 프로세서에서 상기 대기자 테이블에 축적되는 일정량의 현재 장애 정보를 상기 클라이언트 리스트 테이블의 판독 장애 시퀀스 번호(Reading Alarm Sequence Number)와 매핑하여 상기 대기자 테이블내의 현재 장애 리스트를 관리하고, 상기 클라이언트 리스트 테이블의 상태를 최종 폴링 시간과 장애 시퀀스 번호로 파악하여 비정상 종료된 클라이언트를 관리하게 된다.

Description

실시간 장애 제어를 위한 데이터베이스 테이블 모델링 및 이벤트 처리 방법{Method for procesing event and controlling real error and modeling database table}
본 발명은 실시간 장애 제어를 위한 데이터베이스 테이블 모델링 및 이벤트 처리 방법에 관한 것으로, 특히 네트워크 장비로부터 발생하는 장애(Alarm) 및 연관 이벤트(Event)를 실시간으로 장애 관리자(Alarm Manager)에게 전달하는 경우, 각각의 클라이언트(Client)들과 장애 시퀀스 번호(Alarm Sequence Number)간의 매핑(Mapping)과 이를 뒷받침하는 데이터베이스 모델링(Database Modeling)과 이벤트 관리 기법을 통하여 보다 효율적으로 이벤트를 처리할 수 있도록 한 실시간 장애 제어를 위한 데이터베이스 테이블 모델링 및 이벤트 처리 방법에 관한 것이다.
일반적으로, 다수개의 시스템들이 연결된 네트웍을 관리하기 위해서는 네트워크 관리 시스템(Network Management System)을 사용하게 된다. 따라서 네트워크 관리 시스템에서는 네트워크를 이루는 각 시스템들과 직접 또는 간접적으로 연결되어 각 시스템의 상태정보를 수신하여 관리하게 된다.
또한 이러한 상태정보는 네트워크 관리 시스템에 연결된 각 운용자 컴퓨터에서 확인할 수 있다.
네트워크 관리 시스템에 연결되는 시스템들은 교환 시스템 및 전송 시스템 등이 있다. 네트워크 관리 시스템은 교환 시스템 및 전송 시스템과 연결되어 각 시스템으로부터 장애 데이터 및 유지보수를 위한 데이터를 수집하며 데이터베이스로 관리하게 된다.
네트워크 관리 시스템은, 통신 네트워크의 상태를 항상 감시하여 최적의 상태를 유지하며, 네트워크의 상태, 장애, 트래픽 데이터 등을 수집 및 축적한다. 특히 네트워크 장애관리 시스템은 네트워크에서 발생된 복수개의 장애정보를 저장하여 네트워크 장애관리 시스템에 연동된 복수개의 장애 관리자 컴퓨터에게 원하는 장애정보를 제공하게 된다.
도 1은 종래의 네트워크 장애관리 시스템을 나타낸 블록도이다.
도 1을 참조하면, 장애관리를 위한 호스트 컴퓨터(서버)는 네트워크 관리를 위한 워크 스테이션으로서, 장애관리 프로세서(10)와, 브로드캐스팅 리스트 테이블(20)과, 장애 데이터 베이스(30)와, 이벤트 데이터 베이스(40)와, 데몬 프로세서(50)와, 복수개의 대기자 테이블들(61 ∼ 63)과, 복수개의 장애 관리자들(71 ∼ 73)을 포함한다.
네트워크에서 발생되는 각종 상태 정보는 컴퓨터를 기반으로 하는 정보 시스템(Management Information System)(도면에는 도시되지 않음)에 의하여 취합된다. 정보 시스템은 컴퓨터 하드웨어(hardware), 소프트웨어(software), 데이터(Data), 절차(procedures), 그리고 사람(people)을 구성요소로 하는 시스템으로서 네트워크에서 발생되는 데이터를 처리하여 다양한 정보를 생산한다.
정보 시스템에 의하여 통지된 장애, 이벤트 정보는 장애관리 프로세서(10)에 전달된다. 장애관리 프로세서(10)는 데몬(daemon) 응용 프로그램인 장애관리 응용 프로그램에 의하여 동작한다. 알려진 바와 같이 데몬이란 시스템의 운영에 관련된 작업을 후선(background)상태로 동작하면서 실행하는 상주 프로그램을 말한다. 즉 장애관리 데몬 응용 프로그램은 후선 상태에 있다가 처리해야 할 작업 조건이 발생하면 자동으로 기동하여 필요한 작업을 실행한다.
다중 분산 테이블 구조를 가지는 장애 데이터베이스(30)는 미해제장애 테이블(uncleared alarm table)(31)과 해제장애 테이블(cleared alarm table)(32)을 포함한다. 장애관리 프로세서(10)는 네트워크에서 발생된 후 해제되지 않은 장애정보를 미해제장애 테이블(31)에 저장하고, 장애가 해제되면 해당하는 장애정보를 미해제장애 테이블(31)에서 삭제한 뒤 해제장애 테이블(32)로 이동하여 저장한다.
그리고 발생된 이벤트는 이벤트 데이터베이스(40)에 저장한다.
장애관리 서버는 복수명의 운영자들에 의한 분산 장애 관리를 지원하기 위하여 워크 스테이션이나 개인 컴퓨터 또는 장애관리 서버에서 동작하는 응용 프로그램 등으로 구현될 수 있는 복수개의 장애 관리자들(71 ∼ 73)과 연결되는 데, 만약 복수개의 장애 관리자들(71 ∼ 73)이 미해제장애 테이블(31)로부터 장애정보를 독출하는 시점이 동기되지 않는다면 먼저 독출하는 일부 장애 관리자들은 이미 해제된 장애정보를 독출하게 되고 나중에 독출하는 나머지 장애 관리자들은 해제되지 않은 장애정보만을 독출하게 될 수 있다. 이러한 경우 장애 관리자들이 가지는 장애정보들이 서로 일치하지 않게 된다.
이를 방지하기 위하여 복수개의 장애 관리자들(71 ∼ 73)은 각각 고유한 장애정보 인식공간인 대기자 테이블(61 ∼ 63)을 가진다. 대기자 테이블들(61 ∼ 63)의 이름들은 브로드캐스팅 리스트 테이블(20)에 등록되며, 네트워크에서 발생된 장애정보는 미해제장애 테이블(31)에 저장되는 동시에 복수개의 장애 관리자들(71 ∼ 73)에 각각 대응하는 복수개의 대기자 테이블들(61 ∼ 63)에 저장된다. 복수개의장애 관리자들(71 ∼ 73)은 각각 해당하는 대기자 테이블(61 ∼ 63)로부터 장애정보를 독출한다.
즉, 종래의 장애 관리자들은 실시간 이벤트를 처리하기 위하여 클라이언트가 장애 관리자를 구동하게 되면 서버(Server)에 의해 생성된 데이터베이스내의 대기자(Listener)라는 테이블을 할당받게 된다. 대기자 테이블은 구동된 장애 관리자들의 개수만큼 생성되게 되며, 이는 각각의 장애 관리자의 독립적인 작업수행 결과의 전달을 위함이다.
도 2는 종래의 네트워크 장애관리 시스템에서 장애 관리 동작을 나타낸 흐름도이다.
이에 도시된 바와 같이, 단계 81에서와 같이 장애 데이터가 장애관리 프로세서(10)로 입력되면, 장애관리 프로세서(10)는 해당 장애에 대하여 정해진 처리 프로세스를 수행하게 된다. 장애 처리 프로세스가 시작되면 단계 82에서 발생된 장애 자체의 정보를 장애 관리자에게 전달하기 위하여 브로드캐스팅 리스트 테이블에 등록되어 관리되고 있는 모든 대기자(Listener) 테이블을 조회하고, 단계 83에서 대기자 테이블에 장애 정보를 입력 저장하게 된다.
데몬 프로세서(50)는 단계 84에서 최종 검색 시간을 조회하게 되고, 단계 85에서 경과 시간을 예정치와 대비하게 된다. 단계 86에서는 대기자 테이블을 드롭(Drop)시키게 되고, 단계 87에서는 대기자 테이블에 기록된 정보를 삭제하게 되고, 단계 88에서는 다음 장애 정보가 발생할 때까지 대기하게 된다.
아울러 장애 관리자들(71)은 단계 91에서 장애 관리를 시작하고, 단계 92에서 대기자 테이블을 생성한다. 그리고 단계 93에서 폴링(Polling) 방식을 통하여 주기적으로 자신만의 대기자 테이블에 새로이 저장되어진 정보를 읽은 후, 대기자 테이블로부터 읽은 데이터를 실시간 장애 표시창에 디스플레이한다. 아울러 단계 94에서 다음 폴링 작업을 위하여 대기자 테이블에 있는 모든 실시간 데이터를 삭제하여 초기화한다. 단계 95에서는 최종 검색시간을 업데이트하고, 단계 96에서는 다음 폴링 기간 동안을 대기하게 된다. 단계 97에서 사용자가 장애 관리 접속을 종료하게 되면 단계 98에서 대기자 테이블을 드롭시키고, 단계 99에서 장애 관리를 종료하게 된다.
주지한 바와 같이, 네트워크의 크기와 관리 범위 영역의 기하급수적 팽창은 대용량 네트워크를 관리할 수 있는 네트워크 관리 시스템(NMS : Network Management System)을 요구하게 되며, 이 네트워크 관리 시스템을 운용하기 위해서는 대용량 처리가 가능한 서버와 무수히 많은 클라이언트들의 연결 구조가 예상되어진다.
그러나 종래의 장애 관리자의 실시간 장애 처리 방식은, 상대적으로 네트워크 크기가 작은 시스템을 대상으로 개발된 것이므로, 서버에서는 장애들을 처리하여 클라이언트에 전달하기 위하여 구동된 장애 관리자의 개수만큼 생성된 대기자 테이블에 쓰기 작업을 수행하여야 한다. 즉, 하나의 이벤트(장애 이벤트)를 처리하는 과정에 이벤트 개수 x 대기자 테이블 개수만큼의 불필요한 쓰기 작업이 수행되어진다.
따라서 종래의 장애 관리 시스템은, 접속한 클라이언트의 장애 관리자수가증가할수록 처리하여야 할 대기자 테이블의 수가 증가하게 되므로, 장애 처리 속도가 감소하게 되는 문제점을 발생하였다.
즉, 종래의 장애 처리 구조는 실시간(Real Time)을 반영하여야 하는 대용량 네트워크 관리 시스템의 장애 처리 성능 기준을 만족시키지 못하는 단점을 유발하였다.
이에 본 발명은 상기와 같은 종래 네트워크 장애관리 시스템에서 장애 처리시 발생하는 제반 문제점을 해결하기 위해서 제안된 것으로서,
본 발명의 목적은, 네트워크 장비로부터 발생하는 장애(Alarm) 및 연관 이벤트(Event)를 실시간으로 장애 관리자(Alarm Manager)에게 전달하는 경우, 각각의 클라이언트(Client)들과 장애 시퀀스 번호(Alarm Sequence Number)간의 매핑(Mapping)과 이를 뒷받침하는 데이터베이스 모델링(Database Modeling)과 이벤트 관리 기법을 통하여 보다 효율적으로 이벤트를 처리할 수 있도록 한 실시간 장애 제어를 위한 데이터베이스 테이블 모델링 및 이벤트 처리 방법을 제공하는 데 있다.
도 1은 종래의 네트워크 장애관리 시스템을 나타낸 블록도이고,
도 2는 종래의 네트워크 장애관리 시스템에서 장애 관리 동작을 나타낸 흐름도이고,
도 3은 본 발명에 의한 실시간 장애 제어를 위한 데이터베이스 테이블 모델링 및 이벤트 처리 방법이 적용된 네트워크 장애관리 시스템을 나타낸 블록도이다.
<도면의 주요 부분에 대한 부호의 설명>
110 : 장애관리 프로세서 121 : 클라이언트 리스트 테이블
122 : 장애 데이터 베이스 123 : 이벤트 데이터 베이스
124 : 대기자 테이블 130 : 데몬 프로세서
141 ∼ 143 : 장애 관리자
상기와 같은 목적을 달성하기 위한 본 발명에 의한 "실시간 장애 제어를 위한 데이터베이스 테이블 모델링 및 이벤트 처리 방법"은,
장애관리 프로세서와 클라이언트 리스트 테이블과 장애 데이터 베이스와 비정상 종료된 클라이언트를 관리하는 데몬 프로세서와 하나의 대기자 테이블 및 복수개의 장애 관리자들을 구비한 네트워크 장애관리 시스템에서의 실시간 장애 제어를 위한 데이터베이스 테이블 모델링 및 이벤트 처리 방법에 있어서,
상기 장애관리 프로세서에서 네트워크 시스템 장비로부터 장애 이벤트가 발생하면 그 발생한 장애 정보를 장애 데이터베이스에 저장하는 단계와;
상기 장애 관리자들은 상기 데이터베이스에 저장된 장애 정보를 장애 시퀀스 번호에 대응하여 폴링하고, 폴링이 종료되면 상기 클라이언트 리스트 테이블에 폴링 관련 정보를 저장하는 단계와;
상기 데몬 프로세서에서 상기 대기자 테이블에 축적되는 일정량의 현재 장애 정보를 상기 클라이언트 리스트 테이블의 판독 장애 시퀀스 번호(Reading Alarm Sequence Number)와 매핑하여 상기 대기자 테이블내의 현재 장애 리스트를 관리하고, 상기 클라이언트 리스트 테이블의 상태를 최종 폴링 시간과 장애 시퀀스 번호로 파악하여 비정상 종료된 클라이언트를 관리하는 단계를 수행함을 특징으로 한다.
상기에서 장애관리 프로세서는, 장애 정보가 도착하면, 장애 데이터 베이스의 미해제 장애 테이블 및 해제장애 테이블에 유효 적절하게 장애 정보를 저장하는 단계; 클라이언트 리스트 테이블을 검색하여 클라이언트 리스트에 접속된 클라이언트가 존재하는지를 확인하는 단계; 상기 확인 결과 클라이언트 리스트에 접속된 클라이언트가 없을 경우에는 대기자 테이블에 수행하는 장애 저장을 생략하고, 이와는 달리 상기 클라이언트 리스트에 접속된 클라이언트가 존재하는 경우에는 상기 대기자 테이블에 장애 정보를 저장하는 단계를 수행하는 것을 특징으로 한다.
또한 상기 장애 관리자들은, 초기 구동시, 자신의 구동 시간정보를 상기 클라이언트 리스트 테이블에 기록하는 단계; 자기 식별자인 클라이언트 고유번호(client_id)를 할당받아 상기 클라이언트 리스트 테이블에 기록하는 단계; 상기 클라이언트 리스트 테이블에서 자신이 폴링한 마지막 시퀀스 번호(last_seq no)를 읽어온 후 상기 대기자 테이블에 존재하는 장애 시퀀스 번호(seq_no)중 상기 마지막 시퀀스 번호보다 큰 값을 갖는 장애 정보를 폴링하는 단계; 상기 폴링이 끝남과 동시에 상기 클라이언트 리스트 테이블에 폴링 종료시간과 마지막 시퀀스 번호(last_sequence number)를 기록하는 단계; 접속이 종료되면 상기 클라이언트 리스트 테이블에 존재하는 자신의 정보를 삭제하는 단계를 수행하는 것을 특징으로 한다.
또한 상기 데몬 프로세서는, 주기적으로 상기 클라이언트 리스트 테이블을 모니터링하여 그 모니터링하는 시점과 클라이언트의 마지막 폴링 시간(Last Polling Time)을 비교하는 단계; 상기 비교 결과 모니터링한 시점의 시간과 클라이언트의 마지막 폴링 시간의 차이가 클라이언트 폴링 기간 또는 폴링 기간 임계치(Client's Polling Period or Polling Period Threshold Value)보다 클 경우에는 클라이언트 리스트에 존재하는 클라이언트 정보를 삭제하는 단계; 상기 클라이언트 리스트 테이블에 등록되어 있는 각각의 클라이언트들의 최소 장애 시퀀스 번호(min(last_seq))를 찾아, 상기 대기자 테이블에 저장된 장애 정보와 비교하는단계; 상기 최소 장애 시퀀스 번호(min(last_seq))와 상기 대기자 테이블에 저장된 장애 정보를 비교한 결과 상기 대기자 테이블에 저장된 장애 정보중 상기 최소 장애 시퀀스 번호보다 작은 장애 시퀀스 번호에 대응하는 장애 정보를 삭제하는 단계를 수행하는 것을 특징으로 한다.
이하 상기와 같은 기술적 사상에 따른 본 발명의 바람직한 실시 예를 첨부한 도면에 의거 상세히 설명하면 다음과 같다.
본 발명은, 대용량 네트워크 시스템을 관리할 경우 대량의 장애 이벤트 발생을 처리하기 위해서, 다중 대기자 테이블 구조로부터 단일 대기자 테이블 구조로 개선하고, 네트워크의 부하와 데이터베이스 트랜잭션 입/출력(Transaction I/O)처리를 최소화하여 기존 관리장비 대상 장애 처리 속도를 향상시키고, 대용량 네트워크 관리 시스템에서 요구되는 실시간 장애 처리 속도를 향상시키고자 한 것이다.
도 3은 본 발명에 의한 실시간 장애 제어를 위한 데이터베이스 테이블 모델링 및 이벤트 처리 방법이 적용된 네트워크 장애관리 시스템을 나타낸 블록도이다.
이에 도시된 바와 같이, 장애관리 프로세서(110)와, 장애 정보의 저장 및 처리를 위한 데이터 베이스(121 ∼ 124)와, 대기자 테이블에 축적되는 일정량의 현재 장애 정보를 클라이언트 리스트의 판독 장애 시퀀스 번호(Reading Alarm Sequence Number)와 매핑(Mapping)하여 대기자 테이블내의 현재 장애 리스트를 관리하고, 클라이언트 리스트의 상태를 최종 폴링(Polling) 시간과 장애 시퀀스 번호(Sequence Number)로 파악하여 비정상 종료된 클라이언트를 관리하는 대기자 서버 데몬 프로세서인 데몬 프로세서(130)와, 복수개의 장애 관리자들(141 ∼ 143)로 구성된다.
여기서 데이터 베이스(121 ∼ 124)는, 현재까지 해제되지 않은 장애 정보를 저장하는 미해제장애 테이블(122a)과 해제된 장애 정보만을 관리 저장하는 해제장애 테이블(122B)을 포함하는 장애 데이터 베이스(122)와, 장애 정보 이외의 이벤트성 정보를 저장 및 관리하는 이벤트 데이터 베이스(123)와, 클라이언트 장애 관리자의 폴링을 위한 대기자 테이블(124)과, 그리고 접속된 클라이언트 리스트를 관리하는 클라이언트 리스트 테이블(121)로 구성된다.
이와 같이 구성된 본 발명에 의한 실시간 장애 제어를 위한 데이터베이스 테이블 모델링 및 이벤트 처리 방법이 적용된 네트워크 장애관리 시스템의 동작을 좀 더 상세히 설명하면 다음과 같다.
시스템 장비(정보 시스템)로부터 장애 이벤트가 발생하면, 이 정보는 서버의 장애관리 프로세서(110)에 전달되고, 상기 장애관리 프로세서(110)는 발생한 장애 정보를 장애 데이터베이스(122)에 저장하게 된다.
즉, 장애관리 프로세서(110)는 장애 정보가 도착하면, 장애 데이터 베이스(122)의 미해제 장애 테이블(122a) 및 해제장애 테이블(122b)에 유효 적절하게 장애 정보를 저장하게 된다. 그리고 클라이언트 리스트 테이블(121)을 검색하여 클라이언트 리스트에 접속된 클라이언트가 존재하는지를 확인한다. 그 확인 결과 클라이언트 리스트에 접속된 클라이언트가 없을 경우에는 대기자 장애 저장을 생략하게 되고, 이와는 달리 클라이언트 리스트에 접속된 클라이언트가 존재하는 경우에는 대기자 테이블(1240에 장애 정보를 저장하게 된다.
다음으로 장애 관리자들(141 ∼ 143)은, 초기 구동시, 자신의 구동 시간정보를 상기 클라이언트 리스트 테이블(121)에 기록하며, 자기 식별자인 클라이언트 고유번호(client_id)를 할당받아 상기 클라이언트 리스트 테이블(121)에 기록하게 된다.
또한, 상기 클라이언트 리스트 테이블(121)에서 자신이 폴링한 마지막 시퀀스 번호(last_seq no)를 읽어온 후 상기 대기자 테이블(124)에 존재하는 장애 시퀀스 번호(seq_no)중 상기 마지막 시퀀스 번호보다 큰 값을 갖는 장애 정보를 폴링하게 된다(select * from listener where seq_no > (select last_seq from client_list where client_id = [my_id]).
또한, 폴링이 끝남과 동시에 상기 클라이언트 리스트 테이블(121)에 폴링 종료시간과 마지막 시퀀스 번호(last_sequence number)를 기록하게 된다.
그리고 접속이 종료되면 상기 클라이언트 리스트 테이블(121)에 존재하는 자신의 정보를 삭제하게 된다.
한편, 데몬 프로세서(130)는, 주기적으로 상기 클라이언트 리스트 테이블(121)을 모니터링하여 그 모니터링하는 시점과 클라이언트의 마지막 폴링 시간(Last Polling Time)을 비교하게 된다. 이때 모니터링한 시점의 시간 - 클라이언트의 마지막 폴링 시간이 클라이언트 폴링 기간 또는 폴링 기간 임계치(Client's Polling Period or Polling Period Threshold Value)보다 클 경우에는 클라이언트 리스트에 존재하는 클라이언트 정보를 삭제하게 된다.
또한, 상기 클라이언트 리스트 테이블(121)에 등록되어 있는 각각의 클라이언트들의 최소 장애 시퀀스 번호(min(last_seq))를 찾아, 상기 대기자 테이블(124)에 저장된 장애 정보와 비교하여, 상기 대기자 테이블(124)에 저장된 장애 정보중 상기 최소 장애 시퀀스 번호보다 작은 장애 시퀀스 번호에 대응하는 장애 정보를 삭제하게 된다.
이상에서 상술한 본 발명은, 데이터베이스 테이블 모델링을 통하여 장애 이벤트를 용이하게 핸들링(Handling)하도록 도모해주는 효과가 있다.
또한, 발생된 장애 정보를 클라이언트에게 폴링(Polling) 방식으로 전달할 수 있는 단일 대기자 테이블과 접속한 클라이언트의 상태를 관리하는 테이블, 그리고 대기자 데이터 관리 및 접속 클라이언트 리스트 관리를 주관하는 폴링 방식의 모니터링 데몬 프로세서(Monitoring Daemon Process) 기법을 이용함으로써, 장애 정보 처리 속도를 향상시킬 수 있는 효과가 있다.
또한, 실시간 장애를 모니터링하는 서버/클라이언트(Server/Client) 구조의 대용량 네트워크 관리 시스템에서 클라이언트 접속 수의 증가에 반비례적으로 급속히 저하되는 장애 관리자들의 실시간 모니터링 기능의 단점을 해결할 수 있는 효과가 있다.

Claims (7)

  1. 장애관리 프로세서와 클라이언트 리스트 테이블과 장애 데이터 베이스와 비정상 종료된 클라이언트를 관리하는 데몬 프로세서와 하나의 대기자 테이블 및 복수개의 장애 관리자들을 구비한 네트워크 장애관리 시스템에서의 실시간 장애 제어를 위한 데이터베이스 테이블 모델링 및 이벤트 처리 방법에 있어서,
    상기 장애관리 프로세서에서 네트워크 시스템 장비로부터 장애 이벤트가 발생하면 그 발생한 장애 정보를 장애 데이터베이스에 저장하는 단계와;
    상기 장애 관리자들은 상기 데이터베이스에 저장된 장애 정보를 장애 시퀀스 번호에 대응하여 폴링하고, 폴링이 종료되면 상기 클라이언트 리스트 테이블에 폴링 관련 정보를 저장하는 단계와;
    상기 데몬 프로세서에서 상기 대기자 테이블에 축적되는 일정량의 현재 장애 정보를 상기 클라이언트 리스트 테이블의 판독 장애 시퀀스 번호(Reading Alarm Sequence Number)와 매핑하여 상기 대기자 테이블내의 현재 장애 리스트를 관리하고, 상기 클라이언트 리스트 테이블의 상태를 최종 폴링 시간과 장애 시퀀스 번호로 파악하여 비정상 종료된 클라이언트를 관리하는 단계를 수행하는 것을 특징으로 하는 실시간 장애 제어를 위한 데이터베이스 테이블 모델링 및 이벤트 처리 방법.
  2. 제1항에 있어서, 상기 장애관리 프로세서는,
    장애 정보가 도착하면, 장애 데이터 베이스의 미해제 장애 테이블 및 해제장애 테이블에 유효 적절하게 장애 정보를 저장하는 단계; 클라이언트 리스트 테이블을 검색하여 클라이언트 리스트에 접속된 클라이언트가 존재하는지를 확인하는 단계; 상기 확인 결과 클라이언트 리스트에 접속된 클라이언트가 없을 경우에는 대기자 테이블에 수행하는 장애 저장을 생략하는 단계를 수행하는 것을 특징으로 하는 실시간 장애 제어를 위한 데이터베이스 테이블 모델링 및 이벤트 처리 방법.
  3. 제1항 또는 제2항에 있어서, 상기 장애관리 프로세서는,
    상기 클라이언트 리스트에 접속된 클라이언트가 존재하는 경우에는 상기 대기자 테이블에 장애 정보를 저장하는 단계를 더 포함하여 이루어짐을 특징으로 하는 실시간 장애 제어를 위한 데이터베이스 테이블 모델링 및 이벤트 처리 방법.
  4. 제1항에 있어서, 상기 장애 관리자들은,
    초기 구동시, 자신의 구동 시간정보를 상기 클라이언트 리스트 테이블에 기록하는 단계; 자기 식별자인 클라이언트 고유번호(client_id)를 할당받아 상기 클라이언트 리스트 테이블에 기록하는 단계; 상기 클라이언트 리스트 테이블에서 자신이 폴링한 마지막 시퀀스 번호(last_seq no)를 읽어온 후 상기 대기자 테이블에 존재하는 장애 시퀀스 번호(seq_no)중 상기 마지막 시퀀스 번호보다 큰 값을 갖는장애 정보를 폴링하는 단계를 수행하는 것을 특징으로 하는 실시간 장애 제어를 위한 데이터베이스 테이블 모델링 및 이벤트 처리 방법.
  5. 제1항 또는 제4항에 있어서, 상기 장애 관리자들은,
    상기 폴링이 끝남과 동시에 상기 클라이언트 리스트 테이블에 폴링 종료시간과 마지막 시퀀스 번호(last_sequence number)를 기록하는 단계; 접속이 종료되면 상기 클라이언트 리스트 테이블에 존재하는 자신의 정보를 삭제하는 단계를 더 포함하여 이루어짐을 특징으로 하는 실시간 장애 제어를 위한 데이터베이스 테이블 모델링 및 이벤트 처리 방법.
  6. 제1항에 있어서, 상기 데몬 프로세서는,
    주기적으로 상기 클라이언트 리스트 테이블을 모니터링하여 그 모니터링하는 시점과 클라이언트의 마지막 폴링 시간(Last Polling Time)을 비교하는 단계; 상기 비교 결과 모니터링한 시점의 시간과 클라이언트의 마지막 폴링 시간의 차이가 클라이언트 폴링 기간 또는 폴링 기간 임계치(Client's Polling Period or Polling Period Threshold Value)보다 클 경우에는 클라이언트 리스트에 존재하는 클라이언트 정보를 삭제하는 단계를 수행하는 것을 특징으로 하는 실시간 장애 제어를 위한 데이터베이스 테이블 모델링 및 이벤트 처리 방법.
  7. 제1항 또는 제6항에 있어서, 상기 데몬 프로세서는,
    상기 클라이언트 리스트 테이블에 등록되어 있는 각각의 클라이언트들의 최소 장애 시퀀스 번호(min(last_seq))를 찾아, 상기 대기자 테이블에 저장된 장애 정보와 비교하는 단계; 상기 최소 장애 시퀀스 번호(min(last_seq))와 상기 대기자 테이블에 저장된 장애 정보를 비교한 결과 상기 대기자 테이블에 저장된 장애 정보중 상기 최소 장애 시퀀스 번호보다 작은 장애 시퀀스 번호에 대응하는 장애 정보를 삭제하는 단계를 더 포함하여 이루어짐을 특징으로 하는 실시간 장애 제어를 위한 데이터베이스 테이블 모델링 및 이벤트 처리 방법.
KR10-2003-0009519A 2003-02-14 2003-02-14 실시간 장애 제어를 위한 데이터베이스 테이블 모델링 및이벤트 처리 방법 KR100489690B1 (ko)

Priority Applications (3)

Application Number Priority Date Filing Date Title
KR10-2003-0009519A KR100489690B1 (ko) 2003-02-14 2003-02-14 실시간 장애 제어를 위한 데이터베이스 테이블 모델링 및이벤트 처리 방법
US10/754,059 US7136864B2 (en) 2003-02-14 2004-01-09 Database table modeling and event handling method for real time alarm management
CNB200410004851XA CN1311387C (zh) 2003-02-14 2004-02-06 针对实时告警管理的数据库表建模及事件处理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR10-2003-0009519A KR100489690B1 (ko) 2003-02-14 2003-02-14 실시간 장애 제어를 위한 데이터베이스 테이블 모델링 및이벤트 처리 방법

Publications (2)

Publication Number Publication Date
KR20040073800A true KR20040073800A (ko) 2004-08-21
KR100489690B1 KR100489690B1 (ko) 2005-05-17

Family

ID=32844843

Family Applications (1)

Application Number Title Priority Date Filing Date
KR10-2003-0009519A KR100489690B1 (ko) 2003-02-14 2003-02-14 실시간 장애 제어를 위한 데이터베이스 테이블 모델링 및이벤트 처리 방법

Country Status (3)

Country Link
US (1) US7136864B2 (ko)
KR (1) KR100489690B1 (ko)
CN (1) CN1311387C (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101043165B1 (ko) * 2004-08-26 2011-06-20 주식회사 케이티 데이터베이스를 큐 기능으로 활용하는 장애/복구 통보방법
WO2021034114A1 (ko) * 2019-08-21 2021-02-25 주식회사 이노지에스코리아 장애대응 에지서버 그루핑을 이용한 장애유발 클라이언트 검출 방법 및 시스템

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7337370B2 (en) * 2004-05-28 2008-02-26 International Business Machines Corporation System and method for capturing significant events at web portlets
CN100452716C (zh) * 2004-08-27 2009-01-14 华为技术有限公司 集中网络管理系统告警处理方法及集中网络管理系统
CN100421384C (zh) * 2005-04-08 2008-09-24 华为技术有限公司 屏蔽处理瞬断通知事件的方法
CN100417087C (zh) * 2005-08-23 2008-09-03 中兴通讯股份有限公司 一种snmp协议网管系统的告警管理方法
EP2097794B2 (en) 2006-11-03 2017-03-08 Air Products and Chemicals, Inc. System and method for process monitoring
KR101457851B1 (ko) * 2011-09-21 2014-11-12 후아웨이 테크놀러지 컴퍼니 리미티드 다중-모드 기지국 경보 방법, 다중-모드 기지국 및 통신 시스템
CN102420861B (zh) * 2011-11-29 2015-04-29 广州杰赛科技股份有限公司 服务器的消息监听方法、装置及系统
US8782218B1 (en) * 2011-12-22 2014-07-15 Emc Corporation Activity stream based alert processing for information technology infrastructure
KR101416280B1 (ko) 2013-01-15 2014-07-08 주식회사 엘지씨엔에스 이벤트 처리 시스템 및 방법
US9379951B2 (en) 2014-01-10 2016-06-28 Instep Software, Llc Method and apparatus for detection of anomalies in integrated parameter systems
CN106470307A (zh) * 2015-08-18 2017-03-01 泰科电子(上海)有限公司 可编程机器视觉装置
CN105302703B (zh) * 2015-09-21 2018-01-30 上海斐讯数据通信技术有限公司 一种olt设备的告警数据管理的方法
CN106559247B (zh) * 2015-09-30 2020-03-27 中兴通讯股份有限公司 网络管理系统中的告警管理方法及网络管理系统
CN106598978A (zh) * 2015-10-16 2017-04-26 中兴通讯股份有限公司 一种网元历史告警的查询方法及装置
DE102017006677A1 (de) * 2017-07-14 2019-01-17 Drägerwerk AG & Co. KGaA Vorrichtungen, Verfahren und Computerprogramme für einen Alarmserver, eine Alarmquelle und einen Alarmgeber, Alarmsystem
CN107491940A (zh) * 2017-08-24 2017-12-19 安徽工大信息技术有限公司 一种针对养殖场饲喂对象的无纸化数据采集系统和方法
CN110071837B (zh) * 2019-04-28 2022-02-01 烽火通信科技股份有限公司 一种接入网的告警处理方法及系统

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5204941A (en) * 1987-09-30 1993-04-20 Sharp Kabushiki Kaisha Element checking system for use in forward inference system
US6115393A (en) 1991-04-12 2000-09-05 Concord Communications, Inc. Network monitoring
US5777549A (en) 1995-03-29 1998-07-07 Cabletron Systems, Inc. Method and apparatus for policy-based alarm notification in a distributed network management environment
US6408386B1 (en) 1995-06-07 2002-06-18 Intel Corporation Method and apparatus for providing event handling functionality in a computer system
US6181776B1 (en) 1997-12-24 2001-01-30 Nortel Networks Limited Network management of automatic call distributor resources
US6609128B1 (en) 1999-07-30 2003-08-19 Accenture Llp Codes table framework design in an E-commerce architecture
US6697970B1 (en) * 2000-07-14 2004-02-24 Nortel Networks Limited Generic fault management method and system
KR100346185B1 (ko) * 2000-12-01 2002-07-26 삼성전자 주식회사 네트워크 관리 시스템의 장애관리 시스템 및 방법
CN1194316C (zh) * 2001-06-28 2005-03-23 华为技术有限公司 一种计算机网络远程网络监控方法
CN1363907A (zh) * 2001-09-25 2002-08-14 郑肖惺 分布式通用模拟量及数字量数据采集与控制网络系统

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101043165B1 (ko) * 2004-08-26 2011-06-20 주식회사 케이티 데이터베이스를 큐 기능으로 활용하는 장애/복구 통보방법
WO2021034114A1 (ko) * 2019-08-21 2021-02-25 주식회사 이노지에스코리아 장애대응 에지서버 그루핑을 이용한 장애유발 클라이언트 검출 방법 및 시스템
US11909577B2 (en) 2019-08-21 2024-02-20 Innogs Korea Corp. Method and system for detecting failure-causing client with failure handling edge server grouping

Also Published As

Publication number Publication date
US20040162810A1 (en) 2004-08-19
US7136864B2 (en) 2006-11-14
CN1311387C (zh) 2007-04-18
CN1521663A (zh) 2004-08-18
KR100489690B1 (ko) 2005-05-17

Similar Documents

Publication Publication Date Title
KR100489690B1 (ko) 실시간 장애 제어를 위한 데이터베이스 테이블 모델링 및이벤트 처리 방법
KR100346185B1 (ko) 네트워크 관리 시스템의 장애관리 시스템 및 방법
US7441024B2 (en) Method and apparatus for applying policies
JP4760491B2 (ja) イベント処理システム、イベント処理方法、イベント処理装置、及び、イベント処理プログラム
US7328213B2 (en) Transaction processing method, transaction control apparatus and program thereof
US5758071A (en) Method and system for tracking the configuration of a computer coupled to a computer network
JP4294353B2 (ja) ジョブ管理機能を有するストレージ系障害管理方法及び装置
US7610511B2 (en) Journal migration method and data recovery management method
US6839815B2 (en) System and method for storage on demand service in a global SAN environment
CN101137984B (zh) 用于分布加载数据库的系统、方法和软件
US20030097370A1 (en) Database load distribution processing method and recording medium storing a database load distribution processing program
US20050267963A1 (en) Method for managing I/O interface modules in a computer system
CN100527081C (zh) 实现数据升级的计算机处理系统和数据升级方法
CN106506490B (zh) 一种分布式计算控制方法以及分布式计算系统
JP2007102452A (ja) システム管理プログラムおよびシステム管理方法
CN116501783A (zh) 一种分布式数据库数据导入方法及系统
US20070180452A1 (en) Load distributing system and method
CN113254536A (zh) 数据库事务处理方法、系统、电子设备及存储介质
JP2004527820A (ja) コンピュータ予約システムにおけるデータの処理及びアクセス方法、並びにその方法を実施するためのシステム
JPH08221433A (ja) 情報検索システム
US7143082B2 (en) Distributed-processing database-management system
US20050234988A1 (en) Message-based method and system for managing a storage area network
JP2004178336A (ja) 運用管理システム、管理計算機、監視対象計算機、運用管理方法及びプログラム
KR20070010156A (ko) 데이터 저장 시스템, 컬러 및 컬러 경계 유지 방법 및 컴퓨터 판독 가능한 프로그램을 기록한 기록 매체
US8473592B2 (en) Storage system and management method in storage system

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20130429

Year of fee payment: 9

FPAY Annual fee payment

Payment date: 20140429

Year of fee payment: 10

FPAY Annual fee payment

Payment date: 20160121

Year of fee payment: 11

R401 Registration of restoration
FPAY Annual fee payment

Payment date: 20160504

Year of fee payment: 12