KR100443914B1 - 장애 정보 제공 시스템 및 그 방법 - Google Patents

장애 정보 제공 시스템 및 그 방법 Download PDF

Info

Publication number
KR100443914B1
KR100443914B1 KR10-2002-0011670A KR20020011670A KR100443914B1 KR 100443914 B1 KR100443914 B1 KR 100443914B1 KR 20020011670 A KR20020011670 A KR 20020011670A KR 100443914 B1 KR100443914 B1 KR 100443914B1
Authority
KR
South Korea
Prior art keywords
information
failure
fault
storage module
module
Prior art date
Application number
KR10-2002-0011670A
Other languages
English (en)
Other versions
KR20030072103A (ko
Inventor
윤기헌
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Priority to KR10-2002-0011670A priority Critical patent/KR100443914B1/ko
Publication of KR20030072103A publication Critical patent/KR20030072103A/ko
Application granted granted Critical
Publication of KR100443914B1 publication Critical patent/KR100443914B1/ko

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04QSELECTING
    • H04Q3/00Selecting arrangements
    • H04Q3/0016Arrangements providing connection between exchanges
    • H04Q3/0062Provisions for network management
    • H04Q3/0075Fault management techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/22Arrangements for supervision, monitoring or testing
    • H04M3/2254Arrangements for supervision, monitoring or testing in networks
    • H04M3/2263Network management
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/22Arrangements for supervision, monitoring or testing
    • H04M3/36Statistical metering, e.g. recording occasions when traffic exceeds capacity of trunks

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Debugging And Monitoring (AREA)

Abstract

본 발명에 따른 장애 정보 제공 방법은, 교환기 시스템에서 발생된 장애 정보를 제공하는 방법에 있어서, 교환기 시스템으로부터 전달된 장애 발생 정보를 진단하여 장애 발생 정보에 따라 일정 시간대별로 구분하여 장애 통계 정보로 임시 저장하는 단계와, 일정 주기마다 장애 통계 정보를 업데이트하는 단계와, 업데이트된 장애 통계 정보를 일정 주기마다 시간대별로 백업하여 장애 이력 정보를 생성하는 단계와, 요청이 있는 경우, 업데이트된 장애 통계 정보 또는 장애 이력정보중에 해당 시간대의 정보를 제공하는 단계를 수행함으로써, 교환기 시스템의 장애에 대한 실시간 및 누적 통계 데이터를 관리하여 실시간으로 시스템의 현재 장애 상황을 파악할 수 있고, 원하는 시간대의 장애 현황을 수치, 그래프등과 같은 다양한 GUI(Graphic User Interface)를 통해 파악할 수 있음으로 인해 효율적으로 시스템을 관리할 수 있다.

Description

장애 정보 제공 시스템 및 그 방법{system and method for providing fault information}
본 발명은 장애 정보 제공 시스템 및 그 방법에 관한 것으로, 상세하게는 인포렉스 시스템(Inforex System)을 위한 MAP(Maintenance Administration PC)/RMAP(Remote Maintenance Administration PC)같은 관리툴에서 취약하였던 통계부분을 보강하여 시스템 관리자가 보다 편리하게 시스템 장애 상황을 파악하고 대처할수 있도록 진단 데이터의 효율적인 관리를 위한 장애 정보 제공 시스템 및 그 방법에 관한 것이다.
인포렉스 시스템은 분산제어, 분산데이터 베이스 구조를 채택하고 시스템의 중요부분을 이중화함으로써, 신뢰성이 높은 구조를 가지고 있다. 아울러, 획기적인 기술력을 바탕으로 한 쉘프 및 노드형태로 최대 15,360 회선까지 증설이 가능하고, 대형의 메모리를 수용하고 있어 기능확장에 융통성을 보장하며, ISDN 상용화에 따른 음성, 데이터, 화상 등 각종 데이터 통신망 접속기능을 갖춘 미래 지향적 종합정보통신시스템이다.
도 1은 종래의 인포렉스 시스템에서 장애처리를 수행하기 위한 시스템의 개략적인 블록도이다. 도시된 바와 같이, 시스템내에 장애가 발생하는 경우, 시스템을 진단하고 있던 진단 태스크(Task)(1)가 이를 감지하여 장애가 발생했음을 알리는 메시지를 입출력 프로세스 모듈(IO Process Module: 이하, IPM라 함)(2)로 보낸다. IPM은 입출력을 담당하는 카드로서, 태스크(1)로부터 받은 메시지를 하드 디스크(3)에 장애 관련된 데이터로 저장하고, MAP(4)과 같은 시스템 관리 프로그램을 통해서 장애이력에 대한 조회를 수행한다.
이와 같이 종래의 인포렉스 시스템은 시스템의 장애에 대한 장애 이력은 제공을 하지만, 진단 데이터에 대한 효율적 통계 데이터 처리 모듈이 없었기 때문에 통계 데이타는 제공할 수 없다. 즉, 장애 메시지를 이용하여 사용자가 원하는 정보를 추출하여 볼수 있도록 하는 중간 모듈이 없기 때문이다.
따라서, 실제 사이트(site)의 시스템 관리자는 시스템의 장애 상황에 대해서 적절한 대처를 할 수 있는 정보를 획득하지 못함으로 인해서 시스템 장애에 대한 관리를 효율적으로 하기 어려운 문제점이 있다.
본 발명은 이러한 종래의 문제점을 해결하기 위하여 안출된 것으로, 시스템의 장애 진단 메시지를 효율적으로 분류하고 데이터베이스에 저장하여 시간대별로 장애 이력을 볼 수 있게 하는 장애 정보 제공 시스템 및 그 방법을 제공하는데 그 목적이 있다.
도 1은 종래의 장애 정보 제공 시스템의 개략적인 블록도.
도 2는 본 발명에 따른 장애 정보 제공 시스템이 구비된 장애 관리 서버의 구성 블록도.
도 3은 도 2에 도시된 진단 매니저 모듈의 내부 구성블록도 및 메시지 흐름도.
*도면의 주요부분에 대한 부호의 설명*
1 : 진단 태스크 2 : IPM(IO Process Module)
3 : 하드 디스크 드라이브(HDD) 4 : MAP
10 : IAP 11 : 진단 태스크
20 : I/O 서버 21 : IPM
30 : 장애관리서버 31 : 데이터 수집모듈
32 : 진단 매니저 모듈 32a: 초기화 처리 모듈
32b: 메시지 처리부 32c: DB 관리 처리부
33 : DB 33a: 로그 DB
33b: SUM DB 34 : 작업 영역(WA)
34a : 현재 작업영역(CURR_WA) 34b: 누적 작업영역(SUM_WA)
35 : 동적 라이브러리 모듈 36 : 데이터 리포터 모듈
40 : 웹브라우저 41 : 사용자 화면
이러한 목적을 달성하는 본 발명의 일측면에 의하면, 임의 시점의 교환기 시스템 장애 발생 정보와 설정된 주기의 시간동안에 발생되는 장애 발생 정보를 누적한 장애 통계 정보를 저장하는 제 1 저장 모듈과, 제 1 저장 모듈에 저장되었던 장애 통계 정보 및 교환기 시스템의 장애 발생 정보를 순차적으로 누적하여 저장하는 제 2 저장 모듈과, 교환기 시스템의 장애 발생 정보를 진단하여 제 1 저장 모듈에 해당 주기의 시간동안 저장시킨 후 해당 주기가 경과되면 해당 주기의 장애 통계 정보를 상기 제 2 저장모듈에 누적시키는 진단 매니저 모듈과, 교환기 시스템의 장애를 실시간으로 모니터링하기 위해 임의의 시점에서 제 1 저장모듈에 저장된 정보들을 호출하기 위한 동적 라이브러리 모듈과, 동적 라이브러리 모듈을 통해 제 1 저장모듈에 저장된 해당 주기 시간동안의 장애 발생 정보 및 장애 통계 정보와 제 2 저장모듈에 저장된 정보를 웹환경의 사용자에게 제공하는 데이터 리포터 모듈을 포함하는 장애 정보 제공 시스템교환기를 제공한다.
또한, 본 발명의 다른 측면에 따르면, 교환기 시스템의 장애 발생 정보를 진단하여 임의 시점의 장애 발생 정보와 설정된 주기의 시간동안에 발생되는 장애 발생 정보를 누적한 장애 통계 정보를 설정된 주기동안 제 1 저장 모듈에 저장하는 단계와, 해당 주기가 경과되면 제 1 저장 모듈에 저장된 해당 주기의 장애 통계 정보를 제 2 저장 모듈에 시간대별 장애 이력 정보로 누적하여 저장하는 단계와, 동적 라이브러리 모듈을 통해 제 1 저장 모듈에 저장된 해당 주기 시간동안의 장애 발생 정보 및 장애 통계 정보를 제공하거나, 제 2 저장 모듈에 저장된 시간대별 장애 이력 정보를 제공하는 단계를 포함하는 장애 정보 제공 방법을 제공한다.
이하, 첨부된 도면을 참조하여 본 발명을 상세히 설명해 보자.
도 2는 본 발명에 따른 장애 정보 제공 시스템이 구비된 장애 관리 서버의 구성 블록도이다. 도 2를 참조하여 IAP 및 I/O 서버 및 장애 관리 서버(Admin Server)내의 다른 모듈과의 관계를 알아보자.
장애 관리 서버(30)는 장애여부를 진단하는 진단 태스크(11)를 실장하는 IAP(10)와, I/O 서버(20)와, 사용자 웹브라우저 환경(40)에 연결된다.
IAP(10)은 Integrated Access Platform의 약어로 교환기 시스템을 나타낸다. 진단 태스크(11)를 구비하여 교환기내에 장애가 발생되었는지의 여부를 진단하여 장애가 발생한 경우 장애가 발생했음을 알려주게 된다. 이때, 장애의 발생을 알려주는 메시지는 AFS 메시지 형태를 사용한다. AFS 메시지는 Alarm Fault Status 메시지를 말한다.
I/O 서버(20)는 IAP(10)의 진단 태스크(11)로부터 네트워크에 장애가 발생되었음을 알리는 메시지를 받는 경우 장애처리를 위해 장애 관리 서버(30)에 전달해주는 역할을 수행한다. I/O 서버(20)에는 입출력을 담당하는 카드인 IPM(21)이 실장되어 있다.
장애 관리 서버(30)는 I/O 서버(20)의 IPM(21)을 통해 장애 데이터를 수집하는 데이터 수집 모듈(31)과, 데이터 수집 모듈(31)로부터 장애 데이터를 전달받아 장애처리를 수행하는 진단 매니저 모듈(32)과, 진단 매니저 모듈(32)의 제어에 따라 각종 장애 데이터를 저장하는 DB(33)와, 발생된 장애에 대한 실시간적인 통계 정보를 저장하는 작업 영역(Working Area)(34)과, 외부의 모니터링 요청에 따라 작업 영역에 저장된 장애 데이터를 외부로 전달해주기 위한 동적 라이브러리 모듈(35)과, 동적 라이브러리 모듈(35)을 통해 작업 영역(34)에 저장된 장애 데이터를 외부로 보고하기 위한 데이터 리포터 모듈(36)로 이루어진다.
데이터 수집 모듈(31)은 I/O 서버(20)를 통해 전달되는 장애 데이터를 수신하여 진단 매니저 모듈(32)에 전달하는 기능을 수행한다.
진단 매니저 모듈(32)은 초기화 모듈(Initializer)(32a)과, 메시지 처리 모듈(Message Handler)(32b)과, DB 관리 처리 모듈(DM Handler)(32c)로 구성될 수 있다.
도 3은 도 2에 도시된 진단 매니저 모듈의 구성 블록도 및 각 구성 블록의 개략적인 기능을 보여주고 있다. 도 3을 참조하여 각 구성블록의 기능을 살펴보자.
초기화 모듈(32a)은 진단 매니저 모듈(32)의 내부 모듈 구동 및 환경에 대한 다음과 같은 초기화 작업을 수행하는 루틴이다. 데이터 수집모듈(31)간의 인터페이스를 위한 소켓 인터페이스를 초기화하고, DB를 초기화하고, SQL 서버 I/F(interface)를 초기화하고, WA(CURR_WA 및 SUM_WA)를 초기화하고, 진단 매니저 모듈의 내부 모듈간의 인터페이스를 위한 메시지 큐를 초기화하고, 시스템의 형상정보, 예를 들면, 시스템의 노드/셀프/카드/포트의 상태에 대한 형상 정보 메시지를 요청하고 그에 따른 처리를 수행한다.
메시지 처리 모듈(32b)은 IAP 시스템(10)으로 부터 받은 장애 메시지를 내부큐(queue)에 버퍼링하고 메시지를 읽고 분석하는 루틴모듈이다. 즉, 데이터 수집모듈로부터 장애 메시지 정보를 가지는 POD 메시지와 형상정보 메시지(config message)를 수신하게 된다. 여기서, POD 메시지는 periodic 메시지로서 주기적으로 발생하는 메시지를 나타낸다.
이때, 데이터 수집모듈(31)로부터 수신된 POD 메시지는 AFS 메시지 형태를 가지게 된다. AFS 메시지의 레코드 형태는 DB 관리 처리 모듈(32c)에서 처리하는 로그 레코드의 형식과 차이가 있을 수 있다. 따라서, 데이터 수집모듈(31)로부터 수신된 로그 레코드중에서 DB 관리 처리 모듈(32c)에서 필요한 사항만을 추출할 필요가 있다. 이를 위해서 메시지 처리 모듈(32b)은 수신한 메시지를 내부큐에 버퍼링한 다음 그 메시지를 읽어서 어떠한 메시지인지 그 내용을 분석하여, DB관리 처리 모듈(32c)에 전달하게 된다.
DB 관리 처리 모듈(32c)은, 메시지 처리 모듈(32b)에서 분석한 장애메시지를 실제적으로 처리하는 루틴이다. 이에 따라 장애 카운터(counter) 변경 및 진단 DB 내용을 변경한다.
DB(33)는 장애의 이력을 저장하는 로그 DB(LOG DB)(33a)와, 15분 간격으로 분류되는 장애 내력 정보를 저장하는 SUM DB(33b)로 이루어진다.
로그 DB(33a)는 단위 시간대별 상세 장애 이력을 조회할 때 사용하는 DB로서, 시스템으로부터 받은 장애 메시지(AFS 메세지)에 대하여 분류작업을 거쳐 로그 레코드(record)로 구성한 후 저장하게 된다.
한편, SUM DB(33b)는, 단위 시간대별로 장애 발생 횟수, 장애 복구 횟수, 남은 장애 개수를 셀 때 사용하는 DB이고, 15분 주기로 SUM_WA(34a)의 내용을 저장한다. SUM DB(33b)에는 노드(Node),셀프(Shelf) 및 상태(Status) DB만 저장된다.
WA(34)는 데이터 베이스 관리 체계(DBMS)에서 사용하는 데이터가 저장되는 작업 장소 내에 있는 구역을 의미하며, 사용자 작업 구역 내에는 응용 프로그램에 의해 호출된 서브스키마의 모든 데이터 항목에 대한 저장 장소가 있다.
WA(34)는 SUM_WA(34a)와, CURR_WA(34b)로 구성될 수 있다. SUM_WA(34a) 및 CURR_WA(34b)는 모니터링시에 최근 장애 복구 내역을 구별하기 위해서 "장애 복구 시간" 필드(field)를 추가할 수 도 있다.
SUM_WA(34a)는 노드(node)/셀프(shelf) 별로 장애정보가 저장되며, 15분 주기의 SUM DB(33b)를 만들기 위해 임시로 주메모리(main memory)내에서 유지되는 WA로 주기적으로 SUM DB(33b)에 저장한다. 실시간 모니터링시에는 해당 시간 주기 내에서의 누적 통계치를 보여 주기 위해서 사용된다.
CURR_WA(34b)는 카드(Card) 및 포트(Port)별로 현재(current)의 장애 상태를 표시하며 현재 상태 모니터링시 이용한다. 이 WA는 15분 주기의 WA로서 DB에는 저장되지 않는다.
동적 라이브러리 모듈(35)는 진단 매니저 모듈(32)이 관리하는 WA(working area)(34)는 공유 메모리(Shared Memory)로 구현된 영역으로서 진단 데이터를 사용자에게 보여주거나 관리자에게 보여주는 데이터 리포터 모듈(36)이 ASP로 작성된 관계로 ASP모듈에서 진단 WA를 접근을 하기 위해서 COM DLL로 제공한다. 여기서, COM DLL는 Component Object Model Dynamic Link Library의 약어로 서로 다른 모듈간의 데이터 인터페이스를 제공하기 위한 데이타 접근방법을 위한 다이나믹 링크 라이브러리를 나타낸다.
데이터 리포터 모듈(36)은 외부로부터의 요청이 있는 경우, 진단 데이터를 사용자에게 보여주거나 관리자에게 보여주기 위해 COM DLL(DLL dynamic link library)를 통해 WA(34)를 접근을 하여 각종 데이터를 읽어와서 사용자에게 표시하여 주는 모듈로, 웹환경에서 인터넷을 통하여 접속할 수 있도록 ASP로 작성될 수 있다.
이와 같이 구성된 장애 정보 제공 시스템의 동작을 살펴보자.
진단 매니저 모듈(32)이 구동되면 초기화 처리 모듈(32a)에서 형상 정보 메시지(Config Message)를 데이터 수집 모듈(31)에 요청하고, 이에 대한 응답 처리를 수행하면서, 시스템의 형상 정보(노드, 셀프, 카드 , 포트 정보)를 개별적으로 요청하고 수신하여 형상 정보에 대한 WA(34)를 업데이트한다.
IAP 시스템(10)에 장애가 발생하면 IAP 의 진단 태스크(11)에서는 AFS 메시지라는 메시지 포맷(format)으로 장애 발생에 관련된 진단 메시지를 보내주며 메시지 처리 모듈(32a)에서는 데이터를 형상정보(config) 혹은 로그(log)항목으로 분류하여 메시지 종류별로 해당 처리 모듈(초기화 처리 모듈 또는 DB 관리 처리 모듈)을 호출하여 각 장애 카운터의 값을 변경한다.
한편, 시스템의 장애 상황은 15분 경계에 걸쳐서 지속될수 있기 때문에 이에 대한 장애 리스트를 큐로 관리한다. 즉, 현재 시스템 장애상황은 15분 단위로 관리가 되기 때문에(15분 단위로 WA및 SUM DB관리) 15분이 지나면 WA를 클리어 하게 된다. 따라서,15분 단위 시간이 지나면 현재까지 지속중인 장애에 대한 정보가 없기때문에 현재 장애에 대한 정보를 제대로 파악할수 없다. 따라서, 매15분 단위로 WA를 저장하는 시점에 지속중인 장애는 '지속중'이라는 상태값을 링크 리스트 큐(linked list quqe)에 저장을 시켜 놓는다
알람 발생 메시지인 경우, 링크 리스트(linked list)인 알람 리스트(AlarmQlist)에 발생시간 순으로 저장하고, 해당 AFS 코드를 분석하여 관련된 SUM_WA 및 CURR_WA 의 값들을 업데이트한다.
장애(Fault) 발생 메시지인 경우, 링크 리스트인 장애리스트(FaultQlist)에 발생 시간 순으로 저장하고, 해당 AFS 코드를 분석하여 관련된 SUM_WA 및 CURR_WA의 값들을 업데이트한다.
한편, 알람해제(Alarm Clear) 메시지인 경우, 링크 리스트(linked list)인 알람리스트(AlarmQlist)에서 해당 알람을 제거하고 AFS 코드를 분석하여 관련된 SUM_WA 및 CURR_WA의 값들을 업데이트한다.
상태(Status) 메시지중 장애복구(Fault Recovery) 메시지인 경우에는, 장애 리스트(FaultQlist)에서 해당 장애를 제거하고, AFS 코드를 분석하여 관련된 SUM_WA(34a) 및 CURR_WA(34b)의 값들을 업데이트한다. 다른 상태 메시지에 대해서는 AFS 코드를 분석하여 SUM_WA(34a) 및 CURR_WA(34b)의 값들을 업데이트한다.
매 15분 간격의 타이머를 생성하여 15분 단위로 SUM WA(34a)의 내용을 SUM DB(33b)에 저장하고 SUM_WA(34a)의 내용을 리셋시킨다. 또한 알람 리스트(AlarmQlist) 및 장애 리스트(FaultQlist)에 남아 있는 알람 및 장애들을 로그 DB(33a)에 다시 저장한다. 이때 알람 및 장애의 상태는 "진행중(Alarm Continue/ Fault Continue)"이라는 타입(type)으로 저장이 된다. 이것은 알람 및 장애가 해당 15분 시간 간격 안에 해제되지 않고, 그 다음 15분대로 지속되는 경우에 해당 장애의 이력(history)을 관리하여 알람의 최초발생시간에 관계없이 로그 이력(Log history)을 좀더 간단하게 검색하기 위해서이다.
진단 매니저 모듈(32)이 구동된 후 최초로 진단 AFS 메시지를 받은 경우 또는 매 15분단위로 SUM_WA(34a)를 SUM DB(33b)에 기록(write)한 이후 해당 15분 시간대에서 최초로 받은 AFS 메시지의 타임 스탬프(time stamp)값을 비교 한 후 (15-α)분 타이머를 등록하고, 매 시간의 15분 간격으로 시간초과 메시지(timeout message)를 발생하도록 한다. 이것은 매 15분 간격으로 SUM_WA(34a)를 SUM DB(33b)에 기록하기 위함이다.
본 발명에 의하면, IAP 시스템의 장애에 대한 실시간 및 누적 통계 데이터를 관리하여 실시간으로 시스템의 현재 장애 상황을 파악할 수 있고, 원하는 시간대의 장애 현황을 수치, 그래프등과 같은 다양한 GUI(Graphic User Interface)를 통해 파악할 수 있음으로 인해 효율적으로 시스템을 관리할 수 있다.
아울러, 지속되는 장애의 경우, 발생 시간을 바로 알 수 있기 때문에 중요한 시스템 장애(시스템 재기동)가 발생한 경우 장애 발생 시스템 관리자가 장애 발생 이력을 더욱 편리하게 관리할 수 있다.

Claims (10)

  1. 임의 시점의 교환기 시스템 장애 발생 정보와 설정된 주기의 시간동안에 발생되는 장애 발생 정보를 누적한 장애 통계 정보를 저장하는 제 1 저장 모듈과,
    상기 제 1 저장 모듈에 저장되었던 장애 통계 정보 및 상기 교환기 시스템의 장애 발생 정보를 순차적으로 누적하여 저장하는 제 2 저장 모듈과,
    상기 교환기 시스템의 장애 발생 정보를 진단하여 상기 제 1 저장 모듈에 해당 주기의 시간동안 저장시킨 후 해당 주기가 경과되면 해당 주기의 장애 통계 정보를 상기 제 2 저장모듈에 누적시키는 진단 매니저 모듈과,
    상기 교환기 시스템의 장애를 실시간으로 모니터링하기 위해 임의의 시점에서 상기 제 1 저장모듈에 저장된 정보들을 호출하기 위한 동적 라이브러리 모듈과,
    상기 동적 라이브러리 모듈을 통해 상기 제 1 저장모듈에 저장된 해당 주기 시간동안의 장애 발생 정보 및 장애 통계 정보와 상기 제 2 저장모듈에 저장된 정보를 웹환경의 사용자에게 제공하는 데이터 리포터 모듈을 포함하는 장애 정보 제공 시스템.
  2. 제 1항에 있어서, 상기 제 2 저장 모듈은,
    상기 교환기 시스템으로부터 전달되는 장애 발생 정보를 순차적으로 누적하여 저장하는 제 1 DB와,
    상기 제 1 저장 모듈에 저장되었던 장애 통계 정보를 일정 시간대별로 누적하여 저장하는 제 2 DB를 포함하는 장애 정보 제공 시스템.
  3. 제 2항에 있어서, 상기 제 2 저장모듈은,
    일정시간이 지난후에도 남아있는 장애를 장애 리스트로 관리하기 위해 저장하는 큐를 포함하고, 상기 제 1 DB에 일정시간대 간격마다 해당 장애가 복구될 때까지 재저장하는 장애 정보 제공 시스템.
  4. 제 1항에 있어서, 상기 제 1 저장 모듈은,
    실시간 모니터링시 해당 시간주기내에서의 장애 통계 정보를 임시로 저장하는 제 1 동작영역과,
    일정 주기의 장애 이력 정보를 형성하기 위해 일정 주기동안 임시로 메인 메모리에 유지되었다가 상기 제 2 저장모듈에 백업되어 저장되는 제 2 동작영역을 포함하는 장애 정보 제공 시스템.
  5. 제 1 항에 있어서, 상기 진단 매니저 모듈은,
    상기 교환기 시스템으로부터 장애 정보를 수신하기 위한 소켓 인터페이스, 내부 DB, 상기 제 1 저장모듈, 상기 진단 매니저 모듈의 내부 모듈간의 인터페이스를 위한 메시지 큐를 초기화하고, 상기 교환기 시스템에 시스템 형상정보를 요청하는 초기화 모듈과,
    상기 초기화 모듈의 요청에 따라 상기 교환기 시스템으로부터 전송되는 시스템 형상 정보 및 상기 교환기 시스템에서 전송된 장애 발생 메시지를 해석하는 메시지 처리 모듈과,
    상기 메시지 처리모듈에 의해 해석된 장애 발생 정보에 따라 일정 시간별로 장애 이력정보를 생성하여 상기 제 2 저장모듈에 저장하고, 일정 시간별로 제 1 저장모듈의 장애 통계 정보를 업데이트하고, 일정 주기마다 상기 제 1 저장모듈의 그 업데이트된 시간별 통계정보를 상기 제 2 저장모듈에 백업하여 저장하는 DB 관리 처리모듈을 포함하는 장애 정보 제공 시스템.
  6. 제 1 항에 있어서, 상기 장애 통계 정보는,
    단위 시간대별로 장애 발생 횟수, 장애 복구 횟수, 남은 장애 개수중 적어도 하나를 포함하는 장애 정보 제공 시스템.
  7. 제 1 항에 있어서, 상기 장애 통계 정보는,
    전체 장애를 카드 레벨 이상과, 포트 레벨 이하로 구분하여, 포트 레벨의 장애가 발생한 부분적인 장애에 대해서는 상위 레벨의 장애현황을 표시하지 않도록 레벨에 따라 장애 현황의 표시여부를 결정할 수 있는 테이블로 저장되는 장애 정보 제공 시스템.
  8. 교환기 시스템의 장애 발생 정보를 진단하여 임의 시점의 장애 발생 정보와 설정된 주기의 시간동안에 발생되는 장애 발생 정보를 누적한 장애 통계 정보를 설정된 주기동안 제 1 저장 모듈에 저장하는 단계와,
    해당 주기가 경과되면 상기 제 1 저장 모듈에 저장된 해당 주기의 장애 통계 정보를 제 2 저장 모듈에 시간대별 장애 이력 정보로 누적하여 저장하는 단계와,
    동적 라이브러리 모듈을 통해 상기 제 1 저장 모듈에 저장된 해당 주기 시간동안의 장애 발생 정보 및 장애 통계 정보를 제공하거나, 상기 제 2 저장 모듈에 저장된 시간대별 장애 이력 정보를 제공하는 단계를 포함하는 장애 정보 제공 방법.
  9. 제 8항에 있어서, 상기 정보를 제공하는 단계는, 웹환경을 통하여 제공하는 장애 정보 제공 방법.
  10. 제 9항에 있어서, 상기 웹환경은, 수치 또는 그래프의 그래픽 사용자 인터페이스를 지원하는 장애 정보 제공 방법.
KR10-2002-0011670A 2002-03-05 2002-03-05 장애 정보 제공 시스템 및 그 방법 KR100443914B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR10-2002-0011670A KR100443914B1 (ko) 2002-03-05 2002-03-05 장애 정보 제공 시스템 및 그 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR10-2002-0011670A KR100443914B1 (ko) 2002-03-05 2002-03-05 장애 정보 제공 시스템 및 그 방법

Publications (2)

Publication Number Publication Date
KR20030072103A KR20030072103A (ko) 2003-09-13
KR100443914B1 true KR100443914B1 (ko) 2004-08-09

Family

ID=32223491

Family Applications (1)

Application Number Title Priority Date Filing Date
KR10-2002-0011670A KR100443914B1 (ko) 2002-03-05 2002-03-05 장애 정보 제공 시스템 및 그 방법

Country Status (1)

Country Link
KR (1) KR100443914B1 (ko)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100462881B1 (ko) * 2002-04-19 2004-12-17 삼성전자주식회사 호 통계 처리 방법
CN117714403A (zh) * 2023-08-14 2024-03-15 荣耀终端有限公司 数据处理方法、电子设备和存储介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20000065593A (ko) * 1999-04-07 2000-11-15 윤종용 교환기에서 유지 장애내역 출력방법

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20000065593A (ko) * 1999-04-07 2000-11-15 윤종용 교환기에서 유지 장애내역 출력방법

Also Published As

Publication number Publication date
KR20030072103A (ko) 2003-09-13

Similar Documents

Publication Publication Date Title
US7877472B2 (en) System and method for displaying historical performance of an element on a network
CN100465919C (zh) 应用服务器的健康监视和控制的技术
US7603340B2 (en) Automatic workload repository battery of performance statistics
EP1623325B1 (en) Managing tasks in a data processing environment
US20110035363A1 (en) Real-time database performance and availability monitoring method and system
CN106487574A (zh) 自动化运行维护监测系统
US20030046339A1 (en) System and method for determining location and status of computer system server
CN105071969A (zh) 基于jmx的定制化实时监控及自动化异常处理的系统及方法
AU2001270017A1 (en) Liveexception system
CA2453127A1 (en) Method and system for correlating and determining root causes of system and enterprise events
US20030120627A1 (en) Method and apparatus for retrieving time series data related to an activity
CN114154035A (zh) 一种动环监控的数据处理系统
CN108809729A (zh) 一种分布式系统中ctdb服务的故障处理方法及装置
KR100443914B1 (ko) 장애 정보 제공 시스템 및 그 방법
Sahoo et al. Providing persistent and consistent resources through event log analysis and predictions for large-scale computing systems
CN111414267A (zh) 运用于数据中心的机柜异常状态的远端排除方法
KR100506248B1 (ko) 사설 교환시스템에서 링크를 진단하는 방법
TW202026882A (zh) 運用於資料中心的機櫃異常狀態的遠端排除方法(一)
CN111414274A (zh) 运用于数据中心的机柜异常状态的远端排除方法
TW202026879A (zh) 運用於資料中心的機櫃異常狀態的遠端排除方法(三)
JP2001308858A (ja) ネットワーク管理システム
TWI685736B (zh) 運用於資料中心的機櫃異常狀態的遠端排除方法(二)
JP2003186702A (ja) 端末稼働監視システムおよび端末稼働監視方法
JPH08181693A (ja) ネットワーク障害の対策管理装置
KR100235570B1 (ko) 2이상의 주전산기를 병립 연결한 시스템의 클러스터 관리 마스터 시스템의 클러스터 관리방법

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20120628

Year of fee payment: 9

FPAY Annual fee payment

Payment date: 20130627

Year of fee payment: 10

LAPS Lapse due to unpaid annual fee