KR101520103B1 - It서비스에서의 어플리케이션 장애 분석 감시 시스템 및 방법 - Google Patents

It서비스에서의 어플리케이션 장애 분석 감시 시스템 및 방법 Download PDF

Info

Publication number
KR101520103B1
KR101520103B1 KR1020090051916A KR20090051916A KR101520103B1 KR 101520103 B1 KR101520103 B1 KR 101520103B1 KR 1020090051916 A KR1020090051916 A KR 1020090051916A KR 20090051916 A KR20090051916 A KR 20090051916A KR 101520103 B1 KR101520103 B1 KR 101520103B1
Authority
KR
South Korea
Prior art keywords
function
application
correlation
service
failure
Prior art date
Application number
KR1020090051916A
Other languages
English (en)
Other versions
KR20100133168A (ko
Inventor
김진식
정병덕
이성우
박숙지
양영문
Original Assignee
주식회사 케이티
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 케이티 filed Critical 주식회사 케이티
Priority to KR1020090051916A priority Critical patent/KR101520103B1/ko
Publication of KR20100133168A publication Critical patent/KR20100133168A/ko
Application granted granted Critical
Publication of KR101520103B1 publication Critical patent/KR101520103B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • H04L41/065Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis involving logical or physical relationship, e.g. grouping and hierarchies
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0686Additional information in the notification, e.g. enhancement of specific meta-data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/069Management of faults, events, alarms or notifications using logs of notifications; Post-processing of notifications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/06Generation of reports

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Debugging And Monitoring (AREA)

Abstract

본 발명은 IT 서비스에서 다수의 어플리케이션에서 다수의 장애 경보 발생시 원인이 되는 어플리케이션을 정확히 판단하고 장애 원인이 되는 어플리케이션을 통보해 줄 수 있는 기술에 관한 것으로서, IT 서비스를 제공하기 위한 기능 모듈에 해당하는 각 어플리케이션으로부터 발생하는 경보 이벤트를 수집하는 경보 수집부, 각 수집된 경보 이벤트에 대해 어플리케이션 기능을 매핑하는 경보종류별 기능매핑부, 상기 매핑된 어플리케이션 기능과 관련되는 어플리케이션들의 상관 관계를 분석하여 근원 장애를 판단하는 장애 상관관계 분석부, 및 상기 장애 상관관계 분석부로부터 전송된 근원 장애 판단 결과를 통지하는 알람부를 구비하여 구성된다.
장애, 경보, 어플리케이션, 상관 관계, 서비스 장애, 서비스 자원

Description

IT서비스에서의 어플리케이션 장애 분석 감시 시스템 및 방법{SYSTEM AND METHOD FOR INFERENCE AND SURVEILLANCE OF APPLICATION FAULT OF IT SERVICE USING FUNCTIONAL PARTITIONING}
본 발명은 IT(Information Technology) 서비스에서의 어플리케이션 장애 분석 감시 시스템 및 방법에 관한 것으로서, 보다 상세하게는 IT 서비스에서 구현되는 어플리케이션(application) 레벨의 장애를 관리하는 기술에 관한 것이다.
요즘 IT 서비스는 다양한 네트워크 기반 하에 다수의 어플리케이션 들의 조합을 통해 이루어지고 있으며, 그러한 조합은 기존의 단순 조합에서 매우 복잡한 양상으로 진화하고 있다. 유지보수를 위하여 이러한 IT 서비스의 개별 자원들에 대한 장애를 감시하기 위해서는 사용되는 기술 모두에 익숙한 감시 인력이 필요하므로 현장에서는 운용비용 절감을 위해 소규모 집단에 의해서도 감시 가능한 방법을 찾고 있다. 이미 어플리케이션의 하위 레벨, 즉 네트워크 관점이나 서버 관점 혹은 데몬 프로그램의 단순 생존 여부 관점에서는 장애 상관 관계 분석이라는 자동 분석 방법이 도입되어, 다양하게 활용되고 있다.
그러나, 현재 어플리케이션 전반에 대한 자동 분석 감시 기능이 구현되고 있 지 않다. 이는 각각의 어플리케이션들이 네트워크 장비나 서버간의 상관성보다 훨씬 다양하고 추적하기 어려운 복합적인 상관 관계나 서로 잘 대응되지 않는 경고 체계를 지니고 있기 때문이다. 또한, 이러한 복잡성은 어플리케이션의 버전업 등에 따라 계속 변환하기 때문에 이를 자동 분석할 수 있는 로직을 설계하고 유지보수하기가 매우 어렵다.
따라서, 종래 네트워크나 서버 장애에 대한 분석 방법을 벗어나 어플리케이션 장애 경보에 대한 새로운 분석 및 감시 방법의 도입이 필요하다.
본 발명의 목적은 IT 서비스에서 다수의 어플리케이션에서 다수의 장애 경보 발생시 원인이 되는 어플리케이션을 정확히 판단하고 장애 원인이 되는 어플리케이션을 통보해 줄 수 있는 IT 서비스에서의 어플리케이션 장애 분석 감시 시스템 및 방법을 제공하기 위한 것이다.
상기 목적을 실현하기 위한 본 발명에 따른 IT 서비스에서의 어플리케이션 장애 분석 감시 시스템은 IT 서비스를 제공하기 위한 기능 모듈에 해당하는 각 어플리케이션으로부터 발생하는 경보 이벤트를 수집하는 경보 수집부, 각 수집된 경보 이벤트에 대해 어플리케이션 기능을 매핑하는 경보종류별 기능매핑부, 상기 매핑된 어플리케이션 기능과 관련되는 어플리케이션들의 상관 관계를 분석하여 근원 장애를 판단하는 장애 상관관계 분석부, 및 상기 장애 상관관계 분석부로부터 전송된 근원 장애 판단 결과를 통지하는 알람부를 구비한다.
바람직하게, 본 발명은 각 경보와 관련되는 어플리케이션의 기능의 매핑 관계가 저장된 경보 종류별 기능매핑 DB를 더 구비하고, 상기 경보종류별 기능매핑부는 상기 경보 종류별 기능매핑 DB를 이용하여 상기 경보 이벤트에 관련되는 어플리케이션 기능을 매핑할 수 있다.
바람직하게, 본 발명의 상기 경보종류별 기능매핑부는 상기 경보 이벤트와 상기 경보 이벤트에 매핑된 어플리케이션 기능에 대한 정보를 장애 경보 DB에 저장 할 수 있다.
바람직하게, 본 발명은 각 기능에 대한 어플리케이션들의 상관 관계를 저장하는 기능별 어플리케이션 상관관계 DB를 더 구비하고, 상기 장애 상관관계 분석부는 상기 기능별 어플리케이션 상관관계 DB를 이용하여 상기 경보 이벤트에 해당하는 기능과 관련되는 어플리케이션의 상관 관계를 분석할 수 있다.
바람직하게, 본 발명에서 상기 기능별 어플리케이션 상관관계 DB는 기능 식별자를 저장하는 ID 필드, 해당 기능과 관련되는 서비스명을 저장하는 서비스명 필드, 해당 기능과 관련되는 서비스의 중분류 정보를 저장하는 기능분류 필드 및 해당 기능과 관련되는 서비스의 상세 분류 정보를 저장하는 상세 상세분류 필드를 구비하는 서비스 기능 테이블, 각 기능과 관련된 어플리케이션에 대한 정보를 저장하는 테이블로서, 기능 식별자를 저장하는 기능 ID 필드, 상관 어플리케이션의 상관 순서 정보를 저장하는 순서 ID 필드, 상관 어플리케이션의 상관 순서 정보를 저장하는 순서 ID 필드 및 각 기능에 상관되는 어플리케이션의 식별 정보를 저장하는 유형 ID 필드를 구비하는 기능별 상관관계 테이블, 유형 ID 별로 어플리케이션에 대한 정보를 저장하는 어플리케이션 유형 테이블 및 기능별 어플리케이션의 상관 관계에 대한 요약 정보가 저장되는 기능 상관관계 요약 테이블을 구비할 수 있다.
바람직하게, 본 발명에서 상기 장애 상관관계 분석부는 상기 어플리케이션들의 상관 관계에서 최종단의 어플리케이션을 근원 장애로 판단할 수 있다.
상기 목적을 실현하기 위한 본 발명에 따른 IT 서비스에서의 어플리케이션 장애 분석 방법은 (a) IT 서비스를 제공하기 위한 기능 모듈에 해당하는 각 어플리 케이션으로부터 발생하는 경보 이벤트를 수집하는 과정, (b) 각 수집된 경보 이벤트에 대해 어플리케이션 기능을 매핑하는 과정, (c) 상기 매핑된 어플리케이션 기능과 관련되는 어플리케이션의 상관 관계를 분석하여 근원 장애를 판단하는 과정 및 (d) 상기 어플리케이션의 상관 관계의 분석 결과와 상기 근원 장애의 판단결과를 출력하는 과정을 구비한다.
바람직하게, 본 발명에서 상기 (b) 과정은 각 경보와 관련되는 어플리케이션의 기능의 매핑 관계가 저장된 경보 종류별 기능매핑 DB를 이용하여 상기 경보 이벤트에 관련되는 어플리케이션의 기능을 매핑하는 과정과, 상기 경보 이벤트와 상기 경보 이벤트에 매핑된 어플리케이션 기능에 대한 정보를 장애 경보 DB에 저장하는 과정을 구비할 수 있다.
바람직하게, 본 발명에서 상기 (c) 과정은 각 기능에 대한 어플리케이션의 상관 관계를 저장하는 기능별 어플리케이션 상관관계 DB를 이용하여 상기 경보 이벤트에 해당하는 기능과 관련되는 어플리케이션의 상관 관계를 분석하는 과정과, 상기 어플리케이션의 상관 관계에서 최종단의 어플리케이션을 근원 장애로 판단할 수 있다.
본 발명의 실시예에 따른 IT 서비스에서의 어플리케이션 장애 분석 감시 시스템 및 방법에 의하면, 어플리케이션 장애 발생에 대하여 근원 장애를 신속하게 찾아 최소의 감시 인원으로도 신속하고 정확한 인지 및 빠른 복구를 기대할 수 있다.
또한, 어플리케이션 들의 관계를 서비스 기능 관점에 의해 분류하고, 서로 다른 관점의 정보들을 기능 관점에 의해 분류하여, 기능별로만 상관관계를 분석함으로써 장애 상관관계 방법을 제기할 뿐 아니라, 그 복잡도를 낮추어 저비용으로 상관관계 분석 로직을 적용할 수 있다.
부가하여, 정보의 종류를 추가/변경/삭제하거나 어플리케이션의 기능 관계가 변경될 때, 로직 변경에 의하지 않고 관련된 DB만 수정하여 적용할 수 있도록 함으로써 체계적이면서도 저비용의 관리시스템 유지 보수 체계를 제공할 수 있다는 효과가 있다.
이하, 첨부한 도면을 참조하여 본 발명의 실시예에 대하여 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 상세히 설명한다. 그러나 본 발명은 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시예에 한정되지 않는다. 그리고 도면에서 본 발명을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호를 붙였다.
명세서 전체에서, 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성 요소를 더 포함할 수 있다는 것을 의미한다.
본 발명의 실시예에서 감시의 대상이 되는 어플리케이션은 IT 서비스를 제공하기 위해서 하나의 기능 모듈로서 만들어진, DB/미들웨어/데몬 프로그램/클라이언 트 프로그램 등의 소프트웨어 프로그램을 지칭한다. 이러한 어플리케이션은 다른 어플리케이션과 상호 정보를 송신, 수신, 혹은 처리함으로써 기능하며, 동일한 하드웨어 상에서 구성할 수도 있고 다른 하드웨어 상에서 구성되어 네트워크를 통해 통신할 수도 있다.
본 발명의 실시예에서 어플리케이션 경보는 어플리케이션이 기능상에 이상이 있을 때 내부 로직에 의해 어플리케이션 외부로 송신되는 메시지 혹은 외부에서 해당 어플리케이션 기능 시험이나 성능값 측정 등을 통해 이상 여부를 감지해서 생성해내는 메시지를 말한다. 이는 파일 로깅이나 서비스 기능 테스트 등에 의하여 감지 및 수집 가능하며 대개 발생 시간, 발생 위치, 경보 등급, 경보 종류 등의 정보를 포함하게 된다.
본 발명의 실시예에서 어플리케이션 기능은 특정 IT 서비스 상에서 제공되는 어플리케이션간 한 방향의 데이터 흐름으로 결정되는 기능 단위를 가정한다. 현대의 IT 서비스는 다양하게 그 기능을 나누어 분류할 수 있으나, 본 발명에서는 해당 기능이 어플리케이션간에 연결이 순환하지 않는 범위 내에서 쉽게 구분되어 장애 상관관계 분석의 모호함이 없고 추후 모니터링 시 문제를 쉽게 파악할 수 있는 레벨까지 구분되어야 하기 때문이다. 이는 어플리케이션 경보 발생의 수준과 기능 분류 용이성에 따라 조절되어 구현될 수 있다. 예컨대, 한 기능이 다양한 어플리케이션간의 몇번의 순환이 필요한 기능의 경우에는 이를 한번 순환하는 단위의 기능으로 나누어 분해함으르써 본 발명으로 장애 상관관계 분석이 가능하다.
본 발명의 실시예에서 기능별 어플리케이션 상관관계는 독립 어플리케이션간 의 기능 의존 관계를 의미한다. 이는 하나의 어플리케이션이 다른 하나의 어플리케이션의 동작에 의존함을 의미하며 그 의존의 단계별로 어플리케이션간의 의존 순서가 존재한다. 이 순서에 의하여 해당 기능 이상에 대한 어플리케이션간 우선 순위를 파악할 수 있으며, 이를 통해 장애 원인 어플리케이션 판정이 이루어진다.
도 1은 본 발명의 실시예에 따른 IT 서비스에서의 어플리케이션 장애 분석 감시 시스템의 전체 블럭구성도이다.
도 1에 도시된 바와 같이, 본 발명의 실시예에 따른 IT 서비스에서의 어플리케이션 장애 분석 감시 시스템은 어플리케이션 정보 DB(110), 제어부(120), 장애경보 DB(130), 경보종류별 기능매핑 DB(140), 기능별 어플리케이션 상관관계 DB(150), 알람부(160)를 포함한다. 제어부(120)는 경보 수집부(122), 경보종류별 기능매핑(123), 장애 상관관계 분석부(121)를 포함한다.
어플리케이션 정보 DB(110)는 어플리케이션(210~240)에 대한 개별 정보를 저장한다. 각 어플리케이션에 대한 개별 정보는 어플리케이션명, 위치하는 하드웨어명 등 장애 분석에 필요한 개별 어플리케이션 자체의 속성에 대한 DB이다.
경보 수집부(122)는 어플리케이션에서 발생한 혹은 확인한 다양한 어플리케이션의 장애 경보 이벤트를 수집하는 기능을 수행한다.
경보 종류별 기능 매핑부(123)는 발생한 경보 이벤트에 대해 해당 어플리케이션 유형, 경보 종류, 발생 위치 등을 통해서 어플리케이션 기능을 매핑하는 기능을 수행한다.
경보 종류별 기능매핑 DB(140)는 이러한 매핑 작업을 위해 존재하는 DB로서, 이 DB에는 해당 경보 이벤트의 주요 정보를 키(Key)로 하여 미리 관련 어플리케이션의 도메인 전문가가 설정해놓은 경보별 기능 매핑 관계가 매핑 테이블 형태로 저장되어 있다.
장애 경보 DB(130)는 상기 수집된 경보 이벤트와 상기 경보 이벤트에 매핑된 기능 정보를 저장하는 경보 보관소이다.
장애 상관 관계 분석부(121)에서는 수집된 어플리케이션 장애에 대하여 종합 분석한 결과를 통해서 근원 장애를 판단하는 모듈이다.
기능별 어플리케이션 상관관계 DB(150)는 이러한 장애 상관 관계 분석을 위한 어플리케이션 간 상관관계를 저장하는 보관소이다. 또한, 특정 어플리케이션 유형이 2중화되어 있거나, 지역별로 다른 상관 관계를 가지면 기능별 어플리케이션 상관관계 DB(150)에 반영되어 장애 상관관계 분석을 진행할 수 있도록 한다. 이는 어플리케이션 정보 DB(110)가 단순히 개별 어플리케이션별 속성을 저장하는 것과 다르게, 기능별 어플리케이션간 관계 정보를 보관하는 것이다.
알람부(160)는 장애 상관관계 분석 결과물을 통해 인지하게 될 근원 장애 정보를 해당 담당자나 감시 의무를 가진 대상에게로 출력하는 부분이다. 이를 통해 담당자 내지는 감시 의무를 가진 대상은 구체적인 서비스의 내부에 대한 파악없이도 다수의 경보가 발생하는 장애에 대하여 근원이 되는 장애를 빠르게 인지할 수 있다.
이어, 본 발명의 실시예에 따른 IT 서비스에서의 어플리케이션 장애 분석 감시 방법을 상세하게 설명한다.
먼저 기반 환경에 대한 구축이 필요하다. 따라서 개별 어플리케이션 별 유형, 이름, 위치한 서버 등 속성 정보를 어플리케이션 정보 DB(110)에 저장한다. 이는 추후에 장애 정보에 대해 출력하거나 분석할 때 해당 어플리케이션에 대한 상세 정보를 얻는데 활용된다.
또한 수집된 어플리케이션 정보를 개별 기능별로 매핑하기 위한 경보/기능 매핑 관계를 경보 종류별 기능매핑 DB(140)에 저장한다. 이는 해당 어플리케이션에 지식이 있는 사용자가 구축 및 관리할 수 있다.
마지막으로 기능별로 어플리케이션간의 상관관계를 기능별 어플리케이션 상관관계 DB(150)에 저장한다. 이를 통해 기능 별로 해당 상관 관계를 사용하여 수집된 경보에 대해 어느 어플리케이션에서 원인 장애가 발생했는지 판단할 수 있는 데이터가 확보된다. 이러한 데이터는 시스템의 변경 등에 의하여 사용자에 의해 변경될 수 있으며, 실제 관계를 반영된 이러한 데이터에 기반하여 어플리케이션 장애 분석이 가능해진다.
이하, 도 2에 도시된 플로우차트를 참조하여 본 발명의 실시예에 따른 IT 서비스에서의 어플리케이션 장애 분석 감시 방법을 구체적으로 설명한다.
먼저, 경보 수집부(122)에서 각 어플리케이션(210 ~ 240)로부터 장애 관련 경보 이벤트를 수집한다(S210). 상기 경보 이벤트는 어플리케이션에서 발생시키는 장애 정보 메시지 뿐만 아니라, 로그 파일을 자동으로 검사하면서 생성된 경보, 어플리케이션 특정 기능이나 성능 값을 검사하면서 오류라고 판단되는 경우에 생성되는 모든 장애 경고 메시지를 모두 포함한다.
경보종류별 기능매핑부(123)는 경보 수집부(122)로부터 경보 이벤트가 전송되면, 경보종류별 기능매핑 DB(140)를 이용하여 각 경보 이벤트와 관련되는 기능을 판정한다(S220).
이어, 경보종류별 기능매핑부(123)는 각 장애 관련 정보에 상기 판정된 기능을 매핑시켜 장애경보 DB(130)에 저장함(S230)과 동시에 장애 상관관계 분석부(121)로 전송한다. 경보종류별 기능매핑부(123)가 각 장애 관련 정보에 상기 판정된 기능을 매핑시켜 장애경보 DB(150)에 저장하는 이유는 유사한 시간대에 발생된 경보 이벤트 전체를 분석하기 위함이다.
장애 상관관계 분석부(121)는 기능별 어플리케이션 상관관계 DB(150)에서 기능별 연결관계를 로딩하여 각 장애 관련 경보에 관련되는 어플리케이션들의 연결관계를 조회하고, 상기 연결관계를 통해 각 장애 관련 경보의 우선 순위를 판별한다(S240).
이어, 장애 상관관계 분석부(121)는 각 경보 이벤트와 각 경보 이벤트에 해당하는 기능과 각 기능별 어플리케이션의 상관 관계를 통해 장애 상관 관계를 분석한다(S250). 장애 상관 관계 분석 기술은 다양한 방식으로 구현할 수 있다.
본 발명의 실시예에서는 수집된 장애 관련 경보의 기능별 상관 관계 관점으로 우선순위를 판단하는 방법을 적용한다.
도 3 내지 도 4를 참조하여, 어플리케이션의 기능별 상관 관계를 예시적으로 설명한다.
도 3은 서비스 기능 테이블(151), 기능별 상관관계 테이블(152) 및 어플리케 이션 유형 테이블(153)을 예시적으로 도시한 도면이다.
서비스 기능 테이블(151)은 기능 식별자(ID)를 저장하는 기능 ID 필드, 해당 기능과 관련되는 서비스명을 저장하는 서비스명 필드, 해당 기능과 관련되는 서비스의 중분류 정보를 저장하는 기능분류 필드 및 해당 기능과 관련되는 서비스의 상세 분류 정보를 저장하는 상세 상세분류 필드를 포함한다.
기능별 상관관계 테이블(152)은 각 기능과 관련된 어플리케이션에 대한 정보를 저장하는 테이블로서, 기능 식별자(ID)를 저장하는 기능 ID 필드, 상관 어플리케이션의 상관 순서 정보를 저장하는 순서 ID 필드 및 각 기능에 상관되는 어플리케이션의 식별 정보를 저장하는 유형 ID 필드를 포함한다. 도 3에 도시된 기능별 상관관계 테이블(152)에는 기능 ID가 "1001"인 경우만을 예시적으로 설명하였지만, 실제의 기능별 상관관계 테이블(152)에는 서비스 기능 테이블(151)에 저장된 각 기능 ID에 대해 어플리케이션의 상관 관계를 저장한다.
어플리케이션 유형 테이블(153)은 유형 ID 별로 어플리케이션에 대한 정보를 저장하는 테이블이다.
도 3와 같은 서비스 기능 테이블(151), 기능별 상관관계 테이블(152) 및 어플리케이션 유형 테이블(153)에 저장된 정보에 의해 분석되는 각 어플리케이션의 상관 관계는 도 4와 같을 수 있다.
도 4에 의하면, 기능 ID "1001"(기능 A)에 대해서는 고객단말(유형 ID "101), 콘텐츠관리데몬(유형 ID "102") 및 양방향관리데몬(유형 ID "104")에 해당하는 각 어플리케이션이 관련되고 각 어플리케이션의 상관 관계는 고객단말(유형 ID "101) → 양방향관리데몬(유형 ID "104") → 콘텐츠관리데몬(유형 ID "102")임을 알 수 있다.상기 기능 A에서 영향도가 가장 큰 어플리케이션은 종단인 콘텐츠관리데몬이고, 콘텐트관리데몬은 상기 기능 A에 대한 근원 장애에 해당하는 어플리케이션이 된다.
또, 기능 ID "1002"(기능 B)에 대해서는 고객단말(유형 ID "101), 콘텐츠관리데몬(유형 ID "102") 및 인증데몬(유형 ID "105")에 해당하는 각 어플리케이션이 상관되고 각 어플리케이션의 상관 관계는 고객단말(유형 ID "101) → 인증데몬(유형 ID "105") → 콘텐츠관리데몬(유형 ID "102")를 갖는다는 것을 알 수 있다. 상기 기능 B에서 영향도가 가장 큰 어플리케이션은 종단인 콘텐츠관리데몬이고, 콘텐트관리데몬은 상기 기능 B에 대한 근원 장애에 해당하는 어플리케이션이 된다.
그리고, 기능 ID "1003"(기능 C)에 대해서는 고객단말(유형 ID "101)과 지역비디오데몬(유형 ID "106")에 해당하는 각 어플리케이션이 관련되고 각 어플리케이션의 상관 관계는 고객단말(유형 ID "101) → 지역비디오데몬(유형 ID "106")임을 알 수 있다. 상기 기능 C에서 영향도가 가장 큰 어플리케이션은 종단인 지역비디오데몬이고, 지역비디오데몬은 상기 기능 C에 대한 근원 장애에 해당하는 어플리케이션이 된다.
도 5는 도 4에 도시된 어플리케이션의 상관 관계도와 관련되는 기능상관 관계 요약 테이블로서, 기능별 어플리케이션 상관 관계 DB(150)에 저장되는 테이블이다.
도 5에 의하면, 도 3과 도 4를 통해 설명되는 어플리케이션의 기능별 상관 관계가 기능 ID 필드, 기능구분 필드, 기능상세 필드 및 상관 관계 필드를 통해 저장된다.
한편, 장애 상관관계 분석부(121)는 어플리케이션의 장애 상관관계 분석이 완료되면, 분석 결과를 알람부(160)로 출력하여 담당자나 해당 조직에 통지하여 이를 인지할 수 있도록 한다(S260). 상기 분석결과는 수집된 경보 이벤트에 대한 기능별 어플리케이션의 상관 관계, 각 경보 이벤트의 근원 장애에 해당하는 어플리케이션 등이 될 수 있으며, 수집되어진 경보 이벤트와 각 경보 이벤트의 기능 매핑 결과로부터 얻어진 통계 결과 등이 될 수 있다.
이러한 분석결과를 기 보유한 데이터에 기반하여 사용자가 쉽고 빠르게 고장을 인지할 수 있도록 구성하여 제공된다.
이상에서 설명한 본 발명의 실시예는 장치 및 방법을 통해서만 구현되는 것이 아니며, 본 발명의 실시예의 구성에 대응하는 기능을 실현하기 위한 프로그램, 그 프로그램이 기록된 기록 매체 등을 통해 구현될 수도 있으며, 이러한 구현은 앞서 설명한 실시예의 기재로부터 본 발명이 속하는 기술분야의 전문가라면 쉽게 구현할 수 있을 것이다.
이상 설명한 내용을 통해 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자라면 본 발명의 기술 사상을 일탈하지 않는 범위에서 다양한 변경과 수정 실시가 가능함을 알 수 있을 것이다. 본 발명의 범위는 전술한 설명이 아니라 특허청구범위에 나타나 있으며, 그와 동등한 범위 내에 있는 모든 차이점은 본 발명에 포함된 것으로 해석되어야 할 것이다.
도 1은 본 발명의 실시예에 따른 IT 서비스에서의 어플리케이션 장애 분석 감시 시스템의 전체 블럭 구성도.
도 2는 본 발명의 실시예에 따른 IT 서비스에서의 어플리케이션 장애 분석 감시 방법을 설명하기 위한 플로우차트.
도 3은 본 발명의 실시예에 따른 기능별 어플리케이션 상관관계 DB에 구성되는 테이플들의 예시도.
도 4는 본 발명의 실시예에 따른 기능별 어플리케이션의 상관 관계를 나타낸 도면.
도 5는 본 발명의 실시예에 따른 기능별 어플리케이션 상관관계 DB에 구성되는 기능 상관관계 요약 테이블의 예시도.

Claims (9)

  1. IT 서비스를 제공하기 위한 기능 모듈에 해당하는 각 어플리케이션으로부터 발생하는 경보 이벤트를 수집하는 경보 수집부;
    각 수집된 경보 이벤트에 대해 어플리케이션 기능을 매핑하는 경보종류별 기능매핑부;
    기능별 어플리케이션 상관관계 DB를 기반으로 상기 매핑된 어플리케이션 기능과 관련되는 어플리케이션들의 상관 관계를 분석하여 근원 장애를 판단하는 장애 상관관계 분석부; 및
    상기 장애 상관관계 분석부로부터 전송된 근원 장애 판단 결과를 통지하는 알람부를 포함하되,
    상기 기능별 어플리케이션 상관관계 DB는,
    서비스 기능 테이블, 각 기능과 관련된 어플리케이션에 대한 정보를 저장하는 기능별 상관관계 테이블, 유형 ID 별로 어플리케이션에 대한 정보를 저장하는 어플리케이션 유형 테이블, 기능별 어플리케이션의 상관 관계에 대한 요약 정보가 저장되는 기능 상관관계 요약 테이블을 포함하는 것을 특징으로 하는 IT서비스에서의 어플리케이션 장애 분석 감시 시스템.
  2. 청구항 1에 있어서,
    각 경보와 관련되는 어플리케이션의 기능의 매핑 관계가 저장된 경보 종류별 기능매핑 DB를 더 구비하고,
    상기 경보종류별 기능매핑부는 상기 경보 종류별 기능매핑 DB를 이용하여 상기 경보 이벤트에 관련되는 어플리케이션 기능을 매핑하는 것을 특징으로 하는
    IT서비스에서의 어플리케이션 장애 분석 감시 시스템.
  3. 청구항 2에 있어서, 상기 경보종류별 기능매핑부는
    상기 경보 이벤트와 상기 경보 이벤트에 매핑된 어플리케이션 기능에 대한 정보를 장애 경보 DB에 저장하는 것을 특징으로 하는
    IT서비스에서의 어플리케이션 장애 분석 감시 시스템.
  4. 삭제
  5. 청구항 1에 있어서,
    상기 서비스 기능 테이블은 기능 식별자를 저장하는 ID 필드, 해당 기능과 관련되는 서비스명을 저장하는 서비스명 필드, 해당 기능과 관련되는 서비스의 중분류 정보를 저장하는 기능분류 필드 및 해당 기능과 관련되는 서비스의 상세 분류 정보를 저장하는 상세분류 필드를 구비하고,
    상기 기능별 상관관계 테이블은 각 기능과 관련된 어플리케이션에 대한 정보를 저장하는 테이블로서, 기능 식별자를 저장하는 기능 ID 필드, 상관 어플리케이션의 상관 순서 정보를 저장하는 순서 ID 필드, 상관 어플리케이션의 상관 순서 정보를 저장하는 순서 ID 필드 및 각 기능에 상관되는 어플리케이션의 식별 정보를 저장하는 유형 ID 필드를 구비하는 하는 것을 특징으로 하는 IT서비스에서의 어플리케이션 장애 분석 감시 시스템.
  6. 청구항 1 또는 청구항 5에 있어서, 상기 장애 상관관계 분석부는
    상기 어플리케이션들의 상관 관계에서 최종단의 어플리케이션을 근원 장애로 판단하는 것을 특징으로 하는
    IT서비스에서의 어플리케이션 장애 분석 감시 시스템.
  7. (a) IT 서비스를 제공하기 위한 기능 모듈에 해당하는 각 어플리케이션으로부터 발생하는 경보 이벤트를 수집하는 과정;
    (b) 각 수집된 경보 이벤트에 대해 어플리케이션 기능을 매핑하는 과정;
    (c) 기능별 어플리케이션 상관관계 DB를 기반으로 상기 매핑된 어플리케이션 기능과 관련되는 어플리케이션의 상관관계를 분석하여 근원장애를 판단하는 과정 및
    (d) 상기 어플리케이션의 상관 관계의 분석 결과와 상기 근원 장애의 판단결과를 출력하는 과정을 포함하되,
    상기 기능별 어플리케이션 상관관계 DB는,
    서비스 기능 테이블, 각 기능과 관련된 어플리케이션에 대한 정보를 저장하는 기능별 상관관계 테이블, 유형 ID 별로 어플리케이션에 대한 정보를 저장하는 어플리케이션 유형 테이블, 기능별 어플리케이션의 상관 관계에 대한 요약 정보가 저장되는 기능 상관관계 요약 테이블을 포함하는 것을 특징으로 하는 IT서비스에서의 어플리케이션 장애 분석 감시 방법.
  8. 청구항 7에 있어서, 상기 (b) 과정은
    각 경보와 관련되는 어플리케이션의 기능의 매핑 관계가 저장된 경보 종류별 기능매핑 DB를 이용하여 상기 경보 이벤트에 관련되는 어플리케이션의 기능을 매핑하는 과정과;
    상기 경보 이벤트와 상기 경보 이벤트에 매핑된 어플리케이션 기능에 대한 정보를 장애 경보 DB에 저장하는 과정을 구비하는 것을 특징으로 하는
    IT서비스에서의 어플리케이션 장애 분석 감시 방법.
  9. 청구항 7에 있어서, 상기 (c) 과정은
    각 기능에 대한 어플리케이션의 상관 관계를 저장하는 기능별 어플리케이션 상관관계 DB를 이용하여 상기 경보 이벤트에 해당하는 기능과 관련되는 어플리케이션의 상관 관계를 분석하는 과정과;
    상기 어플리케이션의 상관 관계에서 최종단의 어플리케이션을 근원 장애로 판단하는 것을 특징으로 하는
    IT서비스에서의 어플리케이션 장애 분석 감시 방법.
KR1020090051916A 2009-06-11 2009-06-11 It서비스에서의 어플리케이션 장애 분석 감시 시스템 및 방법 KR101520103B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020090051916A KR101520103B1 (ko) 2009-06-11 2009-06-11 It서비스에서의 어플리케이션 장애 분석 감시 시스템 및 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020090051916A KR101520103B1 (ko) 2009-06-11 2009-06-11 It서비스에서의 어플리케이션 장애 분석 감시 시스템 및 방법

Publications (2)

Publication Number Publication Date
KR20100133168A KR20100133168A (ko) 2010-12-21
KR101520103B1 true KR101520103B1 (ko) 2015-05-21

Family

ID=43508592

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020090051916A KR101520103B1 (ko) 2009-06-11 2009-06-11 It서비스에서의 어플리케이션 장애 분석 감시 시스템 및 방법

Country Status (1)

Country Link
KR (1) KR101520103B1 (ko)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101545215B1 (ko) 2013-10-30 2015-08-18 삼성에스디에스 주식회사 데이터 센터 장애 이벤트 관리 자동화 시스템 및 방법
KR101965839B1 (ko) 2017-08-18 2019-04-05 주식회사 티맥스 소프트 구성정보 관리 데이터베이스 기반의 it 시스템 장애 분석 기법

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20060093524A (ko) * 2005-02-22 2006-08-25 주식회사 어니언소프트웨어 It 서비스의 품질개선을 위한 it 서비스 관리 방법
KR20090001786A (ko) * 2007-05-21 2009-01-09 김진수 전산장애로 인한 비즈니스 영향도 분석 시스템

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20060093524A (ko) * 2005-02-22 2006-08-25 주식회사 어니언소프트웨어 It 서비스의 품질개선을 위한 it 서비스 관리 방법
KR20090001786A (ko) * 2007-05-21 2009-01-09 김진수 전산장애로 인한 비즈니스 영향도 분석 시스템

Also Published As

Publication number Publication date
KR20100133168A (ko) 2010-12-21

Similar Documents

Publication Publication Date Title
US11500757B2 (en) Method and system for automatic real-time causality analysis of end user impacting system anomalies using causality rules and topological understanding of the system to effectively filter relevant monitoring data
US9413597B2 (en) Method and system for providing aggregated network alarms
CA2835446C (en) Data analysis system
US8352790B2 (en) Abnormality detection method, device and program
KR101951526B1 (ko) 스마트팩토리 플랫폼을 위한 인터페이스 미들웨어 시스템 및 그 동작방법
US8874642B2 (en) System and method for managing the performance of an enterprise application
US10652103B2 (en) System and method for handling events involving computing systems and networks using fabric monitoring system
US20130166729A1 (en) Method and system for message tracking and checking
WO2021114971A1 (zh) 一种检测基于多层架构的应用系统是否正常运行的方法
US8554908B2 (en) Device, method, and storage medium for detecting multiplexed relation of applications
CN103518192A (zh) 大规模服务的实时诊断流水线
KR101520103B1 (ko) It서비스에서의 어플리케이션 장애 분석 감시 시스템 및 방법
CN117729576A (zh) 告警监控方法、装置、设备及存储介质
CN117376107A (zh) 一种智能化网络管理方法、系统、计算机设备及介质
US20060053021A1 (en) Method for monitoring and managing an information system
Kuang et al. Knowledge-aware Alert Aggregation in Large-scale Cloud Systems: a Hybrid Approach
Li et al. An integrated data-driven framework for computing system management
JP2017199250A (ja) 計算機システム、データの分析方法、及び計算機
CN111988172B (zh) 一种网络信息管理平台、装置及安全管理方法
KR20030056301A (ko) 시스템 장애 통합관리방법
Afshinpour et al. Telemetry-based Software Failure Prediction by Concept-space Model Creation
WO2018173698A1 (ja) 監視システム、コンピュータ可読記憶媒体および監視方法
JP5261510B2 (ja) ネットワーク監視装置及び方法及びプログラム
CN115567319A (zh) 一种日志采集解析规则优化以及系统性能优化
CN118627023A (zh) 一种进行微服务间调用跟踪的分析系统

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20180503

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20190502

Year of fee payment: 5