KR20180005512A - Apparatus and method for detecting error occurrence - Google Patents

Apparatus and method for detecting error occurrence Download PDF

Info

Publication number
KR20180005512A
KR20180005512A KR1020160085718A KR20160085718A KR20180005512A KR 20180005512 A KR20180005512 A KR 20180005512A KR 1020160085718 A KR1020160085718 A KR 1020160085718A KR 20160085718 A KR20160085718 A KR 20160085718A KR 20180005512 A KR20180005512 A KR 20180005512A
Authority
KR
South Korea
Prior art keywords
event
tree
failure
window size
information
Prior art date
Application number
KR1020160085718A
Other languages
Korean (ko)
Other versions
KR102670723B1 (en
Inventor
전재규
이종필
Original Assignee
주식회사 케이티
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 케이티 filed Critical 주식회사 케이티
Priority to KR1020160085718A priority Critical patent/KR102670723B1/en
Priority claimed from KR1020160085718A external-priority patent/KR102670723B1/en
Publication of KR20180005512A publication Critical patent/KR20180005512A/en
Application granted granted Critical
Publication of KR102670723B1 publication Critical patent/KR102670723B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/147Network analysis or design for predicting network behaviour
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/149Network analysis or design for prediction of maintenance
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/06Generation of reports

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

The present invention provides a device and a method for judging a failure occurrence, which analyze event information of a failure event generated from a communication device, predict whether the failure event occurs, and provide the predicted result to a manager. The device for judging a failure occurrence comprises: a collection part collecting the event information with respect to the event generated from a plurality of communication devices; a registration part registering a window size with respect to the plurality of communication devices; a tree building part building an event tree based on a plurality of events related to a predetermined event and the registered window size, if the predetermined event generated from the plurality of communication devices occurs; and an analysis part analyzing the collected event information based on the built event tree.

Description

장애 발생 판단 장치 및 장애 발생 판단 방법{APPARATUS AND METHOD FOR DETECTING ERROR OCCURRENCE}[0001] APPARATUS AND METHOD FOR DETECTING ERROR OCCURRENCE [0002]

본 발명은 장애 발생 판단 장치 및 장애 발생 판단 방법에 관한 것이다. The present invention relates to a fault occurrence determination apparatus and a fault occurrence determination method.

ICT(Information Communication Technology) 통합관제 시스템은 IT 인프라를 관리하고, 다양한 요소들의 연계를 통해 전체 IT 자원 상황을 종합적으로 판단할 수 있는 통합관제 체제의 시스템을 말한다. ICT (Information Communication Technology) Integrated control system is a system of integrated control system that manages IT infrastructure and can collectively judge the overall IT resource situation through linkage of various factors.

ICT 통합관제 시스템은 CT 자원의 경우, 네트워크 및 회선 장비를 관리하기 위해 네트워크 장비에서 제공하는 프로토콜(SNMP, CMIP 등)을 통해 정보를 수집하거나, syslog, trap, cli 등의 명령어를 활용하여 정보를 수집함으로써, 장애 및 성능 정보를 모니터링하여 관리자에게 제공할 수 있다. ICT 통합관제 시스템은 IT 자원의 경우, 네트워크 연결 여부(ping 등)를 이용하여 시스템 감지 및 어플리케이션의 장애, 성능 정보를 주기적으로 수집하여 장애 이벤트를 관리자에게 제공할 수 있다. In the case of CT resources, the ICT integrated control system collects information through protocols (SNMP, CMIP, etc.) provided by the network equipment or manages information by using commands such as syslog, trap and cli to manage network and line equipment By collecting, fault and performance information can be monitored and provided to the administrator. In the case of IT resources, the ICT integrated control system can periodically collect system failure detection information, application failure information, and performance information by using network connection (ping, etc.) and provide fault events to the administrator.

이러한 ICT 통합관제 시스템과 관련하여, 선행기술인 한국등록특허 제 10-1204236호는 통합 관제 시스템 및 방법을 개시하고 있다. With respect to this ICT integrated control system, Korean Patent Registration No. 10-1204236, a prior art, discloses an integrated control system and method.

그러나 기존의 ICT 통합관제 시스템은 다수의 장애가 발생하는 경우, 장비에서 발생된 다수의 장애 이벤트만으로 서비스 장애를 판단할 수 없다. 또한, 장비에서 발생된 이벤트 정보가 실제 서비스 장애와 관련이 없을 수도 있으므로, 하나의 장애 이벤트만으로 서비스 장애를 판단하기 어렵다는 단점을 가지고 있다. However, the existing ICT integrated control system can not judge the service failure by only a plurality of failure events generated in the equipment when a plurality of failures occur. In addition, since the event information generated by the equipment may not be related to the actual service failure, it is difficult to determine the service failure based on only one failure event.

통신 장비에서 발생된 장애 이벤트의 이벤트 정보를 분석하여 장애 이벤트의 발생 여부를 예측하고, 예측 결과를 관리자에게 제공하는 장애 발생 판단 장치 및 장애 발생 판단 방법을 제공하고자 한다. 장애 발생 시, 장애 발생으로 인한 손실을 최소화하고, 관리자로 하여금 장애 이벤트를 빠르게 대처할 수 있도록 신뢰성을 제공하는 장애 발생 판단 장치 및 장애 발생 판단 방법을 제공하고자 한다. 장비 별로 발생할 수 있는 이벤트에 대한 패턴을 학습시킴으로써, 다양하고 방대한 이벤트를 지식 베이스로서 구축하고, 반복적이고 다양한 유형으로 발생하는 장애를 사전에 예측하여 방지할 수 있도록 하는 장애 발생 판단 장치 및 장애 발생 판단 방법을 제공하고자 한다. 다만, 본 실시예가 이루고자 하는 기술적 과제는 상기된 바와 같은 기술적 과제들로 한정되지 않으며, 또 다른 기술적 과제들이 존재할 수 있다. The present invention provides a fault occurrence determination apparatus and a fault occurrence determination method that predicts whether a fault event is generated by analyzing event information of a fault event generated in a communication device, and provides a prediction result to an administrator. The present invention provides a fault occurrence determination device and a fault occurrence determination method that minimize the loss due to a fault occurrence when a fault occurs and allow the administrator to quickly respond to the fault event. By learning a pattern of an event that can occur for each equipment, it is possible to construct a variety of large-scale events as a knowledge base, and to make it possible to anticipate and prevent failures occurring in repetitive and various types, Method. It is to be understood, however, that the technical scope of the present invention is not limited to the above-described technical problems, and other technical problems may exist.

상술한 기술적 과제를 달성하기 위한 수단으로서, 본 발명의 일 실시예는, 복수개의 통신 장비로부터 발생된 이벤트에 대한 이벤트 정보를 수집하는 수집부, 상기 복수개의 통신 장비에 대한 윈도우 사이즈를 등록받는 등록부, 상기 복수개의 통신 장비로부터 기설정된 이벤트가 발생하는 경우, 상기 기설정된 이벤트와 관련된 복수개의 이벤트 및 상기 등록받은 윈도우 사이즈에 기초하여 이벤트 트리를 구축하는 트리 구축부 및 상기 구축된 이벤트 트리에 기초하여 상기 수집된 이벤트 정보를 분석하는 분석부를 포함하는 장애 발생 판단 장치를 제공할 수 있다. According to an aspect of the present invention, there is provided a communication system including a collecting unit for collecting event information on events generated from a plurality of communication equipments, a registration unit for registering a window size for the plurality of communication equipments, A tree construction unit for constructing an event tree based on a plurality of events related to the preset event and the registered window size when a predetermined event is generated from the plurality of communication equipments, And an analyzer for analyzing the collected event information.

또한, 본 발명의 다른 실시예는, 복수개의 통신 장비로부터 발생된 이벤트에 대한 이벤트 정보를 수집하는 수집부, 상기 복수개의 통신 장비에 대한 윈도우 사이즈를 등록받는 등록부, 상기 등록받은 윈도우 사이즈 및 상기 수집된 이벤트 정보에 기초하여 이벤트 트리를 구축하는 트리 구축부 및 상기 구축된 이벤트 트리에 기초하여 상기 수집된 이벤트 정보를 분석하여 상기 복수개의 통신 장비 중 적어도 하나에 서비스 장애 이벤트가 발생할지 여부를 예측하는 예측부를 포함하는 장애 발생 판단 장치를 제공할 수 있다. According to another embodiment of the present invention, there is provided a communication apparatus including a collection unit for collecting event information on events generated from a plurality of communication equipments, a registration unit for registering a window size for the plurality of communication equipments, A tree construction unit for constructing an event tree based on the event information, and analyzing the collected event information based on the constructed event tree to predict whether a service fault event occurs in at least one of the plurality of communication equipments It is possible to provide a fault occurrence determination apparatus including a prediction unit.

또한, 본 발명의 또 다른 실시예는, 복수개의 통신 장비로부터 발생된 이벤트에 대한 이벤트 정보를 수집하는 단계, 상기 복수개의 통신 장비에 대한 윈도우 사이즈를 등록받는 단계, 상기 복수개의 통신 장비로부터 기설정된 이벤트가 발생하는 경우, 상기 기설정된 이벤트와 관련된 복수개의 이벤트 및 상기 등록받은 윈도우 사이즈에 기초하여 이벤트 트리를 구축하는 단계, 상기 구축된 이벤트 트리에 기초하여 상기 수집된 이벤트 정보를 분석하여 상기 복수개의 통신 장비 중 적어도 하나에 서비스 장애 이벤트가 발생할지 여부를 예측하는 단계를 포함하는 장애 발생 판단 방법을 제공할 수 있다. According to another embodiment of the present invention, there is provided a method for controlling a communication device, the method comprising: collecting event information for an event generated from a plurality of communication devices; registering a window size for the plurality of communication devices; The method comprising the steps of: constructing an event tree based on a plurality of events related to the preset event and the registered window size when an event occurs, analyzing the collected event information based on the constructed event tree, And estimating whether or not a service fault event occurs in at least one of the communication devices.

상술한 과제 해결 수단은 단지 예시적인 것으로서, 본 발명을 제한하려는 의도로 해석되지 않아야 한다. 상술한 예시적인 실시예 외에도, 도면 및 발명의 상세한 설명에 기재된 추가적인 실시예가 존재할 수 있다.The above-described task solution is merely exemplary and should not be construed as limiting the present invention. In addition to the exemplary embodiments described above, there may be additional embodiments described in the drawings and the detailed description of the invention.

전술한 본 발명의 과제 해결 수단 중 어느 하나에 의하면, 통신 장비에서 발생된 장애 이벤트의 이벤트 정보를 분석하여 장애 이벤트의 발생 여부를 예측하고, 예측 결과를 관리자에게 제공하는 장애 발생 판단 장치 및 장애 발생 판단 방법을 제공할 수 있다. 장애 발생 시, 장애 발생으로 인한 손실을 최소화하고, 관리자로 하여금 장애 이벤트를 빠르게 대처할 수 있도록 신뢰성을 제공하는 장애 발생 판단 장치 및 장애 발생 판단 방법을 제공할 수 있다. 장비 별로 발생할 수 있는 이벤트에 대한 패턴을 학습시킴으로써, 다양하고 방대한 이벤트를 지식 베이스로서 구축하고, 반복적이고 다양한 유형으로 발생하는 장애를 사전에 예측하여 방지할 수 있도록 하는 장애 발생 판단 장치 및 장애 발생 판단 방법을 제공할 수 있다.According to any one of the above-mentioned objects of the present invention, there is provided a fault occurrence determination device for analyzing event information of a fault event generated in a communication device to predict whether or not a fault event is generated, A judgment method can be provided. It is possible to provide a failure occurrence determination device and a failure occurrence determination method that minimize the loss due to the occurrence of a failure when a failure occurs and provide reliability so that the administrator can quickly respond to the failure event. By learning a pattern of an event that can occur for each equipment, it is possible to construct a variety of large-scale events as a knowledge base, and to make it possible to anticipate and prevent failures occurring in repetitive and various types, Method can be provided.

도 1은 종래의 통신 장비에서 이벤트가 발생된 경우의 장애 이벤트 정보를 제공하는 과정을 설명하기 위한 예시적인 도면이다.
도 2는 본 발명의 일 실시예에 따른 장애 발생 판단 시스템의 구성도이다.
도 3은 본 발명의 일 실시예에 따른 장애 발생 판단 장치의 구성도이다.
도 4는 본 발명의 일 실시예에 따른 윈도우 사이즈 및 이벤트 정보에 대한 속성 정보의 등록 UI를 도시한 예시적인 도면이다.
도 5는 본 발명의 일 실시예에 따른 장애 발생 판단 장치에서 이벤트 트리를 구축하는 과정을 설명하기 위한 예시적인 도면이다.
도 6은 본 발명의 일 실시예에 따른 장애 발생 판단 장치에서 기설정된 이벤트에 따라 이벤트 트리를 구축하여 이벤트 정보를 분석하는 방법의 순서도이다.
도 7은 본 발명의 일 실시예에 따른 장애 발생 판단 장치에서 장애 발생을 판단하는 방법의 순서도이다.
도 8은 본 발명의 일 실시예에 따른 장애 발생 판단 장치에서 수집된 이벤트 정보를 분석하여 서비스 장애 이벤트의 발생 여부를 예측하는 과정을 설명하기 위한 예시적인 도면이다.
도 9는 본 발명의 일 실시예에 따른 장애 발생 판단 장치에서 이벤트 정보와 이벤트 트리를 비교하여 일치도를 산출하는 과정을 설명하기 위한 예시적인 도면이다.
1 is an exemplary diagram for explaining a process of providing failure event information when an event is generated in a conventional communication device.
2 is a configuration diagram of a fault occurrence determination system according to an embodiment of the present invention.
3 is a block diagram of a fault occurrence determination apparatus according to an embodiment of the present invention.
4 is an exemplary diagram illustrating a registration UI of attribute information for a window size and event information according to an exemplary embodiment of the present invention.
5 is an exemplary diagram illustrating a process of constructing an event tree in the fault occurrence determination apparatus according to an embodiment of the present invention.
6 is a flowchart illustrating a method of analyzing event information by constructing an event tree according to a preset event in the fault occurrence determination apparatus according to an embodiment of the present invention.
FIG. 7 is a flowchart of a method for determining a failure occurrence in a failure occurrence determination apparatus according to an embodiment of the present invention. Referring to FIG.
8 is an exemplary diagram for explaining a process of estimating whether a service fault event is generated by analyzing event information collected by the fault occurrence determination apparatus according to an embodiment of the present invention.
9 is an exemplary diagram for explaining a process of comparing the event information and the event tree in the fault occurrence determination apparatus according to an embodiment of the present invention to calculate the match degree.

아래에서는 첨부한 도면을 참조하여 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 본 발명의 실시예를 상세히 설명한다. 그러나 본 발명은 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시예에 한정되지 않는다. 그리고 도면에서 본 발명을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호를 붙였다. Hereinafter, embodiments of the present invention will be described in detail with reference to the accompanying drawings, which will be readily apparent to those skilled in the art. The present invention may, however, be embodied in many different forms and should not be construed as limited to the embodiments set forth herein. In order to clearly illustrate the present invention, parts not related to the description are omitted, and similar parts are denoted by like reference characters throughout the specification.

명세서 전체에서, 어떤 부분이 다른 부분과 "연결"되어 있다고 할 때, 이는 "직접적으로 연결"되어 있는 경우뿐 아니라, 그 중간에 다른 소자를 사이에 두고 "전기적으로 연결"되어 있는 경우도 포함한다. 또한 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있는 것을 의미하며, 하나 또는 그 이상의 다른 특징이나 숫자, 단계, 동작, 구성요소, 부분품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다. Throughout the specification, when a part is referred to as being "connected" to another part, it includes not only "directly connected" but also "electrically connected" with another part in between . Also, when an element is referred to as "including" an element, it is to be understood that the element may include other elements as well as other elements, And does not preclude the presence or addition of one or more other features, integers, steps, operations, components, parts, or combinations thereof.

본 명세서에 있어서 '부(部)'란, 하드웨어에 의해 실현되는 유닛(unit), 소프트웨어에 의해 실현되는 유닛, 양방을 이용하여 실현되는 유닛을 포함한다. 또한, 1 개의 유닛이 2 개 이상의 하드웨어를 이용하여 실현되어도 되고, 2 개 이상의 유닛이 1 개의 하드웨어에 의해 실현되어도 된다.In this specification, the term " part " includes a unit realized by hardware, a unit realized by software, and a unit realized by using both. Further, one unit may be implemented using two or more hardware, or two or more units may be implemented by one hardware.

본 명세서에 있어서 단말 또는 디바이스가 수행하는 것으로 기술된 동작이나 기능 중 일부는 해당 단말 또는 디바이스와 연결된 서버에서 대신 수행될 수도 있다. 이와 마찬가지로, 서버가 수행하는 것으로 기술된 동작이나 기능 중 일부도 해당 서버와 연결된 단말 또는 디바이스에서 수행될 수도 있다.In this specification, some of the operations or functions described as being performed by the terminal or the device may be performed in the server connected to the terminal or the device instead. Similarly, some of the operations or functions described as being performed by the server may also be performed on a terminal or device connected to the server.

이하 첨부된 도면을 참고하여 본 발명의 일 실시예를 상세히 설명하기로 한다. Hereinafter, embodiments of the present invention will be described in detail with reference to the accompanying drawings.

도 1은 종래의 통신 장비에서 이벤트가 발생된 경우의 장애 이벤트 정보를 제공하는 과정을 설명하기 위한 예시적인 도면이다. 도 1을 참조하면, 통신 장비에서 그래픽 카드 또는 메인 보드에 장애가 발생한 경우, 통신 장비는 시스템을 바로 다운(down)시키지 않고, 다양한 장애 이벤트 및 성능/품질 이벤트를 관리자에게 제공할 수 있다. 1 is an exemplary diagram for explaining a process of providing failure event information when an event is generated in a conventional communication device. Referring to FIG. 1, when a failure occurs in a graphics card or a main board in a communication device, the communication device can provide various kinds of failure events and performance / quality events to the manager without directly down the system.

예를 들어, 통신 장비는 장애 이벤트가 발생한 경우, 메인보드에서 제공하는 syslog 메시지를 알림 형태로 관리자 단말(미도시)로 제공할 수 있다. 다른 예를 들어, 통신 장비는 성능/품질 이벤트가 발생한 경우, 통신 장비의 부하 평균 상승, CPU 평균 다운, 프리 메모리(free memory) 다운, 대기 QUEUE SIZE 상승 등을 임계치 이벤트 정보로서 관리자 또는 사용자에게 제공할 수 있다. For example, when a failure event occurs, the communication device can provide a syslog message provided by the main board to a manager terminal (not shown) in a notification form. In another example, when a performance / quality event occurs, the communication device provides a load average, a CPU average, a free memory, a standby QUEUE SIZE, and the like of the communication equipment as threshold event information to the administrator or the user can do.

관리자 단말(미도시)은 통신 장비로부터 장애 이벤트 및 성능 임계치에 대한 초과/이하 이벤트 정보를 수신하여, 예를 들어, 총 9개의 이벤트 정보를 디스플레이를 통해 표시할 수 있다. The administrator terminal (not shown) receives over / under event information on the failure event and the performance threshold from the communication equipment and displays, for example, a total of nine event information through a display.

그러나 이벤트 정보가 과도하게 발생되고, 최근에 발생된 이벤트와 기존에 처리되지 않은 이벤트가 혼재되어 있는 경우, 관리자는 통신 장비에서 발생된 단순 장애를 발견하기 어렵다는 단점을 가지고 있다. 또한, 장애 이벤트가 누적되면, 결국 메인 보드에 장애가 발생되어 정상적인 통신 서비스를 제공하지 못하게 되는 경우가 종종 발생되고 있다. However, when the event information is excessively generated, and the recently generated event and the unprocessed event are mixed, the manager has a disadvantage that it is difficult to detect a simple fault generated in the communication equipment. In addition, when the failure events are accumulated, a fault occurs in the main board and the normal communication service can not be provided.

도 2는 본 발명의 일 실시예에 따른 장애 발생 판단 시스템의 구성도이다. 도 2를 참조하면, 장애 발생 판단 시스템(1)은 복수개의 통신 장비(210) 및 장애 발생 판단 장치(220)를 포함할 수 있다. 도 2에 도시된 복수개의 통신 장비(210) 및 장애 발생 판단 장치(220)는 장애 발생 판단 시스템(1)에 의하여 제어될 수 있는 구성요소들을 예시적으로 도시한 것이다. 2 is a configuration diagram of a fault occurrence determination system according to an embodiment of the present invention. Referring to FIG. 2, the failure occurrence determination system 1 may include a plurality of communication devices 210 and a failure occurrence determination device 220. The plurality of communication devices 210 and the failure occurrence determination device 220 shown in FIG. 2 illustratively show the components that can be controlled by the failure occurrence determination system 1. As shown in FIG.

도 2의 장애 발생 판단 시스템(1)의 각 구성요소들은 일반적으로 네트워크(network)를 통해 연결된다. 예를 들어, 도 1에 도시된 바와 같이, 장애 발생 판단 장치(220)는 복수개의 통신 장비(210)와 동시에 또는 시간 간격을 두고 연결될 수 있다. Each component of the failure occurrence judgment system 1 of FIG. 2 is generally connected via a network. For example, as shown in FIG. 1, the failure occurrence determination device 220 may be connected to the plurality of communication devices 210 at the same time or at intervals.

네트워크는 단말들 및 서버들과 같은 각각의 노드 상호간에 정보교환이 가능한 연결구조를 의미하는 것으로, 이러한 네트워크의 일예는, 3G, 4G, 5G, Wi-Fi, 블루투스(Bluetooth), 인터넷(Internet), LAN(Local Area Network), Wireless LAN(Wireless Local Area Network), WAN(Wide Area Network), PAN(Personal Area Network) 등이 포함되나 이에 한정되지는 않는다.The network refers to a connection structure in which information can be exchanged between each node such as terminals and servers. An example of such a network is 3G, 4G, 5G, Wi-Fi, Bluetooth, , A LAN (Local Area Network), a Wireless LAN (Local Area Network), a WAN (Wide Area Network), a PAN (Personal Area Network), and the like.

복수개의 통신 장비(210)는 발생된 이벤트에 대한 이벤트 정보를 장애 발생 판단 장치(220)로 전송할 수 있다. 복수개의 통신 장비(210)는 IT 또는 CT 장비일 수 있다. 복수개의 통신 장비(210)에서 발생된 이벤트는 장애 데이터를 기반으로 하는 장애 이벤트, 손실/지연/처리량과 같은 성능/품질 데이터를 기반으로 하는 성능/품질 이벤트 및 서비스 장애 이벤트를 포함할 수 있다. 장애 이벤트는 장애의 정도에 따라 인폼(inform) 장애 이벤트, 마이너(minor) 장애 이벤트, 메이저(major) 장애 이벤트 및 크리티컬(critical) 장애 이벤트를 포함할 수 있다. 성능/품질 이벤트는 성능/품질 데이터가 일정 임계치를 초과하는 경우 이벤트화된 것을 의미할 수 있다.The plurality of communication devices 210 may transmit the event information about the generated event to the failure occurrence determination device 220. The plurality of communication devices 210 may be IT or CT equipment. Events generated in the plurality of communication devices 210 may include performance / quality events based on performance / quality data such as failure events based on failure data, loss / delay / throughput, and service failure events. The fault event may include an inform fault event, a minor fault event, a major fault event, and a critical fault event depending on the degree of the fault. The performance / quality event may mean that the performance / quality data is eventized when the data exceeds the predetermined threshold.

장애 발생 판단 장치(220)는 복수개의 통신 장비(210)로부터 발생된 이벤트에 대한 이벤트 정보를 수집할 수 있다. 예를 들어, 장애 발생 판단 장치(220)는 복수개의 통신 장비(210)로부터 트랩(trap) 또는 SNMP 등을 이용한 폴링(polling) 방식으로 이벤트에 대한 이벤트 정보를 수집할 수 있다. The failure occurrence determination device 220 can collect event information on events generated from the plurality of communication devices 210. [ For example, the failure occurrence determination device 220 may collect event information about an event from a plurality of communication devices 210 in a polling manner using a trap or SNMP.

장애 발생 판단 장치(220)는 복수개의 통신 장비(210)에 대한 윈도우 사이즈를 등록받을 수 있다. 이 때, 장애 발생 판단 장치(220)는 각 통신 장비 별로 감시할 이벤트의 수와 대응되도록 윈도우 사이즈를 등록받을 수 있다. 또한, 장애 발생 판단 장치(120)는 이벤트 트리에 포함되는 복수개의 이벤트 정보에 대한 속성 정보를 각각 등록받을 수 있다. 속성 정보는 각 이벤트의 순서 준수 여부, 각 이벤트의 지속 시간 및 각 이벤트의 중복성 허용 여부 등을 포함할 수 있다. The failure occurrence determination device 220 can register a window size for a plurality of communication devices 210. [ At this time, the failure occurrence determination device 220 can register the window size so as to correspond to the number of events to be monitored for each communication device. In addition, the failure occurrence determination apparatus 120 may register attribute information of a plurality of event information included in the event tree. The attribute information may include the order of each event, the duration of each event, and whether or not each event is redundant.

장애 발생 판단 장치(220)는 이벤트 정보를 수집하는 시점마다 이벤트 정보와 대응하는 통신 장비와의 네트워크 연결 상태에 기초하여 서비스 장애 이벤트의 발생 여부를 판단할 수 있다. The failure occurrence determination device 220 can determine whether a service failure event is generated based on the network connection state between the event information and the corresponding communication device at each time point at which the event information is collected.

장애 발생 판단 장치(220)는 복수개의 통신 장비(210)로부터 기설정된 이벤트가 발생하는 경우, 기설정된 이벤트와 관련된 복수개의 이벤트 및 등록받은 윈도우 사이즈에 기초하여 이벤트 트리를 구축할 수 있다. 이 때, 장애 발생 판단 장치(220)는 각 통신 장비 별로 이벤트 트리를 구축할 수 있다. 기설정된 이벤트는 크리티컬 장애 이벤트, 서비스 장애 이벤트 등을 포함할 수 있다. When a predetermined event is generated from a plurality of communication devices 210, the failure occurrence determination device 220 can construct an event tree based on a plurality of events related to a preset event and a registered window size. At this time, the failure occurrence determination device 220 can construct an event tree for each communication device. The predetermined event may include a critical failure event, a service failure event, and the like.

예를 들어, 장애 발생 판단 장치(220)는 기설정된 이벤트로 크리티컬 장애 이벤트가 발생하는 경우, 크리티컬 이벤트가 발생되기 전 발생되고 등록된 윈도우 사이즈와 대응되는 복수개의 이벤트의 이벤트 정보를 저장하여 이벤트 트리를 구축할 수 있다.For example, when a critical failure event occurs as a preset event, the failure occurrence determination unit 220 stores event information of a plurality of events generated before a critical event occurs and corresponding to the registered window size, Can be constructed.

다른 예를 들어, 장애 발생 판단 장치(220)는 기설정된 이벤트로 서비스 장애 이벤트가 발생하는 경우, 서비스 장애 이벤트가 발생되기 전 발생되고 등록된 윈도우 사이즈와 대응되는 복수개의 이벤트의 이벤트 정보를 저장하여 이벤트 트리를 구축할 수 있다. For example, when a service fault event occurs in a preset event, the fault occurrence determination unit 220 stores event information of a plurality of events that occurred before the occurrence of the service fault event and corresponded to the registered window size You can build an event tree.

장애 발생 판단 장치(220)는 기설정된 이벤트가 발생되기 전 발생되고 등록된 윈도우 사이즈와 대응되는 복수개의 이벤트의 이벤트 정보를 구축된 이벤트 트리와 비교하여 구축된 이벤트 트리에 새로운 이벤트에 대한 이벤트 정보를 추가할 수 있다. The failure occurrence determination device 220 compares event information of a plurality of events generated before the preset event is generated and corresponding to a registered window size with the established event tree to generate event information about a new event in the event tree Can be added.

장애 발생 판단 장치(220)는 구축된 이벤트 트리에 기초하여 수집된 이벤트 정보를 분석하여 복수개의 통신 장비(210) 중 적어도 하나에 서비스 장애 이벤트가 발생할지 여부를 예측할 수 있다. 이 때, 장애 발생 판단 장치(220)는 각 통신 장비 별로 서비스 장애 이벤트가 발생할지 여부를 예측할 수 있다.The failure occurrence determination device 220 may analyze the collected event information based on the constructed event tree to predict whether a service failure event occurs in at least one of the plurality of communication devices 210. [ At this time, the failure occurrence determination device 220 can predict whether or not a service failure event occurs for each communication device.

예를 들어, 장애 발생 판단 장치(220)는 이벤트 정보를 수집하는 시점마다 등록된 윈도우 사이즈와 대응되는 복수개의 이벤트의 이벤트 정보와 이벤트 트리를 비교하여 일치도를 산출함으로써, 서비스 장애 이벤트의 발생 가능성을 예측할 수 있다. 이 때, 장애 발생 판단 장치(220)는 각 통신 장비 별로 산출된 일치도 중 최대값을 별도의 디스플레이를 통해 표시되도록 할 수 있다. For example, the failure occurrence determination device 220 compares the event information of the plurality of events corresponding to the registered window size with the event tree at each time when the event information is collected, Can be predicted. At this time, the failure occurrence determination device 220 may display the maximum value of the match degree calculated for each communication device through a separate display.

도 3은 본 발명의 일 실시예에 따른 장애 발생 판단 장치의 구성도이다. 도 3을 참조하면, 장애 발생 판단 장치(220)는 수집부(310), 등록부(320), 장애 판단부(330), 트리 구축부(340) 및 분석부(350)를 포함할 수 있다. 3 is a block diagram of a fault occurrence determination apparatus according to an embodiment of the present invention. 3, the fault occurrence determination apparatus 220 may include a collecting unit 310, a registering unit 320, a failure determining unit 330, a tree building unit 340, and an analyzing unit 350.

수집부(310)는 복수개의 통신 장비(110)로부터 발생된 이벤트에 대한 이벤트 정보를 수집할 수 있다. 복수개의 통신 장비(110)로부터 발생된 이벤트는 장애 데이터를 기반으로 하는 장애 이벤트, 손실/지연/처리량과 같은 성능/품질 데이터를 기반으로 하는 성능/품질 이벤트 및 서비스 장애 이벤트를 포함할 수 있다. 수집부(210)는 복수개의 통신 장비(110)에서 발생된 이벤트에 대한 이벤트 정보를 트랩(trap) 또는 SNMP 등을 이용한 폴링(polling) 방식으로 수집하여 로 데이터(raw data)로 관리할 수 있다. The collecting unit 310 may collect event information on events generated from the plurality of communication equipments 110. Events generated from a plurality of communication devices 110 may include performance / quality events based on performance / quality data such as failure events based on failure data, loss / delay / throughput, and service failure events. The collecting unit 210 collects event information about events generated in the plurality of communication equipments 110 by a polling method using a trap or SNMP and manages the event information as raw data .

등록부(320)는 복수개의 통신 장비(110)에 대한 윈도우 사이즈를 등록받을 수 있다. 이 때, 등록부(320)는 각 통신 장비 별로 감시할 이벤트의 수와 대응되도록 윈도우 사이즈를 등록받을 수 있으며, 디폴트 값으로 설정될 수도 있다. 예를 들어, 등록부(220)는 장애 발생 판단 서비스를 제공받을 통신 장비명, 윈도우 사이즈의 기본 정보, 고객이 사용하는 IP 또는 URL을 등록받을 수 있다. The registration unit 320 can register a window size for the plurality of communication equipments 110. At this time, the registration unit 320 may register the window size so as to correspond to the number of events to be monitored for each communication device, and may be set to a default value. For example, the registration unit 220 may register the name of the communication equipment to be provided with the failure occurrence determination service, basic information of the window size, IP or URL used by the customer.

등록부(320)는 이벤트 트리에 포함되는 복수개의 이벤트 정보에 대한 속성 정보를 각각 등록받을 수 있다. 속성 정보는 각 통신 장비 별로 이벤트 트리에 포함된 각 이벤트 정보와 대응되는 이벤트 노드의 속성을 나타내는 것으로, 예를 들어, 각 이벤트의 순서 준수 여부, 각 이벤트의 지속 시간 및 각 이벤트의 중복성 허용 여부 등을 포함할 수 있다. The registration unit 320 can register attribute information of a plurality of event information included in the event tree. The attribute information indicates the attribute of the event node corresponding to each event information included in the event tree for each communication device. For example, whether or not the order of each event, the duration of each event, and the redundancy of each event are allowed . ≪ / RTI >

등록부(320)에서 복수개의 통신 장비(210)에 대한 윈도우 사이즈 및 이벤트 트리에 포함되는 복수개의 이벤트 정보에 대한 속성 정보를 등록받는 과정에 대해서는 도 4를 통해 상세히 설명하도록 하겠다. The window size of the plurality of communication equipments 210 and registering the attribute information of the plurality of event information included in the event tree in the registration unit 320 will be described in detail with reference to FIG.

도 4는 본 발명의 일 실시예에 따른 윈도우 사이즈 및 이벤트 정보에 대한 속성 정보의 등록 UI를 도시한 예시적인 도면이다. 도 4를 참조하면, 장애 발생 판단 장치(220)는 장애 발생 판단 서비스를 제공하기 위해 장비별 윈도우 사이즈 및 이벤트에 대한 속성 정보를 등록받음으로써, 각 통신 장비(210)별로 이벤트 트리를 구축할 수 있게 된다. 4 is an exemplary diagram illustrating a registration UI of attribute information for a window size and event information according to an exemplary embodiment of the present invention. Referring to FIG. 4, the failure occurrence determination device 220 can register an event window for each communication device 210 by registering window size and event attribute information for each device to provide a failure occurrence determination service .

등록 UI는 윈도우 사이즈 등록 UI(410) 및 이벤트 정보에 대한 속성 정보의등록 UI(420)를 포함할 수 있다. The registration UI may include a window size registration UI 410 and a registration UI 420 of attribute information for event information.

등록부(320)는 윈도우 사이즈 등록 UI(410)를 통해 장비(411), 서비스 IP(412), 윈도우 사이즈(413)에 대한 설정을 등록받을 수 있다. 예를 들어, 등록부(320)는 윈도우 사이즈 등록 UI(410)를 통해 관리자로부터 관리받을 장비(411)를 선택받고, 서비스 IP(412)를 통해 사용자의 IP 또는 URL을 입력받고, 윈도우 사이즈(413)를 통해 해당 장비의 장애 발생 판단 서비스를 제공하기 위한 감시 이벤트의 개수를 등록받을 수 있다. 예를 들어, 등록부(320)는 1개의 장비에 대해 4개의 윈도우 사이즈를 등록받을 수 있다. The registration unit 320 can register the settings for the equipment 411, the service IP 412, and the window size 413 through the window size registration UI 410. For example, the registration unit 320 selects a device 411 to be managed by the administrator through the window size registration UI 410, receives the user's IP or URL through the service IP 412, The number of monitoring events for providing the failure occurrence judgment service of the corresponding equipment can be registered. For example, the registration unit 320 can register four window sizes for one piece of equipment.

등록부(320)는 이벤트에 대한 속성 정보의 등록 UI(420)를 통해 장비(421), 이벤트 순서 여부(422), 중복성 허용 여부(423), 지속시간(424), 발생회수(425)를 등록받을 수 있다. 예를 들어, 등록부(320)는 이벤트에 대한 속성 정보의 등록 UI(420)를 통해 관리받을 장비(421)를 선택받고, 이벤트 순서 여부(422)를 통해 발생된 이벤트가 윈도우 사이즈 내부에 일련의 이벤트가 발생되는 순서와 관련이 있는지에 대해 체크를 수행할 지의 여부를 Y/N로 설정받고, 중복성 허용 여부(423)를 통해 단일 이벤트가 중복적으로 발생하는 것을 허용하는 지의 여부를 Y/N로 설정받고, 지속 시간(424)를 통해 해당 이벤트에 대한 장애 발생 및 해제가 반복되는 경우의 장애 발생이 유지되는 시간을 설정받고, 발생 회수(425)를 통해 최소 이벤트 발생 개수에 대한 임계값을 설정받을 수 있다. The registration unit 320 registers the equipment 421, the event order 422, the redundancy permission 423, the duration 424, and the number of occurrences 425 through the registration UI 420 of the attribute information about the event Can receive. For example, the registration unit 320 selects the equipment 421 to be managed through the registration UI 420 of the attribute information about the event, and the event generated through the event sequence 422 includes a series of Whether or not to perform a check as to whether the event is related to the order in which the event is generated is set to Y / N, whether or not to allow a single event to occur redundantly through redundancy permission 423 is determined by Y / N And sets the time for which the occurrence of the fault in the case where the occurrence and the cancellation of the fault for the event is repeated is maintained through the duration 424 and sets a threshold value for the minimum event occurrence number through the occurrence number 425 Can be set.

이벤트에 대한 속성 정보의 등록이 완료되면, 필수 장애 이벤트 처리 리스트 등록 결과(426)를 통해 입력 결과가 표시될 수 있다. 예를 들어, 윈도우 사이즈 등록 UI(410)를 통해 장비 1개, 윈도우 사이즈 4개를 등록받은 경우, 장애 발생 판단 장치(220)는 이벤트 1에서 이벤트 4까지의 이벤트 트리를 구축할 수 있으며, 각각의 이벤트 정보는 속성 정보에 기초하여 구축될 수 있다. When the registration of the attribute information for the event is completed, the input result can be displayed through the essential failure event processing list registration result 426. [ For example, when one device and four window sizes are registered through the window size registration UI 410, the failure occurrence determination device 220 can construct an event tree from Events 1 to 4, May be constructed based on the attribute information.

장애 판단부(330)는 이벤트 정보를 수집하는 시점마다 이벤트 정보와 대응하는 통신 장비와의 네트워크 연결 상태에 기초하여 서비스 장애 이벤트의 발생 여부를 판단할 수 있다. 예를 들어, 장애 판단부(330)는 최근에 발생된 이벤트 정보를 이용하여 기존에 발생된 서비스 장애의 패턴으로 학습된 이벤트 정보 데이터베이스를 검색함으로써, 서비스 장애 이벤트의 발생 여부를 판단할 수 있다. The failure determination unit 330 may determine whether a service fault event is generated based on the network connection state between the event information and the corresponding communication equipment at each time of collecting the event information. For example, the failure determination unit 330 can determine whether a service failure event has occurred by searching the event information database that has been learned in the pattern of the service failure that has occurred in the past using the event information that has recently occurred.

트리 구축부(340)는 복수개의 통신 장비(110)로부터 기설정된 이벤트가 발생하는 경우, 기설정된 이벤트와 관련된 복수개의 이벤트 및 등록받은 윈도우 사이즈에 기초하여 이벤트 트리를 구축할 수 있다. 이 때, 트리 구축부(340)는 각 통신 장비 별로 이벤트 트리를 구축할 수 있다. 기설정된 이벤트는 크리티컬 장애 이벤트 및 서비스 장애 이벤트를 포함할 수 있다. The tree construction unit 340 may construct an event tree based on a plurality of events related to a preset event and a registered window size when a predetermined event is generated from a plurality of communication devices 110. [ At this time, the tree construction unit 340 can construct an event tree for each communication equipment. The predetermined event may include a critical failure event and a service failure event.

예를 들어, 트리 구축부(340)는 기설정된 이벤트로 크리티컬 장애 이벤트가 발생하는 경우, 크리티컬 이벤트가 발생되기 전 발생되고 등록된 윈도우 사이즈와 대응되는 복수개의 이벤트의 이벤트 정보를 저장하여 이벤트 트리를 구축할 수 있다. For example, when a critical failure event occurs as a predetermined event, the tree construction unit 340 stores event information of a plurality of events generated before the occurrence of the critical event and corresponding to the registered window size, Can be constructed.

다른 예를 들어, 트리 구축부(340)는 기설정된 이벤트로 서비스 장애 이벤트가 발생하는 경우, 서비스 장애 이벤트가 발생되기 전 발생되고 등록된 윈도우 사이즈와 대응되는 복수개의 이벤트의 이벤트 정보를 저장하여 이벤트 트리를 구축할 수 있다. For example, when a service fault event occurs in a preset event, the tree construction unit 340 stores event information of a plurality of events generated before the occurrence of the service fault event and corresponding to the registered window size, You can build a tree.

트리 구축부(340)는 기설정된 이벤트가 발생 되기 전 발생되고 등록된 윈도우 사이즈와 대응되는 복수개의 이벤트의 이벤트 정보를 구축된 이벤트 트리와 비교하여 구축된 이벤트 트리에 새로운 이벤트에 대한 이벤트 정보를 추가할 수 있다. The tree construction unit 340 compares event information of a plurality of events generated before the preset event is generated and corresponding to the registered window size with the constructed event tree to add event information about a new event to the constructed event tree can do.

트리 구축부(340)에서 이벤트 트리를 구축하는 과정에 대해서는 도 5를 통해 상세히 설명하도록 하겠다. The process of constructing the event tree in the tree building unit 340 will be described in detail with reference to FIG.

도 5는 본 발명의 일 실시예에 따른 장애 발생 판단 장치에서 이벤트 트리를 구축하는 과정을 설명하기 위한 예시적인 도면이다. 도 5를 참조하면, 장애 발생 판단 장치(220)는 최초 이벤트 트리를 구축 시, 장비와 관련된 이벤트 정보를 전혀 가지고 있지 않으므로, 장애 패턴 정보는 null 상태일 수 있다. 5 is an exemplary diagram illustrating a process of constructing an event tree in the fault occurrence determination apparatus according to an embodiment of the present invention. Referring to FIG. 5, since the failure occurrence determination device 220 does not have event information related to the device at the time of constructing the initial event tree, the failure pattern information may be null.

트리 구축부(340)는 기설정된 이벤트로 크리티컬 장애 이벤트 또는 서비스 장애 이벤트가 발생한 경우, 각 통신 장비 별로 윈도우 사이즈의 개수만큼 이벤트 정보를 저장을 하며, 이벤트 트리를 구축할 수 있다. 예를 들어, 트리 구축부(340)는 장비 1개에 대해 윈도우 사이즈가 4개 등록된 경우, 4개의 이벤트 리스트를 갖는 이벤트 트리를 구축할 수 있다. 이벤트 트리는 장비별, 이벤트별로 다수의 멀티 루트 구조로 진행될 수 있다. When a critical failure event or a service failure event occurs as a preset event, the tree construction unit 340 stores event information by the number of window sizes for each communication device, and constructs an event tree. For example, when four window sizes are registered for one piece of equipment, the tree construction unit 340 can construct an event tree having four event lists. The event tree can be organized in multiple multi-route structures for each device and event.

예를 들어, 트리 구축부(340)는 이벤트 트리 중 A-B-C-X(510)와 같이 일련의 이벤트가 발생하고, 크리티컬 장애 이벤트 또는 서비스 장애 이벤트가 발생하는 경우, 해당 이벤트에 대한 이벤트 정보를 저장하여 이벤트 트리(520)를 구축할 수 있다. 트리 구축부(340)는 A 이벤트의 루트(root)를 찾아 이벤트 노드를 검색하여 최종 리프(leaf) 노드까지 추적하고, 윈도우 사이즈에 대응되는 복수개의 이벤트 정보와 이벤트 트리가 일치하지 않거나, 해당 이벤트와 관련된 노드가 없으면 해당 이벤트 노드를 추가할 수 있다. 이 때, 이벤트에 대한 속성 정보는 각 노드 별로 저장되어 관리될 수 있으며, 이벤트에 대한 속성 정보와 노드를 비교함으로써, 장애 발생을 판단할 수 있다. For example, when a series of events such as the ABCX 510 occurs in the event tree and a critical failure event or a service fault event occurs, the tree construction unit 340 stores event information for the corresponding event, (520). The tree construction unit 340 searches for the root of the A event and searches for the event node to trace to the leaf node. If the event tree does not match the event information corresponding to the window size, If there is no node associated with it, you can add the event node. At this time, the attribute information about the event can be stored and managed for each node, and the failure occurrence can be determined by comparing the attribute information with the node.

다시 도 3으로 돌아와서, 분석부(350)는 구축된 이벤트 트리에 기초하여 수집된 이벤트 정보를 분석할 수 있다. Referring again to FIG. 3, the analyzer 350 may analyze the collected event information based on the constructed event tree.

분석부(350)는 예측부(355)를 포함할 수 있다. 예측부(355)는 구축된 이벤트 트리에 기초하여 수집된 이벤트 정보를 분석하여 복수개의 통신 장비(210) 중 적어도 하나에 서비스 장애 이벤트가 발생할지 여부를 예측할 수 있다. The analyzer 350 may include a predictor 355. The prediction unit 355 may analyze the collected event information based on the constructed event tree to predict whether or not a service fault event occurs in at least one of the plurality of communication devices 210. [

예측부(355)는 이벤트 정보를 수집하는 시점마다 등록된 윈도우 사이즈와 대응되는 복수개의 이벤트의 이벤트 정보와 이벤트 트리를 비교함으로써 서비스 장애 이벤트가 발생할지 여부를 예측할 수 있다. 예측부(355)는 이벤트 정보를 수집하는 시점마다 각 통신 장비의 윈도우 사이즈에 대응되는 복수개의 이벤트 정보와 이벤트 트리의 일치도를 산출함으로써 서비스 장애의 발생 가능성을 예측할 수 있으며, 각 통신 장비 별로 산출된 일치도 중 최대값을 디스플레이부(미도시)로 제공할 수 있다. 예를 들어, 예측부(840)는 이벤트 트리에서 루트(root) 노드부터 스캐닝을 통해 윈도우 사이즈에 대응되는 복수개의 이벤트 정보를 비교하고, 리프(leaf) 노드까지의 일치도를 산출할 수 있다. The prediction unit 355 can predict whether a service fault event will occur by comparing the event information of the plurality of events corresponding to the registered window size at each time of collecting the event information with the event tree. The prediction unit 355 can predict the probability of occurrence of a service failure by calculating the degree of agreement between a plurality of event information items corresponding to window sizes of the communication equipments and an event tree at the time of collecting the event information. The maximum value of the match degree can be provided to the display unit (not shown). For example, the predicting unit 840 may compare a plurality of event information corresponding to the window size through scanning from the root node in the event tree, and calculate the degree of match up to the leaf node.

도 6은 본 발명의 일 실시예에 따른 장애 발생 판단 장치에서 기설정된 이벤트에 따라 이벤트 트리를 구축하여 이벤트 정보를 분석하는 방법의 순서도이다. 도 6을 참조하면, 장애 발생 판단 장치(220)는 복수개의 통신 장비(210)에 대한 윈도우 사이즈를 등록받고(S610), 복수개의 통신 장비(210)로부터 발생된 이벤트에 대한 이벤트 정보를 수집하고(S620), 수집된 이벤트 정보에서 기설정된 이벤트의 발생 여부를 판단할 수 있다(S630). 6 is a flowchart illustrating a method of analyzing event information by constructing an event tree according to a preset event in the fault occurrence determination apparatus according to an embodiment of the present invention. Referring to FIG. 6, the failure occurrence determination device 220 registers window sizes for a plurality of communication devices 210 (S610), collects event information about events generated from the plurality of communication devices 210 (S620), and it may be determined whether a predetermined event is generated in the collected event information (S630).

장애 발생 판단 장치(220)는 기설정된 이벤트 정보가 크리티컬 장애 이벤트인지, 또는, 서비스 장애 이벤트인 지를 판단할 수 있다(S640). 예를 들어, 장애 발생 판단 장치(220)는 기설정된 이벤트가 크리티컬 장애 이벤트인 경우(S641), 크리티컬 이벤트가 발생되기 전 발생되고 등록된 윈도우 사이즈와 대응되는 복수개의 이벤트의 이벤트 정보를 저장하여 이벤트 트리를 구축할 수 있다(S650). 이 때, 장애 발생 판단 장치(220)는 윈도우 사이즈의 크기에 해당하는 이벤트 정보를 이용하여 이벤트 트리를 루트(root) 노드부터 검색을 시작할 수 있으며, 노드 리스트가 윈도우 사이즈만큼 존재하면 스킵(skip)하고, 없으면 트리에 노드를 추가할 수 있다. The failure occurrence determination device 220 can determine whether the preset event information is a critical failure event or a service failure event (S640). For example, when the preset event is a critical failure event (S641), the failure occurrence determination device 220 stores event information of a plurality of events generated before the occurrence of the critical event and corresponding to the registered window size, The tree can be constructed (S650). At this time, the failure occurrence determination device 220 can start searching the event tree from the root node using the event information corresponding to the size of the window size. If the node list exists by the window size, If not, you can add nodes to the tree.

다른 예를 들어, 장애 발생 판단 장치(220)는 기설정된 이벤트가 서비스 장애 이벤트인 경우(S642), 서비스 장애 이벤트가 발생되기 전 발생되고 등록된 윈도우 사이즈와 대응되는 복수개의 이벤트의 이벤트 정보를 저장하여 이벤트 트리를 구축할 수 있다(S660). 장애 발생 판단 장치(220)는 이벤트 트리에서 이벤트 정보를 이용하여 검색한 후, 윈도우 사이즈에 대응되는 복수개의 이벤트 정보와 이벤트 트리의 일치도를 산출할 수 있다. 검색 시, 리프(leaf) 노드까지 도달하지 못한 경우, 장애 발생 판단 장치(220)는 장애 발생 경보를 발생시키는 단계로 판단하지 않고, 리프(leaf) 노드에 도달한 경우, 장애 발생 메시지를 사전에 관리자 단말(미도시)로 전송할 수 있다. For example, if the preset event is a service fault event (S642), the fault occurrence determination device 220 stores event information of a plurality of events that occurred before the occurrence of the service fault event and corresponded to the registered window size An event tree can be constructed (S660). The failure occurrence determination apparatus 220 can search for the event tree using the event information, and then calculate the degree of match between the event information and the event tree corresponding to the window size. If the leaf node has not reached the leaf node at the time of retrieval, the fault occurrence determination device 220 does not determine that the fault occurrence alarm is generated, and if the leaf node is reached, To an administrator terminal (not shown).

상술한 설명에서, 단계 S610 내지 S660은 본 발명의 구현예에 따라서, 추가적인 단계들로 더 분할되거나, 더 적은 단계들로 조합될 수 있다. 또한, 일부 단계는 필요에 따라 생략될 수도 있고, 단계 간의 순서가 변경될 수도 있다.In the above description, steps S610 to S660 may be further divided into further steps or combined into fewer steps, according to an embodiment of the present invention. Also, some of the steps may be omitted as necessary, and the order between the steps may be changed.

도 7은 본 발명의 일 실시예에 따른 장애 발생 판단 장치에서 장애 발생을 판단하는 방법의 순서도이다. 도 7에 도시된 실시예에 따른 장애 발생 판단 장치(220)에 의해 수행되는 장애 발생을 판단하는 방법은 도 1 내지 도 6에 도시된 실시예에 따른 장애 발생 판단 시스템(1)에서 시계열적으로 처리되는 단계들을 포함한다. 따라서, 이하 생략된 내용이라고 하더라도 도 1 내지 도 6에 도시된 실시예에 따른 장애 발생 장치(220)에 의해 수행되는 장애 발생을 판단하는 방법에도 적용된다. FIG. 7 is a flowchart of a method for determining a failure occurrence in a failure occurrence determination apparatus according to an embodiment of the present invention. Referring to FIG. The method for determining the occurrence of a failure performed by the failure occurrence determination apparatus 220 according to the embodiment shown in FIG. 7 is the same as that of the failure occurrence determination system 1 according to the embodiment shown in FIGS. 1 to 6, Lt; / RTI > Therefore, the present invention is also applied to a method for determining occurrence of a failure to be performed by the failure generating apparatus 220 according to the embodiment shown in FIGS. 1 to 6 even if omitted from the following description.

단계 S710에서 장애 발생 판단 장치(220)는 복수개의 통신 장비(210)로부터 발생된 이벤트에 대한 이벤트 정보를 수집할 수 있다. In step S710, the failure occurrence determination device 220 may collect event information on events generated from the plurality of communication devices 210. [

단계 S720에서 장애 발생 판단 장치(220)는 복수개의 통신 장비(210)에 대한 윈도우 사이즈를 등록받을 수 있다. 예를 들어, 장애 발생 판단 장치(220)는 각 통신 장비 별로 감시할 이벤트의 수와 대응되도록 윈도우 사이즈를 등록받을 수 있다. In step S720, the failure occurrence determination device 220 can register a window size for a plurality of communication devices 210. [ For example, the failure occurrence determination device 220 may register a window size so as to correspond to the number of events to be monitored for each communication device.

단게 S730에서 장애 발생 판단 장치(220)는 복수개의 통신 장비(210)로부터 기설정된 이벤트가 발생하는 경우, 기설정된 이벤트와 관련된 복수개의 이벤트 및 등록받은 윈도우 사이즈에 기초하여 이벤트 트리를 구축할 수 있다. 장애 발생 판단 장치(220)는 각 통신 장비 별로 이벤트 트리를 구축할 수 있다. 기설정된 이벤트는 예를 들어, 크리티컬 장애 이벤트, 서비스 장애 이벤트 등을 포함할 수 있다. 예를 들어, 장애 발생 판단 장치(220)는 크리티컬 장애 이벤트가 발생하는 경우, 크리티컬 이벤트가 발생되기 전 발생되고 등록된 윈도우 사이즈와 대응되는 복수개의 이벤트의 이벤트 정보를 저장하여 이벤트 트리를 구축할 수 있다. 다른 예를 들어, 장애 발생 판단 장치(220)는 서비스 장애 이벤트가 발생하는 경우, 서비스 장애 이벤트가 발생되기 전 발생되고 등록된 윈도우 사이즈와 대응되는 복수개의 이벤트의 이벤트 정보를 저장하여 이벤트 트리를 구축할 수 있다. In step S730, when a predetermined event is generated from the plurality of communication devices 210, the failure occurrence determination device 220 may construct an event tree based on a plurality of events related to the preset event and a registered window size . The fault occurrence determination device 220 can construct an event tree for each communication device. The predetermined event may include, for example, a critical failure event, a service failure event, and the like. For example, when a critical failure event occurs, the failure occurrence determination device 220 can construct an event tree by storing event information of a plurality of events generated before a critical event occurs and corresponding to a registered window size have. For example, when a service fault event occurs, the fault occurrence determination unit 220 stores event information of a plurality of events generated before the occurrence of the service fault event and corresponding to the registered window size to construct an event tree can do.

단계 S740에서 장애 발생 판단 장치(220)는 구축된 이벤트 트리에 기초하여 수집된 이벤트 정보를 분석할 수 있다. In step S740, the failure occurrence determination apparatus 220 may analyze event information collected based on the constructed event tree.

단계 S750에서 장애 발생 판단 장치(220)는 윈도우 사이즈에 대응되는 복수개의 이벤트 정보와 이벤트 트리의 일치도를 산출할 수 있다. In step S750, the failure occurrence determination apparatus 220 can calculate the degree of match between the event information and the event tree corresponding to the window size.

단계 S760에서 장애 발생 판단 장치(220)는 산출된 일치도가 임계값 이상이면 알림을 표시할 수 있다. 또는, 장애 발생 판단 장치(220)는 알림 메시지를 관리자 단말(미도시)로 전송할 수 있다. 예를 들어, 장애 발생 판단 장치(220)는 산출된 일치도가 70% 이상인 경우 사용자 인터페이스를 통해 서비스 장애 이벤트의 발생에 대한 예측 알림을 표시하거나, 관리자 단말로 알림 메시지를 전송함으로써 관리자에게 서비스 장애 이벤트에 대한 발생 가능성을 인지시킬 수 있다.In step S760, the failure occurrence determination device 220 can display a notification if the calculated match degree is equal to or greater than the threshold value. Alternatively, the failure occurrence determination device 220 may transmit a notification message to an administrator terminal (not shown). For example, when the calculated degree of match is 70% or more, the failure occurrence determination unit 220 displays a prediction notification about the occurrence of a service failure event through the user interface, or transmits a notification message to the administrator terminal, Can be recognized.

도 7에서는 도시되지 않았으나, 장애 발생 판단 장치(220)는 이벤트 정보를 수집하는 시점마다 이벤트 정보와 대응하는 통신 장비와의 네트워크 연결 상태에 기초하여 서비스 장애 이벤트의 발생 여부를 판단하는 단계를 더 포함할 수 있다. Although not shown in FIG. 7, the failure occurrence determination device 220 further includes a step of determining whether or not a service fault event is generated based on the network connection state between the event information and the corresponding communication device at each time of collecting the event information can do.

도 7에서는 도시되지 않았으나, 장애 발생 판단 장치(220)는 기설정된 이벤트가 발생되기 전 발생되고 등록된 윈도우 사이즈와 대응되는 복수개의 이벤트의 이벤트 정보를 구축된 이벤트 트리와 비교하여 구축된 이벤트 트리에 새로운 이벤트에 대한 이벤트 정보를 추가하는 단계를 더 포함할 수 있다. Although not shown in FIG. 7, the failure occurrence determination device 220 compares event information of a plurality of events generated before a predetermined event is generated and corresponding to a registered window size with an established event tree, And adding event information for the new event.

도 7에서는 도시되지 않았으나, 장애 발생 판단 장치(220)는 이벤트 트리에 포함되는 복수개의 이벤트 정보에 대한 속성 정보를 각각 등록받는 단계를 더 포함할 수 있다. 속성 정보는 각 이벤트의 순서 준수 여부, 각 이벤트의 지속 시간 및 각 이벤트의 중복성 허용 여부 등을 포함할 수 있다. Although not illustrated in FIG. 7, the failure occurrence determination apparatus 220 may further include a step of registering attribute information on a plurality of event information included in the event tree, respectively. The attribute information may include the order of each event, the duration of each event, and whether or not each event is redundant.

상술한 설명에서, 단계 S710 내지 S760은 본 발명의 구현예에 따라서, 추가적인 단계들로 더 분할되거나, 더 적은 단계들로 조합될 수 있다. 또한, 일부 단계는 필요에 따라 생략될 수도 있고, 단계 간의 순서가 변경될 수도 있다.In the above description, steps S710 to S760 may be further divided into further steps or combined into fewer steps, according to an embodiment of the present invention. Also, some of the steps may be omitted as necessary, and the order between the steps may be changed.

도 8은 본 발명의 일 실시예에 따른 장애 발생 판단 장치에서 수집된 이벤트 정보를 분석하여 서비스 장애 이벤트의 발생 여부를 예측하는 과정을 설명하기 위한 예시적인 도면이다. 도 8을 참조하면, 장애 발생 판단 장치(220)는 이벤트의 발생 시점마다 윈도우 사이즈와 대응되는 복수개의 이벤트의 이벤트 정보와 이벤트 트리를 비교함으로써, 서비스 장애 이벤트가 발생하였는 지의 여부를 예측할 수 있다. 8 is an exemplary diagram for explaining a process of estimating whether a service fault event is generated by analyzing event information collected by the fault occurrence determination apparatus according to an embodiment of the present invention. Referring to FIG. 8, the failure occurrence determination device 220 can predict whether or not a service fault event has occurred by comparing the event information of a plurality of events corresponding to the window size at each event occurrence time with an event tree.

예를 들어, T1(810)의 시점에서 F라는 장애 이벤트가 발생한 경우, 장애 발생 판단 장치(220)는 해당 장비의 A에서 F까지의 윈도우 사이즈와 대응되는 이벤트의 정보를 이벤트 트리와 비교할 수 있다. 장애 발생 판단 장치(220)는 윈도우 사이즈와 대응되는 이벤트의 정보와 이벤트 트리 간의 일치도를 산출할 수 있다. 이 때, 윈도우 사이즈와 대응되는 이벤트 정보와 이벤트 트리가 불일치하는 경우, 장애 발생 판단 장치(220)는 장애 발생의 가능성을 스킵(skip)처리할 수 있고, 윈도우 사이즈와 대응되는 이벤트 정보와 이벤트 트리 간의 일치도를 수치화하여 표시할 수 있다. For example, if a failure event of F occurs at a time point of T1 810, the failure occurrence determination apparatus 220 may compare information of an event corresponding to a window size from A to F of the corresponding equipment to an event tree . The fault occurrence determination apparatus 220 can calculate the degree of correspondence between the information of the event corresponding to the window size and the event tree. At this time, if the event information corresponding to the window size and the event tree are inconsistent, the failure occurrence determination apparatus 220 can skip the possibility of occurrence of a failure, Can be expressed numerically.

다른 예를 들어, T4(820)의 시점에서 I라는 장애 이벤트가 발생한 경우, 장애 발생 판단 장치(220)는 해당 장비의 D에서 I까지의 윈도우 사이즈와 대응되는 이벤트의 정보를 이벤트 트리와 비교할 수 있다. 장애 발생 판단 장치(220)는 윈도우 사이즈와 대응되는 이벤트의 정보와 이벤트 트리 간의 일치도를 산출할 수 있다. 이 때, 윈도우 사이즈와 대응되는 이벤트 정보와 이벤트 트리 간의 일치도가 일치하는 경우, 장애 발생 판단 장치(220)는 장애 발생의 가능성을 알림 메시지의 형태로 관리자 단말(미도시)로 전송할 수 있다. For example, if a failure event of I occurs at the time of T4 820, the failure occurrence determination device 220 can compare the information of the event corresponding to the window size from D to I of the corresponding device to the event tree have. The fault occurrence determination apparatus 220 can calculate the degree of correspondence between the information of the event corresponding to the window size and the event tree. At this time, if the degree of match between the event information corresponding to the window size and the event tree coincides with each other, the failure occurrence determination apparatus 220 can transmit the possibility of failure occurrence to the administrator terminal (not shown) in the form of a notification message.

도 9는 본 발명의 일 실시예에 따른 장애 발생 판단 장치에서 이벤트 정보와 이벤트 트리를 비교하여 일치도를 산출하는 과정을 설명하기 위한 예시적인 도면이다. 도 9를 참조하면, 장애 발생 판단 장치(220)는 일치도를 산출하기 위해 다음과 같은 수학식을 이용할 수 있다. 9 is an exemplary diagram for explaining a process of comparing the event information and the event tree in the fault occurrence determination apparatus according to an embodiment of the present invention to calculate the match degree. Referring to FIG. 9, the failure occurrence determination apparatus 220 may use the following equation to calculate the degree of agreement.

Figure pat00001
Figure pat00001

수학식 1을 참조하면, p(i)는 i 이벤트에 대한 경로 정보를 이벤트 세트 트리(EST)와 비교하여 매칭되는 레벨을 리턴할 수 있다. ws(i)는 i 이벤트에서 발생되는 장비의 윈도우 사이즈를 리턴할 수 있다. Referring to Equation (1), p (i) may compare the path information for the i-event with the event set tree (EST) and return a matched level. ws (i) may return the window size of the device that is generated in the i event.

장애 발생 판단 장치(220)는 장비 별로 이벤트 i를 구분하고, 윈도우 사이즈(ws)와 이벤트 트리 매칭 레벨간의 비율을 각각 구하여, 그 중 최대값을 관리자에게 제공할 수 있다. 장애 발생 판단 장치(220)는 특정 장비의 장애 패턴에 대한 지표를 왜곡할 수 있는 요소를 방지하기 위해 장비 별로 발생하는 이벤트 패턴을 분석하여 최대값 정보를 제공할 수 있다. The failure occurrence determination device 220 may classify the event i for each device, calculate the ratio between the window size (ws) and the event tree matching level, and provide the maximum value to the administrator. The failure occurrence determination device 220 may analyze the event pattern generated for each device to provide the maximum value information in order to prevent elements that may distort the index of the failure pattern of the specific device.

장애 발생 판단 장치(220)는 이벤트 트리의 루트(root) 노드로부터 시작하여 각각의 확률을 계산하고, 그 중 최대값을 리턴할 수 있다. 이러한 일치도 산출은 이벤트가 발생한 시점마다 처리될 수 있다. The failure occurrence determination device 220 may calculate the respective probabilities starting from the root node of the event tree, and may return the maximum value among them. This match degree calculation can be processed at each time an event occurs.

예를 들어, 이벤트가 A->Z->B->D->X->T->H의 순으로 발생하는 경우, 장애 발생 판단 장치(220)는 해당 시점마다 일치도를 산출할 수 있다. 해당 시점 마다의 일치도는 예를 들어, 25%->25%->50%->75%->75%->100% 일 수 있다. 이 때, 일치도가 100%에 가까워지면, 장애 발생 판단 장치(220)는 장애 발생 가능성을 예측하고, 이에 대한 상세 정보를 분석하여 통신 서비스의 중단을 사전에 방지하도록 할 수 있다. For example, when the event occurs in the order A-> Z-> B-> D-> X-> T-> H, the failure occurrence determination device 220 can calculate the degree of agreement at each point in time. The degree of agreement at each point in time may be, for example, 25% -> 25% -> 50% -> 75% -> 75% -> 100%. At this time, if the degree of agreement is close to 100%, the failure occurrence determination device 220 can predict the possibility of failure and analyze the detailed information to prevent the communication service from being interrupted in advance.

도 1 내지 도 9를 통해 설명된 장애 발생 판단 장치에 의해 수행되는 장애 발생을 판단하는 방법은 컴퓨터에 의해 실행되는 매체에 저장된 컴퓨터 프로그램 또는 컴퓨터에 의해 실행 가능한 명령어를 포함하는 기록 매체의 형태로도 구현될 수 있다. 또한, 도 1 내지 도 9를 통해 설명된 장애 발생 판단 장치에 의해 수행되는 장애 발생을 판단하는 방법은 컴퓨터에 의해 실행되는 매체에 저장된 컴퓨터 프로그램의 형태로도 구현될 수 있다. 컴퓨터 판독 가능 매체는 컴퓨터에 의해 액세스될 수 있는 임의의 가용 매체일 수 있고, 휘발성 및 비휘발성 매체, 분리형 및 비분리형 매체를 모두 포함한다. 또한, 컴퓨터 판독가능 매체는 컴퓨터 저장 매체 및 통신 매체를 모두 포함할 수 있다. 컴퓨터 저장 매체는 컴퓨터 판독가능 명령어, 데이터 구조, 프로그램 모듈 또는 기타 데이터와 같은 정보의 저장을 위한 임의의 방법 또는 기술로 구현된 휘발성 및 비휘발성, 분리형 및 비분리형 매체를 모두 포함한다. 통신 매체는 전형적으로 컴퓨터 판독가능 명령어, 데이터 구조, 프로그램 모듈, 또는 반송파와 같은 변조된 데이터 신호의 기타 데이터, 또는 기타 전송 메커니즘을 포함하며, 임의의 정보 전달 매체를 포함한다. The method for determining occurrence of a failure to be performed by the failure occurrence determination apparatus described with reference to Figs. 1 to 9 may be performed in the form of a computer program stored in a medium executed by a computer or a recording medium including instructions executable by the computer Can be implemented. In addition, the method for determining occurrence of a failure to be performed by the failure occurrence determination apparatus described with reference to Figs. 1 to 9 may be implemented in the form of a computer program stored in a medium executed by a computer. Computer readable media can be any available media that can be accessed by a computer and includes both volatile and nonvolatile media, removable and non-removable media. In addition, the computer-readable medium may include both computer storage media and communication media. Computer storage media includes both volatile and nonvolatile, removable and non-removable media implemented in any method or technology for storage of information such as computer readable instructions, data structures, program modules or other data. Communication media typically includes any information delivery media, including computer readable instructions, data structures, program modules, or other data in a modulated data signal such as a carrier wave, or other transport mechanism.

전술한 본 발명의 설명은 예시를 위한 것이며, 본 발명이 속하는 기술분야의 통상의 지식을 가진 자는 본 발명의 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 쉽게 변형이 가능하다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 한다. 예를 들어, 단일형으로 설명되어 있는 각 구성 요소는 분산되어 실시될 수도 있으며, 마찬가지로 분산된 것으로 설명되어 있는 구성 요소들도 결합된 형태로 실시될 수 있다. It will be understood by those skilled in the art that the foregoing description of the present invention is for illustrative purposes only and that those of ordinary skill in the art can readily understand that various changes and modifications may be made without departing from the spirit or essential characteristics of the present invention. will be. It is therefore to be understood that the above-described embodiments are illustrative in all aspects and not restrictive. For example, each component described as a single entity may be distributed and implemented, and components described as being distributed may also be implemented in a combined form.

본 발명의 범위는 상기 상세한 설명보다는 후술하는 특허청구범위에 의하여 나타내어지며, 특허청구범위의 의미 및 범위 그리고 그 균등 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다. The scope of the present invention is defined by the appended claims rather than the detailed description and all changes or modifications derived from the meaning and scope of the claims and their equivalents are to be construed as being included within the scope of the present invention do.

210: 복수개의 통신 장비
220: 장애 발생 판단 장치
310: 수집부
320: 등록부
330: 장애 판단부
340: 트리 구축부
350: 분석부
355: 예측부
210: a plurality of communication equipments
220: Fault occurrence determination device
310:
320: Register
330:
340: Tree building part
350: Analytical Department
355:

Claims (14)

장애 발생을 판단하는 장치에 있어서,
복수개의 통신 장비로부터 발생된 이벤트에 대한 이벤트 정보를 수집하는 수집부;
상기 복수개의 통신 장비에 대한 윈도우 사이즈를 등록받는 등록부;
상기 복수개의 통신 장비로부터 기설정된 이벤트가 발생하는 경우, 상기 기설정된 이벤트와 관련된 복수개의 이벤트 및 상기 등록받은 윈도우 사이즈에 기초하여 이벤트 트리를 구축하는 트리 구축부; 및
상기 구축된 이벤트 트리에 기초하여 상기 수집된 이벤트 정보를 분석하는 분석부
를 포함하는 것인, 장애 발생 판단 장치.
An apparatus for determining occurrence of a fault,
A collection unit for collecting event information on events generated from a plurality of communication devices;
A registration unit for registering a window size of the plurality of communication equipments;
A tree construction unit for constructing an event tree based on a plurality of events related to the preset event and the registered window size when a predetermined event is generated from the plurality of communication equipments; And
An analysis unit for analyzing the collected event information based on the constructed event tree,
Wherein the fault occurrence determination device comprises:
제 1 항에 있어서,
상기 등록부는 각 통신 장비 별로 감시할 이벤트의 수와 대응되도록 상기 윈도우 사이즈를 등록 받는 것인, 장애 발생 판단 장치.
The method according to claim 1,
Wherein the registration unit registers the window size so as to correspond to the number of events to be monitored for each communication equipment.
제 2 항에 있어서,
상기 트리 구축부는 각 통신 장비 별로 상기 이벤트 트리를 구축하는 것인, 장애 발생 판단 장치.
3. The method of claim 2,
And the tree construction unit constructs the event tree for each communication equipment.
제 3 항에 있어서,
상기 기설정된 이벤트는 크리티컬 장애 이벤트를 포함하고,
상기 트리 구축부는 상기 크리티컬 장애 이벤트가 발생하는 경우, 상기 크리티컬 이벤트가 발생되기 전 발생되고 상기 등록된 윈도우 사이즈와 대응되는 복수개의 이벤트의 이벤트 정보를 저장하여 상기 이벤트 트리를 구축하는 것인, 장애 발생 판단 장치.
The method of claim 3,
The preset event includes a critical failure event,
Wherein the tree construction unit constructs the event tree by storing event information of a plurality of events generated before the occurrence of the critical event and corresponding to the registered window size when the event of the critical failure occurs, Determination device.
제 3 항에 있어서,
상기 이벤트 정보를 수집하는 시점마다 상기 이벤트 정보와 대응하는 통신 장비와의 네트워크 연결 상태에 기초하여 서비스 장애 이벤트의 발생 여부를 판단하는 장애 판단부
를 더 포함하는 것인, 장애 발생 판단 장치.
The method of claim 3,
A failure determination unit for determining whether a service failure event is generated based on a network connection state between the event information and the corresponding communication device at each time of collecting the event information;
Further comprising: a failure detection unit for detecting failure occurrence of the failure.
제 5 항에 있어서,
상기 기설정된 이벤트는 상기 서비스 장애 이벤트를 포함하고,
상기 트리 구축부는 상기 서비스 장애 이벤트가 발생하는 경우, 상기 서비스 장애 이벤트가 발생되기 전 발생되고 상기 등록된 윈도우 사이즈와 대응되는 복수개의 이벤트의 이벤트 정보를 저장하여 상기 이벤트 트리를 구축하는 것인, 장애 발생 판단 장치.
6. The method of claim 5,
Wherein the predetermined event includes the service failure event,
Wherein the tree construction unit constructs the event tree by storing event information of a plurality of events generated before the occurrence of the service fault event and corresponding to the registered window size when the service fault event occurs, An occurrence determination device.
제 2 항에 있어서,
상기 트리 구축부는 상기 기설정된 이벤트가 발생되기 전 발생되고 상기 등록된 윈도우 사이즈와 대응되는 복수개의 이벤트의 이벤트 정보를 상기 구축된 이벤트 트리와 비교하여 상기 구축된 이벤트 트리에 새로운 이벤트에 대한 이벤트 정보를 추가하는 것인, 장애 발생 판단 장치.
3. The method of claim 2,
The tree construction unit compares event information of a plurality of events generated before the predetermined event occurs and corresponding to the registered window size with the constructed event tree, and stores event information on a new event in the constructed event tree Wherein the failure determination device determines whether or not the failure occurs.
제 2 항에 있어서,
상기 등록부는 상기 이벤트 트리에 포함되는 복수개의 이벤트 정보에 대한 속성 정보를 각각 등록받고,
상기 속성 정보는 각 이벤트의 순서 준수 여부, 각 이벤트의 지속 시간 및 각 이벤트의 중복성 허용 여부 중 하나 이상을 포함하는 것인, 장애 발생 판단 장치.
3. The method of claim 2,
Wherein the registration unit registers attribute information of a plurality of event information included in the event tree,
Wherein the attribute information includes at least one of whether or not each event is in order, a duration of each event, and whether redundancy of each event is permitted.
장애 발생을 판단하는 장치에 있어서,
복수개의 통신 장비로부터 발생된 이벤트에 대한 이벤트 정보를 수집하는 수집부;
상기 복수개의 통신 장비에 대한 윈도우 사이즈를 등록받는 등록부;
상기 등록받은 윈도우 사이즈 및 상기 수집된 이벤트 정보에 기초하여 이벤트 트리를 구축하는 트리 구축부; 및
상기 구축된 이벤트 트리에 기초하여 상기 수집된 이벤트 정보를 분석하여 상기 복수개의 통신 장비 중 적어도 하나에 서비스 장애 이벤트가 발생할지 여부를 예측하는 예측부
를 포함하는 것인, 장애 발생 판단 장치.
An apparatus for determining occurrence of a fault,
A collection unit for collecting event information on events generated from a plurality of communication devices;
A registration unit for registering a window size of the plurality of communication equipments;
A tree construction unit for constructing an event tree based on the registered window size and the collected event information; And
A predictor for analyzing the collected event information based on the constructed event tree to predict whether or not a service fault event occurs in at least one of the plurality of communication equipments,
Wherein the fault occurrence determination device comprises:
제 9 항에 있어서,
상기 예측부는 각 통신 장비 별로 상기 서비스 장애 이벤트가 발생할지 여부를 예측하는 것인, 장애 발생 판단 장치.
10. The method of claim 9,
Wherein the predicting unit predicts whether or not the service fault event is generated for each communication equipment.
제 10 항에 있어서,
상기 예측부는 상기 이벤트 정보를 수집하는 시점마다 상기 등록된 윈도우 사이즈와 대응되는 복수개의 이벤트의 이벤트 정보와 상기 이벤트 트리를 비교함으로써 서비스 장애 이벤트가 발생할지 여부를 예측하는 것인, 장애 발생 판단 장치.
11. The method of claim 10,
Wherein the predicting unit predicts whether a service fault event is generated by comparing the event information of a plurality of events corresponding to the registered window size with the event tree at each time of collecting the event information.
제 11 항에 있어서,
상기 예측부는 상기 이벤트 정보를 수집하는 시점마다 상기 각 통신 장비의 상기 윈도우 사이즈에 대응되는 복수개의 이벤트 정보와 상기 이벤트 트리의 일치도를 산출함으로써 상기 서비스 장애의 발생 가능성을 예측하는 것인, 장애 발생 판단 장치.
12. The method of claim 11,
Wherein the predicting unit predicts the probability of occurrence of the service fault by calculating a degree of agreement between the event information and a plurality of event information corresponding to the window size of each communication equipment at each time of collecting the event information, Device.
제 12 항에 있어서,
상기 예측부는 상기 각 통신 장비 별로 산출된 일치도 중 최대값을 디스플레이부에 제공하는 것인, 장애 발생 판단 장치.
13. The method of claim 12,
Wherein the predicting unit provides the display unit with a maximum value of the degree of agreement calculated for each communication equipment.
장애 발생을 판단하는 방법에 있어서,
복수개의 통신 장비로부터 발생된 이벤트에 대한 이벤트 정보를 수집하는 단계;
상기 복수개의 통신 장비에 대한 윈도우 사이즈를 등록받는 단계;
상기 복수개의 통신 장비로부터 기설정된 이벤트가 발생하는 경우, 상기 기설정된 이벤트와 관련된 복수개의 이벤트 및 상기 등록받은 윈도우 사이즈에 기초하여 이벤트 트리를 구축하는 단계;
상기 구축된 이벤트 트리에 기초하여 상기 수집된 이벤트 정보를 분석하여 상기 복수개의 통신 장비 중 적어도 하나에 서비스 장애 이벤트가 발생할지 여부를 예측하는 단계
를 포함하는 것인, 장애 발생 판단 방법.
A method for determining the occurrence of a fault,
Collecting event information on events generated from a plurality of communication devices;
Receiving a window size for the plurality of communication devices;
Constructing an event tree based on the plurality of events associated with the predetermined event and the registered window size when a predetermined event is generated from the plurality of communication equipments;
Analyzing the collected event information based on the constructed event tree to predict whether a service fault event occurs in at least one of the plurality of communication equipments
Wherein the failure occurrence determination method comprises:
KR1020160085718A 2016-07-06 Apparatus and method for detecting error occurrence KR102670723B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020160085718A KR102670723B1 (en) 2016-07-06 Apparatus and method for detecting error occurrence

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020160085718A KR102670723B1 (en) 2016-07-06 Apparatus and method for detecting error occurrence

Publications (2)

Publication Number Publication Date
KR20180005512A true KR20180005512A (en) 2018-01-16
KR102670723B1 KR102670723B1 (en) 2024-05-31

Family

ID=

Similar Documents

Publication Publication Date Title
US9672085B2 (en) Adaptive fault diagnosis
US20190196894A1 (en) Detecting and analyzing performance anomalies of client-server based applications
US9246777B2 (en) Computer program and monitoring apparatus
EP4235436A2 (en) Method and system for automatic real-time causality analysis of end user impacting system anomalies using causality rules and topological understanding of the system to effectively filter relevant monitoring data
EP3745272B1 (en) An application performance analyzer and corresponding method
US6973415B1 (en) System and method for monitoring and modeling system performance
US8352589B2 (en) System for monitoring computer systems and alerting users of faults
US8635498B2 (en) Performance analysis of applications
US7953847B2 (en) Monitoring and management of distributing information systems
US7082381B1 (en) Method for performance monitoring and modeling
US20160378583A1 (en) Management computer and method for evaluating performance threshold value
US7197428B1 (en) Method for performance monitoring and modeling
CN107704387B (en) Method, device, electronic equipment and computer readable medium for system early warning
JPWO2016017208A1 (en) Monitoring system, monitoring device, and inspection device
CN114064196A (en) System and method for predictive assurance
US7369967B1 (en) System and method for monitoring and modeling system performance
JP6572795B2 (en) Analysis apparatus and analysis program
CN110716842A (en) Cluster fault detection method and device
US20210359899A1 (en) Managing Event Data in a Network
KR20210058468A (en) Apparatus and method for artificial intelligence operator support system of intelligent edge networking
US11153769B2 (en) Network fault discovery
KR20180005512A (en) Apparatus and method for detecting error occurrence
KR102670723B1 (en) Apparatus and method for detecting error occurrence
CN111611131B (en) Operation and maintenance method, device and system based on Saltstack and storage medium
KR101520103B1 (en) System and method for inference and surveillance of application fault of it service using functional partitioning

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right