KR20210108340A - IT Infrastructure Fault Learning and Analysis System Using Linguistic Analysis Techniques - Google Patents

IT Infrastructure Fault Learning and Analysis System Using Linguistic Analysis Techniques Download PDF

Info

Publication number
KR20210108340A
KR20210108340A KR1020210106696A KR20210106696A KR20210108340A KR 20210108340 A KR20210108340 A KR 20210108340A KR 1020210106696 A KR1020210106696 A KR 1020210106696A KR 20210106696 A KR20210106696 A KR 20210106696A KR 20210108340 A KR20210108340 A KR 20210108340A
Authority
KR
South Korea
Prior art keywords
event
unit
failure
data
learning
Prior art date
Application number
KR1020210106696A
Other languages
Korean (ko)
Other versions
KR102509374B1 (en
Inventor
박권재
Original Assignee
(주)와치텍
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by (주)와치텍 filed Critical (주)와치텍
Priority to KR1020210106696A priority Critical patent/KR102509374B1/en
Publication of KR20210108340A publication Critical patent/KR20210108340A/en
Application granted granted Critical
Publication of KR102509374B1 publication Critical patent/KR102509374B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3466Performance evaluation by tracing or monitoring
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/22Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
    • G06F11/2263Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3452Performance evaluation by statistical analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/54Interprogram communication
    • G06F9/541Interprogram communication via adapters, e.g. between incompatible applications
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/54Interprogram communication
    • G06F9/542Event management; Broadcasting; Multicasting; Notifications
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services

Abstract

Disclosed is an IT infrastructure failure learning and analysis system using a linguistic analysis technique, capable of learning a failure event through machine learning with a linguistic analysis technique, and, therethrough, predicting an event occurrence cause and an event which can occur, and identifying details which can affect an event of other equipment, at a glance. According to an advisable embodiment of the present invention, the IT infrastructure failure learning and analysis system using a linguistic analysis technique includes: an agent management part collecting a resource based on set data, determining an event, and converting the event statistically ordered in accordance with an existing condition into a sentence; a linguistic analysis part converting the sentence set by the agent management part into data and learning the data, setting and managing the learned data as a model, predicting a failure with respect to the single event, and determining an associated failure and a failure cause; and a web service part bringing necessary information from the linguistic analysis part to display the same on a client.

Description

언어학적 분석 기법을 이용한 IT 인프라 장애 학습 및 분석 시스템{IT Infrastructure Fault Learning and Analysis System Using Linguistic Analysis Techniques}IT Infrastructure Fault Learning and Analysis System Using Linguistic Analysis Techniques

본 발명은 언어학적 분석기법을 이용해 IT 인프라에서 발생하는 이벤트를 학습하고 학습된 내용을 바탕으로 발생하는 이벤트를 분석하는 시스템에 관한 것으로, 보다 상세하게는 이벤트를 단어 및 문장으로 변환하고 그 결과를 언어학적 기법으로 학습해 데이터모델을 생성하고, 이후 이벤트 발생 시 학습한 데이터모델을 통해 장애원인과 연관장비에서 발생할 수 있는 장애 그리고 발생가능한 장애를 예측하기 위한 언어학적 분석기법을 이용한 IT 인프라 장애 학습 및 분석 시스템에 관한 것이다.The present invention relates to a system for learning an event occurring in an IT infrastructure using a linguistic analysis technique and analyzing an event occurring based on the learned content, and more specifically, converting the event into words and sentences and converting the result into words and sentences. Learning with linguistic techniques to create a data model, and then learning IT infrastructure failures using linguistic analysis techniques to predict the causes of failures, possible failures in related equipment, and possible failures through the learned data model when an event occurs and analysis systems.

급격한 IT환경의 변화와 다양화로 관리대상의 범위가 시스템, 서버, 네트워크 등으로 늘어나고 있다. 이기종 장비들이 통합시스템으로 구성됨에 따라 장애이벤트 발생 시 발생원인은 물론 향후 발생할 다양한 장애에 대한 대비가 필요한 상황이다. Due to the rapid change and diversification of the IT environment, the scope of management targets is expanding to systems, servers, and networks. As heterogeneous equipment is composed of an integrated system, it is necessary to prepare for various failures that may occur in the future as well as the cause of the occurrence of a failure event.

종래의 예측시스템은 장애 이력을 바탕으로 유사한 상황에서 해당 장애가 발생할 수 있음을 예측하는데 초점이 맞춰져 있다. 그러나 현재의 복잡하고 다양해진 인프라 구성요소들 간 관계에서 이벤트를 예측하고 요소들 간 연관관계를 파악하기에는 활용성 및 대응력이 부족하다.The conventional prediction system is focused on predicting that a corresponding failure may occur in a similar situation based on the failure history. However, in the current complex and diversified relationship between infrastructure components, it lacks usability and responsiveness to predict events and identify relationships between elements.

이에 따라 장애 이벤트를 분석하는 기법과 이를 바탕으로 한 장애 발생 예측 및 근원지 분석이 가능한 새로운 기술이 필요한 실정이다.Accordingly, there is a need for a technique for analyzing a failure event and a new technology capable of predicting the occurrence of a failure and analyzing the source based on it.

본 발명이 이루고자 하는 기술적인 과제는 발생한 이벤트를 단어와 문장으로 변환해 데이터 학습을 진행하고, 학습된 모델을 통해 장애 이벤트 발생 시 이후 발생할 이벤트를 예측하고 대처할 수 있도록 하는 시스템을 제공하는 것이다.The technical task to be achieved by the present invention is to provide a system that converts an event that occurs into words and sentences to learn data, and predicts and responds to subsequent events when a failure event occurs through the learned model.

또한, 학습된 데이터를 통해 장애 이벤트 발생 시, 이벤트가 발생한 근원을 분석하고 이와 연관된 다른 장비의 이벤트들을 분석할 수 있는 시스템을 제공하는 것이다.In addition, when a failure event occurs through the learned data, it is to provide a system capable of analyzing the source of the event and analyzing the events of other equipment related thereto.

상기 기술적 과제를 달성하기 위하여, 본 발명의 일 실시 예에 따른 언어학적 분석 기법을 이용한 IT 인프라 장애 학습 및 분석 시스템은 설정된 데이터를 기반으로 자원을 수집하고, 이벤트를 판단하고, 기준조건에 따라 통계로 정리된 이벤트를 문장으로 변환하는 에이전트 관리부와; 상기 에이전트 관리부에서 설정된 문장을 데이터로 변환해 학습하고, 학습된 데이터를 모델로 설정해 관리하고, 단일 이벤트에 대해 장애 예측과 연관장애 및 장애원인을 판단하는 언어분석부와; 상기 언어분석부에서 설정한 이벤트 모델의 데이터 정보를 저장하는 데이터모델부와; 상기 언어분석부로부터 필요한 정보를 가져와 클라이언트에 표시하는 웹서비스부;를 포함할 수 있다.In order to achieve the above technical task, an IT infrastructure failure learning and analysis system using a linguistic analysis technique according to an embodiment of the present invention collects resources based on set data, determines an event, and provides statistics according to reference conditions. an agent management unit that converts the events organized by . a language analysis unit that converts and learns the sentences set in the agent management unit into data, sets and manages the learned data as a model, and determines a failure prediction and associated failure and failure cause for a single event; a data model unit for storing data information of the event model set by the language analysis unit; and a web service unit for fetching necessary information from the language analysis unit and displaying it on the client.

또한, 상기 기술적 과제를 달성하기 위하여 본 발명의 다른 실시 예에 따른 언어학적 분석 기법을 이용한 IT 인프라 장애 학습 및 분석 시스템에 있어 상기 에이전트 관리부는 수집대상의 관리타입정보, 자원타입정보, 자원정보를 수집 및 저장하는 자원정보부;를 포함하고, 상기 자원정보부에서 수집한 정보 중 임계치 기준을 초과한 데이터를 기반으로 이벤트 정보를 생성하고 저장하는 이벤트부;를 포함하고, 상기 이벤트부에서 생성된 이벤트를 하나의 단어로 변환하고 변환된 이벤트들을 문장으로 생성하는 문장생성부;를 포함할 수 있다.In addition, in the IT infrastructure failure learning and analysis system using a linguistic analysis technique according to another embodiment of the present invention in order to achieve the above technical task, the agent management unit collects the management type information, resource type information, and resource information of the collection target. Including; and an event unit for generating and storing event information based on data exceeding a threshold standard among the information collected by the resource information unit; It may include; a sentence generator that converts a single word and generates the converted events into a sentence.

또한, 상기 기술적 과제를 달성하기 위한 본 발명의 또 다른 실시 예에 따른 언어학적 분석 기법을 이용한 IT 인프라 장애 학습 및 분석 시스템에 있어 상기 자원정보부는 수집대상 장비종류를 파악하는 관리타입부와; 수집하려는 성능정보 종류를 파악하는 자원타입부와; 성능정보에 해당하는 자원을 파악하는 자원부와; 수집된 자원을 저장하는 수집 자원부;를 포함하고, 상기 이벤트부는 상기 수집 자원부에 저장된 성능 정보가 임계치를 초과했는지를 확인하는 임계치 확인부와; 설정된 임계치를 초과한 정보에 대해 이벤트를 생성하고 생성된 단일 이벤트 정보를 언어분석부로 전달하는 이벤트 생성부;를 포함하고, 상기 문장생성부는 상기 이벤트 생성부에서 생성된 이벤트를 기준조건(시간, 일, 월, 년 등의 기준) 단위로 통계를 생성해 통계범위에 포함되는 이벤트를 분류하는 이벤트 통계부와; 상기 이벤트 통계부에서 생성된 이벤트 통계 정보를 바탕으로 하나의 이벤트를 이벤트 종류에 따라 하나의 임의 단어로 변환하고 변환된 단어를 묶어 문장으로 구성하고 문장으로 변환한 이벤트를 언어분석부로 전달하는 이벤트 변환부;를 포함할 수 있다.In addition, in the IT infrastructure failure learning and analysis system using a linguistic analysis technique according to another embodiment of the present invention for achieving the above technical task, the resource information unit includes: a management type unit for identifying a type of equipment to be collected; a resource type unit for identifying types of performance information to be collected; a resource unit for identifying a resource corresponding to the performance information; a collection resource unit for storing the collected resources; wherein the event unit includes: a threshold value check unit for confirming whether the performance information stored in the collection resource unit exceeds a threshold; Including; an event generator for generating an event for information exceeding a set threshold and delivering the generated single event information to the language analysis unit, wherein the sentence generator sets the event generated by the event generator to a reference condition (time, day, day) , month, year, etc.) by generating statistics by unit and categorizing events included in the statistical range; Event conversion that converts one event into one arbitrary word according to the event type based on the event statistics information generated by the event statistics unit, binds the converted words to form a sentence, and delivers the event converted into a sentence to the language analysis unit may include;

또한, 상기 기술적 과제를 달성하기 위하여 본 발명의 또 다른 실시 예에 따른 언어학적 분석 기법을 이용한 IT 인프라 장애 학습 및 분석 시스템에 있어 상기 언어분석부는 상기 문장 생성부로부터 받은 문장화된 이벤트를 토크나이저하고, 벡터로 변환해 학습하는 데이터학습부;를 포함하고, 상기 데이터학습부에서 학습된 데이터를 하나의 모델로 설정해 관리하고, 단일 이벤트 수신 시 저장된 데이터 모델 중 동일하거나 유사한 데이터 모델을 불러오는 모델관리부;를 포함하고, 상기 이벤트부로부터 받은 단일 이벤트와 동일하거나 유사한 데이터모델을 상기 모델관리부에서 불러와 상호비교를 통해 이후 발생할 이벤트를 예측하고, 이벤트 발생 원인과 연관 이벤트를 판단하는 장애 판단부;를 포함할 수 있다.In addition, in the IT infrastructure failure learning and analysis system using a linguistic analysis technique according to another embodiment of the present invention in order to achieve the above technical task, the language analysis unit converts the sentenced event received from the sentence generation unit into a tokenizer. and a data learning unit that transforms into a vector and learns; a model management unit that sets and manages the data learned in the data learning unit as a model, and calls the same or similar data model among the stored data models when a single event is received Including; and a failure determination unit that calls the same or similar data model as the single event received from the event unit from the model management unit, predicts the event to occur later through mutual comparison, and determines the cause of the event and the related event; may include

또한, 상기 기술적 과제를 달성하기 위하여 본 발명의 또 다른 실시 예에 따른 언어학적 분석 기법을 이용한 IT 인프라 장애 학습 및 분석 시스템에 있어 상기 데이터학습부는 상기 문장 생성부에서 생성한 문장으로 변환한 이벤트를 수신하는 문장수신부와; 수신한 이벤트 문장을 단어토큰으로 분리하는 토크나이저부; 상기 토크나이저부에서 단어토큰으로 분리한 이벤트 문장을 벡터데이터로 변환하고, 변환된 벡터데이터를 언어학적 기법을 활용해 각 이벤트를 하나의 단어로 인식함으로써 주위 단어를 통해 중심 단어를 예측하고 중심 단어를 통해 주위 단어를 예측하는 학습단계를 거쳐 발생할 이벤트와 연관된 이벤트를 언어학적 유사도와 키워드를 통해 머신러닝하는 벡터변환부;를 포함하고, 상기 모델관리부는 상기 벡터변환부에서 벡터로 변환해 학습한 이벤트 정보를 하나의 데이터 모델로 설정하는 모델 설정부와; 설정된 모델 정보를 상기 데이터모델부에 저장하는 모델저장부와; 단일 이벤트 수신 시 수신된 이벤트와 동일한 이벤트가 포함된 데이터모델을 판단해 불러오는 모델로드부;를 포함하고, 상기 장애판단부는 상기 이벤트부에서 생성된 단일 이벤트를 수신하는 이벤트 수신부; 상기 모델 로드부를 통해 데이터모델부에 저장된 데이터모델 정보를 상기 이벤트 수신부에서 수신한 이벤트 정보와 비교하여 발생한 장애에 이어서 수집장비에서 발생할 장애를 예측하는 장애 예측 판단부와; 상기 모델 로드부를 통해 데이터모델부에 저장된 데이터 모델 정보를 수신된 단일 이벤트 분석 정보와 비교하여 이벤트가 발생한 원인과 이벤트로 인해 다른 수집 장비에서 발생한 연관 이벤트를 판단하는 연관 장애 판단부;를 포함할 수 있다.In addition, in the IT infrastructure failure learning and analysis system using a linguistic analysis technique according to another embodiment of the present invention in order to achieve the above technical task, the data learning unit converts the event into the sentence generated by the sentence generation unit. a sentence receiving unit for receiving; a tokenizer unit that separates the received event sentence into word tokens; The tokenizer unit converts the event sentences separated by word tokens into vector data, and recognizes each event as a single word using the converted vector data using linguistic techniques to predict the central word through surrounding words and to predict the central word. a vector conversion unit for machine learning through linguistic similarity and keywords on events related to events that will occur through a learning step of predicting surrounding words through; a model setting unit for setting event information as one data model; a model storage unit for storing set model information in the data model unit; When a single event is received, a model load unit that determines and calls a data model including the same event as the received event; a failure prediction determination unit that compares the data model information stored in the data model unit through the model load unit with the event information received from the event receiving unit and predicts a failure to occur in the collection equipment following the failure; A related failure determination unit that compares the data model information stored in the data model unit through the model load unit with the received single event analysis information to determine the cause of the event and the related event that occurred in other collection equipment due to the event; may include; have.

또한, 상기 기술적 과제를 달성하기 위한 본 발명의 또 다른 실시 예에 따른 언어학적 분석 기법을 이용한 IT 인프라 장애 학습 및 분석 시스템에 있어 상기 에이전트 관리부에서 수집한 이벤트를 언어분석부에서 학습해 데이터모델로 생성하기 위한 방법은 수집된 장비가 있는지 판단하는 단계와; 수집된 장비의 자원값을 확인하는 단계와; 자원값이 임계치를 초과했는지 확인하는 단계와; 임계치를 초과한 자원에 대해 이벤트를 생성하는 단계와; 기준조건(시, 일, 월 년 등)에 따라 이벤트 통계를 생성하는 단계와; 통계범위에 포함된 이벤트를 단어로 변환하고, 변환된 단어를 문장으로 묶는 단계와; 생성된 문장을 데이터 학습부로 전달하는 단계와; 수신한 이벤트 문장을 단어토큰으로 분리하는 단계와; 이벤트 단어토큰을 벡터데이터로 변환하는 단계와; 벡터데이터 분석을 통해 발생할 이벤트와 연관된 이벤트를 언어학적 분석기법에 기반한 머신러닝으로 학습하는 단계와; 학습한 데이터를 하나의 데이터모델로 구축하는 단계와; 결과를 데이터모델부에 저장하는 단계;를 포함할 수 있다. In addition, in the IT infrastructure failure learning and analysis system using a linguistic analysis technique according to another embodiment of the present invention for achieving the above technical task, the event collected by the agent management unit is learned by the language analysis unit as a data model. The method for generating includes determining whether there is collected equipment; checking the resource values of the collected equipment; checking whether the resource value exceeds a threshold; generating an event for a resource exceeding a threshold; generating event statistics according to reference conditions (hour, day, month, year, etc.); converting an event included in the statistical range into a word, and binding the converted word into a sentence; transmitting the generated sentence to a data learning unit; separating the received event sentence into word tokens; converting the event word token into vector data; Learning an event related to an event to occur through vector data analysis by machine learning based on a linguistic analysis technique; building the learned data into one data model; Storing the result in the data model unit; may include.

또한, 상기 기술적 과제를 달성하기 위한 본 발명의 또 다른 실시 예에 따른 언어학적 분석 기법을 이용한 IT 인프라 장애 학습 및 분석 시스템에 있어 상기 에이전트 관리부에서 생성된 이벤트를 언어분석부에서 발생 장애를 예측하고 장애 원인과 연관 장애를 분석하기 위한 방법은 수집된 장비가 있는지 판단하는 단계와; 수집된 장비의 자원값을 확인하는 단계와; 자원값이 임계치를 초과했는지 판단하는 단계와; 임계치를 초과한 자원에 대해 이벤트를 생성하는 단계와; 생성된 이벤트를 장애판단부로 전달하는 단계와; 모델부에서 수신한 이벤트와 동일하거나 유사한 데이터 모델을 불러오는 단계와; 장애예측판단부에서 해당 이벤트 이후 발생할 이벤트를 데이터모델과 비교해 추출하는 단계 및 연관장애 판단부에서 데이터모델과 비교를 통해 이벤트 발생 원인과 이와 연관된 다른 장비의 이벤트를 추출하는 단계와; 각 부에서 판단한 결과값을 웹서비스부를 통해 클라이언트에 표현하는 단계;를 포함할 수 있다.In addition, in the IT infrastructure failure learning and analysis system using a linguistic analysis technique according to another embodiment of the present invention for achieving the above technical task, the event generated by the agent management unit predicts the failure occurring in the language analysis unit, A method for analyzing a cause of a failure and an associated failure comprises the steps of: determining whether there is collected equipment; checking the resource values of the collected equipment; determining whether the resource value exceeds a threshold; generating an event for a resource exceeding a threshold; transmitting the generated event to a failure determination unit; Calling a data model identical to or similar to the event received from the model unit; Comparing and extracting the event to occur after the corresponding event in the failure prediction determination unit with the data model, and extracting the cause of the event and other related equipment events through comparison with the data model in the associated failure determination unit; and expressing the result value determined by each unit to the client through the web service unit.

본 발명에 따른 언어학적 분석 기법을 이용한 IT 인프라 장애 학습 및 분석 시스템은 장애 이벤트를 하나의 단어로 관리하여 머신러닝을 활용한 언어학적 유사도 분석과 키워드 도출을 통해 해당 이벤트로 인해 발생할 이벤트 예측 및 그에 대한 사전 조치를 수행할 수 있는 장점이 있다. The IT infrastructure failure learning and analysis system using a linguistic analysis technique according to the present invention manages a failure event as a single word, predicts an event that will occur due to the event and predicts it through linguistic similarity analysis and keyword derivation using machine learning. It has the advantage of being able to take proactive measures against it.

또한, 장애 이벤트에 대한 분석내용을 통해 이벤트가 발생한 근원과 이로 인해 발생하는 다른 장비의 이벤트를 파악하고, 분석 및 대비할 수 있는 장점이 있다.In addition, there is an advantage in that it is possible to identify, analyze, and prepare for the source of the event and other equipment events that occur due to the analysis of the failure event.

도 1은 본 발명의 바람직한 실시 예에 따른 언어학적 분석기법을 이용한 IT 인프라 장애 분석 시스템을 나타내는 블록도
도 2는 도 1의 언어분석부의 주요 모듈의 구성을 나타내는 블록도
도 3은 도 1의 에이전트 관리부의 주요 모듈의 구성을 나타내는 블록도
도 4는 발생한 이벤트를 학습해 데이터모델로 생성하기 위한 흐름도
도 5는 발생한 이벤트를 통해 장애를 예측하고 연관 장애를 판단하기 위한 흐름도
도 6은 이벤트를 학습하고 장애를 분석하는 과정의 적용 예시를 나타내는 흐름도
1 is a block diagram showing an IT infrastructure failure analysis system using a linguistic analysis technique according to a preferred embodiment of the present invention.
Figure 2 is a block diagram showing the configuration of the main module of the language analysis unit of Figure 1;
3 is a block diagram showing the configuration of main modules of the agent management unit of FIG. 1
4 is a flowchart for learning the event that has occurred and generating it as a data model.
5 is a flowchart for predicting a failure through an event that has occurred and determining an associated failure
6 is a flowchart showing an application example of a process of learning an event and analyzing a disability

본 발명의 이점 및 특징, 그리고 그것들을 달성하는 방법은 첨부되는 도면과 함께 상세하게 후술되어 있는 실시 예들을 참조하면 명확해질 것이다. 그러나 본 발명은 이하에서 게시되는 실시 예들에 한정되는 것이 아니라 서로 다른 다양한 형태로 구현될 수 있으며, 단지 본 실시 예들은 본 발명의 개시가 완전하도록 하고, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 발명의 범주를 완전하게 알려주기 위해 제공되는 것이며, 본 발명은 청구항의 범주에 의해 정의될 뿐이다. 명세서 전체에 걸쳐 동일 참조 부호는 동일 구성요소를 지칭한다. Advantages and features of the present invention, and a method for achieving them will become apparent with reference to the embodiments described below in detail in conjunction with the accompanying drawings. However, the present invention is not limited to the embodiments published below, but may be implemented in various different forms, and only these embodiments allow the disclosure of the present invention to be complete, and common knowledge in the art to which the present invention pertains. It is provided to fully inform the possessor of the scope of the invention, and the present invention is only defined by the scope of the claims. Like reference numerals refer to like elements throughout.

이하에서는 본 발명의 바람직한 실시 예들에 따른 언어학적 분석기법을 이용한 IT인프라 장애 학습 및 분석 시스템을 상세히 설명하기로 한다. 참고로 본 발명을 설명함에 있어서 관련된 공지 기능 혹은 구성에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우 그 상세한 설명을 생략한다.Hereinafter, an IT infrastructure failure learning and analysis system using a linguistic analysis technique according to preferred embodiments of the present invention will be described in detail. For reference, in describing the present invention, if it is determined that a detailed description of a related known function or configuration may unnecessarily obscure the gist of the present invention, the detailed description thereof will be omitted.

본 명세서에서 이벤트란 관제대상 장비의 자원값 중 지정된 임계치를 초과한 이슈에 관한 것으로, 임계치를 초과한 내역을 장애로 정의한다.In this specification, an event relates to an issue that exceeds a specified threshold among resource values of the equipment to be controlled, and a history exceeding the threshold is defined as a failure.

도 1은 본 발명의 바람직한 실시 예에 따른 언어학적 분석기법을 이용한 IT 인프라 장애 학습 및 분석 시스템을 나타내는 블록도이고, 도 2는 언어분석부의 주요 모듈의 구성을 나타내는 블록도이고, 도 3은 에이전트 관리부의 주요 모듈을 나타내는 블록도이다.1 is a block diagram showing an IT infrastructure failure learning and analysis system using a linguistic analysis technique according to a preferred embodiment of the present invention, FIG. 2 is a block diagram showing the configuration of a main module of a language analysis unit, and FIG. 3 is an agent It is a block diagram showing the main modules of the management unit.

도 4는 발생한 이벤트를 학습해 데이터 모델로 생성하기 위한 흐름도이고, 도 5는 발생한 이벤트를 통해 장애를 예측하고 연관 장애 판단하기 위한 흐름도이고, 도 6은 이벤트를 학습하고 장애를 분석하는 과정의 적용 예시를 나타내는 흐름도.Figure 4 is a flow chart for learning the event that has occurred and creating a data model, Figure 5 is a flow chart for predicting a failure through the occurred event and determining a related failure, Figure 6 is an application of the process of learning the event and analyzing the failure A flow chart showing an example.

도 1에서 도시된 바와 같이, 본 발명의 일 실시 예에 따른 언어학적 분석기법을 이용한 IT 인프라 장애 학습 및 분석 시스템은 설정된 데이터를 기반으로 자원을 수집하고, 이벤트를 판단하고, 기준조건에 따라 통계로 정리된 이벤트를 문장으로 변환하는 에이전트 관리부(10); 상기 에이전트 관리부에서 설정된 문장을 데이터 변환해 학습하고, 학습된 데이터를 모델로 설정해 관리하고, 단일 이벤트에 대해 장애 예측과 연관 장애 및 장애원인을 판단하는 언어분석부(20); 상기 언어분석부에서 설정한 이벤트 모델의 데이터 정보를 저장하는 데이터모델부(30); 상기 언어분석부로부터 필요한 정보를 가져와 클라이언트(50)에 표시하는 웹서비스부(40);를 포함할 수 있다. As shown in FIG. 1 , the IT infrastructure failure learning and analysis system using a linguistic analysis technique according to an embodiment of the present invention collects resources based on set data, determines an event, and provides statistics according to reference conditions. Agent management unit (10) for converting the event arranged as a sentence; a language analysis unit 20 that converts and learns the sentences set in the agent management unit, sets and manages the learned data as a model, and determines a failure prediction and associated failure and failure cause for a single event; a data model unit 30 for storing data information of the event model set by the language analysis unit; It may include; a web service unit 40 that retrieves the necessary information from the language analysis unit and displays it on the client 50 .

상기 에이전트관리부(10)는 수집대상의 관리타입정보, 자원타입정보, 자원정보를 수집 및 저장하는 자원정보부(100); 상기 자원정보부에서 수집한 정보 중 임계치 기준을 초과한 데이터를 기반으로 이벤트 정보를 생성하고 저장하는 이벤트부(110); 및 상기 이벤트부에서 생성된 이벤트를 하나의 단어로 변환하고 변환된 이벤트들을 문장으로 생성하는 문장생성부(120);를 포함할 수 있다.The agent management unit 10 includes: a resource information unit 100 for collecting and storing management type information, resource type information, and resource information of a collection target; an event unit 110 for generating and storing event information based on data exceeding a threshold criterion among the information collected by the resource information unit; and a sentence generation unit 120 that converts the event generated by the event unit into a single word and generates the converted events into a sentence.

상기 언어분석부(20)는 상기 문장생성부로부터 받은 문장화된 이벤트를 토크나이저하고, 벡터로 변환해 학습하는 데이터학습부(200); 상기 데이터학습부에서 학습된 데이터를 하나의 모델로 설정해 관리하고, 단일 이벤트 수신 시 저장된 데이터 모델 중 동일하거나 유사한 데이터 모델을 불러오는 모델관리부(210); 및 상기 이벤트로부터 받은 단일 이벤트와 동일하거나 유사한 데이터 모델을 상기 모델관리부에서 불러와 상호비교를 통해 이후 발생할 이벤트를 예측하고, 이벤트 발생 원인과 연관 이벤트를 판단하는 장애 판단부(220);를 포함할 수 있다.The language analysis unit 20 includes: a data learning unit 200 for tokenizing the sentenced event received from the sentence generating unit, transforming it into a vector and learning; a model management unit 210 that sets and manages the data learned in the data learning unit as a single model, and calls the same or similar data model among the stored data models when a single event is received; and a failure determination unit 220 that calls a data model identical to or similar to a single event received from the event from the model management unit, predicts an event to occur later through mutual comparison, and determines a cause of the event and a related event. can

도 2에서 도시된 바와 같이, 상기 자원정보부(100)는 수집대상 장비의 장비종류를 파악하는 관리타입부(101); 수집하려는 성능정보 종류를 파악하는 자원타입부(102); 성능정보에 해당하는 자원을 파악하는 자원부(103); 및 수집된 자원을 저장하는 수집 자원부(104);를 포함할 수 있다. As shown in Figure 2, the resource information unit 100 includes a management type unit 101 for identifying the equipment type of the collection target equipment; a resource type unit 102 for identifying a type of performance information to be collected; a resource unit 103 for identifying a resource corresponding to the performance information; and a collection resource unit 104 for storing the collected resources.

상기 이벤트부(110)는 상기 수집자원부(104)에 저장된 성능 정보가 임계치를 초과했는지 확인하는 임계치 확인부(111); 설정된 임계치를 초과한 정보에 대해 이벤트를 생성하고 생성된 단일 이벤트 정보를 언어분석부로 전달하는 이벤트 생성부(112);를 포함할 수 있다.The event unit 110 includes a threshold check unit 111 to check whether the performance information stored in the collection resource unit 104 exceeds a threshold; and an event generating unit 112 that generates an event for information exceeding a set threshold and transmits the generated single event information to the language analysis unit.

상기 문장생성부(120)는 상기 이벤트 생성부(112)에서 생성된 이벤트를 기준조건(시간, 일, 월, 년 등) 단위로 통계를 생성해 통계범위에 포함되는 이벤트를 분류하는 이벤트 통계부(121); 상기 이벤트 통계부(121)에서 생성된 이벤트 통계 정보를 바탕으로 하나의 이벤트를 이벤트 종류에 따라 하나의 임의 단어로 변환하고 변환된 단어를 묶어 문장으로 구성하고 문장으로 변환한 이벤트를 언어분석부로 전달하는 이벤트 변환부(122);를 포함할 수 있다.The sentence generation unit 120 generates statistics on the event generated by the event generation unit 112 in units of a reference condition (hour, day, month, year, etc.) and classifies the event included in the statistical range. (121); Based on the event statistics information generated by the event statistics unit 121, one event is converted into one arbitrary word according to the event type, the converted words are bundled to form a sentence, and the converted event is delivered to the language analysis unit. It may include an event conversion unit 122;

도 3에서 도시된 바와 같이, 상기 데이터학습부(200)는 상기 문장생성부(120)에서 생성한 문장으로 변환한 이벤트를 수신하는 문장수신부(201); 수신한 이벤트 문장을 단어토큰으로 분리하는 토크나이저부(202); 상기 토크나이저부(202)에서 단어토큰으로 분리한 이벤트 문장을 벡터데이터로 변환하고, 변환된 벡터데이터를 언어학적 기법을 활용해 각 이벤트를 하나의 단어로 인식함으로써 주위 단어를 통해 중심 단어를 예측하고 중심 단어를 통해 주위 단어를 예측하는 학습단계를 거쳐 발생할 이벤트와 연관된 이벤트를 언어학적 유사도와 키워드를 통해 머신러닝으로 학습하는 벡터변환부(203);를 포함할 수 있다.As shown in FIG. 3 , the data learning unit 200 includes: a sentence receiving unit 201 for receiving an event converted into a sentence generated by the sentence generating unit 120 ; a tokenizer unit 202 that separates the received event sentence into word tokens; The tokenizer unit 202 converts the event sentences separated by word tokens into vector data, and predicts the central word through the surrounding words by recognizing each event as a single word using the converted vector data using a linguistic technique. and a vector transform unit 203 that learns an event related to an event to occur through a learning step of predicting surrounding words through a central word through machine learning through linguistic similarity and keywords; may include.

상기 모델관리부(210)는 상기 벡터변환부(203)에서 벡터로 변환해 학습한 이벤트 정보를 하나의 데이터 모델로 설정하는 모델설정부(211); 설정된 모델 정보를 상기 데이터모델부(30)에 저장하는 모델저장부(212); 및 단일 이벤트 수신 시 수신된 이벤트와 동일한 이벤트가 포함된 데이터모델을 판단 해 불러오는 모델 로드부(213);를 포함할 수 있다.The model management unit 210 includes: a model setting unit 211 for setting the event information learned by converting the vector conversion unit 203 into a vector as one data model; a model storage unit 212 for storing set model information in the data model unit 30; and a model load unit 213 that determines and calls a data model including the same event as the received event when a single event is received.

상기 장애판단부(220)는 상기 이벤트부(110)에서 생성된 단일 이벤트를 수신하는 이벤트 수신부(221); 상기 모델 로드부(213)를 통해 데이터모델부(30)에 저장된 데이터 모델 정보를 상기 이벤트 수신부(221)에서 수신한 이벤트 정보와 비교하여 발생한 장애에 이어서 수집장비에서 발생할 장애를 예측하는 장애 예측 판단부(223); 상기 모델 로드부를 통해 데이터모델부(30)에 저장된 데이터 모델 정보를 수신된 단일 이벤트 분석 정보와 비교하여 이벤트가 발생한 원인과 이벤트로 인해 다른 수집 장비에서 발생한 연관 이벤트를 판단하는 연관 장애 판단부(222);를 포함할 수 있다.The failure determination unit 220 includes an event receiving unit 221 for receiving a single event generated by the event unit 110; Failure prediction determination to predict the failure to occur in the collection equipment following the failure occurred by comparing the data model information stored in the data model unit 30 through the model load unit 213 with the event information received from the event receiving unit 221 part 223; A related failure determination unit 222 that compares the data model information stored in the data model unit 30 through the model load unit with the received single event analysis information to determine the cause of the event and a related event that occurred in other collection equipment due to the event ); may be included.

도 4는 본 발명의 바람직한 실시 예에 언어학적 분석 기법을 이용한 IT 인프라 장애 학습 및 분석 시스템에서 발생한 이벤트를 학습해 데이터 모델로 생성하기 위한 흐름도이다.4 is a flowchart for learning an event occurring in an IT infrastructure failure learning and analysis system using a linguistic analysis technique in a preferred embodiment of the present invention and generating it as a data model.

도 4에서 도시된 바와 같이, 상기 에이전트 관리부(10)에서 수집한 이벤트를 언어분석부(20)에서 학습해 데이터모델로 생성하기 위한 방법은 수집된 장비가 있는지 판단하는 단계(S100); 수집된 장비의 자원값을 확인하는 단계(S101); 자원값이 임계치를 초과했는지 확인하는 단계(S102); 임계치를 초과한 자원에 대해 이벤트를 생성하는 단계(S103); 기준조건(시간, 일, 월, 년 등)에 따라 이벤트 통계를 생성하는 단계(S104); 통계범위에 포함된 이벤트를 단어로 변환하고, 변환된 단어를 문장으로 묶는 단계(S105); 생성된 문장을 데이터 학습부로 전달하는 단계(S106); 수신한 이벤트 문장을 단어토큰으로 분리하는 단계(S107); 이벤트 단어토큰을 벡터 데이터로 변환하는 단계(S108); 벡터데이터 분석을 통해 발생할 이벤트와 연관된 이벤트를 언어학적 분석기법에 기반한 머신러닝으로 학습하는 단계(S109); 학습한 데이터를 하나의 데이터모델로 구축하는 단계(S110); 결과를 데이터모델부에 저장하는 단계(S111)를 포함할 수 있다.As shown in Fig. 4, the method for learning the event collected by the agent management unit 10 in the language analysis unit 20 and generating it as a data model includes the steps of determining whether there is collected equipment (S100); checking the resource values of the collected equipment (S101); Checking whether the resource value exceeds the threshold (S102); generating an event for a resource exceeding a threshold (S103); generating event statistics according to reference conditions (hour, day, month, year, etc.) (S104); converting an event included in the statistical range into a word, and bundling the converted word into a sentence (S105); transmitting the generated sentence to the data learning unit (S106); separating the received event sentence into word tokens (S107); converting the event word token into vector data (S108); Learning an event related to an event to occur through vector data analysis by machine learning based on a linguistic analysis technique (S109); Building the learned data into one data model (S110); It may include a step (S111) of storing the result in the data model unit.

도 5는 본 발명의 바람직한 실시 예에 따른 언어학적 분석 기법을 이용한 IT 인프라 장애 학습 및 분석 시스템에서 발생한 이벤트를 통해 장애를 예측하고 연관 장애를 판단하기 위한 흐름도이다.5 is a flowchart for predicting a failure and determining a related failure through an event occurring in an IT infrastructure failure learning and analysis system using a linguistic analysis technique according to a preferred embodiment of the present invention.

도 5에서 도시된 바와 같이, 상기 에이전트 관리부(10)에서 생성된 이벤트를 언어분석부(20)에서 발생 장애를 예측하고 장애 원인과 연관 장애를 분석하기 위한 방법은 수집된 장비가 있는지 판단하는 단계(S200); 수집된 장비의 자원값을 확인하는 단계(S201); 자원값이 임계치를 초과했는지 판단하는 단계(S202); 임계치를 초과한 자원에 대해 이벤트를 생성하는 단계(S203); 생성된 이벤트를 장애판단부로 전달하는 단계(S204); 모델로드부에서 수신한 이벤트와 동일하거나 유사한 데이터모델을 불러오는 단계(S205); 장애예측판단부에서 해당 이벤트 이후 발생할 이벤트를 데이터모델과 비교해 추출하는 단계 및 연관 장애 판단부에서 데이터모델과 비교를 통해 이벤트 발생 원인과 이와 연관된 다른 장비의 이벤트를 추출하는 단계(S206, S207); 각 부에서 판단한 결과값을 웹서비스부를 통해 클라이언트에 표현하는 단계(S208)를 포함할 수 있다.As shown in FIG. 5, the method for predicting the occurrence of the failure in the language analysis unit 20 for the event generated by the agent management unit 10 and analyzing the cause of the failure and the associated failure is the step of determining whether there is collected equipment. (S200); checking the resource values of the collected equipment (S201); determining whether the resource value exceeds a threshold (S202); generating an event for a resource exceeding a threshold (S203); transmitting the generated event to the failure determination unit (S204); Calling a data model identical to or similar to the event received from the model load unit (S205); The steps of extracting the event to occur after the corresponding event in the failure prediction determining unit by comparing it with the data model and extracting the cause of the event and other related equipment events through comparison with the data model in the related failure determination unit (S206, S207); It may include a step (S208) of expressing the result value determined by each unit to the client through the web service unit.

도 6은 본 발명의 바람직한 실시 예에 따른 언어학적 분석 기법을 이용한 IT 인프라 장애 학습 및 분석 시스템에서 이벤트를 학습하고 장애를 분석하는 과정의 적용 예시를 나타내는 흐름도이다.6 is a flowchart illustrating an application example of a process of learning an event and analyzing a failure in an IT infrastructure failure learning and analysis system using a linguistic analysis technique according to a preferred embodiment of the present invention.

도 6에서 도시된 바와 같이, 발생한 이벤트를 학습하고 장애를 분석하는 방법의 예는 상기 임계치 확인부(111)에서 임계치를 초과한 자원값에 대해 이벤트 생성부(112)에서 이벤트를 생성하고, 생성된 이벤트를 기준조건에 따라 이벤트 통계부(121)에서 통계를 내는 단계(S300); 통계에 포함된 이벤트를 이벤트 변환부(122)에서 단어로 변환하는 단계(S301); 상기 이벤트 변환부(122)에서 변환한 단어를 문장화시키는 단계(S302); 상기 문장 수신부(201)에서 수신한 문장을 토크나이저부(202)에서 단어토큰화하는 단계(S303); 상기 벡터변환부(203)에서 단어토큰을 벡터데이터로 변환하고, 변환된 데이터 구성을 하나의 데이터 모델로 학습하는 단계(S304); 상기 이벤트부(110)에서 생성된 단일 이벤트를 이벤트 수신부(221)에서 수신해 정보를 분석하는 단계(S305); 상기 데이터모델부(30)에서 해당 이벤트 정보와 동일한 이벤트가 포함된 데이터 모델을 불러오고 연관장애판단부(222)와 장애예측판단부(223)를 통해 발생할 이벤트를 예측하고, 이벤트 원인과 연관 장비의 이벤트를 파악하는 단계(S306);을 포함할 수 있다.As shown in FIG. 6 , an example of a method of learning a generated event and analyzing a failure is generating an event in the event generating unit 112 for a resource value exceeding the threshold in the threshold checking unit 111 , and generating generating statistics from the event statistics unit 121 according to the reference condition (S300); converting an event included in statistics into a word by the event conversion unit 122 (S301); converting the word converted by the event conversion unit 122 into a sentence (S302); converting the sentence received by the sentence receiving unit 201 into a word token by the tokenizer 202 (S303); converting the word token into vector data in the vector conversion unit 203 and learning the converted data configuration as a data model (S304); receiving the single event generated by the event unit 110 at the event receiving unit 221 and analyzing the information (S305); The data model unit 30 calls a data model including the same event as the corresponding event information, predicts the event to occur through the associated failure determination unit 222 and the failure prediction determination unit 223, and the event cause and associated equipment It may include a; step (S306) of identifying the event of.

이상 첨부된 도면을 참조하여 본 발명의 실시 예를 설명하였지만, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자는 본 발명이 그 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 실시될 수 있다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시 예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 한다. 본 발명의 범위는 상기 상세한 설명보다는 후술하는 특허청구범위에 의하여 나타내어지며, 특허청구범위의 의미 및 범위 그리고 그 균등개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석하여야 한다.Although embodiments of the present invention have been described with reference to the accompanying drawings, those of ordinary skill in the art to which the present invention pertains can realize that the present invention can be implemented in other specific forms without changing the technical spirit or essential features. you will be able to understand Therefore, it should be understood that the embodiments described above are illustrative in all respects and not restrictive. The scope of the present invention is indicated by the following claims rather than the above detailed description, and all changes or modifications derived from the meaning and scope of the claims and their equivalent concepts should be interpreted as being included in the scope of the present invention. do.

10 : 에이전트관리부 20 : 언어분석부
30 : 데이터 모델부 40 : 웹서비스부
50 : 클라이언트 100 : 자원정보부
101 : 관리타입부 102 : 자원타입부
103 : 자원부 104 : 수집 자원부
110 : 이벤트부 111 : 임계치 확인부
112 : 이벤트 생성부 120 : 문장생성부
121 : 이벤트 통계부 122 : 이벤트 변환부
200 : 데이터 학습부 201 : 문장 수신부
202 : 토크나이저부 203 : 벡터변환부
210 : 모델 관리부 211 : 모델 설정부
212 : 모델 저장부 213 : 모델 로드부
220 : 장애 판단부 221 : 이벤트 수신부
222 : 연관 장애 판단부 223 : 장애 예측 판단부
10: agent management unit 20: language analysis unit
30: data model unit 40: web service unit
50: client 100: resource information department
101: management type unit 102: resource type unit
103: Ministry of Resources 104: Ministry of Collection and Resources
110: event unit 111: threshold check unit
112: event generation unit 120: sentence generation unit
121: event statistics unit 122: event conversion unit
200: data learning unit 201: text receiving unit
202: tokenizer unit 203: vector conversion unit
210: model management unit 211: model setting unit
212: model storage unit 213: model loading unit
220: failure determination unit 221: event receiving unit
222: related disability determination unit 223: disability prediction determination unit

Claims (7)

설정된 데이터를 기반으로 자원을 수집하고, 이벤트를 판단하고, 기준조건에 따라 통계로 정리된 이벤트를 문장으로 변환하는 에이전트 관리부;
상기 에이전트 관리부에서 설정된 문장을 데이터로 변환해 학습하고, 학습된 데이터를 모델로 설정해 관리하고, 단일 이벤트에 대해 장애 예측과 연관 장애 및 장애원인을 판단하는 언어분석부;
상기 언어분석부에서 설정한 이벤트 모델의 데이터 정보를 저장하는 데이터모델부;
상기 언어분석부로부터 필요한 정보를 가져와 클라이언트에 표시하는 웹서비스부;를 포함하는 것을 특징으로 하는 언어학적 분석 기법을 이용한 IT 인프라 장애 학습 및 분석 시스템
an agent management unit that collects resources based on set data, determines an event, and converts an event organized into statistics according to a reference condition into a sentence;
a language analysis unit for learning by converting the sentences set in the agent management unit into data, setting and managing the learned data as a model, and determining a failure prediction and associated failure and failure cause for a single event;
a data model unit for storing data information of the event model set by the language analysis unit;
IT infrastructure failure learning and analysis system using a linguistic analysis technique, characterized in that it includes; a web service unit that retrieves the necessary information from the language analysis unit and displays it on the client
제 1항에 있어서,
상기 에이전트 관리부는,
수집대상의 관리타입정보, 자원타입정보, 자원정보를 수집 및 저장하는 자원정보부;를 포함하고,
상기 자원정보부에서 수집한 정보 중 임계치 기준을 초과한 데이터를 기반으로 이벤트 정보를 생성하고 저장하는 이벤트부;를 포함하고,
상기 이벤트부에서 생성된 이벤트를 하나의 단어로 변환하고 변환된 이벤트들을 문장으로 생성하는 문장 생성부;를 포함하는 것을 특징으로 하는 언어학적 분석 기법을 이용한 IT 인프라 장애 학습 및 분석 시스템
The method of claim 1,
The agent management unit,
A resource information unit that collects and stores the management type information, resource type information, and resource information of the collection target;
and an event unit for generating and storing event information based on data exceeding a threshold criterion among the information collected by the resource information unit;
An IT infrastructure failure learning and analysis system using a linguistic analysis technique comprising a; a sentence generation unit that converts the event generated by the event unit into a single word and generates the converted events into a sentence
제 2항에 있어서,
상기 자원정보부는 수집대상 장비의 장비종류를 파악하는 관리타입부; 수집하려는 성능정보 종류를 파악하는 자원타입부; 성능정보에 해당하는 자원을 파악하는 자원부; 수집된 자원을 저장하는 수집 자원부;를 포함하고,
상기 이벤트부는 상기 수집 자원부에 저장된 성능 정보가 임계치를 초과했는지를 확인하는 임계치 확인부; 설정된 임계치를 초과한 정보에 대해 이벤트를 생성하고 생성된 단일 이벤트 정보를 언어분석부로 전달하는 이벤트 생성부;를 포함하고,
상기 문장생성부는 상기 이벤트 생성부에서 생성된 이벤트를 기준조건(시간, 일, 월, 년 등의 기준) 단위로 통계를 생성해 통계범위에 포함되는 이벤트를 분류하는 이벤트 통계부;
상기 이벤트 통계부에서 생성된 이벤트 통계 정보를 바탕으로 하나의 이벤트를 이벤트 종류에 따라 하나의 임의 단어로 변환하고 변환된 단어를 묶어 문장으로 구성하고 문장으로 변환한 이벤트를 언어분석부로 전달하는 이벤트 변환부; 를 포함하는 것을 특징으로 하는 언어학적 분석 기법을 이용한 IT 인프라 장애 학습 및 분석 시스템
3. The method of claim 2,
The resource information unit includes a management type unit for identifying the equipment type of the equipment to be collected; a resource type unit for identifying types of performance information to be collected; a resource unit for identifying a resource corresponding to the performance information; Includes; a collection resource unit for storing the collected resources;
The event unit may include: a threshold check unit for checking whether the performance information stored in the collection resource unit exceeds a threshold; Including; an event generating unit that generates an event for information exceeding a set threshold and delivers the generated single event information to the language analysis unit;
The sentence generating unit includes: an event statistic unit for classifying events included in the statistical range by generating statistics based on the event generated by the event generating unit in units of reference conditions (time, day, month, year, etc.);
Event conversion that converts an event into a random word according to the event type based on the event statistics information generated by the event statistics unit, forms a sentence by tying the converted word, and delivers the event converted into a sentence to the language analysis unit wealth; IT infrastructure failure learning and analysis system using a linguistic analysis technique, characterized in that it includes
제 1항에 있어서,
상기 언어분석부는,
상기 문장생성부로부터 받은 문장화된 이벤트를 토크나이저하고, 벡터로 변환해 학습하는 데이터학습부;를 포함하고,
상기 데이터학습부에서 학습된 데이터를 하나의 모델로 설정해 관리하고, 단일 이벤트 수신 시 저장된 데이터 모델 중 동일하거나 유사한 데이터 모델을 불러오는 모델관리부;를 포함하고,
상기 이벤트부로부터 받은 단일 이벤트와 동일하거나 유사한 데이터모델을 상기 모델관리부에서 불러와 상호비교를 통해 이후 발생할 이벤트를 예측하고, 이벤트 발생 원인과 연관 이벤트를 판단하는 장애 판단부;를 포함하는 것을 특징으로 하는 언어학적 분석 기법을 이용한 IT 인프라 장애 학습 및 분석 시스템
The method of claim 1,
The language analysis unit,
A data learning unit that tokenizes the sentenced event received from the sentence generating unit, converts it into a vector, and learns;
a model management unit that sets and manages the data learned in the data learning unit as a single model, and calls the same or similar data model among the stored data models when a single event is received;
and a failure determination unit that calls a data model identical or similar to a single event received from the event unit from the model management unit, predicts an event to occur later through mutual comparison, and determines a cause of the event and a related event. IT infrastructure failure learning and analysis system using linguistic analysis technique
제 4항에 있어서,
상기 데이터학습부는 상기 문장 생성부에서 생성한 문장으로 변환한 이벤트를 수신하는 문장수신부; 수신한 이벤트 문장을 단어토큰으로 분리하는 토크나이저부; 상기 토크나이저부에서 단어토큰으로 분리한 이벤트 문장을 벡터데이터로 변환하고, 변환된 벡터데이터를 언어학적 기법을 활용해 각 이벤트를 하나의 단어로 인식함으로써 주위 단어를 통해 중심 단어를 예측하고 중심 단어를 통해 주위 단어를 예측하는 학습단계를 거쳐 하나의 이벤트를 기준으로 발생할 이벤트와 연관된 이벤트를 언어학적 유사도와 키워드를 통해 머신러닝으로 학습하는 벡터변환부;를 포함하고,
상기 모델관리부는 상기 벡터변환부에서 벡터로 변환해 학습한 이벤트 정보를 하나의 데이터 모델로 설정하는 모델 설정부; 설정된 모델 정보를 상기 데이터모델부에 저장하는 모델 저장부; 단일 이벤트 수신 시 수신된 이벤트와 동일한 이벤트가 포함된 데이터모델을 판단 해 불러오는 모델 로드부;를 포함하고,
상기 장애판단부는 상기 이벤트부에서 생성된 단일 이벤트를 수신하는 이벤트 수신부; 상기 모델 로드부를 통해 데이터모델부에 저장된 데이터모델 정보를 상기 이벤트 수신부에서 수신한 이벤트 정보와 비교하여 발생한 장애에 이어서 수집장비에서 발생할 장애를 예측하는 장애 예측 판단부; 상기 모델 로드부를 통해 데이터모델부에 저장된 데이터 모델 정보를 수신된 단일 이벤트 분석 정보와 비교하여 이벤트가 발생한 원인과 이벤트로 인해 다른 수집 장비에서 발생한 연관 이벤트를 판단하는 연관 장애 판단부;를 포함하는 것을 특징으로 하는 언어학적 분석 기법을 이용한 IT 인프라 장애 학습 및 분석 시스템
5. The method of claim 4,
The data learning unit may include: a sentence receiving unit for receiving an event converted into a sentence generated by the sentence generating unit; a tokenizer unit that separates the received event sentence into word tokens; The tokenizer unit converts the event sentences separated into word tokens into vector data, and recognizes each event as a single word using the converted vector data using linguistic techniques to predict the central word through surrounding words and to predict the central word. A vector transform unit that learns an event related to an event to occur based on a single event through a learning step of predicting surrounding words through linguistic similarity and machine learning through keywords;
The model management unit includes: a model setting unit for setting the event information learned by converting the vector conversion unit into a vector as one data model; a model storage unit for storing set model information in the data model unit; When a single event is received, the model load unit determines and calls the data model including the same event as the received event;
The failure determining unit includes an event receiving unit for receiving a single event generated by the event unit; a failure prediction determination unit that compares the data model information stored in the data model unit through the model load unit with the event information received from the event receiving unit and predicts a failure to occur in the collection equipment following the failure; A related failure determination unit that compares the data model information stored in the data model unit through the model load unit with the received single event analysis information to determine the cause of the event and the related event that occurred in other collection equipment due to the event; IT infrastructure failure learning and analysis system using a linguistic analysis technique characterized by
제 1항에 있어서,
상기 에이전트 관리부에서 수집한 이벤트를 언어분석부에서 학습해 데이터모델로 생성하기 위한 방법은,
수집된 장비가 있는지 판단하는 단계와,
수집된 장비의 자원값을 확인하는 단계와,
자원값이 임계치를 초과했는지 확인하는 단계와,
임계치를 초과한 자원에 대해 이벤트를 생성하는 단계와,
기준조건(시, 일, 월, 년 등)에 따라 이벤트 통계를 생성하는 단계와,
통계범위에 포함된 이벤트를 단어로 변환하고, 변환된 단어를 문장으로 묶는 단계와,
생성된 문장을 데이터 학습부로 전달하는 단계와,
수신한 이벤트 문장을 단어토큰으로 분리하는 단계와,
이벤트 단어토큰을 벡터 데이터로 변환하는 단계와,
벡터데이터 분석을 통해 발생할 이벤트와 연관된 이벤트를 언어학적 분석기법에 기반한 머신러닝으로 학습하는 단계와,
학습한 데이터를 하나의 데이터모델로 구축하는 단계와,
결과를 데이터모델부에 저장하는 단계; 를 포함하는 것을 특징으로 하는 언어학적 분석 기법을 이용한 IT 인프라 장애 학습 및 분석 시스템
The method of claim 1,
The method for learning the event collected by the agent management unit in the language analysis unit and generating it as a data model,
determining whether there is collected equipment; and
checking the resource value of the collected equipment;
determining whether the resource value exceeds a threshold;
generating an event for a resource that exceeds a threshold;
generating event statistics according to standard conditions (hour, day, month, year, etc.);
converting events included in the statistical range into words, and tying the converted words into sentences;
transmitting the generated sentence to the data learning unit;
Separating the received event sentence into word tokens;
converting event word tokens into vector data;
Learning events related to events that will occur through vector data analysis by machine learning based on linguistic analysis techniques;
Building the learned data into one data model;
storing the result in the data model unit; IT infrastructure failure learning and analysis system using a linguistic analysis technique, characterized in that it includes
제 1항에 있어서,
상기 에이전트 관리부에서 생성된 이벤트를 언어분석부에서 발생 장애를 예측하고 장애 원인과 연관 장애를 분석하기 위한 방법은,
수집된 장비가 있는지 판단하는 단계와,
수집된 장비의 자원값을 확인하는 단계와,
자원값이 임계치를 초과했는지 판단하는 단계와,
임계치를 초과한 자원에 대해 이벤트를 생성하는 단계와,
생성된 이벤트를 장애판단부로 전달하는 단계와,
모델로드부에서 수신한 이벤트와 동일(유사)한 데이터모델을 불러오는 단계와,
장애예측판단부에서 해당 이벤트 이후 발생할 이벤트를 데이터모델과 비교해 추출하는 단계 및 연관장애판단부에서 데이터모델과 비교를 통해 이벤트 발생 원인과 이와 연관된 다른 장비의 이벤트를 추출하는 단계와,
각 부에서 판단한 결과값을 웹서비스부를 통해 클라이언트에 표현하는 단계; 를 포함하는 것을 특징으로 하는 언어학적 분석 기법을 이용한 IT 인프라 장애 학습 및 분석 시스템
The method of claim 1,
A method for predicting a failure occurring in the language analysis unit for the event generated by the agent management unit and analyzing the cause of the failure and related failure,
determining whether there is collected equipment; and
checking the resource value of the collected equipment;
determining whether the resource value exceeds a threshold;
generating an event for a resource that exceeds a threshold;
A step of passing the generated event to the failure determination unit;
Loading the same (similar) data model as the event received from the model load unit;
The step of extracting the event that will occur after the corresponding event in the failure prediction judging unit by comparing it with the data model, and extracting the cause of the event and other related equipment events by comparing it with the data model in the related failure judging unit;
expressing a result value determined by each unit to a client through a web service unit; IT infrastructure failure learning and analysis system using a linguistic analysis technique, characterized in that it includes
KR1020210106696A 2021-08-12 2021-08-12 IT Infrastructure Fault Learning and Analysis System Using Linguistic Analysis Techniques KR102509374B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020210106696A KR102509374B1 (en) 2021-08-12 2021-08-12 IT Infrastructure Fault Learning and Analysis System Using Linguistic Analysis Techniques

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020210106696A KR102509374B1 (en) 2021-08-12 2021-08-12 IT Infrastructure Fault Learning and Analysis System Using Linguistic Analysis Techniques

Publications (2)

Publication Number Publication Date
KR20210108340A true KR20210108340A (en) 2021-09-02
KR102509374B1 KR102509374B1 (en) 2023-03-15

Family

ID=77794382

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020210106696A KR102509374B1 (en) 2021-08-12 2021-08-12 IT Infrastructure Fault Learning and Analysis System Using Linguistic Analysis Techniques

Country Status (1)

Country Link
KR (1) KR102509374B1 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102509381B1 (en) * 2022-07-28 2023-03-14 (주)와치텍 SMART Log Integration and Trend Prediction Visualization System Based on Machine Learning Log Analysis
KR102509382B1 (en) * 2021-09-14 2023-03-15 (주)와치텍 A big data-based IT infrastructure event control plan using machine learning

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20150049541A (en) * 2013-10-30 2015-05-08 삼성에스디에스 주식회사 system and method for automatically manageing fault events of data center
KR20160007462A (en) * 2015-12-29 2016-01-20 (주)와치텍 Resource information management and data storage system through the management of the resource template
KR20160132698A (en) * 2015-05-11 2016-11-21 삼성에스디에스 주식회사 Apparatus and method of intelligent system diagnosis
KR20180108446A (en) * 2017-03-23 2018-10-04 (주)모아데이타 System and method for management of ict infra
KR20190047809A (en) * 2017-10-30 2019-05-09 주식회사 케이티 Ict equipment management system and method there of
KR20190099710A (en) * 2018-02-19 2019-08-28 주식회사 케이티 System and method for handling network failure
KR20210026554A (en) * 2019-08-30 2021-03-10 주식회사 케이티 Apparatus, method and computer program for determining error of network equipment based on self-learning

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20150049541A (en) * 2013-10-30 2015-05-08 삼성에스디에스 주식회사 system and method for automatically manageing fault events of data center
KR20160132698A (en) * 2015-05-11 2016-11-21 삼성에스디에스 주식회사 Apparatus and method of intelligent system diagnosis
KR20160007462A (en) * 2015-12-29 2016-01-20 (주)와치텍 Resource information management and data storage system through the management of the resource template
KR20180108446A (en) * 2017-03-23 2018-10-04 (주)모아데이타 System and method for management of ict infra
KR20190047809A (en) * 2017-10-30 2019-05-09 주식회사 케이티 Ict equipment management system and method there of
KR20190099710A (en) * 2018-02-19 2019-08-28 주식회사 케이티 System and method for handling network failure
KR20210026554A (en) * 2019-08-30 2021-03-10 주식회사 케이티 Apparatus, method and computer program for determining error of network equipment based on self-learning

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102509382B1 (en) * 2021-09-14 2023-03-15 (주)와치텍 A big data-based IT infrastructure event control plan using machine learning
KR102509381B1 (en) * 2022-07-28 2023-03-14 (주)와치텍 SMART Log Integration and Trend Prediction Visualization System Based on Machine Learning Log Analysis

Also Published As

Publication number Publication date
KR102509374B1 (en) 2023-03-15

Similar Documents

Publication Publication Date Title
KR101854576B1 (en) Cloud management system based on chatbot and operating method thereof
US6542881B1 (en) System and method for revealing necessary and sufficient conditions for database analysis
EP3136249A1 (en) Log analysis device, attack detection device, attack detection method and program
KR102509374B1 (en) IT Infrastructure Fault Learning and Analysis System Using Linguistic Analysis Techniques
CN111475370A (en) Operation and maintenance monitoring method, device and equipment based on data center and storage medium
CN112087334B (en) Alarm root cause analysis method, electronic device and storage medium
CN115174231B (en) Network fraud analysis method and server based on AI Knowledge Base
CN112954031B (en) Equipment state notification method based on cloud mobile phone
CN112738040A (en) Network security threat detection method, system and device based on DNS log
US11886818B2 (en) Method and apparatus for detecting anomalies in mission critical environments
CN113627566A (en) Early warning method and device for phishing and computer equipment
US11003705B2 (en) Natural language processing and classification
CN113704772B (en) Safety protection processing method and system based on user behavior big data mining
CN113098715B (en) Information processing method, device, system, medium and computing equipment
CN113282920B (en) Log abnormality detection method, device, computer equipment and storage medium
CN115034596A (en) Risk conduction prediction method, device, equipment and medium
CN112948822A (en) Big data audit scene analysis method and system applied to intelligent education system
KR20220160476A (en) System and method for inferencing type of crime based on text data
CN113704414A (en) Data processing method, system, storage medium and electronic equipment
CN113343248A (en) Vulnerability identification method, device, equipment and storage medium
Yousef et al. On the use of predictive analytics techniques for network elements failure prediction in telecom operators
US11870933B2 (en) Emergency dispatch command information management system, device, and method capable of providing relevant emergency dispatch command information
CN115809466B (en) Security requirement generation method and device based on STRIDE model, electronic equipment and medium
US10565189B2 (en) Augmentation of a run-time query
US20230370350A1 (en) System and method for outage prediction

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant