KR102509374B1 - 언어학적 분석 기법을 이용한 it 인프라 장애 학습 및 분석 시스템 - Google Patents

언어학적 분석 기법을 이용한 it 인프라 장애 학습 및 분석 시스템 Download PDF

Info

Publication number
KR102509374B1
KR102509374B1 KR1020210106696A KR20210106696A KR102509374B1 KR 102509374 B1 KR102509374 B1 KR 102509374B1 KR 1020210106696 A KR1020210106696 A KR 1020210106696A KR 20210106696 A KR20210106696 A KR 20210106696A KR 102509374 B1 KR102509374 B1 KR 102509374B1
Authority
KR
South Korea
Prior art keywords
unit
event
data
learning
model
Prior art date
Application number
KR1020210106696A
Other languages
English (en)
Other versions
KR20210108340A (ko
Inventor
박권재
Original Assignee
(주)와치텍
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by (주)와치텍 filed Critical (주)와치텍
Priority to KR1020210106696A priority Critical patent/KR102509374B1/ko
Publication of KR20210108340A publication Critical patent/KR20210108340A/ko
Application granted granted Critical
Publication of KR102509374B1 publication Critical patent/KR102509374B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3466Performance evaluation by tracing or monitoring
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/22Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
    • G06F11/2263Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3452Performance evaluation by statistical analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/54Interprogram communication
    • G06F9/541Interprogram communication via adapters, e.g. between incompatible applications
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/54Interprogram communication
    • G06F9/542Event management; Broadcasting; Multicasting; Notifications
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services

Abstract

언어학적 분석기법을 통해 장애 이벤트를 머신러닝을 통해 학습하고, 이를 통해 이벤트 발생원인과 발생 가능한 이벤트를 예측하고, 다른 장비의 이벤트에 영향을 줄 수 있는 내역을 한 눈에 파악할 수 있도록 언어학적 분석 기법을 이용한 IT 인프라 장애 학습 및 분석 시스템이 개시된다. 본 발명의 바람직한 실시 예에 따른 언어학적 분석 기법을 이용한 IT 인프라 장애 학습 및 분석시스템은 설정된 데이터를 기반으로 자원을 수집하고, 이벤트를 판단하고, 기존조건에 따라 통계로 정리된 이벤트를 문장으로 변환하는 에이전트 관리부와, 상기 에이전트 관리부에서 설정된 문장을 데이터로 변환해 학습하고, 학습된 데이터를 모델로 설정해 관리하고, 단일 이벤트에 대해 장애 예측과 연관 장애 및 장애 원인을 판단하는 언어분석부와, 상기 언어분석부로부터 필요한 정보를 가져와 클라이언트에 표시하는 웹서비스부를 포함할 수 있다.

Description

언어학적 분석 기법을 이용한 IT 인프라 장애 학습 및 분석 시스템{IT Infrastructure Fault Learning and Analysis System Using Linguistic Analysis Techniques}
본 발명은 언어학적 분석기법을 이용해 IT 인프라에서 발생하는 이벤트를 학습하고 학습된 내용을 바탕으로 발생하는 이벤트를 분석하는 시스템에 관한 것으로, 보다 상세하게는 이벤트를 단어 및 문장으로 변환하고 그 결과를 언어학적 기법으로 학습해 데이터모델을 생성하고, 이후 이벤트 발생 시 학습한 데이터모델을 통해 장애원인과 연관장비에서 발생할 수 있는 장애 그리고 발생가능한 장애를 예측하기 위한 언어학적 분석기법을 이용한 IT 인프라 장애 학습 및 분석 시스템에 관한 것이다.
급격한 IT환경의 변화와 다양화로 관리대상의 범위가 시스템, 서버, 네트워크 등으로 늘어나고 있다. 이기종 장비들이 통합시스템으로 구성됨에 따라 장애이벤트 발생 시 발생원인은 물론 향후 발생할 다양한 장애에 대한 대비가 필요한 상황이다.
종래의 예측시스템은 장애 이력을 바탕으로 유사한 상황에서 해당 장애가 발생할 수 있음을 예측하는데 초점이 맞춰져 있다. 그러나 현재의 복잡하고 다양해진 인프라 구성요소들 간 관계에서 이벤트를 예측하고 요소들 간 연관관계를 파악하기에는 활용성 및 대응력이 부족하다.
이에 따라 장애 이벤트를 분석하는 기법과 이를 바탕으로 한 장애 발생 예측 및 근원지 분석이 가능한 새로운 기술이 필요한 실정이다.
본 발명이 이루고자 하는 기술적인 과제는 발생한 이벤트를 단어와 문장으로 변환해 데이터 학습을 진행하고, 학습된 모델을 통해 장애 이벤트 발생 시 이후 발생할 이벤트를 예측하고 대처할 수 있도록 하는 시스템을 제공하는 것이다.
또한, 학습된 데이터를 통해 장애 이벤트 발생 시, 이벤트가 발생한 근원을 분석하고 이와 연관된 다른 장비의 이벤트들을 분석할 수 있는 시스템을 제공하는 것이다.
상기 기술적 과제를 달성하기 위하여, 본 발명의 일 실시 예에 따른 언어학적 분석 기법을 이용한 IT 인프라 장애 학습 및 분석 시스템은 설정된 데이터를 기반으로 자원을 수집하고, 이벤트를 판단하고, 기준조건에 따라 통계로 정리된 이벤트를 문장으로 변환하는 에이전트 관리부와; 상기 에이전트 관리부에서 설정된 문장을 데이터로 변환해 학습하고, 학습된 데이터를 모델로 설정해 관리하고, 단일 이벤트에 대해 장애 예측과 연관장애 및 장애원인을 판단하는 언어분석부와; 상기 언어분석부에서 설정한 이벤트 모델의 데이터 정보를 저장하는 데이터모델부와; 상기 언어분석부로부터 필요한 정보를 가져와 클라이언트에 표시하는 웹서비스부;를 포함할 수 있다.
또한, 상기 기술적 과제를 달성하기 위하여 본 발명의 다른 실시 예에 따른 언어학적 분석 기법을 이용한 IT 인프라 장애 학습 및 분석 시스템에 있어 상기 에이전트 관리부는 수집대상의 관리타입정보, 자원타입정보, 자원정보를 수집 및 저장하는 자원정보부;를 포함하고, 상기 자원정보부에서 수집한 정보 중 임계치 기준을 초과한 데이터를 기반으로 이벤트 정보를 생성하고 저장하는 이벤트부;를 포함하고, 상기 이벤트부에서 생성된 이벤트를 하나의 단어로 변환하고 변환된 이벤트들을 문장으로 생성하는 문장생성부;를 포함할 수 있다.
또한, 상기 기술적 과제를 달성하기 위한 본 발명의 또 다른 실시 예에 따른 언어학적 분석 기법을 이용한 IT 인프라 장애 학습 및 분석 시스템에 있어 상기 자원정보부는 수집대상 장비종류를 파악하는 관리타입부와; 수집하려는 성능정보 종류를 파악하는 자원타입부와; 성능정보에 해당하는 자원을 파악하는 자원부와; 수집된 자원을 저장하는 수집 자원부;를 포함하고, 상기 이벤트부는 상기 수집 자원부에 저장된 성능 정보가 임계치를 초과했는지를 확인하는 임계치 확인부와; 설정된 임계치를 초과한 정보에 대해 이벤트를 생성하고 생성된 단일 이벤트 정보를 언어분석부로 전달하는 이벤트 생성부;를 포함하고, 상기 문장생성부는 상기 이벤트 생성부에서 생성된 이벤트를 기준조건(시간, 일, 월, 년 등의 기준) 단위로 통계를 생성해 통계범위에 포함되는 이벤트를 분류하는 이벤트 통계부와; 상기 이벤트 통계부에서 생성된 이벤트 통계 정보를 바탕으로 하나의 이벤트를 이벤트 종류에 따라 하나의 임의 단어로 변환하고 변환된 단어를 묶어 문장으로 구성하고 문장으로 변환한 이벤트를 언어분석부로 전달하는 이벤트 변환부;를 포함할 수 있다.
또한, 상기 기술적 과제를 달성하기 위하여 본 발명의 또 다른 실시 예에 따른 언어학적 분석 기법을 이용한 IT 인프라 장애 학습 및 분석 시스템에 있어 상기 언어분석부는 상기 문장 생성부로부터 받은 문장화된 이벤트를 토크나이저하고, 벡터로 변환해 학습하는 데이터학습부;를 포함하고, 상기 데이터학습부에서 학습된 데이터를 하나의 모델로 설정해 관리하고, 단일 이벤트 수신 시 저장된 데이터 모델 중 동일하거나 유사한 데이터 모델을 불러오는 모델관리부;를 포함하고, 상기 이벤트부로부터 받은 단일 이벤트와 동일하거나 유사한 데이터모델을 상기 모델관리부에서 불러와 상호비교를 통해 이후 발생할 이벤트를 예측하고, 이벤트 발생 원인과 연관 이벤트를 판단하는 장애 판단부;를 포함할 수 있다.
또한, 상기 기술적 과제를 달성하기 위하여 본 발명의 또 다른 실시 예에 따른 언어학적 분석 기법을 이용한 IT 인프라 장애 학습 및 분석 시스템에 있어 상기 데이터학습부는 상기 문장 생성부에서 생성한 문장으로 변환한 이벤트를 수신하는 문장수신부와; 수신한 이벤트 문장을 단어토큰으로 분리하는 토크나이저부; 상기 토크나이저부에서 단어토큰으로 분리한 이벤트 문장을 벡터데이터로 변환하고, 변환된 벡터데이터를 언어학적 기법을 활용해 각 이벤트를 하나의 단어로 인식함으로써 주위 단어를 통해 중심 단어를 예측하고 중심 단어를 통해 주위 단어를 예측하는 학습단계를 거쳐 발생할 이벤트와 연관된 이벤트를 언어학적 유사도와 키워드를 통해 머신러닝하는 벡터변환부;를 포함하고, 상기 모델관리부는 상기 벡터변환부에서 벡터로 변환해 학습한 이벤트 정보를 하나의 데이터 모델로 설정하는 모델 설정부와; 설정된 모델 정보를 상기 데이터모델부에 저장하는 모델저장부와; 단일 이벤트 수신 시 수신된 이벤트와 동일한 이벤트가 포함된 데이터모델을 판단해 불러오는 모델로드부;를 포함하고, 상기 장애판단부는 상기 이벤트부에서 생성된 단일 이벤트를 수신하는 이벤트 수신부; 상기 모델 로드부를 통해 데이터모델부에 저장된 데이터모델 정보를 상기 이벤트 수신부에서 수신한 이벤트 정보와 비교하여 발생한 장애에 이어서 수집장비에서 발생할 장애를 예측하는 장애 예측 판단부와; 상기 모델 로드부를 통해 데이터모델부에 저장된 데이터 모델 정보를 수신된 단일 이벤트 분석 정보와 비교하여 이벤트가 발생한 원인과 이벤트로 인해 다른 수집 장비에서 발생한 연관 이벤트를 판단하는 연관 장애 판단부;를 포함할 수 있다.
또한, 상기 기술적 과제를 달성하기 위한 본 발명의 또 다른 실시 예에 따른 언어학적 분석 기법을 이용한 IT 인프라 장애 학습 및 분석 시스템에 있어 상기 에이전트 관리부에서 수집한 이벤트를 언어분석부에서 학습해 데이터모델로 생성하기 위한 방법은 수집된 장비가 있는지 판단하는 단계와; 수집된 장비의 자원값을 확인하는 단계와; 자원값이 임계치를 초과했는지 확인하는 단계와; 임계치를 초과한 자원에 대해 이벤트를 생성하는 단계와; 기준조건(시, 일, 월 년 등)에 따라 이벤트 통계를 생성하는 단계와; 통계범위에 포함된 이벤트를 단어로 변환하고, 변환된 단어를 문장으로 묶는 단계와; 생성된 문장을 데이터 학습부로 전달하는 단계와; 수신한 이벤트 문장을 단어토큰으로 분리하는 단계와; 이벤트 단어토큰을 벡터데이터로 변환하는 단계와; 벡터데이터 분석을 통해 발생할 이벤트와 연관된 이벤트를 언어학적 분석기법에 기반한 머신러닝으로 학습하는 단계와; 학습한 데이터를 하나의 데이터모델로 구축하는 단계와; 결과를 데이터모델부에 저장하는 단계;를 포함할 수 있다.
또한, 상기 기술적 과제를 달성하기 위한 본 발명의 또 다른 실시 예에 따른 언어학적 분석 기법을 이용한 IT 인프라 장애 학습 및 분석 시스템에 있어 상기 에이전트 관리부에서 생성된 이벤트를 언어분석부에서 발생 장애를 예측하고 장애 원인과 연관 장애를 분석하기 위한 방법은 수집된 장비가 있는지 판단하는 단계와; 수집된 장비의 자원값을 확인하는 단계와; 자원값이 임계치를 초과했는지 판단하는 단계와; 임계치를 초과한 자원에 대해 이벤트를 생성하는 단계와; 생성된 이벤트를 장애판단부로 전달하는 단계와; 모델부에서 수신한 이벤트와 동일하거나 유사한 데이터 모델을 불러오는 단계와; 장애예측판단부에서 해당 이벤트 이후 발생할 이벤트를 데이터모델과 비교해 추출하는 단계 및 연관장애 판단부에서 데이터모델과 비교를 통해 이벤트 발생 원인과 이와 연관된 다른 장비의 이벤트를 추출하는 단계와; 각 부에서 판단한 결과값을 웹서비스부를 통해 클라이언트에 표현하는 단계;를 포함할 수 있다.
본 발명에 따른 언어학적 분석 기법을 이용한 IT 인프라 장애 학습 및 분석 시스템은 장애 이벤트를 하나의 단어로 관리하여 머신러닝을 활용한 언어학적 유사도 분석과 키워드 도출을 통해 해당 이벤트로 인해 발생할 이벤트 예측 및 그에 대한 사전 조치를 수행할 수 있는 장점이 있다.
또한, 장애 이벤트에 대한 분석내용을 통해 이벤트가 발생한 근원과 이로 인해 발생하는 다른 장비의 이벤트를 파악하고, 분석 및 대비할 수 있는 장점이 있다.
도 1은 본 발명의 바람직한 실시 예에 따른 언어학적 분석기법을 이용한 IT 인프라 장애 분석 시스템을 나타내는 블록도
도 2는 도 1의 언어분석부의 주요 모듈의 구성을 나타내는 블록도
도 3은 도 1의 에이전트 관리부의 주요 모듈의 구성을 나타내는 블록도
도 4는 발생한 이벤트를 학습해 데이터모델로 생성하기 위한 흐름도
도 5는 발생한 이벤트를 통해 장애를 예측하고 연관 장애를 판단하기 위한 흐름도
도 6은 이벤트를 학습하고 장애를 분석하는 과정의 적용 예시를 나타내는 흐름도
본 발명의 이점 및 특징, 그리고 그것들을 달성하는 방법은 첨부되는 도면과 함께 상세하게 후술되어 있는 실시 예들을 참조하면 명확해질 것이다. 그러나 본 발명은 이하에서 게시되는 실시 예들에 한정되는 것이 아니라 서로 다른 다양한 형태로 구현될 수 있으며, 단지 본 실시 예들은 본 발명의 개시가 완전하도록 하고, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 발명의 범주를 완전하게 알려주기 위해 제공되는 것이며, 본 발명은 청구항의 범주에 의해 정의될 뿐이다. 명세서 전체에 걸쳐 동일 참조 부호는 동일 구성요소를 지칭한다.
이하에서는 본 발명의 바람직한 실시 예들에 따른 언어학적 분석기법을 이용한 IT인프라 장애 학습 및 분석 시스템을 상세히 설명하기로 한다. 참고로 본 발명을 설명함에 있어서 관련된 공지 기능 혹은 구성에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우 그 상세한 설명을 생략한다.
본 명세서에서 이벤트란 관제대상 장비의 자원값 중 지정된 임계치를 초과한 이슈에 관한 것으로, 임계치를 초과한 내역을 장애로 정의한다.
도 1은 본 발명의 바람직한 실시 예에 따른 언어학적 분석기법을 이용한 IT 인프라 장애 학습 및 분석 시스템을 나타내는 블록도이고, 도 2는 언어분석부의 주요 모듈의 구성을 나타내는 블록도이고, 도 3은 에이전트 관리부의 주요 모듈을 나타내는 블록도이다.
도 4는 발생한 이벤트를 학습해 데이터 모델로 생성하기 위한 흐름도이고, 도 5는 발생한 이벤트를 통해 장애를 예측하고 연관 장애 판단하기 위한 흐름도이고, 도 6은 이벤트를 학습하고 장애를 분석하는 과정의 적용 예시를 나타내는 흐름도.
도 1에서 도시된 바와 같이, 본 발명의 일 실시 예에 따른 언어학적 분석기법을 이용한 IT 인프라 장애 학습 및 분석 시스템은 설정된 데이터를 기반으로 자원을 수집하고, 이벤트를 판단하고, 기준조건에 따라 통계로 정리된 이벤트를 문장으로 변환하는 에이전트 관리부(10); 상기 에이전트 관리부에서 설정된 문장을 데이터 변환해 학습하고, 학습된 데이터를 모델로 설정해 관리하고, 단일 이벤트에 대해 장애 예측과 연관 장애 및 장애원인을 판단하는 언어분석부(20); 상기 언어분석부에서 설정한 이벤트 모델의 데이터 정보를 저장하는 데이터모델부(30); 상기 언어분석부로부터 필요한 정보를 가져와 클라이언트(50)에 표시하는 웹서비스부(40);를 포함할 수 있다.
상기 에이전트관리부(10)는 수집대상의 관리타입정보, 자원타입정보, 자원정보를 수집 및 저장하는 자원정보부(100); 상기 자원정보부에서 수집한 정보 중 임계치 기준을 초과한 데이터를 기반으로 이벤트 정보를 생성하고 저장하는 이벤트부(110); 및 상기 이벤트부에서 생성된 이벤트를 하나의 단어로 변환하고 변환된 이벤트들을 문장으로 생성하는 문장생성부(120);를 포함할 수 있다.
상기 언어분석부(20)는 상기 문장생성부로부터 받은 문장화된 이벤트를 토크나이저하고, 벡터로 변환해 학습하는 데이터학습부(200); 상기 데이터학습부에서 학습된 데이터를 하나의 모델로 설정해 관리하고, 단일 이벤트 수신 시 저장된 데이터 모델 중 동일하거나 유사한 데이터 모델을 불러오는 모델관리부(210); 및 상기 이벤트로부터 받은 단일 이벤트와 동일하거나 유사한 데이터 모델을 상기 모델관리부에서 불러와 상호비교를 통해 이후 발생할 이벤트를 예측하고, 이벤트 발생 원인과 연관 이벤트를 판단하는 장애 판단부(220);를 포함할 수 있다.
도 2에서 도시된 바와 같이, 상기 자원정보부(100)는 수집대상 장비의 장비종류를 파악하는 관리타입부(101); 수집하려는 성능정보 종류를 파악하는 자원타입부(102); 성능정보에 해당하는 자원을 파악하는 자원부(103); 및 수집된 자원을 저장하는 수집 자원부(104);를 포함할 수 있다.
상기 이벤트부(110)는 상기 수집자원부(104)에 저장된 성능 정보가 임계치를 초과했는지 확인하는 임계치 확인부(111); 설정된 임계치를 초과한 정보에 대해 이벤트를 생성하고 생성된 단일 이벤트 정보를 언어분석부로 전달하는 이벤트 생성부(112);를 포함할 수 있다.
상기 문장생성부(120)는 상기 이벤트 생성부(112)에서 생성된 이벤트를 기준조건(시간, 일, 월, 년 등) 단위로 통계를 생성해 통계범위에 포함되는 이벤트를 분류하는 이벤트 통계부(121); 상기 이벤트 통계부(121)에서 생성된 이벤트 통계 정보를 바탕으로 하나의 이벤트를 이벤트 종류에 따라 하나의 임의 단어로 변환하고 변환된 단어를 묶어 문장으로 구성하고 문장으로 변환한 이벤트를 언어분석부로 전달하는 이벤트 변환부(122);를 포함할 수 있다.
도 3에서 도시된 바와 같이, 상기 데이터학습부(200)는 상기 문장생성부(120)에서 생성한 문장으로 변환한 이벤트를 수신하는 문장수신부(201); 수신한 이벤트 문장을 단어토큰으로 분리하는 토크나이저부(202); 상기 토크나이저부(202)에서 단어토큰으로 분리한 이벤트 문장을 벡터데이터로 변환하고, 변환된 벡터데이터를 언어학적 기법을 활용해 각 이벤트를 하나의 단어로 인식함으로써 주위 단어를 통해 중심 단어를 예측하고 중심 단어를 통해 주위 단어를 예측하는 학습단계를 거쳐 발생할 이벤트와 연관된 이벤트를 언어학적 유사도와 키워드를 통해 머신러닝으로 학습하는 벡터변환부(203);를 포함할 수 있다.
상기 모델관리부(210)는 상기 벡터변환부(203)에서 벡터로 변환해 학습한 이벤트 정보를 하나의 데이터 모델로 설정하는 모델설정부(211); 설정된 모델 정보를 상기 데이터모델부(30)에 저장하는 모델저장부(212); 및 단일 이벤트 수신 시 수신된 이벤트와 동일한 이벤트가 포함된 데이터모델을 판단 해 불러오는 모델 로드부(213);를 포함할 수 있다.
상기 장애판단부(220)는 상기 이벤트부(110)에서 생성된 단일 이벤트를 수신하는 이벤트 수신부(221); 상기 모델 로드부(213)를 통해 데이터모델부(30)에 저장된 데이터 모델 정보를 상기 이벤트 수신부(221)에서 수신한 이벤트 정보와 비교하여 발생한 장애에 이어서 수집장비에서 발생할 장애를 예측하는 장애 예측 판단부(223); 상기 모델 로드부를 통해 데이터모델부(30)에 저장된 데이터 모델 정보를 수신된 단일 이벤트 분석 정보와 비교하여 이벤트가 발생한 원인과 이벤트로 인해 다른 수집 장비에서 발생한 연관 이벤트를 판단하는 연관 장애 판단부(222);를 포함할 수 있다.
도 4는 본 발명의 바람직한 실시 예에 언어학적 분석 기법을 이용한 IT 인프라 장애 학습 및 분석 시스템에서 발생한 이벤트를 학습해 데이터 모델로 생성하기 위한 흐름도이다.
도 4에서 도시된 바와 같이, 상기 에이전트 관리부(10)에서 수집한 이벤트를 언어분석부(20)에서 학습해 데이터모델로 생성하기 위한 방법은 수집된 장비가 있는지 판단하는 단계(S100); 수집된 장비의 자원값을 확인하는 단계(S101); 자원값이 임계치를 초과했는지 확인하는 단계(S102); 임계치를 초과한 자원에 대해 이벤트를 생성하는 단계(S103); 기준조건(시간, 일, 월, 년 등)에 따라 이벤트 통계를 생성하는 단계(S104); 통계범위에 포함된 이벤트를 단어로 변환하고, 변환된 단어를 문장으로 묶는 단계(S105); 생성된 문장을 데이터 학습부로 전달하는 단계(S106); 수신한 이벤트 문장을 단어토큰으로 분리하는 단계(S107); 이벤트 단어토큰을 벡터 데이터로 변환하는 단계(S108); 벡터데이터 분석을 통해 발생할 이벤트와 연관된 이벤트를 언어학적 분석기법에 기반한 머신러닝으로 학습하는 단계(S109); 학습한 데이터를 하나의 데이터모델로 구축하는 단계(S110); 결과를 데이터모델부에 저장하는 단계(S111)를 포함할 수 있다.
도 5는 본 발명의 바람직한 실시 예에 따른 언어학적 분석 기법을 이용한 IT 인프라 장애 학습 및 분석 시스템에서 발생한 이벤트를 통해 장애를 예측하고 연관 장애를 판단하기 위한 흐름도이다.
도 5에서 도시된 바와 같이, 상기 에이전트 관리부(10)에서 생성된 이벤트를 언어분석부(20)에서 발생 장애를 예측하고 장애 원인과 연관 장애를 분석하기 위한 방법은 수집된 장비가 있는지 판단하는 단계(S200); 수집된 장비의 자원값을 확인하는 단계(S201); 자원값이 임계치를 초과했는지 판단하는 단계(S202); 임계치를 초과한 자원에 대해 이벤트를 생성하는 단계(S203); 생성된 이벤트를 장애판단부로 전달하는 단계(S204); 모델로드부에서 수신한 이벤트와 동일하거나 유사한 데이터모델을 불러오는 단계(S205); 장애예측판단부에서 해당 이벤트 이후 발생할 이벤트를 데이터모델과 비교해 추출하는 단계 및 연관 장애 판단부에서 데이터모델과 비교를 통해 이벤트 발생 원인과 이와 연관된 다른 장비의 이벤트를 추출하는 단계(S206, S207); 각 부에서 판단한 결과값을 웹서비스부를 통해 클라이언트에 표현하는 단계(S208)를 포함할 수 있다.
도 6은 본 발명의 바람직한 실시 예에 따른 언어학적 분석 기법을 이용한 IT 인프라 장애 학습 및 분석 시스템에서 이벤트를 학습하고 장애를 분석하는 과정의 적용 예시를 나타내는 흐름도이다.
도 6에서 도시된 바와 같이, 발생한 이벤트를 학습하고 장애를 분석하는 방법의 예는 상기 임계치 확인부(111)에서 임계치를 초과한 자원값에 대해 이벤트 생성부(112)에서 이벤트를 생성하고, 생성된 이벤트를 기준조건에 따라 이벤트 통계부(121)에서 통계를 내는 단계(S300); 통계에 포함된 이벤트를 이벤트 변환부(122)에서 단어로 변환하는 단계(S301); 상기 이벤트 변환부(122)에서 변환한 단어를 문장화시키는 단계(S302); 상기 문장 수신부(201)에서 수신한 문장을 토크나이저부(202)에서 단어토큰화하는 단계(S303); 상기 벡터변환부(203)에서 단어토큰을 벡터데이터로 변환하고, 변환된 데이터 구성을 하나의 데이터 모델로 학습하는 단계(S304); 상기 이벤트부(110)에서 생성된 단일 이벤트를 이벤트 수신부(221)에서 수신해 정보를 분석하는 단계(S305); 상기 데이터모델부(30)에서 해당 이벤트 정보와 동일한 이벤트가 포함된 데이터 모델을 불러오고 연관장애판단부(222)와 장애예측판단부(223)를 통해 발생할 이벤트를 예측하고, 이벤트 원인과 연관 장비의 이벤트를 파악하는 단계(S306);을 포함할 수 있다.
이상 첨부된 도면을 참조하여 본 발명의 실시 예를 설명하였지만, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자는 본 발명이 그 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 실시될 수 있다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시 예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 한다. 본 발명의 범위는 상기 상세한 설명보다는 후술하는 특허청구범위에 의하여 나타내어지며, 특허청구범위의 의미 및 범위 그리고 그 균등개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석하여야 한다.
10 : 에이전트관리부 20 : 언어분석부
30 : 데이터 모델부 40 : 웹서비스부
50 : 클라이언트 100 : 자원정보부
101 : 관리타입부 102 : 자원타입부
103 : 자원부 104 : 수집 자원부
110 : 이벤트부 111 : 임계치 확인부
112 : 이벤트 생성부 120 : 문장생성부
121 : 이벤트 통계부 122 : 이벤트 변환부
200 : 데이터 학습부 201 : 문장 수신부
202 : 토크나이저부 203 : 벡터변환부
210 : 모델 관리부 211 : 모델 설정부
212 : 모델 저장부 213 : 모델 로드부
220 : 장애 판단부 221 : 이벤트 수신부
222 : 연관 장애 판단부 223 : 장애 예측 판단부

Claims (7)

  1. 설정된 데이터를 기반으로 자원을 수집하고, 이벤트를 판단하고, 기준조건에 따라 통계로 정리된 이벤트를 문장으로 변환하는 에이전트 관리부;
    상기 에이전트 관리부에서 설정된 문장을 데이터로 변환해 학습하고, 학습된 데이터를 모델로 설정해 관리하고, 단일 이벤트에 대해 장애 예측과 연관 장애 및 장애원인을 판단하는 언어분석부;
    상기 언어분석부에서 설정한 이벤트 모델의 데이터 정보를 저장하는 데이터모델부;
    상기 언어분석부로부터 필요한 정보를 가져와 클라이언트에 표시하는 웹서비스부;를 포함하고,
    수집대상의 관리타입정보, 자원타입정보, 자원정보를 수집 및 저장하는 자원정보부;
    상기 자원정보부에서 수집한 정보 중 임계치 기준을 초과한 데이터를 기반으로 이벤트 정보를 생성하고 저장하는 이벤트부;
    상기 이벤트부에서 생성된 이벤트를 하나의 단어로 변환하고 변환된 이벤트들을 문장으로 생성하는 문장생성부;를 포함하는 것을 특징으로 하는 언어학적 분석 기법을 이용한 IT 인프라 장애 학습 및 분석 시스템
  2. 삭제
  3. 제 1항에 있어서,
    상기 자원정보부는 수집대상 장비의 장비종류를 파악하는 관리타입부; 수집하려는 성능정보 종류를 파악하는 자원타입부; 성능정보에 해당하는 자원을 파악하는 자원부; 수집된 자원을 저장하는 수집 자원부;를 포함하고,
    상기 이벤트부는 상기 수집 자원부에 저장된 성능 정보가 임계치를 초과했는지를 확인하는 임계치 확인부; 설정된 임계치를 초과한 정보에 대해 이벤트를 생성하고 생성된 단일 이벤트 정보를 언어분석부로 전달하는 이벤트 생성부;를 포함하고,
    상기 문장생성부는 상기 이벤트 생성부에서 생성된 이벤트를 기준조건(시간, 일, 월, 년 등의 기준) 단위로 통계를 생성해 통계범위에 포함되는 이벤트를 분류하는 이벤트 통계부;
    상기 이벤트 통계부에서 생성된 이벤트 통계 정보를 바탕으로 하나의 이벤트를 이벤트 종류에 따라 하나의 임의 단어로 변환하고 변환된 단어를 묶어 문장으로 구성하고 문장으로 변환한 이벤트를 언어분석부로 전달하는 이벤트 변환부; 를 포함하는 것을 특징으로 하는 언어학적 분석 기법을 이용한 IT 인프라 장애 학습 및 분석 시스템
  4. 제 1항에 있어서,
    상기 언어분석부는,
    상기 문장생성부로부터 받은 문장화된 이벤트를 토크나이저하고, 벡터로 변환해 학습하는 데이터학습부;를 포함하고,
    상기 데이터학습부에서 학습된 데이터를 하나의 모델로 설정해 관리하고, 단일 이벤트 수신 시 저장된 데이터 모델 중 동일하거나 유사한 데이터 모델을 불러오는 모델관리부;를 포함하고,
    상기 이벤트부로부터 받은 단일 이벤트와 동일하거나 유사한 데이터모델을 상기 모델관리부에서 불러와 상호비교를 통해 이후 발생할 이벤트를 예측하고, 이벤트 발생 원인과 연관 이벤트를 판단하는 장애 판단부;를 포함하는 것을 특징으로 하는 언어학적 분석 기법을 이용한 IT 인프라 장애 학습 및 분석 시스템
  5. 제 4항에 있어서,
    상기 데이터학습부는 상기 문장 생성부에서 생성한 문장으로 변환한 이벤트를 수신하는 문장수신부; 수신한 이벤트 문장을 단어토큰으로 분리하는 토크나이저부; 상기 토크나이저부에서 단어토큰으로 분리한 이벤트 문장을 벡터데이터로 변환하고, 변환된 벡터데이터를 언어학적 기법을 활용해 각 이벤트를 하나의 단어로 인식함으로써 주위 단어를 통해 중심 단어를 예측하고 중심 단어를 통해 주위 단어를 예측하는 학습단계를 거쳐 하나의 이벤트를 기준으로 발생할 이벤트와 연관된 이벤트를 언어학적 유사도와 키워드를 통해 머신러닝으로 학습하는 벡터변환부;를 포함하고,
    상기 모델관리부는 상기 벡터변환부에서 벡터로 변환해 학습한 이벤트 정보를 하나의 데이터 모델로 설정하는 모델 설정부; 설정된 모델 정보를 상기 데이터모델부에 저장하는 모델 저장부; 단일 이벤트 수신 시 수신된 이벤트와 동일한 이벤트가 포함된 데이터모델을 판단 해 불러오는 모델 로드부;를 포함하고,
    상기 장애판단부는 상기 이벤트부에서 생성된 단일 이벤트를 수신하는 이벤트 수신부; 상기 모델 로드부를 통해 데이터모델부에 저장된 데이터모델 정보를 상기 이벤트 수신부에서 수신한 이벤트 정보와 비교하여 발생한 장애에 이어서 수집장비에서 발생할 장애를 예측하는 장애 예측 판단부; 상기 모델 로드부를 통해 데이터모델부에 저장된 데이터 모델 정보를 수신된 단일 이벤트 분석 정보와 비교하여 이벤트가 발생한 원인과 이벤트로 인해 다른 수집 장비에서 발생한 연관 이벤트를 판단하는 연관 장애 판단부;를 포함하는 것을 특징으로 하는 언어학적 분석 기법을 이용한 IT 인프라 장애 학습 및 분석 시스템
  6. 제 1항에 있어서,
    상기 에이전트 관리부에서 수집한 이벤트를 언어분석부에서 학습해 데이터모델로 생성하기 위한 방법은,
    수집된 장비가 있는지 판단하는 단계와,
    수집된 장비의 자원값을 확인하는 단계와,
    자원값이 임계치를 초과했는지 확인하는 단계와,
    임계치를 초과한 자원에 대해 이벤트를 생성하는 단계와,
    기준조건(시, 일, 월, 년 등)에 따라 이벤트 통계를 생성하는 단계와,
    통계범위에 포함된 이벤트를 단어로 변환하고, 변환된 단어를 문장으로 묶는 단계와,
    생성된 문장을 데이터 학습부로 전달하는 단계와,
    수신한 이벤트 문장을 단어토큰으로 분리하는 단계와,
    이벤트 단어토큰을 벡터 데이터로 변환하는 단계와,
    벡터데이터 분석을 통해 발생할 이벤트와 연관된 이벤트를 언어학적 분석기법에 기반한 머신러닝으로 학습하는 단계와,
    학습한 데이터를 하나의 데이터모델로 구축하는 단계와,
    결과를 데이터모델부에 저장하는 단계; 를 포함하는 것을 특징으로 하는 언어학적 분석 기법을 이용한 IT 인프라 장애 학습 및 분석 시스템
  7. 제 1항에 있어서,
    상기 에이전트 관리부에서 생성된 이벤트를 언어분석부에서 발생 장애를 예측하고 장애 원인과 연관 장애를 분석하기 위한 방법은,
    수집된 장비가 있는지 판단하는 단계와,
    수집된 장비의 자원값을 확인하는 단계와,
    자원값이 임계치를 초과했는지 판단하는 단계와,
    임계치를 초과한 자원에 대해 이벤트를 생성하는 단계와,
    생성된 이벤트를 장애판단부로 전달하는 단계와,
    모델로드부에서 수신한 이벤트와 동일(유사)한 데이터모델을 불러오는 단계와,
    장애예측판단부에서 해당 이벤트 이후 발생할 이벤트를 데이터모델과 비교해 추출하는 단계 및 연관장애판단부에서 데이터모델과 비교를 통해 이벤트 발생 원인과 이와 연관된 다른 장비의 이벤트를 추출하는 단계와,
    각 부에서 판단한 결과값을 웹서비스부를 통해 클라이언트에 표현하는 단계; 를 포함하는 것을 특징으로 하는 언어학적 분석 기법을 이용한 IT 인프라 장애 학습 및 분석 시스템
KR1020210106696A 2021-08-12 2021-08-12 언어학적 분석 기법을 이용한 it 인프라 장애 학습 및 분석 시스템 KR102509374B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020210106696A KR102509374B1 (ko) 2021-08-12 2021-08-12 언어학적 분석 기법을 이용한 it 인프라 장애 학습 및 분석 시스템

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020210106696A KR102509374B1 (ko) 2021-08-12 2021-08-12 언어학적 분석 기법을 이용한 it 인프라 장애 학습 및 분석 시스템

Publications (2)

Publication Number Publication Date
KR20210108340A KR20210108340A (ko) 2021-09-02
KR102509374B1 true KR102509374B1 (ko) 2023-03-15

Family

ID=77794382

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020210106696A KR102509374B1 (ko) 2021-08-12 2021-08-12 언어학적 분석 기법을 이용한 it 인프라 장애 학습 및 분석 시스템

Country Status (1)

Country Link
KR (1) KR102509374B1 (ko)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102509382B1 (ko) * 2021-09-14 2023-03-15 (주)와치텍 머신러닝을 이용한 빅데이터 기반의 it인프라 이벤트 제어 방안
KR102509381B1 (ko) * 2022-07-28 2023-03-14 (주)와치텍 머신러닝 로그 분석 기반의 smart 로그병합 및 추이예측 시각화 시스템

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101545215B1 (ko) * 2013-10-30 2015-08-18 삼성에스디에스 주식회사 데이터 센터 장애 이벤트 관리 자동화 시스템 및 방법
KR20160132698A (ko) * 2015-05-11 2016-11-21 삼성에스디에스 주식회사 지능형 시스템 진단 장치 및 방법
KR101725192B1 (ko) * 2015-12-29 2017-04-28 (주)와치텍 자원 템플릿 관리를 통한 자원 정보 관리 및 데이터 저장 시스템
KR102118670B1 (ko) * 2017-03-23 2020-06-04 (주)모아데이타 Ict 인프라 관리 시스템 및 이를 이용한 ict 인프라 관리 방법
KR102418594B1 (ko) * 2017-10-30 2022-07-08 주식회사 케이티 Ict 장비 관리 시스템 및 방법
KR102149930B1 (ko) * 2018-02-19 2020-08-31 주식회사 케이티 네트워크 장애 처리 시스템 및 방법
KR102367861B1 (ko) * 2019-08-30 2022-02-25 주식회사 케이티 자가학습에 기초하여 네트워크 장비에 대한 장애를 판단하는 장치, 방법 및 컴퓨터 프로그램

Also Published As

Publication number Publication date
KR20210108340A (ko) 2021-09-02

Similar Documents

Publication Publication Date Title
KR101984730B1 (ko) 서버 장애 자동 예측 시스템 및 자동 예측 방법
Rahnamay-Naeini et al. Cascading failures in interdependent infrastructures: An interdependent Markov-chain approach
KR102509374B1 (ko) 언어학적 분석 기법을 이용한 it 인프라 장애 학습 및 분석 시스템
KR101854576B1 (ko) 챗봇 기반 클라우드 관리 시스템 및 그의 운영 방법
JP2018170006A (ja) 電力グリッドにおけるサイバー脅威を検出する汎用フレームワーク
CN105637519A (zh) 使用行为辨识系统的认知信息安全性
CN107426022A (zh) 安全事件监测方法及装置、电子设备、存储介质
US11586981B2 (en) Failure analysis device, failure analysis method, and failure analysis program
CN112954031B (zh) 一种基于云手机的设备状态通知方法
CN112087334A (zh) 告警根因分析方法、电子设备和存储介质
Hong et al. Towards accurate and efficient classification of power system contingencies and cyber-attacks using recurrent neural networks
CN113704772B (zh) 基于用户行为大数据挖掘的安全防护处理方法及系统
KR101444250B1 (ko) 개인정보 접근감시 시스템 및 그 방법
Lorenzen et al. Determining viability of deep learning on cybersecurity log analytics
CN107480051B (zh) 一种核电厂数字化反应堆保护系统软件测试系统及方法
CN110855489B (zh) 故障处理方法、装置和故障处理装置
KR101770066B1 (ko) 분산시스템에서 애플리케이션 호출 로그를 이용한 비즈니스 트랜잭션의 실시간 추적 및 분석 방법, 그리고 그 시스템
CN112948822A (zh) 一种应用于智慧教育系统的大数据审计场景分析方法和系统
JP2012256193A (ja) システムの管理装置、システムの管理方法及びシステムの管理プログラム
CN116389062A (zh) 基于流量安全分析的工业控制系统行为监测方法及设备
KR20220160476A (ko) 텍스트 데이터 기반 범죄사건 유형 추론 시스템 및 그 방법
KR102559398B1 (ko) 인공지능을 이용한 보안관제 침입탐지 알람 처리 장치 및 방법
Pump et al. State of the art in artificial immune-based intrusion detection systems for smart grids
Mohamed et al. Telecommunication fraud prediction using backpropagation neural network
Wrench et al. A rule induction approach to forecasting critical alarms in a telecommunication network

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant