KR20200009939A - 장애 경보를 이용하여 장애 도메인을 판단하는 장치 및 방법 - Google Patents

장애 경보를 이용하여 장애 도메인을 판단하는 장치 및 방법 Download PDF

Info

Publication number
KR20200009939A
KR20200009939A KR1020180085037A KR20180085037A KR20200009939A KR 20200009939 A KR20200009939 A KR 20200009939A KR 1020180085037 A KR1020180085037 A KR 1020180085037A KR 20180085037 A KR20180085037 A KR 20180085037A KR 20200009939 A KR20200009939 A KR 20200009939A
Authority
KR
South Korea
Prior art keywords
network
failure
domain
pattern
unit
Prior art date
Application number
KR1020180085037A
Other languages
English (en)
Other versions
KR102216574B1 (ko
Inventor
최아솔
이종필
김보섭
이동준
정경훈
Original Assignee
주식회사 케이티
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 케이티 filed Critical 주식회사 케이티
Priority to KR1020180085037A priority Critical patent/KR102216574B1/ko
Publication of KR20200009939A publication Critical patent/KR20200009939A/ko
Application granted granted Critical
Publication of KR102216574B1 publication Critical patent/KR102216574B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/069Management of faults, events, alarms or notifications using logs of notifications; Post-processing of notifications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/12Discovery or management of network topologies
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/16Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks using machine learning or artificial intelligence

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Software Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Databases & Information Systems (AREA)
  • Medical Informatics (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

본 발명은 각 망 도메인에서 발생된 장애 경보를 수집하여 장애를 일으키는 망 도메인을 도메인을 판단하는 장치 및 방법에 관한 것이다. 본 발명에 따르는 장애 관리 장치는, 각 망 도메인들에서 발생된 장애 경보를 수집하는 수집부; 수집된 장애 경보를 분석하여 장애 패턴을 추출하는 추출부; 및 추출된 장애 패턴의 장애가 발생된 하나의 망 도메인을 판단하는 판단부를 포함한다.

Description

장애 경보를 이용하여 장애 도메인을 판단하는 장치 및 방법{Apparatus and method for deciding failure domain using failure alarm}
본 발명은 망 장애의 기술로서, 각 망 도메인들에서 발생된 장애 경보를 이용하여 장애가 발생된 망 도메인을 판단하는 판단하는 장치 및 방법에 관한 것이다.
망에서 제공되는 서비스가 점점 다양해짐에 따라(예 : IPTV, VoIP) 망 시스템은 한층 더 복잡해졌다. 다양한 서비스 및 트래픽의 증가로 인해 망 시스템 상에서 빈번히 발생하는 장애는 원인과 구간을 특정하여 분류하기 어렵고, 그로 인해 장애 분류의 처리에 시간과 비용이 소요된다.
장애 처리의 시간 및 비용을 절감하기 위해 다양한 장애 처리 방법이 제안되어 왔으나, 망 시스템의 복잡성과 망 장애의 복합적인 발생 원인의 판단은 높은 수준의 기량을 필요로 한다.
종래 망 시스템에서는 IP 망의 가입자 구간에 설치된 장비에서 발생한 장애의 고장 처리 시간을 단축시키기 위해, 가입자 구간에서 발생한 장애를 발췌하여 즉각적으로 장애 복구 조치를 시도하고, 장애 복구되지 않는 장애에 대해 고장 수리 요원의 현장 출동을 요청하였다. 종래 시스템은 'IP 망 장비 검출' - '장비 원격 접속' - '장애 처리(On-Demand 및 고장 수리 요원 출동 요청)' 의 프로세스로 진행된다.
하지만, 종래 망 시스템은 발생 장애의 근본 원인이 IP 도메인 내부에 있지 않고, 전송 도메인 장애의 파생 장애일 경우 적용할 수 없는 문제점이 있었다. ip 망과 전송 망이 논리적으로 독립되어 있고, 각 망의 이론적, 물리적 특성 차이로 인해 서로 다른 운용 체계를 가지기 때문이다. 위와 같은 경우 전송 망의 장애로 인해 ip 망이 영향을 받더라도 ip 망의 운용자는 전송 망의 장애가 원인임을 신속히 알아차리지 못하고 ip 망 내부에서 장애 원인을 찾고자 시간과 노력을 허비한 후에야 전송 망 운용자의 지원을 받아 장애 처리를 함으로서 많은 시간과 비용을 소모하게 된다.
한국등록특허 10-0993944(2010.11.05.)
본 발명은 상기와 같은 종래 문제점을 해결하기 위한 것으로서, IP 망 및 전송 망의 각 도메인들에서 발생된 장애 경보들을 수집하고, 수집된 장애의 근본 원인이 IP 망과 전송 망의 도메인 중 어느 망 도메인에 있는지 판단하는 장치 및 방법을 제공하는 것을 목적으로 한다.
일 측면에 따른, 장애 경보를 수집하여 장애가 발생된 도메인을 판단하는 장치는, 각 망 도메인들에서 발생된 장애 경보를 수집하는 수집부; 수집된 장애 경보를 분석하여 장애 패턴을 추출하는 추출부; 및 추출된 장애 패턴의 장애가 발생된 하나의 망 도메인을 판단하는 판단부를 포함한다.
상기 수집부는, 아이피 망 및 전송 망에서 발생된 장애 경보를 각 망 관리 시스템으로부터 수집한다.
상기 추출부는, 각 망 도메인에서 발생된 장애 경보에 대해, 장비를 노드로 표현하고 장비들 간의 연결을 노드들의 엣지로 표현하여 하나의 통합 도메인의 장애 패턴으로 분석한다.
상기 추출부는, 수집된 각 도메인에서 장애 경보의 패턴 추출을 위한 벡터 정보를 생성하여 전처리하는 전처리부를 포함한다.
상기 전처리부는, tf-idf((Term Frequency - Inverse Document Frequency) 또는 CharRnn(Character Recurrent neural networks)의 알고리즘을 이용하여 상기 벡터 정보를 생성한다.
상기 추출부는, 전처리된 장애 경보의 벡터를 입력받고, 각 망 도메인의 장애 패턴을 생성하여 출력하는 신경망 엔진부를 더 포함한다.
상기 신경망 엔진부는, 아이피 망 도메인, 아이피 망과 전송 망이 연계된 도메인, 전송 망 도메인의 신경망으로 구성되고, 각 도메인의 신경망이 망 장비들의 연결 관계의 토폴로지에 의해 발생되는 장애 발생의 패턴을 상기 장애 패턴으로 출력한다.
상기 추출부는, 아이피 망 도메인, 아이피 망과 전송 망이 연계된 도메인, 전송 망 도메인에서 각각 발생된 장애 패턴을 통합하여 하나의 망 토폴로지의 장애 패턴으로 생성하는 통합부를 포함한다.
상기 판단부는, 통합된 단일 망의 토폴로지에 기반된 장애 패턴을 상기 추출부로부터 입력받고, 입력된 장애 패턴에 대응되어 장애가 발생된 망을 예측하여 출력하는 신경망 엔진을 포함한다.
다른 측면에 따른, 장치가 장애 경보를 수집하여 장애가 발생된 도메인을 판단하는 방법은, 각 망 도메인들에서 발생된 장애 경보를 수집하는 단계; 수집된 장애 경보를 분석하여 장애 패턴을 추출하는 단계; 및 추출된 장애 패턴의 장애가 발생된 하나의 망 도메인을 판단하는 단계를 포함한다.
본 발명의 일 측면에 따르면, 신경망 엔진을 통해 각 망 도메인의 경보들로부터 장애 패턴을 추출하고, 추출된 각 장애 패턴을 통합된 도메인의 망 토폴로지에 사상하여 통합된 장애 패턴을 추출하고, 추출된 통합 장애 패턴을 다시 신경망 엔진을 통해 장애가 발생된 망을 예측하여 출력함으로써, 장애 경보의 발생에 신속히 대응하여 장애가 발생된 망을 판단할 수 있다.
또한, 장애가 발생된 망이 판단됨으로써, 판단된 망에서 장애 위치 판단 및 장애 복구의 처리 등이 신속히 처리될 수 있게 한다.
본 명세서에 첨부되는 다음의 도면들은 본 발명의 바람직한 실시예를 예시하는 것이며, 후술한 발명의 상세한 설명과 함께 본 발명의 기술사상을 더욱 이해시키는 역할을 하는 것이므로, 본 발명은 그러한 도면에 기재된 사항에만 한정되어 해석되지 않아야 한다.
도 1은 본 발명의 일 실시예에 따른 장애 도메인을 판단하는 시스템의 개략적 구성도이다.
도 2a 및 도 2b는 도 1의 장애 도메인 판단 장치가 각 도메인의 망에서 발생된 경보들을 단일 망으로 통합하는 예시도이다.
도 3은 도 1의 전처리부가 장애 경보의 벡터를 생성하여 출력하는 예시도이다.
도 4는 도 1의 전처리부가 장애 경보를 벡터 정보로 전처리하는 예시도이다.
도 5는 도 1의 추출부가 장애 패턴을 추출하는 개략적 구성도이다.
도 6은 도 5의 전송망 신경망 엔진부가 전처리된 경보 벡터를 입력받아 전송망의 장애 패턴을 출력하는 예시도이다.
도 7은 도 1의 판단부가 장애가 발생된 도메인을 판단하여 출력하는 개략적 구성도이다.
도 8은 도 1의 장애 도메인 판단 장치가 장애 도메인을 판단하는 처리의 개략적 흐름도이다.
이하, 첨부된 도면을 참조하여 본 발명의 바람직한 실시예를 상세히 설명하기로 한다. 이에 앞서, 본 명세서 및 청구 범위에 사용된 용어나 단어는 통상적이거나 사전적인 의미로 한정해서 해석되어서는 아니되며, 발명자는 그 자신의 발명을 가장 최선의 방법으로 설명하기 위해 용어의 개념을 적절하게 정의할 수 있다는 원칙에 입각하여 본 발명의 기술적 사상에 부합하는 의미와 개념으로 해석되어야만 한다. 따라서, 본 명세서에 기재된 실시예와 도면에 도시된 구성은 본 발명의 가장 바람직한 일 실시예에 불과할 뿐이고 본 발명의 기술적 사상에 모두 대변하는 것은 아니므로, 본 출원 시점에 있어서 이들을 대체할 수 있는 다양한 균등물과 변형예들이 있을 수 있음을 이해하여야 한다.
도 1은 본 발명의 일 실시예에 따른 장애 도메인을 판단하는 시스템(100)의 개략적 구성도이다.
본 발명의 일 실시예에 따른 시스템(100)은 NMS(110) 및 장애 도메인 판단 장치(130)를 포함하여 구성된다.
상기 NMS(110)는 IP 망, 전송 망 등의 각 망 도메인마다 망의 관리를 수행하는 망 관리 장치(Network Management System)이다. NMS는 각 망 도메인의 장비들로부터 장애 경보를 수집하여 장애 복구를 관리한다.
상기 장애 도메인 판단 장치(130)는 본 발명의 장치로서 수집부(131), 추출부(133) 및 판단부(137)를 포함하여 구성된다. 또한, 상기 추출부(133)는 전처리부(134), 신경망 엔진부(135) 및 통합부(136)를 포함하여 구성된다.
장애 도메인 판단 장치(130)는 각 망 도메인의 NMS(110)들로부터 장애 경보를 수집하고, 수집된 장애 경보의 장애 패턴을 추출하고, 추출된 장애 패턴을 분석하고, 분석 결과로서 어느 망 도메인에서 장애가 발생했는지를 판단하여 출력한다. 출력된 장애 도메인의 판단 결과는 화면을 통해 망 관리자에게 출력되거나 또는 망 장애가 발생된 도메인의 NMS(110)로 응답될 수 있다.
여기서, 장애 도메인 판단 장치(130)가 메모리와 프로세서로 구성된 컴퓨터 단말이라고 가정하면, 각 구성부(131~137)들은 프로그램의 형태로 메모리에 로딩되어 프로세서를 통해 실행될 수 있다. 예를 들면, 각 구성부(131 ~137)들은 장애 도메인의 판단 프로그램으로 제작된 후, 장애 도메인 판단 장치(130)의 프로세서에 의해 실행되어 장애 경보, 장애 벡터, 망 도메인의 통합 토폴로지 및 장애 도메인의 판단 결과 등의 처리 과정의 결과물을 출력할 수 있다.
도 2a 및 도 2b는 도 1의 장애 도메인 판단 장치(130)가 각 도메인의 망에서 발생된 경보들을 단일 망으로 통합하는 예시도이다.
도 2a를 참조하면, IP 망(210) 및 전송 망(220)은 독립된 이기종의 도메인으로서, 서로 다른 종류와 기능을 가진 복수개의 망 장비(노드)와 이들의 연결 관계(링크)로 이루어진다.
IP 망(210)의 경우, 스위치, 라우터 등의 전용의 망 장비들로 이루어진다. IP 망(210)의 장비들에서 발생되는 각각의 장애 경보는 장애 발생 시간, 경보 형태(장애 정보 발생 또는 장애 정보 복구), 장애 발생 장치 ID, IP 주소, 포트, 제조자, 시스템 모델 정보, 운영체제(OS) 정보, 경보 주요 내용, 성능 및 트래픽 정보 등을 포함한다.
또한, 전송 망(220)의 경우, MSPP(Multi Service Provisioning Platform), PTN(Packet Transport Network) 등의 전용의 망 장비들로 구성된다. 전송 망(220)의 장비들에서 발생되는 각각의 장애 경보는 장애 발생 시간, 장애 발생 장치 ID, 발생 경보 내용(알람 메시지, 경보 등급, 관할 국사), 회선 정보 등을 포함한다.
상기 망 장비들은 IP 망(210) 및 전송 망(220) 중에서 어느 하나의 망 도메인에 소속되고, 일부의 IP 망(210)의 망 장비 및 전송 망(220)의 망 장비는 장애 경보로 인해 상호 간에 연결된다. 따라서, 망에서 발생된 장애 경보는 IP 망(210)의 경보, IP-전송 망의 경보 및 전송 망(220)의 장애 경보로 분류될 수 있다. 상기 IP-전송 망의 경보는 근원-파생의 장애 관계를 가지며, 어느 한쪽 망에서 발생된 근원 장애가 다른 망의 파생 장애를 일으키는 경보에 해당된다.
도 2b를 참조하면, 장애 도메인 판단 장치(130)는 각각의 IP 망(210) 및 전송 망(220)에서 발생된 장애 경보를 수집하고, 수집된 장애 경보를 분석하여 IP-전송 망의 경보의 연결 관계에 따라 통합된 망 도메인의 장애 경보로 모델링한다. 통합된 도메인의 단일 망에서는 장애 경보가 한 번에 비교 및 분석될 수 있다. 즉, 장애 도메인 판단 장치(130)는 장애의 근원 도메인을 먼저 파악한 후, 장애 처리에 들어갈 수 있으므로 장애 처리에 소요되는 시간과 비용을 줄일 수 있다. 이를 위해, 장애 도메인 판단 장치(130)는 IP 망(210) 및 전송 망(220)에서 발생된 각각의 경보들을 전처리한 후, 딥 러닝을 수행하는 신경망을 통해 통합된 도메인 망의 장애 경보의 패턴 정보로 분석한다.
도 3은 도 1의 전처리부(134)가 장애 경보의 벡터를 생성하여 출력하는 예시도이다.
장애 도메인 판단 장치(130)의 수집부(131)는 IP 망(210)의 NMS(110) 및 전송 망(220)의 NMS(110)로부터 해당 도메인의 장애 경보를 수집한다. 망에서 장애 경보가 최초로 발생된 이후로, 장애 도메인의 판단을 위해 소정 시간 동안 발생되는 장애 경보들이 수집될 수 있다.
또한, 장애 도메인 판단 장치(130)의 전처리부(131)는 수집부(131)에 수집된 장애 경보들을 전처리(pre-processing)하여 장애가 발생된 장비들의 연결 관계가 정의된 벡터 정보를 생성한다. 상기 생성에 의해, 전처리부(131)는 IP 망(210)의 경보 벡터, IP-전송 망의 경보 벡터 및 전송 망(220)의 경보 벡터를 각각 출력한다. 출력된 경보 벡터는 경보의 텍스트 정보를 장애 패턴의 추출을 위해 장비들의 연결 관계에 기반된 장애 정보로 전처리된 정보이다.
도 4는 도 1의 전처리부(131)가 장애 경보를 벡터 정보로 전처리하는 예시도이다.
벡터 정보를 생성하여 출력하는 전처리의 알고리즘은 tf-idf, CharRNN 등이 있다. 참고로, 도 4에서는 tf-idf의 처리 결과물이 도시된다. 참고로, CharRNN은 가변 길이 문자열(경보)의 순서를 보고, 그 순서가 어떤 범주에 해당하는지 분류하는 알고리즘으로 학습 과정에서 고정된 길이의 벡터로 경보를 표현할 수 있다.
상기 tf-idf를 이용한 전처리는 참조 처리(401), 그루핑(grouping) 처리(402), 단어 카운팅 처리(403) 및 벡터 생성 처리(404)를 포함한다. 참조 처리(401)에서, 전처리부(131)는 각 도메인 망에서 발생된 장애 경보(401)를 참조한다. 그루핑 처리(402)에서, 전처리부(131)는 참조된 경보들을 동일 장비에서 발생된 경보(402)로 그루핑(grouping)한다. 단어 카운팅 처리(403)에서, 전처리부(131)는 그루핑 처리된 경보로부터 장애 관련의 키워드를 추출하여 출현 횟수를 카운팅한다. 마지막으로 벡터 생성 처리(404)에서, 전처리부(131)는 장비들의 연결 관계를 수학적으로 표현하고, 단어의 카운팅 횟수의 가중치를 계산하여 그 연결 관계 및 가중치가 정의된 벡터 정보를 생성한다. 생성된 각 도메인별 벡터 정보는 통합된 도메인의 단일 망의 정보로 임베딩 처리되기 위해 신경망 엔진부(135)에 입력된다.
도 5는 도 1의 추출부(133)가 장애 패턴을 추출하는 개략적 구성도이다.
상기 신경망 엔진부(135)는 IP 망 신경망 엔진부(535), IP-전송 망 신경망 엔진부(536) 및 전송 망 신경망 엔진부(537)를 포함한다.
추출부(133)의 전처리부(134)에서 출력된 IP 망(210)의 경보 벡터, IP-전송 망의 경보 벡터 및 전송 망(220)의 경보 벡터는 각각 대응되는 IP 망 신경망 엔진부(535), IP-전송 망 신경망 엔진부(536) 및 전송 망 신경망 엔진부(537)로 입력된다.
입력된 각 도메인의 벡터 정보는 각각의 신경망 엔진부(535~537)의 딥 러닝을 기반으로 네트워크 임베딩 처리되어 해당 도메인의 패턴 정보로 생성된다. 여기서, 각각의 신경망 엔진부(535~537)는 FC(Fully Connected) 레이어로 이루어진 비선형 임베딩 처리를 통해 네트워크 상태의 특징(feature)을 추출한다(Feature Transformation). 비선형 임베딩에서 경보는 텍스트 정보이기 때문에 공간적인 정보(Spatial Information)를 포함하지 않는다. 따라서, 이 경우 주로 쓰이는 FC 레이어로 특징을 추출한다. FC 레이어는 레이어내의 모든 노드가 다음 레이어의 모든노드와 전부 연결된(fully-connected) 레이어로서, 입력값을 웨이트(weight)와 바이어스(bias)로 조정 후 액티베이션 함수(activation function)를 취한다. 액티베이션 함수의 입력 값에 비선형의 특성을 부여하는 함수로서, ReLU, Sigmoid 등등이 존재한다.
여기서, 각각의 신경망 엔진부(535)의 패턴 예측에 의해, 장애 벡터의 입력 값이 입력된 후 장애가 발생된 망의 장애 패턴 정보가 출력 값으로 출력된다. 각 망 도메인에서 장애 경보가 발생된 망 장비들 사이의 연결 관계 및 장애 정보는 각 장애를 식별하는 고유한 패턴을 형성한다. 본 발명은 이 장애의 패턴을 미리 학습한 후 나중에 실제 발생된 장애의 패턴을 기반으로 그 장애를 예측한다.
상기 출력 값의 각 도메인 망의 패턴 정보는 통합부(136)로 입력되고, 통합부(136)는 입력된 각 도메인 망의 장애 패턴을 통합하여 단일 망 토폴로지의 장애 패턴으로 생성하여 출력한다.
도 6은 도 5의 전송망 신경망 엔진부(537)가 전처리된 경보 벡터를 입력받아 전송망의 장애 패턴을 출력하는 예시도이다.
전처리부(134)는 각 망 장비에서 발생된 장애 경보로 전처리하여 장애 벡터를 출력한다. 예를 들어, 전처리부(134)가 출력하는 장애 벡터 "(a, b)"의 경우, 전송 망(220)에서 장애 경보가 발생된 a, b의 2개 망 장비의 연결 정보 및 이들 장비의 장애 경보에 관련된 벡터 값이 정의된다. 출력된 장애 벡터는 전송망 신경망 엔진부(537)로 입력되어 전송 망(220)의 장애 패턴 정보로 추출된다.
그리고 추출된 전송 망(220)의 장애 패턴은 통합부(136)로 입력되어 각 도메인들이 통합된 단일 망 토폴로지의 패턴 정보로 통합된다. 통합부(136)는 각 도메인의 차원으로 추출된 장애 특징을 통합된 단일 공간 상에 사상하는 처리를 수행한다. 통합부(136)는 장애가 발생된 망 도메인을 판단하기 위해 통합된 단일 망의 패턴 정보를 판단부(137)로 출력한다.
도 7은 도 1의 판단부(136)가 장애가 발생된 도메인을 판단하여 출력하는 개략적 구성도이다.
판단부(137)의 신경망 엔진은 통합부(136)에서 출력된 장애 패턴을 입력받고, IP 망, IP-전송 망 및 전송 망 중에서 장애가 발생된 망을 예측하여 출력한다. 물론, 입력 값의 장애 패턴과 출력 값의 장애 망 정보를 출력하기 위해, 판단부(137)는 과거 동안에 발생된 입력 값의 장애 패턴과 출력 값의 망 정보를 학습 정보로 입력받아 예측 모델을 완성시킨다.
도 8은 도 1의 장애 도메인 판단 장치(130)가 장애 도메인을 판단하는 처리의 개략적 흐름도이다.
장애 도메인 판단 장치(130)의 수집부는 각 망 도메인의 NMS(110)를 통해 각 망에서 발생된 장애 경보를 수집한다(S801).
장애 도메인 판단 장치(131)의 추출부(133)에서 장애 경보가 수집되면, 전처리부(134)는 수집된 장애 경보를 참조하고(S811), 참조된 장애 경보를 전처리하여 장애 경보의 벡터 정보를 생성하여 출력한다(S812). 생성된 벡터 정보는 장애가 발생된 망 장비들의 연결 정보 및 장애 정보를 포함한다. 생성된 벡터 정보가 출력되면, 각각의 신경망 엔진부(535 ~537)는 벡터 정보로부터 각 도메인 망에서의 장애 패턴을 추출하여 결과 값으로 생성한다(S813). 각 망 도메인의 장애 패턴의 결과 값이 생성되면, 통합부(136)는 각 망 도메인의 장애 패턴을 통합된 단일 망에 사상하여 통합 망의 토폴로지를 기반으로 하는 통합 도메인의 장애 패턴을 생성하여 출력한다(S814 및 S815).
통합 도메인의 장애 패턴이 출력되면, 장애 도메인 판단 장치(131)의 판단부(137)는 추출부(133)에서 출력된 통합 도메인의 장애 패턴을 입력받고, 기 학습된 신경망 엔진의 예측 처리에 따라 장애가 발생된 어느 하나의 도메인을 판단하여 출력한다(S821 및 S822). 장애가 발생된 도메인이 출력됨으로써, 망의 근원 장애 확인 및 복구 절차는 더욱 신속하고 정확해질 수 있다.
본 발명은 비록 한정된 실시예와 도면에 의해 설명되었으나, 본 발명은 이것에 의해 한정되지 않으며 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에 의해 본 발명의 기술사상과 아래에 기재될 특허청구범위의 균등범위 내에서 다양한 수정 및 변형이 가능함은 물론이다.
100 : 시스템 110 : NMS
130 : 장애 도메인 판단 장치 131 : 수집부
133 : 추출부 134 : 전처리부
135 : 신경망 엔진부 136 : 통합부
137 : 판단부

Claims (18)

  1. 장애 경보를 수집하여 장애가 발생된 도메인을 판단하는 장치에 있어서,
    각 망 도메인들에서 발생된 장애 경보를 수집하는 수집부;
    수집된 장애 경보를 분석하여 장애 패턴을 추출하는 추출부; 및
    추출된 장애 패턴의 장애가 발생된 하나의 망 도메인을 판단하는 판단부
    를 포함하는 장치.
  2. 제 1항에 있어서,
    상기 수집부는,
    아이피 망 및 전송 망에서 발생된 장애 경보를 각 망 관리 시스템으로부터 수집하는 것을 특징으로 하는 장치.
  3. 제 1항에 있어서,
    상기 추출부는,
    각 망 도메인에서 발생된 장애 경보에 대해, 장비를 노드로 표현하고 장비들 간의 연결을 노드들의 엣지로 표현하여 하나의 통합 도메인의 장애 패턴으로 분석하는 것을 특징으로 하는 장치.
  4. 제 1항에 있어서,
    상기 추출부는,
    수집된 각 도메인에서 장애 경보의 패턴 추출을 위한 벡터 정보를 생성하여 전처리하는 전처리부를 포함하는 것을 특징으로 하는 장치.
  5. 제 4항에 있어서,
    상기 전처리부는,
    tf-idf((Term Frequency - Inverse Document Frequency) 또는 CharRnn(Character Recurrent neural networks)의 알고리즘을 이용하여 상기 벡터 정보를 생성하는 것을 특징으로 하는 장치.
  6. 제 4항에 있어서,
    상기 추출부는,
    전처리된 장애 경보의 벡터를 입력받고, 각 망 도메인의 장애 패턴을 생성하여 출력하는 신경망 엔진부를 더 포함하는 것을 특징으로 하는 장치.
  7. 제 6항에 있어서,
    상기 신경망 엔진부는,
    아이피 망 도메인, 아이피 망과 전송 망이 연계된 도메인, 전송 망 도메인의 신경망으로 구성되고, 각 도메인의 신경망이 망 장비들의 연결 관계의 토폴로지에 의해 발생되는 장애 발생의 패턴을 상기 장애 패턴으로 출력하는 것을 특징으로 하는 장치.
  8. 제 1항에 있어서,
    상기 추출부는,
    아이피 망 도메인, 아이피 망과 전송 망이 연계된 도메인, 전송 망 도메인에서 각각 발생된 장애 패턴을 통합하여 하나의 망 토폴로지의 장애 패턴으로 생성하는 통합부를 포함하는 것을 특징으로 하는 장치.
  9. 제 1항에 있어서,
    상기 판단부는,
    통합된 단일 망의 토폴로지에 기반된 장애 패턴을 상기 추출부로부터 입력받고, 입력된 장애 패턴에 대응되어 장애가 발생된 망을 예측하여 출력하는 신경망 엔진을 포함하는 것을 특징으로 하는 장치.
  10. 장치가 장애 경보를 수집하여 장애가 발생된 도메인을 판단하는 방법에 있어서,
    각 망 도메인들에서 발생된 장애 경보를 수집하는 단계;
    수집된 장애 경보를 분석하여 장애 패턴을 추출하는 단계; 및
    추출된 장애 패턴의 장애가 발생된 하나의 망 도메인을 판단하는 단계
    를 포함하는 방법.
  11. 제 10항에 있어서,
    상기 수집하는 단계는,
    아이피 망 및 전송 망에서 발생된 장애 경보를 각 망 관리 시스템으로부터 수집하는 것을 특징으로 하는 방법.
  12. 제 10항에 있어서,
    상기 추출하는 단계는,
    각 망 도메인에서 발생된 장애 경보에 대해, 장비를 노드로 표현하고 장비들 간의 연결을 노드들의 엣지로 표현하여 하나의 통합 도메인의 장애 패턴으로 분석하는 것을 특징으로 하는 방법.
  13. 제 10항에 있어서,
    상기 추출하는 단계는,
    수집된 각 도메인에서 장애 경보의 패턴 추출을 위한 벡터 정보를 생성하여 전처리하는 단계를 포함하는 것을 특징으로 하는 방법.
  14. 제 13항에 있어서,
    상기 전처리하는 단계는,
    tf-idf((Term Frequency - Inverse Document Frequency) 또는 CharRnn(Character Recurrent neural networks)의 알고리즘을 이용하여 상기 벡터 정보를 생성하는 것을 특징으로 하는 방법.
  15. 제 13항에 있어서,
    상기 추출하는 단계는,
    전처리된 장애 경보의 벡터를 입력받고, 각 망 도메인의 장애 패턴을 생성하여 출력하는 신경망 엔진 처리 단계를 더 포함하는 것을 특징으로 하는 방법.
  16. 제 15항에 있어서,
    상기 신경망 엔진 처리 단계는,
    아이피 망 도메인, 아이피 망과 전송 망이 연계된 도메인, 전송 망 도메인의 신경망으로 구성되고, 각 도메인의 신경망이 망 장비들의 연결 관계의 토폴로지에 의해 발생되는 장애 발생의 패턴을 상기 장애 패턴으로 출력하는 것을 특징으로 하는 방법.
  17. 제 10항에 있어서,
    상기 추출하는 단계는,
    아이피 망 도메인, 아이피 망과 전송 망이 연계된 도메인, 전송 망 도메인에서 각각 발생된 장애 패턴을 통합하여 하나의 망 토폴로지의 장애 패턴으로 생성하는 통합 단계를 포함하는 것을 특징으로 하는 방법.
  18. 제 10항에 있어서,
    상기 판단하는 단계는,
    상기 추출하는 단계에서 통합된 단일 망의 토폴로지에 기반된 장애 패턴을 입력받고, 입력된 장애 패턴에 대응되어 장애가 발생된 망을 신경망을 이용하여 예측하여 출력하는 단계인 것을 특징으로 하는 방법.
KR1020180085037A 2018-07-20 2018-07-20 장애 경보를 이용하여 장애 도메인을 판단하는 장치 및 방법 KR102216574B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020180085037A KR102216574B1 (ko) 2018-07-20 2018-07-20 장애 경보를 이용하여 장애 도메인을 판단하는 장치 및 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020180085037A KR102216574B1 (ko) 2018-07-20 2018-07-20 장애 경보를 이용하여 장애 도메인을 판단하는 장치 및 방법

Publications (2)

Publication Number Publication Date
KR20200009939A true KR20200009939A (ko) 2020-01-30
KR102216574B1 KR102216574B1 (ko) 2021-02-16

Family

ID=69321985

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020180085037A KR102216574B1 (ko) 2018-07-20 2018-07-20 장애 경보를 이용하여 장애 도메인을 판단하는 장치 및 방법

Country Status (1)

Country Link
KR (1) KR102216574B1 (ko)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20220039033A (ko) * 2020-09-21 2022-03-29 주식회사 엘지유플러스 통신 네트워크 장비의 장애 관리 시스템 및 방법
KR20230024747A (ko) * 2021-08-12 2023-02-21 주식회사 케이티 이기종 네트워크 장비들을 위한 장애 경보 분류 장치 및 방법
KR20230128942A (ko) * 2022-02-28 2023-09-05 주식회사 케이티 무선망을 관제하는 서버, 방법 및 컴퓨터 프로그램

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000244510A (ja) * 1999-02-18 2000-09-08 Toshiba Corp ネットワーク管理方法およびネットワーク管理装置
JP2005252765A (ja) * 2004-03-05 2005-09-15 Mitsubishi Electric Corp ネットワーク故障判定装置及びネットワーク保守システム及びネットワーク故障判定方法及びプログラム
KR20100028360A (ko) * 2008-09-04 2010-03-12 한국전자통신연구원 홈네트워크 오류 예측 시스템 및 그 방법
KR100993944B1 (ko) 2003-06-27 2010-11-11 주식회사 케이티 네트워크 상에서의 장애 처리 시스템 및 그 방법

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000244510A (ja) * 1999-02-18 2000-09-08 Toshiba Corp ネットワーク管理方法およびネットワーク管理装置
KR100993944B1 (ko) 2003-06-27 2010-11-11 주식회사 케이티 네트워크 상에서의 장애 처리 시스템 및 그 방법
JP2005252765A (ja) * 2004-03-05 2005-09-15 Mitsubishi Electric Corp ネットワーク故障判定装置及びネットワーク保守システム及びネットワーク故障判定方法及びプログラム
KR20100028360A (ko) * 2008-09-04 2010-03-12 한국전자통신연구원 홈네트워크 오류 예측 시스템 및 그 방법

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20220039033A (ko) * 2020-09-21 2022-03-29 주식회사 엘지유플러스 통신 네트워크 장비의 장애 관리 시스템 및 방법
KR20230024747A (ko) * 2021-08-12 2023-02-21 주식회사 케이티 이기종 네트워크 장비들을 위한 장애 경보 분류 장치 및 방법
KR20230128942A (ko) * 2022-02-28 2023-09-05 주식회사 케이티 무선망을 관제하는 서버, 방법 및 컴퓨터 프로그램

Also Published As

Publication number Publication date
KR102216574B1 (ko) 2021-02-16

Similar Documents

Publication Publication Date Title
US10476749B2 (en) Graph-based fusing of heterogeneous alerts
CN107683597B (zh) 用于异常检测的网络行为数据收集和分析
EP3528463A1 (en) An artificial intelligence cyber security analyst
US6353902B1 (en) Network fault prediction and proactive maintenance system
US6604208B1 (en) Incremental alarm correlation method and apparatus
US20200021511A1 (en) Performance analysis for transport networks using frequent log sequence discovery
CN113225359A (zh) 一种基于类脑计算的安全流量分析系统
US8245079B2 (en) Correlation of network alarm messages based on alarm time
KR20200009939A (ko) 장애 경보를 이용하여 장애 도메인을 판단하는 장치 및 방법
US20170288979A1 (en) Blue print graphs for fusing of heterogeneous alerts
CN105187411A (zh) 一种分布式异常检测网络数据流的方法
CN112769605B (zh) 一种异构多云的运维管理方法及混合云平台
CN105847029A (zh) 一种基于大数据分析的信息安全事件自动关联及快速响应的方法及系统
Kalegele et al. Four decades of data mining in network and systems management
Wang et al. Spatio-temporal patterns in network events
Brahmi et al. Towards a multiagent-based distributed intrusion detection system using data mining approaches
KR102367861B1 (ko) 자가학습에 기초하여 네트워크 장비에 대한 장애를 판단하는 장치, 방법 및 컴퓨터 프로그램
CN112671767B (zh) 一种基于告警数据分析的安全事件预警方法及装置
US11972334B2 (en) Method and apparatus for generating a combined isolation forest model for detecting anomalies in data
CN115277102A (zh) 网络攻击检测方法、装置、电子设备及存储介质
CN112448919B (zh) 网络异常检测方法、装置和系统、计算机可读存储介质
KR101741108B1 (ko) 시스템 결함 분석 장치, 방법 및 시스템 결함을 분석하기 위한 프로그램을 저장하는 저장매체
KR102182977B1 (ko) 분석적 규칙 기반의 인공지능형 망 장애 관제 장치 및 방법
Nam et al. Virtual machine failure prediction using log analysis
He et al. A distributed network alarm correlation analysis mechanism for heterogeneous networks

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
X091 Application refused [patent]
AMND Amendment
X701 Decision to grant (after re-examination)
GRNT Written decision to grant