KR102291615B1 - Apparatus for predicting failure of communication network and method thereof - Google Patents

Apparatus for predicting failure of communication network and method thereof Download PDF

Info

Publication number
KR102291615B1
KR102291615B1 KR1020170066221A KR20170066221A KR102291615B1 KR 102291615 B1 KR102291615 B1 KR 102291615B1 KR 1020170066221 A KR1020170066221 A KR 1020170066221A KR 20170066221 A KR20170066221 A KR 20170066221A KR 102291615 B1 KR102291615 B1 KR 102291615B1
Authority
KR
South Korea
Prior art keywords
failure
traffic pattern
predicting
communication network
prediction
Prior art date
Application number
KR1020170066221A
Other languages
Korean (ko)
Other versions
KR20180130295A (en
Inventor
김형수
백성복
안태진
이종필
Original Assignee
주식회사 케이티
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 케이티 filed Critical 주식회사 케이티
Priority to KR1020170066221A priority Critical patent/KR102291615B1/en
Publication of KR20180130295A publication Critical patent/KR20180130295A/en
Application granted granted Critical
Publication of KR102291615B1 publication Critical patent/KR102291615B1/en

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/147Network analysis or design for predicting network behaviour
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/0464Convolutional networks [CNN, ConvNet]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery
    • H04L41/0663Performing the actions predefined by failover planning, e.g. switching to standby network elements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/069Management of faults, events, alarms or notifications using logs of notifications; Post-processing of notifications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/16Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks using machine learning or artificial intelligence
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/04Processing captured monitoring data, e.g. for logfile generation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/16Threshold monitoring

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Databases & Information Systems (AREA)
  • Medical Informatics (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

신경망을 기반으로 통신망의 장애를 예측하는 장치 및 방법이 개시된다. 일 측면에 따른 통신망 장애 예측 장치는, 통신망의 제어 데이터를 수집하는 수집 모듈; 수집된 제어 데이터에서 제어 메시지들을 분류하고, 각 제어 메시지의 트래픽 패턴을 소정의 시간 단위로 정규화한 제 1 정규화 데이터를 생성하는 제 1 정규화 모듈; 제 1 정규화 데이터를 기초로 신경망을 통해 각 제어 메시지의 다음 주기의 트래픽 패턴을 예측하는 트래픽 패턴 예측 모듈; 예측된 다음 주기의 트래픽 패턴을 구성하는 각 항목의 값을 임계 값과 비교하여 정규화한 제 2 정규화 데이터를 생성하는 제 2 정규화 모듈; 및 제 2 정규화 데이터를 기초로 신경망을 통해 상기 통신망의 장애 발생 가능성을 예측하는 장애 발생 예측 모듈을 포함한다.Disclosed are an apparatus and method for predicting a failure of a communication network based on a neural network. A communication network failure prediction apparatus according to an aspect includes: a collection module for collecting control data of a communication network; a first normalization module for classifying control messages from the collected control data and generating first normalized data obtained by normalizing a traffic pattern of each control message by a predetermined time unit; a traffic pattern prediction module for predicting a traffic pattern of a next period of each control message through a neural network based on the first normalized data; a second normalization module for generating second normalized data normalized by comparing the value of each item constituting the predicted next cycle traffic pattern with a threshold value; and a failure occurrence prediction module for predicting the probability of occurrence of a failure in the communication network through a neural network based on the second normalized data.

Description

통신망의 장애를 예측하는 장치 및 방법{Apparatus for predicting failure of communication network and method thereof}Apparatus for predicting failure of communication network and method thereof

본 발명은 통신망 장애의 예측 기술로서, 보다 구체적으로, 통신망 데이터를 수집하고, 수집된 통신망 데이터에 대해 신경망을 이용하여, 앞으로 발생될 통신망의 장애를 예측하는 장치 및 방법에 관한 것이다.The present invention relates to a communication network failure prediction technology, and more particularly, to an apparatus and method for collecting communication network data and predicting a future communication network failure by using a neural network for the collected communication network data.

딥 러닝(Deep Learning)은 인공 지능 기술의 한 종류로서 사람의 신경망을 수학적으로 모델링하여 신경망과 유사한 방법으로 문제를 해결하는 기술이다.Deep Learning is a type of artificial intelligence technology that mathematically models a human neural network to solve a problem in a similar way to a neural network.

4차 산업 혁명의 등장으로 인공 지능에 대한 관심과 연구가 활발히 진행되고 있다. 특히, 컴퓨팅 파워의 놀라운 발전과 딥 러닝 기술의 출현으로 인공 지능 기술의 정확도가 획기적으로 개선됨에 따라 다양한 분야에서 인공 지능 기술을 활용하고자 하는 연구가 활발하게 진행되고 있다.With the advent of the 4th industrial revolution, interest in and research on artificial intelligence is actively progressing. In particular, as the accuracy of artificial intelligence technology is dramatically improved due to the remarkable development of computing power and the advent of deep learning technology, research to utilize artificial intelligence technology in various fields is being actively conducted.

스마트 폰으로 대표되는 모바일 혁명은 그 저변에 광대역 모바일 통신망이 안정적으로 구축 운용되고 있어야 가능하다. 모바일 통신망에서 장애가 발생하면 우리 생활에 커다란 불편을 초래한다. 현재 LTE 망으로 대표되는 모바일 통신망은 다양하고 많은 장비들이 구축 운용되고 있고, 한 장비에서 장애가 발생하면 곧바로 다른 장비로 파급되어 전체 서비스에 커다란 영향을 미친다. 통신망 사업자는 망에서 장애가 발생하지 않도록 첨단 운용 관리 시스템의 구축에 많은 투자와 노력을 기울이고 있다. 그러나 LTE 망은 수많은 장비들에서 배출하는 제어 데이터와 망 장비 데이터들이 하루에도 수 TB(Tera Byte)에 이를 정도로 방대하기 때문에 아무리 높은 기량을 갖고 있는 운용자라도 이 많은 양의 데이터들을 실시간으로 분석하여 장애를 예측하는 것은 거의 불가능하다. The mobile revolution represented by smart phones is possible only when a broadband mobile communication network is stably built and operated at the base. When a failure occurs in a mobile communication network, it causes great inconvenience in our lives. Currently, a variety of mobile communication networks, represented by LTE networks, are constructed and operated with a variety of devices, and when a failure occurs in one device, it immediately spreads to other devices, greatly affecting the overall service. Communication network operators are putting a lot of investment and effort into building a state-of-the-art operation management system to prevent network failures. However, in the LTE network, control data and network equipment data emitted by numerous devices are vast enough to reach several TB (Tera Bytes) per day, so even an operator with high skills can analyze this large amount of data in real time and It is almost impossible to predict.

현재의 기술은 장비들에서 장애를 감지하여 실시간 통보 및 유지 보수하는데 주로 적용되어 있다. 통신망의 장애를 예측하는데 적용된 기술은 수집된 데이터들을 가공하여 시간에 따른 추이를 분석하고 그래프로 보여줌으로써 운용자가 눈으로 보고 장애를 예측하는 수준이기 때문에 예측의 정확도가 많이 떨어지는 단점이 있다. 숙련된 운용자라면 현재 적용된 통신망 장애의 예측 기술의 도움을 받아서 일부 요인에 의한 장애를 예측하는 것은 가능할 수도 있지만, 여러 요인들이 복합적으로 연관된 장애를 예측하는 것은 매우 어려운 일이다.Current technology is mainly applied to detecting failures in equipment and providing real-time notification and maintenance. The technology applied to predict the failure of the communication network has a disadvantage in that the accuracy of prediction is very low because the collected data is analyzed over time, the trend is analyzed and displayed in a graph, so that the operator can predict the failure by looking at the eyes. It may be possible for an experienced operator to predict a failure caused by some factors with the help of the currently applied network failure prediction technology, but it is very difficult to predict a failure that is complexly related to several factors.

한국등록특허 10-0439674(2004.07.12)Korean Patent Registration 10-0439674 (2004.07.12)

본 발명은 상기와 같은 종래 기술의 인식하에 창출된 것으로서, 통신망 데이터를 수집하고, 수집된 통신망 데이터를 예측에 필요한 데이터로 정규화하고, 정규화된 데이터에 대해 통신망의 장애를 일으키는 다양한 연관 관계를 학습한 신경망을 통해 통신망의 장애 발생을 예측하는 장치 및 방법을 제공하는데 있다.The present invention was created in recognition of the prior art as described above, collects communication network data, normalizes the collected communication network data to data necessary for prediction, and learns various associations that cause communication network failure with respect to the normalized data. An object of the present invention is to provide an apparatus and method for predicting the occurrence of a failure in a communication network through a neural network.

또한, 본 발명은 수집된 통신망 데이터로부터 앞으로 발생될 통신망 데이터를 1차 예측하고, 발생이 예측된 통신망 데이터가 일으킬 수 있는 장애를 2차 예측하는데 다른 목적이 있다.Another object of the present invention is to first predict network data to be generated in the future from the collected communication network data, and to secondarily predict failures that the predicted occurrence of network data may cause.

또한, 본 발명은 예측된 장애에 대비하는 사전 조치로서 운영자 통보 및 자동 복구를 선택적으로 실행하는데 또 다른 목적이 있다.In addition, another object of the present invention is to selectively execute operator notification and automatic recovery as a precautionary measure in preparation for a predicted failure.

일 측면에 따른, 신경망 기반의 통신망 장애 예측 장치는, 상기 통신망의 제어 데이터를 일정한 주기로 수집하는 수집 모듈; 주기별로 수집된 상기 제어 데이터에서 제어 메시지들을 분류하고 각 제어 메시지의 트래픽 패턴을 소정의 시간 단위로 정규화한 제 1 정규화 데이터를 생성하는 제 1 정규화 모듈; 상기 제 1 정규화 데이터를 기초로 신경망을 통해 상기 각 제어 메시지의 다음 주기의 트래픽 패턴을 예측하는 트래픽 패턴 예측 모듈; 각 제어 메시지의 예측된 다음 주기의 트래픽 패턴을 구성하는 각 항목의 값을 임계 값과 비교하여 정규화한 제 2 정규화 데이터를 생성하는 제 2 정규화 모듈; 및 상기 제 2 정규화 데이터를 기초로 신경망을 통해 상기 통신망의 장애 발생 가능성을 예측하는 장애 발생 예측 모듈을 포함한다.According to one aspect, an apparatus for predicting network failure based on a neural network includes: a collection module for collecting control data of the communication network at regular intervals; a first normalization module for classifying control messages from the control data collected for each period and generating first normalized data obtained by normalizing a traffic pattern of each control message to a predetermined time unit; a traffic pattern prediction module for predicting a traffic pattern of a next period of each control message through a neural network based on the first normalized data; a second normalization module for generating second normalized data normalized by comparing the value of each item constituting the predicted next cycle traffic pattern of each control message with a threshold value; and a failure occurrence prediction module for predicting the probability of occurrence of a failure of the communication network through a neural network based on the second normalized data.

상기 제 1 정규화 모듈은, 소정의 시간 단위마다, 상기 트래픽 패턴을 구성하는 상기 제어 메시지의 발생 횟수, 실패 횟수, 지연 시간 및 타임 아웃 횟수의 항목별로 카운트하여 정규화한다.The first normalization module counts and normalizes the number of occurrences, the number of failures, the delay time, and the number of timeouts of the control message constituting the traffic pattern for each predetermined time unit.

상기 제 2 정규화 모듈은, 각 제어 메시지의 예측된 트래픽 패턴을 구성하는 각 항목별로, 최대 값과 임계 값을 비교하여 정규화한다.The second normalization module compares and normalizes the maximum value and the threshold value for each item constituting the predicted traffic pattern of each control message.

상기 제 2 정규화 모듈은, 상기 임계 값에 가중치를 달리 적용하며 상기 최대 값과 비교하여 상기 각 항목의 값을 정규화한다.The second normalization module applies different weights to the threshold value and normalizes the value of each item by comparing it with the maximum value.

상기 제 2 정규화 모듈은, 상기 각 항목의 값을, 상기 가중치의 개수에 1을 더한 수에 대응하는 종류의 값 중 하나로 결정한다.The second normalization module determines the value of each item as one of values of a type corresponding to a number obtained by adding 1 to the number of weights.

상기 제 2 정규화 모듈은, 상기 통신망 내의 장비별로 제어 메시지들을 분류하고, 분류된 각 제어 메시지의 예측된 트래픽 패턴을 구성하는 각 항목의 값을 정규화한다.The second normalization module classifies the control messages for each device in the communication network, and normalizes the value of each item constituting the predicted traffic pattern of each classified control message.

상기 제 2 정규화 모듈은, 각 장비의 트래픽 패턴의 값에 비례하는 임계 값을 적용한다.The second normalization module applies a threshold value proportional to the value of the traffic pattern of each device.

상기 장애 발생 예측 모듈은, 장비별로 장애 발생 가능성을 예측한다.The failure occurrence prediction module predicts the failure probability for each device.

상기 장애 발생 예측 모듈은, 장애 발생 가능성이 있는 장비의 장애 발생 확률을 계산한다.The failure occurrence prediction module calculates the failure occurrence probability of the equipment with the possibility of failure.

상기 장애 발생 예측 모듈에서 예측된 장애의 복구 가능성을 장애 지식 데이터베이스에 쿼리하여 판단하고, 판단 결과에 따라 운용자 통보 또는 자동 복구의 장애 조치를 처리하는 장애 예측 결과 처리 모듈을 더 포함한다.The failure prediction result processing module further includes a failure prediction result processing module for determining the recovery possibility of the failure predicted by the failure occurrence prediction module by querying the failure knowledge database, and processing an operator notification or automatic recovery failure action according to the determination result.

상기 트래픽 패턴 예측 모듈은, 리커런트(Recurrent) 신경망을 기반으로 하고, 상기 장애 발생 예측 모듈은, 컨벌루션(Convolution) 신경망을 기반으로 한다.The traffic pattern prediction module is based on a recurrent neural network, and the failure occurrence prediction module is based on a convolutional neural network.

다른 측면에 따른, 신경망 기반의 통신망 장애 예측 장치가 실행하는 통신망 장애 예측 방법은, 상기 통신망의 제어 데이터를 일정한 주기로 수집하는 단계; 주기별로 수집된 상기 제어 데이터에서 제어 메시지들을 분류하고 각 제어 메시지의 트래픽 패턴을 소정의 시간 단위로 정규화한 제 1 정규화 데이터를 생성하는 단계; 상기 제 1 정규화 데이터를 기초로 신경망을 통해 상기 각 제어 메시지의 다음 주기의 트래픽 패턴을 예측하는 단계; 각 제어 메시지의 예측된 다음 주기의 트래픽 패턴을 구성하는 각 항목의 값을 임계 값과 비교하여 정규화한 제 2 정규화 데이터를 생성하는 단계; 및 상기 제 2 정규화 데이터를 기초로 신경망을 통해 상기 통신망의 장애 발생 가능성을 예측하는 단계를 포함한다.According to another aspect, a communication network failure prediction method executed by a neural network-based communication network failure prediction apparatus includes: collecting control data of the communication network at regular intervals; classifying control messages from the control data collected for each period and generating first normalized data obtained by normalizing a traffic pattern of each control message to a predetermined time unit; predicting a traffic pattern of a next period of each control message through a neural network based on the first normalized data; generating second normalized data normalized by comparing the value of each item constituting the predicted next cycle traffic pattern of each control message with a threshold value; and predicting the probability of occurrence of a failure of the communication network through a neural network based on the second normalized data.

본 발명의 일 측면에 따르면, 망 장비가 처리하는 제어 메시지를 예측하고, 예측된 제어 메시지로 인해 발생될 망 장비의 장애를 예측하고, 예측된 장애에 운용자 통보 및 명령 실행 등의 복구 조치를 실행하여 망의 장애 발생에 미리 대비한다.According to an aspect of the present invention, a control message processed by network equipment is predicted, a failure of network equipment that will occur due to the predicted control message is predicted, and recovery measures such as operator notification and command execution are executed for the predicted failure. Therefore, it prepares in advance for the occurrence of network failure.

본 발명의 다른 측면에 따르면, 리커런트 신경망을 통해 앞으로 발생될 제어 메시지의 제어 트래픽을 제 1예측하고, 컨볼루션 신경망을 통해 제어 트래픽에 의한 장비별 장애 발생 가능성을 제 2예측함으로써 예측의 신뢰도를 높인다.According to another aspect of the present invention, the reliability of prediction is improved by first predicting control traffic of a control message to be generated in the future through a recurrent neural network, and second predicting the probability of occurrence of a failure for each device due to control traffic through a convolutional neural network. elevate

본 명세서에 첨부되는 다음의 도면들은 본 발명의 바람직한 실시예를 예시하는 것이며, 후술한 발명의 상세한 설명과 함께 본 발명의 기술사상을 더욱 이해시키는 역할을 하는 것이므로, 본 발명은 그러한 도면에 기재된 사항에만 한정되어 해석되지 않아야 한다.
도 1은 본 발명의 일 실시예에 따른 통신망 장애 예측 장치의 개략적인 구성도이다.
도 2는 도 1의 통신망 장애 예측 장치가 분류하는 제어 메시지의 예시도이다.
도 3은 도 1의 통신망 장애 예측 장치가 제어 메시지를 예측하는 개략적 구성도이다.
도 4는 도 3의 트래픽 패턴 예측부가 예측한 트래픽 패턴과 실제 발생된 트래픽 패턴을 대비하는 그래프이다.
도 5는 도 3의 트래픽 패턴 예측부가 리커런트 신경망을 기반으로 예측 오차를 보정하는 예시도이다.
도 6은 도 1의 통신망 장애 예측 장치가 장비별 장애 발생을 예측하는 개략적 구성도이다.
도 7은 도 6의 제 2 정규화부가 예측된 트래픽 패턴의 값을 장비별로 제 2 정규화하는 순서도이다.
도 8은 도 1의 통신망 장애 예측 장치가 예측된 장애 발생에 대해 장애 조치하는 개략적 구성도이다.
도 9는 본 발명의 일 실시예에 따른 장애 예측 방법의 개략적 순서도이다.
The following drawings attached to the present specification illustrate preferred embodiments of the present invention, and serve to further understand the technical spirit of the present invention together with the detailed description of the present invention, so that the present invention is described in such drawings. should not be construed as limited to
1 is a schematic configuration diagram of a communication network failure prediction apparatus according to an embodiment of the present invention.
FIG. 2 is an exemplary diagram of a control message classified by the apparatus for predicting network failure of FIG. 1 .
FIG. 3 is a schematic configuration diagram in which the apparatus for predicting network failure of FIG. 1 predicts a control message.
FIG. 4 is a graph comparing the traffic pattern predicted by the traffic pattern predictor of FIG. 3 and the actually generated traffic pattern.
5 is an exemplary diagram in which the traffic pattern prediction unit of FIG. 3 corrects a prediction error based on a recurrent neural network.
6 is a schematic configuration diagram in which the communication network failure prediction apparatus of FIG. 1 predicts the occurrence of a failure for each device.
7 is a flowchart illustrating a second normalization of the predicted traffic pattern value for each device by the second normalizer of FIG. 6 .
FIG. 8 is a schematic configuration diagram in which the apparatus for predicting network failure of FIG. 1 performs a failover in response to a predicted failure.
9 is a schematic flowchart of a failure prediction method according to an embodiment of the present invention.

이하, 첨부된 도면을 참조하여 본 발명의 바람직한 실시예를 상세히 설명하기로 한다. 이에 앞서, 본 명세서 및 청구 범위에 사용된 용어나 단어는 통상적이거나 사전적인 의미로 한정해서 해석되어서는 아니되며, 발명자는 그 자신의 발명을 가장 최선의 방법으로 설명하기 위해 용어의 개념을 적절하게 정의할 수 있다는 원칙에 입각하여 본 발명의 기술적 사상에 부합하는 의미와 개념으로 해석되어야만 한다. 따라서, 본 명세서에 기재된 실시예와 도면에 도시된 구성은 본 발명의 가장 바람직한 일 실시예에 불과할 뿐이고 본 발명의 기술적 사상에 모두 대변하는 것은 아니므로, 본 출원 시점에 있어서 이들을 대체할 수 있는 다양한 균등물과 변형예들이 있을 수 있음을 이해하여야 한다.Hereinafter, preferred embodiments of the present invention will be described in detail with reference to the accompanying drawings. Prior to this, the terms or words used in the present specification and claims should not be construed as being limited to their ordinary or dictionary meanings, and the inventor should properly understand the concept of the term in order to best describe his invention. Based on the principle that it can be defined, it should be interpreted as meaning and concept consistent with the technical idea of the present invention. Accordingly, the configuration shown in the embodiments and drawings described in the present specification is only the most preferred embodiment of the present invention and does not represent all of the technical idea of the present invention, so at the time of the present application, various It should be understood that there may be equivalents and variations.

도 1은 본 발명의 일 실시예에 따른 통신망 장애 예측 장치(100)의 개략적인 구성도이다.1 is a schematic configuration diagram of a communication network failure prediction apparatus 100 according to an embodiment of the present invention.

본 발명이 적용되는 망 시스템(150)은 eNB(151)(evolved NodeB)(151), 이동 통신 코아망(EPC : Evolved Packet Core)을 구성하는 MME(152)(Mobility Management Entity)(152), SGW(Serving GateWay)(156) 및 PGW(Packet data network GateWay)(157), MME(152)에 연결된 EIR(Equipment Identity Register)(153), HSS(Home Subscriber Server)(154) 및 AuC(Authentication Center)(155) 그리고 PGW(157)에 연결된 PCRF(Policy & Charging Rules Function)와 같은 망 장비들을 포함한다.The network system 150 to which the present invention is applied includes an eNB 151 (evolved NodeB) 151, an MME 152 (Mobility Management Entity) 152 constituting an Evolved Packet Core (EPC), Serving GateWay (SGW) (156) and Packet data network GateWay (PGW) (157), Equipment Identity Register (EIR) (153) connected to MME (152), Home Subscriber Server (HSS) (154) and Authentication Center (AuC) ) (155) and network equipment such as PCRF (Policy & Charging Rules Function) connected to the PGW (157).

망 시스템(150)에서는, 가입자에게 통신 서비스를 제공하는 과정에서 각 망 장비(151~158)들이 처리 동작을 제어하는 제어 데이터(예 : 제어 메시지)를 발생시키고, 발생된 제어 데이터를 타 망 장비(151-158)들과 통신하고, 해당 제어 데이터에 따라 처리 동작한다. 제어 데이터의 상기 발생, 통신 및 처리는 제어 프로세싱의 트래픽을 유발한다. 상기 제어 데이터는 제어 트래픽을 유발하는 제어 트래픽 데이터에 해당된다. 망 시스템(150)이 가입자에게 제공하는 통신 서비스의 부하가 증가하면, 증가된 서비스를 처리하기 위해 제어 트래픽이 증가한다. 증가된 제어 트래픽은 각 망 장비(151~158)들의 장애를 유발할 수 있다. 특정 망 장비(151~158)에서 장애가 발생되는 것은 상기 제어 트래픽의 처리가 불능이 되는 것이다. 그리고 상기 불능은 가입자 통신 서비스의 지연, 불능 등으로 이어진다.In the network system 150, in the process of providing communication services to subscribers, each of the network devices 151 to 158 generates control data (eg, a control message) that controls the processing operation, and transmits the generated control data to other network devices. (151-158) communicates with them, and performs a processing operation according to the corresponding control data. Said generation, communication and processing of control data results in traffic of control processing. The control data corresponds to control traffic data causing control traffic. When the load of the communication service provided by the network system 150 to subscribers increases, control traffic increases in order to process the increased service. The increased control traffic may cause failure of each of the network devices 151 to 158 . When a failure occurs in the specific network equipment 151 to 158, the processing of the control traffic becomes impossible. And the inability leads to delay, inability, etc. of subscriber communication service.

상기 망 시스템(150)은 각 망 장비(151~158)들 사이에서 제어 메시지를 통해 가입자들에게 통신 서비스가 제공되기만 하면 특별한 제한을 두지 않는다. 예를 들어, 5G, 차세대 망 및 NB-IoT(Narrow Band-Internet of Things) 등은 본 발명이 적용된다. 이하에서는, LTE 서비스를 제공하는 망 시스템(150)이라 가정한다.The network system 150 is not particularly limited as long as a communication service is provided to subscribers through a control message between the respective network equipments 151 to 158. For example, the present invention is applied to 5G, next-generation networks, and Narrow Band-Internet of Things (NB-IoT). Hereinafter, it is assumed that the network system 150 provides an LTE service.

망 시스템(150)이 LTE 단말에 해당되는 UE(160)로 LTE 서비스를 제공하는 과정을 간략히 설명하면 다음과 같다. UE(160)는 LTE 서비스를 제공받기 위해 현재 위치에서 기지국에 해당되는 eNB(151)와 무선 설정을 맺는다. eNB(151)를 통해 UE(160)가 EPC에 접속되면, MME(152)는 EIR(153)을 통해 UE(160)의 가입자 단말 인증을 처리한다. EIR(153)은 서비스 가입자가 개통한 UE(160)의 단말 고유 번호인 IMEI(International Mobile Equipment Identity)를 저장하는 DB이다. MME(152)는 HSS(154)로 UE(160)의 위치를 등록하고 서비스 프로파일을 수신한다. MME(152)는 AuC(156)를 통해 UE(160)로부터 수신된 정보와 저장된 가입 정보를 비교하여 정당한 가입자로 인증한다. MME(152)와 연결된 SGW(156)는 통화 설정 관리, 패킷 데이터 전달, IP 이동성 관리 및 3G 네트워크 연동 등을 처리한다. 또한, SGW(156)와 연결된 PGW(157)는 UE(151)의 IP 주소를 할당하고 PCRF(158)를 통해 데이터 사용량에 따른 요금 정보를 관리한다.A process in which the network system 150 provides an LTE service to the UE 160 corresponding to the LTE terminal will be briefly described as follows. The UE 160 establishes a radio setting with the eNB 151 corresponding to the base station at the current location in order to receive the LTE service. When the UE 160 is connected to the EPC through the eNB 151 , the MME 152 processes the subscriber terminal authentication of the UE 160 through the EIR 153 . The EIR 153 is a DB for storing an International Mobile Equipment Identity (IMEI), which is a terminal unique number of the UE 160 opened by a service subscriber. The MME 152 registers the location of the UE 160 with the HSS 154 and receives a service profile. The MME 152 compares the information received from the UE 160 through the AuC 156 with the stored subscription information to authenticate as a legitimate subscriber. The SGW 156 connected to the MME 152 handles call setup management, packet data delivery, IP mobility management, and 3G network interworking. In addition, the PGW 157 connected to the SGW 156 allocates an IP address of the UE 151 and manages charge information according to data usage through the PCRF 158 .

본 발명의 일 실시예에 따른 통신망 장애 예측 장치(100)는 메모리, 메모리 제어기, 하나 이상의 프로세서(CPU), 주변 인터페이스, 입출력(I/O) 서브시스템, 디스플레이 장치, 입력 장치 및 통신 회로를 포함할 수 있다. The communication network failure prediction apparatus 100 according to an embodiment of the present invention includes a memory, a memory controller, one or more processors (CPU), a peripheral interface, an input/output (I/O) subsystem, a display device, an input device, and a communication circuit. can do.

메모리는 고속 랜덤 액세스 메모리를 포함할 수 있고, 또한 하나 이상의 자기 디스크 저장 장치, 플래시 메모리 장치와 같은 불휘발성 메모리, 또는 다른 불휘발성 반도체 메모리 장치를 포함할 수 있다. 프로세서 및 주변 인터페이스와 같은 다른 구성요소에 의한 메모리로의 액세스는 메모리 제어기에 의하여 제어될 수 있다. 메모리는 각종 정보와 프로그램 명령어를 저장할 수 있고, 프로그램은 프로세서에 의해 실행된다. The memory may include high-speed random access memory, and may also include one or more magnetic disk storage devices, non-volatile memories such as flash memory devices, or other non-volatile semiconductor memory devices. Access to the memory by other components, such as the processor and peripheral interfaces, may be controlled by the memory controller. The memory may store various kinds of information and program instructions, and the program is executed by the processor.

주변 인터페이스는 통신망 장애 예측 장치(100)의 입출력 주변 장치를 프로세서 및 메모리와 연결한다. 하나 이상의 프로세서는 다양한 소프트웨어 프로그램 및/또는 메모리에 저장되어 있는 명령어 세트를 실행하여 통신망 장애 예측 장치(100)를 위한 여러 기능을 수행하고 데이터를 처리한다. I/O 서브시스템은 디스플레이 장치, 입력 장치와 같은 입출력 주변장치와 주변 인터페이스 사이에 인터페이스를 제공한다. 디스플레이 장치는 LCD(liquid crystal display) 기술 또는 LED(light emitting polymer display) 기술을 사용할 수 있다. The peripheral interface connects an input/output peripheral device of the communication network failure prediction apparatus 100 with a processor and a memory. One or more processors execute various software programs and/or instruction sets stored in the memory to perform various functions for the communication network failure prediction apparatus 100 and process data. The I/O subsystem provides an interface between input/output peripherals such as display devices and input devices and the peripheral interface. The display device may use a liquid crystal display (LCD) technology or a light emitting polymer display (LED) technology.

프로세서는 통신망 장애 예측 장치(100)에 연관된 동작을 수행하고 명령어들을 수행하도록 구성된 프로세서로서, 예를 들어, 메모리로부터 검색된 명령어들을 이용하여, 통신망 장애 예측 장치(100)의 컴포넌트 간의 입력 및 출력 데이터의 수신과 조작을 제어할 수 있다. 통신 회로는 외부 포트를 통한 통신 또는 RF 신호에 의한 통신을 수행한다. 통신 회로는 전기 신호를 RF 신호로 또는 그 반대로 변환하며 이 RF 신호를 통하여 통신 네트워크, 다른 이동형 게이트웨이 장치 및 통신 장치와 통신할 수 있다.The processor is a processor configured to perform an operation related to the communication network failure prediction apparatus 100 and perform instructions, for example, by using the instructions retrieved from the memory, input and output data between the components of the communication network failure prediction apparatus 100 . Reception and manipulation can be controlled. The communication circuit performs communication through an external port or communication by an RF signal. The communication circuitry converts electrical signals into RF signals and vice versa through which the RF signals can communicate with communication networks, other mobile gateway devices, and communication devices.

도 1을 참조하면, 통신망 장애 예측 장치(100)는, 망 시스템(150)으로부터 제어 데이터를 수집하는 수집부(101), 수집된 제어 데이터에서 제어 메시지를 분류하고 각 제어 메시지의 트래픽 패턴을 정규화한 제 1 정규화 데이터를 생성하는 제 1 정규화부(102), 제 1 정규화 데이터를 기초로 신경망을 통해 앞으로 발생될 각 제어 메시지의 트래픽 패턴을 예측하는 트래픽 패턴 예측부(103), 예측된 트래픽 패턴의 값을 임계 값과 비교하여 정규화한 제 2 정규화 데이터를 생성하는 제 2 정규화부(105), 제 2 정규화 데이터를 기초로 신경망을 통해 통신망의 장애를 예측하는 장애 발생 예측부(106) 및 예측된 장애에 대해 사전 조치로서 장애 복구를 처리하는 장애 예측 결과 처리부(107)를 포함한다. 이러한 구성요소는 소프트웨어로 구현되어 메모리에 저장되어 프로세서에 의해 실행될 수 있고, 또는 소프트웨어와 하드웨어의 조합으로 구현될 수도 있다.Referring to FIG. 1 , the communication network failure prediction apparatus 100 includes a collection unit 101 that collects control data from a network system 150 , classifies control messages from the collected control data, and normalizes traffic patterns of each control message. The first normalizer 102 for generating the first normalized data, the traffic pattern prediction unit 103 for predicting the traffic pattern of each control message to be generated in the future through the neural network based on the first normalized data, the predicted traffic pattern A second normalization unit 105 for generating normalized second normalized data by comparing the value of α with a threshold value, a failure occurrence prediction unit 106 for predicting a failure of a communication network through a neural network based on the second normalized data, and prediction It includes a failure prediction result processing unit 107 that processes failure recovery as a preliminary measure for the failure. These components may be implemented as software, stored in a memory, and executed by a processor, or may be implemented as a combination of software and hardware.

여기서, 통신망 장애 예측 장치(100)는 수집부(101), 제 1 정규화부(102) 및 트래픽 패턴 예측부(103)를 통해, 현재 발생된 제어 메시지의 트래픽 패턴을 기반으로 앞으로 발생될 제어 메시지의 트래픽 패턴을 예측한다. 이후, 통신망 장애 예측 장치(100)는 제 2 정규화부(105), 장애 발생 예측부(106) 및 장애 예측 결과 처리부(107)를 통해, 상기 예측된 제어 메시지의 트래픽 패턴을 기초로 통신망의 장애 가능성을 예측하고, 예측된 장애에 대해 사전 조치를 처리한다.Here, the apparatus 100 for predicting network failure is a control message to be generated in the future based on the traffic pattern of the currently generated control message through the collection unit 101 , the first normalization unit 102 and the traffic pattern prediction unit 103 . predict traffic patterns. Then, the communication network failure prediction apparatus 100 through the second normalization unit 105, the failure occurrence prediction unit 106, and the failure prediction result processing unit 107, based on the traffic pattern of the predicted control message network failure Predict the likelihood and take proactive measures against predicted failures.

상기 수집부(101)는 가입자에게 데이터 통신 서비스를 제공하기 위해 망 시스템(150)의 각 장비(151~158)들 사이에서 발생되는 제어 데이터를 일정한 주기로 수집한다. 제어 데이터는 상기 통신 서비스의 처리를 위해 장비(151~158)들 간에 인터페이스되는 제어 메시지(X2, S1, S5, S6a, S6a_AuC, S11, S13, Gx 등)를 포함한다. 수집부(101)는 수집된 제어 데이터를 DB에 저장할 수 있다.The collection unit 101 collects control data generated between each device 151 to 158 of the network system 150 at regular intervals to provide a data communication service to subscribers. The control data includes control messages (X2, S1, S5, S6a, S6a_AuC, S11, S13, Gx, etc.) interfaced between the devices 151 to 158 for processing the communication service. The collection unit 101 may store the collected control data in a DB.

상기 제 1 정규화부(102)는 현재 주기에서 수집된 제어 데이터로부터 장비별로 제어 메시지를 분류하고, 분류된 제어 메시지의 트래픽 패턴을 소정의 시간 단위로 정규화한다. 여기서, 제 1 정규화부(102)는 장비별로 제어 메시지의 트래픽 패턴을 구분하고 장비별로 제어 메시지의 트래픽 패턴의 각 항목을 소정의 시간 단위로 제 1 정규화 처리한 제 1 정규화 데이터를 출력한다. 각 트래픽 패턴의 항목은, 예를 들어 제어 메시지의 시도 횟수, 실패 횟수, 지연 시간, 타임 아웃 횟수 등을 포함한다. 제 1 정규화 처리는 망 시스템(150)에서 수집된 제어 메시지를 시간 및 트래픽 패턴으로 분석하여 상기 예측을 위한 입력 데이터를 생성하는 처리로서 도 3을 통해 상세히 후술한다.The first normalizer 102 classifies a control message for each device from the control data collected in the current period, and normalizes the traffic pattern of the classified control message in a predetermined time unit. Here, the first normalizer 102 classifies the traffic pattern of the control message for each device and outputs the first normalized data obtained by first normalizing each item of the traffic pattern of the control message for each device in a predetermined time unit. The items of each traffic pattern include, for example, the number of attempts, the number of failures, the delay time, and the number of timeouts of the control message. The first normalization process is a process for generating input data for the prediction by analyzing the control message collected in the network system 150 with time and traffic patterns, and will be described in detail later with reference to FIG. 3 .

상기 트래픽 패턴 예측부(103)는 제 1 정규화 처리된 장비별 제 1 정규화 데이터를 이용하여 신경망을 통해 장비별로 앞으로 발생될 제어 메시지의 트래픽 패턴을 예측한다. 상기 트래픽 패턴 예측부(103)는 리커런트 신경망을 이용한다. The traffic pattern prediction unit 103 predicts a traffic pattern of a control message to be generated for each device through a neural network using the first normalized data for each device that has been subjected to the first normalization process. The traffic pattern prediction unit 103 uses a recurrent neural network.

상기 제 2 정규화부(105)는 장비별로 앞으로 발생될 장애 가능성을 예측하기 위해, 장비별로 예측된 제어 메시지의 트래픽 패턴에 대해 제 2 정규화 처리하여 제 2 정규화 데이터를 출력한다. 여기서, 제 2 정규화 처리는 각 장비별로 예측된 제어 메시지의 트래픽 패턴을 구성하는 각 항목의 값들을 각 장비(151~158)들의 장애에 영향을 미치는 정도의 값으로 정규화하는 것으로서, 도 6을 통해 상세히 후술한다.The second normalization unit 105 outputs second normalized data by performing a second normalization process on a traffic pattern of a control message predicted for each device in order to predict the possibility of a failure occurring in the future for each device. Here, the second normalization process normalizes the values of each item constituting the traffic pattern of the control message predicted for each device to a value that affects the failure of each device 151 to 158, and through FIG. It will be described later in detail.

상기 장애 발생 예측부(106)는 정규화 처리된 제 2 정규화 데이터를 이용하여 신경망을 통해 앞으로 발생될 장비(151~158)별 장애 가능성을 예측한다. 상기 장애 발생 예측부(106)는 컨볼루션 신경망을 이용한다. The failure occurrence prediction unit 106 predicts the possibility of failure for each device 151 to 158 that will occur in the future through a neural network using the normalized second normalized data. The failure occurrence prediction unit 106 uses a convolutional neural network.

상기 장애 예측 결과 처리부(107)는 예측된 장비(151~158)별 장애 가능성의 결과를 처리하여 장애 제거 및 장애 복구 등의 사전 조치를 실행한다. 사전 조치가 실행되면, 예측된 장애는 미리 예방되어 실제로 발생되지 않는다.The failure prediction result processing unit 107 processes the result of the predicted failure probability for each equipment 151 to 158 and executes preliminary measures such as failure removal and failure recovery. If precautionary measures are taken, predicted failures are prevented in advance so that they do not actually occur.

도 2는 도 1의 통신망 장애 예측 장치(100)가 분류하는 제어 메시지의 예시도이다.FIG. 2 is an exemplary diagram of a control message classified by the apparatus 100 for predicting network failure of FIG. 1 .

제 1 정규화부(102)는 망 시스템(150)으로부터 수집된 제어 데이터에서 제어 메시지(예 : X2, S1, S5, S6a, S6a_AuC, S11, S13, Gx 등)를 분류한다.The first normalizer 102 classifies control messages (eg, X2, S1, S5, S6a, S6a_AuC, S11, S13, Gx, etc.) from the control data collected from the network system 150 .

여기서, X2는 인접한 2개의 eNB(151)들 사이에서 사용되는 제어 메시지(예 : 핸드 오버 제어)이다. S1은 eNB(151)와 MME(152) 사이에서 사용되는 제어 메시지(예 : 호 설정)이다. S1 제어 메시지는 하부 메시지로서 Attach, SRMO(Service Request Mobile Originate), SRMT, TAU, S1HO, Detach, ESRMO, ESRMT 등의 메시지가 있다. S5는 SGW(156)와 PGW(157) 사이에서 사용되는 제어 메시지이다. S5 제어 메시지에는 하부 메시지로서 CSR(Create Session Request), MBR(Modify Bearer Request), DBR(Delete Bearer Request), DSR(Delete Session Request) 등의 메시지가 있다. S6a는 MME(152)와 HSS(154) 사이에서 사용되는 제어 메시지이다. S6a_AuC는 MME(152)와 AuC(155) 사이에서 사용되는 제어 메시지이다. S11은 MME(152)와 SGW(156) 사이에서 사용되는 제어 메시지이다. S11 제어 메시지 안에는 하부 메시지로 CSR, MBR, DBR, DSR 등의 메시지가 있다. S13은 MME(152)와 EIR(153) 사이에서 사용되는 제어 메시지이다. Gx는 PGW(157)와 PCRF(158) 사이에서 사용되는 제어 메시지이다.Here, X2 is a control message (eg, handover control) used between two adjacent eNBs 151 . S1 is a control message (eg, call setup) used between the eNB (151) and the MME (152). The S1 control message includes messages such as Attach, Service Request Mobile Originate (SRMO), SRMT, TAU, S1HO, Detach, ESRMO, and ESRMT as sub-messages. S5 is a control message used between SGW 156 and PGW 157 . The S5 control message includes messages such as Create Session Request (CSR), Modify Bearer Request (MBR), Delete Bearer Request (DBR), and Delete Session Request (DSR) as sub-messages. S6a is a control message used between the MME (152) and the HSS (154). S6a_AuC is a control message used between the MME (152) and the AuC (155). S11 is a control message used between the MME (152) and the SGW (156). In the S11 control message, there are messages such as CSR, MBR, DBR, and DSR as sub-messages. S13 is a control message used between the MME (152) and the EIR (153). Gx is a control message used between the PGW (157) and the PCRF (158).

도 3은 도 1의 통신망 장애 예측 장치(100)가 제어 메시지를 예측하는 개략적 구성도로서, 어느 한 장비에서 처리되는 제어 메시지를 나타낸다.3 is a schematic configuration diagram in which the communication network failure prediction apparatus 100 of FIG. 1 predicts a control message, and shows a control message processed by any one device.

망 시스템(150)으로부터 소정의 주기로 수집되는 제어 데이터들은 UE(160)나 장비(151~158)의 상태가 바뀔 때마다 발생되어 CDR(Call Detailed Record) 형태로 수집부(101)에서 수집된다. 수집된 제어 데이터는 하루에도 수 Tera byte가 쌓일 정도로 많은 양일 뿐만 아니라 데이터의 형태도 숫자, 문자, 스트링, Boolean 등으로 다양하기 때문에 모든 데이터를 신경망 기반의 트래픽 패턴 예측부(103)로 직접 입력할 수 없다.Control data collected from the network system 150 at a predetermined cycle is generated whenever the state of the UE 160 or equipment 151 to 158 changes and is collected by the collection unit 101 in the form of a Call Detailed Record (CDR). Since the collected control data is not only large enough to accumulate several Tera bytes per day, but also the form of the data is diverse such as numbers, characters, strings, Booleans, etc., all data can be directly input into the neural network-based traffic pattern prediction unit 103. can't

따라서, 제 1 정규화부(102)는 수집부(101)에 의해 수집된 망 시스템(150)의 제어 데이터 중에서 장애 예측에 필요한 데이터로서 제어 메시지를 장비별로 분류하고, 장비별로 분류된 제어 메시지의 트래픽 패턴을 구분하여 트래픽 패턴의 각 항목을 소정의 시간 단위로 정규화 처리한다. Accordingly, the first normalization unit 102 classifies the control message as data necessary for failure prediction among the control data of the network system 150 collected by the collection unit 101 for each device, and the traffic of the control message classified for each device. By dividing the pattern, each item of the traffic pattern is normalized by a predetermined time unit.

여기서, 트래픽 패턴은 단위 시간에서 제어 메시지가 발생에 의해 처리 시도된 시도 횟수(Attempt count), 시도된 제어 메시지의 처리가 실패된 실패 횟수(Fail Count), 시도된 제어 메시지의 처리가 지연되고 있는 평균 지연 시간(Delay) 및 시도된 제어 메시지가 처리 지연되어 타임 아웃된 타임 아웃 횟수(Timeout count)의 항목을 포함한다. Here, the traffic pattern is the number of attempts (Attempt count), the number of attempts to process the attempted control message failed (Fail Count), and the delay in the processing of the attempted control message in a unit time. It includes items of the average delay time (Delay) and the number of timeout times (Timeout count) timed out due to processing delay of the attempted control message.

분석 과정에서, 제 1 정규화부(102)는 장비별로 분류된 제어 메시지에 대해, 각 주기(예 : t, 2t, 3t, ...)마다 소정의 시간 단위로 , 발생된 트래픽 패턴의 각 항목의 값을 카운트하여 제 1 정규화 데이터 X1 ~ Xt를 생성한다. 단위 시간은 제어 데이터의 수집 주기와 같거나 작다. 생성된 제 1 정규화 데이터는 도 3의 제 1 정규화 테이블(301)과 같은 데이터 구조로 표현될 수 있다. 제 1 정규화 테이블(301)은 장비마다 생성될 수 있고, 제어 메시지별로 단위 시간당 트래픽 패턴의 각 항목이 발생한 횟수 X1 ~ Xt로 구성된다.In the analysis process, the first normalizer 102, for the control message classified by equipment, for each period (eg, t, 2t, 3t, ...) in a predetermined time unit, each item of the generated traffic pattern The first normalized data X 1 to X t are generated by counting the values of . The unit time is equal to or less than the collection period of the control data. The generated first normalized data may be expressed in the same data structure as the first normalized table 301 of FIG. 3 . The first normalization table 301 may be generated for each device, and consists of the number of occurrences of each item of the traffic pattern per unit time X 1 to X t for each control message.

현재 주기(t)에서 발생된 각 제어 메시지의 트래픽 패턴이 제 1 정규화 데이터로 분석되면, 트래픽 패턴 예측부(103)는 제 1 정규화부(102)에서 생성된 장비별 제 1 정규화 데이터를 입력받고, 다음 주기(t+1~2t)에서 장비별로 예측되는 제어 메시지의 트래픽 패턴을 생성한다. 생성된 트래픽 패턴의 예측 값은 도 3의 예측 테이블(303)과 같은 데이터 구조로 표현될 수 있다. 제 1 정규화 테이블(301)의 항목 값 X1~Xt는 현재 주기(t) 내에서 발생된 각 제어 메시지의 트래픽 패턴의 각 항목의 단위 시간별 값이고, 예측 테이블(303)의 항목 값 U1~Ut는 트래픽 패턴의 각 항목의 단위 시간별 값 X1~Xt를 이용하여 다음 주기(t+1~2t)에서 발생이 예측되는 제어 메시지의 트래픽 패턴의 각 항목의 단위 시간별 값이다. 즉, 트래픽 패턴 예측부(103)는 현재 수집 주기(t)에서 발생된 망 시스템(150)의 제어 메시지의 트래픽 패턴으로부터 다음 번 주기(t+1~2t)에서 발생될 망 시스템(150)의 제어 메시지의 트래픽 패턴을 예측한다.When the traffic pattern of each control message generated in the current period t is analyzed as the first normalized data, the traffic pattern prediction unit 103 receives the first normalized data for each device generated by the first normalization unit 102 and receives , generate a traffic pattern of control messages predicted for each device in the next period (t+1 to 2t). The predicted value of the generated traffic pattern may be expressed in a data structure such as the prediction table 303 of FIG. 3 . The item values X 1 to X t of the first normalization table 301 are values for each unit time of each item of the traffic pattern of each control message generated within the current period t, and the item value U 1 of the prediction table 303 ~U t is the value per unit time of each item of the traffic pattern of the control message that is predicted to occur in the next period (t+1~2t) using the value X 1 ~X t for each unit time of each item of the traffic pattern. That is, the traffic pattern prediction unit 103 calculates the data of the network system 150 to be generated in the next period (t+1 to 2t) from the traffic pattern of the control message of the network system 150 generated in the current collection period (t). Predict the traffic pattern of control messages.

도 4는 도 3의 트래픽 패턴 예측부(103)가 예측한 트래픽 패턴과 실제 발생된 트래픽 패턴을 대비하는 그래프로서, 특정 장비에서 발생한 특정 종류의 제어 메시지의 트래픽 패턴 중 어느 한 항목의 예측 값과 실제 발생한 값을 대비한 그래프이다. 4 is a graph comparing the traffic pattern predicted by the traffic pattern prediction unit 103 of FIG. 3 and the actually generated traffic pattern. This is a graph comparing the actual values.

2t 주기에서 발생될 것으로 예측된 제어 메시지의 트래픽 패턴 U1~Ut는 예측 그래프(401)로 표시된다. 이후, 2t 주기에서 실제 발생된 트래픽 패턴 Xt+1~X2t는 실제 그래프(403)로 표시된다. 그러면, 2t 주기의 예측 트래픽 패턴 U1~Ut 및 2t 주기의 실제 트래픽 패턴 Xt+1~X2t의 차이는 예측의 오차이다. 이 예측의 오차는, 리커런트 신경망 학습을 통해 줄일 수 있다. Traffic patterns U 1 to U t of the control message predicted to be generated in the 2t period are represented by a prediction graph 401 . Thereafter, the traffic patterns X t+1 to X 2t that are actually generated in the 2t period are displayed as an actual graph 403 . Then, the difference between the predicted traffic pattern U 1 to U t of the 2t period and the actual traffic pattern X t+1 to X 2t of the 2t period is an error of prediction. The error of this prediction can be reduced through recurrent neural network learning.

도 5는 도 3의 트래픽 패턴 예측부(103)가 리커런트 신경망을 기반으로 예측 오차를 보정하는 예시도이다.5 is an exemplary diagram in which the traffic pattern prediction unit 103 of FIG. 3 corrects a prediction error based on a recurrent neural network.

트래픽 패턴 예측부(103)는 현재 주기에서 발생된 제어 메시지의 트래픽 패턴 XT를 입력받고, 리커런트 신경망을 통해 예측된 제어 메시지의 트래픽 패턴 UT를 출력한다. 여기서, 예측된 트래픽 패턴 UT는 오차 계산부(501)로 피드백된다. 오차 계산부(501)는 예측된 트래픽 패턴 UT와 다음 주기의 입력된 트래픽 패턴 XT+1에 대해 오차 UT - XT+1를 계산하고, 계산된 오차를 트래픽 패턴 예측부(103)의 리커런트 신경망의 학습에 반영하여 예측의 오차를 줄인다.The traffic pattern prediction unit 103 receives the traffic pattern X T of the control message generated in the current period and outputs the traffic pattern U T of the control message predicted through the recurrent neural network. Here, the predicted traffic pattern U T is fed back to the error calculator 501 . The error calculation unit 501 calculates an error U T - X T+1 for the predicted traffic pattern U T and the input traffic pattern X T+1 of the next period, and uses the calculated error as the traffic pattern prediction unit 103 . It is reflected in the training of the current neural network of , and the error of prediction is reduced.

도 6은 도 1의 통신망 장애 예측 장치(100)가 장비별 장애 발생을 예측하는 개략적 구성도이다.6 is a schematic configuration diagram in which the communication network failure prediction apparatus 100 of FIG. 1 predicts the occurrence of a failure for each device.

제 2 정규화부(105)는 트래픽 패턴 예측부(103)가 장비별로 예측한 예측 테이블(303)의 제어 메시지별 예측된 트래픽 패턴 U1~Ut를 입력받고, 이를 임계 값과 비교하는 제 2 정규화를 하여 제 2 정규화 데이터를 출력한다. 구체적으로, 제 2 정규화부(105)는, 장비별로 예측된 제어 메시지별 트래픽 패턴의 각 항목마다, 최대 값(U1~Ut 중 최대값)과 임계 값을 비교하여 각 항목의 값을 정규화한다. The second normalizer 105 receives the traffic pattern U 1 ~U t predicted for each control message of the prediction table 303 predicted by the traffic pattern prediction unit 103 for each device, and compares it with a threshold value. Normalization is performed to output second normalized data. Specifically, the second normalizer 105 compares the maximum value (the maximum value among U 1 to U t ) with the threshold value for each item of the traffic pattern for each control message predicted for each device and normalizes the value of each item. do.

상기 제 2 정규화 처리에서, 예측 테이블(303)의 제어 메시지별 트래픽 패턴의 각 항목의 값(U1~Ut)은 각 항목별로 단위가 수십에서 수만까지 차이가 크게 나는 정량 값인데, 이 정량 값을 그대로 예측 계산해 버리면, 큰 값은 예측에 과대하게 반영되고, 작은 값은 과소하게 반영되어 예측의 신뢰도에 문제가 생긴다. 예를 들어, 어느 한 장비에서 제 1 제어 메시지의 트래픽 패턴의 A 항목의 분포 값이 1~10이고, 예측된 A 항목의 값이 10일 경우와 제 2 제어 메시지의 트래픽 패턴의 B 항목의 분포가 1~100이고 예측된 B 항목의 값이 10일 경우라 가정할 때, A 항목의 값 10과 B 항목의 값 10을 그대로 해당 장비의 예측 처리의 계산 값으로 사용하는 것은 예측의 오류를 불러온다. 왜냐하면, A 항목은 분포의 최대 값이 10이므로 B 항목의 값보다 훨씬 중대하게 영향을 미치는 계산 값으로 사용해야 하기 때문이다. In the second normalization process, the value (U 1 ~ U t ) of each item of the traffic pattern for each control message of the prediction table 303 is a quantitative value with a large difference in units from tens to tens of thousands for each item. When a value is predicted and calculated as it is, a large value is overreflected in the prediction and a small value is underreflected, resulting in a problem in the reliability of the prediction. For example, in a case where the distribution value of item A of the traffic pattern of the first control message is 1 to 10 and the predicted value of item A is 10 in any one device, and the distribution of item B of the traffic pattern of the second control message Assuming that is 1 to 100 and the predicted value of item B is 10, using the value 10 of item A and the value 10 of item B as it is as the calculated value of the prediction processing of the equipment will lead to an error in prediction. come. This is because item A has a maximum value of 10 in the distribution, so it should be used as a calculated value that affects much more significantly than the value of item B.

때문에, 제 2 정규화부(105)는 상기 정량 값을 각 장비와 제어 메시지의 트래픽 패턴의 상호 영향 관계를 고려한 정성 값으로 제 2 정규화 처리하여 제어 메시지의 트래픽 패턴이 실제로 각 망 장비(151~158)에 영향을 미치는 정도를 신뢰도있게 평가한다.Therefore, the second normalization unit 105 performs a second normalization process on the quantitative value as a qualitative value in consideration of the mutual influence relationship between each device and the traffic pattern of the control message, so that the traffic pattern of the control message is actually determined by each network device (151 to 158). ) to reliably evaluate the degree of influence on

따라서, 제 2 정규화부(105)는 장비마다 제어 메시지별 트래픽 데이터의 각 항목별로, 각 항목의 값 U1~Ut의 최대 값 Umax를 트래픽 패턴의 분포 범위 및 장비 특성을 고려한 임계 값 T와 비교하여 제 2 정규화 데이터 Vij를 생성한다. 구체적으로, 제 2 정규화부(105)는, 임계 값 T에 3개의 가중치, 예를 들어 1, 1.2, 1.5를 부여하고, 상기 최대 값 Umax를 가중치 부여된 각각의 임계 값 T, 1.2T, 1.5T와 비교하여, 제 2 정규화 데이터 Vij를 생성한다. 예를 들어, 최대 값 Umax <T일 경우 제 2 정규화 데이터 Vij는 0, T<= Umax <1.2T일 경우 제 2 정규화 데이터 Vij는 1, 1.2T<= Umax <1.5T일 경우 제 2 정규화 데이터 Vij는 2 및 1.5T<= Umax일 경우 제 2 정규화 데이터 Vij는 3이 될 수 있다. 임계 값 T 및 가중치는 제어 메시지의 종류, 각 항목의 분포 및 장비 특성을 고려하여 장비별, 제어 메시지 종류별, 트래픽 패턴의 항목별로 정해질 수 있다 . 이와 같이 생성된 장비별 제어 메시지의 트래픽 패턴의 항목별 제 2 정규화 데이터 Vij는 도 6의 제 2 정규화 테이블(610)과 같은 데이터 구조로 표현될 수 있다. 제 2 정규화 테이블(610)은 예측 테이블(303)을 트래픽 패턴의 분포 값/임계 값 및 장비/제어 메시지의 특성을 고려하여 제 2 정규화 처리한 것이다.Therefore, the second normalizer 105 sets the maximum value U max of the values U 1 to U t of each item for each item of traffic data for each control message for each equipment, and the threshold value T considering the distribution range of the traffic pattern and the equipment characteristics. and to generate second normalized data V ij . Specifically, the second normalizer 105 gives three weights, for example, 1, 1.2, and 1.5, to the threshold value T, and assigns the maximum value U max to each of the weighted threshold values T, 1.2T, Compared with 1.5T, the second normalized data V ij is generated. For example, the maximum value U max When <T, the second normalized data V ij is 0, T<= U max When <1.2T, the second normalized data V ij is 1, 1.2T<= U max When <1.5T, the second normalized data V ij may be 2, and when 1.5T<= U max , the second normalized data V ij may be 3. The threshold value T and weight may be determined for each device, each control message type, and each traffic pattern item in consideration of the type of control message, distribution of each item, and device characteristics. The second normalized data V ij for each item of the traffic pattern of the generated control message for each device may be expressed in the same data structure as the second normalization table 610 of FIG. 6 . The second normalization table 610 is obtained by second normalizing the prediction table 303 in consideration of the distribution value/threshold value of the traffic pattern and the characteristics of the equipment/control message.

장애 발생 예측부(106)는 제 2 정규화 테이블(610)의 제 2 정규화 데이터를 이용하여 컨볼루션 신경망을 통해 각 장비의 다음 주기에서의 장애 발생 가능성을 예측한다. 장애 발생 예측부(106)는, 장비별 장애 발생 확률을 산출할 수 있다. The failure occurrence prediction unit 106 predicts a failure occurrence probability in the next cycle of each device through a convolutional neural network using the second normalized data of the second normalization table 610 . The failure occurrence prediction unit 106 may calculate the failure occurrence probability for each equipment.

도 7은 제 2 정규화부(105)가 예측된 장비별 제어 메시지의 트래픽 패턴의 각 항목의 값을 장비별로 제 2 정규화하는 순서도이다. 도 7은 어느 한 장비의 트래픽 패턴의 여러 항목 중 어느 한 항목의 값을 정규화하는 순서도로서, 도 6의 PGW1의 제어 메시지1의 트래픽 패턴의 항목 중 시도 횟수를 정규화하여 제 2 정규화 데이터(V11)를 생성하는 방법이다.7 is a flowchart for second normalizing the value of each item of the traffic pattern of the predicted control message for each device by the second normalizer 105 for each device. 7 is a flow chart for normalizing the values of any of a number of entries in the traffic patterns of any item of equipment, a second normalized data by normalizing the number of attempts of the entries in the traffic pattern of the control message 1 of PGW1 of Figure 6 (V 11 ) to create a method.

도 7을 참조하면, 제 2 정규화 처리에서, 제 2 정규화부(105)는 제 2 정규화 테이블(610)의 제 2 정규화 데이터(V11)를 초기화한다(S701).Referring to FIG. 7 , in the second normalization process, the second normalization unit 105 initializes the second normalization data V 11 of the second normalization table 610 ( S701 ).

먼저, 제 2 정규화부(105)는 입력 값에 해당되는 PGW1의 제어 메시지1의 트래픽 패턴의 항목 중 시도 횟수의 값 U1~Ut 중에서 최대 값 Umax를 구한다. 최대 값 Umax를 구하는 이유는 당해 주기 동안에 발생될 트래픽 패턴의 최대 값 Umax에 의해 영향을 받는 최대의 장애 가능성을 예측하기 위함이다.First, the second normalizer 105 obtains the maximum value U max from among the values of the number of attempts U 1 to U t among the traffic pattern items of the control message 1 of the PGW1 corresponding to the input value. The reason to obtain the maximum value U max is a maximum in order to predict the possibility of failure that are affected by the maximum value U max of the traffic pattern to be generated during the period the art.

다음으로, 제 2 정규화부(105)는 최대 값 Umax 및 임계 값(T)을 비교하여 임계 값보다 작으면 초기 값 "0"을 유지한다(S703). 최대 값 Umax가 임계 값(T) 이상이고 임계 값(T)의 1.2배보다 작으면, 제 2 정규화부(105)는 제 2 정규화 데이터(V11)를 1로 할당한다(S705, S707). 또한, 최대 값 Umax가 임계 값(T)의 1.2배 이상이고 임계 값(T)의 1.5배보다 작으면 "2"를 할당하고, 임계 값(T)의 1.5배 이상이면 "3"을 할당한다(S709~S713). 그러면, PGW1의 당해 주기에 예측된 제어 메시지1의 시도 횟수는 하나의 정성 값으로 생성된다.Next, the second normalizer 105 compares the maximum value U max and the threshold value T and maintains the initial value "0" if it is less than the threshold value (S703). If the maximum value U max is equal to or greater than the threshold value T and is less than 1.2 times the threshold value T, the second normalization unit 105 assigns the second normalized data V 11 to 1 ( S705 , S707 ). . In addition, if the maximum value U max is 1.2 times or more of the threshold value T and less than 1.5 times the threshold value T, "2" is assigned, and if it is 1.5 times or more of the threshold value T, "3" is assigned (S709 to S713). Then, the number of attempts of the control message 1 predicted in the period of the PGW1 is generated as a single qualitative value.

도 8은 도 1의 통신망 장애 예측 장치가 예측된 장애 발생에 대해 장애 조치하는 개략적 구성도이다.FIG. 8 is a schematic configuration diagram in which the apparatus for predicting network failure of FIG. 1 performs a failover in response to a predicted failure.

도 8을 참조하면, 장애 발생 예측부(106)는 제 2 정규화 테이블(610)의 값을 이용하여 컨볼루션 신경망을 통해 각 망 장비(151~158)의 장애 발생 가능성을 예측한다. 컨볼루션 신경망에서 제 2 정규화 테이블(610)의 장비별 트래픽 패턴의 값은 각 장비들과 제어 메시지들 사이의 상호 관계가 고려되어 장애의 발생이 예측된다. 장애 발생 예측부(106)는 장애 발생이 예측되는 장비 정보, 장애 코드 및 장애 발생 확률(P)을 포함하는 장애 예측 정보를 생성한다.Referring to FIG. 8 , the failure occurrence prediction unit 106 predicts the failure probability of each network equipment 151 to 158 through a convolutional neural network using the value of the second normalization table 610 . In the convolutional neural network, the value of the traffic pattern for each device of the second normalization table 610 considers the correlation between each device and the control messages to predict the occurrence of a failure. The failure occurrence prediction unit 106 generates failure prediction information including the equipment information, the failure code, and the failure occurrence probability (P) in which the failure occurrence is predicted.

컨볼루션 신경망을 통해 장애 발생이 예측되면, 장애 예측 처리부(107)는 생성된 장애 코드로 도 8에 도시된 장애 지식 DB(810)를 조회하고, 조회된 장애 지식 정보를 참조하여 복구 명령의 실행과 같은 자동 복구 또는 관리자 통보와 같은 수동 복구를 사전 조치로서 실행한다.When the occurrence of a failure is predicted through the convolutional neural network, the failure prediction processing unit 107 inquires the failure knowledge DB 810 shown in FIG. 8 with the generated failure code, and executes the recovery command with reference to the inquired failure knowledge information Auto-recovery, such as , or manual recovery, such as administrator notification, is implemented as a precautionary measure.

여기서, 도 8에 도시된 장애 지식 DB(810)는 장비 종류별로 장애 코드, 자동 또는 수동 복구 여부, 자동 복구 실행 가능한 최소 확률(PMA : : Minimum Probability for Auto recovery) 및 복구 명령 등의 데이터 항목을 포함한다. 장애 예측 처리부(107)는 장애 발생 예측부(106)에서 예측된 장비 종류 및 장애 코드를 키로 하여 장애 지식 DB(810)의 정보를 조회하고, 조회된 정보에 따라 복구 처리를 실행한다. 수동 복구는 장비별 장애 발생 확률 Pi 가 PMA 미만인 경우로서 수동 조치를 위해 운용자에게 장애 내역이 통보된다. 자동 복구에 의한 복구 명령은 장비별 장애 발생 확률 Pi가 PMA 이상일 경우, 망 관리 시스템(NMS : Network Management System)으로 복구 명령이 전달되어 실행된다. 즉, 수동 복구 및 자동 복구 등의 사전 조치에 의해 예측된 장애의 발생은 미리 차단되어 실제로 장애가 발생되지 않는다.Here, the failure knowledge DB 810 shown in FIG. 8 includes data items such as failure codes, automatic or manual recovery, minimum probability of automatic recovery (P MA : Minimum Probability for Auto recovery), and recovery commands by equipment type. includes The failure prediction processing unit 107 inquires the information of the failure knowledge DB 810 using the equipment type and failure code predicted by the failure occurrence prediction unit 106 as keys, and executes recovery processing according to the inquired information. Manual recovery is a case where the failure probability P i for each equipment is less than P MA, and the failure details are notified to the operator for manual action. The recovery command by automatic recovery is executed by transmitting the recovery command to the Network Management System (NMS) when the failure probability P i for each device is greater than or equal to P MA. That is, the occurrence of a failure predicted by prior measures such as manual recovery and automatic recovery is blocked in advance, so that a failure does not actually occur.

도 9는 본 발명의 일 실시예에 따른 장애 예측 방법의 개략적 순서도이다.9 is a schematic flowchart of a failure prediction method according to an embodiment of the present invention.

도 9를 참조하면, 통신망 장애 예측 장치(100)는 각 망 장비(151~158)들 사이에서 처리되는 제어 데이터를 한 주기 t 시간 동안 망 시스템(150)으로부터 수집한다(S901).Referring to FIG. 9 , the apparatus 100 for predicting network failure collects control data processed between the respective network devices 151 to 158 from the network system 150 for one period t ( S901 ).

통신망 장애 예측 장치(100)는 수집된 제어 데이터로부터 제어 메시지를 장비별로 분류하고, 장비별로 분류된 제어 메시지의 트래픽 패턴을 구분하여 트래픽 패턴의 각 항목을 소정의 시간 단위로 정규화 처리하여 제 1 정규화 데이터를 생성한다(S902). 여기서, 트래픽 패턴은, 제어 메시지가 시도된 시도 횟수(Attempt count), 시도된 제어 메시지의 처리가 실패된 실패 횟수(Fail Count), 시도된 제어 메시지의 처리가 지연되고 있는 평균 지연 시간(Delay) 및 시도된 제어 메시지가 처리 지연되어 타임 아웃된 타임 아웃 횟수(Timeout count)의 항목을 포함하고, 각 항목은 소정의 시간 단위로 카운트된다. 시간 단위는 상기 시간 t와 같거나 작은 단위이다. 제 1 정규화 데이터는 도 3의 제 1 정규화 테이블(301)과 같은 데이터 구조로 표현될 수 있다. 제 1 정규화 테이블(301)은 제어 메시지별로 단위 시간당 트래픽 패턴의 각 항목이 발생한 횟수 X1 ~ Xt로 구성된다.The communication network failure prediction apparatus 100 classifies a control message for each device from the collected control data, classifies the traffic pattern of the control message classified for each device, and normalizes each item of the traffic pattern by a predetermined time unit to perform the first normalization process Data is generated (S902). Here, the traffic pattern is the number of attempts at which the control message is attempted (Attempt count), the number of times the attempted control message fails to be processed (Fail Count), and the average delay time at which the attempted control message is delayed (Delay) and an item of a timeout count timed out because the attempted control message is delayed in processing, and each item is counted in a predetermined time unit. The time unit is the same as or smaller than the time t. The first normalized data may be expressed in the same data structure as the first normalized table 301 of FIG. 3 . The first normalization table 301 is composed of the number of occurrences of each item of the traffic pattern per unit time for each control message X 1 to X t.

통신망 장애 예측 장치(100)는 장비별 제 1 정규화 데이터 X1~Xt를 신경망의 입력 데이터로 하여 장비별로 앞으로 발생될 제어 메시지의 트래픽 패턴을 예측한다(S903). 즉 t 주기에서 수집된 제어 메시지의 트래픽 패턴은 리커런트 신경망 처리를 통해 다음 주기 t+1~2t에서의 제어 메시지의 트래픽 패턴으로 예측된다. 예측된 제어 메시지의 트래픽 패턴 U1~Ut는 도 3의 예측 테이블(303)의 구조로 형성될 수 있다. 여기서, 통신망 장애 예측 장치(100)는 예측된 트래픽 패턴 U1~Ut 및 2t 주기에서 실제 생성된 Xt+1~X2t의 차이를 오차로 계산하고, 계산된 오차를 피드백하여 상기 리커런트 신경망의 학습 처리에 반영한다(S904). The communication network failure prediction apparatus 100 predicts a traffic pattern of a control message to be generated for each device in the future by using the first normalized data X 1 to X t for each device as input data of the neural network (S903). That is, the traffic pattern of the control message collected in period t is predicted as the traffic pattern of the control message in the next period t+1 to 2t through recurrent neural network processing. Traffic patterns U 1 to U t of the predicted control message may be formed in the structure of the prediction table 303 of FIG. 3 . Here, the communication network failure prediction apparatus 100 calculates the difference between the predicted traffic patterns U 1 to U t and X t+1 to X 2t actually generated in the period of 2t as an error, and feeds back the calculated error to the recurrent It is reflected in the learning process of the neural network (S904).

장비별로 다음 주기 t+1 ~ 2t 시간 동안의 제어 메시지의 트래픽 패턴이 예측되면, 통신망 장애 예측 장치(100)는 신뢰도를 갖는 장애 예측을 위해, 장비마다, 제어 메시지의 트래픽 데이터의 각 항목별로, 각 항목의 값 U1~Ut의 최대 값 Umax를 트래픽 패턴의 분포 범위 및 장비 특성을 고려한 임계 값 T와 비교하여 제 2 정규화 데이터 Vij를 생성한다(S905). 구체적으로, 통신망 장애 예측 장치(100)는, 임계 값 T에 3개의 가중치, 예를 들어 1, 1.2, 1.5를 부여하고, 상기 최대 값 Umax를 가중치 부여된 각각의 임계 값 T, 1.2T, 1.5T와 비교하여, 제 2 정규화 데이터 Vij를 생성한다. 제 2 정규화 처리에 의해 생성된 제 2 정규화 데이터 V11~Vij는 도 6의 제 2 정규화 테이블(610)의 구조를 형성할 수 있다. 장비마다 제어 메시지별로 트래픽 패턴의 각 항목에 대한 제 2 정규화 데이터 Vij가 생성되면, 통신망 장애 예측 장치(100)는 모든 값들(all [Vij])이 0 이면, 각 망 장비(151~158)들에서 다음 주기에 장애가 발생할 가능성이 없는 것으로 판단하여 이후의 장애 예측 과정을 중단하고 다음 주기(t+1 ~ 2t) 데이터를 수집하는 과정으로 돌아간다(S906). 이렇게 모든 Vij 가 0 인 경우에는 후속 처리 과정을 중단하고 다음 주기의 데이터 수집 단계(S901)로 넘어감으로써 시스템의 부하를 많이 줄일 수 있다. When the traffic pattern of the control message for the next period of time t+1 to 2t is predicted for each device, the communication network failure prediction apparatus 100 for each device, for each item of traffic data of the control message, for reliable failure prediction, The second normalized data V ij is generated by comparing the maximum value U max of the values U 1 to U t of each item with a threshold value T in consideration of the distribution range of the traffic pattern and the equipment characteristics ( S905 ). Specifically, the communication network failure prediction apparatus 100 gives three weights, for example, 1, 1.2, 1.5, to the threshold value T, and assigns the maximum value U max to each of the weighted threshold values T, 1.2T, Compared with 1.5T, the second normalized data V ij is generated. The second normalized data V 11 to V ij generated by the second normalization process may form the structure of the second normalization table 610 of FIG. 6 . When the second normalized data V ij for each item of the traffic pattern is generated for each control message for each device, the network failure prediction apparatus 100 sets all the values (all [V ij ]) to 0, each of the network devices 151 to 158 ), it is determined that there is no possibility of a failure occurring in the next period, so the subsequent failure prediction process is stopped and the process returns to the process of collecting data for the next period (t+1 to 2t) (S906). In this way, when all Vij is 0, the load of the system can be greatly reduced by stopping the subsequent processing and moving on to the data collection step S901 of the next cycle.

만약 Vij 중에 0 이 아닌 값이 있으면, 통신망 장애 예측 장치(100)는 제 2 정규화 데이터(Vij)를 컨볼루션 신경망으로 입력하여 다음 주기(t+1 ~ 2t)에서 장애 발생이 예측되는 장비 종류, 장애 코드 및 확률(Pi) 등의 장애 정보를 예측한다(S907).If there is a non-zero value among V ij , the communication network failure prediction apparatus 100 inputs the second normalized data V ij to the convolutional neural network, and the failure occurrence is predicted in the next period (t+1 to 2t). Prediction of failure information such as type, failure code and probability (P i ) (S907).

상기 장애 정보가 예측되지 않는 경우, 통신망 장애 예측 장치(100)는 다음 주기(t+1 ~ 2t)의 제어 데이터를 수집하는 단계(S901)로 돌아간다(S908).If the failure information is not predicted, the communication network failure prediction apparatus 100 returns to the step (S901) of collecting control data of the next period (t+1 to 2t) (S908).

상기 장애 정보가 예측될 경우, 통신망 장애 예측 장치(100)는 예측된 장애 정보를 키로 하여 장애 지식 DB(810)로부터 장애 복구 정보를 조회한다(S909). 수동 복구의 장애 복구 정보가 조회되면(S910), 통신망 장애 예측 장치(100)는 수동 복구를 위해 운용자에게 예측된 장애 정보를 통보한다(S911). 만약, 자동 복구가 조회되면, 장비별 장애 발생 확률 Pi가 최소 장애 발생 확률 PMA 미만일 경우, 수동 복구를 준비하기 위해 운용자에게 예측된 장애 정보를 통보한다(S911). Pi 가 PMA 이상이면, 통신망 장애 예측 장치(100)는 망 관리 시스템으로 자동 복구 명령을 전달한다. 이와 같이 장애 조치를 취한 후, 통신망 장애 예측 장치(100)는 다음 주기(t+1 ~ 2t)의 제어 데이터를 수집하는 단계(S901)로 돌아간다.When the failure information is predicted, the communication network failure prediction apparatus 100 inquires the failure recovery information from the failure knowledge DB 810 using the predicted failure information as a key (S909). When the failure recovery information of manual recovery is inquired ( S910 ), the communication network failure prediction apparatus 100 notifies the operator of the predicted failure information for manual recovery ( S911 ). If automatic recovery is inquired, if the failure probability P i for each device is less than the minimum failure probability P MA , the predicted failure information is notified to the operator in order to prepare for manual recovery (S911). If P i is greater than or equal to P MA , the apparatus 100 for predicting network failure transmits an automatic recovery command to the network management system. After taking the failover in this way, the communication network failure prediction apparatus 100 returns to the step (S901) of collecting control data of the next period (t+1 to 2t).

본 발명은 비록 한정된 실시예와 도면에 의해 설명되었으나, 본 발명은 이것에 의해 한정되지 않으며 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에 의해 본 발명의 기술사상과 아래에 기재될 특허청구범위의 균등범위 내에서 다양한 수정 및 변형이 가능함은 물론이다.Although the present invention has been described with reference to limited embodiments and drawings, the present invention is not limited thereto, and the technical idea of the present invention and claims to be described below by those skilled in the art to which the present invention pertains Of course, various modifications and variations are possible within the equivalent range of the range.

100 : 시스템 101 : 수집부
102 : 제 1 정규화부 103 : 트래픽 패턴 예측부
105 : 제 2 정규화부 106 : 장애 발생 예측부
107 : 장애 예측 결과 처리부 150 : 망 시스템
100: system 101: collection unit
102: first normalization unit 103: traffic pattern prediction unit
105: second normalization unit 106: failure occurrence prediction unit
107: failure prediction result processing unit 150: network system

Claims (22)

신경망 기반의 통신망 장애 예측 장치에 있어서,
상기 통신망의 제어 데이터를 일정한 주기로 수집하는 수집 모듈;
주기별로 수집된 상기 제어 데이터에서 제어 메시지들을 분류하고 각 제어 메시지의 트래픽 패턴을 소정의 시간 단위로 정규화한 제 1 정규화 데이터를 생성하는 제 1 정규화 모듈;
상기 제 1 정규화 데이터를 기초로 신경망을 통해 상기 각 제어 메시지의 다음 주기의 트래픽 패턴을 예측하는 트래픽 패턴 예측 모듈;
각 제어 메시지의 예측된 다음 주기의 트래픽 패턴을 구성하는 각 항목의 값을 임계 값과 비교하여 정규화한 제 2 정규화 데이터를 생성하는 제 2 정규화 모듈; 및
상기 제 2 정규화 데이터를 기초로 신경망을 통해 상기 통신망의 장애 발생 가능성을 예측하는 장애 발생 예측 모듈을 포함하고,
상기 임계 값은, 상기 각 항목의 값의 분포를 고려하여 상기 각 항목 별로 결정되는 통신망 장애 예측 장치.
In the neural network-based communication network failure prediction device,
a collection module for collecting control data of the communication network at regular intervals;
a first normalization module for classifying control messages from the control data collected for each period and generating first normalized data obtained by normalizing a traffic pattern of each control message to a predetermined time unit;
a traffic pattern prediction module for predicting a traffic pattern of a next period of each control message through a neural network based on the first normalized data;
a second normalization module for generating second normalized data normalized by comparing the value of each item constituting the predicted next cycle traffic pattern of each control message with a threshold value; and
and a failure prediction module for predicting the probability of occurrence of a failure of the communication network through a neural network based on the second normalized data,
The threshold value is determined for each item in consideration of the distribution of the values of each item.
제 1 항에 있어서,
상기 제 1 정규화 모듈은,
소정의 시간 단위마다, 상기 트래픽 패턴을 구성하는 각 항목별로 발생 횟수를 카운트하여 정규화하는 것을 특징으로 하는 통신망 장애 예측 장치.
The method of claim 1,
The first normalization module,
A communication network failure prediction apparatus, characterized in that for each predetermined time unit, the number of occurrences for each item constituting the traffic pattern is counted and normalized.
제 1 항에 있어서,
상기 제 2 정규화 모듈은,
각 제어 메시지의 예측된 트래픽 패턴을 구성하는 각 항목별로, 최대 값과 상기 임계 값을 비교하여 정규화하는 것을 특징으로 하는 통신망 장애 예측 장치.
The method of claim 1,
The second normalization module,
Network failure prediction apparatus, characterized in that for each item constituting the predicted traffic pattern of each control message, the maximum value and the threshold value are compared and normalized.
제 3 항에 있어서,
상기 제 2 정규화 모듈은,
상기 임계 값에 가중치를 달리 적용하며 상기 최대 값과 비교하여 상기 각 항목의 값을 정규화하는 것을 특징으로 하는 통신망 장애 예측 장치.
4. The method of claim 3,
The second normalization module,
The apparatus for predicting network failure, characterized in that different weights are applied to the threshold value and the value of each item is normalized by comparing it with the maximum value.
제 4 항에 있어서,
상기 제 2 정규화 모듈은,
상기 각 항목의 값을, 상기 가중치의 개수에 1을 더한 수에 대응하는 종류의 값 중 하나로 결정하는 것을 특징으로 하는 통신망 장애 예측 장치.
5. The method of claim 4,
The second normalization module,
The apparatus for predicting network failure, characterized in that the value of each item is determined as one of values corresponding to a number obtained by adding 1 to the number of weights.
제 4 항에 있어서,
상기 제 2 정규화 모듈은,
상기 통신망 내의 장비별로 제어 메시지들을 분류하고, 분류된 각 제어 메시지의 예측된 트래픽 패턴을 구성하는 각 항목의 값을 정규화하는 것을 특징으로 하는 통신망 장애 예측 장치.
5. The method of claim 4,
The second normalization module,
The apparatus for predicting network failure, characterized in that the control messages are classified for each device in the communication network, and values of each item constituting the predicted traffic pattern of each classified control message are normalized.
제 6 항에 있어서,
상기 제 2 정규화 모듈은,
각 장비의 트래픽 패턴의 값에 비례하는 상기 임계 값을 적용하는 것을 특징으로 하는 통신망 장애 예측 장치.
7. The method of claim 6,
The second normalization module,
Network failure prediction apparatus, characterized in that applying the threshold value proportional to the value of the traffic pattern of each device.
제 6 항에 있어서,
상기 장애 발생 예측 모듈은,
장비별로 장애 발생 가능성을 예측하는 것을 특징으로 하는 통신망 장애 예측 장치.
7. The method of claim 6,
The failure occurrence prediction module,
A communication network failure prediction device, characterized in that predicting the possibility of failure by equipment.
제 8 항에 있어서,
상기 장애 발생 예측 모듈은,
장애 발생 가능성이 있는 장비의 장애 발생 확률을 계산하는 것을 특징으로 하는 통신망 장애 예측 장치.
9. The method of claim 8,
The failure occurrence prediction module,
Communication network failure prediction device, characterized in that for calculating the failure occurrence probability of the equipment with the possibility of failure.
제 1 항에 있어서,
상기 장애 발생 예측 모듈에서 예측된 장애의 복구 가능성을 장애 지식 데이터베이스에 쿼리하여 판단하고, 판단 결과에 따라 운용자 통보 또는 자동 복구의 장애 조치를 처리하는 장애 예측 결과 처리 모듈을 더 포함하는 것을 특징으로 하는 통신망 장애 예측 장치.
The method of claim 1,
The failure prediction result processing module further comprises a failure prediction result processing module for determining the recovery possibility of the failure predicted by the failure occurrence prediction module by querying the failure knowledge database, and processing the failure action of the operator notification or automatic recovery according to the determination result Network failure prediction device.
제 1 항에 있어서,
상기 트래픽 패턴 예측 모듈은,
리커런트(Recurrent) 신경망을 기반으로 하고,
상기 장애 발생 예측 모듈은,
컨벌루션(Convolution) 신경망을 기반으로 하는 것을 특징으로 하는 통신망 장애 예측 장치.
The method of claim 1,
The traffic pattern prediction module,
Based on the recurrent neural network,
The failure occurrence prediction module,
A communication network failure prediction device, characterized in that based on a convolutional neural network.
신경망 기반의 통신망 장애 예측 장치가 실행하는 통신망 장애 예측 방법에 있어서,
상기 통신망의 제어 데이터를 일정한 주기로 수집하는 단계;
주기별로 수집된 상기 제어 데이터에서 제어 메시지들을 분류하고 각 제어 메시지의 트래픽 패턴을 소정의 시간 단위로 정규화한 제 1 정규화 데이터를 생성하는 단계;
상기 제 1 정규화 데이터를 기초로 신경망을 통해 상기 각 제어 메시지의 다음 주기의 트래픽 패턴을 예측하는 단계;
각 제어 메시지의 예측된 다음 주기의 트래픽 패턴을 구성하는 각 항목의 값을 임계 값과 비교하여 정규화한 제 2 정규화 데이터를 생성하는 단계; 및
상기 제 2 정규화 데이터를 기초로 신경망을 통해 상기 통신망의 장애 발생 가능성을 예측하는 단계를 포함하고,
상기 임계 값은, 상기 각 항목의 값의 분포를 고려하여 상기 각 항목 별로 결정되는 통신망 장애 예측 방법.
In the communication network failure prediction method executed by the neural network-based communication network failure prediction apparatus,
collecting control data of the communication network at regular intervals;
classifying control messages from the control data collected for each period and generating first normalized data obtained by normalizing a traffic pattern of each control message to a predetermined time unit;
predicting a traffic pattern of a next period of each control message through a neural network based on the first normalized data;
generating second normalized data normalized by comparing the value of each item constituting the predicted next cycle traffic pattern of each control message with a threshold value; and
Predicting the probability of occurrence of a failure of the communication network through a neural network based on the second normalized data,
The threshold value is a communication network failure prediction method that is determined for each item in consideration of a distribution of values of the respective items.
제 12 항에 있어서,
상기 제 1 정규화 데이터를 생성하는 단계는,
소정의 시간 단위마다, 상기 트래픽 패턴을 구성하는 각 항목별로 발생 횟수를 카운트하여 정규화하는 단계인 것을 특징으로 하는 통신망 장애 예측 방법.
13. The method of claim 12,
The step of generating the first normalized data comprises:
The method for predicting network failure, characterized in that the counting and normalizing the number of occurrences for each item constituting the traffic pattern for each predetermined time unit.
제 12 항에 있어서,
상기 제 2 정규화 데이터를 생성하는 단계는,
각 제어 메시지의 예측된 트래픽 패턴을 구성하는 각 항목별로, 최대 값과 상기 임계 값을 비교하여 정규화하는 단계인 것을 특징으로 하는 통신망 장애 예측 방법.
13. The method of claim 12,
The step of generating the second normalized data comprises:
The method for predicting a network failure, characterized in that for each item constituting the predicted traffic pattern of each control message, comparing and normalizing the maximum value with the threshold value.
제 14 항에 있어서,
상기 제 2 정규화 데이터를 생성하는 단계는,
상기 임계 값에 가중치를 달리 적용하며 상기 최대 값과 비교하여 상기 각 항목의 값을 정규화하는 단계인 것을 특징으로 하는 통신망 장애 예측 방법.
15. The method of claim 14,
The step of generating the second normalized data comprises:
and applying a different weight to the threshold value and normalizing the value of each item by comparing it with the maximum value.
제 15 항에 있어서,
상기 제 2 정규화 데이터를 생성하는 단계는,
상기 각 항목의 값을, 상기 가중치의 개수에 1을 더한 수에 대응하는 종류의 값 중 하나로 결정하는 단계인 것을 특징으로 하는 통신망 장애 예측 방법.
16. The method of claim 15,
The step of generating the second normalized data comprises:
and determining the value of each item as one of values corresponding to a number obtained by adding 1 to the number of weights.
제 15 항에 있어서,
상기 제 2 정규화 데이터를 생성하는 단계는,
상기 통신망 내의 장비별로 제어 메시지들을 분류하고, 분류된 각 제어 메시지의 예측된 트래픽 패턴을 구성하는 각 항목의 값을 정규화하는 단계인 것을 특징으로 하는 통신망 장애 예측 방법.
16. The method of claim 15,
The step of generating the second normalized data comprises:
Classifying control messages for each device in the communication network, and normalizing the values of each item constituting the predicted traffic pattern of each classified control message.
제 17 항에 있어서,
상기 제 2 정규화 데이터를 생성하는 단계는,
각 장비의 트래픽 패턴의 값에 비례하는 상기 임계 값을 적용하는 단계인 것을 특징으로 하는 통신망 장애 예측 방법.
18. The method of claim 17,
The step of generating the second normalized data comprises:
A method for predicting network failure, characterized in that applying the threshold value proportional to the value of the traffic pattern of each device.
제 17 항에 있어서,
상기 장애 발생 가능성을 예측하는 단계는,
장비별로 장애 발생 가능성을 예측하는 것을 특징으로 하는 통신망 장애 예측 방법.
18. The method of claim 17,
The step of predicting the probability of occurrence of the failure,
A communication network failure prediction method, characterized in that predicting the probability of failure by equipment.
제 19 항에 있어서,
상기 장애 발생 가능성을 예측하는 단계는,
장애 발생 가능성이 있는 장비의 장애 발생 확률을 계산하는 것을 특징으로 하는 통신망 장애 예측 방법.
20. The method of claim 19,
The step of predicting the probability of occurrence of the failure,
Network failure prediction method, characterized in that calculating the failure probability of the equipment with the possibility of failure.
제 12 항에 있어서,
상기 장애 발생 가능성을 예측하는 단계 이후에,
예측된 장애의 복구 가능성을 장애 지식 데이터베이스에 쿼리하여 판단하고, 판단 결과에 따라 운용자 통보 또는 자동 복구의 장애 조치를 처리하는 단계를 더 포함하는 것을 특징으로 하는 통신망 장애 예측 방법.
13. The method of claim 12,
After predicting the probability of occurrence of the failure,
The method for predicting a network failure, further comprising: querying the failure knowledge database to determine the recovery possibility of the predicted failure, and processing an operator notification or automatic recovery failover according to the determination result.
제 12 항에 있어서,
상기 트래픽 패턴을 예측하는 단계는,
리커런트(Recurrent) 신경망을 기반으로 하고,
상기 장애 발생 가능성을 예측하는 단계는,
컨벌루션(Convolution) 신경망을 기반으로 하는 것을 특징으로 하는 통신망 장애 예측 방법.
13. The method of claim 12,
Predicting the traffic pattern comprises:
Based on the recurrent neural network,
The step of predicting the probability of occurrence of the failure,
A communication network failure prediction method, characterized in that based on a convolutional neural network.
KR1020170066221A 2017-05-29 2017-05-29 Apparatus for predicting failure of communication network and method thereof KR102291615B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020170066221A KR102291615B1 (en) 2017-05-29 2017-05-29 Apparatus for predicting failure of communication network and method thereof

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020170066221A KR102291615B1 (en) 2017-05-29 2017-05-29 Apparatus for predicting failure of communication network and method thereof

Publications (2)

Publication Number Publication Date
KR20180130295A KR20180130295A (en) 2018-12-07
KR102291615B1 true KR102291615B1 (en) 2021-08-18

Family

ID=64669380

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020170066221A KR102291615B1 (en) 2017-05-29 2017-05-29 Apparatus for predicting failure of communication network and method thereof

Country Status (1)

Country Link
KR (1) KR102291615B1 (en)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110031227A (en) * 2019-05-23 2019-07-19 桂林电子科技大学 A kind of Rolling Bearing Status diagnostic method based on binary channels convolutional neural networks
KR102289980B1 (en) * 2019-12-31 2021-08-13 순천향대학교 산학협력단 A method for multicast uplink data transmission in LPWA network
US11743237B2 (en) 2020-11-10 2023-08-29 Accenture Global Solutions Limited Utilizing machine learning models to determine customer care actions for telecommunications network providers
KR102391510B1 (en) * 2021-11-15 2022-04-27 (주)테온 Method, device and system for predicting failure in advance of it infrastructure equipment based on artificial intelligence

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009086896A (en) * 2007-09-28 2009-04-23 Toshiba Corp Failure prediction system and failure prediction method for computer
JP2010141655A (en) * 2008-12-12 2010-06-24 Yokogawa Electric Corp Network monitoring device

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100439674B1 (en) 2001-09-27 2004-07-12 (주) 엘지텔레콤 Apparatus and method for failure prediction of radio port using neural network
KR102305584B1 (en) * 2015-01-19 2021-09-27 삼성전자주식회사 Method and apparatus for training language model, method and apparatus for recognizing language

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009086896A (en) * 2007-09-28 2009-04-23 Toshiba Corp Failure prediction system and failure prediction method for computer
JP2010141655A (en) * 2008-12-12 2010-06-24 Yokogawa Electric Corp Network monitoring device

Also Published As

Publication number Publication date
KR20180130295A (en) 2018-12-07

Similar Documents

Publication Publication Date Title
US11985025B2 (en) Network system fault resolution via a machine learning model
KR102291615B1 (en) Apparatus for predicting failure of communication network and method thereof
US20180198812A1 (en) Context-Based Detection of Anomalous Behavior in Network Traffic Patterns
CN110166462B (en) Access control method, system, electronic device and computer storage medium
KR102626273B1 (en) Network abnormality detection
US20220172076A1 (en) Prediction of network events via rule set representations of machine learning models
US20190036795A1 (en) Method and system for proactive anomaly detection in devices and networks
US9491186B2 (en) Method and apparatus for providing hierarchical pattern recognition of communication network data
US20220279053A1 (en) Self-learning connected-device network
US11838311B2 (en) Systems and methods for automated quantitative risk and threat calculation and remediation
WO2017140710A1 (en) Detection of malware in communications
CN111315026B (en) Channel selection method, device, gateway and computer readable storage medium
KR102333866B1 (en) Method and Apparatus for Checking Problem in Mobile Communication Network
Zhang et al. A distributed network qoe measurement framework for smart networks in smart cities
CN117972478A (en) Intelligent recognition method and device for abnormal behaviors of terminal of Internet of things
CN116017404B (en) Network element driving method and device for private park network, electronic equipment and storage medium
CN116743606A (en) Abnormal flow monitoring method, device, equipment and storage medium
US20230351245A1 (en) Federated learning
CN112738808B (en) DDoS attack detection method in wireless network, cloud server and mobile terminal
US11568313B2 (en) Control apparatus, analysis apparatus, communication system, data processing method, data transmission method, and non-transitory computer readable medium
CN105307212A (en) Processing method for traffic data of base station and base station
US12108263B2 (en) Systems and methods for providing network failure and cause code handling in 5G networks
EP4391472A1 (en) Method for training a machine learning model
CN113852513B (en) Network capacity prediction method and device
US20240121678A1 (en) Distributed machine learning solution for rogue base station detection

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant