KR102393839B1 - 통신 네트워크 장비의 장애 관리 시스템 및 방법 - Google Patents

통신 네트워크 장비의 장애 관리 시스템 및 방법 Download PDF

Info

Publication number
KR102393839B1
KR102393839B1 KR1020200121608A KR20200121608A KR102393839B1 KR 102393839 B1 KR102393839 B1 KR 102393839B1 KR 1020200121608 A KR1020200121608 A KR 1020200121608A KR 20200121608 A KR20200121608 A KR 20200121608A KR 102393839 B1 KR102393839 B1 KR 102393839B1
Authority
KR
South Korea
Prior art keywords
equipment
alarm
communication network
alarms
alarm data
Prior art date
Application number
KR1020200121608A
Other languages
English (en)
Other versions
KR20220039033A (ko
Inventor
박준영
김수현
Original Assignee
주식회사 엘지유플러스
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 엘지유플러스 filed Critical 주식회사 엘지유플러스
Priority to KR1020200121608A priority Critical patent/KR102393839B1/ko
Publication of KR20220039033A publication Critical patent/KR20220039033A/ko
Application granted granted Critical
Publication of KR102393839B1 publication Critical patent/KR102393839B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0604Management of faults, events, alarms or notifications using filtering, e.g. reduction of information by using priority, element types, position or time
    • H04L41/0627Management of faults, events, alarms or notifications using filtering, e.g. reduction of information by using priority, element types, position or time by acting on the notification or alarm source
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • H04L41/065Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis involving logical or physical relationship, e.g. grouping and hierarchies
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/06Generation of reports

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

본 발명은 통신 네트워크 장비의 장애 관리 시스템 및 방법에 관한 것으로서, 본 발명의 통신 네트워크 장비의 장애 관리 방법은, 통신 네트워크를 구성하는 복수의 장비들로부터 장비명, 알람명 및 알람시간을 포함하는 장비 알람 데이터를 수신하는 단계; 상기 장비 알람 데이터를 기 설정된 기준에 따라 분류하는 단계; 분류된 장비 알람 데이터 중 반복적으로 발생하는 장비 알람을 클러스터링하는 단계; 및 상기 클러스터링 결과에 따라 장비 알람 패턴을 추출하여 장비 장애를 판단하는 단계;를 포함한다. 이에 의해, 통신 네트워크에서 발생하는 장비 알람 데이터들을 누적하여 반복적인 패턴으로 발생하는 장비 알람을 분석할 수 있다.

Description

통신 네트워크 장비의 장애 관리 시스템 및 방법{SYSTEM AND METHOD FOR COMMUNICATION NETWORK EQUIPMENT FAULT MANAGEMENT}
본 발명은 통신 네트워크 장비의 장애 관리 시스템 및 방법에 관한 것으로서, 보다 상세하게는, 통신 네트워크에서 발생하는 장비 알람 데이터들을 누적하여 반복적인 패턴으로 발생하는 장비 알람을 분석할 수 있는 통신 네트워크 장애 관리 시스템 및 그 방법에 관한 것이다.
통신 네트워크를 구성하는 장비들은 장애가 발생하면 정해진 규칙에 따라 알람을 생성한다. 통신 네트워크의 장비 알람은 장비의 고장으로 발생할 수도 있지만, 일시적인 통신환경의 변화로 인해 발생하기도 한다. 환경적 요인으로 인해 발생한 알람은 해당 요인이 제거되면 다시 복원되어 알람이 해제된다. 통신 네트워크의 관리 시스템은 장비들의 알람 정보를 수집하여 관리한다. 관리자는 알람 정보의 종류 및 유형을 분석하여 장애 원인을 파악한 후 원인에 대응하는 조치를 취하게 된다. 이러한, 종래기술에 따르면, 관리자는 실시간 장비 알람의 성격을 통해서만 문제를 인지하기 때문에, 과거에 알람이 발생한 후 복원된 상태라면 문제를 인지하기 어렵다.
그런데, 장비의 알람이 자동복구 되었지만, 특정 시간에만 알람이 발생하거나 단시간에 장애 발생과 복원이 반복적으로 발생한 경우 해당 장비에는 이상이 있을 가능성이 높다. 이와 같이, 과거 특정 시간에 발생하거나 반복적인 패턴으로 발생하는 알람에 대해서는 관리자가 인지할 수 없기 때문에 장비의 성능 저하에 적절히 대처하기 어렵다는 문제점이 있다.
상술한 배경기술의 문제점을 해결하기 위한 본 발명은 통신 네트워크에서 발생하는 장비 알람 데이터들을 누적하여 반복적인 패턴으로 발생하는 장비 알람을 분석할 수 있는 통신 네트워크 장비의 장애 관리 시스템 및 방법을 제공하는 것을 목적으로 한다.
특히, 본 발명은 동일알람이 동일장비에서 반복적으로 발생하거나, 동일알람이 여러장비에서 반복적으로 발생하는 반복 발생하는 패턴을 추출하여 장비의 장애를 검출할 수 있는 통신 네트워크 장비의 장애 관리 시스템 및 방법을 제공하는 것을 목적으로 한다.
본 발명에서 이루고자 하는 기술적 과제들은 이상에서 언급한 기술적 과제들로 제한되지 않으며, 언급하지 않은 또 다른 기술적 과제들은 아래의 기재로부터 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 명확하게 이해될 수 있을 것이다.
상기와 같은 기술적 과제를 해결하기 위하여, 본 발명의 일 실시예에 따른 통신 네트워크 장비의 장애 관리 방법은, 통신 네트워크를 구성하는 복수의 장비들로부터 장비명, 알람명 및 알람시간을 포함하는 장비 알람 데이터를 수신하는 단계; 상기 장비 알람 데이터를 기 설정된 기준에 따라 분류하는 단계; 분류된 장비 알람 데이터 중 반복적으로 발생하는 장비 알람을 클러스터링하는 단계; 및 상기 클러스터링 결과에 따라 장비 알람 패턴을 추출하여 장비 장애를 판단하는 단계;를 포함할 수 있다.
예를 들어, 상기 장비 알람 데이터를 기 설정된 기준에 따라 분류하는 단계는, 동일한 장비에 대해 발생한 동일한 알람들을 분류하는 단계를 포함할 수 있다.
예를 들어, 상기 장비 알람을 클러스터링하는 단계는, 상기 분류된 장비 알람들을 시계열적으로 정렬하는 단계; 및 일정 시간 내에 반복 발생한 장비 알람을 그룹핑하는 단계를 포함할 수 있다.
예를 들어, 상기 장비 알람을 클러스터링하는 단계는, 시계열적으로 정렬된 상기 장비 알람이 일정 시간 내에 적어도 두 번 이상 발생하였는지 판단하는 단계; 및 적어도 두 번 이상 발생한 장비 알람들을 제1 그룹으로 정의하고, 한번 발생한 장비 알람은 제2 그룹으로 정의하여 클러스터링하는 단계를 포함할 수 있다.
예를 들어, 상기 클러스터링 결과에 따라 장비 알람 패턴을 추출하여 장비 장애를 판단하는 단계는, 상기 제1 그룹과 상기 제2 그룹의 발생 횟수 및 발생 비율 중 적어도 어느 하나에 기초하여 상기 장비 알람 패턴을 추출하는 단계; 및 상기 장비 알람 데이터에 포함된 알람명과 상기 장비 알람 패턴이 발생한 시간에 기초하여 해당 장비의 장애 데이터를 출력하는 단계를 포함할 수 있다.
예를 들어, 상기 장비 알람 데이터를 기 설정된 기준에 따라 분류하는 단계는, 동일한 알람이 발생한 장비 알람 데이터를 추출하는 단계; 추출된 장비 알람 데이터를 해당 장비가 접속된 상위 장비의 이름에 따라 분류하는 단계를 포함할 수 있다.
예를 들어, 상기 장비 알람을 클러스터링하는 단계는, 상기 장비 알람 데이터가 발생한 하위 장비들 간 거리가 기준거리 이내인 장비 알람 데이터를 그룹핑하는 단계를 포함할 수 있다.
예를 들어, 상기 클러스터링 결과에 따라 장비 알람 패턴을 추출하여 장비 장애를 판단하는 단계는, 추출된 장비 알람 데이터가 일정 시간 내에 기준 횟수 이상 발생하였거나, 일정 영역 내에 기준 개수 이상 발생한 경우 해당 장비 알람 데이터를 장비 알람 패턴으로 추출하는 단계를 포함할 수 있다.
예를 들어, 상기 클러스터링 결과에 따라 장비 알람 패턴을 추출하여 장비 장애를 판단하는 단계는, 상기 장비 알람 데이터가 발생한 하위 장비가 접속된 상위 장비의 장애 데이터를 출력하는 단계를 포함할 수 있다.
예를 들어, 상기 장비 알람 데이터를 기 설정된 기준에 따라 분류하는 단계는, 동일한 장비에 대해 발생한 장비 알람들을 분류하는 단계를 포함할 수 있다.
예를 들어, 상기 장비 알람을 클러스터링하는 단계는, 상기 분류된 장비 알람들을 시계열적으로 정렬하는 단계; 및 일정 시간 내에 반복 발생한 장비 알람을 그룹핑하는 단계를 포함할 수 있다.
예를 들어, 상기 클러스터링 결과에 따라 장비 알람 패턴을 추출하여 장비 장애를 판단하는 단계는, 상기 그룹핑된 개수에 기초하여 상기 장비 알람 패턴을 추출하는 단계; 및 상기 장비 알람 데이터에 포함된 알람명과 상기 장비 알람 패턴이 발생한 시간에 기초하여 해당 장비의 장애 데이터를 출력하는 단계를 포함할 수 있다.
또한, 본 발명의 일 실시예에 따른 통신 네트워크 장비의 장애 관리 시스템은, 통신 네트워크를 구성하는 복수의 장비들로부터 장비명, 알람명 및 알람시간을 포함하는 장비 알람 데이터를 수신하는 데이터 수신부; 상기 장비 알람 데이터를 기 설정된 기준에 따라 분류하여 상기 장비 알람 데이터가 반복적으로 발생하는 장비 알람을 클러스터링하는 클러스터링부; 및 상기 클러스터링 결과에 따라 장비 알람 패턴을 추출하여 장비 장애를 판단하는 패턴 검출부;를 포함할 수 있다.
예를 들어, 상기 클러스터링부는, 동일한 장비에 대해 발생한 동일한 알람들을 분류할 수 있다.
예를 들어, 상기 클러스터링부는, 상기 분류된 장비 알람들을 시계열적으로 정렬하고, 일정 시간 내에 반복 발생한 장비 알람을 그룹핑할 수 있다.
예를 들어, 상기 클러스터링부는, 시계열적으로 정렬된 상기 장비 알람이 일정 시간 내에 적어도 두 번 이상 발생하였는지 판단하여, 적어도 두 번 이상 발생한 장비 알람들을 제1 그룹으로 정의하고, 한번 발생한 장비 알람은 제2 그룹으로 정의하여 클러스터링할 수 있다.
예를 들어, 상기 패턴 검출부는, 상기 제1 그룹과 상기 제2 그룹의 발생 횟수 및 발생 비율 중 적어도 어느 하나에 기초하여 상기 장비 알람 패턴을 추출하고, 상기 장비 알람 데이터에 포함된 알람명과 상기 장비 알람 패턴이 발생한 시간에 기초하여 해당 장비의 장애 데이터를 출력할 수 있다.
예를 들어, 상기 클러스터링부는, 동일한 알람이 발생한 장비 알람 데이터를 추출하고, 추출된 장비 알람 데이터를 해당 장비가 접속된 상위 장비의 이름에 따라 분류할 수 있다.
예를 들어, 상기 클러스터링부는, 상기 장비 알람 데이터가 발생한 하위 장비들 간 거리가 기준거리 이내인 장비 알람 데이터를 그룹핑할 수 있다.
예를 들어, 상기 패턴 검출부는, 추출된 장비 알람 데이터가 일정 시간 내에 기준 횟수 이상 발생하였거나, 일정 영역 내에 기준 개수 이상 발생한 경우 해당 장비 알람 데이터를 장비 알람 패턴으로 추출할 수 있다.
예를 들어, 상기 패턴 검출부는, 상기 장비 알람 데이터가 발생한 하위 장비가 접속된 상위 장비의 장애 데이터를 출력할 수 있다.
예를 들어, 상기 클러스터링부는, 동일한 장비에 대해 발생한 장비 알람들을 분류할 수 있다.
예를 들어, 상기 클러스터링부는, 상기 분류된 장비 알람들을 시계열적으로 정렬하고, 일정 시간 내에 반복 발생한 장비 알람을 그룹핑할 수 있다.
예를 들어, 상기 패턴 검출부는, 상기 그룹핑된 개수에 기초하여 상기 장비 알람 패턴을 추출하고, 상기 장비 알람 데이터에 포함된 알람명과 상기 장비 알람 패턴이 발생한 시간에 기초하여 해당 장비의 장애 데이터를 출력할 수 있다.
상기와 같이 구성되는 본 발명의 적어도 하나의 실시예에 관련된 통신 네트워크 장비의 장애 관리 시스템 및 방법은, 통신 네트워크에서 발생하는 장비 알람 데이터들을 누적하여 반복적인 패턴으로 발생하는 장비 알람을 분석할 수 있다.
특히, 동일알람이 동일장비에서 반복적으로 발생하거나, 동일알람이 여러장비에서 반복적으로 발생하는 반복 발생하는 패턴을 추출하여 장비의 장애를 검출할 수 있다.
본 발명에서 이루고자 하는 기술적 과제들은 이상에서 언급한 기술적 과제들로 제한되지 않으며, 언급하지 않은 또 다른 기술적 과제들은 아래의 기재로부터 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 명확하게 이해될 수 있을 것이다.
도 1은 본 발명의 일 실시예에 따른 통신 네트워크 장비의 장애 관리 시스템의 제어 블럭도이다.
도 2는 본 발명의 일 실시예에 따른 통신 네트워크 장비의 장애 관리방법을 설명하기 위한 흐름도이다.
도 3은 본 발명의 실시예들이 적용될 수 있는 통신 네트워크의 구성도이다.
도 4는 본 발명의 제1 실시예에 따른 통신 네트워크 장비의 장애 관리 방법의 흐름도이다.
도 5는 도 4의 실시예에서 따른 장비 알람 데이터를 클러스터링 방법을 설명하기 위한 도면이다.
도 6은 본 발명의 제2 실시예에 따른 통신 네트워크 장비의 장애 관리 방법의 흐름도이다.
도 7은 본 발명의 제3 실시예에 따른 통신 네트워크 장비의 장애 관리 방법의 흐름도이다.
아래에서는 첨부한 도면을 참고로 하여 본 발명의 실시 예에 대하여 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 상세히 설명한다. 그러나 본 발명은 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시 예에 한정되지 않는다. 그리고 도면에서 본 발명을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호를 붙였다.
명세서 전체에서, 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성 요소를 더 포함할 수 있는 것을 의미한다. 또한, 명세서 전체에 걸쳐서 동일한 참조번호로 표시된 부분들은 동일한 구성요소들을 의미한다.
도 1은 본 발명의 일 실시예에 따른 통신 네트워크 장비의 장애 관리 시스템의 제어 블럭도이다.
도 1을 참조하면, 통신 네트워크 장비의 장애 관리 시스템은, 데이터 수신부(110), 클러스터링부(120), 패턴 검출부(130) 및 리포팅부(140)를 포함할 수 있다.
데이터 수신부(110)는 통신 네트워크를 구성하는 복수의 장비들로부터 장비명, 알람명 및 알람시간을 포함하는 장비 알람 데이터를 수신한다.
클러스터링부(120)는 데이터 수신부(110)로 수신된 장비 알람 데이터들에서 반복적으로 발생하는 장비 알람을 그룹핑할 수 있다. 클러스터링부(120)는 기 설정된 기준에 따라 장비 알람 데이터들을 분류한 후 특정 시간 내의 알람 횟수에 따라 장비 알람 데이터를 그룹핑하거나, 알람을 발생한 장비들 간 거리에 따라 장비 알람 데이터를 그룹핑할 수 있으며, 이러한 클러스터링부(120)의 데이터 클러스터링 기준은 검출하고자 하는 장애의 종류에 따라 다양하게 변형될 수 있다.
동일한 장비에서 동일한 알람이 반복적으로 발생하는 케이스를 검출하는 경우 클러스터링부(120)는 특정 기간 동안의 동일한 장비에서 동일한 알람들을 분류한다. 클러스터링부(120)는 동일한 장비의 동일한 알람들을 시계열적으로 정렬한 후, 일정 시간 내에 반복 발생한 장비 알람을 그룹핑한다. 알람을 그룹핑할 시 그룹의 종류는 알람 횟수에 따라 2개 이상의 그룹으로 설정될 수 있다. 예컨대, 1시간 이내에 적어도 두 번 이상 발생한 장비 알람들을 제1 그룹으로 정의하고, 1시간 이내에 한번 발생한 장비 알람은 제2 그룹으로 정의하여 클러스터링하는 것이 가능하다.
여러 장비에서 동일한 알람이 반복적으로 발생하는 케이스를 검출하는 경우 클러스터링부(120)는 특정 기간 동안 여러 장비에서 발생한 동일한 알람들을 분류한다. 여러 장비에서 동일한 알람이 반복적으로 발생하는 케이스의 경우 해당 장비들이 연결된 상위 장비에 이상이 있을 가능성이 있다. 따라서, 여러 장비에서 발생한 동일한 알람 데이터를 해당 장비가 접속된 상위 장비의 이름에 따라 분류한다. 클러스터링부(120)는 장비 알람 데이터가 발생한 하위 장비들 간 거리가 기준거리 이내인 장비 알람 데이터를 그룹핑할 수 있다.
동일 장비에서 여러 알람이 반복적으로 발생하는 케이스를 검출하는 경우 클러스터링부(120)는 특정 기간 동안의 동일한 장비에서 여러 알람들을 분류한다. 클러스터링부(120)는 동일한 장비의 여러 알람들을 시계열적으로 정렬한 후, 일정 시간 내에 반복 발생한 장비 알람을 그룹핑할 수 있다.
패턴 검출부(130)는 클러스터링부(120)의 그룹핑 결과를 분석하여 그룹핑 결과에 따라 장비의 장애 발생 여부를 판단할 수 있다.
동일한 장비에서 동일한 알람이 반복적으로 발생하는 케이스를 검출하는 경우 패턴 검출부(130)는 알람이 반복된 그룹의 개수, 전체 알람 개수 대비 알람이 반복된 그룹의 비율 등을 산출하여 해당 장비의 이상 여부를 판단할 수 있다. 패턴 검출부(130)는 그룹의 개수가 기준 이상 카운트 되었거나, 전체 알람 대비 그룹의 발생 비율이 기준 이상인 경우, 해당 장비에 장애가 있는 것으로 판단할 수 있다.
여러 장비에서 동일한 알람이 반복적으로 발생하는 케이스를 검출하는 경우 패턴 검출부(130)는 하위 장비들 간 거리가 기준거리 이내인 장비 알람 데이터의 그룹이 특정 기간 이상 지속되었는지를 확인하여 장비의 이상 여부를 판단할 수 있다. 또한, 패턴 검출부(130)는 군집 내 국소 2개 이상의 그룹이 검출된 경우 해당 장비에 이상이 있는 것으로 판단할 수 있다.
동일 장비에서 여러 알람이 반복적으로 발생하는 케이스를 검출하는 경우 패턴 검출부(130)는 그룹의 개수가 기준 이상 카운트 되었거나, 전체 알람 대비 그룹의 발생 비율이 기준 이상인 경우, 해당 장비에 장애가 있는 것으로 판단할 수 있다.
리포팅부(140)는 패턴 검출부(130)의 장비 장애 판단 결과를 보고한다. 리포팅부(140)는 GUI(Graphic User Interface), 혹은 텍스트 등의 형태로 관리자에게 장비 장애 판단 결과를 보고할 수 있다.
도 2는 본 발명의 일 실시예에 따른 통신 네트워크 장비의 장애 관리방법을 설명하기 위한 흐름도이다.
데이터 수신부(110)는 통신 네트워크를 구성하는 복수의 장비들로부터 장비명, 알람명 및 알람시간을 포함하는 장비 알람 데이터를 수신한다(S110). 여기서, 수신된 데이터는 특정 기간 내에 발생한 장비 알람 데이터들일 수 있다.
클러스터링부(120)는 데이터 수신부(110)로 수신된 장비 알람 데이터들을 기 설정된 기준에 따라 분류하여, 반복적으로 발생하는 장비 알람을 클러스터링한다(S112). 클러스터링부(120)는 특정 시간 내의 알람 횟수에 따라 장비 알람 데이터를 그룹핑하거나, 알람을 발생한 장비들 간 거리에 따라 장비 알람 데이터를 그룹핑할 수 있으며, 이러한 클러스터링부(120)의 데이터 클러스터링 기준은 검출하고자 하는 장애의 종류에 따라 다양하게 변형될 수 있다.
패턴 검출부(130)는 클러스터링 결과에 따라 장비 알람 패턴을 검출하고(S116), 패턴이 기준 이상 발생하였는지 판단한다(S116).
패턴이 기준 이상 발생한 것으로 판단되면, 패턴 검출부(130)는 장비에 장애가 발생한 것으로 판단할 수 있다(S118).
도 3은 본 발명의 실시예들이 적용될 수 있는 통신 네트워크의 구성도이다.
도 3을 참조하면, 통신 네트워크는 디지털 신호의 처리를 담당하는 디지털 유닛(DU: Digital Unit)과 RF(radio frequency) 신호의 처리를 담당하는 무선 유닛(RU: Radio Unit)들을 포함할 수 있다. 예컨대, 하나의 디지털 유닛(DU)과 다수의 무선 유닛들(RU1, RU2, RU3)을 포함할 수 있다. 디지털 유닛(DU)이 LTE 시스템을 지원하는 경우 8개의 무선 유닛(RU)를 포함할 수 있다.
무선 유닛(RU)은 알람을 발생할 수 있으며, 각 무선 유닛(RU)에서 발생하는 알람들은 장비명, 알람명, 알람 시간을 포함하는 장비 알람 데이터로 수집될 수 있다.
본 발명의 실시예에 따른 통신 네트워크 장비의 장애 관리방법은 이러한 장비 알람 데이터에서 반복 되는 알람 패턴을 추출함으로써 기존의 시스템에서는 판별하지 못하였던 장비의 이상 상태를 판별할 수 있다. 또한, 무선 유닛(RU)의 상위 유닛인 디지털 유닛(DU)의 이름에 따라 장비 알람 데이터를 분류하여 기준 거리 이내의 장비 알람 데이터를 클러스터링 함으로써, 상위 유닛인 디지털 유닛(DU)의 이상 상태도 판별할 수 있다.
도 4는 본 발명의 제1 실시예에 따른 통신 네트워크 장비의 장애 관리 방법의 흐름도이고, 도 5는 도 4의 실시예에서 따른 장비 알람 데이터를 클러스터링 방법을 설명하기 위한 도면이다. 본 발명의 제1 실시예는 동일한 장비에서 동일한 알람이 반복적으로 발생하는 케이스를 검출하는 방법을 예시하고 있다.
통신 네트워크 장비의 장애 관리를 위해, 통신 네트워크를 구성하는 복수의 장비들로부터 장비명, 알람명 및 알람시간을 포함하는 장비 알람 데이터를 수신한다(S210). 여기서, 수신된 데이터는 특정 기간, 예컨대, 최근 4주 내에 발생한 장비 알람 데이터들일 수 있다.
클러스터링부(120)는 클러스터링 조건을 동일 장비의 동일 알람으로 설정하여, 수신된 장비 알람 데이터들 중 동일한 장비에서 발생한 동일한 알람들을 선별한다. 클러스터링부(120)는 선별된 장비 알람 데이터들을 동일 날짜, 동일 시간대의 Task로 시계열적으로 정렬할 수 있다(S212). 도 5를 참조하면, 10시에서 10시 40분 사이에 3개의 알람이 반복 발생하고, 14시에서 14시 50분 사이에 3개의 알람이 반복 발생하고, 16시 10분에서 16시 30분 사이에 3개의 알람이 반복 발생하고, 18시40분, 20시 50분에 각각 한 번씩 알람이 발생한 경우를 예시할 수 있다.
이 후, 클러스터링부(120)는 특정 시간 내의 알람 횟수에 따라 장비 알람 데이터를 그룹핑할 수 있다(S214). 도 5를 참조하면, 1시간 이내에 적어도 두 번 이상 발생한 장비 알람들을 그룹(group)으로 정의하고, 한번 발생한 장비 알람은 유니트(unit)으로 정의하여 클러스터링하는 것이 가능하다. 도 5의 예에서는 3개의 그룹과 2개의 유니트로 클러스터링 된 것을 확인할 수 있다.
이 후, 패턴 검출부(130)는 알람이 반복된 그룹의 개수, 전체 알람 개수 대비 알람이 반복된 그룹의 비율 등을 산출하여 해당 장비의 이상 여부를 판단할 수 있다(S216). 예컨대, 그룹의 개수가 3건 이상 카운트 되었거나, 전체 그룹 및 유니트의 개수 대비 그룹의 발생 비율이 0.5를 초과하고 유니트의 비율이 0.2 미만인지를 확인하여 해당 장비에 장애가 있는 것으로 판단할 수 있다.
장애가 있는 것으로 판단된 경우, 리포팅부(140)는 동일 장비에서 동일한 알람이 반복 발생하는 장애가 발생하였음을 리포팅한다(S218).
도 6은 본 발명의 제2 실시예에 따른 통신 네트워크 장비의 장애 관리 방법의 흐름도로서, 여러 장비에서 동일한 알람이 반복적으로 발생하는 케이스를 검출하는 방법을 예시하고 있다.
통신 네트워크 장비의 장애 관리를 위해, 통신 네트워크를 구성하는 복수의 장비들로부터 장비명, 알람명 및 알람시간을 포함하는 장비 알람 데이터를 수신한다(S310). 여기서, 수신된 데이터는 특정 기간, 예컨대, 최근 4주 내에 발생한 장비 알람 데이터들일 수 있다.
클러스터링부(120)는 클러스터링 조건을 동일한 상위 장비(DU)인 것으로 설정할 수 있다. 클러스터링부(120)는 동일한 상위 장비(DU)에 연결된 무선 유닛들(RU1, RU2, RU3)에서 발생한 알람들을 선별한다. 클러스터링부(120)는 선별된 장비 알람 데이터들을 동일 날짜, 동일 시간대의 Task로 시계열적으로 정렬할 수 있다(S312).
이 후, 클러스터링부(120)는 장비 알람 데이터가 발생한 하위 장비들 간 거리가 기준거리 이내인 장비 알람 데이터를 그룹핑할 수 있다(S314). 클러스터링 거리 기준=1은 1Km 거리 이내의 장비 알람 데이터를 그룹핑하는 것을 의미할 수 있다.
패턴 검출부(130)는 하위 장비들 간 거리가 기준거리 이내인 장비 알람 데이터의 그룹이 2일 이상 지속된 경우, 혹은, 군집 내 국소 2개 이상의 그룹이 검출된 경우 해당 장비에 이상이 있는 것으로 판단할 수 있다(S316).
장애가 있는 것으로 판단된 경우, 리포팅부(140)는 여러 장비에서 동일한 알람이 반복 발생하는 장애가 발생하였음을 리포팅한다(S318). 이러한 분석 결과를 통해, 관리자는 해당 장비가 연결된 상위 장비(DU)에 장애가 발생하였음을 인지할 수 있다.
도 7은 본 발명의 제3 실시예에 따른 통신 네트워크 장비의 장애 관리 방법의 흐름도이다. 본 발명의 제3 실시예는 동일한 장비에서 여러 알람이 반복적으로 발생하는 케이스를 검출하는 방법을 예시하고 있다.
통신 네트워크 장비의 장애 관리를 위해, 통신 네트워크를 구성하는 복수의 장비들로부터 장비명, 알람명 및 알람시간을 포함하는 장비 알람 데이터를 수신한다(S310). 여기서, 수신된 데이터는 특정 기간, 예컨대, 최근 4주 내에 발생한 장비 알람 데이터들일 수 있다.
클러스터링부(120)는 클러스터링 조건을 동일 장비의 알람으로 설정하여, 수신된 장비 알람 데이터들 중 동일한 장비에서 발생한 알람들을 선별한다. 클러스터링부(120)는 선별된 장비 알람 데이터들을 동일 날짜, 동일 시간대의 Task로 시계열적으로 정렬할 수 있다(S412).
이 후, 클러스터링부(120)는 특정 시간 내의 알람 횟수에 따라 장비 알람 데이터를 그룹핑할 수 있다(S414).
이 후, 패턴 검출부(130)는 알람이 발생한 기간, 알람이 반복된 그룹의 개수 등을 산출하여 해당 장비의 이상 여부를 판단할 수 있다(S416). 예컨대, 알람이 발생한 기간이 2일 이상인 경우, 알람이 반복된 그룹의 개수가 3건 이상인 경우 해당 장비에 장애가 있는 것으로 판단할 수 있다.
장애가 있는 것으로 판단된 경우, 리포팅부(140)는 동일 장비에서 동일한 알람이 반복 발생하는 장애가 발생하였음을 리포팅한다(S418).
이상 설명한 바와 같이, 본 발명은 통신 네트워크에서 발생하는 장비 알람 데이터들을 누적하여 반복적인 패턴으로 발생하는 장비 알람을 분석할 수 있다. 특히, 동일알람이 동일장비에서 반복적으로 발생하거나, 동일알람이 여러장비에서 반복적으로 발생하는 반복 발생하는 패턴을 추출하여 장비의 장애를 검출할 수 있다.
전술한 본 발명은, 프로그램이 기록된 매체에 컴퓨터가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 컴퓨터가 읽을 수 있는 매체는, 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록장치를 포함한다. 컴퓨터가 읽을 수 있는 매체의 예로는, HDD(Hard Disk Drive), SSD(Solid State Disk), SDD(Silicon Disk Drive), ROM, RAM, CD-ROM, 자기 테이프, 플로피 디스크, 광 데이터 저장 장치 등이 있다.
따라서, 상기의 상세한 설명은 모든 면에서 제한적으로 해석되어서는 아니되고 예시적인 것으로 고려되어야 한다. 본 발명의 범위는 첨부된 청구항의 합리적 해석에 의해 결정되어야 하고, 본 발명의 등가적 범위 내에서의 모든 전환은 본 발명의 범위에 포함된다.
110 : 데이터 수신부 120 : 클러스터링부
130 : 패턴 검출부 140 : 리포팅부

Claims (25)

  1. 통신 네트워크를 구성하는 복수의 장비들로부터 장비명, 알람명 및 알람시간을 포함하는 장비 알람 데이터를 수신하는 단계;
    상기 장비 알람 데이터 중 동일한 장비에서 발생한 동일한 장비 알람들을 분류하는 단계;
    분류된 장비 알람들 중 일정 시간 내에 반복 발생한 장비 알람을 그 횟수에 따라 복수의 그룹으로 그룹핑하여 장비 알람을 클러스터링하는 단계; 및
    클러스터링 결과에 따라 상기 복수의 그룹들의 발생 횟수 및 발생 비율중 적어도 어느 하나에 기초하여 장비 알람 패턴을 추출하여 장비 장애를 판단하는 단계;
    를 포함하는 통신 네트워크 장비의 장애 관리 방법.
  2. 삭제
  3. 제1항에 있어서,
    상기 클러스터링하는 단계는,
    상기 분류된 장비 알람들을 시계열적으로 정렬하는 단계를 포함하는 통신 네트워크 장비의 장애 관리 방법.
  4. 제3항에 있어서,
    상기 클러스터링하는 단계는,
    시계열적으로 정렬된 상기 장비 알람이 일정 시간 내에 적어도 두 번 이상 발생하였는지 판단하는 단계; 및
    적어도 두 번 이상 발생한 장비 알람들을 제1 그룹으로 정의하고, 한번 발생한 장비 알람은 제2 그룹으로 정의하여 클러스터링하는 단계;
    를 포함하는 통신 네트워크 장비의 장애 관리 방법.
  5. 제4항에 있어서,
    상기 장애를 판단하는 단계는,
    상기 제1 그룹과 상기 제2 그룹의 발생 횟수 및 발생 비율 중 적어도 어느 하나에 기초하여 상기 장비 알람 패턴을 추출하는 단계; 및
    상기 장비 알람 데이터에 포함된 알람명과 상기 장비 알람 패턴이 발생한 시간에 기초하여 해당 장비의 장애 데이터를 출력하는 단계;
    를 포함하는 통신 네트워크 장비의 장애 관리 방법.
  6. 통신 네트워크를 구성하는 복수의 장비들로부터 장비명, 알람명 및 알람시간을 포함하는 장비 알람 데이터를 수신하는 단계;
    상기 장비 알람 데이터 중 동일한 알람이 발생한 장비 알람 데이터를 추출하여, 추출된 장비 알람 데이터를 해당 장비가 접속된 상위 장비의 이름에 따라 분류하는 단계;
    분류된 장비 알람 데이터 중 상기 장비 알람 데이터가 발생한 하위 장비들 간 거리가 기준거리 이내인 장비 알람 데이터를 그룹핑하여 장비 알람을 클러스터링하는 단계; 및
    클러스터링 결과에 따라 장비 알람 패턴을 추출하여 상기 장비 알람 데이터가 발생한 하위 장비가 접속된 상위 장비의 장애를 판단하는 단계;
    를 포함하는 통신 네트워크 장비의 장애 관리 방법.
  7. 삭제
  8. 제6항에 있어서,
    상기 장애를 판단하는 단계는,
    상기 장비 알람 데이터가 일정 시간 내에 기준 횟수 이상 발생하였거나, 일정 영역 내에 기준 개수 이상 발생한 경우 해당 장비 알람 데이터를 장비 알람 패턴으로 추출하는 단계;
    를 포함하는 통신 네트워크 장비의 장애 관리 방법.
  9. 삭제
  10. 통신 네트워크를 구성하는 복수의 장비들로부터 장비명, 알람명 및 알람시간을 포함하는 장비 알람 데이터를 수신하는 단계;
    상기 장비 알람 데이터 중 동일한 장비에 대해 발생한 장비 알람 데이터들을 분류하는 단계;
    분류된 장비 알람 데이터 중 일정 시간 내에 반복 발생한 장비 알람 데이터를 그룹핑하여 장비 알람 데이터를 클러스터링하는 단계; 및
    클러스터링 결과에 따라 상기 그룹핑된 개수에 기초하여 장비 알람 패턴을 추출하여 장비 장애를 판단하는 단계;
    를 포함하는 통신 네트워크 장비의 장애 관리 방법.
  11. 제10항에 있어서,
    상기 클러스터링하는 단계는,
    상기 분류된 장비 알람 데이터들을 시계열적으로 정렬하는 단계를 포함하는 통신 네트워크 장비의 장애 관리 방법.
  12. 제11항에 있어서,
    상기 장비 장애를 판단하는 단계는,
    상기 장비 알람 데이터에 포함된 알람명과 상기 장비 알람 패턴이 발생한 시간에 기초하여 해당 장비의 장애 데이터를 출력하는 단계;
    를 포함하는 통신 네트워크 장비의 장애 관리 방법.
  13. 제1항, 제3항 내지 제6항, 제8항, 제10항 내지 제12 항 중 어느 한 항에 기재된 통신 네트워크 장비의 장애 관리 방법을 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체.
  14. 통신 네트워크를 구성하는 복수의 장비들로부터 장비명, 알람명 및 알람시간을 포함하는 장비 알람 데이터를 수신하는 데이터 수신부;
    상기 장비 알람 데이터 중 동일한 장비에서 발생한 동일한 장비 알람들을 분류하고, 분류된 장비 알람들 중 일정 시간 내에 반복 발생한 장비 알람을 그 횟수에 따라 복수의 그룹으로 그룹핑하여 장비 알람을 클러스터링하는 클러스터링부; 및
    클러스터링 결과에 따라 상기 복수의 그룹들의 발생 횟수 및 발생 비율중 적어도 어느 하나에 기초하여 장비 알람 패턴을 추출하여 장비 장애를 판단하는 패턴 검출부;
    를 포함하는 통신 네트워크 장비의 장애 관리 시스템.
  15. 삭제
  16. 제14항에 있어서,
    상기 클러스터링부는,
    상기 분류된 장비 알람들을 시계열적으로 정렬하고, 일정 시간 내에 반복 발생한 장비 알람을 그룹핑하는 통신 네트워크 장비의 장애 관리 시스템.
  17. 제16항에 있어서,
    상기 클러스터링부는,
    시계열적으로 정렬된 상기 장비 알람이 일정 시간 내에 적어도 두 번 이상 발생하였는지 판단하여, 적어도 두 번 이상 발생한 장비 알람들을 제1 그룹으로 정의하고, 한번 발생한 장비 알람은 제2 그룹으로 정의하여 클러스터링하는 통신 네트워크 장비의 장애 관리 시스템.
  18. 제17항에 있어서,
    상기 패턴 검출부는,
    상기 제1 그룹과 상기 제2 그룹의 발생 횟수 및 발생 비율 중 적어도 어느 하나에 기초하여 상기 장비 알람 패턴을 추출하고, 상기 장비 알람 데이터에 포함된 알람명과 상기 장비 알람 패턴이 발생한 시간에 기초하여 해당 장비의 장애 데이터를 출력하는 통신 네트워크 장비의 장애 관리 시스템.
  19. 통신 네트워크를 구성하는 복수의 장비들로부터 장비명, 알람명 및 알람시간을 포함하는 장비 알람 데이터를 수신하는 데이터 수신부;
    상기 장비 알람 데이터 중 동일한 알람이 발생한 장비 알람 데이터를 추출하여, 추출된 장비 알람 데이터를 해당 장비가 접속된 상위 장비의 이름에 따라 분류하고, 분류된 장비 알람 데이터 중 상기 장비 알람 데이터가 발생한 하위 장비들 간 거리가 기준거리 이내인 장비 알람 데이터를 그룹핑하여 장비 알람을 클러스터링하는 클러스터링부; 및
    클러스터링 결과에 따라 장비 알람 패턴을 추출하여 상기 장비 알람 데이터가 발생한 하위 장비가 접속된 상위 장비의 장애를 판단하여 장애 데이터를 출력하는 패턴 검출부;
    를 포함하는 통신 네트워크 장비의 장애 관리 시스템.
  20. 삭제
  21. 제19항에 있어서,
    상기 패턴 검출부는,
    추출된 장비 알람 데이터가 일정 시간 내에 기준 횟수 이상 발생하였거나, 일정 영역 내에 기준 개수 이상 발생한 경우 해당 장비 알람 데이터를 장비 알람 패턴으로 추출하는 통신 네트워크 장비의 장애 관리 시스템.
  22. 삭제
  23. 통신 네트워크를 구성하는 복수의 장비들로부터 장비명, 알람명 및 알람시간을 포함하는 장비 알람 데이터를 수신하는 데이터 수신부;
    상기 장비 알람 데이터 중 동일한 장비에서 발생한 장비 알람들을 분류하고, 분류된 장비 알람 데이터 중 일정 시간 내에 반복 발생한 장비 알람을 그룹핑하여 장비 알람을 클러스터링하는 클러스터링부; 및
    클러스터링 결과에 따라 그룹핑된 개수에 기초하여 장비 알람 패턴을 추출하여 장비 장애를 판단하는 패턴 검출부;
    를 포함하는 통신 네트워크 장비의 장애 관리 시스템.
  24. 제23항에 있어서,
    상기 클러스터링부는,
    상기 분류된 장비 알람들을 시계열적으로 정렬하고, 일정 시간 내에 반복 발생한 장비 알람을 그룹핑하는 통신 네트워크 장비의 장애 관리 시스템.
  25. 제24항에 있어서,
    상기 패턴 검출부는,
    상기 그룹핑된 개수에 기초하여 상기 장비 알람 패턴을 추출하고, 상기 장비 알람 데이터에 포함된 알람명과 상기 장비 알람 패턴이 발생한 시간에 기초하여 해당 장비의 장애 데이터를 출력하는 통신 네트워크 장비의 장애 관리 시스템.
KR1020200121608A 2020-09-21 2020-09-21 통신 네트워크 장비의 장애 관리 시스템 및 방법 KR102393839B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020200121608A KR102393839B1 (ko) 2020-09-21 2020-09-21 통신 네트워크 장비의 장애 관리 시스템 및 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020200121608A KR102393839B1 (ko) 2020-09-21 2020-09-21 통신 네트워크 장비의 장애 관리 시스템 및 방법

Publications (2)

Publication Number Publication Date
KR20220039033A KR20220039033A (ko) 2022-03-29
KR102393839B1 true KR102393839B1 (ko) 2022-05-03

Family

ID=80997283

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020200121608A KR102393839B1 (ko) 2020-09-21 2020-09-21 통신 네트워크 장비의 장애 관리 시스템 및 방법

Country Status (1)

Country Link
KR (1) KR102393839B1 (ko)

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100933991B1 (ko) * 2003-06-30 2009-12-28 주식회사 케이티 네트워크 장애 관리 시스템 및 그 방법
KR102200275B1 (ko) * 2018-06-20 2021-01-07 주식회사 케이티 네트워크 장애경보 관리장치 및 방법
KR102216574B1 (ko) * 2018-07-20 2021-02-16 주식회사 케이티 장애 경보를 이용하여 장애 도메인을 판단하는 장치 및 방법

Also Published As

Publication number Publication date
KR20220039033A (ko) 2022-03-29

Similar Documents

Publication Publication Date Title
US8352789B2 (en) Operation management apparatus and method thereof
CN109327320B (zh) 一种故障定界方法及设备
CN111309565B (zh) 告警处理方法、装置、电子设备以及计算机可读存储介质
EP3663919B1 (en) System and method of automated fault correction in a network environment
KR20180012812A (ko) 컨버터 밸브의 고장 조기경보 방법 및 시스템
CN115809183A (zh) 基于知识图谱的信创终端故障发现及处置的方法
WO2019019749A1 (zh) 一种内存异常检测方法及设备
CN104574219A (zh) 电网业务信息系统运行工况的监测预警方法及系统
CN110580492A (zh) 一种基于小幅波动检测的轨道电路故障前兆发现方法
CN114095965A (zh) 指标检测模型获取及故障定位方法、装置、设备及存储介质
CN115454778A (zh) 大规模云网络环境下的时序指标异常智能监控系统
CN110855489B (zh) 故障处理方法、装置和故障处理装置
KR102393839B1 (ko) 통신 네트워크 장비의 장애 관리 시스템 및 방법
CN108055152B (zh) 基于分布式服务日志的通信网络信息系统异常检测方法
CN117421188A (zh) 告警定级方法、装置、设备及可读存储介质
CN117194177A (zh) 一种提高存储系统慢盘检测准确率的方法
CN106228248B (zh) 一种基于模糊fmea分析的系统自动故障诊断方法
US10157113B2 (en) Information processing device, analysis method, and recording medium
CN115495274B (zh) 基于时序数据的异常处理方法、网络设备和可读存储介质
Maździarz Alarm correlation in mobile telecommunications networks based on k-means cluster analysis method
JP2014153736A (ja) 障害予兆検出方法、プログラムおよび装置
WO2018122889A1 (ja) 異常検出方法、システムおよびプログラム
CN114564469A (zh) 采集数据的处理方法及系统
CN113986618A (zh) 集群脑裂自动修复方法、系统、装置及存储介质
CN104469713B (zh) 一种应急处置流程短信智能操作系统

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant