KR102657778B1 - Apparatus for managing network using clustering by failure event, and method thereof - Google Patents

Apparatus for managing network using clustering by failure event, and method thereof Download PDF

Info

Publication number
KR102657778B1
KR102657778B1 KR1020200180923A KR20200180923A KR102657778B1 KR 102657778 B1 KR102657778 B1 KR 102657778B1 KR 1020200180923 A KR1020200180923 A KR 1020200180923A KR 20200180923 A KR20200180923 A KR 20200180923A KR 102657778 B1 KR102657778 B1 KR 102657778B1
Authority
KR
South Korea
Prior art keywords
node
failure
cluster
network
link
Prior art date
Application number
KR1020200180923A
Other languages
Korean (ko)
Other versions
KR20220090083A (en
Inventor
김수정
Original Assignee
주식회사 케이티
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 케이티 filed Critical 주식회사 케이티
Priority to KR1020200180923A priority Critical patent/KR102657778B1/en
Publication of KR20220090083A publication Critical patent/KR20220090083A/en
Application granted granted Critical
Publication of KR102657778B1 publication Critical patent/KR102657778B1/en

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • H04L41/065Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis involving logical or physical relationship, e.g. grouping and hierarchies
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/069Management of faults, events, alarms or notifications using logs of notifications; Post-processing of notifications

Abstract

본 발명은 네트워크 관리 장치 및 방법에 관한 것으로 종래의 노드/링크 단위로 네트워크 장애를 관리하던 것을 전체 네트워크를 클러스터 단위로 분리하여 각 클러스터 장애에 의한 전체 네트워크의 장애 여부를 판단하고 관리함으로써 보다 신속하고 효율적으로 대규모의 네트워크를 관리할 수 있는 장점이 있다.The present invention relates to a network management device and method. Instead of managing network failures on a node/link basis in the past, the entire network is separated into clusters to determine and manage failures in the entire network due to each cluster failure, making it faster and more efficient. It has the advantage of being able to efficiently manage large-scale networks.

Description

장애 이벤트에 의한 클러스터링을 이용한 네트워크 관리 장치 및 그 방법{APPARATUS FOR MANAGING NETWORK USING CLUSTERING BY FAILURE EVENT, AND METHOD THEREOF}Network management device and method using clustering by failure event {APPARATUS FOR MANAGING NETWORK USING CLUSTERING BY FAILURE EVENT, AND METHOD THEREOF}

본 발명은 네트워크 관리에 관한 것으로, 특히 장애 이벤트가 발생한 경우의 네트워크 관리에 관한 것이다.The present invention relates to network management, and particularly to network management when a failure event occurs.

현대 사회의 많은 시스템은 연결망을 통한 네트워크 구조이다. 예를 들면 통신망이나 수도망, 전력망, 소셜 네트워크 등도 모두 네트워크 구조를 이루고 있다. 이러한 네트워크 시스템은 수많은 개체(노드)들로 이루어져 있고 이러한 개체는 현대에 와서 점점 증가하고 있는 추세이다.Many systems in modern society have a network structure through a network of connections. For example, communication networks, water networks, power networks, and social networks all have a network structure. This network system is made up of numerous entities (nodes), and these entities are increasing in modern times.

종래에는 네트워크를 구성하는 각각의 개체(노드)들을 관리하는 방법으로 네트워크를 관리해 왔다. 하지만 인프라 시스템이 확장되고 그에 따라 무한한 데이터가 쏟아져 나오는 시대에 더 이상 네트워크의 노드 개개의 상태 또는 이웃 노드의 분석으로는 시스템의 장애 여부를 파악하기 힘든 문제가 있다.Conventionally, networks have been managed by managing each entity (node) that constitutes the network. However, in an era where infrastructure systems are expanding and infinite data is pouring out, there is a problem that it is no longer difficult to determine whether there is a system failure by analyzing the status of each node in the network or analysis of neighboring nodes.

본 발명의 발명자들은 이러한 종래 기술의 네트워크 노드 관리 문제의 어려움을 해결하기 위해 연구 노력해 왔다. 네트워크를 클러스터 단위로 구분하여 클러스터링 관점에서 네트워크를 분석함으로써 장애 이벤트가 전체 네트워크 시스템 단위에 미치는 영향을 빠르고 정확하게 탐지할 수 있는 장치 및 방법을 완성하기 위해 많은 노력 끝에 본 발명을 완성하기에 이르렀다.The inventors of the present invention have made research efforts to solve the difficulties of the network node management problem of the prior art. After much effort, the present invention was completed to complete a device and method that can quickly and accurately detect the impact of a failure event on the entire network system unit by dividing the network into cluster units and analyzing the network from a clustering perspective.

본 발명은 네트워크 구조를 클러스터링 단위로 파악함으로써 장애 이벤트가 전체 시스템에 미치는 영향을 빠르고 정확하게 탐지하는 것을 목적으로 한다.The purpose of the present invention is to quickly and accurately detect the impact of a failure event on the entire system by understanding the network structure in clustering units.

한편, 본 발명의 명시되지 않은 또 다른 목적들은 하기의 상세한 설명 및 그 효과로부터 용이하게 추론 할 수 있는 범위 내에서 추가적으로 고려될 것이다.Meanwhile, other unspecified purposes of the present invention will be additionally considered within the scope that can be easily inferred from the detailed description and effects below.

본 발명에 따른 네트워크 관리 장치는,The network management device according to the present invention,

노드 정보와 노드 사이를 연결하는 링크 정보에 의해 네트워크 구조를 파악하는 네트워크 구조 관리부; 노드 또는 링크의 장애 이벤트를 수집하는 노드/링크 이벤트 관리부; 상기 노드 또는 링크의 장애 발생 시 네트워크 구조를 클러스터 단위로 재구성하는 네트워크 클러스터링부; 및 상기 재구성한 클러스터 단위로 전체 네트워크의 장애 여부를 판단하는 네트워크 장애 판단부;를 포함한다.a network structure management unit that determines the network structure based on node information and link information connecting nodes; Node/link event management unit that collects failure events of nodes or links; a network clustering unit that reconfigures the network structure in clusters when a failure of the node or link occurs; and a network failure determination unit that determines whether the entire network has a failure in the reconfigured cluster unit.

상기 네트워크 장애 판단부는 상기 재구성한 단위 클러스터에 시드(Seed) 노드가 포함되어 있는지 여부에 의해 상기 단위 클러스터의 장애 여부를 판단하는 것을 특징으로 한다.The network failure determination unit is characterized in that it determines whether the unit cluster has a failure based on whether the reconfigured unit cluster includes a seed node.

상기 네트워크 장애 판단부는 상기 재구성한 클러스터 중 장애가 발생한 클러스터에 포함된 노드의 수와 노드 리스트를 포함하는 장애 클러스터 전표를 작성하는 것을 특징으로 한다.The network failure determination unit is characterized in that it creates a failure cluster slip including the number of nodes included in the failure cluster among the reconfigured clusters and a node list.

상기 네트워크 장애 판단부는 상기 노드/링크 이벤트 관리부에서 수집한 장애 발생 노드 또는 링크가 상기 장애 클러스터 전표에 포함되어 있는 경우 상기 장애 발생 노드 또는 링크 이벤트를 상기 장애 클러스터 전표에 병합하는 것을 특징으로 한다.The network failure determination unit is characterized in that when the failure node or link collected by the node/link event management unit is included in the failure cluster slip, the failure node or link event is merged into the failure cluster slip.

본 발명의 다른 실시예에 따른 네트워크 관리 방법은,A network management method according to another embodiment of the present invention:

노드 또는 링크의 장애 이벤트를 수집하는 단계; 상기 노드 또는 링크의 장애에 의해 분리되는 클러스터 단위로 네트워크를 재구성하는 단계; 및 상기 재구성한 클러스터 단위로 전체 네트워크의 장애 여부를 판단하는 단계를 포함한다.collecting failure events of nodes or links; Reorganizing the network into clusters separated by failure of the node or link; and determining whether the entire network has a failure in the reconfigured cluster unit.

상기 전체 네트워크의 장애 여부를 판단하는 단계는 상기 재구성한 단위 클러스터에 시드(Seed) 노드가 포함되어 있는지 여부에 의해 상기 단위 클러스터의 장애 여부를 판단하는 것을 특징으로 한다.The step of determining whether the entire network has a failure is characterized by determining whether the unit cluster has a failure based on whether the reconfigured unit cluster includes a seed node.

상기 전체 네트워크의 장애 여부를 판단하는 단계는 상기 재구성한 클러스터 중 장애가 발생한 클러스터에 포함된 노드의 수와 노드 리스트를 포함하는 장애 클러스터 전표를 작성하는 것을 특징으로 한다.The step of determining whether the entire network has a failure is characterized by creating a failure cluster slip including the number of nodes included in the failed cluster among the reconfigured clusters and a node list.

상기 노드 또는 링크의 장애 이벤트를 수집하는 단계 후에 상기 장애 이벤트가 발생한 노드 또는 링크가 상기 장애 클러스터 전표에 포함되는지 판단하는 단계;를 더 포함하고, 상기 장애 이벤트가 발생한 노드 또는 링크가 상기 장애 클러스터 전표에 포함되면 상기 장애 발생 노드 또는 링크 이벤트를 상기 장애 클러스터 전표에 병합하는 것을 특징으로 한다.After collecting the failure event of the node or link, determining whether the node or link where the failure event occurred is included in the failure cluster slip, further comprising: the node or link where the failure event occurred is included in the fault cluster slip If included in , the failed node or link event is merged into the fault cluster slip.

본 발명에 따르면 노드 단위의 장애가 아니라 시스템 전체의 장애를 빠르게 파악할 수 있으므로 전체 네트워크 시스템의 장애를 보다 빠르게 해결할 수 있는 효과가 있다. According to the present invention, it is possible to quickly identify failures in the entire system rather than node-level failures, which has the effect of resolving failures in the entire network system more quickly.

한편, 여기에서 명시적으로 언급되지 않은 효과라 하더라도, 본 발명의 기술적 특징에 의해 기대되는 이하의 명세서에서 기재된 효과 및 그 잠정적인 효과는 본 발명의 명세서에 기재된 것과 같이 취급됨을 첨언한다.Meanwhile, it is to be added that even if the effects are not explicitly mentioned herein, the effects described in the following specification and their potential effects expected from the technical features of the present invention are treated as if described in the specification of the present invention.

도 1은 본 발명의 바람직한 어느 실시예에 따른 네트워크 관리 장치의 구조도이다.
도 2 내지 도 4는 본 발명의 바람직한 어느 실시예에 따른 네트워크 관리 장치에 의해 관리되는 네트워크의 예이다.
도 5는 본 발명의 바람직한 다른 실시예에 따른 네트워크 관리 방법의 흐름도이다.
※ 첨부된 도면은 본 발명의 기술사상에 대한 이해를 위하여 참조로서 예시된 것임을 밝히며, 그것에 의해 본 발명의 권리범위가 제한되지는 아니한다
1 is a structural diagram of a network management device according to a preferred embodiment of the present invention.
2 to 4 are examples of networks managed by a network management device according to a preferred embodiment of the present invention.
Figure 5 is a flowchart of a network management method according to another preferred embodiment of the present invention.
※ The attached drawings are intended as reference for understanding the technical idea of the present invention and are not intended to limit the scope of the present invention.

이하, 도면을 참조하여 본 발명의 다양한 실시예가 안내하는 본 발명의 구성과 그 구성으로부터 비롯되는 효과에 대해 살펴본다. 본 발명을 설명함에 있어서 관련된 공지기능에 대하여 이 분야의 기술자에게 자명한 사항으로서 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명을 생략한다. Hereinafter, with reference to the drawings, we will look at the configuration of the present invention guided by various embodiments of the present invention and the effects resulting from the configuration. In describing the present invention, if it is determined that related known functions may unnecessarily obscure the gist of the present invention as they are obvious to those skilled in the art, the detailed description thereof will be omitted.

'제1', '제2' 등의 용어는 다양한 구성요소를 설명하는데 사용될 수 있지만, 상기 구성요소는 위 용어에 의해 한정되어서는 안 된다. 위 용어는 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용될 수 있다. 예를 들어, 본 발명의 권리범위를 벗어나지 않으면서 '제1구성요소'는 '제2구성요소'로 명명될 수 있고, 유사하게 '제2구성요소'도 '제1구성요소'로 명명될 수 있다. 또한, 단수의 표현은 문맥상 명백하게 다르게 표현하지 않는 한, 복수의 표현을 포함한다. 본 발명의 실시예에서 사용되는 용어는 다르게 정의되지 않는 한, 해당 기술분야에서 통상의 지식을 가진 자에게 통상적으로 알려진 의미로 해석될 수 있다.Terms such as 'first' and 'second' may be used to describe various components, but the components should not be limited by the above terms. The above terms may be used only for the purpose of distinguishing one component from another. For example, the 'first component' may be named 'the second component' without departing from the scope of the present invention, and similarly, the 'second component' may also be named 'the first component'. You can. Additionally, singular expressions include plural expressions, unless the context clearly dictates otherwise. Unless otherwise defined, terms used in the embodiments of the present invention may be interpreted as meanings commonly known to those skilled in the art.

이하, 도면을 참조하여 본 발명의 다양한 실시예가 안내하는 본 발명의 구성과 그 구성으로부터 비롯되는 효과에 대해 살펴본다.Hereinafter, with reference to the drawings, we will look at the configuration of the present invention guided by various embodiments of the present invention and the effects resulting from the configuration.

도 1은 본 발명의 바람직한 어느 실시예에 따른 네트워크 관리 장치의 구조도이다.1 is a structural diagram of a network management device according to a preferred embodiment of the present invention.

본 발명에 따른 네트워크 관리 장치(10)는 네트워크 구조 관리부(20), 노드/링크 이벤트 관리부(30), 네트워크 클러스터링부(40) 및 네트워크 장애 판단부(50)를 포함한다.The network management device 10 according to the present invention includes a network structure management unit 20, a node/link event management unit 30, a network clustering unit 40, and a network failure determination unit 50.

본 발명에 따른 네트워크 관리 장치(10)는 하나 이상의 프로세서 및 메모리를 포함한다. 메모리에는 본 발명의 실시를 위해 프로세서를 구동하기 위한 프로그램 코드 및 데이터들이 포함될 수 있다.The network management device 10 according to the present invention includes one or more processors and memory. The memory may include program codes and data for driving a processor to implement the present invention.

도 2는 본 발명에 따른 네트워크 관리 장치(10)에 관리되는 네트워크의 예를 나타낸다.Figure 2 shows an example of a network managed by the network management device 10 according to the present invention.

도 2의 (a)는 6개의 노드로 구성된 네트워크의 한 예를 나타낸다. 네트워크는 6개의 노드 및 노드와 노드 사이를 연결하는 6개의 링크로 구성되어 있으며, 노드 1은 시드(Seed) 노드의 역할을 하고 있다. 즉 일부 노드 혹은 링크의 장애가 있더라도 노드들이 시드 노드인 노드 1에 연결될 수 있다면 전체 네트워크의 영향은 없는 것으로 판단될 수 있는 것이다.Figure 2(a) shows an example of a network consisting of 6 nodes. The network consists of 6 nodes and 6 links connecting nodes, with node 1 serving as a seed node. In other words, even if there is a failure of some nodes or links, if the nodes can be connected to Node 1, the seed node, it can be judged that there is no effect on the entire network.

예를 들어 도 2의 (b)에서 노드 4에 장애가 발생한 경우라면 노드 3은 여전히 시드 노드인 노드 1과 연결이 가능하지만, 노드 2, 노드 5 및 노드 6은 시드 노드인 노드 1과 연결이 발생하므로 전체 네트워크에 장애가 발생하는 것이다.For example, if node 4 fails in (b) of Figure 2, node 3 can still connect to node 1, the seed node, but node 2, node 5, and node 6 can connect to node 1, the seed node. Therefore, a failure occurs in the entire network.

반면 도 2의 (c)와 같은 경우 노드 3 혹은 노드 3와 연결된 링크들에 장애가 발생하더라도 노드 2, 노드 5 및 노드 6은 여전히 노드 4를 통해 시드 노드인 노드 1에 연결 될 수 있다. 즉, 노드 3의 장애는 장애가 발생한 노드 3을 제외한 전체 네트워크에 미치는 영향은 없다고 볼 수 있는 것이다.On the other hand, in the case shown in (c) of FIG. 2, even if a failure occurs in node 3 or the links connected to node 3, node 2, node 5, and node 6 can still be connected to node 1, which is the seed node, through node 4. In other words, the failure of Node 3 can be seen as having no effect on the entire network except for Node 3 where the failure occurred.

따라서 본 발명은 노드/링크 개개의 장애 이벤트가 전체 네트워크에 미치는 영향을 네트워크를 클러스터 단위로 재구성하여 판단하려는 것이다.Therefore, the present invention is intended to determine the impact of individual node/link failure events on the entire network by reorganizing the network on a cluster basis.

네트워크 구조 관리부(20)는 노드 정보 DB(22)와 링크 정보 DB(24)를 포함할 수 있다. 네트워크 구조 관리부(20)는 노드/링크 정보에 의해 네트워크의 구조를 파악하고 관리한다.The network structure management unit 20 may include a node information DB 22 and a link information DB 24. The network structure management unit 20 identifies and manages the network structure based on node/link information.

도 2의 (a)와 같은 네트워크에 대해 노드 정보 DB(22)는 다음 표 1과 같은 노드 정보들을 포함할 수 있다.For a network such as (a) in FIG. 2, the node information DB 22 may include node information as shown in Table 1 below.

node_nonode_no node_descriptionnode_description link_degreelink_degree cluster_nocluster_no seed_ynseed_yn 1One AA 22 1One 1One 22 BB 1One 1One 00 33 CC 22 1One 00 44 DD 33 1One 00 55 EE 22 1One 00 66 FF 22 1One 00

노드 정보 DB(22)에는 노드 번호(node_no), 노드 설명(node_description), 링쿠 수(link_degree), 클러스터 번호(cluster_no), 시드 노드 여부(seed_yn) 등이 포함될 수 있다.The node information DB 22 may include a node number (node_no), node description (node_description), link number (link_degree), cluster number (cluster_no), and whether or not it is a seed node (seed_yn).

노드 번호는 노드의 일련번호를 나타낸다.The node number represents the serial number of the node.

노드 설명은 노드의 특이점들이나 필요한 설명 등이 저장된다.The node description stores the node's unique features and necessary explanations.

링크 수는 각 노드에 연결된 링크의 수를 나타낸다.The number of links indicates the number of links connected to each node.

노 2와 같은 경우 노드 6만 연결되어 있으므로 링크의 수가 1이고, 노드 4는 노드 1, 노드 3 및 노드 5와 연결되어 있어 링크의 수가 3이다.In the case of node 2, only node 6 is connected, so the number of links is 1, and node 4 is connected to node 1, node 3, and node 5, so the number of links is 3.

본 발명은 네트워크를 클러스터 단위로 파악한다. 따라서 직, 간접적으로 서로 연결되는 노드들을 하나의 클러스터로 파악하게 된다.The present invention understands the network in cluster units. Therefore, nodes that are directly or indirectly connected to each other are identified as one cluster.

예를 들어 도 2의 (a)는 모든 노드들이 서로 연결되어 있으므로 하나의 클러스터로 구성되는 것이고, 도 2의 (b)의 경우에는 노드 1과 노드 3이 서로 연결되어 있고, 노드 2, 노드 5 및 노드 6은 서로 연결되어 있지만 노드 1이나 노드 3과는 연결되지 않으므로 노드 1과 노드 3이 하나의 클러스터를 구성하고, 노드 2, 노드 5 및 노드 6이 또 하나의 클러스터를 구성한다. 즉, 노드 4의 장애에 의해 전체 네트워크가 두 개의 클러스터로 재편되는 것이다.For example, in (a) of Figure 2, all nodes are connected to each other, so it consists of one cluster, and in the case of (b) of Figure 2, node 1 and node 3 are connected to each other, node 2, and node 5. and Node 6 are connected to each other but not to Node 1 or Node 3, so Node 1 and Node 3 form one cluster, and Node 2, Node 5, and Node 6 form another cluster. In other words, the entire network is reorganized into two clusters due to the failure of node 4.

또한 링크 정보 DB(24)는 다음 표 2와 같은 링크 정보들을 포함할 수 있다.Additionally, the link information DB 24 may include link information as shown in Table 2 below.

node_nonode_no connected_nodeconnected_node 1One [3,4][3,4] 22 [6][6] 33 [1,4][1,4] 44 [1,3,5][1,3,5] 55 [4,6][4,6] 66 [2,5][2,5]

링크 정보 DB(24)에는 노드 번호(node_no)와 해당 노드가 연결된 모든 노드들의 리스트(connected_node)를 포함한다.The link information DB 24 includes a node number (node_no) and a list of all nodes to which the node is connected (connected_node).

도 2의 (a)와 같은 네트워크의 예에서 노드 1은 노드 3과 노드 4에 연결되고 노드 2는 노드 6에만 연결되며 노드 4는 노드1, 노드3 및 노드 5와 연결됨을 나타낸다.In the example of the network shown in (a) of Figure 2, node 1 is connected to node 3 and node 4, node 2 is connected only to node 6, and node 4 is connected to node 1, node 3, and node 5.

네트워크 구조 관리부(20)는 이렇게 노드 정보 DB(22)와 링크 정보 DB(24)를 관리함으로써 전체 네트워크의 구조를 관리할 수 있다.The network structure management unit 20 can manage the structure of the entire network by managing the node information DB 22 and the link information DB 24 in this way.

노드/링크 이벤트 관리부(30)는 장애가 발생한 노드 또는 링크의 정보를 수집한다. 전체 네트워크에서 어떤 노드 혹은 링크에 장애가 발생했고, 그에 의한 전체 네트워크의 영향을 판단하기 위함이다.The node/link event management unit 30 collects information on nodes or links in which a failure has occurred. This is to determine which node or link in the entire network has failed and its impact on the entire network.

노드/링크 이벤트 관리부(30)에 의해 이벤트가 수집되면, 네트워크 클러스터링부(40)는 네트워크를 클러스터 단위로 재구성한다.When events are collected by the node/link event management unit 30, the network clustering unit 40 reorganizes the network in cluster units.

네트워크 클러스터링부(40)는 네트워크 구조 관리부(20)의 노드 정보 DB(22)와 링크 정보 DB(24)를 이용하여 클러스터를 구성하고 클러스터 정보 DB(42)에 그 정보를 저장한다.The network clustering unit 40 forms a cluster using the node information DB 22 and link information DB 24 of the network structure management unit 20 and stores the information in the cluster information DB 42.

이를 위해 네트워크 클러스터링부(40)는 클러스터 정보 DB(42)를 포함할 수 있다. 다음 표 3은 클러스터 정보 DB(42)에 저장되는 정보의 예를 나타낸다.For this purpose, the network clustering unit 40 may include a cluster information DB 42. Table 3 below shows an example of information stored in the cluster information DB 42.

cluster_nocluster_no seed_ynseed_yn cluster_sizecluster_size 1One 1One 66

도 2의 (a)와 같은 네트워크는 전체가 하나로 연결되어 있으므로 클러스터 1의 하나의 클러스터로 구성된다. 노드 1이 시드 노드이므로 시드 노드 포함 여부(seed_yn)는 1이고 클러스터 사이즈(cluster_size)는 포함하는 모든 노드의 수인 6이 된다.Since the entire network as shown in (a) of Figure 2 is connected as one, it consists of one cluster, cluster 1. Since node 1 is a seed node, whether or not the seed node is included (seed_yn) is 1, and the cluster size (cluster_size) is 6, which is the number of all included nodes.

도 3은 장애 이벤트가 접수되어 네트워크 구조가 재구성되는 예를 나타낸다.Figure 3 shows an example in which a network structure is reconfigured when a failure event is received.

도 3의 (a)에서 노드 4와 노드 5 사이의 링크에 장애가 발생하면 노드/링크 이벤트 관리부(30)는 이를 접수하여 네트워크 구조 관리부(20)와 네트워크 클러스터링부(40)에 전달한다.In (a) of FIG. 3, when a failure occurs in the link between node 4 and node 5, the node/link event management unit 30 receives the error and transmits it to the network structure management unit 20 and the network clustering unit 40.

네트워크 구조 관리부(20)는 전달받은 장애 정보에 의해 노드 정보 DB(22)와 링크 정보 DB(24)를 업데이트 한다.The network structure management unit 20 updates the node information DB 22 and the link information DB 24 according to the received failure information.

다음 표 4와 표 5는 업데이트 된 노드 정보 DB(22)와 링크 정보 DB(24)의 예를 나타낸다.The following Tables 4 and 5 show examples of the updated node information DB 22 and link information DB 24.

node_nonode_no node_descriptionnode_description link_degreelink_degree cluster_nocluster_no seed_ynseed_yn 1One AA 22 1One 1One 22 BB 1One 22 00 33 CC 22 1One 00 44 DD 22 1One 00 55 EE 1One 22 00 66 FF 22 22 00

node_nonode_no connected_nodeconnected_node 1One [3,4][3,4] 22 [6][6] 33 [1,4][1,4] 44 [1,3][1,3] 55 [6][6] 66 [2,5][2,5]

도 3의 (a)에서 노드 4와 노드 5의 링크에 장애가 발생하였고 따라서 노드 정보와 링크 정보에 변화가 발생했다.In Figure 3(a), a failure occurred in the link between node 4 and node 5, and accordingly, a change occurred in node information and link information.

표 4에서 굵은 글씨로 표시된 노드 4와 노드 5의 링크 수가 변경되었고 따라서 표 5의 굵은 글씨로 표시된 노드 4와 노드 5의 연결 노드 리스트도 변경되었다.The number of links between Node 4 and Node 5, shown in bold in Table 4, has changed, and therefore the list of connected nodes between Node 4 and Node 5, shown in bold in Table 5, has also changed.

구체적으로는 노드 1, 노드 4 및 노드 4가 제1 클러스터(101)를 구성하고, 노드 2, 노드 5 및 노드 6이 제2 클러스터(102)를 구성하도록 변경되었다. Specifically, node 1, node 4, and node 4 were changed to form the first cluster 101, and node 2, node 5, and node 6 were changed to form the second cluster 102.

제1 클러스터(101)은 링크 장애에도 불구하고 여전히 시드 노드인 노드 1을 포함하고 있으므로 네트워크의 영향이 없다.The first cluster 101 still includes node 1, which is the seed node, despite the link failure, and thus is not affected by the network.

그런데 제2 클러스터(102)는 시드 노드인 노드 1과의 연결이 끊어졌으므로 네트워크의 장애가 발생했다고 판단할 수 있다.However, since the second cluster 102 is disconnected from node 1, which is the seed node, it may be determined that a network failure has occurred.

네트워크 클러스터링부(40)는 클러스터 정보 DB(42)를 다음 표 6과 같이 업데이트 할 수 있다.The network clustering unit 40 can update the cluster information DB 42 as shown in Table 6 below.

cluster_nocluster_no seed_ynseed_yn cluster_sizecluster_size 1One 1One 33 22 00 33

클러스터는 두 개가 되어 클러스터 번호가 추가되었고, 각 클러스터에 포함된 노드의 수는 3이며 제2 클러스터(102)에는 시드 노드가 포함되지 않았음을 나타낸다.There are two clusters and a cluster number has been added, and the number of nodes included in each cluster is 3, indicating that the second cluster 102 does not include a seed node.

이와 같이 네트워크 장애 판단부(50)는 구분된 클러스터 단위(101, 102)로 장애 여부를 판단할 수 있다. In this way, the network failure determination unit 50 can determine whether there is a failure in divided cluster units 101 and 102.

한 예로 도 3의 (a)와 같이 시드 노드가 포함되지 않은 클러스터(102)가 발생하는 경우 전체 네트워크의 장애가 발생했다고 판단할 수 있는 것이다. 반면 도 3의 (b)와 같이 링크 장애가 발생하여 제3 클러스터(103)와 제4 클러스터(104)로 클러스터가 분리되었더라도 제4 클러스터(104)의 제2 노드가 시드 노드라면 전체 네트워크는 장애의 영향을 받지 않는다고 판단할 수 있는 것이다.As an example, if a cluster 102 that does not include a seed node occurs as shown in (a) of FIG. 3, it may be determined that a failure of the entire network has occurred. On the other hand, even if a link failure occurs and the cluster is separated into the third cluster 103 and the fourth cluster 104, as shown in (b) of FIG. 3, if the second node of the fourth cluster 104 is the seed node, the entire network is affected by the failure. It can be judged that it is not affected.

네트워크 장애 판단부(50)는 네트워크 장애 발생 시 장애 클러스터 전표를 생성할 수 있다. 장애 클러스터 전표는 최초 발생 장애의 위치, 장애 클러스터 포함 노드 수, 노드 리스트 등을 포함할 수 있다.The network failure determination unit 50 may generate a failure cluster slip when a network failure occurs. The fault cluster slip may include the location of the first fault, the number of nodes included in the fault cluster, and the node list.

도 3의 (a)에서 노드 4와 노드 5 사이의 링크 장애에 의해 제2 클러스터(102)에 장애가 발생했으므로 장애 클러스터 전표에는 노드 4와 노드 5 사이의 링크 장애, 장애 클러스터 포함 노드 수 3개, 노드 리스트인 노드 2, 노드 5, 노드 6이 기록된다.In (a) of FIG. 3, a failure occurred in the second cluster 102 due to a link failure between node 4 and node 5, so the failure cluster slip includes the link failure between node 4 and node 5, the number of nodes including the failure cluster: 3, The node list Node 2, Node 5, and Node 6 are recorded.

네트워크 장애 판단부(50)는 노드/링크의 장애가 발생했을 때 이미 발생한 장애에 포함되는 노드 또는 링크의 장애라면 새로 장애 클러스터 전표를 생성하지 않고 기존 장애 클러스터 전표에 장애를 병합할 수 있다.When a node/link failure occurs, the network failure determination unit 50 may merge the failure into the existing failure cluster slip without creating a new fault cluster slip if the failure of the node or link is included in the faults that have already occurred.

도 4는 기존 장애 클러스터 전표에 새로운 이벤트를 병합하는 예를 나타낸다.Figure 4 shows an example of merging a new event into an existing fault cluster slip.

노드 4와 노드 5 사이의 링크 장애에 의해 네트워크가 제5 클러스터(201)와 제6 클러스터(202)로 구분된 상황이라면 장애 클러스터인 제6 클러스터(106)에 대한 장애 클러스터 전표가 생성된다.If the network is divided into the fifth cluster 201 and the sixth cluster 202 due to a link failure between node 4 and node 5, a fault cluster slip for the sixth cluster 106, which is the fault cluster, is created.

이후 노드/링크 이벤트 관리부(30)에서 노드 2의 장애를 추가로 접수하면 네트워크 장애 판단부(50)는 기존의 장애 클러스터 전표에 노드 2가 포함되었는지 판단한다. 기존 장애 클러스터 전표는 제6 클러스터(106)에 대한 전표이고, 제6 클러스터(106)는 노드 2, 노드 5, 노드 6으로 구성되어 노드 2가 이미 포함되어 있으므로, 네트워크 장애 판단부(50)는 새로 전표를 생성하지 않고 제6 클러스터(106)에 대한 장애 전표에 노드 2의 장애 정보를 추가한다.Afterwards, when the node/link event management unit 30 additionally receives a failure of node 2, the network failure determination unit 50 determines whether node 2 is included in the existing failure cluster slip. The existing fault cluster slip is a slip for the sixth cluster 106, and the sixth cluster 106 is composed of node 2, node 5, and node 6, and since node 2 is already included, the network fault determination unit 50 The failure information of node 2 is added to the failure slip for the sixth cluster 106 without creating a new slip.

도 5는 본 발명의 바람직한 다른 실시예에 따른 네트워크 관리 방법의 흐름도이다. 본 발명의 네트워크 관리 장치에 의해 수행되는 네트워크 관리 방법을 다시 한 번 정리한다.Figure 5 is a flowchart of a network management method according to another preferred embodiment of the present invention. The network management method performed by the network management device of the present invention is summarized once again.

우선 노드/링크 이벤트를 수집하여(S10) 장애 이벤트가 발생했는지 판단하고(S20) 장애가 발생하지 않으면 계속 이벤트를 수집한다.First, node/link events are collected (S10) to determine whether a failure event has occurred (S20), and if a failure does not occur, events are continued to be collected.

노드/링크 장애 이벤트가 발생했다면 노드 또는 링크 장애가 이미 생성된 장애 클러스터 전표에 포함되어있는지 판단한다(S30).If a node/link failure event occurs, it is determined whether the node or link failure is included in the already created failure cluster slip (S30).

새로운 장애가 발생했다면 노드 또는 링크 장애에 의해 전체 네트워크 구조를 다시 클러스터링 한다(S40).If a new failure occurs, the entire network structure is re-clustered due to the node or link failure (S40).

클러스터링 후 각각의 단위 클러스터에 대해 시드 노드가 포함되었는지를 판단하고 시드 노드가 포함되지 않은 클러스터가 생성됐다면 이를 장애 클러스터로 판단하여 장애 클러스터 전표를 발행하게 된다. 장애 클러스터 전표는 최초 발생 장애의 위치, 장애 클러스터 포함 노드 수, 노드 리스트 등을 포함할 수 있다.After clustering, it is determined whether a seed node is included in each unit cluster, and if a cluster that does not contain a seed node is created, it is judged to be a faulty cluster and a faulty cluster slip is issued. The fault cluster slip may include the location of the first fault, the number of nodes included in the fault cluster, and the node list.

반면 노드 또는 링크 장애가 이미 생성된 장애 클러스터 전표에 포함되어 있는지 판단한 결과(S30) 이미 생성된 장애 클러스터 전표에 포함되어 있는 노드 또는 링크 장애라면 기존의 장애 클러스터 전표에 노드 또는 링크 장애 정보를 병합하게 된다(S60).On the other hand, as a result of determining whether the node or link failure is included in the already created fault cluster slip (S30), if the node or link failure is included in the already created fault cluster slip, the node or link failure information is merged into the existing fault cluster slip. (S60).

이상과 같은 본 발명의 네트워크 관리 장치 및 방법에 따르면 네트워크 장애 정보를 개별 노드 또는 링크 단위로 파악하는 것이 아니라 클러스터 단위로 구분하여 판단함으로써 전체 네트워크에 미치는 영향을 빠르게 판단할 수 있는 효과가 있다.According to the network management device and method of the present invention as described above, it is possible to quickly determine the impact on the entire network by distinguishing and determining network failure information by cluster rather than by individual node or link.

본 발명의 보호범위가 이상에서 명시적으로 설명한 실시예의 기재와 표현에 제한되는 것은 아니다. 또한, 본 발명이 속하는 기술분야에서 자명한 변경이나 치환으로 말미암아 본 발명이 보호범위가 제한될 수도 없음을 다시 한 번 첨언한다.The scope of protection of the present invention is not limited to the description and expression of the embodiments explicitly described above. In addition, it is to be added once again that the scope of protection of the present invention may not be limited due to changes or substitutions that are obvious in the technical field to which the present invention pertains.

Claims (8)

하나 이상의 프로세서 및 메모리를 포함하는 네트워크 관리 장치에 있어서, 상기 프로세서는:
노드 정보와 노드 사이를 연결하는 링크 정보에 의해 네트워크 구조를 파악하는 네트워크 구조 관리부;
노드 또는 링크의 장애 이벤트를 수집하는 노드/링크 이벤트 관리부;
상기 노드 또는 링크의 장애 발생 시 발생한 장애 정보에 의해 네트워크 구조를 클러스터 단위로 재구성하는 네트워크 클러스터링부; 및
상기 재구성한 클러스터 단위로 전체 네트워크의 장애 여부를 판단하는 네트워크 장애 판단부;
를 포함하는, 네트워크 관리 장치.
A network management device comprising one or more processors and memory, wherein the processor:
a network structure management unit that determines the network structure based on node information and link information connecting nodes;
Node/link event management unit that collects failure events of nodes or links;
a network clustering unit that reorganizes the network structure in clusters based on error information generated when a node or link failure occurs; and
a network failure determination unit that determines whether the entire network has a failure in the reconfigured cluster unit;
Including, network management device.
제1항에 있어서,
상기 네트워크 장애 판단부는 상기 재구성한 단위 클러스터에 시드(Seed) 노드가 포함되어 있는지 여부에 의해 상기 단위 클러스터의 장애 여부를 판단하는 것을 특징으로 하는, 네트워크 관리 장치.
According to paragraph 1,
The network management device is characterized in that the network failure determination unit determines whether the unit cluster has a failure based on whether the reconfigured unit cluster includes a seed node.
제1항에 있어서,
상기 네트워크 장애 판단부는 상기 재구성한 클러스터 중 장애가 발생한 클러스터에 포함된 노드의 수와 노드 리스트를 포함하는 장애 클러스터 전표를 작성하는 것을 특징으로 하는, 네트워크 관리 장치.
According to paragraph 1,
The network management device is characterized in that the network failure determination unit creates a failure cluster slip including a list of nodes and the number of nodes included in a failure cluster among the reconfigured clusters.
제3항에 있어서,
상기 네트워크 장애 판단부는 상기 노드/링크 이벤트 관리부에서 수집한 장애 발생 노드 또는 링크가 상기 장애 클러스터 전표에 포함되어 있는 경우 상기 장애 발생 노드 또는 링크 이벤트를 상기 장애 클러스터 전표에 병합하는 것을 특징으로 하는, 네트워크 관리 장치.
According to paragraph 3,
The network failure determination unit merges the failure node or link event into the failure cluster slip if the failure node or link collected by the node/link event management unit is included in the failure cluster slip. Management device.
하나 이상의 프로세서 및 메모리를 포함하는 네트워크 관리 장치에 의해 수행되는 네트워크 관리 방법에 있어서:
노드 또는 링크의 장애 이벤트를 수집하는 단계;
상기 노드 또는 링크의 장애 발생 시 발생한 장애 정보에 의해 네트워크 구조를 클러스터 단위로 재구성하는 단계; 및
상기 재구성한 클러스터 단위로 전체 네트워크의 장애 여부를 판단하는 단계;
를 포함하는, 네트워크 관리 방법.
In a network management method performed by a network management device including one or more processors and memory:
collecting failure events of nodes or links;
Reconfiguring the network structure in clusters based on fault information generated when a node or link failure occurs; and
determining whether the entire network has a failure on a per-reconstructed cluster basis;
Network management method, including.
제5항에 있어서,
상기 전체 네트워크의 장애 여부를 판단하는 단계는 상기 재구성한 단위 클러스터에 시드(Seed) 노드가 포함되어 있는지 여부에 의해 상기 단위 클러스터의 장애 여부를 판단하는 것을 특징으로 하는, 네트워크 관리 방법.
According to clause 5,
The step of determining whether the entire network has a failure includes determining whether the unit cluster has a failure based on whether the reconfigured unit cluster includes a seed node.
제5항에 있어서,
상기 전체 네트워크의 장애 여부를 판단하는 단계는 상기 재구성한 클러스터 중 장애가 발생한 클러스터에 포함된 노드의 수와 노드 리스트를 포함하는 장애 클러스터 전표를 작성하는 것을 특징으로 하는, 네트워크 관리 방법.
According to clause 5,
The step of determining whether the entire network has a failure is characterized by creating a failure cluster slip including the number of nodes included in the failed cluster among the reconfigured clusters and a node list.
제7항에 있어서,
상기 노드 또는 링크의 장애 이벤트를 수집하는 단계 후에 상기 장애 이벤트가 발생한 노드 또는 링크가 상기 장애 클러스터 전표에 포함되는지 판단하는 단계;를 더 포함하고,
상기 장애 이벤트가 발생한 노드 또는 링크가 상기 장애 클러스터 전표에 포함되면 상기 장애 발생 노드 또는 링크 이벤트를 상기 장애 클러스터 전표에 병합하는 것을 특징으로 하는, 네트워크 관리 방법.
In clause 7,
After collecting the failure event of the node or link, determining whether the node or link in which the failure event occurred is included in the failure cluster slip; further comprising;
A network management method, characterized in that if the node or link where the failure event occurred is included in the failure cluster slip, the fault occurring node or link event is merged into the fault cluster slip.
KR1020200180923A 2020-12-22 2020-12-22 Apparatus for managing network using clustering by failure event, and method thereof KR102657778B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020200180923A KR102657778B1 (en) 2020-12-22 2020-12-22 Apparatus for managing network using clustering by failure event, and method thereof

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020200180923A KR102657778B1 (en) 2020-12-22 2020-12-22 Apparatus for managing network using clustering by failure event, and method thereof

Publications (2)

Publication Number Publication Date
KR20220090083A KR20220090083A (en) 2022-06-29
KR102657778B1 true KR102657778B1 (en) 2024-04-15

Family

ID=82270435

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020200180923A KR102657778B1 (en) 2020-12-22 2020-12-22 Apparatus for managing network using clustering by failure event, and method thereof

Country Status (1)

Country Link
KR (1) KR102657778B1 (en)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015519812A (en) * 2012-04-27 2015-07-09 モトローラ モビリティ エルエルシーMotorola Mobility Llc Estimating the severity level of network failure

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101043134B1 (en) * 2004-02-26 2011-06-20 주식회사 케이티 Fault management method using network alarm information

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015519812A (en) * 2012-04-27 2015-07-09 モトローラ モビリティ エルエルシーMotorola Mobility Llc Estimating the severity level of network failure

Also Published As

Publication number Publication date
KR20220090083A (en) 2022-06-29

Similar Documents

Publication Publication Date Title
US11265203B2 (en) System and method for processing alerts indicative of conditions of a computing infrastructure
US10949280B2 (en) Predicting failure reoccurrence in a high availability system
CN106341454B (en) Across computer room distributed data base management system (DDBMS) mostly living and method
US8347143B2 (en) Facilitating event management and analysis within a communications environment
US20070053283A1 (en) Correlation and consolidation of link events to facilitate updating of status of source-destination routes in a multi-path network
US6941362B2 (en) Root cause analysis in a distributed network management architecture
CN101997709B (en) Root alarm data analysis method and system
US20170123885A1 (en) System and Method for Generating a Graphical Display Region Indicative of Conditions of a Computing Infrastructure
EP1333615B1 (en) System and method of identifying a faulty component in a network element
JP4405511B2 (en) Dynamically configurable fault tolerance in autonomous computing with multiple service points
US10819594B2 (en) System and method for generating a graphical display region indicative of conditions of a computing infrastructure
US20210211346A1 (en) Method and system for assessing network resource failures using passive shared risk resource groups
CN105790972B (en) Controller and alarm correlation processing method
CN108769170A (en) A kind of cluster network fault self-checking system and method
CN101309173A (en) Automatic concatenation algorithm for transmission network service circuit routing and data checking system
CN106897421B (en) Memory database read and write abruption system and method based on sentry's mode
CN105681070A (en) Method and system for automatically collecting and analyzing computer cluster node information
CN105703957A (en) Robustness calculating method of aviation electrical network system
Rosenkrantz et al. Structure-based resilience metrics for service-oriented networks
KR102657778B1 (en) Apparatus for managing network using clustering by failure event, and method thereof
GB2416091A (en) High Capacity Fault Correlation
CN110502496A (en) A kind of distributed file system restorative procedure, system, terminal and storage medium
CN108712499A (en) Based on the system being managed to cloud computing service
CN113821412A (en) Equipment operation and maintenance management method and device
US20190207805A1 (en) Node fault isolation

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant