KR102657778B1 - Apparatus for managing network using clustering by failure event, and method thereof - Google Patents
Apparatus for managing network using clustering by failure event, and method thereof Download PDFInfo
- Publication number
- KR102657778B1 KR102657778B1 KR1020200180923A KR20200180923A KR102657778B1 KR 102657778 B1 KR102657778 B1 KR 102657778B1 KR 1020200180923 A KR1020200180923 A KR 1020200180923A KR 20200180923 A KR20200180923 A KR 20200180923A KR 102657778 B1 KR102657778 B1 KR 102657778B1
- Authority
- KR
- South Korea
- Prior art keywords
- node
- failure
- cluster
- network
- link
- Prior art date
Links
- 238000000034 method Methods 0.000 title abstract description 4
- 238000007726 management method Methods 0.000 claims description 43
- 230000000694 effects Effects 0.000 description 8
- 230000014509 gene expression Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 1
- 230000003334 potential effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
- H04L41/0631—Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
- H04L41/065—Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis involving logical or physical relationship, e.g. grouping and hierarchies
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
- H04L41/069—Management of faults, events, alarms or notifications using logs of notifications; Post-processing of notifications
Abstract
본 발명은 네트워크 관리 장치 및 방법에 관한 것으로 종래의 노드/링크 단위로 네트워크 장애를 관리하던 것을 전체 네트워크를 클러스터 단위로 분리하여 각 클러스터 장애에 의한 전체 네트워크의 장애 여부를 판단하고 관리함으로써 보다 신속하고 효율적으로 대규모의 네트워크를 관리할 수 있는 장점이 있다.The present invention relates to a network management device and method. Instead of managing network failures on a node/link basis in the past, the entire network is separated into clusters to determine and manage failures in the entire network due to each cluster failure, making it faster and more efficient. It has the advantage of being able to efficiently manage large-scale networks.
Description
본 발명은 네트워크 관리에 관한 것으로, 특히 장애 이벤트가 발생한 경우의 네트워크 관리에 관한 것이다.The present invention relates to network management, and particularly to network management when a failure event occurs.
현대 사회의 많은 시스템은 연결망을 통한 네트워크 구조이다. 예를 들면 통신망이나 수도망, 전력망, 소셜 네트워크 등도 모두 네트워크 구조를 이루고 있다. 이러한 네트워크 시스템은 수많은 개체(노드)들로 이루어져 있고 이러한 개체는 현대에 와서 점점 증가하고 있는 추세이다.Many systems in modern society have a network structure through a network of connections. For example, communication networks, water networks, power networks, and social networks all have a network structure. This network system is made up of numerous entities (nodes), and these entities are increasing in modern times.
종래에는 네트워크를 구성하는 각각의 개체(노드)들을 관리하는 방법으로 네트워크를 관리해 왔다. 하지만 인프라 시스템이 확장되고 그에 따라 무한한 데이터가 쏟아져 나오는 시대에 더 이상 네트워크의 노드 개개의 상태 또는 이웃 노드의 분석으로는 시스템의 장애 여부를 파악하기 힘든 문제가 있다.Conventionally, networks have been managed by managing each entity (node) that constitutes the network. However, in an era where infrastructure systems are expanding and infinite data is pouring out, there is a problem that it is no longer difficult to determine whether there is a system failure by analyzing the status of each node in the network or analysis of neighboring nodes.
본 발명의 발명자들은 이러한 종래 기술의 네트워크 노드 관리 문제의 어려움을 해결하기 위해 연구 노력해 왔다. 네트워크를 클러스터 단위로 구분하여 클러스터링 관점에서 네트워크를 분석함으로써 장애 이벤트가 전체 네트워크 시스템 단위에 미치는 영향을 빠르고 정확하게 탐지할 수 있는 장치 및 방법을 완성하기 위해 많은 노력 끝에 본 발명을 완성하기에 이르렀다.The inventors of the present invention have made research efforts to solve the difficulties of the network node management problem of the prior art. After much effort, the present invention was completed to complete a device and method that can quickly and accurately detect the impact of a failure event on the entire network system unit by dividing the network into cluster units and analyzing the network from a clustering perspective.
본 발명은 네트워크 구조를 클러스터링 단위로 파악함으로써 장애 이벤트가 전체 시스템에 미치는 영향을 빠르고 정확하게 탐지하는 것을 목적으로 한다.The purpose of the present invention is to quickly and accurately detect the impact of a failure event on the entire system by understanding the network structure in clustering units.
한편, 본 발명의 명시되지 않은 또 다른 목적들은 하기의 상세한 설명 및 그 효과로부터 용이하게 추론 할 수 있는 범위 내에서 추가적으로 고려될 것이다.Meanwhile, other unspecified purposes of the present invention will be additionally considered within the scope that can be easily inferred from the detailed description and effects below.
본 발명에 따른 네트워크 관리 장치는,The network management device according to the present invention,
노드 정보와 노드 사이를 연결하는 링크 정보에 의해 네트워크 구조를 파악하는 네트워크 구조 관리부; 노드 또는 링크의 장애 이벤트를 수집하는 노드/링크 이벤트 관리부; 상기 노드 또는 링크의 장애 발생 시 네트워크 구조를 클러스터 단위로 재구성하는 네트워크 클러스터링부; 및 상기 재구성한 클러스터 단위로 전체 네트워크의 장애 여부를 판단하는 네트워크 장애 판단부;를 포함한다.a network structure management unit that determines the network structure based on node information and link information connecting nodes; Node/link event management unit that collects failure events of nodes or links; a network clustering unit that reconfigures the network structure in clusters when a failure of the node or link occurs; and a network failure determination unit that determines whether the entire network has a failure in the reconfigured cluster unit.
상기 네트워크 장애 판단부는 상기 재구성한 단위 클러스터에 시드(Seed) 노드가 포함되어 있는지 여부에 의해 상기 단위 클러스터의 장애 여부를 판단하는 것을 특징으로 한다.The network failure determination unit is characterized in that it determines whether the unit cluster has a failure based on whether the reconfigured unit cluster includes a seed node.
상기 네트워크 장애 판단부는 상기 재구성한 클러스터 중 장애가 발생한 클러스터에 포함된 노드의 수와 노드 리스트를 포함하는 장애 클러스터 전표를 작성하는 것을 특징으로 한다.The network failure determination unit is characterized in that it creates a failure cluster slip including the number of nodes included in the failure cluster among the reconfigured clusters and a node list.
상기 네트워크 장애 판단부는 상기 노드/링크 이벤트 관리부에서 수집한 장애 발생 노드 또는 링크가 상기 장애 클러스터 전표에 포함되어 있는 경우 상기 장애 발생 노드 또는 링크 이벤트를 상기 장애 클러스터 전표에 병합하는 것을 특징으로 한다.The network failure determination unit is characterized in that when the failure node or link collected by the node/link event management unit is included in the failure cluster slip, the failure node or link event is merged into the failure cluster slip.
본 발명의 다른 실시예에 따른 네트워크 관리 방법은,A network management method according to another embodiment of the present invention:
노드 또는 링크의 장애 이벤트를 수집하는 단계; 상기 노드 또는 링크의 장애에 의해 분리되는 클러스터 단위로 네트워크를 재구성하는 단계; 및 상기 재구성한 클러스터 단위로 전체 네트워크의 장애 여부를 판단하는 단계를 포함한다.collecting failure events of nodes or links; Reorganizing the network into clusters separated by failure of the node or link; and determining whether the entire network has a failure in the reconfigured cluster unit.
상기 전체 네트워크의 장애 여부를 판단하는 단계는 상기 재구성한 단위 클러스터에 시드(Seed) 노드가 포함되어 있는지 여부에 의해 상기 단위 클러스터의 장애 여부를 판단하는 것을 특징으로 한다.The step of determining whether the entire network has a failure is characterized by determining whether the unit cluster has a failure based on whether the reconfigured unit cluster includes a seed node.
상기 전체 네트워크의 장애 여부를 판단하는 단계는 상기 재구성한 클러스터 중 장애가 발생한 클러스터에 포함된 노드의 수와 노드 리스트를 포함하는 장애 클러스터 전표를 작성하는 것을 특징으로 한다.The step of determining whether the entire network has a failure is characterized by creating a failure cluster slip including the number of nodes included in the failed cluster among the reconfigured clusters and a node list.
상기 노드 또는 링크의 장애 이벤트를 수집하는 단계 후에 상기 장애 이벤트가 발생한 노드 또는 링크가 상기 장애 클러스터 전표에 포함되는지 판단하는 단계;를 더 포함하고, 상기 장애 이벤트가 발생한 노드 또는 링크가 상기 장애 클러스터 전표에 포함되면 상기 장애 발생 노드 또는 링크 이벤트를 상기 장애 클러스터 전표에 병합하는 것을 특징으로 한다.After collecting the failure event of the node or link, determining whether the node or link where the failure event occurred is included in the failure cluster slip, further comprising: the node or link where the failure event occurred is included in the fault cluster slip If included in , the failed node or link event is merged into the fault cluster slip.
본 발명에 따르면 노드 단위의 장애가 아니라 시스템 전체의 장애를 빠르게 파악할 수 있으므로 전체 네트워크 시스템의 장애를 보다 빠르게 해결할 수 있는 효과가 있다. According to the present invention, it is possible to quickly identify failures in the entire system rather than node-level failures, which has the effect of resolving failures in the entire network system more quickly.
한편, 여기에서 명시적으로 언급되지 않은 효과라 하더라도, 본 발명의 기술적 특징에 의해 기대되는 이하의 명세서에서 기재된 효과 및 그 잠정적인 효과는 본 발명의 명세서에 기재된 것과 같이 취급됨을 첨언한다.Meanwhile, it is to be added that even if the effects are not explicitly mentioned herein, the effects described in the following specification and their potential effects expected from the technical features of the present invention are treated as if described in the specification of the present invention.
도 1은 본 발명의 바람직한 어느 실시예에 따른 네트워크 관리 장치의 구조도이다.
도 2 내지 도 4는 본 발명의 바람직한 어느 실시예에 따른 네트워크 관리 장치에 의해 관리되는 네트워크의 예이다.
도 5는 본 발명의 바람직한 다른 실시예에 따른 네트워크 관리 방법의 흐름도이다.
※ 첨부된 도면은 본 발명의 기술사상에 대한 이해를 위하여 참조로서 예시된 것임을 밝히며, 그것에 의해 본 발명의 권리범위가 제한되지는 아니한다1 is a structural diagram of a network management device according to a preferred embodiment of the present invention.
2 to 4 are examples of networks managed by a network management device according to a preferred embodiment of the present invention.
Figure 5 is a flowchart of a network management method according to another preferred embodiment of the present invention.
※ The attached drawings are intended as reference for understanding the technical idea of the present invention and are not intended to limit the scope of the present invention.
이하, 도면을 참조하여 본 발명의 다양한 실시예가 안내하는 본 발명의 구성과 그 구성으로부터 비롯되는 효과에 대해 살펴본다. 본 발명을 설명함에 있어서 관련된 공지기능에 대하여 이 분야의 기술자에게 자명한 사항으로서 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명을 생략한다. Hereinafter, with reference to the drawings, we will look at the configuration of the present invention guided by various embodiments of the present invention and the effects resulting from the configuration. In describing the present invention, if it is determined that related known functions may unnecessarily obscure the gist of the present invention as they are obvious to those skilled in the art, the detailed description thereof will be omitted.
'제1', '제2' 등의 용어는 다양한 구성요소를 설명하는데 사용될 수 있지만, 상기 구성요소는 위 용어에 의해 한정되어서는 안 된다. 위 용어는 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용될 수 있다. 예를 들어, 본 발명의 권리범위를 벗어나지 않으면서 '제1구성요소'는 '제2구성요소'로 명명될 수 있고, 유사하게 '제2구성요소'도 '제1구성요소'로 명명될 수 있다. 또한, 단수의 표현은 문맥상 명백하게 다르게 표현하지 않는 한, 복수의 표현을 포함한다. 본 발명의 실시예에서 사용되는 용어는 다르게 정의되지 않는 한, 해당 기술분야에서 통상의 지식을 가진 자에게 통상적으로 알려진 의미로 해석될 수 있다.Terms such as 'first' and 'second' may be used to describe various components, but the components should not be limited by the above terms. The above terms may be used only for the purpose of distinguishing one component from another. For example, the 'first component' may be named 'the second component' without departing from the scope of the present invention, and similarly, the 'second component' may also be named 'the first component'. You can. Additionally, singular expressions include plural expressions, unless the context clearly dictates otherwise. Unless otherwise defined, terms used in the embodiments of the present invention may be interpreted as meanings commonly known to those skilled in the art.
이하, 도면을 참조하여 본 발명의 다양한 실시예가 안내하는 본 발명의 구성과 그 구성으로부터 비롯되는 효과에 대해 살펴본다.Hereinafter, with reference to the drawings, we will look at the configuration of the present invention guided by various embodiments of the present invention and the effects resulting from the configuration.
도 1은 본 발명의 바람직한 어느 실시예에 따른 네트워크 관리 장치의 구조도이다.1 is a structural diagram of a network management device according to a preferred embodiment of the present invention.
본 발명에 따른 네트워크 관리 장치(10)는 네트워크 구조 관리부(20), 노드/링크 이벤트 관리부(30), 네트워크 클러스터링부(40) 및 네트워크 장애 판단부(50)를 포함한다.The
본 발명에 따른 네트워크 관리 장치(10)는 하나 이상의 프로세서 및 메모리를 포함한다. 메모리에는 본 발명의 실시를 위해 프로세서를 구동하기 위한 프로그램 코드 및 데이터들이 포함될 수 있다.The
도 2는 본 발명에 따른 네트워크 관리 장치(10)에 관리되는 네트워크의 예를 나타낸다.Figure 2 shows an example of a network managed by the
도 2의 (a)는 6개의 노드로 구성된 네트워크의 한 예를 나타낸다. 네트워크는 6개의 노드 및 노드와 노드 사이를 연결하는 6개의 링크로 구성되어 있으며, 노드 1은 시드(Seed) 노드의 역할을 하고 있다. 즉 일부 노드 혹은 링크의 장애가 있더라도 노드들이 시드 노드인 노드 1에 연결될 수 있다면 전체 네트워크의 영향은 없는 것으로 판단될 수 있는 것이다.Figure 2(a) shows an example of a network consisting of 6 nodes. The network consists of 6 nodes and 6 links connecting nodes, with node 1 serving as a seed node. In other words, even if there is a failure of some nodes or links, if the nodes can be connected to Node 1, the seed node, it can be judged that there is no effect on the entire network.
예를 들어 도 2의 (b)에서 노드 4에 장애가 발생한 경우라면 노드 3은 여전히 시드 노드인 노드 1과 연결이 가능하지만, 노드 2, 노드 5 및 노드 6은 시드 노드인 노드 1과 연결이 발생하므로 전체 네트워크에 장애가 발생하는 것이다.For example, if node 4 fails in (b) of Figure 2, node 3 can still connect to node 1, the seed node, but node 2, node 5, and node 6 can connect to node 1, the seed node. Therefore, a failure occurs in the entire network.
반면 도 2의 (c)와 같은 경우 노드 3 혹은 노드 3와 연결된 링크들에 장애가 발생하더라도 노드 2, 노드 5 및 노드 6은 여전히 노드 4를 통해 시드 노드인 노드 1에 연결 될 수 있다. 즉, 노드 3의 장애는 장애가 발생한 노드 3을 제외한 전체 네트워크에 미치는 영향은 없다고 볼 수 있는 것이다.On the other hand, in the case shown in (c) of FIG. 2, even if a failure occurs in node 3 or the links connected to node 3, node 2, node 5, and node 6 can still be connected to node 1, which is the seed node, through node 4. In other words, the failure of Node 3 can be seen as having no effect on the entire network except for Node 3 where the failure occurred.
따라서 본 발명은 노드/링크 개개의 장애 이벤트가 전체 네트워크에 미치는 영향을 네트워크를 클러스터 단위로 재구성하여 판단하려는 것이다.Therefore, the present invention is intended to determine the impact of individual node/link failure events on the entire network by reorganizing the network on a cluster basis.
네트워크 구조 관리부(20)는 노드 정보 DB(22)와 링크 정보 DB(24)를 포함할 수 있다. 네트워크 구조 관리부(20)는 노드/링크 정보에 의해 네트워크의 구조를 파악하고 관리한다.The network
도 2의 (a)와 같은 네트워크에 대해 노드 정보 DB(22)는 다음 표 1과 같은 노드 정보들을 포함할 수 있다.For a network such as (a) in FIG. 2, the
노드 정보 DB(22)에는 노드 번호(node_no), 노드 설명(node_description), 링쿠 수(link_degree), 클러스터 번호(cluster_no), 시드 노드 여부(seed_yn) 등이 포함될 수 있다.The
노드 번호는 노드의 일련번호를 나타낸다.The node number represents the serial number of the node.
노드 설명은 노드의 특이점들이나 필요한 설명 등이 저장된다.The node description stores the node's unique features and necessary explanations.
링크 수는 각 노드에 연결된 링크의 수를 나타낸다.The number of links indicates the number of links connected to each node.
노 2와 같은 경우 노드 6만 연결되어 있으므로 링크의 수가 1이고, 노드 4는 노드 1, 노드 3 및 노드 5와 연결되어 있어 링크의 수가 3이다.In the case of node 2, only node 6 is connected, so the number of links is 1, and node 4 is connected to node 1, node 3, and node 5, so the number of links is 3.
본 발명은 네트워크를 클러스터 단위로 파악한다. 따라서 직, 간접적으로 서로 연결되는 노드들을 하나의 클러스터로 파악하게 된다.The present invention understands the network in cluster units. Therefore, nodes that are directly or indirectly connected to each other are identified as one cluster.
예를 들어 도 2의 (a)는 모든 노드들이 서로 연결되어 있으므로 하나의 클러스터로 구성되는 것이고, 도 2의 (b)의 경우에는 노드 1과 노드 3이 서로 연결되어 있고, 노드 2, 노드 5 및 노드 6은 서로 연결되어 있지만 노드 1이나 노드 3과는 연결되지 않으므로 노드 1과 노드 3이 하나의 클러스터를 구성하고, 노드 2, 노드 5 및 노드 6이 또 하나의 클러스터를 구성한다. 즉, 노드 4의 장애에 의해 전체 네트워크가 두 개의 클러스터로 재편되는 것이다.For example, in (a) of Figure 2, all nodes are connected to each other, so it consists of one cluster, and in the case of (b) of Figure 2, node 1 and node 3 are connected to each other, node 2, and node 5. and Node 6 are connected to each other but not to Node 1 or Node 3, so Node 1 and Node 3 form one cluster, and Node 2, Node 5, and Node 6 form another cluster. In other words, the entire network is reorganized into two clusters due to the failure of node 4.
또한 링크 정보 DB(24)는 다음 표 2와 같은 링크 정보들을 포함할 수 있다.Additionally, the link information DB 24 may include link information as shown in Table 2 below.
링크 정보 DB(24)에는 노드 번호(node_no)와 해당 노드가 연결된 모든 노드들의 리스트(connected_node)를 포함한다.The
도 2의 (a)와 같은 네트워크의 예에서 노드 1은 노드 3과 노드 4에 연결되고 노드 2는 노드 6에만 연결되며 노드 4는 노드1, 노드3 및 노드 5와 연결됨을 나타낸다.In the example of the network shown in (a) of Figure 2, node 1 is connected to node 3 and node 4, node 2 is connected only to node 6, and node 4 is connected to node 1, node 3, and node 5.
네트워크 구조 관리부(20)는 이렇게 노드 정보 DB(22)와 링크 정보 DB(24)를 관리함으로써 전체 네트워크의 구조를 관리할 수 있다.The network
노드/링크 이벤트 관리부(30)는 장애가 발생한 노드 또는 링크의 정보를 수집한다. 전체 네트워크에서 어떤 노드 혹은 링크에 장애가 발생했고, 그에 의한 전체 네트워크의 영향을 판단하기 위함이다.The node/link
노드/링크 이벤트 관리부(30)에 의해 이벤트가 수집되면, 네트워크 클러스터링부(40)는 네트워크를 클러스터 단위로 재구성한다.When events are collected by the node/link
네트워크 클러스터링부(40)는 네트워크 구조 관리부(20)의 노드 정보 DB(22)와 링크 정보 DB(24)를 이용하여 클러스터를 구성하고 클러스터 정보 DB(42)에 그 정보를 저장한다.The
이를 위해 네트워크 클러스터링부(40)는 클러스터 정보 DB(42)를 포함할 수 있다. 다음 표 3은 클러스터 정보 DB(42)에 저장되는 정보의 예를 나타낸다.For this purpose, the
도 2의 (a)와 같은 네트워크는 전체가 하나로 연결되어 있으므로 클러스터 1의 하나의 클러스터로 구성된다. 노드 1이 시드 노드이므로 시드 노드 포함 여부(seed_yn)는 1이고 클러스터 사이즈(cluster_size)는 포함하는 모든 노드의 수인 6이 된다.Since the entire network as shown in (a) of Figure 2 is connected as one, it consists of one cluster, cluster 1. Since node 1 is a seed node, whether or not the seed node is included (seed_yn) is 1, and the cluster size (cluster_size) is 6, which is the number of all included nodes.
도 3은 장애 이벤트가 접수되어 네트워크 구조가 재구성되는 예를 나타낸다.Figure 3 shows an example in which a network structure is reconfigured when a failure event is received.
도 3의 (a)에서 노드 4와 노드 5 사이의 링크에 장애가 발생하면 노드/링크 이벤트 관리부(30)는 이를 접수하여 네트워크 구조 관리부(20)와 네트워크 클러스터링부(40)에 전달한다.In (a) of FIG. 3, when a failure occurs in the link between node 4 and node 5, the node/link
네트워크 구조 관리부(20)는 전달받은 장애 정보에 의해 노드 정보 DB(22)와 링크 정보 DB(24)를 업데이트 한다.The network
다음 표 4와 표 5는 업데이트 된 노드 정보 DB(22)와 링크 정보 DB(24)의 예를 나타낸다.The following Tables 4 and 5 show examples of the updated
도 3의 (a)에서 노드 4와 노드 5의 링크에 장애가 발생하였고 따라서 노드 정보와 링크 정보에 변화가 발생했다.In Figure 3(a), a failure occurred in the link between node 4 and node 5, and accordingly, a change occurred in node information and link information.
표 4에서 굵은 글씨로 표시된 노드 4와 노드 5의 링크 수가 변경되었고 따라서 표 5의 굵은 글씨로 표시된 노드 4와 노드 5의 연결 노드 리스트도 변경되었다.The number of links between Node 4 and Node 5, shown in bold in Table 4, has changed, and therefore the list of connected nodes between Node 4 and Node 5, shown in bold in Table 5, has also changed.
구체적으로는 노드 1, 노드 4 및 노드 4가 제1 클러스터(101)를 구성하고, 노드 2, 노드 5 및 노드 6이 제2 클러스터(102)를 구성하도록 변경되었다. Specifically, node 1, node 4, and node 4 were changed to form the first cluster 101, and node 2, node 5, and node 6 were changed to form the second cluster 102.
제1 클러스터(101)은 링크 장애에도 불구하고 여전히 시드 노드인 노드 1을 포함하고 있으므로 네트워크의 영향이 없다.The first cluster 101 still includes node 1, which is the seed node, despite the link failure, and thus is not affected by the network.
그런데 제2 클러스터(102)는 시드 노드인 노드 1과의 연결이 끊어졌으므로 네트워크의 장애가 발생했다고 판단할 수 있다.However, since the second cluster 102 is disconnected from node 1, which is the seed node, it may be determined that a network failure has occurred.
네트워크 클러스터링부(40)는 클러스터 정보 DB(42)를 다음 표 6과 같이 업데이트 할 수 있다.The
클러스터는 두 개가 되어 클러스터 번호가 추가되었고, 각 클러스터에 포함된 노드의 수는 3이며 제2 클러스터(102)에는 시드 노드가 포함되지 않았음을 나타낸다.There are two clusters and a cluster number has been added, and the number of nodes included in each cluster is 3, indicating that the second cluster 102 does not include a seed node.
이와 같이 네트워크 장애 판단부(50)는 구분된 클러스터 단위(101, 102)로 장애 여부를 판단할 수 있다. In this way, the network
한 예로 도 3의 (a)와 같이 시드 노드가 포함되지 않은 클러스터(102)가 발생하는 경우 전체 네트워크의 장애가 발생했다고 판단할 수 있는 것이다. 반면 도 3의 (b)와 같이 링크 장애가 발생하여 제3 클러스터(103)와 제4 클러스터(104)로 클러스터가 분리되었더라도 제4 클러스터(104)의 제2 노드가 시드 노드라면 전체 네트워크는 장애의 영향을 받지 않는다고 판단할 수 있는 것이다.As an example, if a cluster 102 that does not include a seed node occurs as shown in (a) of FIG. 3, it may be determined that a failure of the entire network has occurred. On the other hand, even if a link failure occurs and the cluster is separated into the third cluster 103 and the fourth cluster 104, as shown in (b) of FIG. 3, if the second node of the fourth cluster 104 is the seed node, the entire network is affected by the failure. It can be judged that it is not affected.
네트워크 장애 판단부(50)는 네트워크 장애 발생 시 장애 클러스터 전표를 생성할 수 있다. 장애 클러스터 전표는 최초 발생 장애의 위치, 장애 클러스터 포함 노드 수, 노드 리스트 등을 포함할 수 있다.The network
도 3의 (a)에서 노드 4와 노드 5 사이의 링크 장애에 의해 제2 클러스터(102)에 장애가 발생했으므로 장애 클러스터 전표에는 노드 4와 노드 5 사이의 링크 장애, 장애 클러스터 포함 노드 수 3개, 노드 리스트인 노드 2, 노드 5, 노드 6이 기록된다.In (a) of FIG. 3, a failure occurred in the second cluster 102 due to a link failure between node 4 and node 5, so the failure cluster slip includes the link failure between node 4 and node 5, the number of nodes including the failure cluster: 3, The node list Node 2, Node 5, and Node 6 are recorded.
네트워크 장애 판단부(50)는 노드/링크의 장애가 발생했을 때 이미 발생한 장애에 포함되는 노드 또는 링크의 장애라면 새로 장애 클러스터 전표를 생성하지 않고 기존 장애 클러스터 전표에 장애를 병합할 수 있다.When a node/link failure occurs, the network
도 4는 기존 장애 클러스터 전표에 새로운 이벤트를 병합하는 예를 나타낸다.Figure 4 shows an example of merging a new event into an existing fault cluster slip.
노드 4와 노드 5 사이의 링크 장애에 의해 네트워크가 제5 클러스터(201)와 제6 클러스터(202)로 구분된 상황이라면 장애 클러스터인 제6 클러스터(106)에 대한 장애 클러스터 전표가 생성된다.If the network is divided into the fifth cluster 201 and the sixth cluster 202 due to a link failure between node 4 and node 5, a fault cluster slip for the sixth cluster 106, which is the fault cluster, is created.
이후 노드/링크 이벤트 관리부(30)에서 노드 2의 장애를 추가로 접수하면 네트워크 장애 판단부(50)는 기존의 장애 클러스터 전표에 노드 2가 포함되었는지 판단한다. 기존 장애 클러스터 전표는 제6 클러스터(106)에 대한 전표이고, 제6 클러스터(106)는 노드 2, 노드 5, 노드 6으로 구성되어 노드 2가 이미 포함되어 있으므로, 네트워크 장애 판단부(50)는 새로 전표를 생성하지 않고 제6 클러스터(106)에 대한 장애 전표에 노드 2의 장애 정보를 추가한다.Afterwards, when the node/link
도 5는 본 발명의 바람직한 다른 실시예에 따른 네트워크 관리 방법의 흐름도이다. 본 발명의 네트워크 관리 장치에 의해 수행되는 네트워크 관리 방법을 다시 한 번 정리한다.Figure 5 is a flowchart of a network management method according to another preferred embodiment of the present invention. The network management method performed by the network management device of the present invention is summarized once again.
우선 노드/링크 이벤트를 수집하여(S10) 장애 이벤트가 발생했는지 판단하고(S20) 장애가 발생하지 않으면 계속 이벤트를 수집한다.First, node/link events are collected (S10) to determine whether a failure event has occurred (S20), and if a failure does not occur, events are continued to be collected.
노드/링크 장애 이벤트가 발생했다면 노드 또는 링크 장애가 이미 생성된 장애 클러스터 전표에 포함되어있는지 판단한다(S30).If a node/link failure event occurs, it is determined whether the node or link failure is included in the already created failure cluster slip (S30).
새로운 장애가 발생했다면 노드 또는 링크 장애에 의해 전체 네트워크 구조를 다시 클러스터링 한다(S40).If a new failure occurs, the entire network structure is re-clustered due to the node or link failure (S40).
클러스터링 후 각각의 단위 클러스터에 대해 시드 노드가 포함되었는지를 판단하고 시드 노드가 포함되지 않은 클러스터가 생성됐다면 이를 장애 클러스터로 판단하여 장애 클러스터 전표를 발행하게 된다. 장애 클러스터 전표는 최초 발생 장애의 위치, 장애 클러스터 포함 노드 수, 노드 리스트 등을 포함할 수 있다.After clustering, it is determined whether a seed node is included in each unit cluster, and if a cluster that does not contain a seed node is created, it is judged to be a faulty cluster and a faulty cluster slip is issued. The fault cluster slip may include the location of the first fault, the number of nodes included in the fault cluster, and the node list.
반면 노드 또는 링크 장애가 이미 생성된 장애 클러스터 전표에 포함되어 있는지 판단한 결과(S30) 이미 생성된 장애 클러스터 전표에 포함되어 있는 노드 또는 링크 장애라면 기존의 장애 클러스터 전표에 노드 또는 링크 장애 정보를 병합하게 된다(S60).On the other hand, as a result of determining whether the node or link failure is included in the already created fault cluster slip (S30), if the node or link failure is included in the already created fault cluster slip, the node or link failure information is merged into the existing fault cluster slip. (S60).
이상과 같은 본 발명의 네트워크 관리 장치 및 방법에 따르면 네트워크 장애 정보를 개별 노드 또는 링크 단위로 파악하는 것이 아니라 클러스터 단위로 구분하여 판단함으로써 전체 네트워크에 미치는 영향을 빠르게 판단할 수 있는 효과가 있다.According to the network management device and method of the present invention as described above, it is possible to quickly determine the impact on the entire network by distinguishing and determining network failure information by cluster rather than by individual node or link.
본 발명의 보호범위가 이상에서 명시적으로 설명한 실시예의 기재와 표현에 제한되는 것은 아니다. 또한, 본 발명이 속하는 기술분야에서 자명한 변경이나 치환으로 말미암아 본 발명이 보호범위가 제한될 수도 없음을 다시 한 번 첨언한다.The scope of protection of the present invention is not limited to the description and expression of the embodiments explicitly described above. In addition, it is to be added once again that the scope of protection of the present invention may not be limited due to changes or substitutions that are obvious in the technical field to which the present invention pertains.
Claims (8)
노드 정보와 노드 사이를 연결하는 링크 정보에 의해 네트워크 구조를 파악하는 네트워크 구조 관리부;
노드 또는 링크의 장애 이벤트를 수집하는 노드/링크 이벤트 관리부;
상기 노드 또는 링크의 장애 발생 시 발생한 장애 정보에 의해 네트워크 구조를 클러스터 단위로 재구성하는 네트워크 클러스터링부; 및
상기 재구성한 클러스터 단위로 전체 네트워크의 장애 여부를 판단하는 네트워크 장애 판단부;
를 포함하는, 네트워크 관리 장치.
A network management device comprising one or more processors and memory, wherein the processor:
a network structure management unit that determines the network structure based on node information and link information connecting nodes;
Node/link event management unit that collects failure events of nodes or links;
a network clustering unit that reorganizes the network structure in clusters based on error information generated when a node or link failure occurs; and
a network failure determination unit that determines whether the entire network has a failure in the reconfigured cluster unit;
Including, network management device.
상기 네트워크 장애 판단부는 상기 재구성한 단위 클러스터에 시드(Seed) 노드가 포함되어 있는지 여부에 의해 상기 단위 클러스터의 장애 여부를 판단하는 것을 특징으로 하는, 네트워크 관리 장치.
According to paragraph 1,
The network management device is characterized in that the network failure determination unit determines whether the unit cluster has a failure based on whether the reconfigured unit cluster includes a seed node.
상기 네트워크 장애 판단부는 상기 재구성한 클러스터 중 장애가 발생한 클러스터에 포함된 노드의 수와 노드 리스트를 포함하는 장애 클러스터 전표를 작성하는 것을 특징으로 하는, 네트워크 관리 장치.
According to paragraph 1,
The network management device is characterized in that the network failure determination unit creates a failure cluster slip including a list of nodes and the number of nodes included in a failure cluster among the reconfigured clusters.
상기 네트워크 장애 판단부는 상기 노드/링크 이벤트 관리부에서 수집한 장애 발생 노드 또는 링크가 상기 장애 클러스터 전표에 포함되어 있는 경우 상기 장애 발생 노드 또는 링크 이벤트를 상기 장애 클러스터 전표에 병합하는 것을 특징으로 하는, 네트워크 관리 장치.
According to paragraph 3,
The network failure determination unit merges the failure node or link event into the failure cluster slip if the failure node or link collected by the node/link event management unit is included in the failure cluster slip. Management device.
노드 또는 링크의 장애 이벤트를 수집하는 단계;
상기 노드 또는 링크의 장애 발생 시 발생한 장애 정보에 의해 네트워크 구조를 클러스터 단위로 재구성하는 단계; 및
상기 재구성한 클러스터 단위로 전체 네트워크의 장애 여부를 판단하는 단계;
를 포함하는, 네트워크 관리 방법.
In a network management method performed by a network management device including one or more processors and memory:
collecting failure events of nodes or links;
Reconfiguring the network structure in clusters based on fault information generated when a node or link failure occurs; and
determining whether the entire network has a failure on a per-reconstructed cluster basis;
Network management method, including.
상기 전체 네트워크의 장애 여부를 판단하는 단계는 상기 재구성한 단위 클러스터에 시드(Seed) 노드가 포함되어 있는지 여부에 의해 상기 단위 클러스터의 장애 여부를 판단하는 것을 특징으로 하는, 네트워크 관리 방법.
According to clause 5,
The step of determining whether the entire network has a failure includes determining whether the unit cluster has a failure based on whether the reconfigured unit cluster includes a seed node.
상기 전체 네트워크의 장애 여부를 판단하는 단계는 상기 재구성한 클러스터 중 장애가 발생한 클러스터에 포함된 노드의 수와 노드 리스트를 포함하는 장애 클러스터 전표를 작성하는 것을 특징으로 하는, 네트워크 관리 방법.
According to clause 5,
The step of determining whether the entire network has a failure is characterized by creating a failure cluster slip including the number of nodes included in the failed cluster among the reconfigured clusters and a node list.
상기 노드 또는 링크의 장애 이벤트를 수집하는 단계 후에 상기 장애 이벤트가 발생한 노드 또는 링크가 상기 장애 클러스터 전표에 포함되는지 판단하는 단계;를 더 포함하고,
상기 장애 이벤트가 발생한 노드 또는 링크가 상기 장애 클러스터 전표에 포함되면 상기 장애 발생 노드 또는 링크 이벤트를 상기 장애 클러스터 전표에 병합하는 것을 특징으로 하는, 네트워크 관리 방법.In clause 7,
After collecting the failure event of the node or link, determining whether the node or link in which the failure event occurred is included in the failure cluster slip; further comprising;
A network management method, characterized in that if the node or link where the failure event occurred is included in the failure cluster slip, the fault occurring node or link event is merged into the fault cluster slip.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020200180923A KR102657778B1 (en) | 2020-12-22 | 2020-12-22 | Apparatus for managing network using clustering by failure event, and method thereof |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020200180923A KR102657778B1 (en) | 2020-12-22 | 2020-12-22 | Apparatus for managing network using clustering by failure event, and method thereof |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20220090083A KR20220090083A (en) | 2022-06-29 |
KR102657778B1 true KR102657778B1 (en) | 2024-04-15 |
Family
ID=82270435
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020200180923A KR102657778B1 (en) | 2020-12-22 | 2020-12-22 | Apparatus for managing network using clustering by failure event, and method thereof |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR102657778B1 (en) |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015519812A (en) * | 2012-04-27 | 2015-07-09 | モトローラ モビリティ エルエルシーMotorola Mobility Llc | Estimating the severity level of network failure |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101043134B1 (en) * | 2004-02-26 | 2011-06-20 | 주식회사 케이티 | Fault management method using network alarm information |
-
2020
- 2020-12-22 KR KR1020200180923A patent/KR102657778B1/en active IP Right Grant
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015519812A (en) * | 2012-04-27 | 2015-07-09 | モトローラ モビリティ エルエルシーMotorola Mobility Llc | Estimating the severity level of network failure |
Also Published As
Publication number | Publication date |
---|---|
KR20220090083A (en) | 2022-06-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11265203B2 (en) | System and method for processing alerts indicative of conditions of a computing infrastructure | |
US10949280B2 (en) | Predicting failure reoccurrence in a high availability system | |
CN106341454B (en) | Across computer room distributed data base management system (DDBMS) mostly living and method | |
US8347143B2 (en) | Facilitating event management and analysis within a communications environment | |
US20070053283A1 (en) | Correlation and consolidation of link events to facilitate updating of status of source-destination routes in a multi-path network | |
US6941362B2 (en) | Root cause analysis in a distributed network management architecture | |
CN101997709B (en) | Root alarm data analysis method and system | |
US20170123885A1 (en) | System and Method for Generating a Graphical Display Region Indicative of Conditions of a Computing Infrastructure | |
EP1333615B1 (en) | System and method of identifying a faulty component in a network element | |
JP4405511B2 (en) | Dynamically configurable fault tolerance in autonomous computing with multiple service points | |
US10819594B2 (en) | System and method for generating a graphical display region indicative of conditions of a computing infrastructure | |
US20210211346A1 (en) | Method and system for assessing network resource failures using passive shared risk resource groups | |
CN105790972B (en) | Controller and alarm correlation processing method | |
CN108769170A (en) | A kind of cluster network fault self-checking system and method | |
CN101309173A (en) | Automatic concatenation algorithm for transmission network service circuit routing and data checking system | |
CN106897421B (en) | Memory database read and write abruption system and method based on sentry's mode | |
CN105681070A (en) | Method and system for automatically collecting and analyzing computer cluster node information | |
CN105703957A (en) | Robustness calculating method of aviation electrical network system | |
Rosenkrantz et al. | Structure-based resilience metrics for service-oriented networks | |
KR102657778B1 (en) | Apparatus for managing network using clustering by failure event, and method thereof | |
GB2416091A (en) | High Capacity Fault Correlation | |
CN110502496A (en) | A kind of distributed file system restorative procedure, system, terminal and storage medium | |
CN108712499A (en) | Based on the system being managed to cloud computing service | |
CN113821412A (en) | Equipment operation and maintenance management method and device | |
US20190207805A1 (en) | Node fault isolation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E902 | Notification of reason for refusal | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant |