KR20230100903A - Fault handling system for network apparatus and control method thereof - Google Patents

Fault handling system for network apparatus and control method thereof Download PDF

Info

Publication number
KR20230100903A
KR20230100903A KR1020210190572A KR20210190572A KR20230100903A KR 20230100903 A KR20230100903 A KR 20230100903A KR 1020210190572 A KR1020210190572 A KR 1020210190572A KR 20210190572 A KR20210190572 A KR 20210190572A KR 20230100903 A KR20230100903 A KR 20230100903A
Authority
KR
South Korea
Prior art keywords
network device
failure
management information
interface unit
manager
Prior art date
Application number
KR1020210190572A
Other languages
Korean (ko)
Other versions
KR102623414B1 (en
Inventor
정정문
박성진
윤재호
Original Assignee
스트라토 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 스트라토 주식회사 filed Critical 스트라토 주식회사
Priority to KR1020210190572A priority Critical patent/KR102623414B1/en
Publication of KR20230100903A publication Critical patent/KR20230100903A/en
Application granted granted Critical
Publication of KR102623414B1 publication Critical patent/KR102623414B1/en

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0695Management of faults, events, alarms or notifications the faulty arrangement being the maintenance, administration or management system
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04QSELECTING
    • H04Q1/00Details of selecting apparatus or arrangements
    • H04Q1/18Electrical details
    • H04Q1/20Testing circuits or apparatus; Circuits or apparatus for detecting, indicating, or signalling faults or troubles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/02Details
    • H04L12/12Arrangements for remote connection or disconnection of substations or of equipment thereof
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/04Network management architectures or arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/22Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks comprising specially adapted graphical user interfaces [GUI]

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer And Data Communications (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Maintenance And Management Of Digital Transmission (AREA)

Abstract

본 발명은 네트워크 장치 장애 처리를 위한 시스템 및 그 제어방법에 관한 것이다. 본 발명에 따른 장애 관리 시스템은, 원격 마이크로 데이터 센터 내에 설치된 적어도 하나의 네트워크 장치와 통신하는 장애 관리 시스템에 있어서, 관리자 장치와 통신하는 관리자 인터페이스부와; 상기 관리자 인터페이스부를 통해 수신된 장치 관리 정보를 저장하는 관리 정보 저장부와; 상기 네트워크 장치 각각과 통신하는 개별 제어 모듈을 구비한 네트워크 장치 인터페이스부와; 상기 관리 정보 저장부에 저장된 장치 관리 정보를 이용하여 상기 네트워크 장치 인터페이스부를 통해 상기 적어도 하나의 네트워크 장치에 대한 장애 처리를 수행하는 장치 관리부를 포함하는 것을 특징으로 한다.The present invention relates to a system for handling network device failure and a control method thereof. A failure management system according to the present invention is a failure management system communicating with at least one network device installed in a remote micro data center, comprising: a manager interface unit communicating with a manager device; a management information storage unit for storing device management information received through the manager interface unit; a network device interface unit having individual control modules communicating with each of the network devices; and a device management unit configured to perform failure processing for the at least one network device through the network device interface unit using the device management information stored in the management information storage unit.

Description

네트워크 장치 장애 처리를 위한 시스템 및 그 제어방법{FAULT HANDLING SYSTEM FOR NETWORK APPARATUS AND CONTROL METHOD THEREOF}System and control method for handling network device failure {FAULT HANDLING SYSTEM FOR NETWORK APPARATUS AND CONTROL METHOD THEREOF}

본 발명은 네트워크 장치 장애 처리를 위한 시스템 및 그 제어방법에 관한 것으로, 보다 상세하게는 원격지의 마이크로 데이터 센터 내에 있는 각종 장치들에 대한 장애 처리를 수행하는 시스템 및 그 제어방법에 관한 것이다.The present invention relates to a system for handling network device failure and a control method thereof, and more particularly, to a system and control method for performing failure handling of various devices in a remote micro data center.

최근 클라우드 엣지, 5G 이동통신 등의 산업이 부각되면서, 시스템의 Latency 최소화가 중요한 이슈가 되고 있으며, 이로 인하여 기존의 대형 IDC에서 소형화된 마이크로 데이터센터가 급부상하고 있다.Recently, as industries such as cloud edge and 5G mobile communication have emerged, minimizing system latency has become an important issue, and for this reason, miniaturized micro data centers are rapidly emerging from existing large IDCs.

마이크로 데이터센터는 필요한 시스템만 소형으로 놓여 무인으로 원격지에서 운영이 되며, 필요에 따라 다양한 하드웨어가 운용되고 있다.In the micro data center, only the necessary systems are placed in a small size and operated unattended and remotely, and various hardware is operated as needed.

이러한 마이크로 데이터센터는 일반적으로 원격지에 위치하고, 저 비용으로 유지하기 위해 무인으로 운영되어 문제 발생 시 즉시 대응이 불가하다는 단점이 있다.These micro data centers are generally located in remote locations and are operated unmanned to maintain low cost, so they have the disadvantage of not being able to respond immediately when a problem occurs.

또한 다양한 하드웨어가 운영되어 하드웨어가 추가될 때 마다 장애 처리 절차가 상이하게 되어 전문 지식이 있지 않은 이상 쉽게 장애 처리가 힘들다.In addition, since various hardware is operated and the failure handling procedure is different whenever hardware is added, it is difficult to handle failure easily unless there is specialized knowledge.

등록특허 제10-1545215호Registered Patent No. 10-1545215

본 발명은 상기한 종래의 단점을 해결하기 위해 안출된 것으로서, 그 목적은 마이크로 데이터 센터 내에 구비된 각종 장치들의 장애 처리를 원격지에서 용이하게 처리할 수 있도록 하는 시스템 및 그 제어방법을 제공하는 것이다.The present invention has been made to solve the above conventional disadvantages, and its object is to provide a system and a control method for easily handling failures of various devices provided in a micro data center from a remote location.

상기한 목적을 달성하기 위해 본 발명에 따른 장애 관리 시스템은, 원격 마이크로 데이터 센터 내에 설치된 적어도 하나의 네트워크 장치와 통신하는 장애 관리 시스템에 있어서, 관리자 장치와 통신하는 관리자 인터페이스부와; 상기 관리자 인터페이스부를 통해 수신된 장치 관리 정보를 저장하는 관리 정보 저장부와; 상기 네트워크 장치 각각과 통신하는 개별 제어 모듈을 구비한 네트워크 장치 인터페이스부와; 상기 관리 정보 저장부에 저장된 장치 관리 정보를 이용하여 상기 네트워크 장치 인터페이스부를 통해 상기 적어도 하나의 네트워크 장치에 대한 장애 처리를 수행하는 장치 관리부를 포함할 수 있다.In order to achieve the above object, a failure management system according to the present invention communicates with at least one network device installed in a remote micro data center, comprising: a manager interface unit communicating with a manager device; a management information storage unit for storing device management information received through the manager interface unit; a network device interface unit having individual control modules communicating with each of the network devices; and a device management unit configured to perform failure processing for the at least one network device through the network device interface unit using device management information stored in the management information storage unit.

여기서, 상기 관리 정보 저장부에 저장되는 장치 관리 정보에는 각 네트워크 장치에 접속하기 위한 장치 접속 정보가 포함될 수 있다.Here, the device management information stored in the management information storage unit may include device access information for accessing each network device.

여기서, 상기 장치 관리부는 상기 관리 정보 저장부에 저장된 접속 정보를 기초로 상기 네트워크 장치 인터페이스부를 이용하여 상기 적어도 하나의 네트워크 장치에 대한 장애 처리를 수행할 수 있다.Here, the device management unit may perform failure processing for the at least one network device using the network device interface unit based on access information stored in the management information storage unit.

여기서, 상기 네트워크 장치 인터페이스부는 상기 장치 관리부의 제어에 따라 장애 처리 대상인 네트워크 장치에 대응되는 개별 제어 모듈을 선정하고, 그 선정된 개별 제어 모듈을 이용하여 네트워크 장치에 대한 장애 처리를 위한 신호를 전송할 수 있다.Here, the network device interface unit selects an individual control module corresponding to a network device to be processed for failure under the control of the device manager, and transmits a signal for processing a failure of the network device using the selected individual control module. there is.

또, 상기한 목적을 달성하기 위해 본 발명에 따른 장애 관리 시스템의 제어방법은, 원격 마이크로 데이터 센터 내에 설치된 적어도 하나의 네트워크 장치와 통신하는 장애 관리 시스템의 제어방법에 있어서, 기 구비된 관리자 인터페이스부를 통해 관리자 장치로부터 수신된 장치 관리 정보를 저장하는 단계와; 상기 관리 정보 저장부에 저장된 장치 관리 정보를 이용하여 각 네트워크 장치에 대한 장애 처리를 수행하는 단계를 포함할 수 있다.In addition, in order to achieve the above object, the control method of a failure management system according to the present invention is a control method of a failure management system communicating with at least one network device installed in a remote micro data center, comprising a manager interface storing the device management information received from the manager device through the; and performing failure processing for each network device using device management information stored in the management information storage unit.

여기서, 상기 관리 정보 저장부에 저장되는 장치 관리 정보에는 각 네트워크 장치에 접속하기 위한 장치 접속 정보가 포함될 수 있다.Here, the device management information stored in the management information storage unit may include device access information for accessing each network device.

여기서, 장애 처리 대상인 네트워크 장치에 대응되는 개별 제어 모듈을 선정하고, 그 선정된 개별 제어 모듈을 통해 장애 처리를 위한 신호를 전송할 수 있다.Here, an individual control module corresponding to a network device to be processed for failure may be selected, and a signal for processing failure may be transmitted through the selected individual control module.

이상 설명한 바와 같이 본 발명에 따르면, 마이크로 데이터센터 등에 구비된 각종 네트워크 장치들에 대해 장애가 발생한 경우, 원격지에서 해당 네트워크 장치들에 대한 장애 처리를 수행할 수 있다.As described above, according to the present invention, when a failure occurs in various network devices installed in a micro data center, it is possible to perform failure handling for the corresponding network devices at a remote location.

특히, 각 네트워크 장치들에 대응되는 추상화된 개별 제어 모듈이 장애 관리 시스템에 구비됨으로써, 다양한 네트워크 장치들에 대해서도장애 처리를 수행할 수 있다.In particular, since an abstracted individual control module corresponding to each network device is provided in the failure management system, it is possible to perform failure processing for various network devices.

즉, 다양한 하드웨어(네트워크 장치) 관리를 plug-in 구조로 추상화를 제공함으로써 일원화된 장에 처리 방법을 제공할 수 있고, 기존 마이크로 데이터센터 관리 시스템(예를 들어 관리자 장치)과의 연동 인터페이스를 제공함으로 효율적인 관리 및 연동 개발이 용이하다. 이에 따라 경제적, 시간적 이득이 발생할 수 있다.In other words, by providing abstraction of various hardware (network device) management as a plug-in structure, it is possible to provide a processing method in a unified field, and to provide an interworking interface with an existing micro data center management system (eg, manager device). Therefore, efficient management and interlocking development are easy. Accordingly, economic and time benefits may occur.

도 1은 본 발명의 일 실시예에 따른 장애 관리 시스템을 포함하는 전체 시스템의 개략 구성도이고,
도 2는 도 1의 장애 관리 시스템의 기능 블록도이고,
도 3은 도 2의 장애 관리 시스템의 네트워크 장치 인터페이스부와 마이크로 데이터센터 내의 네트워크 장치들 간의 관계를 설명하기 위한 도면이고,
도 4는 본 발명의 일 실시예에 따른 장애 관리 시스템의 제어흐름도이다.
1 is a schematic configuration diagram of an entire system including a failure management system according to an embodiment of the present invention;
2 is a functional block diagram of the failure management system of FIG. 1;
3 is a diagram for explaining the relationship between a network device interface unit of the failure management system of FIG. 2 and network devices in a micro data center;
4 is a control flow diagram of a failure management system according to an embodiment of the present invention.

이하에서는 첨부도면을 참조하여 본 발명에 대해 상세히 설명한다.Hereinafter, the present invention will be described in detail with reference to the accompanying drawings.

이하 본 발명에 따른 각 실시예는 본 발명의 이해를 돕기 위한 하나의 예에 불과하고, 본 발명이 이러한 실시예에 한정되는 것은 아니다. 특히 본 발명은 각 실시예에 포함되는 개별 구성, 개별 기능, 또는 개별 단계 중 적어도 어느 하나 이상의 조합으로 구성될 수 있다.Hereinafter, each embodiment according to the present invention is only one example to aid understanding of the present invention, and the present invention is not limited to these embodiments. In particular, the present invention may be composed of at least one or more combinations of individual components, individual functions, or individual steps included in each embodiment.

특히, 편의상 청구 범위의 일부 청구항에는 '(a)'와 같은 알파벳을 포함시켰으나, 이러한 알파벳이 각 단계의 순서를 규정하는 것은 아니다.In particular, although alphabets such as '(a)' are included in some claims of the claims for convenience, these alphabets do not prescribe the order of each step.

일 실시예에 따른 일 실시예에 따른 장애 관리 시스템(100)을 포함하는 전체 시스템의 개략 구성은 도 1에 도시된 바와 같다.A schematic configuration of the entire system including the failure management system 100 according to an embodiment according to an embodiment is as shown in FIG.

동 도면에서, 복수 개의 마이크로 데이터 센터(200)에 적어도 하나의 네트워크 장치가 구비되어 있는데, 여기서 각 네트워크 장치들은 소정의 서비스를 제공하는 서버, 스위치, 저장장치, PDU(Power Distribution Unit) 등이 포함될 수 있다.In the figure, at least one network device is provided in a plurality of micro data centers 200, where each network device includes a server, a switch, a storage device, a power distribution unit (PDU), etc. that provide a predetermined service. can

예를 들어 마이크로 데이터센터(200)가 각 랙 단위로 구성되어 있는 경우, 상술한 서버, 스위치, 저장장치, PDU 는 해당 랙에 마운트 되어 있을 수 있다.For example, when the micro data center 200 is configured in units of racks, the above-described servers, switches, storage devices, and PDUs may be mounted in the corresponding racks.

이처럼 마이크로 데이터센터(200) 내에 구비된 네트워크 장치들은 모두 외부 장치(특히, 본 발명에 따른 장애 관리 시스템(100))와 통신할 수 있도록 구성될 수 있다.As such, all network devices provided in the micro data center 200 may be configured to communicate with external devices (in particular, the failure management system 100 according to the present invention).

여기서, 마이크로 데이터 센터(200)는 앞서 언급한 바와 같이 엣지 컴퓨팅 환경에서 스토리지, 프로세싱, 네트워킹 등 안전한 컴퓨팅 인프라 환경을 제공하는 통합 랙 솔루션을 의미하는 것으로서, 데이터센터 인프라에 필수적인 전력, 쿨링, 보안, 원격감시, 인프라 관리 등의 사전 조립 및 테스트가 완료된 소형 데이터센터에 해당한다. 즉, 안전하면서도 소형화된 데이터센터라고 할 수 있는데, 마이크로 데이터 센터(200)의 구성 및 기능 그 자체는 공지된 기술에 해당하므로 보다 상세한 설명은 생략한다.Here, the micro data center 200, as mentioned above, means an integrated rack solution that provides a secure computing infrastructure environment such as storage, processing, and networking in an edge computing environment. It corresponds to a small data center that has been pre-assembled and tested for remote monitoring and infrastructure management. That is, it can be said to be a safe and miniaturized data center. Since the configuration and functions of the micro data center 200 per se correspond to well-known technologies, a detailed description thereof will be omitted.

한편, 관리자 장치(300)는 관리자가 조작하는 장치로서, 예를 들어 마이크로 데이터센터(200)에 구비된 각 네트워크 장치에 접속하거나 관리하기 위한 관리 방식 등을 결정하는 각종 정보를 입력하는 장치에 해당한다.On the other hand, the manager device 300 is a device operated by a manager, and corresponds to, for example, a device for inputting various information for determining a management method for accessing or managing each network device provided in the micro data center 200. do.

도 1에서는 장애 관리 시스템(100)과 관리자 장치(300)가 물리적으로 분리되어 있는 것을 일예로 하였으나, 동일한 물리적 장치(서버 등)에서 이러한 장애 관리 시스템(100) 및 관리자 장치(300)의 모든 기능들이 구현될 수도 있음은 물론이다.In FIG. 1, it is taken as an example that the failure management system 100 and the manager device 300 are physically separated, but all functions of the failure management system 100 and the manager device 300 are in the same physical device (such as a server). Of course, they may be implemented.

본 발명의 일 실시예에 따른 장애 관리 시스템(100)은 적어도 하나의 마이크로 데이터센터(200)에 구비된 각종 네트워크 장치와 통신하여 각 네트워크 장치를 관리하는 것으로서, 특히 각 네트워크 장치의 장애 발생시 이를 처리하는 기능을 수행한다.The failure management system 100 according to an embodiment of the present invention communicates with various network devices provided in at least one micro data center 200 to manage each network device, and in particular, processes it when a failure occurs in each network device. perform the function of

이러한 장애 관리 시스템(100)의 구체적인 기능 블록의 일 예가 도 2에 도시되었다.An example of a specific functional block of the failure management system 100 is shown in FIG. 2 .

동 도면에 도시된 바와 같이 장애 관리 시스템(100)은 관리자 인터페이스부(110), 관리 정보 저장부(120), 네트워크 장치 인터페이스부(130), 장치 관리부(140)를 포함하여 구성될 수 있다.As shown in the figure, the failure management system 100 may include a manager interface unit 110, a management information storage unit 120, a network device interface unit 130, and a device management unit 140.

관리자 인터페이스부(110)는 관리자 장치(300)와 통신하는 기능을 수행한다.The manager interface unit 110 performs a function of communicating with the manager device 300 .

특히 관리자 인터페이스부(110)는 관리자 장치(300)로부터 마이크로 데이터센터(200)에 구비된 네트워크 장치를 제어하기 위해 필요한 각종 정보(이하, '장치 관리 정보'라 함)를 수신할 수 있다.In particular, the manager interface unit 110 may receive various types of information (hereinafter, referred to as 'device management information') required to control the network device included in the micro data center 200 from the manager device 300 .

관리 정보 저장부(120)는 관리자 인터페이스부(110)를 통해 수신된 장치 관리 정보를 저장하는 기능을 수행한다.The management information storage unit 120 performs a function of storing device management information received through the manager interface unit 110 .

이러한 관리 정보 저장부(120)에 저장되는 장치 관리 정보에는 각 네트워크 장치에 접속하기 위한 장치 접속 정보가 포함될 수 있다.Device management information stored in the management information storage unit 120 may include device access information for accessing each network device.

여기서 장치 접속 정보는 각 네트워크 장치의 종류, 인터넷 주소나 각 네트워크 장치에 접속 및 로그인하기 위한 계정 정보(로그인 아이디, 패스워드 등) 등이 포함될 수 있다.Here, the device access information may include the type of each network device, an Internet address, or account information (login ID, password, etc.) for accessing and logging in to each network device.

네트워크 장치 인터페이스부(130)는 적어도 하나의 네트워크 장치와 통신하는 기능을 수행한다.The network device interface unit 130 performs a function of communicating with at least one network device.

즉, 상술한 바와 같이 장애 관리 시스템(100)은 각 네트워크 장치와 통신을 수행하는데, 이때 네트워크 장치 인터페이스부(130)를 통해 통신을 수행하는 것이다. 소정의 인터페이스를 통해 네트워크상의 장치와 통신하는 것 자체는 공지된 기술에 불과하므로 보다 상세한 설명은 생략한다.That is, as described above, the failure management system 100 communicates with each network device, and at this time, the communication is performed through the network device interface unit 130 . Since communicating with a device on a network through a predetermined interface is only a well-known technique, a detailed description thereof will be omitted.

다만, 본 실시예에서 네트워크 장치 인터페이스부(130)는 네트워크 장치 각각과 통신하는 개별 제어 모듈을 구비하는 특징이 있다.However, in this embodiment, the network device interface unit 130 is characterized by having individual control modules communicating with each network device.

예를 들어 A사 스위치, B사 스위치, A사 PDU, B사 PUD 등 각각이 별도의 개별 제어 모듈로 구비되어 대응되는 네트워크 장치(즉, 스위치, PDU 등)와 통신할 수 있는 것이다.For example, a company A switch, a company B switch, a company PDU, and a company B PUD are provided as separate individual control modules and can communicate with corresponding network devices (ie, switches, PDUs, etc.).

특히, 네트워크 장치 인터페이스부(130)는 장치 관리부(140)의 제어에 따라 장애 처리 대상인 네트워크 장치에 대응되는 개별 제어 모듈을 선정하고, 그 선정된 개별 제어 모듈을 이용하여 네트워크 장치에 대한 장애 처리를 위한 신호를 전송할 수 있다.In particular, the network device interface unit 130 selects an individual control module corresponding to a network device to be processed for failure under the control of the device manager 140, and performs failure processing for the network device using the selected individual control module. signal can be transmitted.

참고로 도 3에는 네트워크 장치 인터페이스부(130)에 구비된 각 개별 제어 모듈의 예와 이들 개별 제어 모듈에 의해 제어되는 마이크로 데이터센터(200) 내의 네트워크 장치들의 관계를 나타내고 있다.For reference, FIG. 3 shows an example of each individual control module included in the network device interface unit 130 and a relationship between network devices in the micro data center 200 controlled by these individual control modules.

즉, 도 3에서 A사 스위치 제어 모듈, B사 스위치 제어 모듈, A사 PDU 제어 모듈, B사 PUD 제어 모듈은 각각의 개별 제어 모듈이고, 이 중에서 A사 스위치 제어 모듈은 제1 마이크로 데이터센터(200)에 있는 A사 스위치 및 제2 마이크로 데이터센터(200)에 있는 A사 스위치를 제어하기 위한 일종의 추상화된 인터페이스이고, B사 PDU 제어 모듈은 제1 마이크로 데이터센터(200) 내에 있는 B사 PDU를 제어하기 위한 추상화된 인터페이스이며, A사 PDU 제어 모듈은 제2 마이크로 데이터센터(200) 내에 있는 A사 PDU를 제어하기 위한 추상화된 인터페이스이다.That is, in FIG. 3, the company A switch control module, the company B switch control module, the company A PDU control module, and the company B PUD control module are individual control modules, among which the company A switch control module is the first micro data center ( 200) and the company A switch in the second micro data center 200. The company B PDU control module is a company B PDU in the first micro data center 200. is an abstracted interface for controlling, and the Company A PDU control module is an abstracted interface for controlling the PDUs of Company A in the second micro data center (200).

이처럼 네트워크 장치 인터페이스부(130)는 추상화된 인터페이스일 뿐만 아니라, plug-in 구조로 이루어져서 착탈이 용이하게 이루어질 수 있다.As such, the network device interface unit 130 is not only an abstracted interface, but also has a plug-in structure, so that it can be easily attached or detached.

장치 관리부(140)는 관리 정보 저장부(120)에 저장된 데이터 관리 정보를 이용하여 장치 인터페이스부를 통해 상기 적어도 하나의 네트워크 장치에 대한 장애 처리를 수행하는 기능을 수행한다.The device management unit 140 performs a function of performing failure processing for the at least one network device through the device interface unit using data management information stored in the management information storage unit 120 .

예를 들어 장치 관리부(140)는 관리 정보 저장부(120)에 저장된 접속 정보를 기초로 장치 인터페이스부를 이용하여 적어도 하나의 네트워크 장치에 대한 장애 처리를 수행할 수 있다.For example, the device management unit 140 may perform failure processing for at least one network device using the device interface unit based on access information stored in the management information storage unit 120 .

이하에서는 도 4를 참조하여 본 발명의 일 실시예에 따른 장애 관리 시스템(100)의 제어흐름을 설명한다.Hereinafter, a control flow of the failure management system 100 according to an embodiment of the present invention will be described with reference to FIG. 4 .

우선, 장애 관리 시스템(100)은 관리자 장치(300)와 통신하는 관리자 인터페이스부(110)를 통해 장치 관리 정보를 저장한다(단계 S1).First, the failure management system 100 stores device management information through the manager interface unit 110 communicating with the manager device 300 (step S1).

여기서 장치 관리 정보에는 앞서 설명한 바와 같이 각 네트워크 장치에 접속하기 위한 장치 접속 정보 및 그에 대응되는 네트워크 장치 식별자 등이 포함될 수 있다.As described above, the device management information may include device access information for accessing each network device and a network device identifier corresponding thereto.

이어서 장애 관리 시스템(100)은 마이크로 데이터센터(200) 내의 소정의 네트워크 장치의 장애 발생이 감지된 경우(단계 S3), 그 감지된 네트워크 장치에 대응되는 장치 접속 정보를 추출한다(단계 S5).Subsequently, when failure of a predetermined network device within the micro data center 200 is detected (step S3), the failure management system 100 extracts device access information corresponding to the detected network device (step S5).

예를 들어 각 네트워크 장치가 주기적으로 소정의 신호를 전송하도록 설정되어 있는 상태에서, 그 설정된 신호가 설정된 시점에 수신되지 않는 경우, 장애 관리 시스템(100)은 해당 네트워크 장치에 장애가 발생한 것으로 판단하여 해당 장애가 발생한 장치에 대응되는 장치 접속 정보를 추출하는 것이다.For example, in a state in which each network device is set to periodically transmit a predetermined signal, if the set signal is not received at the set time, the failure management system 100 determines that a failure has occurred in the corresponding network device, and This is to extract device access information corresponding to a device that has a failure.

이어서 장애 관리 시스템(100)은 추출한 장치 접속 정보에 대응되는 개별 제어 모듈을 선정한다(단계 S7).Subsequently, the failure management system 100 selects an individual control module corresponding to the extracted device access information (step S7).

앞서 설명한 바와 같이 각 네트워크 장치에 접속하기 위한 인터페이스들이 개별적으로 구성(개별 제어 모듈로 추상화되어 구성)되어 있으므로, 해당하는 개별 제어 모듈을 선정하는 것이다.As described above, since the interfaces for accessing each network device are individually configured (abstracted and configured as individual control modules), the corresponding individual control module is selected.

이어서 장애 관리 시스템(100)은 선정된 개별 제어 모듈을 통해 장애가 발생한 것으로 판단된 네트워크 장치를 제어한다(단계 S9).Subsequently, the failure management system 100 controls the network device determined to have a failure through the selected individual control module (step S9).

예를 들어 장애 관리 시스템(100)은 장애가 발생한 것으로 판단된 네트워크 장치에 접속하여 기 설정된 처리를 수행한다.For example, the failure management system 100 accesses the network device determined to have a failure and performs a preset process.

본 실시예에서는 장애 관리 시스템(100)이 장애가 발생한 네트워크 장치에 직접 필요한 제어 조치를 취하는 것을 일 예로 하였으나, 각 마이크로 데이터센터(200) 별로 특정 네트워크 장치를 통해 나머지 네트워크 장치에 대한 장애 처리를 수행하도록 구성될 수도 있다.In the present embodiment, an example is that the failure management system 100 directly takes necessary control measures for a network device that has a failure, but the failure handling for the remaining network devices is performed through a specific network device for each micro data center 200. may be configured.

이 경우 각 마이크로 데이터센터(200)에 구비된 각 네트워크 장치 중 어느 하나에 상술한 네트워크 장치 인터페이스부(130)와 통신을 수행하는 에이전트 프로그램을 실행시키고, 네트워크 장치 인터페이스부(130)와 이러한 에이전트 프로그램 간의 통신에 의해 다른 네트워크 장치에 대한 장애 처리를 수행할 수 있는 것이다.In this case, an agent program that communicates with the above-described network device interface unit 130 is executed on any one of the network devices provided in each micro data center 200, and the network device interface unit 130 and this agent program It is possible to perform failure processing for other network devices by intercommunication.

예를 들어 장애 관리 시스템(100)이 특정 마이크로 데이터센터(200)에 구비된 네트워크 장치에 장애가 발생한 것으로 판단되는 경우, 해당 마이크로 데이터센터(200)에서 상술한 에이전트 프로그램이 실행되는 네트워크 장치에 대응되는 개별 제어 모듈을 선정하고, 그 선정된 개별 제어 모듈을 통해 장애 처리 제어 신호를 전송하는 것이다.For example, when the failure management system 100 determines that a network device provided in a specific micro data center 200 has a failure, the corresponding micro data center 200 corresponds to the network device in which the above-described agent program is executed. An individual control module is selected, and a failure handling control signal is transmitted through the selected individual control module.

이에 따라 상술한 에이전트 프로그램이 실행되고 있는 네트워크 장치는 장애 관리 시스템(100)의 제어에 따라 같은 마이크로 데이터센터(200)에 구비된 장애가 발생된 다른 네트워크 장치에 대한 장애 제어 처리(일 예로 전원 리부팅 등)를 수행할 수 있다.Accordingly, the network device on which the above-described agent program is executed performs a failure control process (for example, power rebooting, etc. ) can be performed.

한편, 상술한 각 실시예를 수행하는 과정은 소정의 기록 매체(예를 들어 컴퓨터로 판독 가능한)에 저장된 프로그램 또는 애플리케이션에 의해 이루어질 수 있음은 물론이다. 여기서 기록 매체는 RAM(Random Access Memory)과 같은 전자적 기록 매체, 하드 디스크와 같은 자기적 기록 매체, CD(Compact Disk)와 같은 광학적 기록 매체 등을 모두 포함한다.Meanwhile, it goes without saying that the process of performing each of the above-described embodiments may be performed by a program or application stored in a predetermined recording medium (for example, computer-readable). Here, the recording medium includes all of an electronic recording medium such as RAM (Random Access Memory), a magnetic recording medium such as a hard disk, an optical recording medium such as a CD (Compact Disk), and the like.

이때, 기록 매체에 저장된 프로그램은 컴퓨터나 스마트폰 등과 같은 하드웨어 상에서 실행되어 상술한 각 실시예를 수행할 수 있다. 특히, 상술한 본 발명에 따른 장애 관리 시스템의 기능 블록 중 적어도 어느 하나는 이러한 프로그램 또는 애플리케이션에 의해 구현될 수 있다.At this time, the program stored in the recording medium may be executed on hardware such as a computer or smart phone to perform each of the above-described embodiments. In particular, at least one of the function blocks of the failure management system according to the present invention described above may be implemented by such a program or application.

또한, 본 발명은 상기한 특정 실시예에 한정되는 것이 아니라 본 발명의 요지를 벗어나지 않는 범위 내에서 여러 가지로 변형 및 수정하여 실시할 수 있는 것이다. 이러한 변형 및 수정이 첨부되는 청구범위에 속한다면 본 발명에 포함된다는 것은 자명할 것이다. In addition, the present invention is not limited to the specific embodiment described above, but can be implemented by various modifications and variations within the scope of the present invention. It will be apparent that such variations and modifications are included in the present invention provided they come within the scope of the appended claims.

100 : 장애 관리 시스템 200 : 마이크로 데이터센터
300 : 관리자 장치 110 : 관리자 인터페이스부
120 : 관리 정보 저장부 130 : 네트워크 장치 인터페이스부
140 : 장치 관리부
100: failure management system 200: micro data center
300: manager device 110: manager interface unit
120: management information storage unit 130: network device interface unit
140: device management unit

Claims (9)

원격 마이크로 데이터 센터 내에 설치된 적어도 하나의 네트워크 장치와 통신하는 장애 관리 시스템에 있어서,
관리자 장치와 통신하는 관리자 인터페이스부와;
상기 관리자 인터페이스부를 통해 수신된 장치 관리 정보를 저장하는 관리 정보 저장부와;
상기 네트워크 장치 각각과 통신하는 개별 제어 모듈을 구비한 네트워크 장치 인터페이스부와;
상기 관리 정보 저장부에 저장된 장치 관리 정보를 이용하여 상기 네트워크 장치 인터페이스부를 통해 상기 적어도 하나의 네트워크 장치에 대한 장애 처리를 수행하는 장치 관리부를 포함하는 것을 특징으로 하는 장애 관리 시스템.
A failure management system communicating with at least one network device installed in a remote micro data center, comprising:
a manager interface unit communicating with the manager device;
a management information storage unit for storing device management information received through the manager interface unit;
a network device interface unit having individual control modules communicating with each of the network devices;
and a device management unit configured to perform failure processing for the at least one network device through the network device interface unit using the device management information stored in the management information storage unit.
제1항에 있어서,
상기 관리 정보 저장부에 저장되는 장치 관리 정보에는 각 네트워크 장치에 접속하기 위한 장치 접속 정보가 포함되는 것을 특징으로 하는 장애 관리 시스템.
According to claim 1,
The device management information stored in the management information storage unit includes device access information for accessing each network device.
제2항에 있어서,
상기 장치 관리부는 상기 관리 정보 저장부에 저장된 접속 정보를 기초로 상기 네트워크 장치 인터페이스부를 이용하여 상기 적어도 하나의 네트워크 장치에 대한 장애 처리를 수행하는 것을 특징으로 하는 장애 관리 시스템.
According to claim 2,
Wherein the device management unit performs failure processing for the at least one network device using the network device interface unit based on access information stored in the management information storage unit.
제3항에 있어서,
상기 네트워크 장치 인터페이스부는 상기 장치 관리부의 제어에 따라 장애 처리 대상인 네트워크 장치에 대응되는 개별 제어 모듈을 선정하고, 그 선정된 개별 제어 모듈을 이용하여 네트워크 장치에 대한 장애 처리를 위한 신호를 전송하는 것을 특징으로 하는 장애 관리 시스템.
According to claim 3,
The network device interface unit selects an individual control module corresponding to a network device to be processed for failure under the control of the device manager, and transmits a signal for processing a failure of the network device using the selected individual control module. failure management system.
원격 마이크로 데이터 센터 내에 설치된 적어도 하나의 네트워크 장치와 통신하는 장애 관리 시스템의 제어방법에 있어서,
(a) 기 구비된 관리자 인터페이스부를 통해 관리자 장치로부터 수신된 장치 관리 정보를 저장하는 단계와;
(b) 상기 관리 정보 저장부에 저장된 장치 관리 정보를 이용하여 각 네트워크 장치에 대한 장애 처리를 수행하는 단계를 포함하는 것을 특징으로 하는 장애 관리 시스템의 제어방법.
A control method of a failure management system communicating with at least one network device installed in a remote micro data center,
(a) storing device management information received from a manager device through a previously provided manager interface unit;
(b) performing failure processing on each network device using the device management information stored in the management information storage unit.
제5항에 있어서,
상기 관리 정보 저장부에 저장되는 장치 관리 정보에는 각 네트워크 장치에 접속하기 위한 장치 접속 정보가 포함되는 것을 특징으로 하는 장애 관리 시스템의 제어방법.
According to claim 5,
The device management information stored in the management information storage unit includes device access information for accessing each network device.
제5항에 있어서,
상기 (b) 단계에서는 장애 처리 대상인 네트워크 장치에 대응되는 개별 제어 모듈을 선정하고, 그 선정된 개별 제어 모듈을 통해 장애 처리를 위한 신호를 전송하는 것을 특징으로 하는 장애 관리 시스템의 제어방법.
According to claim 5,
In the step (b), an individual control module corresponding to a network device to be processed for failure is selected, and a signal for processing the failure is transmitted through the selected individual control module.
제5항 내지 제7항 중 어느 한 항의 방법을 실행시키기 위한 프로그램을 기록한 컴퓨터 판독 가능 기록 매체.A computer-readable recording medium recording a program for executing the method of any one of claims 5 to 7. 하드웨어와 결합되어 제5항 내지 제7항 중 어느 한 항의 방법을 실행시키기 위하여 컴퓨터 판독 가능 기록 매체에 저장된 응용 프로그램.An application program stored in a computer readable recording medium to be combined with hardware to execute the method of any one of claims 5 to 7.
KR1020210190572A 2021-12-29 2021-12-29 Fault handling system for network apparatus and control method thereof KR102623414B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020210190572A KR102623414B1 (en) 2021-12-29 2021-12-29 Fault handling system for network apparatus and control method thereof

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020210190572A KR102623414B1 (en) 2021-12-29 2021-12-29 Fault handling system for network apparatus and control method thereof

Publications (2)

Publication Number Publication Date
KR20230100903A true KR20230100903A (en) 2023-07-06
KR102623414B1 KR102623414B1 (en) 2024-01-11

Family

ID=87185725

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020210190572A KR102623414B1 (en) 2021-12-29 2021-12-29 Fault handling system for network apparatus and control method thereof

Country Status (1)

Country Link
KR (1) KR102623414B1 (en)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20040082041A (en) * 2003-03-17 2004-09-24 시큐아이닷컴 주식회사 System and method for recovery of network trouble
KR101545215B1 (en) 2013-10-30 2015-08-18 삼성에스디에스 주식회사 system and method for automatically manageing fault events of data center
KR20190020944A (en) * 2017-08-22 2019-03-05 주식회사 케이티 Method for managing license of virtual network function and network service delivery system using the same
KR20210026554A (en) * 2019-08-30 2021-03-10 주식회사 케이티 Apparatus, method and computer program for determining error of network equipment based on self-learning
KR20210127560A (en) * 2020-04-14 2021-10-22 삼성전자주식회사 Apparatus and method of controlling management thereof

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20040082041A (en) * 2003-03-17 2004-09-24 시큐아이닷컴 주식회사 System and method for recovery of network trouble
KR101545215B1 (en) 2013-10-30 2015-08-18 삼성에스디에스 주식회사 system and method for automatically manageing fault events of data center
KR20190020944A (en) * 2017-08-22 2019-03-05 주식회사 케이티 Method for managing license of virtual network function and network service delivery system using the same
KR20210026554A (en) * 2019-08-30 2021-03-10 주식회사 케이티 Apparatus, method and computer program for determining error of network equipment based on self-learning
KR20210127560A (en) * 2020-04-14 2021-10-22 삼성전자주식회사 Apparatus and method of controlling management thereof

Also Published As

Publication number Publication date
KR102623414B1 (en) 2024-01-11

Similar Documents

Publication Publication Date Title
US8171142B2 (en) Data center inventory management using smart racks
US20200367057A1 (en) Single sign-in for iot devices
US11063835B2 (en) IoT cloud to cloud architecture
EP3575975B1 (en) Method and apparatus for operating smart network interface card
EP2832039B1 (en) Platform independent management controller
CN103401883A (en) Single sign-on method and system
US10616348B2 (en) System and method for providing multiple IPMI serial over LAN (SOL) sessions in management controller stack
CN105446657A (en) Method for monitoring RAID card
CN113765712B (en) Server management method, device, electronic equipment and readable storage medium
US10791032B2 (en) Method and apparatus for determining a physical position of a device
US7761468B2 (en) Supporting multiple security mechanisms in a database driver
CN107943622B (en) Standby operation and maintenance method, device and system
KR20230100903A (en) Fault handling system for network apparatus and control method thereof
CN107704354B (en) Test method for port virtualization of multi-control storage system
CN107688441B (en) Method and device for realizing storage virtualization
CN109728924A (en) The method and apparatus for obtaining the configuration information of host
CN112596429A (en) Control management system of intelligent cabinet
EP2450820B1 (en) User authentication system and plant control system having user authentication system
CN205121541U (en) But remote alarm and spare embedded system encrypt spare still original mounting
CN113193987B (en) Equipment control method and device
CN110850776B (en) Control method and control device of frame type equipment and frame type equipment
CN103907105B (en) Method for establishing client-host connection
KR100574894B1 (en) Method for processing communication of remote test unit in communication network management system
CN112015689A (en) Serial port output path switching method, system and device and switch
CN114912091A (en) KVM switcher with remote management control function and switching method

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right