KR20050001122A - System and method for recovery of network failure - Google Patents
System and method for recovery of network failure Download PDFInfo
- Publication number
- KR20050001122A KR20050001122A KR1020030042689A KR20030042689A KR20050001122A KR 20050001122 A KR20050001122 A KR 20050001122A KR 1020030042689 A KR1020030042689 A KR 1020030042689A KR 20030042689 A KR20030042689 A KR 20030042689A KR 20050001122 A KR20050001122 A KR 20050001122A
- Authority
- KR
- South Korea
- Prior art keywords
- failure
- equipment
- command
- network
- faulty
- Prior art date
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
Abstract
Description
본 발명은 IP 네트워크에서 운용중인 네트워크 구성 장비의 장애 처리를 위한 네트워크 상에서의 장애 처리 시스템 및 그 방법에 관한 것이다.The present invention relates to a system and method for processing a failure on a network for handling a failure of network component equipment operating in an IP network.
현재 많은 사람들이 PC와 같이 데이터 통신이 가능한 통신단말기를 이용하여 인터넷에 접속하여 인터넷에 산재해 있는 방대한 양의 정보를 공유하고 있다.Many people now use a communication terminal, such as a PC, to connect to the Internet and share vast amounts of information scattered on the Internet.
인터넷 사용이 급증하면서 인터넷 서비스의 고장이 빈번히 발생하는데, 가입자 측의 고장 발생 빈도가 전체 고장 신고의 약 80%에 해당한다.Due to the rapid increase in the use of the Internet, the failure of the Internet service frequently occurs, and the frequency of failures on the subscriber side corresponds to about 80% of all failure reports.
따라서, IP 네트워크 관련 운용 관리 시스템(Operation Support System, OSS)은 가입자 측에 발생한 인터넷 서비스 관련 장애를 해결하기 위해 고장신고가접수되면 고장수리 요원을 즉시 현장에 출동하도록 한다.Therefore, IP network-related Operation Support System (OSS) immediately dispatches troubleshooting personnel to the site when a failure report is received in order to solve an Internet service-related failure occurring on the subscriber side.
즉, IP 네트워크 관련 운용 관리 시스템에서는 네트워크 시스템 관련 장애 여부를 가입자가 상담원에게 전화를 걸어서 장애 여부를 문의하고, 가입자로부터 장애신고를 접수한 상담원이 가입자가 사용하는 통신 단말기에 원격 접속한 후 운용자나 관리자에게 문의하여 최종 장애 여부를 확인하여 그 확인 결과를 다시 가입자에게 알려준다.That is, in the IP network related operation management system, the subscriber calls the agent to check whether the network system is related to the failure, and the agent who receives the failure report from the subscriber remotely accesses the communication terminal used by the subscriber. Check with the manager to confirm the final failure and notify the subscriber again.
이때, 가입자의 장비에 장애가 발생한 경우에, 고장수리 요원이 현장 출동하여 직접 가입자 장비를 고장 수리한다. 가입자 장비에 발생한 장애 중에서 일부 장애는 고장수리 요원의 현장 출동 없이 장비를 리셋(RESET)하거나 간단한 조치만으로 고장을 처리할 수 있다.At this time, in the event of a failure of the subscriber's equipment, a trouble-shooter dispatches the site and repairs the subscriber equipment directly. Some of the failures in the subscriber equipment can be resolved by simply resetting the equipment or taking simple actions, without the need for troubleshooting personnel onsite.
그런데, 종래 IP 네트워크 관련 운용 관리 시스템은 가입자 장비의 장애 상태에 상관없이 장애 발생 시마다 고장수리 요원이 출동해야 하므로 고장수리 요원의 출동횟수가 많아 시간과 고장수리비용이 많이 소요되며, 가입자 측면에서도 즉각적인 고장회복 처리가 되지 않아 불편하다는 문제점이 있다.However, the conventional IP network-related operation management system requires a troubleshooter to be dispatched every time a fault occurs regardless of the failure state of the subscriber equipment. There is a problem that the failure recovery process is not convenient
본 발명이 이루고자 하는 기술적 과제는 가입자 구간에서 발생한 장애를 발췌하여 즉각적으로 장애 복구 조치를 시도하고, 장애 복구되지 않는 장애에 대해 고장수리 요원의 출동을 요청함으로써 장애 처리에 대한 시간과 비용을 절감시키기 위한 네트워크 상에서의 장애 처리 시스템을 제공하는 것이다.The technical problem to be achieved by the present invention is to extract the failure occurred in the subscriber section to immediately attempt to take a failover action, and to reduce the time and cost for handling the failure by requesting the dispatch of troubleshooting personnel for the failure that does not recover It is to provide a fault handling system on a network.
도 1은 본 발명의 실시예에 따른 네트워크 상에서의 장애 처리 시스템의 구성을 도시한 것이다.1 illustrates a configuration of a failure handling system on a network according to an embodiment of the present invention.
도 2는 본 발명의 실시예에 따른 네트워크 상에서의 장애 처리 방법의 순서도를 도시한 것이다.2 is a flowchart illustrating a failure handling method on a network according to an embodiment of the present invention.
이러한 과제를 해결하기 위해 본 발명은 네트워크 장애 발생시 가입자 구간에서 발생한 장애를 발췌하여 즉각적으로 장애 회복 처리를 시도하고, 장애 회복 처리가 실패한 경우에 고장수리 요원의 현장 출동을 지시한다.In order to solve this problem, the present invention extracts a failure occurring in a subscriber section when a network failure occurs, and immediately attempts a failure recovery process, and instructs the dispatch of a troubleshooting agent when the failure recovery process fails.
본 발명의 첫 번째 특징에 따른 네트워크 상에서의 장애 처리 시스템 및 그 방법은, 가입자에게 인터넷 서비스를 제공하는 서비스 제공자가 네트워크 상에서의 장애 발생을 처리하는 네트워크 상에서의 장애 처리 시스템에 있어서, 상기 서비스 제공자는, 상기 다수의 가입자 회선에 접속된 네트워크 구성 장비의 장애 발생 여부를 검색하여 장애가 발생한 장비들 중에서 상기 가입자 구간에서 장애가 발생한 장비들을 검출하는 장애 장비 검색부; 상기 장애 검색부에서 검출된 가입자 구간에서의 장애 장비가 상기 서비스 제공자와 가입자간의 네트워크 관리를 담당하는 프로토콜을 지원하는 경우에, 해당 장비의 프로토콜 명령어를 검색하는 명령어 검색부; 상기 장애 검색부에서 검출된 장애 장비와 원격 접속하여 상기 명령어 검색부에서 검색된 명령어를 상기 장비에 적용하여 이상 유무를 판단하는 명령어 적용부; 상기 명령어 적용부에서 명령어가 적용된 장애 장비의 상태 정보를 수집, 분석하여 해당 장비의 장애 상태를 수집하여 최종 장애 상태를 확인하는 장애정보 처리부; 및 상기 장애정보 처리부에서 장비의 최종 장애 상태를 통해 상기 장애 장비의 고장이 회복되면 상기 장비의 장애를 해제하고, 상기 장애 장비의 고장이 회복되지 않은 경우에 고장수리 요원의 현장 출동을 요청하는 서비스 지원부를 포함한다.A failure handling system and a method on a network according to the first aspect of the present invention is a failure handling system on a network in which a service provider for providing an Internet service to a subscriber handles occurrence of a failure on the network. A faulty equipment searching unit configured to detect whether a fault occurs in the network component equipment connected to the plurality of subscriber lines, and to detect faulty equipments in the subscriber section among faulty equipments; A command search unit for searching for a protocol command of a corresponding device when a disabled device in a subscriber section detected by the fault search unit supports a protocol for managing a network between the service provider and the subscriber; A command application unit for remotely accessing a failure device detected by the failure search unit to determine whether there is an error by applying a command retrieved from the command search unit to the device; A failure information processing unit for collecting and analyzing state information of a failure device to which the command is applied by the command application unit to collect a failure state of the corresponding device to check a final failure state; And when the failure of the failure equipment is recovered through the last failure state of the equipment by the failure information processing unit, releasing the failure of the equipment, and requesting on-site dispatch of a troubleshooting agent when the failure of the failure equipment is not recovered. Includes support.
상기 서비스 제공자는 상기 네트워크 구성 장비 관련 시설, 원격 접속 및 장애 정보와, 상기 프로토콜 관련 지원 유/무, 및 명령어 세트(SET) 정보를 저장하는데이터베이스를 포함하는 것이 바람직하다.The service provider preferably includes a database storing the network configuration equipment related facilities, remote access and failure information, the protocol related support presence / absence, and instruction set information.
상기 장애 장비 검색부는, 상기 네트워크 구성 장비들 중에서 장애가 발생한 장애 장비를 검출하여 장애 테이블에 저장하는 장애 상태 검색 모듈; 및 상기 장애 상태 검색 모듈의 장애 테이블에서 장애 장비의 ID를 추출하여 가입자 구간에서 발생한 장애를 검출하는 가입자구간 장애 검출 모듈을 포함하는 것이 바람직하다.The faulty equipment search unit may include: a fault state search module configured to detect faulty equipment having a fault among the network components and store the faulty equipment in a fault table; And a subscriber section failure detection module for detecting a failure occurring in a subscriber section by extracting an ID of a failure device from a failure table of the failure state search module.
상기 명령어 검색부는, 상기 장애 장비가 네트워크를 관리하기 위한 SNMP(Simple Network Management Protocol)을 지원하는지를 판단하는 SNMP 지원 검색 모듈; 및 상기 SNMP 지원 검색 모듈을 통해 SNMP를 지원하는 장비에 적용하기 위한 SNMP-세트(SET) 명령어를 검색하는 명령어 검색 모듈을 포함하는 것이 바람직하다.The command search unit may include: an SNMP support search module configured to determine whether the disabled device supports a simple network management protocol (SNMP) for managing a network; And a command search module for searching for an SNMP-SET command for applying to a device that supports SNMP through the SNMP support search module.
상기 명령어 적용부는, 상기 장애 장비에 원격 접속을 위해 로그인(LOGIN)하는 원격 접속 모듈; 및 상기 원격 접속 모듈을 통해 상기 장애 장비와 원격 접속되면, 상기 명령어 검색부에서 검색된 명령어를 적용하여 이상 유무를 판단하는 명령어 적용 모듈을 포함하는 것이 바람직하다.The command application unit may include: a remote access module configured to log in to a remote device for remote access; And a command application module configured to determine whether there is an error by applying a command searched by the command search unit when the remote device is remotely connected with the failing device.
상기 서비스 지원부는, 상기 장애정보 처리부를 통해 상기 장애 장비의 최종 장애 상태가 고장 회복된 경우에 상기 장애 장비에 대한 장애를 해제하고, 상기 장애 장비의 고장이 회복되지 않은 경우에 고장 수리를 지시하는 장애 처리 모듈; 및 상기 장애 처리 모듈에서 고장 수리를 지시한 경우에 상기 장애 장비의 고장 수리를 위해 고장수리 요원을 수배하여 출동을 요청하는 고장수리 요청 모듈을 포함하는 것이 바람직하다.The service support unit releases the failure of the failure equipment when the failure state of the last failure equipment of the failure equipment is recovered through the failure information processing unit, and instructs troubleshooting when the failure of the failure equipment is not recovered. A fault handling module; And a troubleshooting request module for requesting dispatch by dispatching a troubleshooting agent to troubleshoot the faulty equipment when the fault handling module instructs fault repair.
본 발명의 두 번째 특징에 따른 네트워크 상에서의 장애 처리 시스템 및 그 방법은 .가입자에게 인터넷 서비스를 제공하는 서비스 제공자가 네트워크 상에서의 장애 발생을 처리하는 네트워크 상에서의 장애 처리 방법에 있어서, A) 상기 서비스 제공자는 네트워크 상에서 운용중인 네트워크 구성 장비의 상태 정보를 수집하여 장애 장비들을 검출하는 단계; B) 상기 A) 단계에서 검출된 장비 중에서 가입자 구간에서 장애가 발생한 장애 장비들을 발췌하여, 상기 장애 장비가 서비스 제공자와 가입자간의 네트워크 관리를 담당하는 프로토콜의 지원 여부를 검색하는 단계; C) 상기 B) 단계에서 장애 장비가 상기 프로토콜을 지원하는 경우에, 상기 장애 장비에 해당하는 명령어를 검색하고, 상기 장애 장비와 원격 접속을 통해 상기 명령어를 상기 장애 장비에 적용하는 단계; 및 D) 상기 C) 단계에서 상기 장애 장비에 명령어를 적용한 결과를 수집, 분석하여 상기 장애 장비의 최종 장애 상태를 판단하고, 고장수리 요원의 출동 여부를 결정하는 단계를 포함한다.A system and method for handling a failure on a network according to a second aspect of the present invention is a failure handling method on a network in which a service provider that provides an Internet service to subscribers handles occurrence of a failure on a network. The provider collects the state information of the network configuration equipment running on the network to detect the failure equipment; B) extracting the faulty equipments in which the fault occurs in the subscriber section among the equipment detected in step A), and searching whether the faulty equipment supports the protocol for managing the network between the service provider and the subscriber; C) if the faulty equipment supports the protocol in step B), searching for a command corresponding to the faulty equipment, and applying the command to the faulty equipment through a remote connection with the faulty equipment; And D) collecting and analyzing the result of applying the command to the faulty equipment in step C) to determine a final fault state of the faulty equipment, and to determine whether a fault repair agent is dispatched.
상기 B) 단계에서 가입자 구간에서의 장애 장비를 발췌하는 단계는, 상기 A) 단계에서 검출된 장애 장비들의 ID를 추출하여 각 장비의 ID와 상기 네트워크 구성 장비에 관한 시설 정보를 매칭시켜 가입자 구간에서 발생한 장애를 검출하는 것이 바람직하다.The extracting of the disabled equipment in the subscriber section in the step B) may include extracting IDs of the disabled devices detected in the step A), matching the ID of each device with facility information about the network configuration equipment, in the subscriber section. It is desirable to detect the disorder that has occurred.
상기 B) 단계에서 상기 장애 장비가 상기 프로토콜을 지원하지 않는 경우에, 상기 서비스 제공자는 고장수리 요원의 출동을 요청하는 것이 바람직하다.In the case where the failure equipment does not support the protocol in step B), it is preferable that the service provider requests the dispatch of a troubleshooting agent.
상기 C) 단계에서 상기 장애 장비에 명령어를 적용하는 단계는, 상기 장애 장비가 SNMP(Simple Network Management Protocol)을 지원하면, 상기 장애 장비에적용 가능한 SNMP-세트(SET) 명령어를 검색하고, 상기 장애 장비에 텔넷 로그인(TELNET LOGIN)하여 상기 명령어를 적용하는 것이 바람직하다.In the step C), when the command is applied to the faulty device, if the faulty device supports Simple Network Management Protocol (SNMP), a search for an SNMP-SET command applicable to the faulty device is performed. It is desirable to apply the above command by telnet login to the device.
상기 장애 장비에 텔넷 로그인이 실패하여 원격 접속되지 않는 경우에, 상기 서비스 제공자는 고장수리 요원의 출동을 요청하는 것이 바람직하다.In case the telnet login fails to remotely connect to the faulty equipment, the service provider may request the dispatch of a troubleshooting agent.
상기 D) 단계에서 고장수리 요원의 출동 여부를 결정하는 단계는, 상기 장애 장비의 최종 장애 상태가 고장 회복된 경우에 상기 장애 장비에 대한 장애를 해제하고, 상기 장애 장비의 고장이 회복되지 않은 경우에 고장수리 요원을 수배하여 해당 장비의 가입자 측에 방문을 요청하는 것이 바람직하다.In step D), determining whether or not a malfunctioning agent is dispatched may include: releasing the fault for the faulty equipment when the fault state of the faulty equipment is recovered from the fault, and failing to recover the faulty equipment. It is advisable to arrange for a repair agent to request a visit to the subscriber of the equipment.
상기 A) 단계에서 장애 장비를 검출하는 단계는, 상기 장애 장비들을 장애 테이블에 저장하고, 상기 가입자 구간에서의 장애 장비 이외의 장비들에 대해 상기 서비스 제공자 측에서 고장 수리 절차를 수행하는 것이 바람직하다.In the detecting of the failing equipment in step A), it is preferable to store the failing equipments in a fault table and to perform a troubleshooting procedure on the service provider side for equipment other than the failing equipment in the subscriber section. .
아래에서는 첨부한 도면을 참고로 하여 본 발명의 실시예에 대하여 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 상세히 설명한다. 그러나 본 발명은 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시예에 한정되지 않는다.DETAILED DESCRIPTION Hereinafter, exemplary embodiments of the present invention will be described in detail with reference to the accompanying drawings so that those skilled in the art may easily implement the present invention. As those skilled in the art would realize, the described embodiments may be modified in various different ways, all without departing from the spirit or scope of the present invention.
먼저, 본 발명의 실시예에 따른 네트워크 상에서의 장애 처리 시스템에 대하여 도 1을 참고로 하여 상세하게 설명한다.First, a failure processing system on a network according to an embodiment of the present invention will be described in detail with reference to FIG. 1.
도 1은 본 발명의 실시예에 따른 네트워크 상에서의 장애 처리 시스템의 구성을 도시한 것이다.1 illustrates a configuration of a failure handling system on a network according to an embodiment of the present invention.
도 1에 나타낸 바와 같이, 본 발명의 실시예에 따른 네트워크 상에서의 장애처리 시스템은, 장애 장비 검색부(10), 명령어 검색부(20), 명령어 적용부(30), 장애정보 처리부(40), 서비스 지원부(50), 데이터베이스들을 포함한다.As shown in FIG. 1, a failure processing system in a network according to an embodiment of the present invention includes a failure equipment search unit 10, a command search unit 20, a command application unit 30, and a failure information processing unit 40. , Service support unit 50, and databases.
장애 장비 검색부(10)는 장애 상태 검색 모듈(11)과 가입자 구간 장애 검출 모듈(15)을 포함하고 있지만 이에 한정되지는 않는다.The failure equipment search unit 10 may include, but is not limited to, a failure state search module 11 and a subscriber section failure detection module 15.
장애 상태 검색 모듈(11)은 현재 IP 네트워크에서 운용중인 스위치 및 DSLAM (Digital Subscriber Line Access Multiplexer), 라우터로부터 TRAP 데이터 또는 원격로그(SYSLOG) 데이터, PORT Admin/Oper status 정보를 수집, 분석하여 네트워크 구성 장비의 장애 상태를 판별하고, 장애로 판별된 장애 장비들을 장애 테이블에 저장한다.The failure status detection module 11 collects and analyzes TRAP data or remote log (SYSLOG) data and PORT Admin / Oper status information from a switch and a DSLAM (Digital Subscriber Line Access Multiplexer), a router currently operating in an IP network, and configures a network. The failure state of the device is determined, and failure devices determined as failures are stored in the failure table.
DSLAM은 디지털 가입자 회선 접속 다중화기로서 대개 서비스 제공자 측에 설치되는 네트워크 장비로서 여러 가입자 회선 접속으로부터 신호를 받아서 다중화 기술을 사용하여 고속 백본 회선에 신호를 보내주는 역할을 담당한다.DSLAM is a digital subscriber line access multiplexer, usually network equipment installed on the service provider side, that receives signals from multiple subscriber line connections and sends signals to high-speed backbone lines using multiplexing techniques.
TRAP 데이터는 예의 작동을 통지하는 경우에 사용되는 데이터이고, PORT Admin/Oper status 정보는 포트 관리와 운용 상태에 관한 정보이다.The TRAP data is used for notifying the operation of the example, and the PORT Admin / Oper status information is information on port management and operation status.
가입자구간 장애 검출 모듈(15)은 장애 장비의 ID를 추출하여 장애 테이블을 실시간으로 검색함으로써 가입자 구간에 설치된 장비의 장애를 검출한다.The subscriber section failure detection module 15 detects the failure of the equipment installed in the subscriber section by extracting the ID of the failure equipment and searching the failure table in real time.
명령어 검색부(20)는 SNMP 지원 검색 모듈(21)과 명령어 검색 모듈(25)로서, SNMP 지원 검색 모듈(21)이 가입자 구간에서의 장애 장비 ID를 이용하여 해당 장비가 실질적으로 SNMP를 지원하는지를 검색한다. 그리고, 명령어 검색 모듈(25)은 장애 장비가 SNMP를 지원하는 경우에 각 장비별, 제조사별 SNMP-세트 명령을 위해 해당 장비에 적용할 명령어를 검색한다.The command retrieval unit 20 is an SNMP support retrieval module 21 and a command retrieval module 25, and the SNMP support retrieval module 21 uses the disabled device ID in the subscriber section to determine whether the corresponding device substantially supports SNMP. Search. In addition, the command search module 25 searches for a command to be applied to the corresponding device for the SNMP set command for each device and manufacturer, if the disabled device supports SNMP.
명령어 적용부(30)는 원격 접속 모듈(31)과 명령어 적용 모듈(35)로서, 원격 접속 모듈(31)이 장애 장비에 텔넷 로그인하여 명령어 검색부(20)에서 검색한 명령어를 적용한다.The command applier 30 is a remote access module 31 and a command applicator module 35, and the remote access module 31 applies a command retrieved from the command search unit 20 by telnet-logining to the disabled device.
장애정보 처리부(40)는 명령어 적용부(30)에서 명령어가 정상적으로 장애 장비에 적용된 경우에 그 장애 장비의 상태 정보를 온-디맨드 상으로 수집, 분석하여 최종 장애 상태를 판단한다.The failure information processor 40 determines the final failure state by collecting and analyzing state information of the failure device on-demand when the command is normally applied to the failure device in the command application unit 30.
서비스 지원부(50)는 장애 처리 모듈(51)과 고장수리 요청 모듈(55)로서, 장애 처리 모듈(51)은 장애정보 처리부(40)의 최종 장애 상태를 통해 장애 복구 조치가 제대로 수행된 경우에 해당 장비의 장애를 해제하고, 장애 복구 조치가 실패한 경우에 고장 수리를 지시한다.The service support unit 50 is a failure handling module 51 and a failure repair request module 55. The failure handling module 51 is a case where a failure recovery action is properly performed through the final failure state of the failure information processing unit 40. Release the fault of the equipment and instruct the fault to be repaired if the failback action fails.
고장수리 요청 모듈(55)은 장애 처리 모듈(51)에서 고장 수리를 지시하면, 장애 장비의 가입자 측과의 시간 및 거리등을 고려하여 고장수리 요원을 수배하고, 이렇게 수배된 고장수리 요원에게 장애가 발생한 가입자 장비의 수리를 위해 즉각 출동을 요청한다.When the troubleshooting request module 55 instructs the fault handling module 51 to repair the fault, the troubleshooter is arranged in consideration of the time and distance with the subscriber side of the faulty equipment, and the troubleshooter has been repaired. Request immediate dispatch for repair of any subscriber equipment incurred.
한편, 데이터베이스들에는 장애정보 DB(61), 시설정보 DB(62), SNMP 정보 DB(63), SNMP-세트 명령어 DB(64), 원격접속 정보 DB(65)를 포함하고 있지만 이에 한정되지는 않는다.The databases include, but are not limited to, a failure information DB 61, a facility information DB 62, an SNMP information DB 63, an SNMP-set command DB 64, and a remote access information DB 65. Do not.
장애정보 DB(61)에는 네트워크 구성 장비의 장애 상태 관련 정보가 저장되어 있고, 시설정보 DB(62)에는 각 장비별 부여된 ID에 장비의 위치 및 시설 관련 정보가 저장되어 있다. 그리고, SNMP 정보 DB(63)에는 각 장비별 실질적인 SNMP의 지원 가능성에 대한 정보가 저장되어 있고, SNMP-세트 명령어 DB(64)에는 각 장비별, 제조사별 적용 가능한 명령어들에 관한 정보가 저장되어 있으며, 원격접속 정보 DB(65)에는 각 장비별 텔넷 로그인하기 위한 정보들이 저장되어 있다.The failure information DB 61 stores the failure state related information of the network configuration equipment, and the facility information DB 62 stores the location of the equipment and the facility related information in an ID assigned to each device. In addition, the SNMP information DB 63 stores information on the actual supportability of SNMP for each device, and the SNMP-set command DB 64 stores information on commands applicable to each device and manufacturer. The remote access information DB 65 stores information for telnet login for each device.
도 2를 참조하여 본 발명의 실시예에 따른 네트워크 상에서의 장애 처리 시스템의 동작에 대하여 자세하게 설명한다.Referring to Figure 2 will be described in detail the operation of the failure handling system on the network according to an embodiment of the present invention.
도 2는 본 발명의 실시예에 따른 네트워크 상에서의 장애 처리 방법의 순서도를 도시한 것이다.2 is a flowchart illustrating a failure handling method on a network according to an embodiment of the present invention.
도 2에 도시된 바와 같이, 본 발명의 실시예에 따른 네트워크 상에서의 장애 처리 방법은, 먼저 장애 상태 검색 모듈(11)이 장애 정보 DB(61)를 통해 IP 네트워크에서 운용중인 스위치 및 라우터, DSLAM으로부터 각종 정보를 수집, 분석하여 네트워크 구성 장비의 장애 상태를 판별하여 장애 장비들을 검출한다.(S11, S12)As shown in FIG. 2, in the failure processing method on the network according to the embodiment of the present invention, a switch, a router, and a DSLAM in which an error state search module 11 is operating in an IP network through a failure information DB 61 is first performed. Collect and analyze various information from the network to determine the failure state of the network configuration equipment to detect the failure equipment (S11, S12).
가입자 구간 장애 검출 모듈(15)은 장애 장비의 ID를 추출하여 시설 정보 DB(62)를 검색함으로써 가입자 구간에 설치된 장비인지 아닌지를 판별한다.(S13, S14)The subscriber section failure detection module 15 determines whether the equipment is installed in the subscriber section by extracting the ID of the disabled device and searching the facility information DB 62. (S13, S14)
만약, 장애 상태 검색 모듈(11)에서 검출된 장애 장비들 중에서 가입자 구간에 설치된 장비가 아닌 경우에, 해당 장애 장비들은 서비스 제공자 측에서 발생한 장애로 판단하고 각 장비의 장애 상태에 대한 정보를 장애 테이블에 저장한 후에 고장 수리를 진행한다.(S15, S16)If the failure status detected by the failure state detection module 11 is not installed in the subscriber section among the failure equipment, the corresponding failure equipment is determined as a failure occurred in the service provider side and the information on the failure status of each equipment failure table After saving it in the memory, repair the problem. (S15, S16)
그런데, 가입자 구간에 설치된 장비들 중에서 장애가 발생한 경우에, SNMP지원 검색 모듈(21)은 SNMP 정보 DB(63)를 통해 해당 장비가 실질적으로 SNMP를 지원하는지를 판단한다.(S17)However, when a failure occurs among the devices installed in the subscriber section, the SNMP support search module 21 determines whether the corresponding device substantially supports SNMP through the SNMP information DB 63 (S17).
이때, 가입자 구간에 설치된 장애 장비가 SNMP를 지원하지 않는 경우에, 서비스 제공자는 원격으로 장애 복구 조치가 불가능하므로 고장수리 요원의 출동을 요청한다.(S18)At this time, if the failure equipment installed in the subscriber section does not support SNMP, the service provider requests the dispatch of the troubleshooter because the failure recovery action is not possible remotely.
가입자 구간에 설치된 장애 장비가 SNMP를 지원하는 경우에, 명령어 검색 모듈(25)은 SNMP-세트 명령어 DB(64)를 통해 해당 장비에 적용 가능한 SNMP-세트 명령어를 검색한다.(S19) 그리고, 원격 접속 모듈(31)은 원격 접속 정보 DB(65)를 이용하여 장애 장비에 텔넷 로그인하여 원격 접속을 시도한다.(S20)If the faulty device installed in the subscriber section supports SNMP, the command search module 25 searches for an SNMP-set command applicable to the device through the SNMP-set command DB 64 (S19). The access module 31 attempts a remote access by telnet logging in to the failing device using the remote access information DB 65. (S20)
이때, 원격 접속이 실패하면 서비스 제공자는 원격으로 장애 복구 조치가 불가능하므로 고장수리 요원의 출동을 요청하만, 원격 접속이 성공적으로 이루어지면 명령어 적용 모듈(35)은 명령어 검색 모듈(25)에서 검색한 명령어를 장애 장비에 적용한다.(S21, S22)In this case, if the remote access fails, the service provider requests the dispatch of a troubleshooting agent remotely because the failure recovery action is impossible, but if the remote access is successful, the command application module 35 searches for the command search module 25. Apply the command to the faulty device (S21, S22).
가입자 구간에 설치된 장애 장비에 SNMP-세트 명령어가 정상적으로 적용된 경우에, 장애 정보 처리부(40)는 온-디맨드 상으로 SNMP-세트 명령어가 적용된 장비의 장애 상태에 관한 정보를 수집, 분석하여 최종 장애 상태를 판단한다.(S23, S24)When the SNMP-set command is normally applied to the faulty device installed in the subscriber section, the fault information processing unit 40 collects and analyzes the information on the fault state of the device to which the SNMP-set command is applied on-demand to determine the final fault state. (S23, S24)
장애 처리 모듈(51)은 장애 정보 처리부(40)의 최종 장애 상태에 따라 원격으로 장애 복구 조치가 성공적으로 이루어진 장비의 경우에 장애를 해제한다.(S25, S26) 그런데, 장애 처리 모듈(51)은 원격으로 장애 복구 조치가 이루어지지 않는장비의 경우에 고장수리 요청 모듈(55)을 통해 가입자 측으로 고장수리 요원의 출동을 요청한다.(S25, S18)The failure processing module 51 releases a failure in the case of a device in which failure recovery is successfully performed remotely according to the final failure state of the failure information processing unit 40. (S25, S26) By the way, the failure processing module 51 In the case of the equipment that does not perform a failure recovery measures remotely, the request for the dispatch of a troubleshooting agent to the subscriber through the troubleshooting request module 55. (S25, S18)
이때, 고장수리 요청 모듈(55)은 가입자 구간에 설치된 장애 장비의 즉각적인 고장수리를 위해 고장수리 요원이 가입자 방문까지 소요되는 거리 및 시간을 고려하여 최적의 고장수리 요원을 수배한다.At this time, the troubleshooting request module 55 arranges the optimal troubleshooting personnel in consideration of the distance and time taken by the troubleshooting personnel to visit the subscriber for immediate troubleshooting of the failure equipment installed in the subscriber section.
이상에서 본 발명의 바람직한 실시예에 대하여 상세하게 설명하였지만 본 발명은 이에 한정되는 것은 아니며, 그 외의 다양한 변경이나 변형이 가능하다.Although the preferred embodiment of the present invention has been described in detail above, the present invention is not limited thereto, and various other changes and modifications are possible.
이와 같이, 네트워크 상에서의 장애 처리 시스템 및 그 방법은 네트워크 상에서 발생한 장애 중에서 가입자 구간에서 발생한 장애를 발췌하여 즉각적인 장애 복구 조치를 시도하고, 장애 회복이 되지 않는 경우에만 고장수리 요원의 출동을 요청함으로써 고장처리 시간을 단축시켜 가입자의 불만을 최소화하고, 고장수리 요원의 출동을 최소화하여 고장수리에 소요되는 노력과 비용을 절감시킬 수 있는 효과가 있다.As described above, the fault handling system and the method on the network fail by extracting the fault in the subscriber section among the faults occurring in the network and attempting an immediate fault recovery action, and requesting the dispatch of a troubleshooting agent only when the fault is not recovered. By shortening the processing time, it is possible to minimize the dissatisfaction of subscribers and minimize the dispatch of troubleshooting personnel, thereby reducing the effort and cost required for troubleshooting.
Claims (13)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020030042689A KR100993944B1 (en) | 2003-06-27 | 2003-06-27 | System and method for recovery of network failure |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020030042689A KR100993944B1 (en) | 2003-06-27 | 2003-06-27 | System and method for recovery of network failure |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20050001122A true KR20050001122A (en) | 2005-01-06 |
KR100993944B1 KR100993944B1 (en) | 2010-11-11 |
Family
ID=37216973
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020030042689A KR100993944B1 (en) | 2003-06-27 | 2003-06-27 | System and method for recovery of network failure |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR100993944B1 (en) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102216574B1 (en) | 2018-07-20 | 2021-02-16 | 주식회사 케이티 | Apparatus and method for deciding failure domain using failure alarm |
-
2003
- 2003-06-27 KR KR1020030042689A patent/KR100993944B1/en active IP Right Grant
Also Published As
Publication number | Publication date |
---|---|
KR100993944B1 (en) | 2010-11-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8738760B2 (en) | Method and system for providing automated data retrieval in support of fault isolation in a managed services network | |
US8812649B2 (en) | Method and system for processing fault alarms and trouble tickets in a managed network services system | |
US8732516B2 (en) | Method and system for providing customer controlled notifications in a managed network services system | |
US8676945B2 (en) | Method and system for processing fault alarms and maintenance events in a managed network services system | |
US8924533B2 (en) | Method and system for providing automated fault isolation in a managed services network | |
US6604137B2 (en) | System and method for verification of remote spares in a communications network when a network outage occurs | |
US6457050B1 (en) | System and method for dynamically restoring communications within a network | |
US6674724B1 (en) | Integrated telecommunications test system | |
JPH0576215B2 (en) | ||
CN100421390C (en) | Client service emergency system and its realizing method | |
US7995485B1 (en) | Method and apparatus for providing automated diagnostics of networks | |
US8291120B2 (en) | Systems, methods, and computer program product for automatically verifying a standby site | |
CN113825164A (en) | Network fault repairing method and device, storage medium and electronic equipment | |
JP2013130901A (en) | Monitoring server and network device recovery system using the same | |
KR100993944B1 (en) | System and method for recovery of network failure | |
JP6555721B2 (en) | Disaster recovery system and method | |
EP3252995B1 (en) | Method for detecting network failures | |
KR102341418B1 (en) | System and Method for Real-Time Trouble Cause Analysis based on Network Quality Data | |
CN101958925A (en) | Method and device for controlling remote equipment | |
US6137774A (en) | System and method for dispatching commands to switching elements within a communications network | |
KR100298176B1 (en) | Method for switching detour route with bypassing error transmission line in subscriber line service of communication network management system | |
Cisco | Taking Corrective Action On Events and Alarms | |
Cisco | Detecting and Correcting Failures | |
Cisco | Taking Corrective Action On Events and Alarms | |
KR100566610B1 (en) | automatic disaster recovery system and recovery method thereof |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20131101 Year of fee payment: 4 |
|
FPAY | Annual fee payment |
Payment date: 20171101 Year of fee payment: 8 |
|
FPAY | Annual fee payment |
Payment date: 20181031 Year of fee payment: 9 |