KR20050001122A - System and method for recovery of network failure - Google Patents

System and method for recovery of network failure Download PDF

Info

Publication number
KR20050001122A
KR20050001122A KR1020030042689A KR20030042689A KR20050001122A KR 20050001122 A KR20050001122 A KR 20050001122A KR 1020030042689 A KR1020030042689 A KR 1020030042689A KR 20030042689 A KR20030042689 A KR 20030042689A KR 20050001122 A KR20050001122 A KR 20050001122A
Authority
KR
South Korea
Prior art keywords
failure
equipment
command
network
faulty
Prior art date
Application number
KR1020030042689A
Other languages
Korean (ko)
Other versions
KR100993944B1 (en
Inventor
김기응
유재형
허재호
Original Assignee
주식회사 케이티
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 케이티 filed Critical 주식회사 케이티
Priority to KR1020030042689A priority Critical patent/KR100993944B1/en
Publication of KR20050001122A publication Critical patent/KR20050001122A/en
Application granted granted Critical
Publication of KR100993944B1 publication Critical patent/KR100993944B1/en

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services

Abstract

PURPOSE: A system and a method for processing failures of a network forming equipment operated on an IP(Internet Protocol) network are provided to reduce time/expense for failure recover by instantly trying to recover the failure generated in a subscriber section and requesting a repairman to repair the non-recovered failure. CONSTITUTION: A failed equipment searcher(10) detects the failed equipments in a subscriber section by searching the failure of the network forming equipment connected to subscriber lines. A command searcher(20) searches a protocol command of the corresponding equipment. A command applier(30) judges abnormality by applying the searched command after connecting to the failed equipment. A failure information processor(40) confirms the final failure state by collecting/analyzing state information of the failed equipment applying the command. A service supporter(50) releases the failure of the equipment if the failure is recovered through the final failure state, and requests mobilization of the failure repairman if the failure is not recovered.

Description

네트워크 상에서의 장애 처리 시스템 및 그 방법{SYSTEM AND METHOD FOR RECOVERY OF NETWORK FAILURE}Fault handling system over network and its method {SYSTEM AND METHOD FOR RECOVERY OF NETWORK FAILURE}

본 발명은 IP 네트워크에서 운용중인 네트워크 구성 장비의 장애 처리를 위한 네트워크 상에서의 장애 처리 시스템 및 그 방법에 관한 것이다.The present invention relates to a system and method for processing a failure on a network for handling a failure of network component equipment operating in an IP network.

현재 많은 사람들이 PC와 같이 데이터 통신이 가능한 통신단말기를 이용하여 인터넷에 접속하여 인터넷에 산재해 있는 방대한 양의 정보를 공유하고 있다.Many people now use a communication terminal, such as a PC, to connect to the Internet and share vast amounts of information scattered on the Internet.

인터넷 사용이 급증하면서 인터넷 서비스의 고장이 빈번히 발생하는데, 가입자 측의 고장 발생 빈도가 전체 고장 신고의 약 80%에 해당한다.Due to the rapid increase in the use of the Internet, the failure of the Internet service frequently occurs, and the frequency of failures on the subscriber side corresponds to about 80% of all failure reports.

따라서, IP 네트워크 관련 운용 관리 시스템(Operation Support System, OSS)은 가입자 측에 발생한 인터넷 서비스 관련 장애를 해결하기 위해 고장신고가접수되면 고장수리 요원을 즉시 현장에 출동하도록 한다.Therefore, IP network-related Operation Support System (OSS) immediately dispatches troubleshooting personnel to the site when a failure report is received in order to solve an Internet service-related failure occurring on the subscriber side.

즉, IP 네트워크 관련 운용 관리 시스템에서는 네트워크 시스템 관련 장애 여부를 가입자가 상담원에게 전화를 걸어서 장애 여부를 문의하고, 가입자로부터 장애신고를 접수한 상담원이 가입자가 사용하는 통신 단말기에 원격 접속한 후 운용자나 관리자에게 문의하여 최종 장애 여부를 확인하여 그 확인 결과를 다시 가입자에게 알려준다.That is, in the IP network related operation management system, the subscriber calls the agent to check whether the network system is related to the failure, and the agent who receives the failure report from the subscriber remotely accesses the communication terminal used by the subscriber. Check with the manager to confirm the final failure and notify the subscriber again.

이때, 가입자의 장비에 장애가 발생한 경우에, 고장수리 요원이 현장 출동하여 직접 가입자 장비를 고장 수리한다. 가입자 장비에 발생한 장애 중에서 일부 장애는 고장수리 요원의 현장 출동 없이 장비를 리셋(RESET)하거나 간단한 조치만으로 고장을 처리할 수 있다.At this time, in the event of a failure of the subscriber's equipment, a trouble-shooter dispatches the site and repairs the subscriber equipment directly. Some of the failures in the subscriber equipment can be resolved by simply resetting the equipment or taking simple actions, without the need for troubleshooting personnel onsite.

그런데, 종래 IP 네트워크 관련 운용 관리 시스템은 가입자 장비의 장애 상태에 상관없이 장애 발생 시마다 고장수리 요원이 출동해야 하므로 고장수리 요원의 출동횟수가 많아 시간과 고장수리비용이 많이 소요되며, 가입자 측면에서도 즉각적인 고장회복 처리가 되지 않아 불편하다는 문제점이 있다.However, the conventional IP network-related operation management system requires a troubleshooter to be dispatched every time a fault occurs regardless of the failure state of the subscriber equipment. There is a problem that the failure recovery process is not convenient

본 발명이 이루고자 하는 기술적 과제는 가입자 구간에서 발생한 장애를 발췌하여 즉각적으로 장애 복구 조치를 시도하고, 장애 복구되지 않는 장애에 대해 고장수리 요원의 출동을 요청함으로써 장애 처리에 대한 시간과 비용을 절감시키기 위한 네트워크 상에서의 장애 처리 시스템을 제공하는 것이다.The technical problem to be achieved by the present invention is to extract the failure occurred in the subscriber section to immediately attempt to take a failover action, and to reduce the time and cost for handling the failure by requesting the dispatch of troubleshooting personnel for the failure that does not recover It is to provide a fault handling system on a network.

도 1은 본 발명의 실시예에 따른 네트워크 상에서의 장애 처리 시스템의 구성을 도시한 것이다.1 illustrates a configuration of a failure handling system on a network according to an embodiment of the present invention.

도 2는 본 발명의 실시예에 따른 네트워크 상에서의 장애 처리 방법의 순서도를 도시한 것이다.2 is a flowchart illustrating a failure handling method on a network according to an embodiment of the present invention.

이러한 과제를 해결하기 위해 본 발명은 네트워크 장애 발생시 가입자 구간에서 발생한 장애를 발췌하여 즉각적으로 장애 회복 처리를 시도하고, 장애 회복 처리가 실패한 경우에 고장수리 요원의 현장 출동을 지시한다.In order to solve this problem, the present invention extracts a failure occurring in a subscriber section when a network failure occurs, and immediately attempts a failure recovery process, and instructs the dispatch of a troubleshooting agent when the failure recovery process fails.

본 발명의 첫 번째 특징에 따른 네트워크 상에서의 장애 처리 시스템 및 그 방법은, 가입자에게 인터넷 서비스를 제공하는 서비스 제공자가 네트워크 상에서의 장애 발생을 처리하는 네트워크 상에서의 장애 처리 시스템에 있어서, 상기 서비스 제공자는, 상기 다수의 가입자 회선에 접속된 네트워크 구성 장비의 장애 발생 여부를 검색하여 장애가 발생한 장비들 중에서 상기 가입자 구간에서 장애가 발생한 장비들을 검출하는 장애 장비 검색부; 상기 장애 검색부에서 검출된 가입자 구간에서의 장애 장비가 상기 서비스 제공자와 가입자간의 네트워크 관리를 담당하는 프로토콜을 지원하는 경우에, 해당 장비의 프로토콜 명령어를 검색하는 명령어 검색부; 상기 장애 검색부에서 검출된 장애 장비와 원격 접속하여 상기 명령어 검색부에서 검색된 명령어를 상기 장비에 적용하여 이상 유무를 판단하는 명령어 적용부; 상기 명령어 적용부에서 명령어가 적용된 장애 장비의 상태 정보를 수집, 분석하여 해당 장비의 장애 상태를 수집하여 최종 장애 상태를 확인하는 장애정보 처리부; 및 상기 장애정보 처리부에서 장비의 최종 장애 상태를 통해 상기 장애 장비의 고장이 회복되면 상기 장비의 장애를 해제하고, 상기 장애 장비의 고장이 회복되지 않은 경우에 고장수리 요원의 현장 출동을 요청하는 서비스 지원부를 포함한다.A failure handling system and a method on a network according to the first aspect of the present invention is a failure handling system on a network in which a service provider for providing an Internet service to a subscriber handles occurrence of a failure on the network. A faulty equipment searching unit configured to detect whether a fault occurs in the network component equipment connected to the plurality of subscriber lines, and to detect faulty equipments in the subscriber section among faulty equipments; A command search unit for searching for a protocol command of a corresponding device when a disabled device in a subscriber section detected by the fault search unit supports a protocol for managing a network between the service provider and the subscriber; A command application unit for remotely accessing a failure device detected by the failure search unit to determine whether there is an error by applying a command retrieved from the command search unit to the device; A failure information processing unit for collecting and analyzing state information of a failure device to which the command is applied by the command application unit to collect a failure state of the corresponding device to check a final failure state; And when the failure of the failure equipment is recovered through the last failure state of the equipment by the failure information processing unit, releasing the failure of the equipment, and requesting on-site dispatch of a troubleshooting agent when the failure of the failure equipment is not recovered. Includes support.

상기 서비스 제공자는 상기 네트워크 구성 장비 관련 시설, 원격 접속 및 장애 정보와, 상기 프로토콜 관련 지원 유/무, 및 명령어 세트(SET) 정보를 저장하는데이터베이스를 포함하는 것이 바람직하다.The service provider preferably includes a database storing the network configuration equipment related facilities, remote access and failure information, the protocol related support presence / absence, and instruction set information.

상기 장애 장비 검색부는, 상기 네트워크 구성 장비들 중에서 장애가 발생한 장애 장비를 검출하여 장애 테이블에 저장하는 장애 상태 검색 모듈; 및 상기 장애 상태 검색 모듈의 장애 테이블에서 장애 장비의 ID를 추출하여 가입자 구간에서 발생한 장애를 검출하는 가입자구간 장애 검출 모듈을 포함하는 것이 바람직하다.The faulty equipment search unit may include: a fault state search module configured to detect faulty equipment having a fault among the network components and store the faulty equipment in a fault table; And a subscriber section failure detection module for detecting a failure occurring in a subscriber section by extracting an ID of a failure device from a failure table of the failure state search module.

상기 명령어 검색부는, 상기 장애 장비가 네트워크를 관리하기 위한 SNMP(Simple Network Management Protocol)을 지원하는지를 판단하는 SNMP 지원 검색 모듈; 및 상기 SNMP 지원 검색 모듈을 통해 SNMP를 지원하는 장비에 적용하기 위한 SNMP-세트(SET) 명령어를 검색하는 명령어 검색 모듈을 포함하는 것이 바람직하다.The command search unit may include: an SNMP support search module configured to determine whether the disabled device supports a simple network management protocol (SNMP) for managing a network; And a command search module for searching for an SNMP-SET command for applying to a device that supports SNMP through the SNMP support search module.

상기 명령어 적용부는, 상기 장애 장비에 원격 접속을 위해 로그인(LOGIN)하는 원격 접속 모듈; 및 상기 원격 접속 모듈을 통해 상기 장애 장비와 원격 접속되면, 상기 명령어 검색부에서 검색된 명령어를 적용하여 이상 유무를 판단하는 명령어 적용 모듈을 포함하는 것이 바람직하다.The command application unit may include: a remote access module configured to log in to a remote device for remote access; And a command application module configured to determine whether there is an error by applying a command searched by the command search unit when the remote device is remotely connected with the failing device.

상기 서비스 지원부는, 상기 장애정보 처리부를 통해 상기 장애 장비의 최종 장애 상태가 고장 회복된 경우에 상기 장애 장비에 대한 장애를 해제하고, 상기 장애 장비의 고장이 회복되지 않은 경우에 고장 수리를 지시하는 장애 처리 모듈; 및 상기 장애 처리 모듈에서 고장 수리를 지시한 경우에 상기 장애 장비의 고장 수리를 위해 고장수리 요원을 수배하여 출동을 요청하는 고장수리 요청 모듈을 포함하는 것이 바람직하다.The service support unit releases the failure of the failure equipment when the failure state of the last failure equipment of the failure equipment is recovered through the failure information processing unit, and instructs troubleshooting when the failure of the failure equipment is not recovered. A fault handling module; And a troubleshooting request module for requesting dispatch by dispatching a troubleshooting agent to troubleshoot the faulty equipment when the fault handling module instructs fault repair.

본 발명의 두 번째 특징에 따른 네트워크 상에서의 장애 처리 시스템 및 그 방법은 .가입자에게 인터넷 서비스를 제공하는 서비스 제공자가 네트워크 상에서의 장애 발생을 처리하는 네트워크 상에서의 장애 처리 방법에 있어서, A) 상기 서비스 제공자는 네트워크 상에서 운용중인 네트워크 구성 장비의 상태 정보를 수집하여 장애 장비들을 검출하는 단계; B) 상기 A) 단계에서 검출된 장비 중에서 가입자 구간에서 장애가 발생한 장애 장비들을 발췌하여, 상기 장애 장비가 서비스 제공자와 가입자간의 네트워크 관리를 담당하는 프로토콜의 지원 여부를 검색하는 단계; C) 상기 B) 단계에서 장애 장비가 상기 프로토콜을 지원하는 경우에, 상기 장애 장비에 해당하는 명령어를 검색하고, 상기 장애 장비와 원격 접속을 통해 상기 명령어를 상기 장애 장비에 적용하는 단계; 및 D) 상기 C) 단계에서 상기 장애 장비에 명령어를 적용한 결과를 수집, 분석하여 상기 장애 장비의 최종 장애 상태를 판단하고, 고장수리 요원의 출동 여부를 결정하는 단계를 포함한다.A system and method for handling a failure on a network according to a second aspect of the present invention is a failure handling method on a network in which a service provider that provides an Internet service to subscribers handles occurrence of a failure on a network. The provider collects the state information of the network configuration equipment running on the network to detect the failure equipment; B) extracting the faulty equipments in which the fault occurs in the subscriber section among the equipment detected in step A), and searching whether the faulty equipment supports the protocol for managing the network between the service provider and the subscriber; C) if the faulty equipment supports the protocol in step B), searching for a command corresponding to the faulty equipment, and applying the command to the faulty equipment through a remote connection with the faulty equipment; And D) collecting and analyzing the result of applying the command to the faulty equipment in step C) to determine a final fault state of the faulty equipment, and to determine whether a fault repair agent is dispatched.

상기 B) 단계에서 가입자 구간에서의 장애 장비를 발췌하는 단계는, 상기 A) 단계에서 검출된 장애 장비들의 ID를 추출하여 각 장비의 ID와 상기 네트워크 구성 장비에 관한 시설 정보를 매칭시켜 가입자 구간에서 발생한 장애를 검출하는 것이 바람직하다.The extracting of the disabled equipment in the subscriber section in the step B) may include extracting IDs of the disabled devices detected in the step A), matching the ID of each device with facility information about the network configuration equipment, in the subscriber section. It is desirable to detect the disorder that has occurred.

상기 B) 단계에서 상기 장애 장비가 상기 프로토콜을 지원하지 않는 경우에, 상기 서비스 제공자는 고장수리 요원의 출동을 요청하는 것이 바람직하다.In the case where the failure equipment does not support the protocol in step B), it is preferable that the service provider requests the dispatch of a troubleshooting agent.

상기 C) 단계에서 상기 장애 장비에 명령어를 적용하는 단계는, 상기 장애 장비가 SNMP(Simple Network Management Protocol)을 지원하면, 상기 장애 장비에적용 가능한 SNMP-세트(SET) 명령어를 검색하고, 상기 장애 장비에 텔넷 로그인(TELNET LOGIN)하여 상기 명령어를 적용하는 것이 바람직하다.In the step C), when the command is applied to the faulty device, if the faulty device supports Simple Network Management Protocol (SNMP), a search for an SNMP-SET command applicable to the faulty device is performed. It is desirable to apply the above command by telnet login to the device.

상기 장애 장비에 텔넷 로그인이 실패하여 원격 접속되지 않는 경우에, 상기 서비스 제공자는 고장수리 요원의 출동을 요청하는 것이 바람직하다.In case the telnet login fails to remotely connect to the faulty equipment, the service provider may request the dispatch of a troubleshooting agent.

상기 D) 단계에서 고장수리 요원의 출동 여부를 결정하는 단계는, 상기 장애 장비의 최종 장애 상태가 고장 회복된 경우에 상기 장애 장비에 대한 장애를 해제하고, 상기 장애 장비의 고장이 회복되지 않은 경우에 고장수리 요원을 수배하여 해당 장비의 가입자 측에 방문을 요청하는 것이 바람직하다.In step D), determining whether or not a malfunctioning agent is dispatched may include: releasing the fault for the faulty equipment when the fault state of the faulty equipment is recovered from the fault, and failing to recover the faulty equipment. It is advisable to arrange for a repair agent to request a visit to the subscriber of the equipment.

상기 A) 단계에서 장애 장비를 검출하는 단계는, 상기 장애 장비들을 장애 테이블에 저장하고, 상기 가입자 구간에서의 장애 장비 이외의 장비들에 대해 상기 서비스 제공자 측에서 고장 수리 절차를 수행하는 것이 바람직하다.In the detecting of the failing equipment in step A), it is preferable to store the failing equipments in a fault table and to perform a troubleshooting procedure on the service provider side for equipment other than the failing equipment in the subscriber section. .

아래에서는 첨부한 도면을 참고로 하여 본 발명의 실시예에 대하여 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 상세히 설명한다. 그러나 본 발명은 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시예에 한정되지 않는다.DETAILED DESCRIPTION Hereinafter, exemplary embodiments of the present invention will be described in detail with reference to the accompanying drawings so that those skilled in the art may easily implement the present invention. As those skilled in the art would realize, the described embodiments may be modified in various different ways, all without departing from the spirit or scope of the present invention.

먼저, 본 발명의 실시예에 따른 네트워크 상에서의 장애 처리 시스템에 대하여 도 1을 참고로 하여 상세하게 설명한다.First, a failure processing system on a network according to an embodiment of the present invention will be described in detail with reference to FIG. 1.

도 1은 본 발명의 실시예에 따른 네트워크 상에서의 장애 처리 시스템의 구성을 도시한 것이다.1 illustrates a configuration of a failure handling system on a network according to an embodiment of the present invention.

도 1에 나타낸 바와 같이, 본 발명의 실시예에 따른 네트워크 상에서의 장애처리 시스템은, 장애 장비 검색부(10), 명령어 검색부(20), 명령어 적용부(30), 장애정보 처리부(40), 서비스 지원부(50), 데이터베이스들을 포함한다.As shown in FIG. 1, a failure processing system in a network according to an embodiment of the present invention includes a failure equipment search unit 10, a command search unit 20, a command application unit 30, and a failure information processing unit 40. , Service support unit 50, and databases.

장애 장비 검색부(10)는 장애 상태 검색 모듈(11)과 가입자 구간 장애 검출 모듈(15)을 포함하고 있지만 이에 한정되지는 않는다.The failure equipment search unit 10 may include, but is not limited to, a failure state search module 11 and a subscriber section failure detection module 15.

장애 상태 검색 모듈(11)은 현재 IP 네트워크에서 운용중인 스위치 및 DSLAM (Digital Subscriber Line Access Multiplexer), 라우터로부터 TRAP 데이터 또는 원격로그(SYSLOG) 데이터, PORT Admin/Oper status 정보를 수집, 분석하여 네트워크 구성 장비의 장애 상태를 판별하고, 장애로 판별된 장애 장비들을 장애 테이블에 저장한다.The failure status detection module 11 collects and analyzes TRAP data or remote log (SYSLOG) data and PORT Admin / Oper status information from a switch and a DSLAM (Digital Subscriber Line Access Multiplexer), a router currently operating in an IP network, and configures a network. The failure state of the device is determined, and failure devices determined as failures are stored in the failure table.

DSLAM은 디지털 가입자 회선 접속 다중화기로서 대개 서비스 제공자 측에 설치되는 네트워크 장비로서 여러 가입자 회선 접속으로부터 신호를 받아서 다중화 기술을 사용하여 고속 백본 회선에 신호를 보내주는 역할을 담당한다.DSLAM is a digital subscriber line access multiplexer, usually network equipment installed on the service provider side, that receives signals from multiple subscriber line connections and sends signals to high-speed backbone lines using multiplexing techniques.

TRAP 데이터는 예의 작동을 통지하는 경우에 사용되는 데이터이고, PORT Admin/Oper status 정보는 포트 관리와 운용 상태에 관한 정보이다.The TRAP data is used for notifying the operation of the example, and the PORT Admin / Oper status information is information on port management and operation status.

가입자구간 장애 검출 모듈(15)은 장애 장비의 ID를 추출하여 장애 테이블을 실시간으로 검색함으로써 가입자 구간에 설치된 장비의 장애를 검출한다.The subscriber section failure detection module 15 detects the failure of the equipment installed in the subscriber section by extracting the ID of the failure equipment and searching the failure table in real time.

명령어 검색부(20)는 SNMP 지원 검색 모듈(21)과 명령어 검색 모듈(25)로서, SNMP 지원 검색 모듈(21)이 가입자 구간에서의 장애 장비 ID를 이용하여 해당 장비가 실질적으로 SNMP를 지원하는지를 검색한다. 그리고, 명령어 검색 모듈(25)은 장애 장비가 SNMP를 지원하는 경우에 각 장비별, 제조사별 SNMP-세트 명령을 위해 해당 장비에 적용할 명령어를 검색한다.The command retrieval unit 20 is an SNMP support retrieval module 21 and a command retrieval module 25, and the SNMP support retrieval module 21 uses the disabled device ID in the subscriber section to determine whether the corresponding device substantially supports SNMP. Search. In addition, the command search module 25 searches for a command to be applied to the corresponding device for the SNMP set command for each device and manufacturer, if the disabled device supports SNMP.

명령어 적용부(30)는 원격 접속 모듈(31)과 명령어 적용 모듈(35)로서, 원격 접속 모듈(31)이 장애 장비에 텔넷 로그인하여 명령어 검색부(20)에서 검색한 명령어를 적용한다.The command applier 30 is a remote access module 31 and a command applicator module 35, and the remote access module 31 applies a command retrieved from the command search unit 20 by telnet-logining to the disabled device.

장애정보 처리부(40)는 명령어 적용부(30)에서 명령어가 정상적으로 장애 장비에 적용된 경우에 그 장애 장비의 상태 정보를 온-디맨드 상으로 수집, 분석하여 최종 장애 상태를 판단한다.The failure information processor 40 determines the final failure state by collecting and analyzing state information of the failure device on-demand when the command is normally applied to the failure device in the command application unit 30.

서비스 지원부(50)는 장애 처리 모듈(51)과 고장수리 요청 모듈(55)로서, 장애 처리 모듈(51)은 장애정보 처리부(40)의 최종 장애 상태를 통해 장애 복구 조치가 제대로 수행된 경우에 해당 장비의 장애를 해제하고, 장애 복구 조치가 실패한 경우에 고장 수리를 지시한다.The service support unit 50 is a failure handling module 51 and a failure repair request module 55. The failure handling module 51 is a case where a failure recovery action is properly performed through the final failure state of the failure information processing unit 40. Release the fault of the equipment and instruct the fault to be repaired if the failback action fails.

고장수리 요청 모듈(55)은 장애 처리 모듈(51)에서 고장 수리를 지시하면, 장애 장비의 가입자 측과의 시간 및 거리등을 고려하여 고장수리 요원을 수배하고, 이렇게 수배된 고장수리 요원에게 장애가 발생한 가입자 장비의 수리를 위해 즉각 출동을 요청한다.When the troubleshooting request module 55 instructs the fault handling module 51 to repair the fault, the troubleshooter is arranged in consideration of the time and distance with the subscriber side of the faulty equipment, and the troubleshooter has been repaired. Request immediate dispatch for repair of any subscriber equipment incurred.

한편, 데이터베이스들에는 장애정보 DB(61), 시설정보 DB(62), SNMP 정보 DB(63), SNMP-세트 명령어 DB(64), 원격접속 정보 DB(65)를 포함하고 있지만 이에 한정되지는 않는다.The databases include, but are not limited to, a failure information DB 61, a facility information DB 62, an SNMP information DB 63, an SNMP-set command DB 64, and a remote access information DB 65. Do not.

장애정보 DB(61)에는 네트워크 구성 장비의 장애 상태 관련 정보가 저장되어 있고, 시설정보 DB(62)에는 각 장비별 부여된 ID에 장비의 위치 및 시설 관련 정보가 저장되어 있다. 그리고, SNMP 정보 DB(63)에는 각 장비별 실질적인 SNMP의 지원 가능성에 대한 정보가 저장되어 있고, SNMP-세트 명령어 DB(64)에는 각 장비별, 제조사별 적용 가능한 명령어들에 관한 정보가 저장되어 있으며, 원격접속 정보 DB(65)에는 각 장비별 텔넷 로그인하기 위한 정보들이 저장되어 있다.The failure information DB 61 stores the failure state related information of the network configuration equipment, and the facility information DB 62 stores the location of the equipment and the facility related information in an ID assigned to each device. In addition, the SNMP information DB 63 stores information on the actual supportability of SNMP for each device, and the SNMP-set command DB 64 stores information on commands applicable to each device and manufacturer. The remote access information DB 65 stores information for telnet login for each device.

도 2를 참조하여 본 발명의 실시예에 따른 네트워크 상에서의 장애 처리 시스템의 동작에 대하여 자세하게 설명한다.Referring to Figure 2 will be described in detail the operation of the failure handling system on the network according to an embodiment of the present invention.

도 2는 본 발명의 실시예에 따른 네트워크 상에서의 장애 처리 방법의 순서도를 도시한 것이다.2 is a flowchart illustrating a failure handling method on a network according to an embodiment of the present invention.

도 2에 도시된 바와 같이, 본 발명의 실시예에 따른 네트워크 상에서의 장애 처리 방법은, 먼저 장애 상태 검색 모듈(11)이 장애 정보 DB(61)를 통해 IP 네트워크에서 운용중인 스위치 및 라우터, DSLAM으로부터 각종 정보를 수집, 분석하여 네트워크 구성 장비의 장애 상태를 판별하여 장애 장비들을 검출한다.(S11, S12)As shown in FIG. 2, in the failure processing method on the network according to the embodiment of the present invention, a switch, a router, and a DSLAM in which an error state search module 11 is operating in an IP network through a failure information DB 61 is first performed. Collect and analyze various information from the network to determine the failure state of the network configuration equipment to detect the failure equipment (S11, S12).

가입자 구간 장애 검출 모듈(15)은 장애 장비의 ID를 추출하여 시설 정보 DB(62)를 검색함으로써 가입자 구간에 설치된 장비인지 아닌지를 판별한다.(S13, S14)The subscriber section failure detection module 15 determines whether the equipment is installed in the subscriber section by extracting the ID of the disabled device and searching the facility information DB 62. (S13, S14)

만약, 장애 상태 검색 모듈(11)에서 검출된 장애 장비들 중에서 가입자 구간에 설치된 장비가 아닌 경우에, 해당 장애 장비들은 서비스 제공자 측에서 발생한 장애로 판단하고 각 장비의 장애 상태에 대한 정보를 장애 테이블에 저장한 후에 고장 수리를 진행한다.(S15, S16)If the failure status detected by the failure state detection module 11 is not installed in the subscriber section among the failure equipment, the corresponding failure equipment is determined as a failure occurred in the service provider side and the information on the failure status of each equipment failure table After saving it in the memory, repair the problem. (S15, S16)

그런데, 가입자 구간에 설치된 장비들 중에서 장애가 발생한 경우에, SNMP지원 검색 모듈(21)은 SNMP 정보 DB(63)를 통해 해당 장비가 실질적으로 SNMP를 지원하는지를 판단한다.(S17)However, when a failure occurs among the devices installed in the subscriber section, the SNMP support search module 21 determines whether the corresponding device substantially supports SNMP through the SNMP information DB 63 (S17).

이때, 가입자 구간에 설치된 장애 장비가 SNMP를 지원하지 않는 경우에, 서비스 제공자는 원격으로 장애 복구 조치가 불가능하므로 고장수리 요원의 출동을 요청한다.(S18)At this time, if the failure equipment installed in the subscriber section does not support SNMP, the service provider requests the dispatch of the troubleshooter because the failure recovery action is not possible remotely.

가입자 구간에 설치된 장애 장비가 SNMP를 지원하는 경우에, 명령어 검색 모듈(25)은 SNMP-세트 명령어 DB(64)를 통해 해당 장비에 적용 가능한 SNMP-세트 명령어를 검색한다.(S19) 그리고, 원격 접속 모듈(31)은 원격 접속 정보 DB(65)를 이용하여 장애 장비에 텔넷 로그인하여 원격 접속을 시도한다.(S20)If the faulty device installed in the subscriber section supports SNMP, the command search module 25 searches for an SNMP-set command applicable to the device through the SNMP-set command DB 64 (S19). The access module 31 attempts a remote access by telnet logging in to the failing device using the remote access information DB 65. (S20)

이때, 원격 접속이 실패하면 서비스 제공자는 원격으로 장애 복구 조치가 불가능하므로 고장수리 요원의 출동을 요청하만, 원격 접속이 성공적으로 이루어지면 명령어 적용 모듈(35)은 명령어 검색 모듈(25)에서 검색한 명령어를 장애 장비에 적용한다.(S21, S22)In this case, if the remote access fails, the service provider requests the dispatch of a troubleshooting agent remotely because the failure recovery action is impossible, but if the remote access is successful, the command application module 35 searches for the command search module 25. Apply the command to the faulty device (S21, S22).

가입자 구간에 설치된 장애 장비에 SNMP-세트 명령어가 정상적으로 적용된 경우에, 장애 정보 처리부(40)는 온-디맨드 상으로 SNMP-세트 명령어가 적용된 장비의 장애 상태에 관한 정보를 수집, 분석하여 최종 장애 상태를 판단한다.(S23, S24)When the SNMP-set command is normally applied to the faulty device installed in the subscriber section, the fault information processing unit 40 collects and analyzes the information on the fault state of the device to which the SNMP-set command is applied on-demand to determine the final fault state. (S23, S24)

장애 처리 모듈(51)은 장애 정보 처리부(40)의 최종 장애 상태에 따라 원격으로 장애 복구 조치가 성공적으로 이루어진 장비의 경우에 장애를 해제한다.(S25, S26) 그런데, 장애 처리 모듈(51)은 원격으로 장애 복구 조치가 이루어지지 않는장비의 경우에 고장수리 요청 모듈(55)을 통해 가입자 측으로 고장수리 요원의 출동을 요청한다.(S25, S18)The failure processing module 51 releases a failure in the case of a device in which failure recovery is successfully performed remotely according to the final failure state of the failure information processing unit 40. (S25, S26) By the way, the failure processing module 51 In the case of the equipment that does not perform a failure recovery measures remotely, the request for the dispatch of a troubleshooting agent to the subscriber through the troubleshooting request module 55. (S25, S18)

이때, 고장수리 요청 모듈(55)은 가입자 구간에 설치된 장애 장비의 즉각적인 고장수리를 위해 고장수리 요원이 가입자 방문까지 소요되는 거리 및 시간을 고려하여 최적의 고장수리 요원을 수배한다.At this time, the troubleshooting request module 55 arranges the optimal troubleshooting personnel in consideration of the distance and time taken by the troubleshooting personnel to visit the subscriber for immediate troubleshooting of the failure equipment installed in the subscriber section.

이상에서 본 발명의 바람직한 실시예에 대하여 상세하게 설명하였지만 본 발명은 이에 한정되는 것은 아니며, 그 외의 다양한 변경이나 변형이 가능하다.Although the preferred embodiment of the present invention has been described in detail above, the present invention is not limited thereto, and various other changes and modifications are possible.

이와 같이, 네트워크 상에서의 장애 처리 시스템 및 그 방법은 네트워크 상에서 발생한 장애 중에서 가입자 구간에서 발생한 장애를 발췌하여 즉각적인 장애 복구 조치를 시도하고, 장애 회복이 되지 않는 경우에만 고장수리 요원의 출동을 요청함으로써 고장처리 시간을 단축시켜 가입자의 불만을 최소화하고, 고장수리 요원의 출동을 최소화하여 고장수리에 소요되는 노력과 비용을 절감시킬 수 있는 효과가 있다.As described above, the fault handling system and the method on the network fail by extracting the fault in the subscriber section among the faults occurring in the network and attempting an immediate fault recovery action, and requesting the dispatch of a troubleshooting agent only when the fault is not recovered. By shortening the processing time, it is possible to minimize the dissatisfaction of subscribers and minimize the dispatch of troubleshooting personnel, thereby reducing the effort and cost required for troubleshooting.

Claims (13)

가입자에게 인터넷 서비스를 제공하는 서비스 제공자가 네트워크 상에서의 장애 발생을 처리하는 네트워크 상에서의 장애 처리 시스템에 있어서,In a failure handling system on a network in which a service provider providing an Internet service to a subscriber handles occurrence of a failure on a network, 상기 서비스 제공자는,The service provider, 상기 다수의 가입자 회선에 접속된 네트워크 구성 장비의 장애 발생 여부를 검색하여 장애가 발생한 장비들 중에서 상기 가입자 구간에서 장애가 발생한 장비들을 검출하는 장애 장비 검색부;A faulty equipment searching unit configured to detect whether a fault occurs in the network component equipment connected to the plurality of subscriber lines, and detect faulty equipment in the subscriber section among faulty equipment; 상기 장애 검색부에서 검출된 가입자 구간에서의 장애 장비가 상기 서비스 제공자와 가입자간의 네트워크 관리를 담당하는 프로토콜을 지원하는 경우에, 해당 장비의 프로토콜 명령어를 검색하는 명령어 검색부;A command search unit for searching for a protocol command of a corresponding device when a disabled device in a subscriber section detected by the fault search unit supports a protocol for managing a network between the service provider and the subscriber; 상기 장애 검색부에서 검출된 장애 장비와 원격 접속하여 상기 명령어 검색부에서 검색된 명령어를 상기 장비에 적용하여 이상 유무를 판단하는 명령어 적용부;A command application unit for remotely accessing a failure device detected by the failure search unit to determine whether there is an error by applying a command retrieved from the command search unit to the device; 상기 명령어 적용부에서 명령어가 적용된 장애 장비의 상태 정보를 수집, 분석하여 해당 장비의 장애 상태를 수집하여 최종 장애 상태를 확인하는 장애정보 처리부; 및A failure information processing unit for collecting and analyzing state information of a failure device to which the command is applied by the command application unit to collect a failure state of the corresponding device to check a final failure state; And 상기 장애정보 처리부에서 장비의 최종 장애 상태를 통해 상기 장애 장비의 고장이 회복되면 상기 장비의 장애를 해제하고, 상기 장애 장비의 고장이 회복되지 않은 경우에 고장수리 요원의 현장 출동을 요청하는 서비스 지원부When the failure of the failure equipment is recovered through the last failure state of the equipment in the failure information processing unit, the service support unit for releasing the failure of the equipment, and requesting on-site dispatch of the troubleshooting personnel when the failure of the failure equipment is not recovered 를 포함하는 네트워크 상에서의 장애 처리 시스템.Failure handling system on the network comprising a. 제1항에 있어서,The method of claim 1, 상기 서비스 제공자는,The service provider, 상기 네트워크 구성 장비 관련 시설, 원격 접속 및 장애 정보와, 상기 프로토콜 관련 지원 유/무, 및 명령어 세트(SET) 정보를 저장하는 데이터베이스를 포함하는 네트워크 상에서의 장애 처리 시스템.And a database storing the network configuration equipment related facility, remote access and failure information, the protocol related support presence / absence, and instruction set information. 제1항에 있어서,The method of claim 1, 상기 장애 장비 검색부는,The obstacle equipment search unit, 상기 네트워크 구성 장비들 중에서 장애가 발생한 장애 장비를 검출하여 장애 테이블에 저장하는 장애 상태 검색 모듈; 및A failure state search module for detecting a failure device having a failure among the network configuration devices and storing the failure device in a failure table; And 상기 장애 상태 검색 모듈의 장애 테이블에서 장애 장비의 ID를 추출하여 가입자 구간에서 발생한 장애를 검출하는 가입자구간 장애 검출 모듈Subscriber section failure detection module for detecting the failure occurred in the subscriber section by extracting the ID of the failure equipment from the failure table of the failure state search module 을 포함하는 네트워크 상에서의 장애 처리 시스템.Failure handling system on the network comprising a. 제1항에 있어서,The method of claim 1, 상기 명령어 검색부는,The command search unit, 상기 장애 장비가 네트워크를 관리하기 위한 SNMP(Simple Network Management Protocol)을 지원하는지를 판단하는 SNMP 지원 검색 모듈; 및An SNMP support search module for determining whether the faulty device supports Simple Network Management Protocol (SNMP) for managing a network; And 상기 SNMP 지원 검색 모듈을 통해 SNMP를 지원하는 장비에 적용하기 위한 SNMP-세트(SET) 명령어를 검색하는 명령어 검색 모듈A command search module for searching for an SNMP-SET command for applying to a device that supports SNMP through the SNMP support search module 을 포함하는 네트워크 상에서의 장애 처리 시스템.Failure handling system on the network comprising a. 제1항에 있어서,The method of claim 1, 상기 명령어 적용부는,The command application unit, 상기 장애 장비에 원격 접속을 위해 로그인(LOGIN)하는 원격 접속 모듈; 및A remote access module for logging in to the faulty device for remote access; And 상기 원격 접속 모듈을 통해 상기 장애 장비와 원격 접속되면, 상기 명령어 검색부에서 검색된 명령어를 적용하여 이상 유무를 판단하는 명령어 적용 모듈;A command application module configured to determine whether there is an error by applying a command searched by the command search unit when the remote device is remotely connected with the disabled device through the remote access module; 을 포함하는 네트워크 상에서의 장애 처리 시스템.Failure handling system on the network comprising a. 제1항에 있어서,The method of claim 1, 상기 서비스 지원부는,The service support unit, 상기 장애정보 처리부를 통해 상기 장애 장비의 최종 장애 상태가 고장 회복된 경우에 상기 장애 장비에 대한 장애를 해제하고, 상기 장애 장비의 고장이 회복되지 않은 경우에 고장 수리를 지시하는 장애 처리 모듈; 및A failure processing module for releasing the failure of the failure equipment when the last failure state of the failure equipment is recovered through the failure information processing unit, and instructing troubleshooting when the failure of the failure equipment is not recovered; And 상기 장애 처리 모듈에서 고장 수리를 지시한 경우에 상기 장애 장비의 고장 수리를 위해 고장수리 요원을 수배하여 출동을 요청하는 고장수리 요청 모듈When the fault handling module instructs a fault repair, a fault repair request module for requesting dispatch by a fault repair agent for fault repair of the faulty equipment 을 포함하는 네트워크 상에서의 장애 처리 시스템.Failure handling system on the network comprising a. 가입자에게 인터넷 서비스를 제공하는 서비스 제공자가 네트워크 상에서의 장애 발생을 처리하는 네트워크 상에서의 장애 처리 방법에 있어서,What is claimed is: 1. A method of handling a failure in a network in which a service provider providing an Internet service to a subscriber handles occurrence of a failure in a network. A) 상기 서비스 제공자는 네트워크 상에서 운용중인 네트워크 구성 장비의 상태 정보를 수집하여 장애 장비들을 검출하는 단계;A) the service provider collecting the status information of the network configuration equipment running on the network to detect the failure equipment; B) 상기 A) 단계에서 검출된 장비 중에서 가입자 구간에서 장애가 발생한 장애 장비들을 발췌하여, 상기 장애 장비가 서비스 제공자와 가입자간의 네트워크 관리를 담당하는 프로토콜의 지원 여부를 검색하는 단계;B) extracting the faulty equipments in which the fault occurs in the subscriber section among the equipment detected in step A), and searching whether the faulty equipment supports the protocol for managing the network between the service provider and the subscriber; C) 상기 B) 단계에서 장애 장비가 상기 프로토콜을 지원하는 경우에, 상기 장애 장비에 해당하는 명령어를 검색하고, 상기 장애 장비와 원격 접속을 통해 상기 명령어를 상기 장애 장비에 적용하는 단계; 및C) if the faulty equipment supports the protocol in step B), searching for a command corresponding to the faulty equipment, and applying the command to the faulty equipment through a remote connection with the faulty equipment; And D) 상기 C) 단계에서 상기 장애 장비에 명령어를 적용한 결과를 수집, 분석하여 상기 장애 장비의 최종 장애 상태를 판단하고, 고장수리 요원의 출동 여부를 결정하는 단계D) collecting and analyzing the result of applying the command to the faulty equipment in step C) to determine the final fault state of the faulty equipment, and determining whether to dispatch a repairman. 을 포함하는 네트워크 상에서의 장애 처리 방법.Failure handling method on a network comprising a. 제7항에 있어서,The method of claim 7, wherein 상기 B) 단계에서 가입자 구간에서의 장애 장비를 발췌하는 단계는,In the step B), extracting the disabled equipment in the subscriber section, 상기 A) 단계에서 검출된 장애 장비들의 ID를 추출하여 각 장비의 ID와 상기 네트워크 구성 장비에 관한 시설 정보를 매칭시켜 가입자 구간에서 발생한 장애를 검출하는 것을 특징으로 하는 네트워크 상에서의 장애 처리 방법.And extracting the IDs of the faulty devices detected in step A), matching the ID of each device with the facility information on the network component, and detecting a fault occurring in the subscriber section. 제7항에 있어서,The method of claim 7, wherein 상기 B) 단계에서 상기 장애 장비가 상기 프로토콜을 지원하지 않는 경우에, 상기 서비스 제공자는 고장수리 요원의 출동을 요청하는 것을 특징으로 하는 네트워크 상에서의 장애 처리 방법.If the failure equipment does not support the protocol in step B), the service provider requests the dispatch of a troubleshooting agent. 제7항에 있어서,The method of claim 7, wherein 상기 C) 단계에서 상기 장애 장비에 명령어를 적용하는 단계는,In the step C) of applying a command to the disabled equipment, 상기 장애 장비가 SNMP(Simple Network Management Protocol)을 지원하면, 상기 장애 장비에 적용 가능한 SNMP-세트(SET) 명령어를 검색하고, 상기 장애 장비에 텔넷 로그인(TELNET LOGIN)하여 상기 명령어를 적용하는 것을 특징으로 하는 네트워크 상에서의 장애 처리 방법.If the faulty device supports Simple Network Management Protocol (SNMP), it searches for an SNMP-SET command applicable to the faulty device, and Telnet LOGIN to the faulty device to apply the command. Method of handling failure on network. 제10항에 있어서,The method of claim 10, 상기 장애 장비에 텔넷 로그인이 실패하여 원격 접속되지 않는 경우에, 상기 서비스 제공자는 고장수리 요원의 출동을 요청하는 것을 특징으로 하는 네트워크 상에서의 장애 처리 방법.If the telnet login fails to remotely connect to the faulty equipment, the service provider requests the dispatch of a troubleshooting agent. 제7항에 있어서,The method of claim 7, wherein 상기 D) 단계에서 고장수리 요원의 출동 여부를 결정하는 단계는,In the step D), the step of determining whether or not to dispatch a troubleshooting agent, 상기 장애 장비의 최종 장애 상태가 고장 회복된 경우에 상기 장애 장비에 대한 장애를 해제하고, 상기 장애 장비의 고장이 회복되지 않은 경우에 고장수리 요원을 수배하여 해당 장비의 가입자 측에 방문을 요청하는 것을 특징으로 하는 네트워크 상에서의 장애 처리 방법.When the failure state of the failure equipment is recovered, the failure of the failure equipment is released, and when the failure of the failure equipment is not recovered, a troubleshooter is arranged to request a visit to the subscriber of the equipment. Method for handling a failure on a network, characterized in that. 제7항에 있어서,The method of claim 7, wherein 상기 A) 단계에서 장애 장비를 검출하는 단계는,Detecting the faulty equipment in step A), 상기 장애 장비들을 장애 테이블에 저장하고, 상기 가입자 구간에서의 장애 장비 이외의 장비들에 대해 상기 서비스 제공자 측에서 고장 수리 절차를 수행하는 것을 특징으로 하는 네트워크 상에서의 장애 처리 방법.Storing the faulty equipments in a fault table and performing a troubleshooting procedure at the service provider for devices other than the faulty equipment in the subscriber section.
KR1020030042689A 2003-06-27 2003-06-27 System and method for recovery of network failure KR100993944B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020030042689A KR100993944B1 (en) 2003-06-27 2003-06-27 System and method for recovery of network failure

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020030042689A KR100993944B1 (en) 2003-06-27 2003-06-27 System and method for recovery of network failure

Publications (2)

Publication Number Publication Date
KR20050001122A true KR20050001122A (en) 2005-01-06
KR100993944B1 KR100993944B1 (en) 2010-11-11

Family

ID=37216973

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020030042689A KR100993944B1 (en) 2003-06-27 2003-06-27 System and method for recovery of network failure

Country Status (1)

Country Link
KR (1) KR100993944B1 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102216574B1 (en) 2018-07-20 2021-02-16 주식회사 케이티 Apparatus and method for deciding failure domain using failure alarm

Also Published As

Publication number Publication date
KR100993944B1 (en) 2010-11-11

Similar Documents

Publication Publication Date Title
US8738760B2 (en) Method and system for providing automated data retrieval in support of fault isolation in a managed services network
US8812649B2 (en) Method and system for processing fault alarms and trouble tickets in a managed network services system
US8732516B2 (en) Method and system for providing customer controlled notifications in a managed network services system
US8676945B2 (en) Method and system for processing fault alarms and maintenance events in a managed network services system
US8924533B2 (en) Method and system for providing automated fault isolation in a managed services network
US6604137B2 (en) System and method for verification of remote spares in a communications network when a network outage occurs
US6457050B1 (en) System and method for dynamically restoring communications within a network
US6674724B1 (en) Integrated telecommunications test system
JPH0576215B2 (en)
CN100421390C (en) Client service emergency system and its realizing method
US7995485B1 (en) Method and apparatus for providing automated diagnostics of networks
US8291120B2 (en) Systems, methods, and computer program product for automatically verifying a standby site
CN113825164A (en) Network fault repairing method and device, storage medium and electronic equipment
JP2013130901A (en) Monitoring server and network device recovery system using the same
KR100993944B1 (en) System and method for recovery of network failure
JP6555721B2 (en) Disaster recovery system and method
EP3252995B1 (en) Method for detecting network failures
KR102341418B1 (en) System and Method for Real-Time Trouble Cause Analysis based on Network Quality Data
CN101958925A (en) Method and device for controlling remote equipment
US6137774A (en) System and method for dispatching commands to switching elements within a communications network
KR100298176B1 (en) Method for switching detour route with bypassing error transmission line in subscriber line service of communication network management system
Cisco Taking Corrective Action On Events and Alarms
Cisco Detecting and Correcting Failures
Cisco Taking Corrective Action On Events and Alarms
KR100566610B1 (en) automatic disaster recovery system and recovery method thereof

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20131101

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20171101

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20181031

Year of fee payment: 9