KR20030050464A - A Management of Fault Information in Telecommunication Network - Google Patents

A Management of Fault Information in Telecommunication Network Download PDF

Info

Publication number
KR20030050464A
KR20030050464A KR1020010080894A KR20010080894A KR20030050464A KR 20030050464 A KR20030050464 A KR 20030050464A KR 1020010080894 A KR1020010080894 A KR 1020010080894A KR 20010080894 A KR20010080894 A KR 20010080894A KR 20030050464 A KR20030050464 A KR 20030050464A
Authority
KR
South Korea
Prior art keywords
failure
fault
information
message
agent
Prior art date
Application number
KR1020010080894A
Other languages
Korean (ko)
Other versions
KR100570835B1 (en
Inventor
이재욱
김태완
Original Assignee
한국전자통신연구원
주식회사 케이티
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국전자통신연구원, 주식회사 케이티 filed Critical 한국전자통신연구원
Priority to KR1020010080894A priority Critical patent/KR100570835B1/en
Publication of KR20030050464A publication Critical patent/KR20030050464A/en
Application granted granted Critical
Publication of KR100570835B1 publication Critical patent/KR100570835B1/en

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0695Management of faults, events, alarms or notifications the faulty arrangement being the maintenance, administration or management system
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04QSELECTING
    • H04Q1/00Details of selecting apparatus or arrangements
    • H04Q1/18Electrical details
    • H04Q1/20Testing circuits or apparatus; Circuits or apparatus for detecting, indicating, or signalling faults or troubles
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04QSELECTING
    • H04Q2213/00Indexing scheme relating to selecting arrangements in general and for multiplex systems
    • H04Q2213/16Service observation; Fault circuit; Testing

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Computer And Data Communications (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

PURPOSE: A system and method for managing failure information in a communication network is provided to automatically detect communication failure between an agent and a manager and automatically restore a failure information error. CONSTITUTION: A communication device(100) having communication equipments performs a communication and reports a failure to an agent(200). The agent(200) receives the failure from the communication device(100), converts it into a failure message form and continuously reports it to a manager(300). The manager(300) processes the failure message. A failure receiver(310) receives the failure message from the agent(200). A failure processor(320) processes the failure message appropriately. A failure storing unit(330) stores the pressed failure message. A failure reporter(340) reports the processed failure to an operator's computer(400). A reception state monitor(350) monitors a communication failure with respect to the agent(200). A failure restoring unit(360) automatically restores failure information with error due to failure message loss caused by a communication failure. A restored information storing unit(380) stores the failure for a predetermined period after the communication state is normally restored for a failure restoration.

Description

통신망에서의 장애정보 관리 시스템 및 관리 방법{A Management of Fault Information in Telecommunication Network}Fault information management system and management method in communication network {A Management of Fault Information in Telecommunication Network}

본 발명은 대행자(agent)가 관리자(manager)에게 보고하는 통신관리망의 장애 관리 기능에 있어서, 관리자와 대행자 사이의 통신장애 등으로 인하여 대행자의 장애 정보가 유실되는 경우 관리자의 장애 정보 복구를 위한 장애정보의 수신 상태감시, 오류의 발생검출 및 장애정보 오류복구를 위한 장애정보 관리 시스템 및 관리 방법에 관한 것이다.The present invention is in the failure management function of the communication management network that the agent (manager) reports to the manager, when the agent's failure information is lost due to communication failure between the manager and the agent for the manager's failure information recovery The present invention relates to a failure information management system and a management method for monitoring a reception status of failure information, detecting occurrence of an error, and recovering from failure information.

종래의 통신망 관리 시스템에서 있어서, 관리자와 대행자 사이의 통신 장애 등으로 인하여 장치에서 발생한 신규 장애 메시지가 중간에 유실되거나 해제 메시지가 유실되어 관리자가 잘못된 장애정보를 운용자에게 전달하는 경우가 발생하므로 인하여, 장치의 운용유지보수에 오류를 발생시켜 장치의 신뢰성을 저하시키는 문제가 있었다. 이에 따라 관리자와 대행자 사이의 통신장애로 인한 장애 메시지의 불일치 등을 검출하고, 또한 이를 자동으로 복구하는 기술이 요구된다.In the conventional network management system, because a new failure message generated in the device is lost in the middle due to a communication failure between the manager and the agent, or the release message is lost, the administrator may deliver the wrong failure information to the operator, There was a problem that caused errors in the operation and maintenance of the device to reduce the reliability of the device. Accordingly, there is a need for a technique for detecting a mismatch in a failure message due to a communication failure between an administrator and an agent, and automatically recovering the mismatch.

따라서, 본 발명은 통신 관리망의 대행자와 관리자 사이의 통신장애를 자동으로 검출함과 동시에 발생한 장애정보 오류를 자동으로 복구함으로써 운용자의 신뢰성 있는 유지보수를 가능하게 하는 통신망에서의 장애정보 관리 시스템 및 관리방법을 제공하는데 그 목적이 있다.Accordingly, the present invention provides an error information management system in a communication network that enables reliable maintenance of an operator by automatically detecting a communication error between an agent and a manager of a communication management network and automatically recovering an error information that occurred. The purpose is to provide a management method.

도1은 본 발명에 따른 장애정보 관리 시스템의 블록 구성도이다.1 is a block diagram of a failure information management system according to the present invention.

도2는 본 발명에 따른 장애정보 오류 감지 순서도이다.2 is a flowchart of error detection error information according to the present invention.

도3은 본 발명에 따른 장애정보 오류 복구 순서도이다.3 is a flowchart of error information error recovery according to the present invention.

*도면의 주요 부분에 대한 부호의 설명 *Explanation of symbols on the main parts of the drawings

100: 통신장치 200: 대행자100: communication device 200: agent

300: 관리자 400: 운용자300: manager 400: operator

210: 장애송신기 310: 장애수신기,210: disabled transmitter 310: disabled receiver,

320: 장애처리기 330: 장애저장기320: fault handler 330: fault saver

340: 장애보고기 350: 수신상태감시기340: failure reporter 350: reception status monitoring

360: 장애복구기 380: 복구정보저장기360: recovery device 380: recovery information storage

상기 목적을 달성하기 위한 본 발명에 따른 장애정보 관리 시스템은, 통신장치에서 발생하는 장애를 수신받아 장애 메시지 형태로 변환하여 보고하는 대행자와, 상기 대행자로부터 수신된 장애 메시지를 처리하는 관리자와, 전체 시스템의 운용보수를 맡는 운용자 컴퓨터를 포함하는 통신망에서의 장애정보 관리 시스템에있어서, 상기 대행자는 장애를 메시지형태로 조립하여 상기 관리자에게 송신하는 장애송신기를 포함하고, 상기 관리자는 상기 대행자로부터 송신되는 장애 메시지를 수신하는 장애수신기, 상기 장애 수신기에 의해 수신된 장애 메시지를 처리하는 장애처리기, 상기 장애처리기에 의해 처리된 장애 메시지를 저장하는 장애저장기, 상기 장애처리기에 의해 처리된 장애를 상기 운용자 컴퓨터에게 보고하기 위한 장애보고기, 상기 대행자와의 통신장애를 감시하는 수신상태 감시기, 통신장애로 인한 장애 메시지 유실로 오류가 발생한 장애정보를 자동 복구하는 장애복구기, 및 장애복구를 위하여 통신상태 정상 복귀 후 일정기간 동안의 장애를 보관하는 복구정보 저장기를 포함하는 것을 특징으로 한다.Disability information management system according to the present invention for achieving the above object, receiving a failure generated in the communication device converted to a failure message form and reporting, the manager for processing the failure message received from the agent, and the whole In a fault information management system in a communication network including an operator computer in charge of operating and maintaining the system, the agent includes a fault transmitter for assembling faults in a message form and sending them to the manager, the manager being transmitted from the agent. A fault receiver for receiving a fault message, a fault handler for handling a fault message received by the fault receiver, a fault store for storing a fault message processed by the fault handler, and a fault handled by the fault handler. Disability Reporter for reporting to computer, above Receiving status monitor that monitors communication failures with the user, fault recovery device that automatically recovers fault information due to loss of fault messages due to communication faults, and keeps faults for a certain period after returning to normal communication state for fault recovery It characterized in that it comprises a recovery information storage.

또한, 본 발명에 따른 장애정보 관리 방법은, 통신장치에서 발생하는 장애를 수신받아 장애 메시지 형태로 변환하여 보고하는 대행자와, 상기 대행자로부터 수신된 장애 메시지를 처리하는 관리자와, 전체 시스템의 운용보수를 맡는 운용자 컴퓨터를 포함하는 장애정보 관리 시스템에서의 장애정보 관리 방법에 있어서, 상기 관리자가 상기 대행자와의 통신 상태를 감시하여 통신 상태 이상 발생 후 정상으로 복귀하면 장애등급별 시간배정을 수행하고, 장애저장기에 저장된 장애정보를 장애등급별로 정렬하는 제1 단계; 상기 관리자가 현재시간과 수신상태정상복귀시간의 차를 계산하여, 상기 장애등급별 시간배정에서 설정한 시간이 상기 계산된 현재시간과 수신상태정상복귀시간의 차보다 크면, 상기 장애저장기내의 장애정보 중에서 해당 등급의 장애정보가 존재하는지 확인하는 제2 단계; 해당 등급의 장애정보가 존재하면, 해당 등급의 장애정보를 추출하고, 장애정보와 복구저장기내의 복구정보를 비교 검색하여, 동일 통신장치에서 발생한 장애 메시지가 존재하는지 확인하는 제3 단계; 및 동일 통신장치에서 발생한 장애 메시지가 존재하면, 장애 메시지의 내용을 적용하고, 동일 통신장치에서 발생한 장애 메시지가 존재하지 않으면, 유실된 장애 메시지가 장애복구 메시지라고 판단하여 해당 장애정보의 장애를 해제하는 제4 단계를 포함하는 것을 특징으로 한다.In addition, the failure information management method according to the present invention, the agent receiving the failure occurring in the communication device to convert the report into a failure message form, the manager processing the failure message received from the agent, and the maintenance of the entire system In a failure information management method in a failure information management system including an operator computer in charge, the administrator monitors the communication status with the agent, and when the communication status is abnormal and returns to the normal state, time allocation for each failure level is performed, and the failure is performed. A first step of sorting the failure information stored in the storage unit according to a failure level; If the administrator calculates the difference between the current time and the reception state normal return time, and the time set in the time allocation for each fault level is larger than the difference between the calculated current time and the reception state normal return time, the fault information in the fault storage device. A second step of checking whether there is disability information of a corresponding level among the information; A third step of extracting failure information of the corresponding grade, searching for the failure information and recovery information in the recovery storage by comparing the failure information of the corresponding grade, and checking whether there is a failure message generated in the same communication device; And if there is a failure message occurring in the same communication device, apply the contents of the failure message, and if there is no failure message occurring in the same communication device, determine that the lost failure message is a failure recovery message and release the failure of the corresponding failure information. It characterized in that it comprises a fourth step.

또한, 본 발명은, 프로세서를 구비하는 컴퓨터에서, 대행자와의 통신 상태를 감시하여 통신 상태 이상 발생 후 정상으로 복귀하면 장애등급별 시간배정을 수행하고, 장애저장기에 저장된 장애정보를 장애등급별로 정렬하는 제1 기능; 현재시간과 수신상태정상복귀시간의 차를 계산하여, 상기 장애등급별 시간배정에서 설정한 시간이 상기 계산된 현재시간과 수신상태정상복귀시간의 차보다 크면, 상기 장애저장기내의 장애정보 중에서 해당 등급의 장애정보가 존재하는지 확인하는 제2 기능; 해당 등급의 장애정보가 존재하면, 해당 등급의 장애정보를 추출하고, 장애정보와 복구저장기내의 복구정보를 비교 검색하여, 동일 통신장치에서 발생한 장애 메시지가 존재하는지 확인하는 제3 기능; 동일 통신장치에서 발생한 장애 메시지가 존재하면, 장애 메시지의 내용을 적용하고, 동일 통신장치에서 발생한 장애 메시지가 존재하지 않으면, 유실된 장애 메시지가 장애복구 메시지라고 판단하여 해당 장애정보의 장애를 해제하는 제4 기능; 및 상기 장애저장기에 존재하는 모든 장애정보에 대한 복구가 수행된 후, 운용자 컴퓨터에게 장애 오류 복구 내용을 보고하는 제5 기능을 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체를 제공한다.In addition, the present invention, in a computer having a processor, monitors the communication state with the agent and if the communication state abnormality occurs after returning to normal to perform the time assignment for each failure level, and to sort the failure information stored in the failure storage for each failure level First function; Calculate the difference between the current time and the reception state normal return time, and if the time set in the time allocation for each fault level is greater than the difference between the calculated current time and the reception state normal return time, the corresponding level among the fault information in the fault storage. A second function of checking whether there is a failure information of a; A third function of extracting fault information of the corresponding class, comparing and searching the fault information and the repair information in the recovery storage, and checking whether there is a fault message generated in the same communication device if the fault information of the corresponding class exists; If a failure message occurred in the same communication device exists, the contents of the failure message are applied, and if a failure message generated in the same communication device does not exist, it is determined that the lost failure message is a failure recovery message and the failure of the corresponding failure information is released. Fourth function; And after the recovery of all the failure information existing in the failure storage is provided, provides a computer-readable recording medium recording a program for executing a fifth function for reporting the failure error recovery to the operator computer.

이하, 첨부된 도면을 참조하여 본 발명에 따른 바람직한 실시 예를 상세히 설명한다.Hereinafter, exemplary embodiments of the present invention will be described in detail with reference to the accompanying drawings.

도1은 본 발명에 따른 통신망 장애정보 관리 시스템의 개략적인 블록 구성도를 나타낸다.1 is a schematic block diagram of a network failure information management system according to the present invention.

일반적으로 통신망 장애정보 관리 시스템은 통신장치(100)에서 발생하는 장애를 수신받아 장애 메시지 형태로 변환하여 관리자(300)에게 보고하는 대행자(200)와, 상기 대행자(200)로부터 수신된 장애 메시지를 처리하는 관리자(300), 및 전체 시스템의 운용보수를 맡는 운용자 컴퓨터(400)로 구성된다.In general, a communication network failure information management system receives a failure occurring in the communication device 100 and converts it into a failure message form and reports the manager 200 to the manager 300 and the failure message received from the agent 200. Manager 300 for processing, and operator computer 400 in charge of the maintenance of the entire system.

통신장치(100)는 통신을 전담하는 장비들이 적재되어 통신을 수행하는 기능을 담당하며, 적재한 장비에 장애가 발생하면 대행자(200)에게 해당 장애를 보고한다. 또한, 현재 발생중인 장애가 일정시간 안에 복구되지 않으면 동일한 장애를 주기적으로 발생한다.The communication device 100 is responsible for the function of performing communication by loading the equipment dedicated to communication, and reports a failure to the agent 200 when a failure occurs in the loaded equipment. In addition, if the current failure does not recover within a certain time, the same failure occurs periodically.

대행자(200)는 통신장치(100)에서 발생하는 장애를 수신받아 장애 메시지 형태로 변환하여 관리자(300)에게 지속적으로 보고한다. 대행자(200)의 구성은 장애를 메시지형태로 조립하여 관리자(300)에게 송신하는 장애송신기(210) 이외에는 어떤 구성 및 기능도 필요하지 않다.The agent 200 receives a failure occurring in the communication device 100, converts it into a failure message form, and continuously reports to the manager 300. The configuration of the agent 200 does not require any configuration and function other than the failure transmitter 210 to assemble the failure in the form of a message to the manager 300.

관리자(300)는 대행자(200)로부터 수신된 장애 메시지를 처리하는 기능을 수행한다. 관리자(300)의 구성은 대행자(200)로부터 송신되는 장애 메시지를 수신하는 장애수신기(310), 수신된 장애 메시지를 적절하게 처리하는 장애처리기(320), 처리된 장애 메시지를 저장하는 장애저장기(330), 처리된 장애를 운용자컴퓨터(400)에게 보고하기 위한 장애보고기(340), 대행자(200)와의 통신장애를 감시하는 수신상태 감시기(350), 통신장애로 인한 장애 메시지 유실로 오류가 발생한 장애정보를 자동 복구하는 장애복구기(360), 및 장애복구를 위하여 통신상태 정상 복귀 후 일정기간 동안의 장애를 보관하는 복구정보 저장기(380)로 구성된다.The manager 300 performs a function of processing a failure message received from the agent 200. The configuration of the manager 300 includes a failure receiver 310 for receiving a failure message transmitted from the agent 200, a failure handler 320 for properly processing the received failure message, and a failure storage device for storing the processed failure message. 330, a failure reporter 340 for reporting the processed failure to the operator computer 400, a reception status monitor 350 for monitoring a communication failure with the agent 200, error due to loss of a failure message due to a communication failure The fault recovery unit 360 automatically recovers the fault information that has occurred, and the recovery information storage unit 380 for storing a fault for a predetermined period of time after the normal return of the communication state for fault recovery.

도2는 본 발명에 따른 장애정보 오류 감지 순서도를 나타낸다.2 is a flowchart illustrating error information error detection according to the present invention.

대행자(200)와 관리자(300)는 장애송신기(210)와 장애수신기(310)를 통하여 지속적으로 장애 메시지를 송수신한다. 만약, 대행자(200)와 관리자(300)사이의 통신장애가 발생하면 수신상태감시기(350)에 의하여 통신장애를 감지한다.The agent 200 and the manager 300 continuously transmit and receive a failure message through the failure transmitter 210 and the failure receiver 310. If a communication failure occurs between the agent 200 and the manager 300, the communication failure is detected by the reception state monitor 350.

수신상태 감시기(350)는 수신상태 초기화(352)와 복구상태 초기화(353)를 수행하여, 현재 송수신상태가 정상적이며 복구가 필요하지 않다는 것을 설정한다. 그리고, 수신상태 감시기는 장애송신기와의 수신상태 정상여부를 확인하여(354) 정상이면 계속 수신상태를 감시한다. 만약 수신상태가 비정상이면 복구상태를 설정하고(355) 수신상태를 감시한다. 계속적으로 수신상태 정상여부를 감시하여(356) 비정상 상태이면 계속 수신상태를 감시한다. 만약, 수신상태가 정상상태로 복귀하였으면, 장애 메시지 유실로 인하여 장애정보에 오류가 발생한 것으로 결정하고 장애복구요구(357)에 의하여 장애복구기(360)를 호출하여 복구를 수행한다.The reception state monitor 350 performs the reception state initialization 352 and the recovery state initialization 353 to set up that the current transmission / reception state is normal and no recovery is required. Then, the reception state monitor checks whether the reception state with the fault transmitter is normal (354) and continues to monitor the reception state if it is normal. If the reception state is abnormal, the recovery state is set (355) and the reception state is monitored. It continuously monitors whether the reception state is normal (356) and if it is abnormal, continuously monitors the reception state. If the reception state is returned to the normal state, it is determined that an error has occurred in the failure information due to the failure of the failure message, and the failure recovery request 357 calls the failure recovery unit 360 to perform recovery.

도3은 본 발명에 따른 장애정보 오류 복구 순서도를 나타낸다.3 is a flowchart of error information error recovery according to the present invention.

장애복구요구(357)에 의하여 호출된 장애복구기(360)는 장애등급별 시간배정을 수행한다(362). 장애등급별 시간배정에서는 장애등급별로 반복적으로 동일한 장애 메시지를 발생시키는 통신장치 발생주기를 이용한다. 예를 들어, 긴급장애등급의 경우 발생주기는 15분, 주요장애등급의 경우 발생주기는 30분 및 경미장애등급의 경우 발생주기는 60분 등의 주기를 내부 변수에 설정한다. 관리자(300)의 장애저장기(330)에 저장된 장애정보를 장애등급별로 정렬한다(363). 다음으로, 모든 장애등급에 해당하는 만큼의 반복처리(364)를 수행한다.The failure recovery device 360 called by the failure recovery request 357 performs time allocation according to a failure level (362). The time allocation for each fault class uses a communication device generation cycle that repeatedly generates the same fault message for each fault class. For example, in case of emergency disability level, the period of occurrence is 15 minutes, in case of major disability level, the frequency of occurrence is 30 minutes and in case of mild disability level, the frequency of occurrence is 60 minutes. The failure information stored in the failure storage unit 330 of the manager 300 is sorted by failure level (363). Next, iterative processing 364 corresponding to all failure levels is performed.

반복처리(364)는 현재시간과 수신상태정상복귀시간의 차를 계산한다(365). 상기 계산된 결과와 장애등급별 시간배정에서 설정한 시간을 비교하여(366) 장애등급별 시간배정에서 설정한 시간이 클 경우, 장애저장기(330)내의 장애정보 중에 해당 i-등급장애정보 존재여부를 확인한다(367). 확인 결과, 해당 등급의 장애정보가 존재하면, 해당 등급의 장애정보를 추출하고(368), 장애정보와 복구저장기(380)내의 복구정보를 비교 검색하여(369), 동일 통신장치(100)에서 발생한 장애 메시지가 존재하는지 확인한다(370). 확인 결과(370), 동일 통신장치에서 발생한 장애 메시지가 존재하면, 장애 메시지의 내용을 적용하고(371), 동일 통신장치에서 발생한 장애 메시지가 존재하지 않으면, 유실된 장애 메시지가 장애복구 메시지라고 판단하여 해당 장애정보의 장애를 해제한다(372). 상기와 같은 과정은 해당 등급을 갖는 장애정보에 대하여 모두 수행된다(373).The iterative process 364 calculates the difference between the current time and the reception state normal return time (365). The calculated result is compared with the time set by the time class for each disability class (366). If the time set by the time class by the disability class is large, the presence of corresponding i-class disability information among the fault information in the fault storage unit 330 is determined. Check (367). As a result of the check, if there is the failure information of the corresponding grade, the failure information of the corresponding grade is extracted (368), the failure information and the recovery information in the recovery storage (380) by comparing and searching (369), the same communication device 100 In step 370, it is determined whether there is a failure message that has occurred. As a result of the check 370, if there is a failure message occurring in the same communication device, the contents of the failure message are applied (371). If there is no failure message occurring in the same communication device, it is determined that the lost failure message is a failure recovery message. The fault of the corresponding fault information is released (372). The above process is performed for all disability information having the corresponding level (373).

상기의 과정을 거쳐 장애저장기에 존재하는 모든 장애정보에 대한 복구가 수행된 후, 관리자(300)는 장애보고기(340)를 통하여 운용자 컴퓨터(400)에게 장애 오류 복구 내용을 보고한다.After the recovery of all the failure information existing in the failure store through the above process, the manager 300 reports the failure error recovery contents to the operator computer 400 through the failure reporter (340).

상기와 같은 본 발명에 의하면, 관리자와 대행자 사이의 통신장애 등으로 인하여 대행자의 정보 보고가 유실되는 경우 관리자의 정보 복구를 위한 불일치 검출 및 이의 복구를 자동으로 수행할 수 있으므로, 정보의 불일치를 자동으로 검출함과 동시에 이를 자동으로 복구함으로써, 운용자의 신뢰성 있는 유지보수를 가능하게 한다. 또한, 본 발명은 종래의 방법에서 사용한 대행자에서 통신장애에 따른 메시지의 버퍼링을 필요로 하지 않고, 통신장애 해지 시 버퍼링된 메시지를 일괄적으로 전송하지 않으므로 대행자의 저렴한 개발이 가능하다.According to the present invention as described above, if the information reporting of the agent is lost due to communication failure between the manager and the agent, it is possible to automatically detect the inconsistency and recovery of the inconsistency for the administrator's information recovery, so that the information inconsistency It automatically detects and recovers automatically, enabling reliable maintenance of the operator. In addition, the present invention does not require the buffering of the message according to the communication failure in the agent used in the conventional method, it is possible to inexpensive development of the agent because the buffered message is not transmitted collectively when the communication failure is terminated.

Claims (5)

통신장치에서 발생하는 장애를 수신받아 장애 메시지 형태로 변환하여 보고하는 대행자와, 상기 대행자로부터 수신된 장애 메시지를 처리하는 관리자와, 전체 시스템의 운용보수를 맡는 운용자 컴퓨터를 포함하는 통신망에서의 장애정보 관리 시스템에 있어서,Failure information in a communication network including an agent that receives a failure occurring in the communication device, converts it into a failure message form, reports an administrator, an administrator processing a failure message received from the agent, and an operator computer in charge of operating and maintaining the entire system. In the management system, 상기 대행자는 장애를 메시지형태로 조립하여 상기 관리자에게 송신하는 장애송신기를 포함하고,The agent includes a failure transmitter for assembling the failure in the form of a message to the manager, 상기 관리자는 상기 대행자로부터 송신되는 장애 메시지를 수신하는 장애수신기, 상기 장애 수신기에 의해 수신된 장애 메시지를 처리하는 장애처리기, 상기 장애처리기에 의해 처리된 장애 메시지를 저장하는 장애저장기, 상기 장애처리기에 의해 처리된 장애를 상기 운용자 컴퓨터에게 보고하기 위한 장애보고기, 상기 대행자와의 통신장애를 감시하는 수신상태 감시기, 통신장애로 인한 장애 메시지 유실로 오류가 발생한 장애정보를 자동 복구하는 장애복구기 및 장애복구를 위하여 통신상태 정상 복귀 후 일정기간 동안의 장애를 보관하는 복구정보 저장기를 포함하는 것을 특징으로 하는 통신망에서의 장애정보 관리 시스템.The manager may include a fault receiver receiving a fault message transmitted from the agent, a fault handler processing a fault message received by the fault receiver, a fault store storing a fault message processed by the fault handler, and the fault processor. A fault reporter for reporting a fault handled by the operator to the operator computer, a reception state monitor for monitoring a communication fault with the agent, a fault recoverer for automatically recovering fault information caused by a fault message lost due to a communication fault And a recovery information storage device for storing a failure for a predetermined period of time after the communication state returns to normal for recovery of the failure. 통신장치에서 발생하는 장애를 수신받아 장애 메시지 형태로 변환하여 보고하는 대행자와, 상기 대행자로부터 수신된 장애 메시지를 처리하는 관리자와, 전체 시스템의 운용보수를 맡는 운용자 컴퓨터를 포함하는 장애정보 관리 시스템에서의장애정보 관리 방법에 있어서,In the failure information management system including an agent that receives a failure occurring in the communication device and converts it into a failure message form, a manager for processing a failure message received from the agent, and an operator computer in charge of operating the entire system. In the failure information management method, 상기 관리자가 상기 대행자와의 통신 상태를 감시하여 통신 상태 이상 발생 후 정상으로 복귀하면 장애등급별 시간배정을 수행하고, 장애저장기에 저장된 장애정보를 장애등급별로 정렬하는 제1 단계;A first step in which the manager monitors a communication state with the agent and performs time allocation for each fault level when the communication state returns to normal after an abnormal communication state occurs, and sorts the fault information stored in the fault store by the fault level; 상기 관리자가 현재시간과 수신상태정상복귀시간의 차를 계산하여, 상기 장애등급별 시간배정에서 설정한 시간이 상기 계산된 현재시간과 수신상태정상복귀시간의 차보다 크면, 상기 장애저장기내의 장애정보 중에서 해당 등급의 장애정보가 존재하는지 확인하는 제2 단계;If the administrator calculates the difference between the current time and the reception state normal return time, and the time set in the time allocation for each fault level is larger than the difference between the calculated current time and the reception state normal return time, the fault information in the fault storage device. A second step of checking whether there is disability information of a corresponding level among the information; 해당 등급의 장애정보가 존재하면, 해당 등급의 장애정보를 추출하고, 장애정보와 복구저장기내의 복구정보를 비교 검색하여, 동일 통신장치에서 발생한 장애 메시지가 존재하는지 확인하는 제3 단계; 및A third step of extracting failure information of the corresponding grade, searching for the failure information and recovery information in the recovery storage by comparing the failure information of the corresponding grade, and checking whether there is a failure message generated in the same communication device; And 동일 통신장치에서 발생한 장애 메시지가 존재하면, 장애 메시지의 내용을 적용하고, 동일 통신장치에서 발생한 장애 메시지가 존재하지 않으면, 유실된 장애 메시지가 장애복구 메시지라고 판단하여 해당 장애정보의 장애를 해제하는 제4 단계를 포함하는 것을 특징으로 하는 통신망에서의 장애정보 관리방법.If a failure message occurred in the same communication device exists, the contents of the failure message are applied, and if a failure message generated in the same communication device does not exist, it is determined that the lost failure message is a failure recovery message and the failure of the corresponding failure information is released. Disability information management method in a communication network comprising a fourth step. 제 2 항에 있어서,The method of claim 2, 상기 장애저장기에 존재하는 모든 장애정보에 대한 복구가 수행된 후, 상기 운용자 컴퓨터에게 장애 오류 복구 내용을 보고하는 제5 단계를 더 포함하는 것을 특징으로 하는 통신망에서의 장애정보 관리방법.And performing a recovery of all the failure information existing in the failure storage unit, and reporting failure recovery contents to the operator computer. 제 2 항 또는 제 3 항에 있어서,The method of claim 2 or 3, 상기 제1 단계는,The first step, 상기 관리자가 상기 대행자와의 장애정보 수신상태 정상여부를 확인하는 단계;Confirming, by the manager, whether the reception status of the failure information with the agent is normal; 장애정보 수신상태가 비정상이면 상기 관리자가 복구상태를 설정하고, 계속적으로 수신상태의 정상여부를 감시하는 단계; 및Setting, by the administrator, a recovery state when the failure information reception state is abnormal and continuously monitoring whether the reception state is normal; And 계속적으로 수신상태의 정상 여부를 감시하여, 수신상태가 정상상태로 복귀하면, 장애등급별 시간배정을 수행하고, 장애저장기에 저장된 장애정보를 장애등급별로 정렬하는 단계를 포함하는 것을 특징으로 하는 통신망에서의 장애정보 관리방법.Continuously monitoring whether the reception state is normal, if the reception state returns to the normal state, performing time allocation for each fault level, and arranging fault information stored in the fault storage unit according to the fault level. To manage disability information 관리자 컴퓨터에서,On the administrator computer, 대행자와의 통신 상태를 감시하여 통신 상태 이상 발생 후 정상으로 복귀하면 장애등급별 시간배정을 수행하고, 장애저장기에 저장된 장애정보를 장애등급별로 정렬하는 제1 기능;A first function of monitoring a communication state with an agent and performing time allocation for each fault level upon returning to a normal state after a communication state abnormality occurs, and sorting fault information stored in the fault store by the fault level; 현재시간과 수신상태정상복귀시간의 차를 계산하여, 상기 장애등급별 시간배정에서 설정한 시간이 상기 계산된 현재시간과 수신상태정상복귀시간의 차보다 크면, 상기 장애저장기내의 장애정보 중에서 해당 등급의 장애정보가 존재하는지 확인하는 제2 기능;Calculate the difference between the current time and the reception state normal return time, and if the time set in the time allocation for each fault level is greater than the difference between the calculated current time and the reception state normal return time, the corresponding level among the fault information in the fault storage. A second function of checking whether there is a failure information of a; 해당 등급의 장애정보가 존재하면, 해당 등급의 장애정보를 추출하고, 장애정보와 복구저장기내의 복구정보를 비교 검색하여, 동일 통신장치에서 발생한 장애 메시지가 존재하는지 확인하는 제3 기능;A third function of extracting fault information of the corresponding class, comparing and searching the fault information and the repair information in the recovery storage, and checking whether there is a fault message generated in the same communication device if the fault information of the corresponding class exists; 동일 통신장치에서 발생한 장애 메시지가 존재하면, 장애 메시지의 내용을 적용하고, 동일 통신장치에서 발생한 장애 메시지가 존재하지 않으면, 유실된 장애 메시지가 장애복구 메시지라고 판단하여 해당 장애정보의 장애를 해제하는 제4 기능; 및If a failure message occurred in the same communication device exists, the contents of the failure message are applied, and if a failure message generated in the same communication device does not exist, it is determined that the lost failure message is a failure recovery message and the failure of the corresponding failure information is released. Fourth function; And 상기 장애저장기에 존재하는 모든 장애정보에 대한 복구가 수행된 후, 운용자 컴퓨터에게 장애 오류 복구 내용을 보고하는 제5 기능을 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체.A computer-readable recording medium having recorded thereon a program for executing a fifth function of reporting a failure error recovery content to an operator computer after recovery of all failure information existing in the failure storage device.
KR1020010080894A 2001-12-18 2001-12-18 A Management Method of Fault Information in Telecommunication Network KR100570835B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020010080894A KR100570835B1 (en) 2001-12-18 2001-12-18 A Management Method of Fault Information in Telecommunication Network

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020010080894A KR100570835B1 (en) 2001-12-18 2001-12-18 A Management Method of Fault Information in Telecommunication Network

Publications (2)

Publication Number Publication Date
KR20030050464A true KR20030050464A (en) 2003-06-25
KR100570835B1 KR100570835B1 (en) 2006-04-13

Family

ID=29576192

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020010080894A KR100570835B1 (en) 2001-12-18 2001-12-18 A Management Method of Fault Information in Telecommunication Network

Country Status (1)

Country Link
KR (1) KR100570835B1 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100608917B1 (en) * 2004-11-29 2006-08-08 한국전자통신연구원 Method for managing fault information of distributed forwarding architecture router
KR100805820B1 (en) * 2006-09-29 2008-02-21 한국전자통신연구원 Method and apparatus for sensor network node fault management

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100211979B1 (en) * 1996-12-06 1999-08-02 이계철 Method and apparatus for monitoring tmn communication connection of synchronous optic transmission system
KR100274848B1 (en) * 1997-12-26 2000-12-15 강병호 Network management method for network management system
KR100292078B1 (en) * 1998-09-02 2001-06-01 이계철 Alarm event error recovery device and its method
KR100315431B1 (en) * 1999-12-24 2001-11-28 오길록 Automatic Service Recovery Method on Network Management System
KR20030021862A (en) * 2001-09-08 2003-03-15 엘지전자 주식회사 Method for Between EMS Server and Agent Fault Processing

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100608917B1 (en) * 2004-11-29 2006-08-08 한국전자통신연구원 Method for managing fault information of distributed forwarding architecture router
KR100805820B1 (en) * 2006-09-29 2008-02-21 한국전자통신연구원 Method and apparatus for sensor network node fault management

Also Published As

Publication number Publication date
KR100570835B1 (en) 2006-04-13

Similar Documents

Publication Publication Date Title
US6782489B2 (en) System and method for detecting process and network failures in a distributed system having multiple independent networks
CN106789306B (en) Method and system for detecting, collecting and recovering software fault of communication equipment
KR100728220B1 (en) Apparatus and Method of Fault Diagnosis and Data Management for Satellite Ground Station
CN103414916B (en) Fault diagnosis system and method
CN101296135A (en) Fault information processing method and device
CN109144789A (en) A kind of method, apparatus and system for restarting OSD
CN103810076A (en) Monitoring method and device for data reproduction
CN101989933A (en) Method and system for failure detection
US20050015683A1 (en) Method, system and computer program product for improving system reliability
CN114490565A (en) Database fault processing method and device
CN107688547A (en) A kind of method and system of controller active-standby switch
CN116684256B (en) Node fault monitoring method, device and system, electronic equipment and storage medium
CN106502665B (en) A kind of restorative procedure and device of application program
CN101924661A (en) Alarm processing method and device
AU674231B2 (en) Fault-tolerant computer systems
KR100570835B1 (en) A Management Method of Fault Information in Telecommunication Network
CN114884803B (en) Method, device, equipment and medium for processing multiple redundant states
US20050268187A1 (en) Method for deferred data collection in a clock running system
CN110572292B (en) High availability system and method based on unidirectional transmission link
US20060248531A1 (en) Information processing device, information processing method and computer-readable medium having information processing program
US20080310314A1 (en) Method for Detecting a Message Interface Fault in a Communication Device
EP1662704A2 (en) Monitoring system, apparatus to be monitored, monitoring apparatus and monitoring method
CN113032106A (en) Automatic detection method and device for IO suspension abnormality of computing node
JP5395951B2 (en) Network equipment
KR20170127876A (en) System and method for dealing with troubles through fault analysis of log

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
J201 Request for trial against refusal decision
AMND Amendment
B601 Maintenance of original decision after re-examination before a trial
J301 Trial decision

Free format text: TRIAL DECISION FOR APPEAL AGAINST DECISION TO DECLINE REFUSAL REQUESTED 20041230

Effective date: 20060228

S901 Examination by remand of revocation
GRNO Decision to grant (after opposition)
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20100401

Year of fee payment: 5

LAPS Lapse due to unpaid annual fee