KR100570835B1 - A Management Method of Fault Information in Telecommunication Network - Google Patents

A Management Method of Fault Information in Telecommunication Network Download PDF

Info

Publication number
KR100570835B1
KR100570835B1 KR1020010080894A KR20010080894A KR100570835B1 KR 100570835 B1 KR100570835 B1 KR 100570835B1 KR 1020010080894 A KR1020010080894 A KR 1020010080894A KR 20010080894 A KR20010080894 A KR 20010080894A KR 100570835 B1 KR100570835 B1 KR 100570835B1
Authority
KR
South Korea
Prior art keywords
failure
information
recovery
fault
error
Prior art date
Application number
KR1020010080894A
Other languages
Korean (ko)
Other versions
KR20030050464A (en
Inventor
이재욱
김태완
Original Assignee
한국전자통신연구원
주식회사 케이티
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국전자통신연구원, 주식회사 케이티 filed Critical 한국전자통신연구원
Priority to KR1020010080894A priority Critical patent/KR100570835B1/en
Publication of KR20030050464A publication Critical patent/KR20030050464A/en
Application granted granted Critical
Publication of KR100570835B1 publication Critical patent/KR100570835B1/en

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0695Management of faults, events, alarms or notifications the faulty arrangement being the maintenance, administration or management system
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04QSELECTING
    • H04Q1/00Details of selecting apparatus or arrangements
    • H04Q1/18Electrical details
    • H04Q1/20Testing circuits or apparatus; Circuits or apparatus for detecting, indicating, or signalling faults or troubles
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04QSELECTING
    • H04Q2213/00Indexing scheme relating to selecting arrangements in general and for multiplex systems
    • H04Q2213/16Service observation; Fault circuit; Testing

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Computer And Data Communications (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

본 발명은 관리자와 대행자 사이의 통신장애 등으로 인하여 대행자의 장애 정보가 유실되는 경우 관리자의 장애 정보 복구를 위한 장애정보 관리 시스템 및 관리 방법에 관한 것이다.The present invention relates to a failure information management system and management method for recovering the failure information of the manager when the failure information of the agent is lost due to a communication failure between the manager and the agent.

본 발명은, 관리자가 대행자와의 장애정보 수신상태 수신상태의 정상여부를 감시하여 통신상태 이상 발생 후 장애정보 수신상태가 정상상태로 복귀하면 장애 등급별 시간 배정을 수행하고, 장애저장기에 저장된 장애정보를 장애등급별로 정렬하고, 상기 관리자가 상기 장애등급별 시간배정에서 설정한 시간이, 현재시간과 상기 장애정보 수신상태의 정상복귀시간의 차이보다 크면, 상기 장애저장기 내의 장애정보 중에서 해당 등급의 장애정보가 존재하는지를 확인하고, 해당 등급의 장애정보가 존재하면, 해당 등급의 장애정보를 추출하고, 상기 추출된 장애정보와 복구저장기 내의 복구정보를 비교하여, 동일 통신장치에서 발생한 장애메시지가 존재하는지 확인하며, 동일 통신장치에서 발생한 장애메시지가 존재하면, 장애메시지의 내용을 적용하고, 동일 통신장치에서 발생한 장애메시지가 존재하지 않으면, 유실된 장애메시지가 장애복구 메시지라고 판단하여 해당 장애정보의 장애를 해제한다.According to the present invention, the administrator monitors whether the reception status of the failure information reception status with the agent is normal, and when the failure information reception status returns to the normal state after the communication status abnormality occurs, time allocation according to the level of failure is performed, and the failure information stored in the failure storage device. If the time set by the administrator in the time allocation by the failure level is greater than the difference between the current time and the normal return time of the failure information receiving state, the failure of the corresponding level among the failure information in the failure storage Check whether the information exists, if there is failure information of the corresponding grade, extract the failure information of the corresponding grade, compare the extracted failure information and recovery information in the recovery storage, there is a failure message generated in the same communication device If there is an error message from the same communication device, apply the contents of the error message. And, if there is no fault messages from the same communication apparatus, it is determined that the fault message is lost fault release message to release the failure of the fault information.

통신망, 관리, 대행자, 관리자, 에이전트, 매니저, 장애정보, 장애, 복구Network, management, agent, manager, agent, manager, failure information, failure, recovery

Description

통신망에서의 장애정보 관리 방법{A Management Method of Fault Information in Telecommunication Network}A management method of fault information in telecommunication network

도1은 본 발명에 따른 장애정보 관리 방법이 구현되는 시스템의 블록 구성도이다.1 is a block diagram of a system in which a failure information management method according to the present invention is implemented.

도2는 본 발명에 따른 장애정보 오류 감지 순서도이다.2 is a flowchart of error detection error information according to the present invention.

도3은 본 발명에 따른 장애정보 오류 복구 순서도이다.3 is a flowchart of error information error recovery according to the present invention.

*도면의 주요 부분에 대한 부호의 설명 *Explanation of symbols on the main parts of the drawings

100: 통신장치 200: 대행자100: communication device 200: agent

300: 관리자 400: 운용자 300: manager 400: operator

210: 장애송신기 310: 장애수신기, 210: disabled transmitter 310: disabled receiver,

320: 장애처리기 330: 장애저장기320: fault handler 330: fault saver

340: 장애보고기 350: 수신상태감시기340: failure reporter 350: reception status monitoring

360: 장애복구기 380: 복구정보저장기360: recovery device 380: recovery information storage

본 발명은 대행자(agent)가 관리자(manager)에게 보고하는 통신관리망의 장애 관리 기능에 있어서, 관리자와 대행자 사이의 통신장애 등으로 인하여 대행자의 장애 정보가 유실되는 경우 관리자의 장애 정보 복구를 위한 장애정보의 수신 상태감시, 오류의 발생검출 및 장애정보 오류복구를 위한 장애정보 관리 방법에 관한 것이다.The present invention is in the failure management function of the communication management network that the agent (manager) reports to the manager, when the agent's failure information is lost due to communication failure between the manager and the agent for the manager's failure information recovery The present invention relates to a method of managing fault information for monitoring reception status of fault information, detecting occurrence of an error, and recovering fault information.

종래의 통신망 관리 시스템에서 있어서, 관리자와 대행자 사이의 통신 장애 등으로 인하여 장치에서 발생한 신규 장애 메시지가 중간에 유실되거나 해제 메시지가 유실되어 관리자가 잘못된 장애정보를 운용자에게 전달하는 경우가 발생하므로 인하여, 장치의 운용유지보수에 오류를 발생시켜 장치의 신뢰성을 저하시키는 문제가 있었다. 이에 따라 관리자와 대행자 사이의 통신장애로 인한 장애 메시지의 불일치 등을 검출하고, 또한 이를 자동으로 복구하는 기술이 요구된다.In the conventional network management system, because a new failure message generated in the device is lost in the middle due to a communication failure between the manager and the agent, or the release message is lost, the administrator may deliver the wrong failure information to the operator, There was a problem that caused errors in the operation and maintenance of the device to reduce the reliability of the device. Accordingly, there is a need for a technique for detecting a mismatch in a failure message due to a communication failure between an administrator and an agent, and automatically recovering the mismatch.

따라서, 본 발명은 통신 관리망의 대행자와 관리자 사이의 통신장애를 자동으로 검출함과 동시에 발생한 장애정보 오류를 자동으로 복구함으로써 운용자의 신뢰성 있는 유지보수를 가능하게 하는 통신망에서의 장애정보 관리방법을 제공하는데 그 목적이 있다.Accordingly, the present invention provides a method for managing failure information in a communication network that enables reliable maintenance of an operator by automatically detecting a communication failure between an agent and a manager of a communication management network and at the same time automatically recovering a failure information error. The purpose is to provide.

상기 목적을 달성하기 위한 본 발명에 따른 장애정보 관리 방법은, 통신장치에서 발생하는 장애를 수신받아 장애 메시지 형태로 변환하여 보고하는 대행자와, 상기 대행자로부터 수신된 장애 메시지를 처리하는 관리자와, 전체 시스템의 운용보수를 담당하는 운용자 컴퓨터를 포함하는 장애정보 관리 시스템에서의 장애정보 관리 방법에 있어서,
상기 관리자가 상기 대행자와의 장애정보 수신상태 정상여부를 확인하여, 장애정보 수신상태가 비정상이면 상기 관리자가 복구상태를 설정하고, 계속적으로 수신상태의 정상여부를 감시하여 통신상태 이상 발생 후 장애정보 수신상태가 정상상태로 복귀하면 장애 등급별 시간 배정을 수행하고, 장애저장기에 저장된 장애정보를 장애등급별로 정렬하는 제1단계; 상기 관리자가 현재시간과 상기 장애정보 수신상태의 정상복귀시간의 차이를 계산하고, 상기 장애등급별 시간배정에서 설정한 시간이 상기 계산된 차이보다 크면, 상기 장애저장기 내의 장애정보 중에서 해당 등급의 장애정보가 존재하는지를 확인하는 제2단계; 상기 제2단계에서 해당 등급의 장애정보가 존재하면, 해당 등급의 장애정보를 추출하고, 상기 추출된 장애정보와 복구저장기 내의 복구정보를 비교하여, 동일 통신장치에서 발생한 장애메시지가 존재하는지 확인하는 제3단계; 동일 통신장치에서 발생한 장애메시지가 존재하면, 장애메시지의 내용을 적용하고, 동일 통신장치에서 발생한 장애메시지가 존재하지 않으면, 유실된 장애메시지가 장애복구 메시지라고 판단하여 해당 장애정보의 장애를 해제하는 제4단계; 및 상기 장애저장기에 존재하는 모든 장애정보에 대한 복구가 수행된 후, 상기 운용자 컴퓨터에 장애오류 복구 내용을 보고하는 제5단계를 포함하는 것을 특징으로 한다.
Disability information management method according to the present invention for achieving the above object, receiving a failure occurring in the communication device to convert the report into a failure message form, the manager for processing the failure message received from the agent, and the whole In the failure information management method in a failure information management system including an operator computer in charge of the operation and maintenance of the system,
The administrator checks whether the reception status of the failure information with the agent is normal. If the reception status of the failure information is abnormal, the administrator sets the recovery status and continuously monitors the reception status to determine whether the reception status is normal. Performing a time allocation for each fault level when the reception state returns to a normal state, and sorting the fault information stored in the fault store by the fault level; If the administrator calculates the difference between the current time and the normal return time of the failure information receiving state, and the time set in the time allocation for each failure level is greater than the calculated difference, the failure of the corresponding level among the failure information in the failure storage A second step of confirming whether information exists; If the failure information of the corresponding grade exists in the second step, extract the failure information of the corresponding grade, compare the extracted failure information and the recovery information in the recovery storage, and determine whether there is a failure message generated in the same communication device A third step of doing; If there is an error message generated in the same communication device, the content of the error message is applied.If the error message generated in the same communication device does not exist, it is determined that the lost error message is a failure recovery message and releases the error of the corresponding error information. The fourth step; And a fifth step of reporting the failure error recovery contents to the operator computer after the recovery of all the failure information existing in the failure storage device is performed.

삭제delete

또한, 본 발명은, 프로세서를 구비하는 컴퓨터에서, 상기 관리자가 상기 대행자와의 장애정보 수신상태 정상여부를 확인하여, 장애정보 수신상태가 비정상이면 상기 관리자가 복구상태를 설정하고, 계속적으로 수신상태의 정상여부를 감시하여 통신상태 이상 발생 후 장애정보 수신상태가 정상상태로 복귀하면 장애 등급별 시간 배정을 수행하고, 장애저장기에 저장된 장애정보를 장애등급별로 정렬하는 제1기능; 상기 관리자가 현재시간과 상기 장애정보 수신상태의 정상복귀시간의 차이를 계산하고, 상기 장애등급별 시간배정에서 설정한 시간이 상기 계산된 차이보다 크면, 상기 장애저장기 내의 장애정보 중에서 해당 등급의 장애정보가 존재하는지를 확인하는 제2기능; 상기 제2기능에서 해당 등급의 장애정보가 존재하면, 해당 등급의 장애정보를 추출하고, 상기 추출된 장애정보와 복구저장기 내의 복구정보를 비교하여, 동일 통신장치에서 발생한 장애메시지가 존재하는지 확인하는 제3기능; 동일 통신장치에서 발생한 장애메시지가 존재하면, 장애메시지의 내용을 적용하고, 동일 통신장치에서 발생한 장애메시지가 존재하지 않으면, 유실된 장애메시지가 장애복구 메시지라고 판단하여 해당 장애정보의 장애를 해제하는 제4기능; 및 상기 장애저장기에 존재하는 모든 장애정보에 대한 복구가 수행된 후, 상기 운용자 컴퓨터에 장애오류 복구 내용을 보고하는 제5기능을 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체를 제공한다.In addition, the present invention, in a computer having a processor, the administrator checks whether the failure information reception state with the agent is normal, if the failure information reception state is abnormal, the administrator sets the recovery state, and continuously receiving state A first function of performing time allocation for each fault level and sorting the fault information stored in the fault store by the fault level when the fault information reception state returns to the normal state after a communication state abnormality occurs by monitoring whether or not the normal state; If the administrator calculates the difference between the current time and the normal return time of the failure information receiving state, and the time set in the time allocation for each failure level is greater than the calculated difference, the failure of the corresponding level among the failure information in the failure storage A second function of checking whether information exists; If the fault information of the corresponding class exists in the second function, extract fault information of the corresponding class, compare the extracted fault information with the repair information in the recovery storage, and check whether there is a fault message generated in the same communication device. A third function of doing; If there is an error message generated in the same communication device, the content of the error message is applied.If the error message generated in the same communication device does not exist, it is determined that the lost error message is a failure recovery message and releases the error of the corresponding error information. Fourth function; And after the recovery of all the failure information existing in the failure storage is provided, provides a computer-readable recording medium recording a program for executing a fifth function for reporting the failure error recovery information to the operator computer.

이하, 첨부된 도면을 참조하여 본 발명에 따른 바람직한 실시 예를 상세히 설명한다.Hereinafter, exemplary embodiments of the present invention will be described in detail with reference to the accompanying drawings.

도1은 본 발명에 따른 통신망 장애정보 관리 방법이 구현되는 시스템의 개략적인 블록 구성도를 나타낸다.1 is a schematic block diagram of a system in which a method for managing communication error information according to the present invention is implemented.

일반적으로 통신망 장애정보 관리 시스템은 통신장치(100)에서 발생하는 장애를 수신받아 장애 메시지 형태로 변환하여 관리자(300)에게 보고하는 대행자(200)와, 상기 대행자(200)로부터 수신된 장애 메시지를 처리하는 관리자(300), 및 전체 시스템의 운용보수를 맡는 운용자 컴퓨터(400)로 구성된다.In general, a communication network failure information management system receives a failure occurring in the communication device 100 and converts it into a failure message form and reports the manager 200 to the manager 300 and the failure message received from the agent 200. Manager 300 for processing, and operator computer 400 in charge of the maintenance of the entire system.

통신장치(100)는 통신을 전담하는 장비들이 적재되어 통신을 수행하는 기능을 담당하며, 적재한 장비에 장애가 발생하면 대행자(200)에게 해당 장애를 보고한다. 또한, 현재 발생중인 장애가 일정시간 안에 복구되지 않으면 동일한 장애를 주기적으로 발생한다. 즉, 기존에 발생한 장애정보가 일정시간 후에도 복구되지 않을 경우 주기적으로 동일한 장애 메시지를 중복하여 발생시키는 장애 중복발생 루틴을 갖는다.The communication device 100 is responsible for the function of performing communication by loading the equipment dedicated to communication, and reports a failure to the agent 200 when a failure occurs in the loaded equipment. In addition, if the current failure does not recover within a certain time, the same failure occurs periodically. That is, if the existing fault information is not recovered even after a certain time, it has a fault duplication routine that generates the same fault message periodically.

대행자(200)는 통신장치(100)에서 발생하는 장애를 수신받아 장애 메시지 형태로 변환하여 관리자(300)에게 지속적으로 보고한다. 대행자(200)의 구성은 장애를 메시지형태로 조립하여 관리자(300)에게 송신하는 장애송신기(210) 이외에는 어떤 구성 및 기능도 필요하지 않다. The agent 200 receives a failure occurring in the communication device 100, converts it into a failure message form, and continuously reports to the manager 300. The configuration of the agent 200 does not require any configuration and function other than the failure transmitter 210 to assemble the failure in the form of a message to the manager 300.

관리자(300)는 대행자(200)로부터 수신된 장애 메시지를 처리하는 기능을 수행한다. 관리자(300)의 구성은 대행자(200)로부터 송신되는 장애 메시지를 수신하는 장애수신기(310), 수신된 장애 메시지를 적절하게 처리하는 장애처리기(320), 처리된 장애 메시지를 저장하는 장애저장기(330), 처리된 장애를 운용자 컴퓨터(400)에게 보고하기 위한 장애보고기(340), 대행자(200)와의 통신장애를 감시하는 수신상태 감시기(350), 통신장애로 인한 장애 메시지 유실로 오류가 발생한 장애정보를 자동 복구하는 장애복구기(360), 및 장애복구를 위하여 통신상태 정상 복귀 후 일정기간 동안의 장애를 보관하는 복구정보 저장기(380)로 구성된다.The manager 300 performs a function of processing a failure message received from the agent 200. The configuration of the manager 300 includes a failure receiver 310 for receiving a failure message transmitted from the agent 200, a failure handler 320 for properly processing the received failure message, and a failure storage device for storing the processed failure message. 330, a failure reporter 340 for reporting the processed failure to the operator computer 400, a reception status monitor 350 for monitoring a communication failure with the agent 200, and a failure message loss due to a communication failure. The fault recovery unit 360 automatically recovers the fault information that has occurred, and the recovery information storage unit 380 for storing a fault for a predetermined period of time after the normal return of the communication state for fault recovery.

도2는 본 발명에 따른 장애정보 오류 감지 순서도를 나타낸다.2 is a flowchart illustrating error information error detection according to the present invention.

대행자(200)와 관리자(300)는 장애송신기(210)와 장애수신기(310)를 통하여 지속적으로 장애 메시지를 송수신한다. 만약, 대행자(200)와 관리자(300)사이의 통신장애가 발생하면 수신상태감시기(350)에 의하여 통신장애를 감지한다.The agent 200 and the manager 300 continuously transmit and receive a failure message through the failure transmitter 210 and the failure receiver 310. If a communication failure occurs between the agent 200 and the manager 300, the communication failure is detected by the reception state monitor 350.

수신상태 감시기(350)는 수신상태 초기화(352)와 복구상태 초기화(353)를 수행하여, 현재 송수신상태가 정상적이며 복구가 필요하지 않다는 것을 설정한다. 그리고, 수신상태 감시기는 장애송신기와의 수신상태 정상여부를 확인하여(354) 정상이면 계속 수신상태를 감시한다. 만약 수신상태가 비정상이면 복구상태를 설정하고(355) 수신상태를 감시한다. 계속적으로 수신상태 정상여부를 감시하여(356) 비정상 상태이면 계속 수신상태를 감시한다. 만약, 수신상태가 정상상태로 복귀하였으면, 장애 메시지 유실로 인하여 장애정보에 오류가 발생한 것으로 결정하고 장애복구요구(357)에 의하여 장애복구기(360)를 호출하여 복구를 수행한다.The reception state monitor 350 performs the reception state initialization 352 and the recovery state initialization 353 to set up that the current transmission / reception state is normal and no recovery is required. Then, the reception state monitor checks whether the reception state with the fault transmitter is normal (354) and continues to monitor the reception state if it is normal. If the reception state is abnormal, the recovery state is set (355) and the reception state is monitored. It continuously monitors whether the reception state is normal (356) and if it is abnormal, continuously monitors the reception state. If the reception state is returned to the normal state, it is determined that an error has occurred in the failure information due to the failure of the failure message, and the failure recovery request 357 calls the failure recovery unit 360 to perform recovery.

도3은 본 발명에 따른 장애정보 오류 복구 순서도를 나타낸다.3 is a flowchart of error information error recovery according to the present invention.

장애복구요구(357)에 의하여 호출된 장애복구기(360)는 장애등급별 시간배정을 수행한다(362). 장애등급별 시간배정에서는 장애등급별로 반복적으로 동일한 장애 메시지를 발생시키는 통신장치 발생주기를 이용한다. 예를 들어, 긴급장애등 급의 경우 발생주기는 15분, 주요장애등급의 경우 발생주기는 30분 및 경미장애등급의 경우 발생주기는 60분 등의 주기를 내부 변수에 설정한다. 관리자(300)의 장애저장기(330)에 저장된 장애정보를 장애등급별로 정렬한다(363). 다음으로, 모든 장애등급에 해당하는 만큼의 반복처리(364)를 수행한다.The failure recovery device 360 called by the failure recovery request 357 performs time allocation according to a failure level (362). The time allocation for each fault class uses a communication device generation cycle that repeatedly generates the same fault message for each fault class. For example, in case of emergency disability class, the frequency of occurrence is 15 minutes, major disability class is 30 minutes, and in case of minor disability class, the frequency is 60 minutes. The failure information stored in the failure storage unit 330 of the manager 300 is sorted by failure level (363). Next, iterative processing 364 corresponding to all failure levels is performed.

반복처리(364)는 현재시간과 수신상태정상복귀시간의 차를 계산한다(365). 상기 계산된 결과와 장애등급별 시간배정에서 설정한 시간을 비교하여(366) 장애등급별 시간배정에서 설정한 시간이 클 경우, 장애저장기(330)내의 장애정보 중에 해당 i-등급장애정보 존재여부를 확인한다(367). 확인 결과, 해당 등급의 장애정보가 존재하면, 해당 등급의 장애정보를 추출하고(368), 장애정보와 복구저장기(380)내의 복구정보를 비교 검색하여(369), 동일 통신장치(100)에서 발생한 장애 메시지가 존재하는지 확인한다(370). 확인 결과(370), 동일 통신장치에서 발생한 장애 메시지가 존재하면, 해당 장애 메시지의 내용을 적용하고(371), 동일 통신장치에서 발생한 장애 메시지가 존재하지 않으면, 유실된 장애 메시지가 장애복구 메시지라고 판단하여 해당 장애정보의 장애를 해제한다(372). 상기와 같은 과정은 해당 등급을 갖는 장애정보에 대하여 모두 수행된다(373).The iterative process 364 calculates the difference between the current time and the reception state normal return time (365). The calculated result is compared with the time set by the time class for each disability class (366). If the time set by the time class by the disability class is large, the presence of corresponding i-class disability information among the fault information in the fault storage unit 330 is determined. Check (367). As a result of the check, if there is the failure information of the corresponding grade, the failure information of the corresponding grade is extracted (368), the failure information and the recovery information in the recovery storage (380) by comparing and searching (369), the same communication device 100 In step 370, it is determined whether there is a failure message that has occurred. As a result of the check (370), if there is a failure message occurring in the same communication device, the contents of the corresponding failure message are applied (371), and if there is no failure message occurring in the same communication device, the lost failure message is called a failover message. By determining, the failure of the corresponding failure information is released (372). The above process is performed for all disability information having the corresponding level (373).

상기의 과정을 거쳐 장애저장기에 존재하는 모든 장애정보에 대한 복구가 수행된 후, 관리자(300)는 장애보고기(340)를 통하여 운용자 컴퓨터(400)에게 장애 오류 복구 내용을 보고한다.After the recovery of all the failure information existing in the failure store through the above process, the manager 300 reports the failure error recovery contents to the operator computer 400 through the failure reporter (340).

상기와 같은 본 발명에 의하면, 관리자와 대행자 사이의 통신장애 등으로 인하여 대행자의 정보 보고가 유실되는 경우 관리자의 정보 복구를 위한 불일치 검출 및 이의 복구를 자동으로 수행할 수 있으므로, 정보의 불일치를 자동으로 검출함과 동시에 이를 자동으로 복구함으로써, 운용자의 신뢰성 있는 유지보수를 가능하게 한다. 또한, 본 발명은 종래의 방법에서 사용한 대행자에서 통신장애에 따른 메시지의 버퍼링을 필요로 하지 않고, 통신장애 해지 시 버퍼링된 메시지를 일괄적으로 전송하지 않으므로 대행자의 저렴한 개발이 가능하다.
나아가, 본 발명에 의하면 대행자(200)측에서 어떠한 장애정보 저장이나 재전송 루틴을 구비하지 않은 구조에서도 장애정보의 유실로 인한 장애정보 불일치 상황을 해결할 수 있다.
According to the present invention as described above, if the information reporting of the agent is lost due to communication failure between the manager and the agent, it is possible to automatically detect the inconsistency and recovery of the inconsistency for the administrator's information recovery, so that the information inconsistency It automatically detects and recovers automatically, enabling reliable maintenance of the operator. In addition, the present invention does not require the buffering of the message according to the communication failure in the agent used in the conventional method, it is possible to inexpensive development of the agent because the buffered message is not transmitted collectively when the communication failure is terminated.
Furthermore, according to the present invention, even in a structure that does not include any failure information storage or retransmission routine on the agent 200 side, it is possible to resolve a failure information mismatch situation due to loss of failure information.

Claims (5)

삭제delete 통신장치에서 발생하는 장애를 수신받아 장애 메시지 형태로 변환하여 보고하는 대행자와, 상기 대행자로부터 수신된 장애 메시지를 처리하는 관리자와, 전체 시스템의 운용보수를 담당하는 운용자 컴퓨터를 포함하는 장애정보 관리 시스템에서의 장애정보 관리 방법에 있어서,A failure information management system including an agent for receiving a failure occurring in a communication device and converting the report into a failure message form, a manager for processing a failure message received from the agent, and an operator computer for operating and maintaining the entire system. In the failure information management method in 상기 관리자가 상기 대행자와의 장애정보 수신상태 정상여부를 확인하여, 장애정보 수신상태가 비정상이면 상기 관리자가 복구상태를 설정하고, 계속적으로 수신상태의 정상여부를 감시하여 통신상태 이상 발생 후 장애정보 수신상태가 정상상태로 복귀하면 장애 등급별 시간 배정을 수행하고, 장애저장기에 저장된 장애정보를 장애등급별로 정렬하는 제1단계;The administrator checks whether the reception status of the failure information with the agent is normal. If the reception status of the failure information is abnormal, the administrator sets the recovery status and continuously monitors the reception status to determine whether the reception status is normal. Performing a time allocation for each fault level when the reception state returns to a normal state, and sorting the fault information stored in the fault store by the fault level; 상기 관리자가 현재시간과 상기 장애정보 수신상태의 정상복귀시간의 차이를 계산하고, 상기 장애등급별 시간배정에서 설정한 시간이 상기 계산된 차이보다 크면, 상기 장애저장기 내의 장애정보 중에서 해당 등급의 장애정보가 존재하는지를 확인하는 제2단계;If the administrator calculates the difference between the current time and the normal return time of the failure information receiving state, and the time set in the time allocation for each failure level is greater than the calculated difference, the failure of the corresponding level among the failure information in the failure storage A second step of confirming whether information exists; 상기 제2단계에서 해당 등급의 장애정보가 존재하면, 해당 등급의 장애정보를 추출하고, 상기 추출된 장애정보와 복구저장기 내의 복구정보를 비교하여, 동일 통신장치에서 발생한 장애메시지가 존재하는지 확인하는 제3단계;If the failure information of the corresponding grade exists in the second step, extract the failure information of the corresponding grade, compare the extracted failure information and the recovery information in the recovery storage, and determine whether there is a failure message generated in the same communication device A third step of doing; 동일 통신장치에서 발생한 장애메시지가 존재하면, 장애메시지의 내용을 적용하고, 동일 통신장치에서 발생한 장애메시지가 존재하지 않으면, 유실된 장애메시지가 장애복구 메시지라고 판단하여 해당 장애정보의 장애를 해제하는 제4단계; 및If there is an error message generated in the same communication device, the content of the error message is applied.If the error message generated in the same communication device does not exist, it is determined that the lost error message is a failure recovery message and releases the error of the corresponding error information. The fourth step; And 상기 장애저장기에 존재하는 모든 장애정보에 대한 복구가 수행된 후, 상기 운용자 컴퓨터에 장애오류 복구 내용을 보고하는 제5단계; 를 포함하는 것을 특징으로 하는 통신망에서의 장애정보 관리방법.A fifth step of reporting failure error recovery contents to the operator computer after recovery of all failure information existing in the failure storage device; Disability information management method in a communication network comprising a. 삭제delete 삭제delete 관리자 컴퓨터에서,On the administrator computer, 관리자가 대행자와의 장애정보 수신상태 정상여부를 확인하여, 장애정보 수신상태가 비정상이면 상기 관리자가 복구상태를 설정하고, 계속적으로 수신상태의 정상여부를 감시하여 통신상태 이상 발생 후 장애정보 수신상태가 정상상태로 복귀하면 장애 등급별 시간 배정을 수행하고, 장애저장기에 저장된 장애정보를 장애등급별로 정렬하는 제1기능;The administrator checks whether the status of receiving error information with the agent is normal. If the status of receiving error information is abnormal, the manager sets the recovery status and continuously monitors whether the receiving status is normal. A first function of performing time allocation for each of the failure grades and sorting the failure information stored in the failure storage unit by the failure grade when the return to the normal state occurs; 상기 관리자가 현재시간과 상기 장애정보 수신상태의 정상복귀시간의 차이를 계산하고, 상기 장애등급별 시간배정에서 설정한 시간이 상기 계산된 차이보다 크면, 상기 장애저장기 내의 장애정보 중에서 해당 등급의 장애정보가 존재하는지를 확인하는 제2기능;If the administrator calculates the difference between the current time and the normal return time of the failure information receiving state, and the time set in the time allocation for each failure level is greater than the calculated difference, the failure of the corresponding level among the failure information in the failure storage A second function of checking whether information exists; 상기 제2기능에서 해당 등급의 장애정보가 존재하면, 해당 등급의 장애정보를 추출하고, 상기 추출된 장애정보와 복구저장기 내의 복구정보를 비교하여, 동일 통신장치에서 발생한 장애메시지가 존재하는지 확인하는 제3기능;If the fault information of the corresponding class exists in the second function, extract fault information of the corresponding class, compare the extracted fault information with the repair information in the recovery storage, and check whether there is a fault message generated in the same communication device. A third function of doing; 동일 통신장치에서 발생한 장애메시지가 존재하면, 장애메시지의 내용을 적용하고, 동일 통신장치에서 발생한 장애메시지가 존재하지 않으면, 유실된 장애메시지가 장애복구 메시지라고 판단하여 해당 장애정보의 장애를 해제하는 제4기능; 및If there is an error message generated in the same communication device, the content of the error message is applied.If the error message generated in the same communication device does not exist, it is determined that the lost error message is a failure recovery message and releases the error of the corresponding error information. Fourth function; And 상기 장애저장기에 존재하는 모든 장애정보에 대한 복구가 수행된 후, 상기 운용자 컴퓨터에 장애오류 복구 내용을 보고하는 제5기능; 을 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체.A fifth function of reporting failure error recovery contents to the operator computer after recovery of all failure information existing in the failure storage device is performed; A computer-readable recording medium having recorded thereon a program for executing the program.
KR1020010080894A 2001-12-18 2001-12-18 A Management Method of Fault Information in Telecommunication Network KR100570835B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020010080894A KR100570835B1 (en) 2001-12-18 2001-12-18 A Management Method of Fault Information in Telecommunication Network

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020010080894A KR100570835B1 (en) 2001-12-18 2001-12-18 A Management Method of Fault Information in Telecommunication Network

Publications (2)

Publication Number Publication Date
KR20030050464A KR20030050464A (en) 2003-06-25
KR100570835B1 true KR100570835B1 (en) 2006-04-13

Family

ID=29576192

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020010080894A KR100570835B1 (en) 2001-12-18 2001-12-18 A Management Method of Fault Information in Telecommunication Network

Country Status (1)

Country Link
KR (1) KR100570835B1 (en)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100608917B1 (en) * 2004-11-29 2006-08-08 한국전자통신연구원 Method for managing fault information of distributed forwarding architecture router
KR100805820B1 (en) * 2006-09-29 2008-02-21 한국전자통신연구원 Method and apparatus for sensor network node fault management

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100211979B1 (en) * 1996-12-06 1999-08-02 이계철 Method and apparatus for monitoring tmn communication connection of synchronous optic transmission system
KR20000018510A (en) * 1998-09-02 2000-04-06 이계철 Alarm event error recovering apparatus and method thereof
KR100274848B1 (en) * 1997-12-26 2000-12-15 강병호 Network management method for network management system
KR100315431B1 (en) * 1999-12-24 2001-11-28 오길록 Automatic Service Recovery Method on Network Management System
KR20030021862A (en) * 2001-09-08 2003-03-15 엘지전자 주식회사 Method for Between EMS Server and Agent Fault Processing

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100211979B1 (en) * 1996-12-06 1999-08-02 이계철 Method and apparatus for monitoring tmn communication connection of synchronous optic transmission system
KR100274848B1 (en) * 1997-12-26 2000-12-15 강병호 Network management method for network management system
KR20000018510A (en) * 1998-09-02 2000-04-06 이계철 Alarm event error recovering apparatus and method thereof
KR100292078B1 (en) * 1998-09-02 2001-06-01 이계철 Alarm event error recovery device and its method
KR100315431B1 (en) * 1999-12-24 2001-11-28 오길록 Automatic Service Recovery Method on Network Management System
KR20030021862A (en) * 2001-09-08 2003-03-15 엘지전자 주식회사 Method for Between EMS Server and Agent Fault Processing

Also Published As

Publication number Publication date
KR20030050464A (en) 2003-06-25

Similar Documents

Publication Publication Date Title
KR100728220B1 (en) Apparatus and Method of Fault Diagnosis and Data Management for Satellite Ground Station
US8526299B2 (en) Method and device for processing cell out-of-service failures
US6820221B2 (en) System and method for detecting process and network failures in a distributed system
US6782489B2 (en) System and method for detecting process and network failures in a distributed system having multiple independent networks
CN106789306B (en) Method and system for detecting, collecting and recovering software fault of communication equipment
US7397385B1 (en) Predicting cable failure through remote failure detection of error signatures
CN101296135A (en) Fault information processing method and device
CN105760247A (en) System and method for processing hard disk faults
CN101989933A (en) Method and system for failure detection
US20050015683A1 (en) Method, system and computer program product for improving system reliability
CN114490565A (en) Database fault processing method and device
CN107688547A (en) A kind of method and system of controller active-standby switch
KR100570835B1 (en) A Management Method of Fault Information in Telecommunication Network
CN114884803B (en) Method, device, equipment and medium for processing multiple redundant states
CN116684256A (en) Node fault monitoring method, device and system, electronic equipment and storage medium
US7343534B2 (en) Method for deferred data collection in a clock running system
CN115549775A (en) Method for processing optical signal transmission abnormity, optical transmission equipment and system
CN106682040A (en) Data management method and device
US8111625B2 (en) Method for detecting a message interface fault in a communication device
US7607051B2 (en) Device and method for program correction by kernel-level hardware monitoring and correlating hardware trouble to a user program correction
EP1662704A2 (en) Monitoring system, apparatus to be monitored, monitoring apparatus and monitoring method
CN110572292B (en) High availability system and method based on unidirectional transmission link
KR20170127876A (en) System and method for dealing with troubles through fault analysis of log
KR100292078B1 (en) Alarm event error recovery device and its method
JP4413758B2 (en) Monitoring device and program thereof

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
J201 Request for trial against refusal decision
AMND Amendment
B601 Maintenance of original decision after re-examination before a trial
J301 Trial decision

Free format text: TRIAL DECISION FOR APPEAL AGAINST DECISION TO DECLINE REFUSAL REQUESTED 20041230

Effective date: 20060228

S901 Examination by remand of revocation
GRNO Decision to grant (after opposition)
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20100401

Year of fee payment: 5

LAPS Lapse due to unpaid annual fee