KR100450415B1 - 가용도를 이용한 망 관리방법 - Google Patents

가용도를 이용한 망 관리방법 Download PDF

Info

Publication number
KR100450415B1
KR100450415B1 KR10-2002-0071288A KR20020071288A KR100450415B1 KR 100450415 B1 KR100450415 B1 KR 100450415B1 KR 20020071288 A KR20020071288 A KR 20020071288A KR 100450415 B1 KR100450415 B1 KR 100450415B1
Authority
KR
South Korea
Prior art keywords
network management
availability
value
failure
manager
Prior art date
Application number
KR10-2002-0071288A
Other languages
English (en)
Other versions
KR20040042702A (ko
Inventor
이소연
최길영
이규호
Original Assignee
한국전자통신연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국전자통신연구원 filed Critical 한국전자통신연구원
Priority to KR10-2002-0071288A priority Critical patent/KR100450415B1/ko
Publication of KR20040042702A publication Critical patent/KR20040042702A/ko
Application granted granted Critical
Publication of KR100450415B1 publication Critical patent/KR100450415B1/ko

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/12Discovery or management of network topologies
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/04Network management architectures or arrangements
    • H04L41/046Network management architectures or arrangements comprising network management agents or mobile agents therefor
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0604Management of faults, events, alarms or notifications using filtering, e.g. reduction of information by using priority, element types, position or time
    • H04L41/0622Management of faults, events, alarms or notifications using filtering, e.g. reduction of information by using priority, element types, position or time based on time
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • H04L41/064Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis involving time analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/147Network analysis or design for predicting network behaviour

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Computer And Data Communications (AREA)

Abstract

본 발명은 망 관리 시스템 설계 단계에서 신뢰성 분석을 통해 계산된 가용도의 예측값과 실제 시스템 운용 단계에서 계산된 가용도의 실측값을 비교하여 적절한 유지보수 시점을 설정함으로써, 망 관리자가 사전에 적정한 예방적 유지보수 정책을 수립할 수 있도록 하는 가용도를 이용한 망 관리방법에 관한 것이다. 이를 위하여 본 발명은, 망관리 매니저의 요구에 대응하여 관리 정보를 전달하는 복수의 망관리 에이전트를 탑재한 관리 대상 시스템에서의 가용도를 이용한 망 관리방법에 있어서, 상기 망관리 매니저는 각 망관리 에이전트별 평균고장간격시간(MTBF)을 계산하고 이를 이용하여 예측 가용도값을 계산하는 제1단계; 시스템 운용 중 상기 예측 가용도값에 의해 설정된 유지보수 시점이 경과 전에 특정 망관리 에이전트에 장애가 발생하면, 상기 장애 발생을 통보받은 상기 망관리 매니저는 상기 특정 망관리 에이전트의 평균고장간격시간(MTBF) 실측값을 계산하는 제2단계; 상기 망관리 매니저는 상기 특정 망관리 에이전트의 장애 복구를 수행하고, 상기 장애 복구 완료 때까지의 평균복구시간(MTTR) 실측값을 계산하여 상기 특정 망관리 에이전트의 실측 가용도값을 계산하는 제3단계; 및 상기 예측 가용도값과 상기 실측 가용도값을 비교하여 더 적은 값을 유지보수 시점으로 재설정하는 제4단계를 포함한다.

Description

가용도를 이용한 망 관리방법{A Network Management Method using Availability Prediction}
본 발명은 가용도를 이용한 망 관리방법에 관한 것으로서 보다 상세하게는, 망 관리 시스템 설계 단계에서 신뢰성 분석을 통해 계산된 가용도의 예측값과 실제 시스템 운용 단계에서 계산된 가용도의 실측값을 비교하여 적절한 유지보수 시점을 설정함으로써, 망 관리자가 사전에 적정한 예방적 유지보수 정책을 수립할 수 있도록 하는 가용도를 이용한 망 관리방법에 관한 것이다.
최근 정보 통신의 급격한 발전으로 인해 통신망 환경의 관리는 점차 복잡해지고 난해하게 만들어지고 있고 더욱이 다양한 인터페이스를 통하여 여러 종류의 통신 서비스가 통합되어 제공되는 통합망 환경에서 보다 빠르고 정확한 정보를 제공하기 위한 노력들이 지속적으로 이루어지고 있다. 이와 더불어 각종 망을 관리하는 망 관리 시스템을 통합하여 관리하는 통합 망 관리 시스템의 비중도 점차 확대되고 있는 추세이다.
이러한 망을 이용한 비즈니스는 점점 그 규모가 커지고 있으며, 그 결과로 단 몇 초간의 망 장애로 인한 손실은 더욱 더 치명적이 되어가고 있다. 이와 같은 장애를 미연에 방지하고자 망 상태를 모니터링하기 위해 이용되는 기술이 망 관리이다. 망 관리에서는 많은 양의 데이터를 모니터링하고, 이를 망 관리자가 이해할수 있도록 적절한 자료 변환을 수행하여 보여준다.
망 관리의 가장 큰 목적은 관리 대상 망의 상태를 관리자가 원하는 시점에 원격에서도 알 수 있도록 정보를 주고 받을 수 있게 하기 위한 것이다. 음성 서비스를 제외한 거의 대부분의 서비스가 인터넷을 통해 제공되고 있는데, 이러한 인터넷을 관리하기 위해 도입된 것이 단순망관리규약(SNMP;Simple Network Management Protocol)이다.
종래의 망 관리의 경우, 시스템 장애 관리는 주로 장애 발생에 대한 보고 형태로 이루어져 있다. 즉, 망을 운용하다가 관리 대상 노드 시스템 중에 장애가 발생하거나 성능 상의 문제가 발생하면 이를 망관리 매니저로 통보하여 관리자가 적절한 조치를 취하는 사후 처리 방법에 의존하였다. 그러나, 이러한 종래의 망관리 방법은, 장애가 발행한 후에 이를 통보받은 망관리자가 적절한 조치를 취하는 것으로서, 망 운용시 장애나 성능 문제가 발생하였을 때 신속히 대처하지 못할 뿐만 아니라, 망 확장시 필요한 데이터를 제공하지 못하는 단점이 있었다. 특히, 장애 및 성능 문제가 발생하기 이전에는 관리자가 능동적으로 대처할 수 있는 방안이 고려되지 못한 문제점이 있었다.
따라서, 당 기술분야에서는 이러한 망 관리 대상 노드 시스템 중에 발생되는 장애 또는 성능 문제에 대하여 망관리자가 사전에 능동적으로 대처할 수 있는 효율적인 망 관리방법이 요구되어 왔다.
본 발명은 상기한 문제점을 해결하기 위해 제안된 것으로서, 망 관리 시스템을 운용하기 전에 미리 신뢰성 분석을 통해 계산된 가용도 예측값과 망 운용 중에 계산되는 가용도 실측값을 비교하여 적절한 유지보수 시점을 재 설정함으로써, 망 관리자가 장애 발생에 대해 사전에 적정한 유지보수 시점 및 정책을 설정할 수 있는 데이터를 제공하도록 가용도를 이용한 망 관리방법을 제공하는데 그 목적이 있다.
도 1은 본 발명이 적용되는 관리 대상 망의 구성도이다.
도 2는 본 발명에 따른 가용도 계산을 포함시킨 망관리 매니저의 구성도이다.
도 3은 본 발명에 따른 가용도 예측값과 실측값의 비교과정을 보이는 흐름도이다.
도 4는 본 발명에 따른 신뢰성 분석 데이터 획득과정을 보이는 절차도이다.
* 도면의 주요 부분에 대한 부호의 설명 *
100 : 망관리 에이전트 101 : 허브
102 : 퍼스널 컴퓨터 103 : 서버
104 : 라우터 105 : 호스트
106 : 네트워크 107 : 망관리 매니저
301 : 사용자 정합부 302 : 기본 기능부
303 : SNMP 서버 304 : 신뢰성 분석부
305 : 관리정보베이스 관리부
상기 목적을 달성하기 위한 본 발명에 따른 가용도를 이용한 망 관리방법은, 망관리 매니저의 요구에 대응하여 관리 정보를 전달하는 복수의 망관리 에이전트를 탑재한 관리 대상 시스템에서의 가용도를 이용한 망 관리방법에 있어서, 망관리 매니저는 각 망관리 에이전트별 평균고장간격시간(MTBF)을 계산하고 이를 이용하여 예측 가용도값을 계산하는 제1 단계; 시스템 운용 중 상기 예측 가용도값에 의해 설정된 유지보수 시점이 경과 전에 특정 망관리 에이전트에 장애가 발생하면, 상기 장애 발생을 통보받은 상기 망관리 매니저는 상기 특정 망관리 에이전트의 평균고장간격시간(MTBF) 실측값을 계산하는 제2 단계; 상기 망관리 매니저는 상기 특정 망관리 에이전트의 장애 복구를 수행하고, 상기 장애 복구 완료 때까지의 평균복구시간(MTTR) 실측값을 계산하여 상기 특정 망관리 에이전트의 실측 가용도값을 계산하는 제3 단계; 및 상기 예측 가용도값과 상기 실측 가용도값을 비교하여 더 적은값을 유지보수 시점으로 재설정하는 제4 단계를 포함한다.
여기서, 상기 망관리 매니저는 상기 설정된 유지보수 시점이 되면 해당 망관리 에이전트의 관리 정보를 점검하고 예측 가용도값을 재 계산하는 단계를 더 포함할 수 있다.
상기 망관리 에이전트의 예측 가용도값은 상기 망관리 에이전트의 평균고장간격시간(MTBF) 및 평균복구시간(MTTR)을 이용하여 계산되고, 상기 실측 가용도값은 상기 특정 망관리 에이전트의 평균고장간격시간 실측값 및 평균복구시간 실측값을 이용하여 계산된다. 또한, 상기 망관리 에이전트의 평균고장간격시간 실측값 및 평균복구시간 실측값은 상기 망관리 매니저에 장애 발생이 통보된 시각을 기준으로 하여 계산되는 것이 바람직하다.
상기 제2 단계는 상기 특정 망관리 에이전트가 장애 발생을 상기 망관리 매니저로 통보하는 단계를 더 포함할 수 있다.
본 발명은 실제 관리 대상 시스템에 탑재되는 망관리 에이전트에 대한 망 관리방법을 제공한다. 인터넷이 대중화되면서 이를 지원하는 망은 점점 더 복잡 다단해져 가고 있으며, 이에 따라 망 관리는 망 운용에 있어 중요한 사항이 되고 있다. 망 관리에 있어 핵심사항은 급증하는 많은 양의 데이터를 모니터링하고, 망의 상태 정보를 망 관리자에게 통보하는 것이다. 그 중에서 망의 사용 가능성 여부를 판단하는 지표로 '가용도'를 들 수 있다. 그 동안 가용도는 관찰 시점을 기준으로 하여 어느 시간만큼 서비스를 제공할 수 있는지에 대한 단순한 수치만을 계산하여 제공되었다.
본 발명에서는 시스템을 운용하기 전에 미리 신뢰성 분석을 통해 시스템을 구성하는 요소들의 평균고장간격시간(MTBF:Mean Time Between Failures)을 구하고 이를 바탕으로 시스템의 예측 가용도를 구하여 시스템에 저장하고, 운용중에 발생하는 장애 이벤트를 통해 각 구성요소별 평균고장간격시간과 가용도 실측값을 장애 발생 시점마다 재 계산한 후, 이 값들을 가용도의 예측값과 비교하여 관리자가 적정한 유지보수 시점을 설정할 수 있는 데이터를 제공하도록 하는 방법을 제공한다.
이와 같이, 시스템 설계 단계에서부터 계산된 가용도의 예측값과 실제 시스템 운용 과정에서 계산되는 가용도의 실측값을 비교할 수 있도록 하여, 망 관리자가 사전 예방적인 유지보수 정책에 대한 의사 결정을 내릴 수 있도록 있다. 이를 위해 본 발명은 망 관리자의 기본 기능에 가용도 분석 기능을 추가하였을 때의 구조 및 절차를 제시한다.
상술한 목적 및 특징들, 장점은 첨부된 도면과 관련한 다음의 상세한 설명을 통하여 보다 분명해 질 것이다. 이하, 본 발명의 바람직한 실시예가 첨부된 도면을 참조하여 본 발명을 상세히 설명한다.
도 1은 본 발명이 적용되는 관리 대상 망의 구성도이다. 먼저, 도 1을 참조하여 관리 적용 대상이 되는 망의 구조를 살펴보면, 관리 대상 망에는 관리자와의 직접적인 인터페이스가 이루어지는 망관리 매니저(107)와, 실제 관리 대상 시스템에 탑재되어 망관리 매니저(107)의 요구에 따라 적절한 정보를 전달해주는 다수의 망관리 에이전트(100)들이 존재한다. 망관리를 위한 주요 관리 기능은 크게 형상관리, 시스템 장애관리, 성능관리, 보안관리 및 계정관리 등 다섯 가지로 분류된다.
관리 대상이 되는 다수의 망관리 에이전트(100)와 망관리 매니저(107)는 각각 네트워크(106)와 연결되고, 상기 네트워크(106)를 통해 망관리 매니저(107)가 상기 다수의 망관리 에이전트(100)의 상태 정보를 확인하고 이를 관리하게 된다. 특히, 상기 망관리 에이전트(100)는 망 내에 발생되는 장애 또는 성능상의 문제를 파악하여 상기 망관리 매니저(107)로 통보하게 된다. 상기 망관리 에이전트(100)는 주로 허브(101), 퍼스널 컴퓨터(102), 서버(103), 라우터(104) 및 호스트(105) 등과 같은 시스템들이다. 이들 망관리 에이전트(100)의 시스템을 구성하는 최소 단위는 흔히 보드라고 불리워지는 회로팩이다. 회로팩은 장애 발생시에 교체 단위가 되므로, 회로팩에 대한 신뢰성 척도는 주로 평균고장간격시간(MTBF)을 적용한다.
망관리 에이전트(100)와 망관리 매니저(107)는 표준 인터넷 프로토콜을 통해 서로 메시지를 주고 받게 되는데, 상기 망관리 매니저(107)는 정보 수집이 요구되는 망관리 에이전트(100)의 IP 주소만 갖고 있으면 도메인 내,외부 위치여부와는 상관없이 통신할 수 있다.
또한, 상기 망관리 매니저(107)에서는 망관리 시스템을 운용하기 전에 미리 신뢰성 분석을 통해 시스템을 구성하는 망관리 에이전트(100)들의 평균고장간격시간을 계산한다. 이어, 상기 계산된 각각의 망관리 에이전트(100)의 평균고장간격시간을 이용하여 망관리 시스템의 가용도 예측값을 구하여 저장한다.
한편, 상기 망관리 매니저(107)는 운용 중에 발생하는 장애를 통해 상기 계산된 각 망관리 에이전트(100)별 평균고장간격시간과 가용도를 장애 발생시점마다 재 계산한 후, 상기 가용도 예측값과 비교하여 장애가 발생하기 전에 미리 시스템을 점검하는 시기를 계산한다.
도 2는 본 발명에 따른 가용도 계산 기능을 포함한 망관리 매니저의 구성도이다. 도면에 도시된 본 발명에 따른 망관리 매니저는 기존의 일반적인 망관리 매니저에 신뢰성 분석부(204)가 추가된 것으로서, 기존의 일반적인 기본 기능외에, 망관리 시스템을 운용하기 전에 신뢰성 분석을 통해 망관리 에이전트들의 평균고장간격시간을 계산하고 이를 이용하여 가용도의 예측값을 계산하며, 운용중에 가용도의 실측값을 계산하여 상기 가용도의 예측값과 실측값을 비교한다. 상기 비교결과를 이용하여 유지보수 시점을 결정한다.
일반적인 망관리 매니저의 기본 기능은 크게 네 부분으로 이루어진다. 즉, 관리자(미도시)와의 휴먼 인터페이스를 이루는 사용자 정합부(201), 망관리의 기능인 형상관리, 장애관리, 성능관리, 보안관리 및 계정관리 기능을 수행하는 기본 기능부(202), 망관리 에이전트(100)와의 SNMP 통신을 위한 메시지 인코딩/디코딩 기능을 수행하는 SNMP 서버부(203) 및 관리 대상 에이전트별로 요구되는 MIB의 트리구조 유지, 검색 및 저장 기능을 수행하는 관리정보베이스(MIB:Management Information Base)를 관리하는 관리정보베이스 관리부(205)로 구성된다. 본 발명에 따른 망관리 매니저(107)는 상기 기본 기능외에, 부품 단계의 신뢰성 데이터와 구조적인 분석을 입력 데이터로 하여 망관리 에이전트(100)들의 신뢰성 분석을 수행하는 신뢰성 분석부(204)가 추가된다.
상기 신뢰성 분석부(204)는 크게 예측 가용도 계산부(211)와 유지보수율 계산부(212)로 나누어지는데, 상기 예측 가용도 계산부(211)는 각 에이전트(100)별 회로팩 평균고장간격시간(MTBF) 및 신뢰성 구조분석에 근거한 망관리 에이전트(100)의 가용도 계산 기능을 가지며, 상기 유지보수율 계산부(212)는 상기 망관리 에이전트별(100) 회로팩 평균고장간격시간(MTBF)에 근거하여 수리시간 계산 기능을 가진다. 또한, 운용 중에 발생하는 장애에 따른 가용도 실측값을 계산하며, 장애가 발생한 회로팩에서 장애 복구 완료시까지 수리시간 실측값을 계산하는 기능을 갖는다.
유지보수 시간 전에 장애가 발생하면 상술한 바와 같이 가용도 예측값 대신 실제 측정값들을 기반으로 신뢰성 파라미터들에 대한 재 계산이 이루어진다. 따라서, 상기 신뢰성 분석부(204)에서는 예측값 및 실측값을 모두 적용할 수 있는 인터페이스가 제공된다. 도 3을 참조하여 이를 보다 상세하게 설명한다.
도 3은 본 발명에 따른 가용도 예측값과 실측값의 비교를 통해 유지보수 시점을 설정하는 과정을 보이는 흐름도를 나타낸 것으로서, 장애발생 시점을 기준으로 한 경우 망관리 매니저(107)의 내부적으로 데이터가 처리되는 절차를 나타낸 것이다. 도 3을 참조하여 이를 설명한다. 상기 망관리 매니저(107)는 망관리 시스템을 운용하기 전에 상기 각 관리 대상 에이전트별(100) 신뢰성 분석 데이터, 즉 회로팩 평균고장간격시간(MTBF) 및 가용도 예측값 등을 미리 계산하여(S301), 데이터베이스에 저장한다(S302). 상기 신뢰성 분석 데이터는 각 회로팩별 평균고장간격시간(MTBF) 및 시스템의 가용도 예측값을 비롯하여, 신뢰도 블록 다이아그램 등을 포함한다. 상기 신뢰성 분석방법에는, 시스템 운용 전에는 장비의 신뢰도를 미리 예측 분석하는 소프트 패키지나 툴을 사용하여 장비의 신뢰도를 분석할 수 있다. 이를 위해 요구되는 파라메터 값을 실제로 사용한 디바이스가 제공하는 값들을 입력하여 상기 시스템의 가용도를 예측할 수 있게 된다. 또한, 다른 방법으로는 실제로 장비를 운용하면서 얻은 장시간의 통계정보(예를 들어, 망관리 정보)를 이용해서 신뢰도를 분석하거나 예측하는 방법을 적용할 수 있다.
계속하여, 각 망관리 에이전트(100)들이 구동을 시작하고 망관리 매니저(107)를 가동시킨 후, 주기적인 시간 간격으로 대상 에이전트(100)들을 폴링(polling)하여 네트워크의 상태를 모니터링한다. 망관리 운용을 수행하면서 상기 미리 계산된 가용도 예측값을 기준으로 하여 유지보수 시점이 되었는지 판단한다(S303). 상기 단계(S303)에서의 판단결과 유지보수 시점이 되었으면, 이를 망관리 매니저(107)에게 통보한다(S311). 이어, 상기 망관리 매니저(107)는 해당 에이전트를 폴링하여 그 때까지 장애없이 운용되었다면 기본적인 관리 데이터를 점검한 뒤(S312). 상기 해당 에이전트(100)의 예측 가용도를 재 계산하여(S313) 다시 상기 데이터 베이스에 저장한다(S302).
상기 단계(S303)에서의 판단결과 유지보수 시점이 되지 않았다면 그 때까지 특정 에이전트(100)에 장애가 발생하였는지 판단한다(S304). 상기 단계(S304)에서의 판단결과 장애가 발생하지 않은 경우에는 종료된다. 그러나 상기 단계(S304)에서의 판단결과 장애가 발생한 경우는 유지보수 시간 전에 장애가 발생한 경우로서, 이 경우에는 트랩(Trap) 메시지가 상기 망관리 매니저(107)로 접수되고, 상기 망관리 매니저(107)는 상기 장애를 유발한 에이전트 회로팩의 평균고장간격시간(MTBF) 실측값을 계산한다(S305). 이때, 시스템의 정상 가동을 알리는 상기 트랩(Trap) 메시지가 상기 망관리 매니저(107)로 도달하면, 장애 복구가 완료될 때까지 장애 복구를 계속 수행한다(S306). 장애 복수가 완료되면 상기 장애가 복구될 때까지의 시간인 평균복구시간(MTTR:Mean Time To Repair)을 계산하고(S307), 이를 이용하여 가용도 실측값을 계산한다(S308).
이어, 상기 가용도 예측값과 상기 가용도 실측값을 비교하여(S309), 더 작은 값을 유지보수 기준 시간으로 선정한다(S310,S314). 상기 유지 보수의 목표는 해당 시스템의 장애가 발생하기 전에 미리 점검을 하여 장애를 최소화하는 것이기 때문이다. 이와 같이, 새롭게 계산된 값들은 다시 데이터베이스에 갱신 저장하고 차기 유지보수 시간과 장애 발생시에 이용되도록 한다.
도 4는 본 발명에 따른 신뢰성 분석에 따른 신뢰성 분석 데이터의 계산과정을 보이는 도면이다. 도 4를 참조하면, 정상 운용하던(S401) 에이전트 시스템으로부터 트랩(Trap) 메시지가 망관리 매니저에게 접수되면, 그 시점의 타이머와 해당 에이전트 시스템의 초기 가동시간을 체크한다(S402). 이어, 장애의 원인이 구성 회로팩의 고장으로부터 기인한 것이면 어느 회로팩 인지를 확인하고(403), 해당 회로팩의 평균고장간격시간(MTBF) 실측값을 계산한다(S404). 장애복구가 이루어지면 그 시점에서의 타이머를 체크하고(S405) 이로부터 수리시간 실측값 즉, 회로팩의 장애를 복구하는데 소요된 시간의 실측값을 계산한다(S406). 상기 계산된 회로팩 평균고장간격시간(MTBF) 실측값과 수리시간 실측값으로부터 가용도 실측값을 계산한다(S407). 상기 계산된 가용도 실측값과 기계산된 가용도 예측값을 비교하여 해당 에이전트의 유지보수 기간을 설정한다(S408). 상기 유지보수 기간은 상기 가용도 실측값과 상기 기계산된 가용도 예측값 중 적은 값으로 결정한다. 이는 장애 발생전에 미리 유지보수를 실시하기 위한 것이다.
이상에서 설명한 바와 같이, 시스템 운용전에 신뢰성 분석을 통해 망관리 에이전트 시스템들의 평균고장간격시간을 구하고 이를 이용하여 상기 각 시스템의 가용도 예측값을 구하며, 운용 중에 장애 발생시점 마다 각 구성요소별 평균고장간격시간 실측값 및 가용도 실측값을 재 계산한 후, 상기 가용도 예측값 및 실측값을 상호 비교하여 적은 값을 유지보수 시점으로 결정하도록 한다. 이로써, 장애 발생 이전에 관리자가 미리 능동적으로 대처할 수 있는 방안을 고려할 수 있게 된다.
본 발명의 상세한 설명 및 도면에는 본 발명을 이해를 돕기 위한 바람직한 일실시예를 개시한 것으로서 본 발명의 권리범위를 한정하는 것은 아니며, 본 발명의 권리의 범위는 상기한 상세한 설명에 의해 결정되는 것이 아니라 첨부한 청구범위에 결정되어야만 할 것이다.
본 발명에 따르면, 망관리 매니저내에 시스템 신뢰성 분석 모듈을 포함하여 신뢰성 파라미터들의 예측, 실측값들을 함께 관리하면 관리 대상 에이전트 시스템에 대한 사전 정보를 망 관리자가 손쉽게 보유할 수 있으므로, 언제쯤 시스템의 장애가 발생할 것인지를 미리 파악하고 있을 수 있다.
나아가, 가용도 예측값 및 실측값을 상호 비교하여 장애가 발생하기 전에 미리 시스템을 점검하는 시기를 제안할 수 있으므로 전체적인 서비스 장애를 최소화할 수 있는 효과를 갖고 있다.
상술한 상세한 설명 및 도면에 개시된 내용은 본 발명을 한정하는 것이 아니며, 본 발명이 속하는 기술분야의 통상의 지식을 가진 자에게는 본 발명의 정신을 벗어나지 않는 범위 내에서 다양한 수정 및 변경이 가능함은 명백한 것이다.

Claims (7)

  1. 망관리 매니저의 요구에 대응하여 관리 정보를 전달하는 복수의 망관리 에이전트를 탑재한 관리 대상 시스템에서의 가용도를 이용한 망 관리방법에 있어서,
    상기 망관리 매니저는 각 망 관리 에이전트별 평균고장간격시간(MTBF)을 계산하고 이를 이용하여 예측 가용도값을 계산하는 제1 단계;
    시스템 운용 중 상기 예측 가용도값에 의해 설정된 유지보수 시점의 경과전에 특정 망관리 에이전트에 장애가 발생하면, 상기 장애 발생을 통보받은 상기 망관리 매니저는 상기 특정 망관리 에이전트의 평균고장간격시간(MTBF) 실측값을 계산하는 제2 단계;
    상기 망관리 매니저는 상기 특정 망관리 에이전트의 장애 복구를 수행하고, 상기 장애 복구 완료 때까지의 평균복구시간(MTTR) 실측값을 계산하여 상기 특정 망관리 에이전트의 실측 가용도값을 계산하는 제3 단계; 및
    상기 예측 가용도값과 상기 실측 가용도값을 비교하여 더 적은 값을 유지보수 시점으로 재설정하는 제4 단계를 포함하는 것을 특징으로 하는 가용도를 이용한 망 관리방법.
  2. 제 1항에 있어서,
    상기 망관리 매니저는 상기 설정된 유지보수 시점이 되면 해당 에이전트의 관리 정보를 점검하고 예측 가용도값을 재 계산하는 단계를 더 포함하는 것을 특징으로 하는 가용도를 이용한 망 관리방법.
  3. 제 1항에 있어서, 상기 예측 가용도값은,
    상기 망관리 에이전트의 평균고장간격시간(MTBF) 및 평균복구시간(MTTR)을 이용하여 계산되는 것을 특징으로 하는 가용도를 이용한 망 관리방법.
  4. 제 1항에 있어서, 상기 실측 가용도값은,
    상기 특정 망관리 에이전트의 평균고장간격시간 실측값 및 평균복구시간 실측값을 이용하여 계산되는 것을 특징으로 하는 가용도를 이용한 망 관리방법.
  5. 제 1항 또는 제 4항에 있어서,
    상기 특정 망관리 에이전트의 평균고장간격시간 실측값 및 평균복구시간 실측값은 상기 망관리 매니저에 장애 발생이 통보된 시각을 기준으로 하여 계산되는 것을 특징으로 하는 가용도를 이용한 망 관리방법.
  6. 제 1항에 있어서, 상기 제1 단계는,
    상기 망관리 매니저는 상기 시스템 운용 전에 해당 망관리 에이전트별 신뢰성 분석을 통해 상기 평균고장간격시간(MTBF)을 계산하는 것을 특징으로 하는 가용도를 이용한 망 관리방법.
  7. 제 1항에 있어서, 상기 제2 단계는,
    상기 특정 망관리 에이전트가 장애 발생을 상기 망관리 매니저로 통보하는 단계를 더 포함하는 것을 특징으로 하는 가용도를 이용한 망 관리방법.
KR10-2002-0071288A 2002-11-15 2002-11-15 가용도를 이용한 망 관리방법 KR100450415B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR10-2002-0071288A KR100450415B1 (ko) 2002-11-15 2002-11-15 가용도를 이용한 망 관리방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR10-2002-0071288A KR100450415B1 (ko) 2002-11-15 2002-11-15 가용도를 이용한 망 관리방법

Publications (2)

Publication Number Publication Date
KR20040042702A KR20040042702A (ko) 2004-05-20
KR100450415B1 true KR100450415B1 (ko) 2004-09-30

Family

ID=37339465

Family Applications (1)

Application Number Title Priority Date Filing Date
KR10-2002-0071288A KR100450415B1 (ko) 2002-11-15 2002-11-15 가용도를 이용한 망 관리방법

Country Status (1)

Country Link
KR (1) KR100450415B1 (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101973062B1 (ko) * 2017-11-10 2019-04-26 네모시스 주식회사 분산 시스템 작동 장치 및 방법
KR102533298B1 (ko) * 2022-11-08 2023-05-17 네모시스 주식회사 시스템 가용도에 기반하여 고장진단모델을 평가하는 장치 및 방법

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100770613B1 (ko) * 2005-09-30 2007-10-29 엘지전자 주식회사 데이터 리포팅 방법 및 그 이동 통신 단말기
KR101341231B1 (ko) * 2012-04-20 2013-12-12 한국남동발전 주식회사 발전설비의 신뢰도 중심 정비 관리방법
KR101566304B1 (ko) * 2013-11-21 2015-11-06 주식회사 쏠리드 Mtbf 개선을 위한 중계 시스템 및 그 방법
CN104780075B (zh) * 2015-03-13 2018-02-23 浪潮电子信息产业股份有限公司 一种云计算系统可用性评估方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR950010423A (ko) * 1993-09-09 1995-04-28 양승택 신호망관리시스템의 시험망 형상 생성 및 성능분석 시험방법
JPH11275074A (ja) * 1998-03-20 1999-10-08 Fujitsu Ltd ネットワークサービス管理方式
JP2001143115A (ja) * 1999-11-11 2001-05-25 Canon Inc 稼働管理装置及び稼働管理方法
KR100298235B1 (ko) * 1999-07-29 2001-09-29 이계철 과금레코드를 이용하여 영구가상연결(pvc)서비스를 제공하는통신망에서의 서비스 가용도 품질값 추출방법
KR20030056301A (ko) * 2001-12-28 2003-07-04 삼성에스디에스 주식회사 시스템 장애 통합관리방법

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR950010423A (ko) * 1993-09-09 1995-04-28 양승택 신호망관리시스템의 시험망 형상 생성 및 성능분석 시험방법
JPH11275074A (ja) * 1998-03-20 1999-10-08 Fujitsu Ltd ネットワークサービス管理方式
KR100298235B1 (ko) * 1999-07-29 2001-09-29 이계철 과금레코드를 이용하여 영구가상연결(pvc)서비스를 제공하는통신망에서의 서비스 가용도 품질값 추출방법
JP2001143115A (ja) * 1999-11-11 2001-05-25 Canon Inc 稼働管理装置及び稼働管理方法
KR20030056301A (ko) * 2001-12-28 2003-07-04 삼성에스디에스 주식회사 시스템 장애 통합관리방법

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101973062B1 (ko) * 2017-11-10 2019-04-26 네모시스 주식회사 분산 시스템 작동 장치 및 방법
KR102533298B1 (ko) * 2022-11-08 2023-05-17 네모시스 주식회사 시스템 가용도에 기반하여 고장진단모델을 평가하는 장치 및 방법

Also Published As

Publication number Publication date
KR20040042702A (ko) 2004-05-20

Similar Documents

Publication Publication Date Title
US7213179B2 (en) Automated and embedded software reliability measurement and classification in network elements
US6754854B2 (en) System and method for event monitoring and error detection
CA2493525C (en) Method and apparatus for outage measurement
US8443074B2 (en) Constructing an inference graph for a network
JP5418250B2 (ja) 異常検出装置、プログラム、及び異常検出方法
US7855952B2 (en) Silent failure identification and trouble diagnosis
US7058861B1 (en) Network model audit and reconciliation using state analysis
US6836798B1 (en) Network model reconciliation using state analysis
US7933211B2 (en) Method and system for providing prioritized failure announcements
US20110122761A1 (en) KPI Driven High Availability Method and apparatus for UMTS radio access networks
KR100450415B1 (ko) 가용도를 이용한 망 관리방법
US20040098230A1 (en) Computer network monitoring with test data analysis
US7421493B1 (en) Orphaned network resource recovery through targeted audit and reconciliation
US20020143917A1 (en) Network management apparatus and method for determining network events
US7673035B2 (en) Apparatus and method for processing data relating to events on a network
KR100269337B1 (ko) 지식 기반 기지국 감시 방법
KR100887874B1 (ko) 인터넷 망의 장애 관리 시스템 및 그 방법
KR101078461B1 (ko) 고객 고장 신고 정보를 이용한 네트워크 장애 감시 시스템과 그 방법
JPH10229396A (ja) サービス管理方法及びシステム
KR101556781B1 (ko) 네트웍 장비 예측 장애 및 수명 정보 서비스 시스템
CN111064506B (zh) 光纤链路的异常监测方法、设备及系统
JP4437416B2 (ja) ネットワーク保守システム
JP2003131905A (ja) 管理サーバシステム
CN111414267A (zh) 运用于数据中心的机柜异常状态的远端排除方法
CN111414274A (zh) 运用于数据中心的机柜异常状态的远端排除方法

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20080905

Year of fee payment: 5

LAPS Lapse due to unpaid annual fee