KR20080006968A - 분산 시스템에서 비정상 노드 검출 장치 및 방법 - Google Patents

분산 시스템에서 비정상 노드 검출 장치 및 방법 Download PDF

Info

Publication number
KR20080006968A
KR20080006968A KR1020060066377A KR20060066377A KR20080006968A KR 20080006968 A KR20080006968 A KR 20080006968A KR 1020060066377 A KR1020060066377 A KR 1020060066377A KR 20060066377 A KR20060066377 A KR 20060066377A KR 20080006968 A KR20080006968 A KR 20080006968A
Authority
KR
South Korea
Prior art keywords
node
management
state
managed
normal
Prior art date
Application number
KR1020060066377A
Other languages
English (en)
Inventor
조석현
백승민
이화순
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Priority to KR1020060066377A priority Critical patent/KR20080006968A/ko
Publication of KR20080006968A publication Critical patent/KR20080006968A/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0805Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability
    • H04L43/0817Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability by checking functioning
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/10Active monitoring, e.g. heartbeat, ping or trace-route

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Environmental & Geological Engineering (AREA)
  • Health & Medical Sciences (AREA)
  • Cardiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Computer And Data Communications (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

본 발명은 분산 시스템에 관한 것으로, 분산 시스템에서 관리 대상 노드의 상태를 검사하는 방법에 있어서, 시스템 관리 노드가 상기 관리 대상 노드로 응용 관리 메시지(HeartBeat Message)를 전송하고 응답 메시지 수신을 대기하는 과정과, 상기 응답메시지 수신이 없을 경우, 상기 관리 대상 노드에 대한 시스템 멤버쉽(Membership)검사를 수행하는 과정과, 상기 관리 대상 노드가 상기 시스템 멤버 쉽에 포함되어 있는 경우, 상기 관리 대상 노드의 상태를 검사하는 과정과, 상기 관리 대상 노드가 일반 관리 노드이고, 정상 상태로 파악될 경우, 상기 응용 관리 메시지 전송 조건을 검사하는 과정과, 상기 응용 관리 메시지 전송 조건이 상기 응용 관리 메시지 재전송 조건인 경우, 상기 응용 관리 메시지를 재전송하고 응답을 대기하는 과정과, 상기 일반 관리 노드가 정상이 아닌 상태로 파악되거나, 상기 응용 관리 메시지 전송 조건이 더 이상 전송하지 못하는 조건인 경우, 상기 일반 관리 노드를 비정상 노드로 처리하는 과정을 포함하는 것으로 특정 관리 노드가 정상적인 오류 보고 절차를 통하지 않고 비정상 상태로 빠진 경우에도 해당 관리 노드에 비정상 상태의 정도를 판단할 수 있는 기술을 제공하여 신뢰성 있는 노드 관리를 수행할 수 있다.
분산 시스템, 이동통신 시스템. 결함 복구, CMM(Cluster Membership Management).

Description

분산 시스템에서 비정상 노드 검출 장치 및 방법{APPATURUS AND METHOD FOR ABNORMAL NODE DETECTION IN DISTRIBUTED SYSTEM}
도 1은 기존의 비정상 노드 관리 과정을 도시한 도면,
도 2는 본 발명의 실시 예에 따른 비정상 노드 관리 과정을 도시한 도면,
도 3은 본 발명의 실시 예에 따른 시스템 관리 노드 관리 과정을 도시한 흐름도,
도 4는 본 발명의 실시 예에 따른 일반 관리 노드 관리 과정을 도시한 흐름도, 및,
도 5는 본 발명의 실시 예에 따른 시스템 관리 노드의 블록 구성을 도시한 도면.
본 발명은 분산 시스템에 관한 것으로, 특히 이동통신 시스템에서 주변 노드를 관리하기 위해 사용되는 분산 시스템 구조에서 시스템 관리 노드가 특정 통신 프로토콜의 오류 코드를 제공받지 못해 주변 노드의 정상 상태 여부를 파악하지 못할 경우, 정상 상태를 파악할 수 있게 하여 주변 노드를 관리할 수 있게 하는 장치 및 방법에 관한 것이다.
일반적으로, 노드 관리 응용(Node Monitor Application)은 노드의 상태를 관리하는 응용으로, 상기 노드 관리 응용이 관리하는 노드 상태 정보는 시스템 형상 정보를 포함하고 있어 시스템이 제공하는 여러 서비스에 필요한 가용성(availability), 신뢰성(reliability), 결함 복구(fault tolerance) 기능을 제공하기 위해 사용된다. 그리고 서버(Server) 또는 시스템 관리노드, 그리고 일반노드에 각각 설치되어 기 설정된 방식에 의해 서로 통신하여 관리 서비스를 수행한다.
예를 들어, WCDMA(Wide Code Division Multiple Access) 교환기는 시스템 관리 응용이 타 노드에 대한 노드 상태 감지용 TCP(Transmission Control Protocol) 연결을 이용하여 비정상 노드 상태 감지 기능을 수행한다.
도 1은 기존의 비정상 노드 관리 과정을 도시한 것이다.
상기 도 1을 참조하면, 상기 방식은 시스템 관리 노드(110, 120)의 노드 관리 응용(114, 124)이 시스템 관리 노드(110, 120) 또는 일반 노드(130, 140)의 노드 관리 응용(114, 124, 134, 144)이 종료 시 발생하는 TCP 연결 종료 예외를 이용하여 상기 예외가 발생한 노드를 비정상 노드(130, 140)로 판단한다. 상기 TCP 연결 종료 예외는 TCP 연결에 오류가 발생하게 되어 상기 TCP 연결이 종료되는 경우, 상기 오류에 따른 고유한 코드가 발생 되는 것을 나타낸다.
상기와 같은 TCP 연결 종료 예외를 이용하는 노드 상태 감지 방식은 시스템 이 비정상 상태가 되어 TCP 연결 종료 없이 비정상 종료되는 경우, 노드 비정상 상태를 감지하지 못하는 문제점이 있다. 따라서, TCP 연결 종료 없이 비정상 종료되는 경우에도 노드의 상태를 파악할 수 있는 장치 및 방법이 필요하다.
본 발명의 목적은 분산 시스템에서 비정상 노드 검출 장치 및 방법을 제공함에 있다.
본 발명의 다른 목적은 시스템이 비정상 상태가 되어 TCP 연결 오류 코드가 발생되지 못하는 비정상 종료의 경우에도 노드 상태를 관리할 수 있는 장치 및 방법을 제공함에 있다.
상기 목적을 달성하기 위한 본 발명의 제 1 견지에 따르면, 분산 시스템에서 관리 대상 노드의 상태를 검사하는 방법에 있어서, 시스템 관리 노드가 상기 관리 대상 노드로 응용 관리 메시지(HeartBeat Message)를 전송하고 응답 메시지 수신을 대기하는 과정과, 상기 응답메시지 수신이 없을 경우, 상기 관리 대상 노드에 대한 시스템 멤버쉽(Membership)검사를 수행하는 과정과, 상기 관리 대상 노드가 상기 시스템 멤버 쉽에 포함되어 있는 경우, 상기 관리 대상 노드의 상태를 검사하는 과정과, 상기 관리 대상 노드가 일반 관리 노드이고, 정상 상태로 파악될 경우, 상기 응용 관리 메시지 전송 조건을 검사하는 과정과, 상기 응용 관리 메시지 전송 조건이 상기 응용 관리 메시지 재전송 조건인 경우, 상기 응용 관리 메시지를 재전송하고 응답을 대기하는 과정과, 상기 일반 관리 노드가 정상이 아닌 상태로 파악되거 나, 상기 응용 관리 메시지 전송 조건이 더 이상 전송하지 못하는 조건인 경우, 상기 일반 관리 노드를 비정상 노드로 처리하는 과정을 포함하는 것을 특징으로 한다.
상기 목적을 달성하기 위한 본 발명의 제 2 견지에 따르면, 분산 시스템에서 특정 노드의 상태를 검사하는 장치에 있어서, 노드 상태 관리부를 제어하여 관리 대상 노드의 상태를 모니터링하게 하고, 모니터링 결과를 제공받아 기 설정된 방식에 의해 대응하는 제어부와, 상기 제어부의 지시에 의해, 관리 대상 노드에 대해 응용 관리 메시지를 전송하고, 시스템 멤버쉽 포함 여부를 검사하고, 상태를 검사하는 과정을 통해 상기 관리 대상 노드가 정상 노드인지 비정상 노드인지 결정하여 상기 제어부로 통보하는 노드 상태 관리부를 포함하는 것을 특징으로 한다.
상기 목적을 달성하기 위한 본 발명의 제 3 견지에 따르면, 분산 시스템에서 특정 노드의 상태를 검사하는 시스템에 있어서, 관리 대상 노드에 대해 응용 관리 메시지를 전송하고, 시스템 멤버쉽 포함 여부를 검사하고, 상태를 검사하는 과정을 통해 상기 관리 대상 노드가 정상 노드인지 비정상 노드인지 결정하고 기 설정된 방식에 의해 대응하는 시스템 관리 노드와, 상기 시스템 관리 노드가 모니터링하여 상태를 관리하는 관리 대상 노드를 포함하는 것을 특징으로 한다.
이하 본 발명의 바람직한 실시 예를 첨부된 도면의 참조와 함께 상세히 설명한다. 그리고, 본 발명을 설명함에 있어서, 관련된 공지기능 혹은 구성에 대한 구 체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단된 경우 그 상세한 설명은 생략한다.
이하, 본 발명은 분산 시스템에서 비정상 노드 검출 장치 및 방법에 대해 설명할 것이다.
본 발명은 일 실시 예로 시스템 관리 노드와 일반 노드로 구성되는 WCDMA 교환기와 WCDMA 교환기의 시스템 관리 노드에 적용된 미들웨어(CMM:Cluster Membership Management)로 구성된 시스템을 설명한다. 상기 시스템 관리 노드는 OAM(Opeation, Administration & Maintenance) 목적으로 사용하며 일반 노드는 호 처리 기능과 과금 등의 기능을 수행한다. 상기 미들웨어는 시스템의 멤버쉽(MemeberShip)을 관리한다.
도 2는 본 발명의 실시 예에 따른 비정상 노드 관리 과정을 도시한 것이다.
상기 도 2를 참조하면, 기존의 방식은 시스템 관리 노드(210, 220)의 노드 관리 응용(214, 224)이 상기 시스템 관리 노드(210, 220) 또는 일반 노드(230, 240)의 노드 관리 응용(214, 224, 234, 244)이 종료 시 발생하는 TCP 연결 종료 예외를 이용하여 예외가 발생한 노드를 비정상 노드로 판단하였는데, 상기와 같은 TCP 연결 종료 예외를 이용하는 노드 상태 감지 방법은 시스템이 비정상 상태가 되어 TCP 연결에 오류가 발생했지만, 오류 코드 없이 비정상 종료되는 경우 노드 비정상 상태를 감지하지 못하는 문제점이 존재하는 반면에, 본 발명은 다수 단계의 통신 및 멤버쉽 확인 단계를 거쳐 비정상 상태를 감지할 수 있다. 상기 다수 단계의 통신 및 멤버쉽 확인 단계는 하기에서 설명할 것이다.
도 3은 본 발명의 실시 예에 따른 시스템 관리 노드 관리 과정을 도시한 흐름도,
상기 도 3을 참조하면, 시스템 관리 노드의 노드 관리 응용은 310단계에서 응용 관리 메시지(HeartBeat Message)를 검사하려는 특정 시스템 관리 노드로 전송한다. 상기 응용 관리 메시지 전송 후에는 특정 타이머(FD Timer:Fault Detection Timer)가 시작된다. 상기 응용 관리 메시지는 특정 관리 노드 응용이 정상 상태인지 확인하기 위한 메시지이다. 상기 응용 관리 메시지를 수신한 상기 특정 관리 노드 응용은 응답 메시지를 전송한다. 상기 응답 메시지를 수신한 시스템 관리 노드의 노드 관리 응용은 상기 응답 메시지를 송신한 상기 특정 관리 노드의 관리 노드 응용이 정상 상태라고 판단한다.
상기 시스템 관리 노드의 노드 관리 응용은 315 단계에서 상기 310단계에서 전송한 응용 관리 메시지에 대한 응답 메시지가 상기 특정 타이머 만료 전에 도착하는지 검사한다.
만약, 상기 315단계에서 상기 응답 메시지가 상기 특정 타이머 만료 전에 도착하는 경우, 상기 310단계부터의 과정을 반복한다.
만약, 상기 315단계에서 상기 응답 메시지가 상기 특정 타이머 만료 전에 도착하지않는 경우, 상기 시스템 관리 노드의 노드 관리 응용은 320단계로 진행하여 CMM API(Advanced Programmming Interface)를 이용하여 상기 검사하려는 특정 시스템 관리 노드에 대해 CMM 검사를 수행한다. 상기 CMM 검사는 특정 노드가 CMM 파트너 쉽(Partner Ship)에 포함되어 있는지의 여부를 검사하는 것으로, 상기 CMM 파트 너 쉽에 포함되어 있다는 것은 관리를 위한 테이블에 기록되어 계속 TCP 통신에 의해 관리되고 있다는 것을 나타낸다.
만약, 상기 검사하려는 특정 시스템 관리 노드가 파트너 쉽에 포함되지 않은 경우, 345단계로 진행하여 상기 검사하려는 특정 시스템 관리 노드에 노드 실패(Node Fail)처리를 수행한다. 상기 노드 실패 처리는 특정 노드를 동작하지 않는 비정상 노드로 설정하는 것을 나타낸다.
만약, 상기 검사하려는 특정 시스템 관리 노드가 파트너 쉽에 포함된 경우, 330단계로 진행하여 상기 검사하려는 특정 시스템 관리 노드에 대한 정상 상태 여부를 검사한다. 상기 정상 상태 여부 검사는 관리 이벤트 기록상에 정상 노드로 설정되어 있는지 그리고 정상적으로 동작하는지를 검사하는 것을 나타낸다.
이후, 335단계에서 상기 검사하려는 특정 시스템 관리 노드가 정상 상태인 경우, 상기 310단계부터의 과정을 반복한다. 이 경우는 상기 315단계에서 응답 메시지 수신에는 실패했지만, 상기 검사하려는 특정 시스템 관리 노드는 아직 정상 상태로 판단하고 상기 310단계부터의 과정을 반복하는 것이다.
만약, 상기 검사하려는 특정 시스템 관리 노드가 정상 상태가 아닌 경우, 345단계로 진행하여 상기 검사하려는 특정 시스템 관리 노드에 노드 실패(Node Fail)처리를 수행한다. 또한, 비정상 노드 이벤트의 발생이 없이 비정상 상태인 경우도 345단계의 과정을 수행한다. 이후, 본 발명의 알고리즘을 종료한다.
도 4는 본 발명의 실시 예에 따른 일반 관리 노드 관리 과정을 도시한 흐름도이다.
상기 도 4을 참조하면, 시스템 관리 노드의 노드 관리 응용은 410단계에서 응용 관리 메시지(HeartBeat 메시지)를 검사하려는 특정 일반 관리 노드로 전송한다. 상기 응용 관리 메시지 전송 후에는 특정 타이머(FD Timer:Fault Detection Timer)가 시작된다. 상기 응용 관리 메시지는 특정 관리 노드 응용이 정상 상태인지 확인하기 위한 메시지이다. 상기 응용 관리 메시지를 수신한 상기 특정 관리 노드 응용은 응답 메시지를 전송한다. 상기 응답 메시지를 수신한 시스템 관리 노드의 노드 관리 응용은 상기 응답 메시지를 송신한 상기 특정 관리 노드의 관리 노드 응용이 정상 상태라고 판단한다.
상기 시스템 관리 노드의 노드 관리 응용은 415 단계에서 상기 410단계에서 전송한 응용 관리 메시지에 대한 응답 메시지가 상기 특정 타이머 만료 전에 도착하는지 검사한다.
만약, 상기 415단계에서 상기 응답 메시지가 상기 특정 타이머 만료 전에 도착하는 경우, 상기 410단계부터의 과정을 반복한다.
만약, 상기 415단계에서 상기 응답 메시지가 상기 특정 타이머 만료 전에 도착하지않는 경우, 상기 시스템 관리 노드의 노드 관리 응용은 420단계로 진행하여 CMM API를 이용하여 상기 검사하려는 특정 일반 관리 노드에 대해 CMM 검사를 수행한다. 상기 CMM 검사는 특정 노드가 CMM 파트너 쉽(Partner Ship)에 포함되어 있는지의 여부를 나타내는 것으로, 만약 상기 CMM 파트너 쉽에 포함되어 있다는 것은 관리를 위한 테이블에 기록되어 계속 TCP 통신에 의해 관리되고 있다는 것을 나타낸다.
만약, 상기 검사하려는 특정 일반 관리 노드가 파트너 쉽에 포함되지 않은 경우, 450단계로 진행하여 상기 검사하려는 특정 일반 관리 노드에 노드 실패(Node Fail)처리를 수행한다. 상기 노드 실패 처리는 특정 노드를 동작하지 않는 비정상노드로 설정하는 것을 나타낸다.
만약, 상기 검사하려는 특정 일반 관리 노드가 파트너 쉽에 포함된 경우, 430단계로 진행하여 상기 검사하려는 특정 일반 관리 노드에 대한 정상 상태 여부를 검사한다. 상기 정상 상태 여부 검사는 관리 이벤트 기록상에 정상 노드로 설정되어 있는지 그리고 정상적으로 동작하는지를 검사하는 것을 나타낸다.
이후, 435단계에서 상기 검사하려는 특정 일반 관리 노드가 정상 상태가 아닌 경우, 450단계로 진행하여 상기 검사하려는 특정 일반 관리 노드에 노드 실패(Node Fail)처리를 수행한다. 또한, 상기 검사하려는 특정 일반 관리 노드가 비정상 노드 이벤트의 발생이 없이 비정상 상태인 경우도 상기 450단계의 과정을 수행한다.
만약, 상기 435단계에서 상기 검사하려는 특정 일반 관리 노드가 정상 상태인 경우, 440단계로 진행하여 응용 관리 메시지의 카운트 값을 하나 증가한다.
이후, 445단계에서 상기 응용 관리 메시지의 카운트 값이 3인 경우, 450단계로 진행하여 상기 검사하려는 특정 일반 관리 노드에 노드 실패(Node Fail)처리를 수행한다. 이 경우는 상기 검사하려는 특정 일반 관리 노드가 계속 응답이 없으므로, 비정상 노드로 처리하는 것을 나타낸다.
만약, 상기 445단계에서 상기 응용 관리 메시지의 카운트 값이 3보다 작은 경우, 상기 410단계부터의 과정을 반복한다. 이후, 본 발명의 알고리즘을 종료한다.
도 5는 본 발명의 실시 예에 따른 시스템 관리 노드의 블록 구성을 도시한 것이다.
상기 도 5을 참조하여 시스템 관리 노드의 구성을 살펴보면, 제어부(510)는 상기 시스템 관리 노드의 전반적인 동작을 제어하고 특히 본 발명에 따라 노드 상태 관리부(540)를 제어한다. 예를 들어, 상기 노드 상태 관리부(540)로 하여금 시스템 관리 노드 또는 일반 관리 노드의 상태를 모니터링하게 하고, 모니터링 결과를 제공받아 기 저장된 방식에 의해 대응을 하게 한다. 예를 들어, 비정상 노드 정보가 상기 노드 상태 관리부(540)로부터 제공된 경우, 그 결과를 보고하거나 기 설정된 방식에 의해 복구 작업을 수행한다.
노드 상태 관리부(540)는 상기 제어부(540)의 지시에 의해, 시스템 관리 노드 또는 일반 관리 노드의 상태를 모니터링하여, 상기 제어부(540)로 시스템 관리 노드 또는 일반 노드가 정상 상태인지, 또는 비정상 상태인지 검사하여 보고한다.
또한, 상기 노드 상태 관리부(540)는 TCP 연결 종료가 정상적인 절차로 행하여지지 않았더라도, 응용 관리 메시지 확인 과정, CMM API를 이용한 확인 과정, 이벤트를 이용한 상태 확인 과정을 수행하여 정상 상태 또는 비정상 상태를 파악할 수 있다.
저장부(530)는 상기 장치의 전반적인 동작을 제어하기 위한 프로그램 및 프로그램 수행 중 발생하는 일시적인 데이터를 저장하는 기능을 수행한다.
인터페이스 모듈(520)은 다른 네트워크 노드와 통신하기 위한 모듈로서, 기저대역 처리부 및 유선처리부 등을 포함하여 구성된다. 상기 제어부(540) 또는 상기 노드 상태 관리부(540)가 생성하는 메시지는 상기 인터페이스 모듈(520)을 통해 전송된다. 상기 유선처리부가 사용하는 물리적 전송 인터페이스는 광통신을 포함하여 여러 가지 기술이 사용될 수 있다.
상술한 블록 구성에서, 상기 제어부(510)는 상기 노드 상태 관리부(540)를 제어한다. 즉, 상기 제어부(510)는 상기 노드 상태 관리부(540)의 기능을 수행할 수 있다. 본 발명에서 이를 별도로 구성하여 도시한 것은 각 기능들을 구별하여 설명하기 위함이다. 따라서 실제로 제품을 구현하는 경우에 이들 모두를 상기 제어부(510)에서 처리하도록 구성할 수도 있으며, 이들 중 일부만을 상기 제어부(510)에서 처리하도록 구성할 수도 있다.
한편 본 발명의 상세한 설명에서는 구체적인 실시 예에 관해 설명하였으나, 본 발명의 범위에서 벗어나지 않는 한도 내에서 여러 가지 변형이 가능함은 물론이다. 그러므로 본 발명의 범위는 설명된 실시 예에 국한되어 정해져서는 아니 되며 후술하는 특허청구의 범위뿐만 아니라 이 특허청구의 범위와 균등한 것들에 의해 정해져야 한다.
본 발명은 특정 관리 노드가 정상적인 오류 보고 절차를 통하지 않고 비정상 상태로 빠진 경우에도 해당 관리 노드에 비정상 상태의 정도를 판단할 수 있는 기술을 제공하여 신뢰성 있는 노드 관리를 수행할 수 있다.

Claims (14)

  1. 분산 시스템에서 관리 대상 노드의 상태를 검사하는 방법에 있어서,
    시스템 관리 노드가 상기 관리 대상 노드로 응용 관리 메시지를 전송하고 응답 메시지 수신을 대기하는 과정과,
    상기 응답메시지 수신이 없을 경우, 상기 관리 대상 노드에 대한 시스템 멤버쉽검사를 수행하는 과정과,
    상기 관리 대상 노드가 상기 시스템 멤버 쉽에 포함되어 있는 경우, 상기 관리 대상 노드의 상태를 검사하는 과정과,
    상기 관리 대상 노드가 일반 관리 노드이고, 정상 상태로 파악될 경우, 상기 응용 관리 메시지 전송 조건을 검사하는 과정과,
    상기 응용 관리 메시지 전송 조건이 상기 응용 관리 메시지 재전송 조건인 경우, 상기 응용 관리 메시지를 재전송하고 응답을 대기하는 과정과,
    상기 일반 관리 노드가 정상이 아닌 상태로 파악되거나, 상기 응용 관리 메시지 전송 조건이 더 이상 전송하지 못하는 조건인 경우, 상기 일반 관리 노드를 비정상 노드로 처리하는 과정을 포함하는 것을 특징으로 하는 방법.
  2. 제 1항에 있어서,
    상기 관리 대상 노드가 다른 시스템 관리 노드이고, 정상 상태로 파악될 경 우, 상기 응용 관리 메시지를 전송하고 응답을 대기하는 과정과,
    상기 다른 시스템 관리 노드가 정상이 아닌 상태로 파악될 경우, 상기 시스템 관리 노드를 비정상 노드로 처리하는 과정을 더 포함하는 것을 특징으로 하는 방법.
  3. 제 1항에 있어서,
    상기 시스템 관리 노드는 상기 관리 대상 노드로부터 상기 응답 메시지를 수신하는 경우, 상기 관리 대상 노드를 정상 노드로 처리하는 것을 특징으로 하는 방법.
  4. 제 1항에 있어서,
    상기 시스템 관리 노드는 상기 관리 대상 노드가 상기 시스템 멤버 쉽에 포함되어 있는 경우, 상기 관리 대상 노드를 정상 노드로 처리하는 것을 특징으로 하는 방법.
  5. 분산 시스템에서 특정 노드의 상태를 검사하는 장치에 있어서,
    노드 상태 관리부를 제어하여 관리 대상 노드의 상태를 모니터링하게 하고, 모니터링 결과를 제공받아 기 설정된 방식에 의해 대응하는 제어부와,
    상기 제어부의 지시에 의해, 관리 대상 노드에 대해 응용 관리 메시지를 전송하고, 시스템 멤버쉽 포함 여부를 검사하고, 상태를 검사하는 과정을 통해 상기 관리 대상 노드가 정상 노드인지 비정상 노드인지 결정하여 상기 제어부로 통보하는 노드 상태 관리부를 포함하는 것을 특징으로 하는 장치.
  6. 제 5항에 있어서,
    상기 노드 상태 관리부는 상기 관리 대상 노드로부터 상기 응용 관리 메시지에 대한 응답 메시지를 수신하는 경우, 상기 관리 대상 노드를 정상 노드로 처리하는 것을 특징으로 하는 장치.
  7. 제 5항에 있어서,
    상기 노드 상태 관리부는 상기 관리 대상 노드가 상기 시스템 멤버쉽에 포함되어 있는 경우, 상기 관리 대상 노드를 정상 노드로 처리하는 것을 특징으로 하는 장치.
  8. 제 5항에 있어서,
    상기 노드 상태 관리부는 상기 관리 대상 노드가 다른 시스템 관리 노드이고 정상 상태로 파악될 경우, 상기 응용 관리 메시지를 전송하는 것을 특징으로 하는 장치.
  9. 제 5항에 있어서,
    상기 노드 상태 관리부는 상기 관리 대상 노드가 일반 관리 노드이고, 정상 상태로 파악될 경우, 상기 응용 관리 메시지 전송 조건을 검사하여, 상기 응용 관리 메시지 전송 조건이 재전송 조건인 경우, 상기 응용 관리 메시지를 재전송 하는 것을 특징으로 하는 장치.
  10. 분산 시스템에서 특정 노드의 상태를 검사하는 시스템에 있어서,
    관리 대상 노드에 대해 응용 관리 메시지를 전송하고, 시스템 멤버쉽 포함 여부를 검사하고, 상태를 검사하는 과정을 통해 상기 관리 대상 노드가 정상 노드인지 비정상 노드인지 결정하고 기 설정된 방식에 의해 대응하는 시스템 관리 노드와,
    상기 시스템 관리 노드가 모니터링하여 상태를 관리하는 관리 대상 노드를 포함하는 것을 특징으로 하는 시스템.
  11. 제 10항에 있어서,
    상기 시스템 관리 노드는 상기 관리 대상 노드로부터 상기 응용 관리 메시지에 대한 응답 메시지를 수신하는 경우, 상기 관리 대상 노드를 정상 노드로 처리하는 것을 특징으로 하는 시스템.
  12. 제 10항에 있어서,
    상기 시스템 관리 노드는 상기 관리 대상 노드가 상기 시스템 멤버쉽에 포함되어 있는 경우, 상기 관리 대상 노드를 정상 노드로 처리하는 것을 특징으로 하는 시스템.
  13. 제 10항에 있어서,
    상기 시스템 관리 노드는 상기 관리 대상 노드가 다른 시스템 관리 노드이고, 정상 상태로 파악될 경우, 상기 응용 관리 메시지를 재전송하는 것을 특징으로 하는 시스템.
  14. 제 10항에 있어서,
    상기 시스템 관리 노드는 상기 관리 대상 노드가 일반 관리 노드이고, 정상 상태로 파악될 경우, 상기 응용 관리 메시지 전송 조건을 검사하여, 상기 응용 관리 메시지 전송 조건이 재전송 조건인 경우, 상기 응용 관리 메시지를 재전송하는 것을 특징으로 하는 시스템.
KR1020060066377A 2006-07-14 2006-07-14 분산 시스템에서 비정상 노드 검출 장치 및 방법 KR20080006968A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020060066377A KR20080006968A (ko) 2006-07-14 2006-07-14 분산 시스템에서 비정상 노드 검출 장치 및 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020060066377A KR20080006968A (ko) 2006-07-14 2006-07-14 분산 시스템에서 비정상 노드 검출 장치 및 방법

Publications (1)

Publication Number Publication Date
KR20080006968A true KR20080006968A (ko) 2008-01-17

Family

ID=39220565

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020060066377A KR20080006968A (ko) 2006-07-14 2006-07-14 분산 시스템에서 비정상 노드 검출 장치 및 방법

Country Status (1)

Country Link
KR (1) KR20080006968A (ko)

Similar Documents

Publication Publication Date Title
CN108880917B (zh) 控制面设备的切换方法、装置及转控分离系统
US11848889B2 (en) Systems and methods for improved uptime for network devices
CN103810076B (zh) 数据复制的监控方法及装置
WO2016095344A1 (zh) 链路切换方法、装置及线卡
JP4478686B2 (ja) バックアップセルコントローラ
KR100407323B1 (ko) 사설 무선 네트워크에서 콜 매니저 이중화 방법
JP5233523B2 (ja) 無線基地局状態検出方法及びシステム
US11153769B2 (en) Network fault discovery
CN114884803B (zh) 多重冗余状态的处理方法、装置、设备和介质
CN114356810B (zh) 一种主机与存储系统的通信连接方法、装置、设备及介质
KR20080006968A (ko) 분산 시스템에서 비정상 노드 검출 장치 및 방법
US20200296607A1 (en) Channel establishment method and base station
US11954509B2 (en) Service continuation system and service continuation method between active and standby virtual servers
CN108880882B (zh) 一种基于健康检查改进机制的gslb处理方法
KR100754770B1 (ko) 이동통신망에서 사용되는 데이터 통신 모듈을 관리하기위한 서버와 서버에 의해 제어 받는 해당 모듈의 동작 방법및 이를 이용한 무선망의 이상 상태를 관리하기 위한 방법
JP2013121095A (ja) 通信装置
JP2018148421A (ja) ネットワーク監視装置、ネットワーク監視システム、ネットワーク監視方法及びプログラム
KR20110033385A (ko) WiBro Access 시스템의 프로토콜 시험 방법과 이를 위한 시스템
US11411807B2 (en) Method and system for detecting and mitigating cabling issues with devices in substation automation systems
KR101071376B1 (ko) Ip 네트워크 품질 정보를 이용한 ip 네트워크 장비 관리 장치
JP4137304B2 (ja) パケット通信網の障害検出方法
JP2002064845A (ja) 無線基地局装置およびリソース情報照合方法
JP2002344460A (ja) 電力系統監視制御システムおよびそのコネクション確立状態監視制御プログラムを記録した記録媒体
JP2003332979A (ja) 無線基地局装置における送信出力レベル異常の誤検出回避方法及び無線基地局装置
CN114007232A (zh) 一种通过优化节点通讯来实现的保活机制

Legal Events

Date Code Title Description
WITN Withdrawal due to no request for examination