KR100832543B1 - 계층적 다중 백업 구조를 갖는 고가용성 클러스터 시스템및 이를 이용한 고가용성 구현 방법 - Google Patents

계층적 다중 백업 구조를 갖는 고가용성 클러스터 시스템및 이를 이용한 고가용성 구현 방법 Download PDF

Info

Publication number
KR100832543B1
KR100832543B1 KR1020060124883A KR20060124883A KR100832543B1 KR 100832543 B1 KR100832543 B1 KR 100832543B1 KR 1020060124883 A KR1020060124883 A KR 1020060124883A KR 20060124883 A KR20060124883 A KR 20060124883A KR 100832543 B1 KR100832543 B1 KR 100832543B1
Authority
KR
South Korea
Prior art keywords
node
high availability
nodes
primary
secondary node
Prior art date
Application number
KR1020060124883A
Other languages
English (en)
Inventor
심규호
김진미
배승조
정영우
고광원
우영춘
김명준
Original Assignee
한국전자통신연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국전자통신연구원 filed Critical 한국전자통신연구원
Priority to KR1020060124883A priority Critical patent/KR100832543B1/ko
Application granted granted Critical
Publication of KR100832543B1 publication Critical patent/KR100832543B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/22Alternate routing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/04Network management architectures or arrangements
    • H04L41/044Network management architectures or arrangements comprising hierarchical management structures
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/10Active monitoring, e.g. heartbeat, ping or trace-route

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Cardiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Hardware Redundancy (AREA)

Abstract

본 발명은 계층적 다중 백업 구조를 갖는 고가용성 클러스터 시스템 및 이를 이용한 고가용성 구현 방법에 관한 것으로, 본 발명의 고가용성 클러스터 시스템은, 클러스터 시스템의 각 노드들에 마련된 가용성 관리부가 동작할 때 구성된 클러스터 멤버십(Cluster Membership)을 기반으로 서비스를 제공할 주 노드, 주 노드의 장애를 감시하기 위한 부 노드, 및 부 노드의 장애를 감시하는 M(M=1,2,...,N)개의 백업 노드로 구성되며, 이러한 구성에서 주 노드의 장애에 대비한 주 노드와 부 노드로 구성된 1+1 고 가용성 시스템은 빠른 오류회복의 장점을 얻을 수 있고, 부 노드와 다수(M 개)의 백업 노드로 구성된 비대칭적 1+M 고가용성 시스템은 클러스터 노드가 증가해도 처리비용이 증가하지 않으므로 이를 결합하여 계층적 다중 백업을 통한 빠르고 높은 가용성을 얻을 수 있다.
클러스터, 고가용성, 백업, 계층, 장애, 하트비트

Description

계층적 다중 백업 구조를 갖는 고가용성 클러스터 시스템 및 이를 이용한 고가용성 구현 방법{High Availability Cluster System having hierarchical multiple backup structure and Method performing high availability using the same}
도 1은 종래 1+1 고가용성 클러스터 시스템 구성을 개략적으로 도시한 도면,
도 2는 종래 클러스터 시스템의 모든 노드가 하트비트 메시지를 내보내는 1+M 고가용성 클러스터 시스템의 구성을 개략적으로 도시한 도면,
도 3은 종래 클러스터 노드 중 서비스를 제공하는 노드만이 하트비트를 발생하는 비대칭적 1+M 고가용성 클러스터 시스템의 구성을 개략적으로 도시한 도면,
도 4는 본 발명의 바람직한 실시예에 따른 고가용성 클러시터 시스템의 계층적 다중 백업 장치를 도시한 도면,
도 5는 본 발명의 실시예에 따른 1+1+M 고가용성 클러스터 시스템에서 부 노드의 장애 또는 부재시에 따른 클러스터 시스템 구성 예를 도시한 도면, 그리고
도 6은 본 발명의 실시예에 따른 고가용성 클러스터 시스템의 계층적 다중 백업 장치를 이용한 고가용성 구현 방법을 도시한 흐름도이다.
본 발명은 고가용성 클러스터 시스템에 관한 것으로서, 보다 상세하게는, 서비스를 일원화된 중앙 집중 관리 형태로 수행하고 고가용성 관리자가 탑재되어 있는 주 노드, 주 노드의 장애를 감시하기 위한 부 노드, 그리고 부 노드의 장애를 동시에 감시하는 백업 노드를 포함하여 구성되는 고가용성 클러스터 시스템 및 고가용성 구현 방법에 관한 것이다.
고가용성 클러스터 시스템은 기업의 기간 업무 서버 등의 안정성을 높이기 위한 것으로서, 데이터 가용성을 위할 경우에 각 시스템 간에 공유 디스크를 중심으로 클러스터링되며 다수의 시스템을 동시에 연결할 수 있다. 또한 고가용성 클러스터 시스템은 구성에 따라 여러 가지 방식으로 구현할 수 있지만, 실제 널리 쓰이는 방식은 2개의 서버를 연결하는 것으로, 2개의 시스템이 각각의 업무를 수행한다.
이와 같이 2개의 서버로 구성되는 고가용성 클러스터 시스템은 1개의 서버에서 장애가 발생하면 다른 하나의 서버가 그 서버의 업무를 대신 수행하여 시스템 장애를 불과 몇 초 만에 복구할 수 있다. 통상적으로 고가용성 클러스터 시스템은 고가용성 기능이 가장 필요한 주 노드만을 대상으로 하며, 이는 고가용성 클러스터 시스템의 목적에 맞는 신뢰도를 높이기가 어렵다.
도 1은 종래 1+1 고가용성 클러스터 시스템 구성을 개략적으로 도시한 도면 이다.
도시된 고가용성 클러스터 시스템은 서비스 제공 서버인 하나의 액티브 노드(10), 및 액티브 노드(10)를 감시하기 위한 하나의 백업 노드(20)로 구성된 1+1 노드로 구성된다.
이러한 1+1 고가용성 클러스터 시스템에서 액티브 노드(10)와 백업 노드(20)에는 각각 고가용성 관리부(12,22)가 설치된다.
액티브 노드(10)의 고가용성 관리부(12)는 일정 주기로 자신의 시스템에 상태를 하트비트 메시지를 통해 백업 노드(20)의 고가용성 관리부(22)에게 알려준다. 백업 노드(20)는 액티브 노드(10)로부터 발생한 하트비트 메시지를 통해 액티브 노드(10)가 정상 작동하고 있음을 알 수 있다.
하트비트 메시지를 통해 액티브 노드(10)에 장애가 발생했음을 알려주거나 액티브 노드(10)에서 발생시키는 하트비트 메시지를 백업 노드(20)가 받지 못할 경우, 백업 노드(20)는 액티브 노드(10)에 장애가 발생했다고 판단하고 액티브 노드(10)에서 수행했던 관리 서비스를 페일 오버(fail over)한다.
이러한 1+1 고 가용성 클러스터 시스템은 백업 노드(20)가 액티브 노드(10)에 장애가 발생했다고 판단할 때 백업 노드(20)의 선출 없이 즉시 액티브 노드(10)의 관리 서비스를 페일 오버함으로써, 서비스 지연시간을 최소화할 수 있는 장점이 있다. 그러나, 이러한 특성을 갖는 1+1 고 가용성 클러스터 시스템은 백업 노드마저 장애 발생시 더 이상 서비스를 제공할 수 없는 가용성의 한계를 가진다.
도 2는 종래 클러스터 시스템의 모든 노드가 하트비트 메시지를 내보내는 1+M 고가용성 클러스터 시스템의 구성을 개략적으로 도시한 도면이다.
도시된 바와 같이, 하나의 액티브 노드(10)와 M개의 백업 노드(20-1,20-2,...,20-N)를 가지는 1+M 고가용성 클러스터 시스템은, 액티브 노드(10) 및 모든 백업 노드(20-1,20-2,...,20-N) 각각에 고가용성 관리부(12,22-1,22-2,...,22-N)가 구비된다.
여기서 각 고가용성 관리부(12,22-1,22-2,...,22-N)는 하트비트 메시지를 발생시키고, 액티브 노드(10)에 장애 발생시 모두 이를 인지하고 페일 오버할 노드를 선출한다. 선출된 노드는 액티브 노드(10)의 모든 관리 서비스를 페일 오버한다.
이런 고가용성 클러스터 시스템은 M개의 백업노드가 존재하여 1+1 고가용성 시스템보다 더 높은 가용성을 제공할 수 있으나, 모든 노드가 클러스터 멤버쉽 정보를 공유하기 위해 하트비트 메시지를 지속적으로 발생시켜야한다. 이에 따라, 클러스터 노드가 증가함에 따라 하트비트 메시지가 증가하여 네트워크와 각 노드에서의 하트비트 메시지 처리에 많은 오버 헤드가 발생할 수 있는 문제점이 있다.
도 3은 종래 클러스터 노드 중 서비스를 제공하는 노드만이 하트비트를 발생하는 비대칭적 1+M 고가용성 클러스터 시스템의 구성을 개략적으로 도시한 도면이다.
도시된 클러스터 시스템은 도 2의 1+M 고가용성 시스템에서의 오버헤드를 제거하기 위해, 액티브 노드(10)에서만 하트비트 메시지를 발생시키고, 나머지 백업 노드(30-1,30-2,...,30-N)들은 하트비트 메시지를 발생시키지 않는 비대칭적 1+M 구조를 갖는다.
이러한 비대칭적 1+M 고가용성 클러스터 시스템은 하나의 액티브 노드(10)의 고가용성 관리부(12)만이 하트비트 메시지를 발생하기 때문에, 클러스터 노드가 증가해도 각 노드에서의 네트워크 및 하트비트 메시지 처리 오버헤드가 증가하지 않는다.
그런데, 액티브 노드(10)에 장애 발생시 클러스터 멤버쉽 정보를 알 수 없기 때문에 바로 페일 오버할 노드를 선출 할 수 없는 단점이 있다. 액티브 노드(10)에 장애 발생시 모든 백업노드(30-1,30-2,...,30-N)는 하트비트를 발생시켜 클러스터 멤버쉽을 구성하고 구성된 클러스터 멤버쉽을 기반으로 페일 오버할 노드를 선출하게 된다.
이때 선출된 노드는 액티브 노드(10)에서 제공하던 모든 관리 서비스를 페일 오버한다. 이러한 비대칭적 1+M 고가용성 클러스터 시스템은 1+1 고가용성 클러스터 시스템보다 높은 가용성을 제공하고 클러스터 노드가 증가해도 네트워크 및 각 노드에서의 하트비트 메시지 처리 오버헤드가 증가하지 않는 장점을 갖는다. 그러나, 액티브 노드(10)에 장애가 발생할 경우, 클러스터 멤버쉽 구성 단계를 다시 거쳐야 함으로 페일 오버 시간이 긴 단점이 있다.
상기와 같은 문제점을 해결하기 위한 본 발명의 제1 목적은, 각 노드들 간의 데이터 전송 부하를 최소화하면서 보다 신속한 액티브 노드에 대한 장애 발생 인식 및 장애 발생에 따른 페일 오버 처리가 가능한 고가용성 클러스터 시스템 및 그 방 법을 제공하는 데 있다.
본 발명의 제2 목적은, 1+1 고가용성 시스템에서의 낮은 가용성, 1+M 고가용성 시스템에서의 클러스터 노드가 증가함에 따라 증가하는 오버헤드, 및 비대칭적 1+M 고가용성 시스템에서의 긴 장애복구 시간 소요에 따른 문제점을 해결할 수 있는 고가용성 클러스터 시스템 및 그 방법을 제공하는 데 있다.
상기와 같은 목적을 달성하기 위한 본 발명의 실시예에 따른 고가용성 클러스터 시스템은, 구성된 클라이언트 멤버쉽의 노드들에게 서비스를 제공하고, 자신의 동작 상태 정보를 출력하는 액티브 노드인 주 노드; 상기 주 노드의 백업 노드로서 상기 주 노드로부터 제공되는 서비스를 제공 받아 출력하고 상기 주 노드의 장애를 감시하며, 자신의 동작 상태 정보를 출력하는 부 노드; 및 상기 주 노드로부터 상기 부 노드를 거처 출력되는 서비스를 제공 받고, 상기 부 노드의 장애를 감시하는 적어도 하나의 백업 노드를 포함한다.
본 발명의 실시예에 따른 고가용성 클러스터 시스템은, 상기 주 노드가 1개, 상기 부 노드가 1개, 및 상기 백업 노드가 M(M=1,2,..,N)개로 구성되는 1+1+M 구조를 갖는다.
본 실시예에서 상기 주 노드, 부 노드, 및 백업 노드들은 클러스터 내에 고가용성 구현을 위한 동작이 시작되면, 일정 시간 동안 하트비트 메시지를 발생시켜 클러스터 멤버쉽을 구성한다.
상기 주 노드, 부 노드, 및 백업 노드들은 상기 구성된 동일한 클러스터 멤버쉽을 기반으로 상기 서비스를 제공할 상기 주 노드를 선출하고, 상기 주 노드의 장애를 감시할 상기 부 노드를 선출한다.
상기 주 노드 및 부 노드는 일정 주기로 하트비트 메시지를 발생시킴으로써 자신이 정상 작동함을 다른 노드들에게 알려준다.
상기 부 노드는 상기 주 노드로부터 상기 하트비트 메시지를 일정 시간 동안 받지 못한 경우, 상기 주 노드의 동작 장애로 판단한다.
상기 부 노드는 상기 주 노드에 동작 장애가 발생하면, 상기 주 노드에서 제공한 서비스를 재시작하기 위한 작업을 수행하고 자신이 주 노드의 기능을 수행한다.
상기 백업 노드들은 상기 부 노드로부터 상기 하트비트 메시지를 일정 시간 동안 받지 못한 경우, 상기 부 노드의 동작 장애로 판단한다.
상기 백업 노드들은 상기 부 노드에 동작 장애가 발생하면, 클러스터 멤버쉽을 구성하여 새로운 부 노드를 선출한다.
상기 주 노드, 부 노드, 및 백업 노드들은 클러스터 내 노드들의 동기화된 시간을 기반으로 각 노드들에 구비된 고가용성 관리부가 구동한 시간을 기반으로 가장 먼저 구동한 고가용성 관리부를 갖는 순서에 기초하여 상기 주 노드 및 상기 부 노드를 선출한다.
한편, 상기와 같은 목적을 달성하기 위한 본 발명의 실시예에 따른 고가용성 클러스터 시스템의 고가용성 구현 방법은, 클러스터 내에 고 가용성 구현이 시작하 면, 모든 클러스터 노드들이 일정 시간 동안 하트비트 메시지를 발생시켜 클러스터 멤버쉽을 구성하는 단계; 상기 구성된 클러스터 멤버쉽을 기반으로 상기 노드들이 서비스를 제공할 주 노드를 선출하고, 상기 주 노드의 장애를 감시할 부 노드를 선출하며, 나머지 노드들은 백업 노드 기능을 수행하는 단계; 상기 주 노드가 상기 구성된 클라이언트 멤버쉽의 노드들에게 서비스를 제공하고 자신의 동작 상태 정보를 출력하는 단계; 상기 부 노드가 상기 주 노드로부터 제공되는 서비스를 제공 받아 출력하고 상기 주 노드의 장애를 감시하며, 자신의 동작 상태 정보를 출력하는 단계; 상기 백업 노드들이 상기 주 노드로부터 상기 부 노드를 거처 출력되는 서비스를 제공 받고, 상기 부 노드의 장애를 감시하는 단계; 상기 부 노드가 상기 주 노드의 장애 발생시, 자신이 상기 주 노드의 기능을 수행하는 단계; 및 상기 백업 노드들이 상기 백업 노드들 중에서 새로운 부 노드를 선출하는 단계를 포함한다.
본 실시예에서 상기 주 노드 및 부 노드의 동작 상태 정보는 일정 주기로 하위 노드에게 출력되는 하트비트 메시지이다.
본 발명의 실시예에 따른 고가용성 클러스터 시스템의 고가용성 구현 방법에서 상기 부 노드가 상기 주 노드로부터 상기 하트비트 메시지를 일정 시간 동안 받지 못한 경우, 상기 주 노드의 동작 장애로 판단한다.
본 실시예에서 상기 백업 노드들이 상기 부 노드로부터 상기 하트비트 메시지를 일정 시간 동안 받지 못한 경우, 상기 부 노드의 동작 장애로 판단한다. 또한 상기 구성된 클러스터 멤버쉽을 기반으로 상기 노드들이, 클러스터 내 상기 노드들의 동기화된 시간을 기반으로 각 노드들에 구비된 고가용성 관리부가 구동한 시간을 기반으로 가장 먼저 구동한 고가용성 관리부를 갖는 순서에 기초하여 상기 주 노드 및 상기 부 노드를 선출한다.
본 발명의 실시예에 따른 고가용성 클러스터 시스템의 고가용성 구현 방법에서 상기 부 노드가 주 노드 기능을 수행하는 단계는, 상기 부 노드가 상기 주 노드의 장애 발생시, 상기 부 노드에 구비된 고가용성 관리부를 복구하는 단계; 및 상기 부 노드가 상기 장애가 발생한 주 노드의 역할을 이임하는 단계를 포함한다.
본 실시예에서 상기 새로운 부 노드를 선출하는 단계는, 상기 백업 노드들이 부 노드의 장애 발생시, 상기 백업 노드들 중에서 새로운 부 노드를 선출하는 단계; 상기 선출된 새로운 부 노드가 구비된 고가용성 관리부를 복구하는 단계; 및 상기 새로 선출된 부 노드가 상기 주 노드의 역할을 이임하는 단계를 포함한다.
본 발명에 따르면, 다수의 서비스 노드를 가지는 클러스터 시스템에서 신뢰성 있는 서비스를 제공하기 위해 계층적 다중 백업 노드로 고가용성 클러스터 시스템을 구성함으로써, 서비스를 지원하는 시스템으로서의 신뢰도를 향상시키고, 서비스 노드가 증가해도 처리 비용이 증가하지 않는 계층적 다중 백업 고가용성 클러스터 시스템의 효율적인 구성으로 요청된 서비스를 보다 신속하게 제공할 수 있다. 또한 본 발명의 계층적 다중 백업 구성을 갖는 고가용성 클러스터 시스템은 기존의 낮은 고가용성과 긴 오류회복 시간을 개선함으로써, 보다 효율적인 가용성을 제공할 수 있다.
이하, 본 발명의 바람직한 실시예들을 첨부한 도면을 참조하여 상세히 설명한다. 도면들 중 동일한 구성요소들은 가능한 한 어느 곳에서든지 동일한 부호들 로 나타내고 있음에 유의해야 한다. 또한 본 발명의 요지를 불필요하게 흐릴 수 있는 공지 기능 및 구성에 대한 상세한 설명은 생략한다.
본 발명의 고가용성 클러스터 시스템은 부노드의 장애를 동시에 감시하는 백업 노드를 포함하여 구성되는 클러스터 시스템을 기반으로 하는 계층적 다중 백업 장치를 탑재한다. 또한, 본 발명은 1+1 고가용성 시스템과 비대칭적 1+M 고가용성 시스템에서 얻고자 하는 방법의 장점을 결합하여 높은 가용성을 제공하면서 기존의 단점을 해결하여 네트워크 및 처리 오버헤드를 최적화하고 오류회복 시간을 최소화할 수 있는 고가용성 클러스터 시스템 및 방법을 제안한다.
도 4는 본 발명의 바람직한 실시예에 따른 고가용성 클러시터 시스템의 계층적 다중 백업 장치를 도시한 도면이다.
도시된 고가용성 클러스터 시스템의 계층적 다중 백업 장치는 1+1+M 구성을 갖는다.
도시된 바와 같이, 고가용성 클러스터 시스템은 하나의 액티브 노드인 주 노드(100), 액티브 노드(주 노드)(100)를 감시하는 하나의 백업 노드(부 노드)(200), 및 부 노드(200)를 감시하는 M개의 백업 노드(300-1,300-2,...,300-N)들로 구성된다.
본 실시예에서 주 노드(100)의 고가용성 관리부(120)와 부 노드(200)의 고가용성 관리부(220)만이 하트비트 메시지 발생하여 자신이 장애 없음을 부 노드(200)와 M개의 백업 노드(300-1,300-2,...,300-N)들에게 알린다. 서비스를 제공하던 주 노드(100)에 장애 발생시 주 노드(100)를 감시하던 부 노드(200)의 고가용성 관리 부(220)는 이를 감지하고 주 노드(100)에서 제공하던 관리 서비스를 페일 오버한다.
도 5는 본 발명의 실시예에 따른 1+1+M 고가용성 클러스터 시스템에서 부 노드의 장애 또는 부재시에 따른 클러스터 시스템 구성 예를 도시한 도면이다.
도시된 바와 같이, 부 노드(200)에 장애가 발생하거나 주 노드(100)의 장애 발생 이후 부 노드(200)가 주 노드(100)의 역할을 수행할 경우, 부 노드(200)의 역할을 수행하는 노드는 부재하게 된다.
부 노드(200)를 감시하는 M개의 백업 노드(300-1,300-2,...,300-N)들은 부 노드(200)가 없음을 감지하여 비대칭적 1+M 고가용성 클러스터 시스템과 같이 부 노드의 역할을 수행할 노드를 M개의 백업 노드(300-1,300-2,...,300-N)들 중에서 선출하고, 선출된 노드는 부 노드의 역할을 수행한다.
도 6은 본 발명의 실시예에 따른 고가용성 클러스터 시스템의 계층적 다중 백업 장치를 이용한 고가용성 구현 방법을 도시한 흐름도이다.
도시된 바와 같이, 각 클러스터 노드에 설치된 고가용성 관리가 시작되면, 각 클러스터 노드들(100,200,300-1,300-2,...,300-N)의 고가용성 관리부(120,220,320-1,320-2,...,320-N)들은 클러스터 멤버쉽을 구성한다(S110).
클러스터 멤버쉽이 구성되면, 고가용성 관리부(120,220,320-1,320-2,...,320-N)들은 구성된 클러스터 멤버쉽을 기반으로 클러스터 노드들(100,200,300-1,300-2,...,300-N) 중에서 서비스를 제공할 주 노드와 주 노드를 감시하는 부 노드를 선출한다(S120,S130).
본 실시예에서 고가용성 관리부(120,220,320-1,320-2,...,320-N)들은 클러스터 노드들(100,200,300-1,300-2,...,300-N) 내 동기화된 시간을 기반으로 해당 고가용성 관리부가 구동된 시간을 순서로, 주 노드와 부 노드를 선출한다. 이때 선출된 부 노드(200)는 주 노드(100)의 장애 여부를 모니터링한다(S134)
클러스터 노드들(100,200,300-1,300-2,...,300-N) 중에서 주 노드와 부 노드로 선출되지 않은 클러스터 노드들은 부 노드를 감시하는 백업 노드로서 역할을 수행한다(S150).
주 노드(100)와 부 노드(200)는 자신의 시스템에 장애가 없음을 알리는 방법으로 일정주기로 하트비트에 자신의 상태 정보를 담아 메시지를 발생시킨다(S122,S132). 부 노드(200)는 주 노드(100)와의 통신 부하 및 처리 오버헤드를 제거하기 위해 하트비트 메시지의 발생을 중지 요청할 수 있다. 이에 따라, 하트비트 메시지의 발생 종료 신호가 수신되면(S124), 주 노드(100)의 고가용성 관리부(120)는 하트 비트 메시를 발생하여 부 노드(200)에게 전송하는 동작을 종료한다.
또한, 다수의 백업 노드들(300-1,300-2,...,300-N)은 네트워크 부하 및 처리 오버헤드를 제거하기 위해 하트비트 메시지 발생을 중지 요청할 수 있다.
서비스를 제공하던 주 노드(100)에 장애가 발생할 경우(136), 주 노드(100)를 감시하던 부 노드(200)는 이를 인지하고 즉시 페일 오버하여(S139) 주 노드로써의 역할을 수행한다. 이러한 방법은 1+1 고가용성 클러스터 시스템과 같이 서비스 지연 시간을 최소화 할 수 있다.
주 노드(100)의 장애가 발생하여 부 노드(200)가 주 노드의 역할을 수행할 경우 또는 주 노드(100)를 감시하던 부 노드(200)에 장애가 발생할 경우(S160), 부 노드(200)를 감시하던 M개의 백업노드들(300-1,300-2,...,300-N)은 클러스터 멤버쉽을 구성한다(S170). 이후 M개의 백업노드들(300-1,300-2,...,300-N)은 구성된 클러스터 멤버쉽을 기반으로 부 노드를 선출하게 된다(S130).
부 노드 선출이 끝나면, 선출된 부 노드만이 하트비트 메시지를 발생시킨다. 이와 같이, 주 노드에 장애가 발생하여 부 노드를 선출하는 과정은 주 노드에 영향을 주지 않음으로 서비스 지연은 발생하지 않는다.
한편 M개의 백업노드들(300-1,300-2,...,300-N)로부터 하트비트 메시지 발생을 중지 요청이 있으면(S138), 부 노드(200)는 하트비트 메지지의 전송을 중지한다. 이후 M개의 백업노드들(300-1,300-2,...,300-N)은 하트비트 메시지의 전송 종료 신호가 수신되면(S190), 부 노드(200)의 장애 모니터링 동작을 종료한다.
이상에서는 본 발명에서 특정의 바람직한 실시예에 대하여 도시하고 또한 설명하였다. 그러나 본 발명은 상술한 실시예에 한정되지 아니하며, 특허 청구의 범위에서 첨부하는 본 발명의 요지를 벗어남이 없이 당해 발명이 속하는 기술 분야에서 통상의 지식을 가진 자라면 누구든지 다양한 변형 및 균등한 타 실시가 가능할 것이다. 따라서 본 발명의 진정한 기술적 보호범위는 첨부한 특허청구범위에 의해서만 정해져야 할 것이다.
상술한 본 발명에 따르면, 다수의 서비스 노드를 가지는 클러스터 시스템에서 신뢰성 있는 서비스를 제공하기 위해 계층적 다중 백업 노드로 고가용성 클러스터 시스템을 구성함으로써, 서비스를 지원하는 시스템으로서의 신뢰도를 향상시키고, 서비스 노드가 증가해도 처리 비용이 증가하지 않는 계층적 다중 백업 고가용성 클러스터 시스템의 효율적인 구성으로 요청된 서비스를 보다 신속하게 제공할 수 있다. 또한 본 발명의 계층적 다중 백업 구성을 갖는 고가용성 클러스터 시스템은 기존의 낮은 고가용성과 긴 오류회복 시간을 개선함으로써, 보다 효율적인 가용성을 제공할 수 있다.
또한, 본 발명은 클러스터 시스템을 기반으로 계층적 다중 백업을 구성하여 고가용성을 처리하기 위해 클러스터 시스템 내에서 서비스를 일원화된 중앙 집중 관리 형태로 수행하고 고가용성 관리부가 탑재되어 있는 주 노드에 장애가 발생할 경우 다른 노드가 이를 감지하여 장애가 발생한 서버에서 제공하던 관리 서비스를 대신 제공함으로써, 지속적으로 서비스를 제공하는 고가용성 시스템에서 본 장치인 계층적 다중 백업 노드를 구성하여 보다 높은 가용성을 제공하여 오류 발생시 즉시 오류 회복을 통해 지속적인 서비스를 제공하고 클러스터 노드의 수가 증가해도 처리 비용이 증가하지 않도록 효율성을 향상시킬 수 있다.

Claims (17)

  1. 구성된 클라이언트 멤버쉽의 노드들에게 서비스를 제공하고, 자신의 동작 상태 정보를 출력하는 액티브 노드인 주 노드;
    상기 주 노드의 백업 노드로서 상기 주 노드로부터 제공되는 서비스를 제공 받아 출력하고 상기 주 노드의 장애를 감시하며, 자신의 동작 상태 정보를 출력하는 부 노드; 및
    상기 주 노드로부터 상기 부 노드를 거처 출력되는 서비스를 제공 받고, 상기 부 노드의 장애를 감시하는 적어도 하나의 백업 노드를 포함하는 것을 특징으로 하는 고가용성 클러스터 시스템.
  2. 제 1항에 있어서,
    상기 주 노드는 1개, 상기 부 노드는 1개, 및 상기 백업 노드는 M(M=1,2,..,N)개로 구성되는 1+1+M 구조를 갖는 것을 특징으로 하는 고가용성 클러스터 시스템.
  3. 제 2항에 있어서,
    상기 주 노드, 부 노드, 및 백업 노드들은 클러스터 내에 고가용성 구현을 위한 동작이 시작되면, 일정 시간 동안 하트비트 메시지를 발생시켜 클러스터 멤버쉽을 구성하는 것을 특징으로 하는 고가용성 클러스터 시스템.
  4. 삭제
  5. 제 1항에 있어서,
    상기 주 노드 및 부 노드는 일정 주기로 하트비트 메시지를 발생시킴으로써 자신이 정상 작동함을 다른 노드들에게 알려주는 것을 특징으로 하는 고가용성 클러스터 시스템.
  6. 제 5항에 있어서,
    상기 부 노드는 상기 주 노드로부터 상기 하트비트 메시지를 일정 시간 동안 받지 못한 경우, 상기 주 노드의 동작 장애로 판단하는 것을 특징으로 하는 고가용 성 클러스터 시스템.
  7. 제 6항에 있어서,
    상기 부 노드는 상기 주 노드에 동작 장애가 발생하면, 상기 주 노드에서 제공한 서비스를 재시작하기 위한 작업을 수행하고 자신이 주 노드의 기능을 수행하는 것을 특징으로 하는 고가용성 클러스터 시스템.
  8. 제 5항에 있어서,
    상기 백업 노드들은 상기 부 노드로부터 상기 하트비트 메시지를 일정 시간 동안 받지 못한 경우, 상기 부 노드의 동작 장애로 판단하는 것을 특징으로 하는 고가용성 클러스터 시스템.
  9. 제 8항에 있어서,
    상기 백업 노드들은 상기 부 노드에 동작 장애가 발생하면, 클러스터 멤버쉽을 구성하여 새로운 부 노드를 선출하는 것을 특징으로 하는 고가용성 클러스터 시스템.
  10. 제 1 항에 있어서,
    상기 주 노드, 부 노드, 및 백업 노드들은 클러스터 내 노드들의 동기화된 시간을 기반으로 각 노드들에 구비된 고가용성 관리부가 구동한 시간을 기반으로 가장 먼저 구동한 고가용성 관리부를 갖는 순서에 기초하여 주 노드 및 부 노드를 선출하는 것을 특징으로 하는 고가용성 클러스터 시스템.
  11. 클러스터 내에 고 가용성 구현이 시작하면, 모든 클러스터 노드들이 일정 시간 동안 하트비트 메시지를 발생시켜 클러스터 멤버쉽을 구성하는 단계;
    상기 구성된 클러스터 멤버쉽을 기반으로 상기 노드들이 서비스를 제공할 주 노드를 선출하고, 상기 주 노드의 장애를 감시할 부 노드를 선출하며, 나머지 노드들은 백업 노드 기능을 수행하는 단계;
    상기 주 노드가 상기 구성된 클라이언트 멤버쉽의 노드들에게 서비스를 제공하고 자신의 동작 상태 정보를 출력하는 단계;
    상기 부 노드가 상기 주 노드로부터 제공되는 서비스를 제공 받아 출력하고 상기 주 노드의 장애를 감시하며, 자신의 동작 상태 정보를 출력하는 단계;
    상기 백업 노드들이 상기 주 노드로부터 상기 부 노드를 거처 출력되는 서비스를 제공 받고, 상기 부 노드의 장애를 감시하는 단계;
    상기 부 노드가 상기 주 노드의 장애 발생시, 자신이 상기 주 노드의 기능을 수행하는 단계; 및
    상기 백업 노드들이 상기 백업 노드들 중에서 새로운 부 노드를 선출하는 단계를 포함하는 것을 특징으로 하는 고가용성 클러스터 시스템의 고가용성 구현 방법.
  12. 제 11항에 있어서,
    상기 주 노드 및 부 노드의 동작 상태 정보는 일정 주기로 하위 노드에게 출력되는 하트비트 메시지인 것을 특징으로 하는 고가용성 클러스터 시스템의 고가용성 구현 방법.
  13. 제 12항에 있어서,
    상기 부 노드가 상기 주 노드로부터 상기 하트비트 메시지를 일정 시간 동안 받지 못한 경우, 상기 주 노드의 동작 장애로 판단하는 것을 특징으로 하는 고가용성 클러스터 시스템의 고가용성 구현 방법.
  14. 제 12항에 있어서,
    상기 백업 노드들이 상기 부 노드로부터 상기 하트비트 메시지를 일정 시간 동안 받지 못한 경우, 상기 부 노드의 동작 장애로 판단하는 것을 특징으로 하는 고가용성 클러스터 시스템의 고가용성 구현 방법.
  15. 제 11항에 있어서,
    상기 구성된 클러스터 멤버쉽을 기반으로 상기 노드들이, 클러스터 내 상기 노드들의 동기화된 시간을 기반으로 각 노드들에 구비된 고가용성 관리부가 구동한 시간을 기반으로 가장 먼저 구동한 고가용성 관리부를 갖는 순서에 기초하여 상기 주 노드 및 상기 부 노드를 선출하는 것을 특징으로 하는 고가용성 클러스터 시스템의 고가용성 구현 방법.
  16. 제 11항에 있어서,
    상기 부 노드가 상기 주 노드의 기능을 수행하는 단계는,
    상기 부 노드가 상기 주 노드의 장애 발생시, 상기 부 노드에 구비된 고가용성 관리부를 복구하는 단계; 및
    상기 부 노드가 상기 장애가 발생한 주 노드의 역할을 이임하는 단계를 포함하는 것을 특징으로 하는 고가용성 클러스터 시스템의 고가용성 구현 방법.
  17. 제 11항에 있어서,
    상기 새로운 부 노드를 선출하는 단계는,
    상기 백업 노드들이 부 노드의 장애 발생시, 상기 백업 노드들 중에서 새로운 부 노드를 선출하는 단계;
    상기 선출된 새로운 부 노드가 구비된 고가용성 관리부를 복구하는 단계; 및
    상기 새로 선출된 부 노드가 상기 주 노드의 역할을 이임하는 단계를 포함하는 것을 특징으로 하는 고가용성 클러스터 시스템의 고가용성 구현 방법.
KR1020060124883A 2006-12-08 2006-12-08 계층적 다중 백업 구조를 갖는 고가용성 클러스터 시스템및 이를 이용한 고가용성 구현 방법 KR100832543B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020060124883A KR100832543B1 (ko) 2006-12-08 2006-12-08 계층적 다중 백업 구조를 갖는 고가용성 클러스터 시스템및 이를 이용한 고가용성 구현 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020060124883A KR100832543B1 (ko) 2006-12-08 2006-12-08 계층적 다중 백업 구조를 갖는 고가용성 클러스터 시스템및 이를 이용한 고가용성 구현 방법

Publications (1)

Publication Number Publication Date
KR100832543B1 true KR100832543B1 (ko) 2008-05-27

Family

ID=39665293

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020060124883A KR100832543B1 (ko) 2006-12-08 2006-12-08 계층적 다중 백업 구조를 갖는 고가용성 클러스터 시스템및 이를 이용한 고가용성 구현 방법

Country Status (1)

Country Link
KR (1) KR100832543B1 (ko)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101447024B1 (ko) * 2013-03-20 2014-10-07 국방과학연구소 서비스 기반의 무기체계용 분산식 다계층 시스템의 고장 복구 방법
KR101558047B1 (ko) 2013-09-09 2015-10-06 삼성에스디에스 주식회사 클러스터 시스템 및 클러스터 시스템에서 서비스 가용성을 제공하기 위한 방법
KR102327520B1 (ko) 2021-06-04 2021-11-17 주식회사 한성정보시스템 무중단 네트워크 미러링 솔루션 시스템 및 그 방법

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004192482A (ja) 2002-12-13 2004-07-08 Hitachi Ltd バックアップを特定するクラスタ型計算機システム及びクラスタ型ストレージシステム
US20050108593A1 (en) 2003-11-14 2005-05-19 Dell Products L.P. Cluster failover from physical node to virtual node

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004192482A (ja) 2002-12-13 2004-07-08 Hitachi Ltd バックアップを特定するクラスタ型計算機システム及びクラスタ型ストレージシステム
US20050108593A1 (en) 2003-11-14 2005-05-19 Dell Products L.P. Cluster failover from physical node to virtual node

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101447024B1 (ko) * 2013-03-20 2014-10-07 국방과학연구소 서비스 기반의 무기체계용 분산식 다계층 시스템의 고장 복구 방법
KR101558047B1 (ko) 2013-09-09 2015-10-06 삼성에스디에스 주식회사 클러스터 시스템 및 클러스터 시스템에서 서비스 가용성을 제공하기 위한 방법
US9575785B2 (en) 2013-09-09 2017-02-21 Samsung Sds Co., Ltd. Cluster system and method for providing service availability in cluster system
KR102327520B1 (ko) 2021-06-04 2021-11-17 주식회사 한성정보시스템 무중단 네트워크 미러링 솔루션 시스템 및 그 방법

Similar Documents

Publication Publication Date Title
US6859889B2 (en) Backup system and method for distributed systems
US7370223B2 (en) System and method for managing clusters containing multiple nodes
US6658595B1 (en) Method and system for asymmetrically maintaining system operability
US6928589B1 (en) Node management in high-availability cluster
US6594776B1 (en) Mechanism to clear MAC address from Ethernet switch address table to enable network link fail-over across two network segments
US20140095925A1 (en) Client for controlling automatic failover from a primary to a standby server
JP4695705B2 (ja) クラスタシステムおよびノード切り替え方法
JP6724998B2 (ja) サーバ装置、クラスタシステム、クラスタ制御方法およびプログラム
US9164864B1 (en) Minimizing false negative and duplicate health monitoring alerts in a dual master shared nothing database appliance
WO2019128670A1 (zh) 用于在分布式系统中使管理能力自恢复的方法和装置
JP2006079603A (ja) 高可用性クラスタ化のためのスマートカード
CN110704250B (zh) 一种分布式系统的热备份装置
KR100832543B1 (ko) 계층적 다중 백업 구조를 갖는 고가용성 클러스터 시스템및 이를 이용한 고가용성 구현 방법
JP2005301436A (ja) クラスタシステムおよびクラスタシステムにおける障害回復方法
CN107071189A (zh) 一种通讯设备物理接口的连接方法
KR20030048503A (ko) 이중화 서버 구조의 데이터 동기화를 위한 통신 시스템 및방법
CN114301763B (zh) 分布式集群故障的处理方法及系统、电子设备及存储介质
CN102638369B (zh) 一种主备倒换的仲裁方法、装置和系统
US7210069B2 (en) Failure recovery in a multiprocessor configuration
JP2000330814A (ja) 二重化サーバシステム
JPH07319836A (ja) 障害監視方式
JP2005258947A (ja) 2重化システム及び多重化制御方法
US20140297724A1 (en) Network element monitoring system and server
JPH05304528A (ja) 多重化通信ノード
CN112328375B (zh) 一种用于跟踪分布式系统的数据片段的关联方法和装置

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20130424

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20140430

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20150601

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20170712

Year of fee payment: 10

FPAY Annual fee payment

Payment date: 20180313

Year of fee payment: 11