KR20050087182A - 이중화 장치 및 그 운용방법 - Google Patents

이중화 장치 및 그 운용방법 Download PDF

Info

Publication number
KR20050087182A
KR20050087182A KR1020040012856A KR20040012856A KR20050087182A KR 20050087182 A KR20050087182 A KR 20050087182A KR 1020040012856 A KR1020040012856 A KR 1020040012856A KR 20040012856 A KR20040012856 A KR 20040012856A KR 20050087182 A KR20050087182 A KR 20050087182A
Authority
KR
South Korea
Prior art keywords
node
active
backup data
standby
nodes
Prior art date
Application number
KR1020040012856A
Other languages
English (en)
Inventor
오수열
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Priority to KR1020040012856A priority Critical patent/KR20050087182A/ko
Publication of KR20050087182A publication Critical patent/KR20050087182A/ko

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L1/00Arrangements for detecting or preventing errors in the information received
    • H04L1/22Arrangements for detecting or preventing errors in the information received using redundant apparatus to increase reliability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery

Abstract

본 발명은 시스템의 이중화 장치에 관한 것으로, 정상적인 서비스를 제공하는 복수의 액티브 노드들과, 상기 복수의 액티브 노드들의 각각과 쌍을 이루며, 상기 복수의 액티브 노드들의 비정상상태에 대비하기 위해 대기하는 복수의 스탠바이 노드들과, 상기 액티브 노드로부터 이중화 절체에 필요한 백업데이터를 수신하여 저장하고, 상기 액티브 노드들중 어느 하나에서 장애가 발생하여 해당 스탠바이 노드로부터 백업데이터 요청이 수신될시 상기 장애가 발생한 액티브 노드의 백업데이터를 상기 스탠바이 노드로 전달하는 보관 노드를 포함하며, 상기 스탠바이 노드는 상기 보관 노드로부터의 백업 데이터를 이용해서 액티브 노드로 천이하는 것을 특징으로 한다. 이와 같은 본 발명은 이중화 절체 시간이 어느 정도 보장된 시스템에서 보다 비용을 적게 소모하면서 보다 안정적으로 시스템을 운용할수 있는 이점이 있다.

Description

이중화 장치 및 그 운용방법{DUPLICATED SYSTEM AND OPERATING METHOD THEREOF}
본 발명은 이중화된 시스템에 관한 것으로, 특히 이중화 절체에 필요한 백업데이터를 별도로 보관하기 위한 장치 및 방법에 관한 것이다.
일반적으로 시스템 장비는, 각각 정해지고 할당된 기능을 수행하는 회로보드(Circuit Board)가 다수 모여서 이루어지게 되고, 상기 각각의 회로보드는 기능부별로 구분되는 동시에, 상기 기능부별로 각 회로보드를 감시하고 제어하는 프로세서 또는 프로세서 보드가 필요하므로, 상기의 기능부가 다수인 경우 다수의 프로세서 보드가 필요하다.
상기와 같은 시스템 장비는, 프로세서 보드와 같이, 시스템의 운용에 있어서 장애가 발생하는 경우 치명적인 영향을 주는 것을 이중화하고, 장애 발견 즉시 정상적인 해당 회로보드로 절체하여 대체 운용함으로써 언제나 정상 운용이 되도록 한다.
도 1은 종래기술에 따른 이중화된 시스템의 구성을 보여주고 있다.
도 1을 참조하면, 종래기술에 의한 이중화된 시스템은, 제어부의 제어하에 해당 시스템의 현재 운용중인 데이터를 저장하는 메모리를 구비하며, 현재 활성화 상태로 운용중인 액티브 노드(101)와, 제어부의 제어하에 해당 시스템의 현재 운용중인 데이터의 일부를 저장하는 메모리를 구비하며, 현재 대기 상태로 운용중인 스탠바이 노드(102)를 포함하여 구성된다.
상기와 같은 이중화된 시스템은, 액티브 노드(101)의 장애에 대비하여 상기 액티브 보드(101)의 중요한 이벤트(event) 발생시 상기 이벤트에 대한 정보(백업 데이터)를 스탠바이 노드(102)로 제공하게 된다. 즉, 종래기술에 따르면, 매 이벤트마다 수행되는 복잡한 알고리즘이 액티브 노드(101) 및 스탠바이 노드(102) 양단간에 구현되어야 하고, 무엇보다 상기 스탠바이 노드(102)는 항상 일정한 정도의 시스템 자원(예: CPU 부하, 메모리 등)을 점유해야 한다.
도 2는 종래기술에 따른 이중화된 시스템에서 이중화 절체를 수행하기 위한 절차를 도시하고 있다.
도 2를 참조하면, 액티브 노드(101)에서 이벤트-1이 발생하면(201단계), 액티브 노드(101)는 203단계에서 스탠바이 노드(102)로 상기 이벤트-1을 통보한다. 그러면, 상기 스탠바이 노드(102)는 205단계에서 상기 이벤트-1에 대한 프로세싱(processing)을 수행한다. 이후, 상기 액티브 노드(101)에서 이벤트-2가 발생하면(207단계), 상기 액티브 노드(101)는 209단계에서 상기 스탠바이 노드(102)로 상기 이벤트-2를 통보한다. 그러면, 상기 스탠바이 노드(102)는 211단계에서 상기 이벤트-2에 대한 프로세싱을 수행한다.
상기와 같은 과정 수행중에, 상기 액티브 노드(101)에서 장애 이벤트가 발생하면(213단계), 상기 액티브 노드(101)는 215단계에서 상기 스탠바이 노드(102)로 상기 장애 이벤트를 통보한다. 그러면, 상기 스탠바이 노드(102)는 217단계에서 액티브 노드로 천이하는 프로세싱을 수행한다.
상기와 같은 과정은 모든 액티브/스탠바이 노드 쌍에서 수행되어야 한다. 액티브 노드가 많은 시스템에서는 마찬가지로 스탠바이 노드도 많게 되며, 이러한 처리에 따른 비용도 증가하게 된다.
상기한 바와 같이, 종래기술에 따르면, 백업을 위해 많은 자원(예 : CPU 부하, 메모리 등)이 평소에 고려되어야 하고, 백업을 위한 복잡한 알고리즘이 양단간에 구현되어야 하는 문제점이 있다. 즉, 이중화를 위해 너무 많은 비용을 지불해야 하는 문제점이 있다.
따라서 본 발명의 목적은 이중화된 시스템에서 이중화를 위한 비용을 최소화하기 위한 장치 및 방법을 제공함에 있다.
본 발명의 다른 목적은 이중화된 시스템에서 스탠바이 노드가 지불해야 하는 비용을 최소화하기 위한 장치 및 방법을 제공함에 있다.
본 발명의 또 다른 목적은 이중화된 시스템에서 이중화 절체에 필요한 백업데이터를 별도로 보관하기 위한 장치 및 방법을 제공함에 있다.
상기 목적들을 달성하기 위한 본 발명의 제1견지에 따르면, 시스템의 이중화 장치에 있어서, 정상적인 서비스를 제공하는 복수의 액티브 노드들과, 상기 복수의 액티브 노드들의 각각과 쌍을 이루며, 상기 복수의 액티브 노드들의 비정상상태에 대비하기 위해 대기하는 복수의 스탠바이 노드들과, 상기 액티브 노드로부터 이중화 절체에 필요한 백업데이터를 수신하여 저장하고, 상기 액티브 노드들중 어느 하나에서 장애가 발생하여 해당 스탠바이 노드로부터 백업데이터 요청이 수신될시 상기 장애가 발생한 액티브 노드의 백업데이터를 상기 스탠바이 노드로 전달하는 보관 노드를 포함하며, 상기 스탠바이 노드는 상기 보관 노드로부터의 백업 데이터를 이용해서 액티브 노드로 천이하는 것을 특징으로 한다.
상기 목적들을 달성하기 위한 본 발명의 제2견지에 따르면, 복수의 액티브/스탠바이 노드 쌍들을 포함하는 이중화된 시스템에서 이중화 절체 방법에 있어서, 상기 액티브 노드들이, 미리 지정된 이벤트 발생시, 이중화 절체에 필요한 백업데이터를 보관 노드로 전달하는 과정과, 상기 보관 노드가, 상기 액티브 노드들로부터 수신되는 백업데이터를 메모리에 저장하는 과정과, 상기 액티브 노드들중 어느 하나에서 장애가 발생하여 해당 스탠바이 노드로부터 백업데이터 요청이 수신될시, 상기 보관 노드가, 상기 장애가 발생한 액티브 노드의 백업데이터를 상기 스탠바이 노드로 전달하는 과정과, 상기 스탠바이 노드가, 상기 보관 노드로부터의 백업데이터를 이용해서 액티브 노드로 천이하는 과정을 포함하는 것을 특징으로 한다.
이하 본 발명의 바람직한 실시 예를 첨부된 도면의 참조와 함께 상세히 설명한다. 본 발명을 설명함에 있어서, 관련된 공지기능 혹은 구성에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단된 경우 그 상세한 설명은 생략한다.
이하 본 발명은 이중화된 시스템에서 이중화 절체에 필요한 백업데이터를 별도의 노드에서 보관하기 위한 방안에 대해 설명할 것이다.
본 발명은 아래와 특성을 갖는 시스템에 적용될 수 있다.
첫째, 정상적인 상태에서 서비스를 제공하는 노드(액티브 노드)가 있고, 비정상적인 상태를 대비하여 대기하는 노드(스탠바이 노드)가 있는 시스템.
둘째, 스탠바이 노드가 대기하기 위한 시스템의 비용(예 : CPU 부하)이 많은 소모되는 시스템.
셋째, 비정상적인 상황 발생시, 스탠바이 노드가 액티브 노드로 천이할 때 소요되는 시간이 어느 정도 충분한 시스템.
이하 설명에서 '액티브 노드'는 필요한 기능 및 각종 자원(CPU, 메모리)이 할당되어 서비스가 제공되는 노드를 의미한다.
또한, '스탠바이 노드'는 액티브 노드의 비정상상태에 대비하기 위해서 최소한의 자원만을 준비하고 있는 노드를 의미한다.
한편, '보관 노드'는 스탠바이 노드에서 액티브 노드로 변경될 때 필요한 백업데이터를 저장하는 노드를 의미한다.
도 3은 본 발명의 실시 예에 따른 이중화된 시스템의 구성을 도시하고 있다.
도시된 바와 같이, 본 발명에 따른 이중화된 시스템은, 복수의 액티브 노드(201)들, 복수의 스탠바이 노드(202)들 및 보관(Repository) 노드(203)를 포함하여 구성된다. 이와 같이 복수의 액티브/스탠바이 쌍들이 구비되며, 본 발명에 따라 이중화 절체에 필요한 데이터를 백업하기 위한 보관 노드가 구비되는 것을 특징으로 한다.
도 3을 참조하면, 먼저 액티브 노드(201)는 정상적인 서비스를 제공하며, 지정된 이벤트 발생시 이중화 절체에 필요한 데이터를 상기 보관 노드(203)로 전달한다. 상기 보관 노드(203)는 상기 액티브 노드(201)로부터 전달받은 데이터를 저장하며, 액티브 노드(201)에서 장애가 발생하여 스탠바이 노드(202)로부터 데이터 요청이 수신되면, 상기 저장된 데이터를 상기 스탠바이 노드(202)로 전달한다. 상기 스탠바이 노드(202)는 별도의 이중화 감지 기능에 액티브 노드의 역할을 하도록 요청을 받으면 이 요청이 수신되는 순간 상기 보관 노드(203)로 백업데이터를 요청한다. 이후, 상기 보관 노드(203)로부터 백업 데이터가 수신되면, 상기 백업 데이터를 이용해서 액티브 노드(201)로 절체한다. 여기서, 상기 액티브 노드(201), 스탠바이 노드(202) 및 보관 노드는 예를들어 이데넷(Ethernet)을 통해 통신할 수 있다.
도 4는 본 발명의 실시 예에 따른 이중화된 시스템에서 이중화 절체를 수행하기 위한 절차를 도시하고 있다.
도 4를 참조하면, 제1 액티브 노드(201-1)에서 특정 이벤트가 발생하면(401단계), 상기 제1 액티브 노드(201-1)는 403단계에서 보관 노드(203)로 상기 이벤트를 통보한다. 그러면, 상기 보관 노드(203)는 405단계에서 상기 이벤트에 대한 백업데이터(backup data)를 메모리에 저장한다. 이후, 제2 액티브 노드(201-2)에서 특정 이벤트가 발생하면(407단계), 상기 제2 액티브 노드(201-2)는 409단계에서 상기 보관 노드(203)로 상기 이벤트를 통보한다. 그러면, 상기 보관 노드(103)는 411단계에서 상기 이벤트에 대한 백업데이터를 메모리를 저장한다.
이후, 상기 제1액티브 노드(201-1)에서 다시 특정 이벤트가 발생하면(413단계), 상기 제1 액티브 노드(201-1)는 415단계에서 상기 보관 노드(203)로 상기 이벤트를 통보한다. 그러면, 상기 보관 노드(203)는 417단계에서 상기 이벤트에 대한 백업데이터를 메모리에 저장한다. 이후, 상기 제2 액티브 노드(201-2)에서 다시 특정 이벤트가 발생하면(419단계), 상기 제2 액티브 노드(201-2)는 421단계에서 상기 보관 노드(203)로 상기 이벤트를 통보한다. 그러면, 상기 보관 노드(203)는 422단계에서 상기 이벤트에 대한 백업데이터를 메모리에 저장한다. 이와 같이, 액티브 노드는 지정된 이벤트 발생때마다 이중화 절체에 필요한 데이터를 상기 보관 노드(203)로 백업한다.
상기와 같은 과정 수행중에, 상기 제1 액티브 노드(201-1)에서 장애 이벤트가 발생하면(423단계), 상기 제1 액티브 노드(201-1)는 425단계에서 상기 스탠바이 노드(202)로 상기 장애 이벤트를 통보한다. 상기 액티브 노드의 장애는 상기와 같이 액티브 노드에서 스탠바이 노드로 직접 통보될 수도 있고, 별도의 프로세서에서 상기 스탠바이 노드로 통보될 수도 있으며, 상기 스탠바이 노드에서 자체적으로 감지할수도 있다.
상기 제1 액티브 노드(201-1)의 장애가 검출되면, 제1 스탠바이 노드(202-1)는 427단계에서 상기 보관 노드(203)로 상기 제1 액티브 노드(201-1)에 대한 백업 데이터를 요청한다. 그리고, 상기 보관 노드(203)는 429단계에서 상기 제1 액티브 노드(201-1)에 대한 백업 데이터를 메모리로부터 독출해서 상기 제1 스탠바이 노드(202-1)로 전달한다. 그러면, 상기 제1 스탠바이 노드(202-1)는 431단계에서 액티브 노드로 천이하기 위한 프로세싱을 수행한다.
상술한 바와 같이, 본 발명은 다수의 액티브 노드/스탠바이 노드 쌍들이 존재하며 한 개의 집중화된 보관 노드가 존재한다. 액티브 노드에서 발생한 이벤트는 스탠바이 노드로 전달되지 않고 보관 노드에 전달되고 저장된다. 상기 액티브 노드들중 어느 하나에서 장애(fail)가 발생되어 서비스를 할 수 없는 상황이 발생되면, 이 정보가 검출되고 스탠바이 노드로 전달된다. 이때 상기 스탠바이 노드는 이중화 절체를 수행해야 한다고 판단하고 이에 필요한 데이터를 상기 보관 노드로 요청하며, 상기 보관 노드는 상기 데이터를 상기 스탠바이 노드로 전달한다. 그러면, 상기 스탠바이 노드는 액티브 노드로 동작하기 위한 프로세싱을 수행해서 액티브 노드로 천이한다.
한편 본 발명의 상세한 설명에서는 구체적인 실시 예에 관해 설명하였으나, 본 발명의 범위에서 벗어나지 않는 한도 내에서 여러 가지 변형이 가능함은 물론이다. 그러므로 본 발명의 범위는 설명된 실시 예에 국한되어 정해져서는 아니 되며 후술하는 특허청구의 범위뿐만 아니라 이 특허청구의 범위와 균등한 것들에 의해 정해져야 한다.
상술한 바와 같이, 본 발명은 이중화를 위한 시간제약이 크지 않는 시스템에서 한 단계의 절차를 더 추가하는 시스템을 제안하고 있다. 보관 노드(Repository node)를 통해서 기존에 스탠바이 노드가 수행한 일정부분의 비용(CPU 부하, 메모리 소요, 알고리즘 복잡성)을 분산하고 있다. 이러한 시스템은 이중화 절체 시간이 어느 정도 보장된 시스템에서 보다 비용을 적게 소모하면서 보다 안정적으로 시스템을 운용할수 있는 이점이 있다.
도 1은 종래기술에 따른 이중화된 시스템의 구성을 보여주는 도면.
도 2는 종래기술에 따른 이중화된 시스템에서 이중화 절체를 수행하기 위한 절차를 도시하는 도면.
도 3은 본 발명의 실시 예에 따른 이중화된 시스템의 구성을 도시하는 도면.
도 4는 본 발명의 실시 예에 따른 이중화된 시스템에서 이중화 절체를 수행하기 위한 절차를 도시하는 도면.

Claims (3)

  1. 시스템의 이중화 장치에 있어서,
    정상적인 서비스를 제공하는 복수의 액티브 노드들과,
    상기 복수의 액티브 노드들의 각각과 쌍을 이루며, 상기 복수의 액티브 노드들의 비정상상태에 대비하기 위해 대기하는 복수의 스탠바이 노드들과,
    상기 액티브 노드로부터 이중화 절체에 필요한 백업데이터를 수신하여 저장하고, 상기 액티브 노드들중 어느 하나에서 장애가 발생하여 해당 스탠바이 노드로부터 백업데이터 요청이 수신될시 상기 장애가 발생한 액티브 노드의 백업데이터를 상기 스탠바이 노드로 전달하는 보관 노드를 포함하며,
    상기 스탠바이 노드는 상기 보관 노드로부터의 백업 데이터를 이용해서 액티브 노드로 천이하는 것을 특징으로 하는 장치.
  2. 이중화된 시스템에서 이중화 절체 방법에 있어서,
    액티브 노드가, 미리 지정된 이벤트 발생시, 이중화 절체에 필요한 백업데이터를 보관 노드로 전달하는 과정과,
    상기 보관 노드가, 상기 액티브 노드로부터의 상기 백업데이터를 메모리에 저장하는 과정과,
    상기 액티브 노드의 장애에 의해 스탠바이 노드로부터 백업데이터 요청이 수신될시, 상기 보관 노드가, 상기 장애가 발생한 액티브 노드의 백업데이터를 상기 스탠바이 노드로 전달하는 과정과,
    상기 스탠바이 노드가, 상기 보관 노드로부터의 백업데이터를 이용해서 액티브 노드로 천이하는 과정을 포함하는 것을 특징으로 하는 방법.
  3. 복수의 액티브/스탠바이 노드 쌍들을 포함하는 이중화된 시스템에서 이중화 절체 방법에 있어서,
    상기 액티브 노드들이, 미리 지정된 이벤트 발생시, 이중화 절체에 필요한 백업데이터를 보관 노드로 전달하는 과정과,
    상기 보관 노드가, 상기 액티브 노드들로부터 수신되는 백업데이터를 메모리에 저장하는 과정과,
    상기 액티브 노드들중 어느 하나에서 장애가 발생하여 해당 스탠바이 노드로부터 백업데이터 요청이 수신될시, 상기 보관 노드가, 상기 장애가 발생한 액티브 노드의 백업데이터를 상기 스탠바이 노드로 전달하는 과정과,
    상기 스탠바이 노드가, 상기 보관 노드로부터의 백업데이터를 이용해서 액티브 노드로 천이하는 과정을 포함하는 것을 특징으로 하는 방법.
KR1020040012856A 2004-02-26 2004-02-26 이중화 장치 및 그 운용방법 KR20050087182A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020040012856A KR20050087182A (ko) 2004-02-26 2004-02-26 이중화 장치 및 그 운용방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020040012856A KR20050087182A (ko) 2004-02-26 2004-02-26 이중화 장치 및 그 운용방법

Publications (1)

Publication Number Publication Date
KR20050087182A true KR20050087182A (ko) 2005-08-31

Family

ID=37270499

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020040012856A KR20050087182A (ko) 2004-02-26 2004-02-26 이중화 장치 및 그 운용방법

Country Status (1)

Country Link
KR (1) KR20050087182A (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106856489A (zh) * 2015-12-08 2017-06-16 阿里巴巴集团控股有限公司 一种分布式存储系统的服务节点切换方法和装置
CN107291585A (zh) * 2016-03-31 2017-10-24 阿里巴巴集团控股有限公司 容灾方法及装置、服务器

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106856489A (zh) * 2015-12-08 2017-06-16 阿里巴巴集团控股有限公司 一种分布式存储系统的服务节点切换方法和装置
CN107291585A (zh) * 2016-03-31 2017-10-24 阿里巴巴集团控股有限公司 容灾方法及装置、服务器

Similar Documents

Publication Publication Date Title
US11194679B2 (en) Method and apparatus for redundancy in active-active cluster system
EP1437658B1 (en) Coordinating persistent status information with multiple file servers
US6134673A (en) Method for clustering software applications
US7076689B2 (en) Use of unique XID range among multiple control processors
US6859889B2 (en) Backup system and method for distributed systems
CN100470494C (zh) 集群可用性管理方法和系统
JP4481338B2 (ja) バックアップシステム、ストレージ装置及びデータのバックアップ方法
US7188237B2 (en) Reboot manager usable to change firmware in a high availability single processor system
US20040153624A1 (en) High availability synchronization architecture
JP4341571B2 (ja) 記憶装置システムおよびその制御方法、制御プログラム
US20080288812A1 (en) Cluster system and an error recovery method thereof
CN112477919B (zh) 一种适用于列车控制系统平台的动态冗余备份方法及系统
TW454128B (en) Shared disk type multiple system
JP2011253408A (ja) サーバシステム及びそのbios復旧方法
CN111585835A (zh) 一种带外管理系统的控制方法、装置和存储介质
US6618819B1 (en) Sparing system and method to accommodate equipment failures in critical systems
US8499080B2 (en) Cluster control apparatus, control system, control method, and control program
JP2006178659A (ja) フォールト・トレラント・コンピュータシステムと、そのための割り込み制御方法
JPH08320835A (ja) 外部バスの障害検出方法
US20140129865A1 (en) System controller, power control method, and electronic system
JP2006172243A (ja) フォルトトレラントコンピュータ装置およびその同期化方法
KR20030048503A (ko) 이중화 서버 구조의 데이터 동기화를 위한 통신 시스템 및방법
KR20050087182A (ko) 이중화 장치 및 그 운용방법
JP2007286952A (ja) サーバシステム、サーバ負荷低減方法
US7287187B2 (en) Method and apparatus for supplying redundant power

Legal Events

Date Code Title Description
WITN Withdrawal due to no request for examination