KR100604552B1

KR100604552B1 - 클러스터 시스템에서 상태 정보 및 제어 명령의 공유를통한 시스템 장애 대응방법

Info

Publication number: KR100604552B1
Application number: KR1020040007024A
Authority: KR
Inventors: 이지은
Original assignee: 엘지엔시스(주)
Priority date: 2004-02-03
Filing date: 2004-02-03
Publication date: 2006-07-28
Also published as: KR20050078931A

Abstract

본 발명은 클러스터 시스템에서 상태 정보 및 제어 명령 공유를 통해 시스템 장애에 효율적으로 대응하는 방법에 관한 것이다. 클러스터 시스템을 구성하는 노드들 중에 서비스 수행 노드에 랜 하트비트(LAN Heartbeat) 장애를 동반한 시스템 장애가 발생한 경우, 당해 노드에 대한 상태 정보 및 제어 명령을 공유 디스크에 저장하여, 정상수행중인 다른 노드가 상기 공유 디스크에 저장된 정보를 읽음으로써 원활하게 장애 발생중인 서비스를 인계받도록 한다. 이로써 특히 랜 하트비트 장애 발생시 서비스 상태 정보 파악의 정확성을 높일 수 있고 제어 명령 또한 정확하게 전달할 수 있으므로 서비스에 발생할 수 있는 모든 장애에 대한 대응이 가능해진다.

클러스터 시스템, 장애, 공유 디스크, 상태변화정보, 제어 명령

Description

클러스터 시스템에서 상태 정보 및 제어 명령의 공유를 통한 시스템 장애 대응방법 {Method for dealing with system troubles through joint-owning of state information and control commands}

도 1은 N개의 노드로 구성된 클러스터 시스템의 구조도.

도 2는 랜 하트비트(LAN Heartbeat)에 장애가 발생하고, 서비스를 구성하는 응용 프로그램에 장애가 발생한 경우의 종래 시스템 구조도.

도 3은 랜 하트비트(LAN Heartbeat)에 장애가 발생하고, 관리자가 서비스를 노드 1에서 노드 2로 이동하려고 하는 경우의 종래 시스템 구조도.

도 4는 랜 하트비트(LAN Heartbeat)에 장애가 발생하고, Public network에 장애가 발생한 경우의 종래 시스템 구조도.

도 5는 랜 하트비트(LAN Heartbeat)에 장애가 발생하고, 본 발명에 따라 상태 정보 및 제어 명령를 저장하는 공유디스크를 통해 이에 대응하는 시스템 구조도.

본 발명은 본 발명은 클러스터 시스템에서 상태 정보 및 제어 명령 공유를 통해 시스템 장애에 효율적으로 대응하는 방법에 관한 것이다.

클러스터 시스템은 상호 연결된 완전한 컴퓨터 시스템들의 집합으로 이루어져 있는 병렬 또는 분산된 형태의 시스템이며, 상기의 "완전한 컴퓨터"라 함은 독립적으로 사용 가능한 컴퓨터를 구성하는 일반 구성요소 즉, 하나 이상의 프로세서와, 허용 가능한 용량의 메모리와, 입/출력 설비 및 운영체제가 조합된 것을 의미한다.

이러한 클러스터 시스템은 클러스터 구성에 포함되는 노드가 동작 중에 장애가 발생하였을 경우, 장애 발생 노드의 상태 정보를 파악하여 장애 발생 노드에서 운영하던 작업을 클러스터 시스템 구성에 포함된 나머지 노드가 인계하는 방법으로 작업을 지속적으로 운영하여 서비스의 중지시간을 최소화한다. 즉, 클러스터 내의 한 노드의 동작이 셧다운되면 그 노드가 수리될 때까지 클러스터 내의 다른 노드들이 동작이 셧다운된 상기 노드의 임무를 자동으로 실행하므로, 사용자에 의한 고장시간(down time)이 없어 높은 가용성을 자랑한다.

상기 서비스는 서비스 운영에 필요한 네트워크(network), 파일 시스템(file system), 응용 프로그램(application)으로 구성되어 있으며, 클러스터 시스템에서는 노드 장애, 서비스 운영에 필요한 네트워크 장애, 응용 프로그램 장애를 감지하고 장애를 복구한다.

종래의 클러스터 시스템에서는 클러스터 시스템들을 구성하는 노드들 간에, 클러스터 시스템에서 수행되는 서비스에 관한 상태 정보와 제어 명령을 사설망(Private Network)으로 구성된 랜 하트비트(LAN Heartbeat)를 통해서만 주고받을 수 있도록 되어 있다. 클러스터 시스템에서 수행되는 서비스에 관한 상태 정보는 최신 상태 정보 갱신 시간, 서비스의 정상/비정상 상태, 서비스의 수행상태 변화정보가 있으며, 제어 명령은 노드들 간의 서비스 이동 명령, 동일 노드 내의 서비스 재수행 명령, 서비스 중지/재개 명령, 서비스 장애 발생시 인계 명령 등이 있다.

이러한 종래 시스템에서는 클러스터 시스템을 구성하는 노드들이 랜 하트비트(LAN Heartbeat)를 통해서만 서비스 상태 정보와 제어 명령을 주고받으므로, 랜 하트비트(LAN Heartbeat) 자체에 장애가 발생하면 서비스 상태 정보와 제어 명령을 주고받지 못하여 노드들은 각자 다른 노드들의 상태를 파악하지 못한다.

즉, 랜 하트비트에 장애가 발생한 노드들은 공중망(Public Network)과 공유 디스크 채널을 통하여 다른 노드들의 상태를 판단하게 되는데, 먼저 공중망(Public Network)을 통해 검사하여 해당 노드에서 응답이 있으면 해당 노드의 사설망(Private Network)에 장애가 발생한 경우로 판단하고, 응답이 없으면 다시 공유 디스크 채널을 통해 검사한다. 공유 디스크 채널을 통해 검사한 결과 해당 노드에서 응답이 있으면 해당 노드의 모든 네트워크에 장애가 발생한 경우로 판단하고, 응답이 없으면 노드다운 장애가 발생한 경우로 판단한다.

이와 같이 특정 노드의 랜 하트비트(LAN Heartbeat)에 장애가 발생하면 공중망(Public Network)과 공유 디스크 채널을 통해 해당 노드가 연결된 네트워크의 장애 여부 및 노드다운 장애의 발생 여부만을 파악할 수 있을 뿐, 해당 노드에서 수행하던 서비스의 상태 정보를 파악할 수 없었으므로 서비스 장애에 적절히 대응하지 못하거나, 관리자의 서비스 제어 명령을 수행하지 못하게 되거나, 상태 정보를 잘못 판단하는 문제점이 발생한다.

본 발명은 이러한 문제점을 해결하기 위해 고안된 것으로서, 클러스터 시스템을 구성하는 노드들 중에 서비스 수행 노드에 랜 하트비트(LAN Heartbeat) 장애를 동반한 시스템 장애가 발생한 경우, 당해 노드에 대한 상태 정보 및 제어 명령을 공유 디스크에 저장하여 정상수행중인 다른 노드와 공유케 함으로써 장애가 발생한 서비스가 원활하게 인계될 수 있도록 하는 방법을 제공하는 것을 목적으로 한다.

이러한 목적을 달성하기 위하여 본 발명은, 클러스터 시스템의 서비스 수행 중 랜 하트비트(LAN Heartbeat)에 장애가 발생한 경우에 상기 서비스의 최초 수행 노드(이하 "서비스 수행 노드"라 함)가 서비스에 대한 상태 정보를 수집하여, 이를 공유 디스크의 파일 시스템에 저장하는 제 1단계와, 상기 서비스 수행 노드에 제어 명령이 입력되는 경우, 그 제어 명령을 공유 디스크의 파일 시스템에 저장하는 제 2단계와, 서비스를 수행하지 않는 다른 노드(이하 "타 노드"라 함)중 일 노드가 상기 저장된 상태 정보를 읽어와서, 이로부터 서비스 상태를 판단하는 제 3단계와, 상기 상태정보로부터 서비스 상태가 비정상이라고 판단되면, 상기 저장된 제어 명령을 읽어와서, 이를 실행하는 제 4단계를 구비한다.

이 때, 서비스 수행 노드는 상태 정보와 제어 명령을 수집/저장하기 위한 파일 시스템을 읽기/쓰기 모드(read/write mode)로 마운트하고, 타 노드는 상기 상태 정보와 제어 명령을 전달받기 위한 파일 시스템을 읽기 모드(read mode)로 마운트하여야 한다.

그리고, 차후 랜 하트비트(LAN Heartbeat) 장애가 복구된 경우에는 상기 제 1단계 내지 제 4단계의 공유 디스크를 통한 상태 정보와 제어 명령 전달이 중단되고, 다시 랜 하트비트(LAN Heartbeat)를 통한 상태 정보와 제어 명령 전달이 개시된다.

상기 서비스에 대한 상태 정보는 서비스 운영에 필요한 네트워크, 파일 시스템, 응용 프로그램 전체에 대한 정상/비정상 상태 정보와 그 모두를 합한 서비스 단위의 정상/비정상 상태 정보 및 서비스의 수행상태 변화 정보를 포함하여 구성되고, 상기 제어 명령은 서비스 이동 명령, 서비스 인계 명령을 포함하여 구성된다.

이하, 도면을 참조하여 본 발명의 바람직한 실시예에 대하여 상세히 설명하되, 특히 도 1 에서 클러스터 시스템의 일반적 구조를 알아보고, 이에 의하는 경우의 문제점들을 도 2 내지 도 4에서 다시 한번 상세히 살펴본 후에 본 발명에 의한 문제점의 해결과정을 도 5에서 상세히 설명하도록 한다.

도 1은 N개의 노드로 구성된 전형적인 클러스터 시스템의 구조도이다.

서비스의 최초 수행 노드는 노드 1이며 서비스 인계순서는 노드 1 -> 노드 2라고 가정한다. 클러스터 시스템 수행을 위해 모든 노드에서 클러스터 데몬(데몬 1 ~ 데몬 N)를 수행하면, 노드들 중 서비스의 최초 수행 노드는 서비스를 수행하게 되고, 모든 서비스가 수행되고 난 후 모든 노드들은 각자 다른 노드들과 랜 하트비트(LAN Heartbeat)를 통해 서비스 상태 정보를 주고 받는다. 노드들은 서비스 상태 정보를 주고받으며 다른 노드에서 수행중인 서비스의 상태를 검사하여 장애를 감지하고, 장애가 발생하면 인계 순서에 따라 서비스를 인계하여 수행을 계속한다. 관리자의 서비스 제어 명령이 입력되면 해당 서비스를 관리하는 데몬에게 제어 명령을 전달하여 제어 명령을 수행한다.

이러한 수행과정 중에 랜 하트비트(LAN Heartbeat)에 장애가 발생하면 나머지 노드들은 해당 노드의 상태 정보를 수신하지 못하게 된다. 특정 노드의 상태 정보를 수신하지 못하게 되면 해당 노드의 장애를 감지하고 장애를 재검사한다. 장애를 재검사하는 순서는 공중망(Public Network)을 통한 검사 -> 공유 디스크 채널을 통한 검사의 순서이며 다음과 같이 장애를 판단한다.

1) 공중망(Public Network)을 통해 검사하여 해당 노드에서 응답이 있으면 해당 노드의 사설망(Private Network)에 장애가 발생한 경우로 판단하고 응답이 없으면 2)를 실행한다.

2) 서비스 인계 순서에 따라 공유 디스크 채널을 통해 검사가 가능한 노드에서는 공유 디스크 채널을 통해 검사하여 해당 노드에서 응답이 있으면 해당 노드의 모든 네트워크에 장애가 발생한 경우로 판단하고, 응답이 없으면 노드다운 장애가 발생한 경우로 판단한다.

즉, 랜 하트비트(LAN Heartbeat)에 장애가 발생하면 노드들은 공중망(Public Network)과 공유 디스크 채널을 통해 노드다운 장애 발생 여부만을 판단할 수 있으며, 다른 노드에서 수행중인 서비스의 상태 정보 변화를 감지하지 못하고, 관리자가 다른 노드에서 수행한 서비스 제어 명령을 수신하지 못해 그 명령을 수행하지 못한다.

이러한 상황에 해당하는 각 종류별 예가 아래 도 2 내지 도 4에서 도시된다. 따라서, 이하에서는 랜 하트비트(LAN Heartbeat) 장애를 동반한 각 시스템 장애 발생시의 시스템 대응과정과 그 대응에 있어서의 문제점을 짚어보도록 한다.

도 2는 랜 하트비트(LAN Heartbeat)에 장애가 발생하고, 서비스를 구성하는 응용 프로그램에 장애가 발생한 경우의 종래 시스템 구조도이다.

랜 하트비트(LAN Heartbeat)에 장애가 발생하고(①), 서비스를 구성하는 응용 프로그램에 장애가 발생하면(②), 노드 1의 데몬 1에서 응용 프로그램 장애를 감지하고 노드 2로의 서비스 인계를 위해 서비스 수행을 중지한다. 서비스 수행을 중지한 후 노드 2에게 랜 하트비트(LAN Heartbeat)를 통해 서비스 인계 명령을 전달하려고 시도하지만, 랜 하트비트(LAN Heartbeat)에 장애가 발생한 상태이므로 서비스 인계 명령이 전달되지 않는다(③).

도 3은 랜 하트비트(LAN Heartbeat)에 장애가 발생하고, 관리자가 서비스를 노드 1에서 노드 2로 이동하려고 하는 경우의 종래 시스템 구조도이다.

랜 하트비트(LAN Heartbeat)에 장애가 발생하고(①), 노드 1에서 관리자가 서비스를 노드 2로 이동시키기 위한 서비스 이동 명령을 입력하면(②), 데몬 1은 명령을 수신하여 서비스를 노드 2로 이동시키기 위해 서비스 수행을 중지한다. 서비스 수행을 중지한 후 노드 2에게 랜 하트비트(LAN Heartbeat)를 통해 서비스 이동 명령을 전달하려고 시도하지만, 랜 하트비트(LAN Heartbeat)에 장애가 발생하였으므로 서비스 이동 명령이 전달되지 않는다(③).

도 4는 랜 하트비트(LAN Heartbeat)에 장애가 발생하고, Public network에 장애가 발생한 경우의 종래 시스템 구조도이다.

서비스 운영에 필요한 네트워크가 공중망(Public Network)에 논리적 인터페이스(logical interface)로 구성된 경우, 랜 하트비트(LAN Heartbeat)에 장애가 발생하고(①), 공중망(Publick Network)에도 장애가 발생하면(②), 노드 1에서는 서비스 네트워크(Service Network) 장애로 인식하고 노드 2로의 서비스 인계를 위해 서비스 수행을 중지한다. 노드 2에서는 랜 하트비트(LAN Heartbeat)와 공중망에 장애가 발생하였으므로, 공유 디스크 채널을 통해 노드 1이 공유 디스크를 사용하는지의 여부를 검사한다(③). 노드 1은 서비스 수행을 중지하면서 공유 디스크를 사용하지 않으므로 노드 2는 노드 1에 장애가 발생하였다고 판단하고 서비스 인계를 시작한다(④). 이러한 경우 서비스는 인계되어 수행되지만, 실제로는 노드 1에 장애가 발생한 것이 아니라 노드 1의 모든 네트워크에 장애가 발생한 것이다.

도 5는 랜 하트비트(LAN Heartbeat)에 장애가 발생하고, 본 발명에 따라 상태 정보 및 제어 명령를 저장하는 공유디스크를 통해 이에 대응하는 시스템 구조도이다.

클러스터 시스템 수행을 위해 모든 노드에서 클러스터 데몬(데몬 1 ~ 데몬 N)을 수행하면 노드들 중 서비스의 최초 수행 노드는 서비스를 수행한다(①). 서비스를 수행한 노드는 공유 디스크를 통해 상태 정보와 제어 명령을 전달하기 위한 파일 시스템을 랜 하트비트(LAN Heartbeat)로 마운트하고, 서비스를 수행하지 않는 노드는 읽기 모드(read mode)로 마운트한다(②). 이 때, 각 서비스가 사용하는 공유 디스크으 파일 시스템은 중복될 수 없으며, 각 서비스는 자신만의 고유한 파일 시스템을 가진다.

서비스가 수행되고 난 후 모든 노드들은 각자 다른 노드들과 랜 하트비트(LAN Heartbeat)를 통해 서비스 상태 정보를 주고받는다(③). 이러한 랜 하트비트(LAN Heartbeat)에 장애가 발생하면(④), 서비스를 수행하는 노드는 수행하는 서비스에 대한 상태 정보 중 서비스의 정상/비정상 상태 정보와 서비스의 수행상태 변화정보를 수집하고, 수집한 서비스의 상태 정보를 공유 디스크의 파일 시스템에 기록한다(⑤).

서비스를 수행하지 않는 다른 노드는 공유 디스크에 기록된 서비스의 상태 정보를 읽고(⑥) 그 상태 정보로부터 서비스의 상태가 비상상이라고 판단되는 경우 서비스 인계를 수행한다(⑦). 이 때, 서비스 상태 정보는 서비스 운영에 필요한 네트워크, 파일 시스템, 응용 프로그램 전체에 대한 정상/비정상 상태 정보와 그 모 두를 합한 서비스 단위의 정상/비정상 상태 정보로 구성된다.

랜 하트비트(LAN Heartbeat)에 장애가 발생한 경우, 그 후 수행되는 제어 명령은 제어 명령 대상이 되는 서비스에 할당된 공유 디스크의 파일 시스템에 기록된다(⑧). 제어 명령이 공유 디스크의 파일 시스템에 기록되면 다른 노드들은 이 제어 명령을 읽어 명령을 수행하게 된다(⑨). 이러한 제어 명령은 서비스 이동 명령, 서비스 인계 명령으로 구성된다.

상태 정보와 제어 명령을 공유 디스크에 기록하는 단위는 파일이며, 이러한 동작중에 다시 랜 하트비트(LAN Heartbeat) 장애가 복구되면 공유 디스크를 통한 상태 정보와 제어 명령 전달은 중지된다.

이와 같은 동작으로 앞서 설명한 도 2 내지 도 4의 장애 발생의 각 경우를 다시 설명하면 다음과 같다.

도 2는 랜 하트비트(LAN Heartbeat)에 장애가 발생하고, 서비스를 구성하는 응용 프로그램에 장애가 발생한 경우를 나타낸다.

랜 하트비트(LAN Heartbeat)에 장애가 발생하면 노드 1은 수행하는 서비스의 상태 정보를 공유 디스크의 파일 시스템에 기록하고, 서비스를 구성하는 응용 프로그램에 장애가 발생하면 노드 2로의 서비스 인계를 위해 서비스 수행을 중지한다. 이러한 서비스의 상태 정보가 공유 디스크의 파일 시스템에 기록되고, 노드 2는 이러한 상태 정보를 읽어 서비스의 장애 발생을 파악하고 서비스를 인계한다.

도 3은 랜 하트비트(LAN Heartbeat)에 장애가 발생하고, 노드 1에서 관리자 가 서비스를 노드 2로 이동시키려고 하는 경우를 나타낸다.

랜 하트비트(LAN Heartbeat)에 장애가 발생하면 데몬 1은 노드 1로 입력되는 모든 제어 명령을 제어 명령 대상이 되는 서비스에 할당된 공유 디스크의 파일 시스템에 기록한다. 그러므로 관리자가 서비스를 노드 2로 이동시키기 위해 서비스 이동 명령을 수행하면 서비스 수행 노드는 공유 디스크의 파일 시스템에 서비스 이동 명령을 기록하고, 서비스를 노드 2로 이동시키기 위해 서비스 수행을 중지한다. 서비스 수행이 중지된면 노드 2는 서비스 이동 명령을 읽어 서비스 수행을 개시한다.

도 4는 랜 하트비트(LAN Heartbeat)에 장애가 발생하고, 공중망(Publick Network)에 장애가 발생한 경우를 나타낸다.

서비스 운영에 필요한 네트워크가 공중망에 논리적 인터페이스로 구성된 경우, 랜 하트비트(LAN Heartbeat)에 장애가 발생하면 노드 1은 수행하는 서비스의 상태 정보를 공유 디스크의 파일 시스템에 기록하고, 공중망에도 장애가 발생하면 노드 2로의 서비스 인계를 위해 서비스 수행을 중지한다. 이러한 서비스의 상태 정보가 공유 디스크의 파일 시스템에 기록되고, 노드 2는 이러한 상태 정보를 읽어 노드 1의 모든 네트워크에 장애가 발생한 것임을 판단한다. 노드 1에서 서비스 수행을 중지하면 노드 2는 서비스 인계를 시작한다.

한편 본 발명의 상세한 설명에서는 구체적인 실시예에 관해 설명하였으나, 본 발명의 범위에서 벗어나지 않는 한도 내에서 여러가지 변형이 가능함은 물론이 다. 그러므로 본 발명의 범위는 설명된 실시예에 국한되지 않으며, 후술되는 특허청구의 범위뿐만 아니라 이 특허청구의 범위와 균등한 것들에 의해 정해져야 할 것이다.

이상 설명한 것처럼 본 발명에 따르면, 클러스터 시스템을 구성하는 노드들 중에 서비스 수행 노드에 시스템 장애가 발생한 경우, 당해 노드에 대한 상태 정보 및 제어 명령을 공유 디스크에 저장하여 정상수행중인 다른 노드와 공유케 함으로써 장애가 발생한 서비스가 원활하게 인계될 수 있도록 하는 방법이 제공된다.

이로써, 기존의 클러스터 시스템에 랜 하트비트(LAN Heartbeat) 장애를 동반한 시스템 장애가 발생한 경우, 그 장애의 종류를 해당 노드의 사설 네트워크 장애, 모든 네트워크 장애, 노드다운 장애 등으로 정확히 파악할 수 있고, 장애가 발생했음에도 랜 하트비트(LAN Heartbeat) 장애로 인해 서비스 상태 정보를 원활하게 파악할 수 없었던 문제가 해결되며, 서비스 인계를 위한 제어 명령을 적소에 적절히 전달할 수 없었던 문제점이 해결되는 효과가 있다.

Claims

클러스터 시스템의 서비스 수행 중 랜 하트비트(LAN Heartbeat)에 장애가 발생한 경우에 있어서,

상기 서비스의 최초 수행 노드(이하 "서비스 수행 노드"라 함)가 서비스 운영에 필요한 네트워크, 파일 시스템, 응용 프로그램 전체에 대한 정상/비정상 상태 정보, 그 모두를 합한 서비스 단위의 정상/비정상 상태 정보 및 서비스의 수행상태 변화 정보 중 어느 하나 이상을 포함하여 이루어지는 서비스 상태 정보를 수집하여 이를 공유 디스크의 파일 시스템에 저장하는 제 1단계;

상기 서비스 수행 노드에 서비스의 이동 또는 서비스의 인계 중 어느 하나에 해당하는 제어 명령이 입력되면 이를 공유 디스크의 파일 시스템에 저장하는 제 2단계;

서비스를 수행하지 않는 다른 노드(이하 "타 노드"라 함)중 일 노드가 상기 저장된 상태 정보를 읽어와서 이로부터 서비스 상태를 판단하는 제 3단계; 및

상기 상태 정보로부터 서비스 상태가 비정상이라고 판단되면 상기 저장된 제어 명령을 읽어와서 실행하는 제 4단계;

를 구비하는 것을 특징으로 하는 클러스터 시스템에서 상태 정보 및 제어 명령의 공유를 통한 시스템 장애 대응방법.
삭제
삭제
제 1항에 있어서,

서비스 수행 노드가 상태 정보와 제어 명령을 수집/저장하기 위한 파일 시스템을 읽기/쓰기 모드(read/write mode)로 마운트하는 단계,

타 노드가 상기 상태 정보와 제어 명령을 전달받기 위한 파일 시스템을 읽기 모드(read mode)로 마운트하는 단계

를 더 포함하는 것을 특징으로 하는, 클러스터 시스템에서 상태 정보 및 제어 명령의 공유를 통한 시스템 장애 대응방법.
제 1항에 있어서,

차후 랜 하트비트(LAN Heartbeat) 장애가 복구된 경우, 상기 제 1단계 내지 제 4단계의 공유 디스크를 통한 상태 정보와 제어 명령 전달이 중단되고, 다시 랜 하트비트(LAN Heartbeat)를 통한 상태 정보와 제어 명령 전달이 개시되는 단계를 더 포함하는 것을 특징으로 하는, 클러스터 시스템에서 상태 정보 및 제어 명령의 공유를 통한 시스템 장애 대응방법.