KR20120074528A

KR20120074528A - 클러스터 노드 제어 방법 및 그를 위한 전화 시스템

Info

Publication number: KR20120074528A
Application number: KR1020100136393A
Authority: KR
Inventors: 김인기
Original assignee: 엘지에릭슨 주식회사
Priority date: 2010-12-28
Filing date: 2010-12-28
Publication date: 2012-07-06

Abstract

본 발명은 액티브 노드와 스탠바이 노드의 절체시 발생하는 서비스 단절 시간을 해결하기 위한 클러스터 노드 제어 방법 및 그를 위한 전화 시스템 IP-PBX(internet protocol private branch exchange)에 관한 것이다. 본 발명의 전화 시스템은, 적어도 둘 이상의 노드(node)로 클러스터(cluster)를 구성하여 액티브(active) 노드의 장애가 발생할 경우 가장 높은 우선순위를 갖는 스탠바이(standby) 노드가 액티브 노드로 동작한다.

Description

클러스터 노드 제어 방법 및 그를 위한 전화 시스템{CLUSTER NODE CONTROL METHOD AND INTERNET PROTOCOL PRIVATE BRANCH EXCHANGE}

본 발명은 전화 시스템에 있어서, 특히 액티브 노드와 스탠바이 노드의 절체시 발생하는 서비스 단절 시간을 해결하기 위한 클러스터 노드 제어 방법 및 그를 위한 전화 시스템 IP-PBX(internet protocol private branch exchange)에 관한 것이다.

통신 장비 특히 IP-PBX(Internet Protocol Provate Branch Exchange) 장비에서 고가용성을 획득하기 위한 방법으로는 1:1 고가용성 클러스터(cluster)인 이중화(redundancy) 방법을 이용한다. 이중화 방법은 2개의 노드 즉, 액티브(Active) 노드와 스탠바이(Standby) 노드를 이용하여 액티브 노드의 장애가 발생하였을 때, 스탠바이 노드가 대체하는 방법이다. 이때, 스탠바이 노드가 액티브 노드의 장애를 감지하여 자신이 액티브 노드의 역할을 수행하는 것을 절체(Take Over Process) 라고 한다. 절체 후에, 기존에 액티브 노드였던 노드의 경우 리셋(SW Reset) 등으로 장애를 제거한 후에 다시 스탠바이 노드로 동작한다.

이러한 이중화 방법으로도 통신 장비의 어느 정도 이상의 고가용성의 확보가 가능하지만, 시스템의 장애가 연속으로 발생하는 경우, 특히 액티브 노드의 장애가 발생한 뒤 스탠바이 노드가 액티브 노드로 절체되는 과정에서 다시 장애가 발생하거나, 또는 절체 후에 스탠바이 노드가 준비되기 전에 장애가 발생하는 경우에는 서비스 단절 시간(Service Down Time)이 발생하는 문제점이 있다.

본 발명은 액티브 노드와 스탠바이 노드의 절체시 발생하는 서비스 단절 시간을 해결하기 위한 클러스터 노드 제어 방법 및 그를 위한 전화 시스템을 제공한다.

본 발명의 전화 시스템은, 적어도 둘 이상의 노드(node)로 클러스터(cluster)를 구성하여 액티브(active) 노드의 장애가 발생할 경우 가장 높은 우선순위를 갖는 스탠바이(standby) 노드가 액티브 노드로 동작한다.

또한 본 발명의 클러스터 노드 제어 방법은, a) 적어도 둘 이상의 노드(node)로 클러스터(cluster)를 구성하는 단계; 및 b) 액티브(active) 노드의 장애가 발생할 경우 우선순위가 가장 높은 스탠바이(standby) 노드를 액티브 노드로 동작시키는 단계를 포함한다.

본 발명에 따르면, 기존 통신장비보다 강력한(extreme) 고가용성을 추구하는 고객에게 강한 마케팅 포인트가 될 수 있다. 또한, 저렴한 서버군을 이용하여 네트워크상의 많은 수의 노드를 가지고 있는 클러스터(cluster)를 구축하면, 낮은 비용으로 향상된 고가용성을 획득할 수 있다.

도 1은 본 발명의 실시예에 따른 IP-PBX 클러스터 구성을 보이는 예시도.
도 2는 본 발명의 실시예에 따른 액티브 노드 장애시 절체를 보이는 예시도.
도 3은 본 발명의 실시예에 따른 전화 시스템의 구동 절차를 보이는 플로우 챠트.
도 4는 본 발명의 실시예에 따른 액티브 노드 장애시 절체 과정을 보이는 플로우 챠트.

이하 첨부된 도면을 참조하여 본 발명의 실시예들에 대해 상세히 설명한다. 다만, 이하의 설명에서는 본 발명의 요지를 불필요하게 흐릴 우려가 있는 경우, 널리 알려진 기능이나 구성에 관한 구체적 설명은 생략하기로 한다.

도 1은 본 발명의 실시예에 따른 IP-PBX 클러스터 구성을 보이는 예시도이다. 도 1을 참조하면, 액티브 노드(Active Node)가 현재 서비스를 제공중인 노드이며, 스탠바이 노드(Standby Node)는 액티브 노드의 장애 발생시를 대비하여 대기중인 노드들이다.

도 2는 본 발명의 실시예에 따른 액티브 노드 장애시 절체를 보이는 예시도이다. 도 2를 참조하면, 전체 클러스터(cluster) 노드 개수가 n개라고 가정할 때, 노드 #1이 액티브 노드이고 현재 서비스 중인 노드이다. 노드 #1에 장애가 발생하면 다음 우선순위를 가지고 있는 노드 #2가 액티브 노드가 된다. 그리고 노드 #1은 리셋(SW reset) 등을 수행하여 정상적으로 스탠바이 노드로 동작할 수 있게 되면, 가장 마지막 우선 순위를 갖는 스탠바이 노드가 된다. 이처럼 액티브 노드의 장애가 발생할 때마다 그 다음 우선순위를 가지고 있는 스탠바이 노드가 액티브 노드가 되고, 장애가 발생한 액티브 노드는 장애를 해결한 후에 마지막 우선 순위의 스탠바이 노드로 동작하게 된다.

도 3은 본 발명의 실시예에 따른 전화 시스템의 구동 절차를 보이는 플로우 챠트이다. 도 3을 참조하면, 전화 시스템의 클러스터 미들웨어(middle ware)가 구동되면, 먼저 클러스터 구성 정보가 포함되어 있는 구성(Configuration) 정보를 읽어(Read)온다(S301). 구성 정보를 바탕으로 총 노드의 개수가 몇 개인지 알 수 있는데, 총 노드의 개수를 판단하여(S302, S303), 1개이면 클러스터를 구성하지 않은 채 서비스를 제공하는 방식인 스탠드얼론(Standalone) 모드로 동작하여 단일 서버가 서비스를 제공한다(S304). 이 경우 총 노드의 개수가 1개이기 때문에 장애가 발생시 서비스 단절이 발생한다. 한편, 총 노드의 개수 판단결과(S302, S303) 1개 미만일 경우 구성 오류이므로, 에러(error)를 반환(return) 하고 시스템을 종료한다(S305).

총 노드의 개수 판단결과(S302, S303) 2개 이상일 경우에는 구성 정보를 바탕으로 각 노드는 자신의 우선순위 (Priority)를 계산한다(S306). 일 실시예로서, 클러스터 구성 시 가장 빠른 우선순위를 가진 노드가 기본값으로 액티브 노드(Default Active)로 간주된다.

클러스터 기본 정보 구성이 완료되면 IP-PBX를 구동시키고(S307), IP-PBX와 통신채널을 형성한다(S308). IP-PBX와의 연결이 완료되면, 다른 클러스터 구성 노드들과 통신채널을 형성한다(S309). 이때 클러스터 내에 액티브 노드가 존재하는지 확인한다(S310). 만일 기존 서비스 중인 액티브 노드가 존재한다면 현재 클러스터에 스탠바이 노드로 참여(join)하게 된다(S311).

만일 현재 서비스중인 액티브 노드가 없다면 즉, 나머지 노드가 전부 스탠바이 상태인 경우 현재 자신의 우선순위보다 빠른 순위의 노드가 있는지 탐색한다(S312).

탐색 결과 자신보다 우선순위가 빠른 노드가 존재하면 해당 노드가 액티브 노드로 설정되며, 자신은 스탠바이 노드로 동작한다(S313). 한편 자신의 우선순위가 가장 빠른 순위의 노드인 경우 자신이 액티브 노드로 설정된다(S314).

도 4는 본 발명의 실시예에 따른 액티브 노드 장애시 절체 과정을 보이는 플로우 챠트이다. 노드 A가 액티브 노드이고, 자신이 특정 우선 순위를 갖는 스탠바이 노드로 동작중이라고 가정한다.

우선 노드 A가 연결 해제(Disconnect)된 것을 감지한 경우(S401), 액티브 노드가 연결 해제되었으므로, 현재 스탠바이 노드중에 자신이 가장 빠른 우선순위를 갖는 노드인지 검사한다(S402). 스탠바이 노드 중에서 자신보다 빠른 우선순위를 가지고 있는 노드가 있다면, 해당 노드로부터 전송되는 Req_ACT_Agree_Pkt 메시지의 수신을 기다린다(S403). Req_ACT_Agree_Pkt 메시지는 메시지를 전송한 해당 노드가 액티브 노드가 되기 전에 다른 스탠바이 노드들로부터 동의를 요구하는 메시지이다.

이후 Req_ACT_Agree_Pkt 메시지를 전송한 노드의 우선 순위와 자신의 우선 순위를 비교하여(S404) Req_ACT_Agree_Pkt 메시지를 전송한 노드가 자신보다 우선 순위가 낮은 노드라면 해당 메시지에 대해 동의하지 않는다는(부동의, disagree) 메시지인 Nack_ACT_Agree_Pkt 메시지를 Req_ACT_Agree_Pkt 메시지를 전송한 노드로 전송한 후 대기한다(S405).

한편, 우선 순위 비교 결과(S404), Req_ACT_Agree_Pkt 메시지를 전송한 노드가 자신보다 우선 순위가 높은 노드라면 해당 메시지에 대한 동의(agreement) 메시지인 Ack_ACT_Agree_Pkt 메시지를 전송하고(S406), 이후 액티브 노드가 Req_ACT_Agree_Pkt 메시지를 전송한 노드로 변경되었다는 메시지를 수신한다(S407).

현재 스탠바이 노드중에 자신이 가장 빠른 우선순위를 갖는 노드인지 검사하여(S402), 스탠바이 노드 중에서 자신이 가장 빠른 우선순위를 갖는 노드라면, 다른 모든 스탠바이 노드들에게 자신이 액티브 노드가 되어도 좋으냐고 물어보기 위한 Req_ACT_Agree_Pkt 메시지를 전송하여 다른 노드들의 동의를 구한다(S408).

다른 모든 스탠바이 노드들이 동의한 경우(S409) 클러스터 미들웨어는 IP-PBX에 이제부터 액티브 노드로 동작한다는 메시지를 전송한다(S410). 이때부터 IP-PBX는 액티브 노드로 동작하기 위한 준비를 수행한다. 일 실시예로서, 액티브 노드로 동작하기 위한 준비는 프로토콜 초기화(protocol initialize), 액티브 노드용 작업 읽기(active task loading) 등을 포함할 수 있다.

클러스터 미들웨어는 액티브 노드로 동작하며, 클러스터의 액티브 노드로서 서비스를 제공하기 위한 액티브 IP를 활성화(Enable)하고(S411), 해당 스위치에 ARP 패킷을 전송하여(S412) 자신이 액티브 노드가 되었음을 알린 후 액티브 노드로 동작하게 된다(S413).

상기 방법들은 특정 실시예들을 통하여 설명되었지만, 상기 방법들은 또한 컴퓨터로 읽을 수 있는 기록매체에 컴퓨터가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 컴퓨터가 읽을 수 있는 기록매체는 컴퓨터 시스템에 의해 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록장치를 포함한다. 컴퓨터가 읽을 수 있는 기록매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피 디스크, 광데이터 저장장치 등이 있으며, 또한 케리어 웨이브(예를 들어 인터넷을 통한 전송)의 형태로 구현되는 것도 포함한다. 또한, 컴퓨터가 읽을 수 있는 기록매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산방식으로 컴퓨터가 읽을 수 있는 코드가 저장되고 실행될 수 있다. 그리고, 상기 실시예들을 구현하기 위한 기능적인(functional) 프로그램, 코드 및 코드 세그먼트들은 본 발명이 속하는 기술분야의 프로그래머들에 의해 용이하게 추론될 수 있다.

본 명세서에서는 본 발명이 일부 실시예들과 관련하여 설명되었지만, 본 발명이 속하는 기술분야의 당업자가 이해할 수 있는 본 발명의 정신 및 범위를 벗어나지 않는 범위에서 다양한 변형 및 변경이 이루어질 수 있다는 점을 알아야 할 것이다. 또한, 그러한 변형 및 변경은 본 명세서에 첨부된 특허청구의 범위 내에 속하는 것으로 생각되어야 한다.

Claims

전화 시스템으로서,
적어도 둘 이상의 노드(node)로 클러스터(cluster)를 구성하여 액티브(active) 노드의 장애가 발생할 경우 가장 높은 우선순위를 갖는 스탠바이(standby) 노드가 액티브 노드로 동작하는 전화 시스템.
제1항에 있어서,
장애가 발생한 상기 액티브 노드는 가장 낮은 우선순위를 갖는 스탠바이 노드로 동작하는 전화 시스템.
제2항에 있어서,
총 노드의 개수를 판단하여 상기 총 노드의 개수가 1개 미만일 경우 구성(configuration) 오류로, 에러(error)를 반환(return) 하고 시스템을 종료하는 전화 시스템.
클러스터 노드 제어 방법으로서,
a) 적어도 둘 이상의 노드(node)로 클러스터(cluster)를 구성하는 단계; 및
b) 액티브(active) 노드의 장애가 발생할 경우 우선순위가 가장 높은 스탠바이(standby) 노드를 액티브 노드로 동작시키는 단계를 포함하는 클러스터 노드 제어 방법.
제4항에 있어서,
c) 장애가 발생한 상기 액티브 노드를 가장 낮은 우선순위를 갖는 스탠바이 노드로 전환하는 단계를 더 포함하는 클러스터 노드 제어 방법.
제5항에 있어서,
상기 단계 a) 이전에,
총 노드의 개수를 판단하여 상기 총 노드의 개수가 1개 미만일 경우 구성(configuration) 오류로, 에러(error)를 반환(return) 하는, 클러스터 노드 제어 방법.