KR20120074528A - 클러스터 노드 제어 방법 및 그를 위한 전화 시스템 - Google Patents

클러스터 노드 제어 방법 및 그를 위한 전화 시스템 Download PDF

Info

Publication number
KR20120074528A
KR20120074528A KR1020100136393A KR20100136393A KR20120074528A KR 20120074528 A KR20120074528 A KR 20120074528A KR 1020100136393 A KR1020100136393 A KR 1020100136393A KR 20100136393 A KR20100136393 A KR 20100136393A KR 20120074528 A KR20120074528 A KR 20120074528A
Authority
KR
South Korea
Prior art keywords
node
nodes
cluster
active
standby
Prior art date
Application number
KR1020100136393A
Other languages
English (en)
Inventor
김인기
Original Assignee
엘지에릭슨 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 엘지에릭슨 주식회사 filed Critical 엘지에릭슨 주식회사
Priority to KR1020100136393A priority Critical patent/KR20120074528A/ko
Publication of KR20120074528A publication Critical patent/KR20120074528A/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/22Arrangements for supervision, monitoring or testing

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Telephonic Communication Services (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

본 발명은 액티브 노드와 스탠바이 노드의 절체시 발생하는 서비스 단절 시간을 해결하기 위한 클러스터 노드 제어 방법 및 그를 위한 전화 시스템 IP-PBX(internet protocol private branch exchange)에 관한 것이다. 본 발명의 전화 시스템은, 적어도 둘 이상의 노드(node)로 클러스터(cluster)를 구성하여 액티브(active) 노드의 장애가 발생할 경우 가장 높은 우선순위를 갖는 스탠바이(standby) 노드가 액티브 노드로 동작한다.

Description

클러스터 노드 제어 방법 및 그를 위한 전화 시스템{CLUSTER NODE CONTROL METHOD AND INTERNET PROTOCOL PRIVATE BRANCH EXCHANGE}
본 발명은 전화 시스템에 있어서, 특히 액티브 노드와 스탠바이 노드의 절체시 발생하는 서비스 단절 시간을 해결하기 위한 클러스터 노드 제어 방법 및 그를 위한 전화 시스템 IP-PBX(internet protocol private branch exchange)에 관한 것이다.
통신 장비 특히 IP-PBX(Internet Protocol Provate Branch Exchange) 장비에서 고가용성을 획득하기 위한 방법으로는 1:1 고가용성 클러스터(cluster)인 이중화(redundancy) 방법을 이용한다. 이중화 방법은 2개의 노드 즉, 액티브(Active) 노드와 스탠바이(Standby) 노드를 이용하여 액티브 노드의 장애가 발생하였을 때, 스탠바이 노드가 대체하는 방법이다. 이때, 스탠바이 노드가 액티브 노드의 장애를 감지하여 자신이 액티브 노드의 역할을 수행하는 것을 절체(Take Over Process) 라고 한다. 절체 후에, 기존에 액티브 노드였던 노드의 경우 리셋(SW Reset) 등으로 장애를 제거한 후에 다시 스탠바이 노드로 동작한다.
이러한 이중화 방법으로도 통신 장비의 어느 정도 이상의 고가용성의 확보가 가능하지만, 시스템의 장애가 연속으로 발생하는 경우, 특히 액티브 노드의 장애가 발생한 뒤 스탠바이 노드가 액티브 노드로 절체되는 과정에서 다시 장애가 발생하거나, 또는 절체 후에 스탠바이 노드가 준비되기 전에 장애가 발생하는 경우에는 서비스 단절 시간(Service Down Time)이 발생하는 문제점이 있다.
본 발명은 액티브 노드와 스탠바이 노드의 절체시 발생하는 서비스 단절 시간을 해결하기 위한 클러스터 노드 제어 방법 및 그를 위한 전화 시스템을 제공한다.
본 발명의 전화 시스템은, 적어도 둘 이상의 노드(node)로 클러스터(cluster)를 구성하여 액티브(active) 노드의 장애가 발생할 경우 가장 높은 우선순위를 갖는 스탠바이(standby) 노드가 액티브 노드로 동작한다.
또한 본 발명의 클러스터 노드 제어 방법은, a) 적어도 둘 이상의 노드(node)로 클러스터(cluster)를 구성하는 단계; 및 b) 액티브(active) 노드의 장애가 발생할 경우 우선순위가 가장 높은 스탠바이(standby) 노드를 액티브 노드로 동작시키는 단계를 포함한다.
본 발명에 따르면, 기존 통신장비보다 강력한(extreme) 고가용성을 추구하는 고객에게 강한 마케팅 포인트가 될 수 있다. 또한, 저렴한 서버군을 이용하여 네트워크상의 많은 수의 노드를 가지고 있는 클러스터(cluster)를 구축하면, 낮은 비용으로 향상된 고가용성을 획득할 수 있다.
도 1은 본 발명의 실시예에 따른 IP-PBX 클러스터 구성을 보이는 예시도.
도 2는 본 발명의 실시예에 따른 액티브 노드 장애시 절체를 보이는 예시도.
도 3은 본 발명의 실시예에 따른 전화 시스템의 구동 절차를 보이는 플로우 챠트.
도 4는 본 발명의 실시예에 따른 액티브 노드 장애시 절체 과정을 보이는 플로우 챠트.
이하 첨부된 도면을 참조하여 본 발명의 실시예들에 대해 상세히 설명한다. 다만, 이하의 설명에서는 본 발명의 요지를 불필요하게 흐릴 우려가 있는 경우, 널리 알려진 기능이나 구성에 관한 구체적 설명은 생략하기로 한다.
도 1은 본 발명의 실시예에 따른 IP-PBX 클러스터 구성을 보이는 예시도이다. 도 1을 참조하면, 액티브 노드(Active Node)가 현재 서비스를 제공중인 노드이며, 스탠바이 노드(Standby Node)는 액티브 노드의 장애 발생시를 대비하여 대기중인 노드들이다.
도 2는 본 발명의 실시예에 따른 액티브 노드 장애시 절체를 보이는 예시도이다. 도 2를 참조하면, 전체 클러스터(cluster) 노드 개수가 n개라고 가정할 때, 노드 #1이 액티브 노드이고 현재 서비스 중인 노드이다. 노드 #1에 장애가 발생하면 다음 우선순위를 가지고 있는 노드 #2가 액티브 노드가 된다. 그리고 노드 #1은 리셋(SW reset) 등을 수행하여 정상적으로 스탠바이 노드로 동작할 수 있게 되면, 가장 마지막 우선 순위를 갖는 스탠바이 노드가 된다. 이처럼 액티브 노드의 장애가 발생할 때마다 그 다음 우선순위를 가지고 있는 스탠바이 노드가 액티브 노드가 되고, 장애가 발생한 액티브 노드는 장애를 해결한 후에 마지막 우선 순위의 스탠바이 노드로 동작하게 된다.
도 3은 본 발명의 실시예에 따른 전화 시스템의 구동 절차를 보이는 플로우 챠트이다. 도 3을 참조하면, 전화 시스템의 클러스터 미들웨어(middle ware)가 구동되면, 먼저 클러스터 구성 정보가 포함되어 있는 구성(Configuration) 정보를 읽어(Read)온다(S301). 구성 정보를 바탕으로 총 노드의 개수가 몇 개인지 알 수 있는데, 총 노드의 개수를 판단하여(S302, S303), 1개이면 클러스터를 구성하지 않은 채 서비스를 제공하는 방식인 스탠드얼론(Standalone) 모드로 동작하여 단일 서버가 서비스를 제공한다(S304). 이 경우 총 노드의 개수가 1개이기 때문에 장애가 발생시 서비스 단절이 발생한다. 한편, 총 노드의 개수 판단결과(S302, S303) 1개 미만일 경우 구성 오류이므로, 에러(error)를 반환(return) 하고 시스템을 종료한다(S305).
총 노드의 개수 판단결과(S302, S303) 2개 이상일 경우에는 구성 정보를 바탕으로 각 노드는 자신의 우선순위 (Priority)를 계산한다(S306). 일 실시예로서, 클러스터 구성 시 가장 빠른 우선순위를 가진 노드가 기본값으로 액티브 노드(Default Active)로 간주된다.
클러스터 기본 정보 구성이 완료되면 IP-PBX를 구동시키고(S307), IP-PBX와 통신채널을 형성한다(S308). IP-PBX와의 연결이 완료되면, 다른 클러스터 구성 노드들과 통신채널을 형성한다(S309). 이때 클러스터 내에 액티브 노드가 존재하는지 확인한다(S310). 만일 기존 서비스 중인 액티브 노드가 존재한다면 현재 클러스터에 스탠바이 노드로 참여(join)하게 된다(S311).
만일 현재 서비스중인 액티브 노드가 없다면 즉, 나머지 노드가 전부 스탠바이 상태인 경우 현재 자신의 우선순위보다 빠른 순위의 노드가 있는지 탐색한다(S312).
탐색 결과 자신보다 우선순위가 빠른 노드가 존재하면 해당 노드가 액티브 노드로 설정되며, 자신은 스탠바이 노드로 동작한다(S313). 한편 자신의 우선순위가 가장 빠른 순위의 노드인 경우 자신이 액티브 노드로 설정된다(S314).
도 4는 본 발명의 실시예에 따른 액티브 노드 장애시 절체 과정을 보이는 플로우 챠트이다. 노드 A가 액티브 노드이고, 자신이 특정 우선 순위를 갖는 스탠바이 노드로 동작중이라고 가정한다.
우선 노드 A가 연결 해제(Disconnect)된 것을 감지한 경우(S401), 액티브 노드가 연결 해제되었으므로, 현재 스탠바이 노드중에 자신이 가장 빠른 우선순위를 갖는 노드인지 검사한다(S402). 스탠바이 노드 중에서 자신보다 빠른 우선순위를 가지고 있는 노드가 있다면, 해당 노드로부터 전송되는 Req_ACT_Agree_Pkt 메시지의 수신을 기다린다(S403). Req_ACT_Agree_Pkt 메시지는 메시지를 전송한 해당 노드가 액티브 노드가 되기 전에 다른 스탠바이 노드들로부터 동의를 요구하는 메시지이다.
이후 Req_ACT_Agree_Pkt 메시지를 전송한 노드의 우선 순위와 자신의 우선 순위를 비교하여(S404) Req_ACT_Agree_Pkt 메시지를 전송한 노드가 자신보다 우선 순위가 낮은 노드라면 해당 메시지에 대해 동의하지 않는다는(부동의, disagree) 메시지인 Nack_ACT_Agree_Pkt 메시지를 Req_ACT_Agree_Pkt 메시지를 전송한 노드로 전송한 후 대기한다(S405).
한편, 우선 순위 비교 결과(S404), Req_ACT_Agree_Pkt 메시지를 전송한 노드가 자신보다 우선 순위가 높은 노드라면 해당 메시지에 대한 동의(agreement) 메시지인 Ack_ACT_Agree_Pkt 메시지를 전송하고(S406), 이후 액티브 노드가 Req_ACT_Agree_Pkt 메시지를 전송한 노드로 변경되었다는 메시지를 수신한다(S407).
현재 스탠바이 노드중에 자신이 가장 빠른 우선순위를 갖는 노드인지 검사하여(S402), 스탠바이 노드 중에서 자신이 가장 빠른 우선순위를 갖는 노드라면, 다른 모든 스탠바이 노드들에게 자신이 액티브 노드가 되어도 좋으냐고 물어보기 위한 Req_ACT_Agree_Pkt 메시지를 전송하여 다른 노드들의 동의를 구한다(S408).
다른 모든 스탠바이 노드들이 동의한 경우(S409) 클러스터 미들웨어는 IP-PBX에 이제부터 액티브 노드로 동작한다는 메시지를 전송한다(S410). 이때부터 IP-PBX는 액티브 노드로 동작하기 위한 준비를 수행한다. 일 실시예로서, 액티브 노드로 동작하기 위한 준비는 프로토콜 초기화(protocol initialize), 액티브 노드용 작업 읽기(active task loading) 등을 포함할 수 있다.
클러스터 미들웨어는 액티브 노드로 동작하며, 클러스터의 액티브 노드로서 서비스를 제공하기 위한 액티브 IP를 활성화(Enable)하고(S411), 해당 스위치에 ARP 패킷을 전송하여(S412) 자신이 액티브 노드가 되었음을 알린 후 액티브 노드로 동작하게 된다(S413).
상기 방법들은 특정 실시예들을 통하여 설명되었지만, 상기 방법들은 또한 컴퓨터로 읽을 수 있는 기록매체에 컴퓨터가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 컴퓨터가 읽을 수 있는 기록매체는 컴퓨터 시스템에 의해 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록장치를 포함한다. 컴퓨터가 읽을 수 있는 기록매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피 디스크, 광데이터 저장장치 등이 있으며, 또한 케리어 웨이브(예를 들어 인터넷을 통한 전송)의 형태로 구현되는 것도 포함한다. 또한, 컴퓨터가 읽을 수 있는 기록매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산방식으로 컴퓨터가 읽을 수 있는 코드가 저장되고 실행될 수 있다. 그리고, 상기 실시예들을 구현하기 위한 기능적인(functional) 프로그램, 코드 및 코드 세그먼트들은 본 발명이 속하는 기술분야의 프로그래머들에 의해 용이하게 추론될 수 있다.
본 명세서에서는 본 발명이 일부 실시예들과 관련하여 설명되었지만, 본 발명이 속하는 기술분야의 당업자가 이해할 수 있는 본 발명의 정신 및 범위를 벗어나지 않는 범위에서 다양한 변형 및 변경이 이루어질 수 있다는 점을 알아야 할 것이다. 또한, 그러한 변형 및 변경은 본 명세서에 첨부된 특허청구의 범위 내에 속하는 것으로 생각되어야 한다.

Claims (6)

  1. 전화 시스템으로서,
    적어도 둘 이상의 노드(node)로 클러스터(cluster)를 구성하여 액티브(active) 노드의 장애가 발생할 경우 가장 높은 우선순위를 갖는 스탠바이(standby) 노드가 액티브 노드로 동작하는 전화 시스템.
  2. 제1항에 있어서,
    장애가 발생한 상기 액티브 노드는 가장 낮은 우선순위를 갖는 스탠바이 노드로 동작하는 전화 시스템.
  3. 제2항에 있어서,
    총 노드의 개수를 판단하여 상기 총 노드의 개수가 1개 미만일 경우 구성(configuration) 오류로, 에러(error)를 반환(return) 하고 시스템을 종료하는 전화 시스템.
  4. 클러스터 노드 제어 방법으로서,
    a) 적어도 둘 이상의 노드(node)로 클러스터(cluster)를 구성하는 단계; 및
    b) 액티브(active) 노드의 장애가 발생할 경우 우선순위가 가장 높은 스탠바이(standby) 노드를 액티브 노드로 동작시키는 단계를 포함하는 클러스터 노드 제어 방법.
  5. 제4항에 있어서,
    c) 장애가 발생한 상기 액티브 노드를 가장 낮은 우선순위를 갖는 스탠바이 노드로 전환하는 단계를 더 포함하는 클러스터 노드 제어 방법.
  6. 제5항에 있어서,
    상기 단계 a) 이전에,
    총 노드의 개수를 판단하여 상기 총 노드의 개수가 1개 미만일 경우 구성(configuration) 오류로, 에러(error)를 반환(return) 하는, 클러스터 노드 제어 방법.
KR1020100136393A 2010-12-28 2010-12-28 클러스터 노드 제어 방법 및 그를 위한 전화 시스템 KR20120074528A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020100136393A KR20120074528A (ko) 2010-12-28 2010-12-28 클러스터 노드 제어 방법 및 그를 위한 전화 시스템

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020100136393A KR20120074528A (ko) 2010-12-28 2010-12-28 클러스터 노드 제어 방법 및 그를 위한 전화 시스템

Publications (1)

Publication Number Publication Date
KR20120074528A true KR20120074528A (ko) 2012-07-06

Family

ID=46708635

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020100136393A KR20120074528A (ko) 2010-12-28 2010-12-28 클러스터 노드 제어 방법 및 그를 위한 전화 시스템

Country Status (1)

Country Link
KR (1) KR20120074528A (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20150049559A (ko) * 2013-10-30 2015-05-08 삼성에스디에스 주식회사 클러스터 노드 상태 변경 장치 및 방법과 그 프로그램을 기록한 기록 매체
KR20150102591A (ko) * 2014-02-28 2015-09-07 한화테크윈 주식회사 고가용성 시스템

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20150049559A (ko) * 2013-10-30 2015-05-08 삼성에스디에스 주식회사 클러스터 노드 상태 변경 장치 및 방법과 그 프로그램을 기록한 기록 매체
KR20150102591A (ko) * 2014-02-28 2015-09-07 한화테크윈 주식회사 고가용성 시스템

Similar Documents

Publication Publication Date Title
US10938710B2 (en) Protection switching method and system, and network device
CN110912780B (zh) 一种高可用集群检测方法、系统及受控终端
US8654762B2 (en) Resource pooling in a blade cluster switching center server
CN102315975B (zh) 一种基于irf系统的故障处理方法及其设备
CN102137017B (zh) 用于虚拟网络单元的工作方法及装置
KR101523457B1 (ko) 지오-리던던트 게이트에서 세션 복원을 위한 시스템 및 방법
CN106330475B (zh) 一种通信系统中管理主备节点的方法和装置及高可用集群
CN102164056B (zh) 堆叠链路聚合故障检测方法和堆叠设备
CN109101196A (zh) 主节点切换方法、装置、电子设备及计算机存储介质
CN102780635B (zh) 基于trill网络实现保护倒换的方法、tor交换机及系统
US20130201873A1 (en) Distributed fabric management protocol
CN101989953A (zh) 双向转发检测报文的发送方法及设备
CN101197733A (zh) 网络连通性的自动检测方法及装置
US9288075B2 (en) Method and system for auto-configuration, and network node
CN103888277A (zh) 一种网关容灾备份方法、装置和系统
US20130139178A1 (en) Cluster management system and method
CN103036716A (zh) 链路切换方法及系统
EP2557732A1 (en) Aps service channel switching method and system, and aps device
WO2017071384A1 (zh) 报文处理的方法及装置
US8161147B2 (en) Method of organising servers
KR20120074528A (ko) 클러스터 노드 제어 방법 및 그를 위한 전화 시스템
CN102271049B (zh) 通信设备状态设置方法、装置和系统
US20220417136A1 (en) Pce controlled network reliability
CN102769571A (zh) 一种平滑重启实现方法及设备
US9015518B1 (en) Method for hierarchical cluster voting in a cluster spreading more than one site

Legal Events

Date Code Title Description
WITN Withdrawal due to no request for examination