KR101017540B1

KR101017540B1 - 로컬 노드 운전 정지 동안의 무중단 네트워크 제어 메시지 발생

Info

Publication number: KR101017540B1
Application number: KR1020087029207A
Authority: KR
Inventors: 디터 스톨; 게오르그 벤젤; 볼프강 토마스
Original assignee: 알카텔-루센트 유에스에이 인코포레이티드
Priority date: 2006-05-30
Filing date: 2006-05-30
Publication date: 2011-02-28
Also published as: EP2030378A1; JP2009539305A; CN101461196A; KR20090016676A; WO2007139542A1; EP2030378A4

Abstract

캐싱 메커니즘은 일시적 제어 플레인 운전 정지들(outages)의 경우 패킷 네트워크 재구성과 관련 트래픽 손실을 방지하도록 제공된다.

패킷 스위칭, 제어 플레인 프로토콜, 워커/보호 프로토콜 상태 머신, 워커/보호 메시지 캐시, 캐싱 메커니즘, 패킷 네트워크 재구성, 트래픽 손실

Description

로컬 노드 운전 정지 동안의 무중단 네트워크 제어 메시지 발생{UNINTERRUPTED NETWORK CONTROL MESSAGE GENERATION DURING LOCAL NODE OUTAGES}

본 발명은 통상적으로 컴퓨터 네트워크들에 관한 것이다. 구체적으로 말하면, 본 발명은 패킷 스위칭(packet switching) 및 제어 플레인 프로토콜들(control plane protocols)에 관한 것이다.

패킷 스위칭 네트워크들은 제어 플레인 프로토콜들, 예를 들면 스패닝 트리 프로토콜(spanning tree network;STP), 일반 속성 등록 프로토콜(generic attribute registration protocol;GARP) 및 가상 근거리 네트워크들을 위한 그것의 버전, VLAN 등록 프로토콜(GVRP), 링크 집약 제어 프로토콜(link aggregation control protocol;LACP), Y.1711 고속 장애 검출(fast failure detection;FFD)과, 예약 프로토콜(reservation protocol;RSVP) 리프레쉬(refresh)를 포함한다. 제어 프로토콜들은 예를 들면, 층 2(L2) 트래픽이 어떻게 네트워크를 통해 흐르는 지에 관한 토폴로지 및 분배를 제어하는 역할을 한다. 이러한 프로토콜들은 각각의 참가 네트워크 엘리먼트에서 가동하는 상태 머신들에서 실현된다. 일단 안정된 네트워크 구성에 도달되면, 프로토콜들은 네트워크에 전송하는 동일 메시지를 반복하는 경향이 있다. 상이한 메시지들은 통상적으로 네트워크에서 오퍼레이터로부터 또는 결함으로부터 유도된 변화로부터 결과된다. 네트워크 엘리먼트에 의한 프로토콜에의 참여 실패는, 수 밀리 초에서 수 초까지 범위의 타임아웃 기간이 초과하는 경우 트래픽 재구성들을 초래하게 된다. 어떤 경우들에서는, 트래픽 재구성들은 전체 네트워크와 관계한다.

현행 네트워크 엘리먼트들에서, 패킷 제어 프로토콜들은 3개 카테고리들 중 하나가 된다. 그것들은 (1) 비보호되고; (2) 제어 플레인 운전 정지들(outages) 이전에 인접한 네트워크 엘리먼트들과의 사적(proprietary) 통신에 의해 보호되거나; 또는 (3) 프로토콜 운전 정지 직전 또는 직후 인접 네트워크 엘리먼트들과의 상호 작용을 요구하는 표준화된 적절한 재시동 기술에 의해 보호된다. 비보호되는 경우, 그 결과는 통상적으로 네트워크를 통한 트래픽 흐름이 재구성되게 된다. 재구성 시간 동안에, 트래픽 손실은 전체 네트워크 도메인만큼 클 수 있는 네트워크들의 일부들에서 발생하게 된다. 장애가 있었던 네트워크 엘리먼트가 복구되는 경우, 제 2 재구성은 장애이전에 트래픽 흐름 분배를 재설정하게 한다. 또한, 트래픽 손실은 이전과 유사한 정도로 발생할 것이다. 전용 구현에는 2가지 단점이 있다. 첫 번째로, 그것은 문제 시나리오들, 즉 자발적으로 입력되고(예를 들면, 네트워크 엘리먼트에서 오퍼레이터 구동 소프트웨어 업그레이드의 경우에) 장애가 있는 네트워크 엘리먼트로 하여금 다가올 제어 플레인 장애를 인접 엘리먼트들에 알리는 것을 허용하는 것들 중 일부만을 커버한다. 둘째로, 이러한 능력들을 갖는 네트워크와 상호 작용하는 것이 제한된다. 즉, 통상적으로 다른 장비 판매자들과 상호작용 시나리오들에서 기능하지 않을 것이다. 표준화된 적절한 재시동 경우에, 단지 프로토콜들 중 적은 세트만이 커버된다. 장애 이후에 인접 엘리먼트들에게 적절한 재시동이 적용되어야 한다고 알리기 위한 시간 제한이 적은 경우, 의도되지 않은 장애들에 관한 제한을 놓칠 가능성이 크다. 인접 엘리먼트들이 제어 플레인 운전 정지를 검출하고 네트워크 재구성을 트리거링하므로, 시간 제한을 놓치면 트래픽 손실을 초래하게 된다.

따라서, 일시적인 패킷 제어 플레인 운전 정지의 경우 메커니즘이 패킷 네트워크 재구성 및 관련 트래픽 손실을 방지할 필요가 있다.

본 발명의 예시적인 실시예들은 로컬 노드 운전 정지들 동안에, 무중단 네트워크 제어 메시지 발생을 제공함으로써 패킷 네트워크 재구성 및 관련된 트래픽 손실을 방지한다.

일 실시예는 로컬 노드 운전 정지들 동안에 무중단 네트워크 제어 메시지 발생을 제공하는 방법이다. 메시지 캐시(cache)는 로컬 노드에 대하여 프로토콜 상태 머신(protocol state machine)으로부터 전송된 다수 메시지를 수신하고 네트워크에서 다른 노드들에 그것들을 보낸다. 또한, 메시지 캐시는 노드들로부터 메시지들을 수신한다. 메시지 캐시는 버퍼에 송신 및 수신된 메시지들 양자를 저장한다. 프로토콜 상태 머신의 장애시, 메시지 캐시는 버퍼가 유효한 한 노드들에 메시지들을 송신하고 그 노드들로부터 메시지들을 수신한다. 메시지들은 그 노드들에 주기적으로 송신된다. 메시지 캐시는 버퍼가 유효한 지의 여부를 버퍼의 메시지들과 장애 이후 노드들로부터 수신되는 메시지들에 기초하여 판정한다. 또한, 상기 방법은 가동 프로토콜 상태 머신의 장애시 스탠바이 프로토콜 상태 머신으로 스위칭하는 것을 포함하며, 스탠바이 프로토콜 상태 머신은 제 1 버퍼를 복제한 또 다른 버퍼를 포함한다.

또 다른 실시예는 로컬 노드 운전 정지들 동안에 무중단 네트워크 제어 메시지 발생을 제공하는 상기 방법을 실행하는 명령들을 저장한 판독 가능 매체이다.

또 다른 실시예는 프로토콜 상태 머신 및 메시지 캐시를 포함하는, 로컬 노드 운전 정지들 동안에 무중단 네트워크 제어 메시지 발생을 제공하는 시스템이다. 프로토콜 상태 머신은 메시지들을 발생한다. 메시지 캐시는 프로토콜 상태 머신으로부터 메시지들을 수신하고 네트워크 내의 노드들에게 그것들을 전송한다. 메시지 캐시는 하나 또는 그 이상의 버퍼들에 송신 및 수신 메시지들 모두를 저장한다. 프로토콜 상태 머신의 장애시, 상기 메시지 캐시는 유효한 한 그 노드들에 메시지들을 송신하고 그 노드들로부터 메시지들을 수신한다. 메시지 캐시는 노드들에 주기적 메시지들을 송신하는 타이머와 메시지 캐시가 유효한 지를 판정하는 상태 제어기를 포함한다. 시스템은 워커(worker) 노드와 보호 노드를 포함하며, 각각은 워커 노드의 장애가시 보호 노드가 가동될 수 있도록 프로토콜 상태 머신들 및 메시지 캐시들을 구비한다. 보호 메시지 캐시는 워커 프로토콜 상태 머신이 가동되는 동안에 워커 메시지 캐시를 복제할 수 있다.

본 발명의 기재는 첨부 도면들과 결합하여 이하의 상세한 설명을 고려하면 용이하게 이해될 수 있다.

도 1은 제어 플레인 프로토콜용 상태 머신이 가동될 때 디폴트 경우에 관한 캐시 개념의 한 예시적인 실시예를 설명하는 블록도이다.

도 2는 프로토콜 상태 머신이 이용 불가능하고 네트워크 상태가 안정적일 때 제어 플레인 장애 경우에 대한 도 1의 캐시 개념의 예시적인 실시예를 설명하는 블록도이다.

도 3은 프로토콜 상태 머신이 이용 불가능하고 네트워크 상태가 불안정적일 때 제어 플레인 장애 경우에 대한 도 1의 캐시 개념의 예시적인 실시예를 설명하는 블록도이다.

도 4는 상태 머신에 관한 2가지 경우들이 있고(워커 및 보호) 워커 상태 머신이 가동되고, 보호 상태 머신이 스탠바이이고, 각각이 캐시에 관련된 경우, 디폴트 경우에 관한 캐시 개념의 한 예시적인 실시예를 설명하는 블록도이다.

도 5는 워커 상태 머신이 가동될 때와 장애났을 때, 스탠바이 상태의 보호 상태 머신이 복구되고(스탠바이에서 완전 동작으로), 하지만 네트워크 상태는 안정적일 때, 중간 상태에 대한 도 4의 캐시 개념의 예시적인 실시예를 설명하는 블록도이다.

도 6은 보호 상태 머신이 가동되고 워커 상태 머신이 스탠바이(워커에서 보호로 스위치한 후)인 경우 도 4의 캐시 개념의 예시적인 실시예를 설명하는 블록도이다.

도 7은 도 4의 캐시 개념의 예시적인 실시예에 대하여 시간 라인에 선택된 상태 전이들과 이벤트들을 도시한 챠트이다.

도 8은 분배된 캐시의 한 예시적인 실시예를 설명하는 블록도이다.

보다 쉽게 이해할 수 있도록, 가능한 곳에 도면들에 공통적인 동일 엘리먼트들을 나타내기 위해 동일 참조 부호들이 사용되었다.

본 발명의 설명은 기본적으로 패킷 스위치 네트워크들 및 제어 플레인 프로토콜들의 문맥 내에 있다. 그러나, 당업자들은 본 발명의 주 개념이 컴퓨터 네트워크들에 통상적으로 적용 가능하고, 임의 네트워크 구조 및 디자인, 통신 프로토콜들, 네트워크 소프트웨어, 네트워크 기술들, 네트워크 서비스들 및 어플리케이션들, 및 네트워크 운영 관리에 광범위하게 적용될 수 있슴을 인식할 것이다. 따라서, 본 발명의 통상적인 개념들은 광범위하게 적용 가능하고 임의 특정 구현에 한정되지는 않는다.

소개 - 장비 보호와 관련한 L2 이더넷 실례

예를 들어, 스패닝 트리 프로토콜들 및 링크 집약 제어 프로토콜들, 일반 속성 등록 프로토콜(GARP) 및 그것의 변형들 및 다른 프로토콜들과 같이, L2 제어 플레인에 영향을 미치는 장비 보호 스위치들의 조건 하에서 L2 이더넷 서비스들에 대하여 안정적 네트워크 구성을 유지할 필요가 있다. 프로토콜 데이터 유닛(protocol data unit;PDU) 분배가 3초 정도 동안 중단되는 경우, 로컬 보호 스위치가 네트워크에서 전체 스패닝 트리의 재구성을 유도할 가능성이 있다. 이것은 네트워크가 안정된 상태를 다시 회복할 때까지 몇십 초의 트래픽 운전 정지들을 야기할 수 있다. 따라서, 보호 스위치 직후에, 네트워크 엘리먼트가 이하를 행하는 것이 바람직하다. 첫 번째로, 네트워크 엘리먼트는, 예를 들어, 수동 스위치들과 같은 오퍼레이터 구동 이벤트들의 경우와 단일의 장애(예를 들면, 회로 팩 결함)의 경우와 같이, 불안정 원인이 장비 보호 스위치만이면 안정된 네트워크를 유지해야 한다. 두 번째로, 네트워크 엘리먼트는 예를 들면, 원격 네트워크 엘리먼트 장애로 인해 네트워크가 이미 재구성하고 있는 경우에 네트워크 영향을 최소화해야 하는 반면, 동시에 보호 스위치는 로컬 결함(이중 장애) 또는 오퍼레이터 명령들에 의해 요구된다. 본 발명의 예시적인 실시예들은, 상기 L2 이더넷 실례뿐만 아니라 많은 프로토콜에 대한 임의 네트워크의 로컬 제어 플레인의 일시 이용불가능성을 야기하는 임의 장애(예를 들면, 하드웨어 결함)에 대해서도 더 광범위하게 상기 목적들을 달성한다.

네트워크 엘리먼트 이더넷 작동의 높은 수준의 서술

네트워크 엘리먼트 작동은 3가지 상태로 서술될 수 있다. 첫 번째 상태에서, 상태 머신은 모든 요청들에 전적으로 작동 가능하고 반응한다. 두 번째 상태에서, 상태 머신은 이용할 수 없고 캐시는 네트워크 변화가 일어나기 전까지 PDU 송신을 유지하며, 이것은 캐시를 무효화시키거나, 또는 상태 머신이 동작 가능해 진다. 세 번째 상태에서, 상태 머신 및 캐시는 예를 들면, 상태 머신이 동작할 수 없는 동안에 네트워크에서 진행되는 재구성으로 인해, 또는 동기화되지 않은 프로토콜 상태 머신 및 캐시로 인해 이용 불가능하다.

높은 수준 캐시 개념-STP 실례

캐싱 개념의 예시적인 실시예들은, 안정된 네트워크에서 스패닝 트리 프로토콜 노드들이 인접 노드들에 동일한 PDU들을 반복적으로 분배한다고 하는 관찰에서 파생된다. 어떠한 PDU도 3개의 연속 송신 기간들 동안에 스패닝 트리 노드에 의해 수신되지 않거나 또는 PDU의 콘텐트가 이전 PDU와는 상이한 경우에, 네트워크 결함 또는 네트워크 변화가 검출된다. 따라서, 다른 안정된 네트워크 토폴로지에서, 스패닝 트리 프로토콜 머신의 활동상태는 PDU들의 주기적 송신이 유지되는 한 일정치 않은 시간 동안에 정지될 수 있다. 따라서, 캐시 개념은 PDU들의 네트워크 요구들이 구성, 프로토콜 상태 머신들 모두에 대해, 개시되고 동기화된 것들에 대한 필요 없이도 캐시로부터 충족되도록 이 사실을 이용한다. 따라서, 캐시 개념은 (핫 스탠바이에 있는) 캐시를 동작시키는 것을 제외하고는 소프트웨어 구성 소자들 모두의 복구 속도에 관한 요구를 경감시킨다. 캐시가 PDU 송신에 대하여 유효하다고 고려될 때의 특정 시간들과 캐시가 무효로 될 필요가 있을 때의 다른 시간들이 있다. 안정된 네트워크 토폴로지 내에서 일정 범위에서 새로운 서비스들조차도 설정될 수 있슴을 주목한다(예를 들면, 전달 트래픽은 새로운 품질의 서비스(quality of service;QoS) 파라미터들에 의해 변경될 수 있고, 새로운 고객들(C-VLAN들에 의해 구별되는)은 서비스 제공자(802.1ad) 네트워크 등에 부가될 수 있슴)

높은 수준 캐시 개념-통상적

일 실시예는 패킷 스위치 네트워크에 제어 플레인 및 메시지 캐시를 포함한다. 패킷 스위치 네트워크는, 메시지들 또는 메시지들(패킷들)의 단편들이 라우팅 알고리즘(routing algorithm)에 의해 결정되는 것처럼 가장 빠른 루트를 통해 그들 목적지에 전송되는 네트워크이다. 제어 플레인은 데이터 플레인 접속들을 셋업, 유지 및 종료하기 위해 사용되는 가상 네트워크 기능이다. 이러한 기능을 실현하기 위하여 상호 동작할 필요가 있는 네트워크 노드들에 분배되는 면에서 가상적이다. 데이터 플레인은 노드들 사이에 데이터를 분배하는데 사용되는 가상 네트워크 경로이다. 일부 네트워크들은 또한 제어 및 전달 플레인들을 분해할 수도 있다. 용어 캐시는 액세스의 국소성을 이용하도록 관리되는 임의 저장소를 말한다. 메시지 캐시는 메시지들을 저장한다. 메시지 캐시는 실체화되고, 그 메시지들은 제어 플레인이 네트워크에 송신하고 그 네트워크로부터 수신하는 메시지들과 동기 상태로 유지된다. 제어 플레인의 장애시, 캐시는 캐시 메시지들을 송신함으로써 네트워크의 요구들을 충족시킨다. 일단 제어 플레인이 복구되는 경우, 캐시는 제어 동작을 다시 따르고 동기를 유지한다. 캐시는 네트워크에서 트래픽 모두를 여전히 전송하는 동안에 제어 플레인 상태 머신들의 인스턴스들(instances)이 작동하지 않는 것을 허용한다. 이러한 개념은 불안정 네트워크들, 이중 장애들, 및 전달 플레인이 제어 플레인으로부터 독립적이지 못한 시스템들을 제외하고는 대부분의 상황들에서 동작한다. 불안정 네트워크들은 네트워크 엘리먼트의 시나리오들의 전력과 같은 트래픽 흐름 분배가 가동과 같은 안정 상태에 도달하지 못하는 것들이다. 이중 장애들은 한 네트워크 엘리먼트의 제어 플레인 운전 정지에 부가하여 다른 네트워크 엘리먼트들이 결함들 또는 오퍼레이터 구동 재구성들을 경험하는 시나리오들이다.

본 발명은 제어 플레인에 영향을 미치는 소프트웨어 업그레이드 시나리오들과 장애 시의 트래픽 손실을 상당히 최소화시키는 것을 포함한 많은 이점을 가진다. 이러한 이득은 전술된 바와 같이 네트워크 엘리먼트가 캐시 동작을 지원하는 경우 국부적으로 달성된다. 네트워크 엘리먼트의 캐시 특징은 기존의 네트워크에 부가될 수 있다. 다른 장비와의 상호동작성은 다른 장비가 캐시 동작을 지원하지 않아도 가능하다.

도 1은 제어 플레인 프로토콜용 상태 머신(102)이 가동되는 경우, 디폴트 경우에 캐시 개념(100)의 한 예시적인 실시예를 도시한다. 제어 플레인 프로토콜은 임의 종류의 프로토콜, 예를 들면 STP, VLAN 등록 프로토콜, LACP, Y.1711 FFD, 또는 RSVP 리프레쉬일 수 있다. 종래의 네트워크에서, 프로토콜 상태 머신(102)은 인접 노드들(106) 및 나머지 네트워크(108)와 (중개 하드웨어 층들을 통해) 통신한다. 반대로, 상기 실시예는 프로토콜 상태 머신(102)과 네트워크(108) 사이에 설치된 메시지 캐시(104)를 포함한다. 프로토콜 상태 머신(102)은 메시지 캐시(104)에 메시지들을 보내며, 메시지 캐시는 네트워크(108)에 그 메시지들을 전달한다. 메시지 캐시(104)는 버퍼들에 송신 메시지들(110)과 수신 메시지들(112) 모두를 저장함으로써 프로토콜 상태 머신(102)과 네트워크간의 통신을 캡처링한다. 또한, 메시지 캐시(104)는 타이머(114)와 상태 제어기(116)를 포함한다. 선택적으로, 상태 머신(102)은 지원되는 특정 프로토콜에 따라 부가 상태 정보를 상태 제어기(116)에(즉, 변경된 메시지들에 부가하여) 전달할 수 있다. 메시지 캐시(104)의 콘텐트들은 구현되는 제어 플레인 프로토콜에 따라 다르다. 메시지 캐시(104)는 상태 머신(102)의 장애시 네트워크(108)가 필요로 하는 것들을 일시적으로 만족시키는데 필요로 되는 것을 저장한다.

도 2는 프로토콜 상태 머신(102)이 이용 불가능하고 네트워크 상태가 안정적일 때 제어 플레인 장애시 도 1의 캐시 개념(100)의 예시적인 실시예를 도시한다. 메시지 캐시(104)는 네트워크를 계속해서 일시적으로 만족시킴으로써 어떤 이유로 프로토콜 상태 머신이 이용 불가능한 상황들에 대비하여 보호한다. 예를 들면, 프로토콜 상태 머신(102)을 홀딩하는 프로세서는 재부팅할 수 있다. 메시지 캐시(104)는 통상적으로 네트워크(108)의 인접 노드들(106)이 프로토콜 상태 머신이 이용 불가능하다는 것을 인식하지 못하게 되도록 버퍼들로부터의 메시지들을 계속해서 보낸다. 인접 노드들(106)로의 통신은 메시지 캐시(104)에 저장된 정보에 기초하여 모방된다. 따라서, 메시지 캐시(104)는 프로토콜 상태 머신(102)이 이용 불가능한 시간의 적어도 부분을 브리지(bridge)한다. 인접 노드들(106)에 동일 메시지(예를 들면, 헬로우 메시지, 업데이트 메시지)를 주기적으로 송신하는 프로토콜들은 용이하게 모방될 수 있다. 메시지 캐시(104)는 프로토콜 상태 머신(102)과 동일한 방법으로 주기적으로 송신된 메시지 버퍼(110)에 저장된 메시지들을 송신하기 위하여 타이머(114)를 이용한다. 결국, 인접 노드들(106)은 프로토콜 상태 머신(102)의 임의 변화를 검출하지 못한다. 메시지 캐시(104)는 인접 노드들(106)로부터 메시지들을 수신하여 수신 메시지 버퍼(112)에 그것들을 저장한다. 메시지 캐시(104)는 상태 제어기(116)와 수신 메시지들을 조사하여 메시지 캐시(104)를 무효화시키는 네트워크(108)에서 임의 이벤트 또는 변화(예를 들면, 상태 변화)를 검출할 수 있다. 상태 제어기(116)는 메시지 캐시(104)가 유효한지 무효한지의 여부를 판정한다. 메시지 캐시(104)가 무효하게 되는 경우, 그것이 네트워크(108)에서의 이벤트 또는 변화에 대해 적절하게 반응할 수 없기 때문에 송신 메시지들을 중지시킨다.

메시지 캐시(104)는 적어도 프로토콜 상태 머신(102) 일부를 시뮬레이팅(simulate)하는 단순 구성 소자이다. 메시지 캐시(104)의 효율적 구현은 제어 플레인 프로토콜의 완전 작동을 아마도 시뮬레이팅할 수 없다. 메시지 캐시(104)의 단순함 또는 복잡함의 정도는 구현되는 제어 플레인 프로토콜에 따라 다를 수 있다. 예를 들면, 메시지 캐시는 상태 제어기(116)에서 로직으로 프로토콜 상태 머신(102)의 2개 또는 그 이상의 상태들 간의 전이를 시뮬레이팅할 수 있다. 메시지 캐시는 하드웨어, 펌웨어, 또는 소프트웨어(예를 들면, 필드-프로그래머블 게이트 어레이(FPGA) 또는 어플리케이션-특정한 집적 회로(ASIC))로 구현될 수 있다. 메시지 캐시(104)는 환경들에 따라 프로토콜 상태 머신이 이용 불가능한 짧은 시간 또는 전체 시간일 수도 있는 유효한 기간 동안은 프로토콜 상태 머신을 계속해서 모방한다. 일부 프로토콜들은 수 밀리 초 범위 내에서 업데이트를 요구하고, 다른 프로토콜들은 수초 범위 내에서 업데이트를 요구한다. 이 실시예는 상태 제어 로직(116)의 복잡함의 정도 또는 임의 특정 프로토콜에 한정되지 않는다.

도 3은 프로토콜 상태 머신(102)이 이용 불가능하고 네트워크 상태가 불안정한 때 제어 플레인 장애시 대한 도 1의 캐시 개념(100)의 예시적인 실시예를 도시하고 있다. 이 경우에, 메시지 캐시(104)는 무효 상태로 전이한다. 수신 메시지들(112)에 기초하여, 상태 제어기(116)는 메시지 캐시(104)에 의한 프로토콜 상태 머신(102)의 시뮬레이션이 구현되는 특정 프로토콜에 따라 정지하도록 네트워크 상태를 불안정하게 하는 어떤 이벤트가 발생하는 지의 여부를 판정한다. 일단 메시지 캐시(104)가 프로토콜 상태 머신(102)을 시뮬레이팅하는 것을 정지하면, 인접 노드들(106)은 어떤 메시지 캐시(104)도 존재하고 있지 않은 것처럼 프로토콜 상태 머신(102)이 고장났거나 또는 그렇지 않으면 이용 불가능함을 인식하게 될 것이다.

도 4는 상태 머신에 관한 2개 인스턴스들이 존재하는 경우(워커 및 보호) 디폴트 경우에 대한 캐시 개념(400)의 한 예시적인 실시예를 도시하고 있으며, 워커 상태 머신은 가동되고, 보호 상태 머신은 스탠바이이며, 각각은 캐시와 관련된다. 이 실시예는 특정 문맥에서 제어 플레인 프로토콜의 특정 구현이다; 그러나, 본 발명은 임의 특정 구현에 한정되지 않는다. 이 실시예에서, 네트워크 이용가능성은 메시지들을 캐시함으로써 향상된다.

상기 실시예는 블레이드(blade) 서버(도시되지 않음) 문맥에 있다; 그러나, 본 발명은 임의 특정 하드웨어에 한정되지 않는다. 블레이드 서버는 서버 블레이드들로 알려진 복수의 얇은 모듈러 전자 회로 보드들을 하우징하는 서버 샤시이다. 각각의 블레이드는 프로세서들, 메모리, 통합 네트워크 제어기들, 입력/출력(I/O) 포트들을 내장한 카드상의 서버이다. 블레이드 서버들은 개별 블레이드들로서의 라우터들 및 네트워크 스위치들과 같은 기능들의 포함을 점차 허용한다. 2개의 이러한 블레이드들용 상태 머신(SM)들은 도 4에 도시된다: 워커 패킷 스위치(PS)(402)용 워커 상태 머신(406)과 보호 PS(404)용 보호 상태 머신(408). 워커 상태 머신(408)은 초기에 가동되고, 보호 상태 머신(406)은 초기에 스탠바이 상태 이며, 곧 가동되게 된다. 프로토콜 상태 머신의 2가지 인스턴스들(가동/스탠바이)은 상이한 하드웨어(예를 들면, CPU들)에 배치되지만, 동일 네트워크 노드 내에 여전히 배치된다.

상기 실시예는 스패닝 트리 프로토콜(STP)용 보호 상태 머신(404)과 워커 상태 머신(406)을 도시한다; 그러나, 본 발명은 임의 특정 프로토콜에 한정되지 않는다. 스패닝 트리 프로토콜은 임의 브리지 네트워크용 루프 프리 토폴로지(loop free topology)를 제공한다. IEEE 표준 802.1D는 STP를 정의한다. 워커 PS(402) 및 보호 PS(404)는 특정 독립 브리지 파티션(IBP: Independent Bridge Partition)용 STP 상태 머신들(406, 408)과 타이머들(416, 412)을 각각 포함한다. 네트워크 브리지(a/k/a 네트워크 스위치)는 복수 네트워크 세그먼트들(예를 들면, 파티션들, 도메인들)을 접속시키고 한 세그먼트에서 또 다른 세그먼트로 트래픽을 전달한다. 이러한 상태 머신들(406, 408)은 제어 플레인에 있으며, 나머지 네트워크(108)의 인접 노드들(106)에 송신하는 메시지들을 생성한다.

상기 실시예에서, 워커 캐시(410)는 워커 상태 머신(406)과 네트워크(108) 사이에 배치된다. 도 4는 네트워크(108)에 메시지를 송신하고, 그 네트워크로부터 메시지를 수신하며, 워커 캐시(410)에 메시지들을 저장하는 워커 상태 머신(406)이 가동되는 초기 상태를 도시한다. 워커 캐시(410)는 밖으로 송신되는 메시지들(412)과 수신되는 메시지들(414) 모두를 저장한다. 브리지 프로토콜 데이터 유닛(bridge protocol data unit;BPDU)들은 STP 정보를 전하는 프레임들이다. 스위치는 STP 멀티캐스트 어드레스의 소스 어드레스 및 목적지 어드레스로서 포트 자체 의 고유 MAC 어드레스를 이용하여 BPDU 프레임을 송신한다. 보호 캐시(418)는 웜(warm) 스탠바이 상태에 있으며 개시를 대기하는 보호 상태 머신(408)용 캐시 복제에 의해 워커 캐시(410)와 동기화된다.

도 5는 워커 상태 머신(406)이 가동되고 고장났을 때(예를 들면, 소프트웨어 크래시), 스탠바이 상태의 보호 상태 머신(408)이 복구되지만(스탠바이에서 완전 동작으로), 네트워크 상태는 안정적일 때의 중간 상태에 대한 도 4의 캐시 개념(400)의 예시적인 실시예를 도시하고 있다. 중간 상태는, 워커 상태 머신(406)이 고장났을 때의 시간과 보호 상태 머신(408)이 네트워크(108)에 서비스할 준비가 되어 있는 시간(즉, 부팅 후 시작)사이에 지연이 있기 때문에 발생한다. 상기 중간 상태 동안에, 보호 캐시(418)는 이제 가동 캐시이고 도 2에 기술된 바와 같이 동작한다.

도 6은 보호 상태 머신(408)이 가동되고 워커 상태 머신이 스탠바이(워커에서 보호로 스위치한 후)일 때 도 4의 캐시 개념의 예시적인 실시예를 도시하고 있다. 도 4와 도 6을 비교하면, 도 6에 의해 설명되는 시나리오에서 보호 상태 머신(408)은 도 4에 의해 설명되는 시나리오, 즉 가동 상태 머신으로서 동작하는 워커 상태 머신(406)과 유사하게 작동한다. 보호 캐시(418)는 송신되는 메시지들(420)과 수신되는 메시지들(422) 모두를 저장하며, 따라서 도 4에서와 같은 방법으로 동작한다. 보호 상태 머신(408)이 가동되는 동안에, 보호 캐시(418)의 메시지들은 워커 캐시(410)에 복제된다.

도 7은 도 4의 워커 상태 머신(406), 보호 상태 머신(408) 및 보호 캐 시(418)에 대한 시간 라인상의 선택된 상태 전이들과 이벤트들을 도시하는 챠트이다. (아래 표 1은 표의 형태로 도 7을 설명함) 도 7은 보호 캐시(418)가 유효 상태이고 네트워크(108)의 요구들을 일시적으로 제공하기 위하여 사용될 수 있을 때와 보호 캐시(418)가 무효 상태이고 사용될 수 없을 때의 상태들의 다양한 결합들을 도시하고 있다. 도 7은 몇몇 시나리오들을 도시하고 있다. 제 1 시나리오는 T₁에서 T₅로이고, 제 2 시나리오는 T₅서 T₉로이고, 제 3 시나리오는 T₉에서 T₁₂로이다.

제 1 시나리오는 T₁에서 개시한다. T₁에서, 워커 상태 머신(406)이 가동 상태에 있고, 보호 상태 머신(408)이 동기 상태에 있을 때, 보호 캐시(418)는 무효 상태이고 워커 캐시(410)를 복제한다. 예를 들면, 보호 PS(404) 블레이드가 네트워크 엘리먼트에 부가되었기 때문에 보호 상태 머신(408)은 초기에 동기 상태에 있다. 동기가 T₂에서 완료될 때, 보호 상태 머신(408)은 동기에서 스탠바이로 전이하고 보호 캐시(418)는 준비되어 있으며 비가동상태이다. T₃에서 장애가 발생할 경우, 워커 상태 머신(406)은 가동 상태에서 장애 상태로 전이하고, 보호 상태 머신(408)은 스탠바이에서 개시로 전이하고(즉, 가동 역할을 대신할 준비가 되어 있음), 보호 캐시(418)는 준비가 되어 있고 송신한다(즉, 네트워크(108)의 필요들을 일시적으로 제공함). T₃으로부터 전방 간격 동안에, 워커 상태 머신(406)은 장애 상태에서 동기중(예를 들면, 재부팅의 결과로서)로 전이한다. 네트워크 엘리먼트의 예상 작동에 있어서 정확한 시간들은 중요하지 않다. 그것들은 구현에 따르며, 따라서 명확하게 나타나지 않는다. T₄에서, 보호 상태 머신(408)은 개시에서 가동 상태로 전이하고 보호 캐시(418)는 업데이트한다(즉, 가동 프로토콜 상태 머신(408)과 계속해서 동기화시킴으로써 수동적 역할을 함). T₃ 으로부터 전방 간격 동안에, 워커 상태 머신(406)은 동기중에서 스탠바이로 전이한다. 이것이 행해진 이후에, T₅에서 보호 상태 머신(408)은 가동되고 워커 상태 머신(406)은 스탠바이 상태이다.

제 2 시나리오는 T₅에서 개시한다. T₅에서, 워커 상태 머신(406)은 가동 상태이고, 보호 상태 머신(408)은 동기중이 되고, 보호 캐시(418)는 무효 상태이다. T₆에서, 보호 상태 머신(408)은 동기중에서 스탠바이 상태로 전이하고, 보호 캐시(418)는 준비되어 있고 비가동 상태이다. 네트워크 재구성이 T₇에서 발생하는 경우에(예를 들면, 네트워크 엘리먼트의 장애의 경우), 워커 상태 머신(406)은 가동에서 재구성 상태로 전이하고 보호 캐시(418)는 T₇에서 무효로 된다. 간격 T₇ 내지 T₈ 동안에, 워커 상태 머신(406)은 네트워크의 상태 변화를 다룬다. 네트워크가 T₈에서 안정된 후에, 워커 상태 머신(406)은 재구성에서 가동 상태로 전이하고, 보호 캐시(418)는 준비 상태로 되고 다시 비가동 상태로 된다.

제 3 시나리오는 T₉에서 개시하고 이벤트들 순서에서 제 2 시나리오와는 다르다. T₉에서, 워커 상태 머신(406)은 가동되고, 보호 상태 머신(408)은 동기중이 되고, 보호 캐시(418)는 무효 상태이다. 네트워크 재구성은 T₉내지 T₁₁의 간격 동안에 발생한다. T₁₀에서, 워커 상태 머신(406)은 가동 상태에서 재구성 상태로 전이한다. T₁₁에서, 보호 상태 머신(408)은 동기중 상태에서 스탠바이 상태로 전이한다. 보호 캐시(418)는 워커 상태 머신(406)이 재구성 상태에서 가동 상태로 전이할 때, T₁₂가 될 때까지 무효 상태에서 준비 상태, 비가동 상태로 전이하지 않는다.

표 1 PS 상태 머신 및 캐시 상태들의 기술

네트워크 상태	워커 PS	보호 PS			도 7로의 참조
네트워크 상태	SM의 상태	SM의 상태	캐시의 상태	캐시의 활동상태	도 7로의 참조
네트워크는 안정 상태에 있다	가동	스탠바이 및 동기화	준비	동기화, 비가동	T₂-T₃/T₆-T₇/T₈-T₉
	가동	동기화 중	무효	동기화 중, 비가동	T₁-T₂/T₅-T₆/T₉-T₁₀
	장애 또는 수동 스위치	시작	준비	BPDU 송신	T₃-T₄
		시작	무효	비가동	도시 안됨
		가동	비가동	업데이팅 중	T₄-T₅
네트워크는 재구성을 수행한다	국지적 상태들을 재구성	스탠바이 및 동기화	무효	동기화 중, 비가동	T₇-T₈/T₁₁-T₁₂
	국지적 상태들을 재구성	동기화 중	무효	동기화중, 비가동	T₁₀-T₂₂
	장애 또는 수동 스위치	시작	무효	동기화 중, 비가동	도시 안됨
	장애 또는 수동 스위치	가동	업데이팅	업데이팅 중	도시 안됨

일 실시예에서, 독립 브리지 파티션마다 하나의 캐시 인스턴스가 있다. 각각의 독립 브리지 파티션은 독립 동작들 및 재구성들을 보장하기 위하여 자신의 캐시 구현을 갖는다.

일 실시예에서, 포트마다 2개의 캐시 엔트리들이 있다: 하나는 인입(incoming) PDU용이고, 다른 하나는 출장(outgoing) PDU용이다. 각각의 포트는 특정 포트 상태를 가진다. 브리지의 상태에 따라서, PDU들은 송신, 수신 또는 송수신된다. 캐시는 송신 또는 수신되는 PDU들을 기억하는 것뿐만 아니라, 어떠한 PDU들도 반드시 송신 또는 수신될 필요가 없슴도 기억한다. 일부 포트들에서 PDU 송신/수신이 네트워크 수렴 처리 동안에 어떤 시점에서 정지하게 되는 것, 즉 캐시가 네트워크 수렴들 이후에만 충전된다는 것에 주목한다.

일 실시예에서, 캐시들은 핫-스탠바이(hot-standby) 모드로 유지된다.

일 실시예에서, 캐시들은 PDU 발생에 그것들이 유효한 지의 여부를 나타내는 플래그를 전달한다. 다양한 상황들은, 예를 들어, 스패닝 트리의 계산 및 BPDU들의 변화 등을 요구하는 네트워크에서 현재 진행중인 재구성들과 같은 캐시들의 무효화를 야기할 수 있다.

일 실시예에서, 가동 PS의 캐시는 인입 및 출장 PUS들에 의해 업데이트된다.

일 실시예에서, 스탠바이 PS의 캐시는 다음 조건들에서 즉각 무효화가 된다: 네트워크 제공된 PDU들이 캐시 콘텐트와 상이한 경우와 PDU들이 캐시 콘텐트와 상이한 경우. 양자의 차이들은 워킹 스패닝 트리 상태 머신에 의해서만 처리될 수 있는 네트워크에서의 변화를 나타내는 것에 주목한다. 시간이 늦은 PDU들의 임의 복제는 고객 트래픽과 스패닝 트리의 수렴에 심각한 영향을 초래할 수 있다. 예를 들면, 루프들이 생성될 수 있다. 가동 워커 PS의 경우에 무효가 되는 것은 보호(스탠바이) PS 상의 캐시임에 주목한다. 워커 PS가 고장나고 보호 PS가 스탠바이에서 가동 상태로 전이하는 경우에, 보호 PS'의 캐시는 무효화가 된다. 캐시가 단지 PS 복구시킬 때에만 무효가 되는 경우를 무시하고 모든 포트 상태들을 변화시킬 필요가 있슴을 주목한다.

일 실시예에서, 캐시는 토폴로지가 수렴되는 경우에만 유효하다고 단언될 수 있다. 수렴 과정 동안에, 가동 상태 머신이 요구된다. 네트워크 수렴 기간의 끝이 프로토콜 상태 머신에 의해 언급되거나 또는 상당히 장기간 안정된 네트워크 상태로부터 유도될 수 있다는 것에 주목한다. 이것은 수 초에 걸쳐 PDU들에서 트랙킹 변화들을 요구할 것이다. 이것은 시스템(네트워크)이 장비 보호 스위치들에 영향을 받기 쉬운 시간에 부가되지만, 트래픽에 영향을 미치는 네트워크 구성이 이미 발생한 후에 일어난다. 스위치 이후에 그리고 불안정된 네트워크에서, 그 회복 이후에 상태 머신으로부터 발생되는 PDU들이 캐시의 것들에 변경이 없고, 즉 상기 상황에서 토폴로지는 둘다 홀딩될 때 수렴되는 것으로 고려될 수 있다. 캐시는 가동되고 상태 머신으로부터 송신되는 제 1 PDU에 의해 비가동 상태로 설정된다. 캐시의 모든 PDU들은 캐시가 비활동화되는 시간 이후 상태 머신으로부터 PDU들에 의해 적어도 한번은 업데이트되었다.

일 실시예에서, 캐시는 스탠바이 PS가 완전히 동기화되는 경우에만 유효하다고 단언될 수 있다.

일 실시예에서, 캐시로부터 PDU 발생을 트리거링하는 타이머가 있다. 가동 상태 PDU들로 보호 PS 상태 변화가 캐시로부터 전송되는 경우에, 그것을 유효하다고 플래그(flag)된다. 이를 위해, 적정 반복 타이머(및 허용 기간 동안 분배)가 개시된다. 캐시가 유효하게 플래깅되는 경우 PDU들이 캐시로부터 생성되는 상태는 가동 상태로 개시한다. 그것은 상이한 PDU들이 네트워크로부터 수신되거나 상태 머신이 모두 복구되는 경우에 종료한다. 이것은 상태 머신이 네트워크로의 PDU들 송신을 개시한다는 사실에 의해 인지될 수 있다. 상태 머신이 요구되는 시간 간격에서 모든 나머지 PDU들을 송신할 수 있기 때문에, 제 1 PDU는 캐시 가동을 정지시키도록 트리거로서 사용될 수 있다.

도 8은 분배 캐시에 관한 한 예시적인 실시예를 도시하고 있다. 상기 일례는 시스템용 싱글 메시지 캐시에 대립하는 것으로 시스템 내에 메시지 캐시가 분배될 수 있는 방법을 나타낸다. 이 일례에서, 주기적 메시지 캐시(810)는 2개의 입력/출력(I/O) 팩들(802)에 분배된다. I/O 팩들의 수는 물론 2개에 한정되지 않는다. 각각의 I/O 팩(802)은 패킷 전달 하드웨어(810) 및 보드 제어기(808)를 포함한다. 로컬 노드(804)는 패킷 전달 하드웨어(812)와 하나 또는 그 이상의 중앙 패킷 제어 플레인 프로세서들(814)을 포함한다. 중앙 패킷 제어 플레인 프로세서(814)는 I/O 팩들(802)의 보드 제어기들(808) 상에서 주기적 메시지 캐시(810)로 업데이트들을 전송한다. 주기적 메시지 캐시(810)는 I/O 팩(802)의 패킷 전달 하드웨어(810)를 통해 출장 주기적 메시지들을 전송한다. 이 방법에서, 주기적 메시지 캐시들(810)은 제어 플레인 상태 머신이 이용 불가능하거나 또는 고장났을 때 제어 플레인 프로토콜을 시뮬레이팅한다. 어플리케이션 프로토콜들은, 예를 들면 (R)STP, GVRP, RSVP, 개방 최단 경로 우선(open shortest path first: OSPF), 중간 시스템 대 중간 시스템(IS-IS 또는 ISIS), Y.1711, FFD 등 같이 일정 콘텐트를 갖는 주기적 출장 메시지들을 가지는 임의 프로토콜들을 포함한다. 물론, 메시지 캐시들은 많은 상이한 시스템 구조들에 대하여 많은 다른 방법들로 광범위하게 구현될 수 있다. 예를 들면, 메시지 캐시들은 몇몇 하드웨어 블레이드들에, 몇몇 컴퓨터 처리 유닛(CPU)들에, 한 CPU내의 몇몇 스레드들에, FPGA들, ASIC들 등에 있을 수 있다.

본 발명의 실시예들은 네트워크 시스템의 하나 또는 그 이상의 컴퓨터들에서 구현될 수 있다. 각각의 컴퓨터는 프로세서뿐만 아니라 다양한 프로그램들 및 데이터를 저장하는 메모리도 포함한다. 메모리는 또한 프로그램들을 지원하는 오퍼레이팅 시스템을 저장할 수도 있다. 프로세서는 전원 공급장치들, 클럭 회로, 캐시 메모리 등과 같은 종래의 지원 회로뿐만 아니라, 메모리에 저장된 소프트웨어 루틴들을 실행할 때 도움이 되는 회로들과 협동하여 동작한다. 그래서, 소프트웨어 방법들로서 본 명세서에서 논의된 단계들 중 일부가 하드웨어, 예를 들면 다양한 방법 단계들을 수행하기 위한 프로세서와 협동하여 동작하는 회로 내에서 구현될 수 있슴을 알 수 있다. 또한, 컴퓨터는 컴퓨터와 통신하는 다양한 기능 엘리먼트들간의 인터페이스를 형성하는 입력/출력(I/O) 회로를 포함한다. 본 발명의 실시예들은 하드웨어 또는 펌웨어, 예를 들면 FPGA들 또는 ASIC들에서 구현될 수 있다.

본 발명은 컴퓨터 프로그램 제품으로서 구현될 수 있고, 컴퓨터 명령들이 컴퓨터에 의해 처리될 경우 본 발명의 방법들 및/또는 기술들이 야기되거나 또는 그렇지 않으면 제공되도록 컴퓨터 동작을 적합하게 한다. 본 발명의 방법들을 야기하는 명령들은 고정 또는 착탈 가능 매체에 저장되고, 방송 매체 또는 다른 신호-전달 매체에서 데이터 스트림에 의해 전송되고, 그리고/또는 명령들에 따라 동작하는 컴퓨팅 디바이스 내의 워킹 메모리(working memory) 내에 저장된다.

본 발명의 다양한 실시예들에 관해 전술되었지만, 본 발명의 다른 및 추가 실시예들이 그것의 기본 범위에서 벗어나지 않게 고안될 수 있다. 그래서, 본 발명의 적정 범위는 첨부된 청구범위에 따라 결정되어야 한다.

Claims

로컬 노드의 프로토콜 상태 머신에 장애가 있는 동안 무중단 네트워크 제어 통신(uninterrupted network control communication)을 제공하기 위한 방법에 있어서,

상기 프로토콜 상태 머신의 적어도 일부를 시뮬레이팅하도록 적응된 메시지 캐시로 보내기 위한 복수의 송신 메시지들을 상기 프로토콜 상태 머신(protocol state machine)으로부터 수신하는 단계;

네트워크의 복수의 노드들로 상기 송신 메시지들을 전달하는 단계;

상기 노드들로부터 복수의 수신 메시지들을 수신하는 단계;

상기 메시지 캐시의 적어도 하나의 버퍼에 상기 송신 및 수신된 메시지들을 저장하는 단계; 및

상기 메시지 캐시가 유효 상태에 있는 한, 상기 프로토콜 상태 머신의 장애시, 상기 노드들로 메시지들을 송신하고 상기 노드들로부터 메시지들을 수신하는 단계를 포함하는 무중단 네트워크 제어 통신 제공 방법.
제 1 항에 있어서, 상기 메시지들은 상기 노드들로 주기적으로 송신되는 무중단 네트워크 제어 통신 제공 방법.
제 1 항에 있어서,

상기 버퍼의 상기 송신 및 수신 메시지들과 상기 장애가 있은 후에, 상기 노드들로부터 수신된 메시지들에 기초하여 상기 버퍼가 유효한 지의 여부를 판정하는 단계를 더 포함하는 무중단 네트워크 제어 통신 제공 방법.
제 1 항에 있어서,

상기 프로토콜 상태 머신의 장애시, 스탠바이 프로토콜 상태 머신으로 스위칭하는 단계를 더 포함하며, 상기 스탠바이 프로토콜 상태 머신은 상기 송신 및 수신 메시지들의 복제들을 포함하는 또 다른 버퍼를 포함하는 무중단 네트워크 제어 통신 제공 방법.
로컬 노드의 프로토콜 상태 머신에 장애가 있는 동안 무중단 네트워크 제어 통신을 제공하기 위한 시스템에 있어서,

복수의 메시지들을 발생하는 프로토콜 상태 머신; 및

상기 프로토콜 상태 머신으로부터 상기 메시지들을 수신하여, 네트워크의 복수의 노드들에 상기 메시지들을 전달하는 메시지 캐시로서, 상기 프로토콜 상태 머신의 적어도 일부를 시뮬레이팅하도록 적응된 메시지 캐시는 상기 노드들로부터 수신된 메시지들과 상기 노드들로 송신된 메시지들 둘다를 상기 메시지 캐시에 저장하는, 상기 메시지 캐시를 포함하고,

상기 메시지 캐시는, 상기 메시지 캐시가 유효 상태에 있는 한, 상기 프로토콜 상태 머신의 장애시, 상기 노드들로 메시지들을 송신하고 상기 노드들로부터 메시지를 수신하는 무중단 네트워크 제어 통신 제공 시스템.
제 5 항에 있어서, 상기 메시지 캐시는 상기 노드들로 주기적 메시지들을 송신하기 위한 타이머를 포함하는 무중단 네트워크 제어 통신 제공 시스템.
제 5 항에 있어서, 상기 메시지 캐시는 상기 메시지 캐시가 유효한지의 여부를 판정하는 상태 제어기(status control)를 포함하는 무중단 네트워크 제어 통신 제공 시스템.
제 7 항에 있어서, 상기 프로토콜 상태 머신은 워커 프로토콜 상태 머신(worker protocol state machine)이며, 상기 메시지 캐시는 워커 메시지 캐시이고, 워커 노드는 상기 워커 프로토콜 상태 머신과 상기 워커 메시지 캐시를 포함하며,

보호 프로토콜 상태 머신 및 보호 메시지 캐시를 포함하는 보호 노드를 더 포함하며,

상기 보호 상태 머신은 상기 워커 프로토콜 상태 머신의 장애시 가동되게 할 수 있는 무중단 네트워크 제어 통신 제공 시스템.
제 8 항에 있어서, 상기 워커 프로토콜 상태 머신이 가동되는 동안 상기 보호 메시지 캐시는 상기 워커 메시지 캐시를 복제하는 무중단 네트워크 제어 통신 제공 시스템.
로컬 노드의 프로토콜 상태 머신에 장애가 있는 동안 무중단 네트워크 제어 통신을 제공하기 위한 방법을 수행하기 위한 명령들을 저장한 컴퓨터 판독 가능 매체로서, 상기 방법은:

상기 프로토콜 상태 머신의 적어도 일부를 시뮬레이팅하도록 적응된 메시지 캐시로 보내기 위한 복수의 송신 메시지들을 상기 프로토콜 상태 머신으로부터 수신하는 단계;

네트워크의 복수의 노드들로 상기 송신 메시지들을 전달하는 단계;

상기 노드들로부터 복수의 수신 메시지들을 수신하는 단계;

상기 메시지 캐시에 상기 송신 및 수신 메시지들을 저장하는 단계; 및

상기 메시지 캐시가 유효 상태에 있는 한, 상기 프로토콜 상태 머신의 장애시, 상기 노드들로 메시지들을 송신하고 상기 노드들로부터 메시지들을 수신하는 단계를 포함하는 컴퓨터 판독 가능 매체.