KR20200072941A - 실시간 오류 감지를 통한 vrrp 기반의 네트워크 장애 대응 방법 및 장치 - Google Patents

실시간 오류 감지를 통한 vrrp 기반의 네트워크 장애 대응 방법 및 장치 Download PDF

Info

Publication number
KR20200072941A
KR20200072941A KR1020180161077A KR20180161077A KR20200072941A KR 20200072941 A KR20200072941 A KR 20200072941A KR 1020180161077 A KR1020180161077 A KR 1020180161077A KR 20180161077 A KR20180161077 A KR 20180161077A KR 20200072941 A KR20200072941 A KR 20200072941A
Authority
KR
South Korea
Prior art keywords
vrrp
router
session
engine
present
Prior art date
Application number
KR1020180161077A
Other languages
English (en)
Inventor
이창식
김선철
류호용
Original Assignee
한국전자통신연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국전자통신연구원 filed Critical 한국전자통신연구원
Priority to KR1020180161077A priority Critical patent/KR20200072941A/ko
Publication of KR20200072941A publication Critical patent/KR20200072941A/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/28Routing or path finding of packets in data switching networks using route fault recovery
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery
    • H04L41/0668Management of faults, events, alarms or notifications using network fault recovery by dynamic selection of recovery network elements, e.g. replacement by the most appropriate element after failure
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/08Configuration management of networks or network elements
    • H04L41/085Retrieval of network configuration; Tracking network configuration history
    • H04L41/0853Retrieval of network configuration; Tracking network configuration history by actively collecting configuration information or by backing up configuration information
    • H04L41/0856Retrieval of network configuration; Tracking network configuration history by actively collecting configuration information or by backing up configuration information by backing up or archiving configuration information
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/10Active monitoring, e.g. heartbeat, ping or trace-route
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/58Association of routers
    • H04L45/586Association of routers of virtual routers

Abstract

본 발명은 VRRP(Virtual Router Redundancy Protocol) 백업 라우터가 네트워크 장애를 추적하는 방법 및 장치에 대한 것으로 링크(link) 상태 변화 발생시 이벤트 메시지를 수신하고, 이벤트 메시지에 포함된 정보를 분석하여, 분석된 정보에 기초하여 상기 백업 라우터가 마스터 라우터로 전환되되, 이벤트 메시지에는 세션 상태가 포함되고, 이벤트 메시지에 포함된 세션 상태와 현재의 세션 상태가 다른 경우 백업 라우터가 상기 마스터 라우터로 전환되는 방법이 개시된다.

Description

실시간 오류 감지를 통한 VRRP 기반의 네트워크 장애 대응 방법 및 장치{Method and apparatus for handling VRRP(Virtual Router Redundancy Protocol)-based network failure using real-time fault detection}
본 발명은 네트워크 장애 발생시, 이를 빠르게 감지하여 VRRP(Virtual Router Redundancy Protocol) 백업 라우터에게 알려줌으로써 신속하게 마스터 라우터로 전환할 수 있도록 하는, 고가용 네트워크 서비스를 제공하는 기술에 관한 것이다.
전통적 방식의 WAN(wide area network) 관리는 엔터프라이즈 네트워크를 운영하는 측면에서 가장 비용이 많이 들고 융통성이 떨어지는 부분이었다. 이러한 부담을 완화하기 위해 SD-WAN(Software Defined WAN)이라는 기술이 도입 되었고, 이를 통해 기업들이 비즈니스급 IP VPN(Virtual private network), 광대역 인터넷, 무선 서비스로 구성된 스마트한 WAN을 신속하게 구축할 수 있다. 특히, SD-WAN은 가상 CPE(고객 댁내 장비)에서 실행되는 소프트웨어에 내장되는 경우 모든 퍼블릭/프라이빗 회선 서비스의 상태를 모니터링하고 그에 따라 각각의 애플리케이션 트래픽 유형을 라우팅하는 방법을 결정한다.
예를 들어, 기본적으로 MPLS VPN 서비스를 통해 VoIP 트래픽을 전송하다가, MPLS 연결이 정체될 경우 해당 트래픽을 광대역 인터넷 또는 4G LTE 무선 서킷으로 전환할 수 있다. 이러한 방식으로 자동 로드 밸런싱과 네트워크 정체 관리를 지원함에도 불구하고, SD-WAN이 탑재된 CPE 자체에 문제가 생기거나 이와 연결된 L2 링크가 끊어질 경우에는, LAN(Local Area Network) 구간에 속한 클라이언트들에게 서비스 제공이 어려워진다.
이러한 상황을 대비하고자, 게이트웨이 역할을 하는 라우터를 이중화하여 현재 서비스하고 있는 장비에 문제가 생기거나 링크가 끊어졌을 경우, 대기하고 있던 다른 장비를 통해 서비스를 재개하는 "라우터 이중화 기술"을 도입 할 수 있다. 라우터 이중화 방법에는 여러 가지가 있지만, 본 발명에서는 오픈 소스기반으로 많이 활용되고 있는 Virtual Redundancy Router Protocol (VRRP) 을 다룬다.
VRRP 는 LAN 상에 존재하는 2개 이상의 라우터들 간에 마스터 라우터와 백업 라우터를 지정하고 마스터에 의해 운영되는 가상 라우터를 둠으로써, 링크 단절 시에도 사용자 단말들이 중단 없는 망 서비스를 받을 수 있도록 하는 내고장성 라우터 지원용 프로토콜이다. 마스터 라우터는 Advertisement Interval 마다 VRRP Advertisement 패킷을 보냄으로써 자신의 존재를 알리고, 백업 라우터는 이를 읽음으로써 마스터 라우터의 존재를 감지한다. 일반적으로 Advertisement Interval은 1초의 값을 가진다. 만약, 정상적인 VRRP Advertisement 패킷이 일정 시간 동안 수신되지 않을 경우에는 백업 라우터가 마스터 라우터로 전환하여 가상 라우터의 역할을 하게 된다. 백업 라우터에서 마스터 라우터로 전환 시에는, 가상의 IP 주소와 MAC 주소를 기존 마스터 라우터의 주소 값과 동일하게 설정함으로써, LAN 환경의 사용자 단말들에게 네트워크 이중화 기능을 제공한다.
백업 라우터가 마스터 라우터로 전환하기 위한 장치로써 Master Down Timer가 동작하는데, 일반적으로 Master Down Timer 는 (3 x Advertisement Interval + Skew time) 초의 시간을 가진다. Skew time은 여러 백업 라우터가 동시에 마스터 라우터로 전환되는 것을 막기 위해 차이를 주기 위한 것이며, ((256 - Priority) / 256) 초의 값을 가진다. Master Down Timer는 정상적인 Advertisement 패킷이 수신되고, 해당 패킷에 담긴 Priority 값이 자신의 Priority 보다 높을 때마다 초기화된다. 만약, 정상적인 VRRP 패킷이 계속해서 수신되지 않아서 Master Down Timer가 만료될 경우, 해당 백업 라우터는 마스터 라우터에 장애가 발생한 것으로 간주하여 자신이 마스터 라우터로 전환한다.
최근 real-time video streaming, virtual reality, augmented reality 등의 time-sensitive 어플리케이션이 급증하면서, 단절 없는 네트워크 서비스에 대한 요구사항도 높아졌다. 하지만 기존의 VRRP 동작 구조에서는 네트워크 장애 발생 후 서비스 재개를 위해 3초 이상의 fail-over 시간이 소요되며, 이는 time-sensitive한 어플리케이션 요구사항을 만족시키기엔 부족하다.
이를 위해 본 발명에서는 네트워크 장애가 발생했을 경우, 이를 빠르게 감지하고 신속하게 백업 라우터에게 알려줌으로써 백업 라우터가 빠르게 마스터 라우터로 전환하여 네트워크 서비스 단절을 최소화하는 방법을 제안한다.
본 발명은 기존의 VRRP 라우터 동작 구조에서 백업 라우터가 네트워크 장애를 감지하여 마스터 라우터로 전환하기까지의 과정이 비효율적으로 느리다는 것을 인지하고, 이러한 상황에서 신속한 장애 감지와 빠른 역할 전환을 통해 단절 없는 네트워크 서비스 제공을 달성하는데 목적이 있다.
본 발명에서 이루고자 하는 기술적 과제들은 이상에서 언급한 기술적 과제들로 제한되지 않으며, 언급하지 않은 또 다른 기술적 과제들은 아래의 기재로부터 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 명확하게 이해될 수 있을 것이다.
본 발명에 의해 VRRP(Virtual Router Redundancy Protocol) 백업 라우터가 네트워크 장애를 추적하는 방법 및 장치가 개시될 수 있다.
VRRP 백업 라우터가 네트워크 장애를 추적하는 방법은 방법 링크(link) 상태 변화 발생시 이벤트 메시지를 수신하는 단계, 이벤트 메시지에 포함된 정보를 분석하는 단계 및 분석된 정보에 기초하여 백업 라우터가 마스터 라우터로 전환되는 단계를 포함한다.
이때 이벤트 메시지에는 세션 상태가 포함되고, 이벤트 메시지에 포함된 세션 상태와 현재의 세션 상태가 다른 경우 백업 라우터가 마스터 라우터로 전환될 수 있다.
본 발명에서 제안하는 방식을 이용하면 다음과 같은 장점이 있다.
첫째, 네트워크 장애 발생 시, 이를 신속하게 감지할 수 있다. 이를 위해 사용되는 BFD 패킷은 낮은 오버헤드를 가지며, 라우터 내부에서 동작하는 다른 프로토콜과 독립적으로 동작하기 때문에 기존 프로토톨과 연동이 쉬운 특징을 가지고 있다.
둘째, 네트워크 장애 감지 후, 백업 라우터가 신속하게 마스터 라우터로 전환하여 동작을 함으로써 끊김 없는 네트워크 서비스를 제공할 수 있다. 기존의 VRRP 라우터는 마스터 라우터에 장애가 발생하여도 내부에서 동작하는 VRRP 타이머가 만료되기 전까지 백업 라우터가 대기 상태로 있기 때문에, 그 동안 네트워크 서비스 단절이 발생한다. 본 발명에서 제안하는 방식을 사용하여, 장애 복구 시간을 최대한 단축할 수 있다.
본 발명에서 얻을 수 있는 효과는 이상에서 언급한 효과들로 제한되지 않으며, 언급하지 않은 또 다른 효과들은 아래의 기재로부터 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 명확하게 이해될 수 있을 것이다.
도 1은 기존의 VRRP 동작 환경에 대한 도면이다.
도 2는 기존의 VRRP 백업 라우터가 마스터 라우터로 전환하기 위한 과정을 나타낸 것이다.
도 3은 본 발명의 일 실시예에 따른 VRRP 라우터 동작 구조를 나타낸 도면이다.
도 4는 본 발명의 일 실시예에 따른 session 이벤트 처리의 흐름도를 나타낸 것이다.
도 5는 본 발명의 일 실시예에 따른 Session 등록 또는 제거 요청을 위한 IPC 메세지 구조를 나타낸 도면이다.
도 6은 본 발명의 일 실시예에 따른 Session 등록 또는 제거 요청에 대한 응답 IPC 메세지 구조를 나타낸 도면이다.
도 7은 본 발명의 일 실시예에 따른 Session 상태 변화에 대한 Event 메세지 구조를 나타낸 도면이다.
도 8은 본 발명의 일 실시예에 따른 VRRP(Virtual Router Redundancy Protocol) 백업 라우터가 네트워크 장애를 추적하는 방법에 대한 흐름도이다.
이하에서는 첨부한 도면을 참고로 하여 본 발명의 실시 예에 대하여 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 상세히 설명한다. 그러나, 본 발명은 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시 예에 한정되지 않는다.
본 발명의 실시 예를 설명함에 있어서 공지 구성 또는 기능에 대한 구체적인 설명이 본 발명의 요지를 흐릴 수 있다고 판단되는 경우에는 그에 대한 상세한 설명은 생략한다. 그리고, 도면에서 본 발명에 대한 설명과 관계없는 부분은 생략하였으며, 유사한 부분에 대해서는 유사한 도면 부호를 붙였다.
본 발명에 있어서, 어떤 구성요소가 다른 구성요소와 "연결", "결합" 또는 "접속"되어 있다고 할 때, 이는 직접적인 연결관계뿐만 아니라, 그 중간에 또 다른 구성요소가 존재하는 간접적인 연결관계도 포함할 수 있다. 또한 어떤 구성요소가 다른 구성요소를 "포함한다" 또는 "가진다"고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 배제하는 것이 아니라 또 다른 구성요소를 더 포함할 수 있는 것을 의미한다.
본 발명에 있어서, 제1, 제2 등의 용어는 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용되며, 특별히 언급되지 않는 한 구성요소들간의 순서 또는 중요도 등을 한정하지 않는다. 따라서, 본 발명의 범위 내에서 일 실시 예에서의 제1 구성요소는 다른 실시 예에서 제2 구성요소라고 칭할 수도 있고, 마찬가지로 일 실시 예에서의 제2 구성요소를 다른 실시 예에서 제1 구성요소라고 칭할 수도 있다.
본 발명에 있어서, 서로 구별되는 구성요소들은 각각의 특징을 명확하게 설명하기 위함이며, 구성요소들이 반드시 분리되는 것을 의미하지는 않는다. 즉, 복수의 구성요소가 통합되어 하나의 하드웨어 또는 소프트웨어 단위로 이루어질 수도 있고, 하나의 구성요소가 분산되어 복수의 하드웨어 또는 소프트웨어 단위로 이루어질 수도 있다. 따라서, 별도로 언급하지 않더라도 이와 같이 통합된 또는 분산된 실시 예도 본 발명의 범위에 포함된다.
본 발명에 있어서, 다양한 실시 예에서 설명하는 구성요소들이 반드시 필수적인 구성요소들은 의미하는 것은 아니며, 일부는 선택적인 구성요소일 수 있다. 따라서, 일 실시 예에서 설명하는 구성요소들의 부분집합으로 구성되는 실시예도 본 발명의 범위에 포함된다. 또한, 다양한 실시 예에서 설명하는 구성요소들에 추가적으로 다른 구성요소를 포함하는 실시 예도 본 발명의 범위에 포함된다.
본 발명은 네트워크 장애 발생 시 신속한 장애 감지 및 고가용 네트워크 서비스 제공을 위한 게이트웨이 이중화 제어 방법 및 장치에 대한 것이다.
이하에서는, 본 발명의 실시예에 장치 및 방법을 첨부한 도면들을 참조하여 설명한다. 본 발명에 따른 동작 및 작용을 이해하는데 필요한 부분을 중심으로 상세히 설명한다.
도 1은 기존의 VRRP 동작 환경에 대한 도면이다.
도 1은 기존의 VRRP 라우터가 동작하는 구조를 나타낸 것이다. Router 1(101)이 마스터 라우터로, Router 2(102)는 백업 라우터로 동작하는 상황이다.
Client (103,104,105,106)들은 현재 설정되어 있는 마스터 라우터를 통하여 외부 Network(107) 와 통신이 가능한 상황이다. 이러한 상황에서 마스터 라우터 기능에 이상이 생겼거나 마스터 라우터에 연결된 링크가 끊어졌을 경우, 대기 상태에 있던 백업 라우터가 마스터 라우터로 전환하여 기존의 마스터 라우터 대신 패킷 포워딩 및 라우팅 역할을 수행하여야 한다.
도 2는 기존의 VRRP 백업 라우터가 마스터 라우터로 전환하기 위한 과정을 나타낸 것이다.
라우터가 Advertisement 패킷을 수신(S201) 하면, 해당 패킷이 동일한 그룹의 마스터 라우터가 보낸 것인지, 가상의 IP 주소 값이 동일한지 등의 유효성 검사 (S202)를 하게 된다.
유효한 패킷일 경우, 해당 패킷에 적힌 우선순위 값이 자신의 우선순위 보다 높은지 비교(S203)하여 높을 경우에만 Master Down Timer를 초기화(S204)하여 재가동시키고, 그렇지 않을 경우에는 해당 Advertisement 패킷을 무시(S205)한다.
이와 같이, 기존의 VRRP 백업 라우터는 일정시간 Advertisement 패킷을 수신하지 못하여 'Master Down Timer'가 만료될 경우 (S206)에만 마스터 라우터로 전환(S207)된다.
VRRP 백업 라우터가 마스터 라우터로 전환된 후에는 Advertisement 패킷을 전송(S208)함으로써 자신의 존재를 다른 VRRP 라우터들에게 알리게 된다.
이러한 타이머에 기반한 동작 구조는 네트워크 장애가 발생하더라도 타이머가 만료될 때까지 기다려야 하므로, 그 동안 네트워크 서비스가 단절된다는 단점을 가지고 있다. 따라서, 네트워크 장애가 발생한 상황에서도 Client들에게 끊김 없는 고가용 네트워크 서비스를 제공하기 위해서는 네트워크 장애를 실시간으로 감지하고 이에 즉각적으로 대응하는 매커니즘이 필요하다.
도 3은 본 발명의 일 실시예에 따른 VRRP 라우터 동작 구조를 나타낸 도면이다.
보다 상세하게는 도 3은 본 발명에서 제안하는 신속한 네트워크 장애 감지 및 역할 전환을 위한 VRRP 라우터 동작 구조를 나타낸 것이다.
VRRP 라우터 (301, 302)는 VRRP 프로토콜이 동작하는 VRRP engine(303)과 BFD 프로토콜이 동작하는 BFD(Bidirectional Forwarding Detection) engine(304), 그리고 각 engine에서 발생하는 IPC 또는 Event 메세지를 처리하여 전달해주는 IPC/Event 매니저(305)으로 구성될 수 있다.
VRRP engine(303)는 VRRP 데이터베이스(306), VRRP 타이머(307), IPC/Event 처리 모듈(308), 상태 전환 모듈(318) 및 소켓 통신 모듈(319)로 구성될 수 있다.
VRRP 데이터베이스(306)는 VRRP engine에서 VRRP 그룹 정보, Virtual IP 주소, Interface 정보 등의 기본적인 구성 정보를 관리할 수 있다.
기존의 VRRP 라우터에서는 네트워크 장애가 발생하여도 VRRP 타이머(307)가 만료될 때까지 역할 전환이 이루어지지 않은 것과 달리, 신속한 네트워크 장애 감지 및 역할 전환을 위해서 BFD engine(304)을 통해 관심 있는 session을 주기적으로 감시할 수 있다. 이를 위해서 VRRP Engine 내부의 IPC/Event 처리 모듈(308)을 통해 관심 있는 session 정보를 BFD engine에 등록하는 과정 (309)이 필요하다.
VRRP engine(303)에서 BFD engine(304)으로 등록을 위한 IPC(Inter-Process Communication) 메세지를 보내면, BFD engine의 IPC/Event 처리 모듈(310)에서 IPC 메세지 처리 후 완료 응답을 보냄으로써 등록이 이루어질 수 있다.
이 때 VRRP engine(303)에서 BFD engine(304)으로 등록을 위한 IPC(Inter-Process Communication) 메시지는 도 5의 구조와 같다.
또한 BFD engine의 IPC/Event 처리 모듈(310)에서 IPC 메세지 처리 후 완료 응답은 도 6의 구조와 같다.
등록 시 필요한 session 정보는 session의 local IP 주소(311)와 peer IP 주소(312)로 구성되며, 해당 정보는 BFD engine(304) 내부의 session 데이터베이스(313)에 저장 및 관리될 수 있다.
만약, 이미 존재하는 session에 대해서 등록 메세지를 수신할 경우, 에러 메세지를 보냄으로써 VRRP engine 과의 session 정보 동기화를 이룰 수 있다.
양쪽 VRRP 라우터에서 session 등록이 완료되면, BFD 소켓 통신 모듈(314)을 통해 local IP 주소와 peer IP 주소를 기반으로 BFD 패킷(315)을 주기적으로 송수신할 수 있다.
이렇게 주기적으로 주고 받는 BFD 패킷은 session 상태 감지 모듈(316)에서 session의 상태를 계속해서 감시하기 위해 사용될 수 있다. 일정 시간이상 BFD 패킷이 수신되지 않는 경우 해당 session에 문제가 생긴 것으로 판단하고, 즉시 IPC/Event 처리 모듈을 통해 'session down' 이벤트를 VRRP engine에게 알려줄 수 있다(317). 이때 이벤트 메시지는 도 7의 구조와 같다.
BFD engine으로부터 'session down' 이벤트를 수신한 VRRP engine(302)은 IPC/Event 처리 모듈(308)에서 해당 이벤트 메세지를 분석하여, 상태 전환이 필요하다고 판단되면 즉시 상태 전환 모듈(318)을 호출하여 자신의 상태를 백업에서 마스터로 전환할 수 있다.
상태 전환 과정이 끝나면, VRRP 소켓 통신 모듈(319)를 통해, 주변 라우터들에게 자신의 IP 주소, MAC 주소, 우선순위 등의 정보가 담긴 Advertisement 패킷을 보냄으로써 마스터 라우터의 존재를 알릴 수 있다.
VRRP engine(303)에서 더 이상 session 감지를 원하지 않을 경우에는 session 제거를 위한 IPC 메세지를 BFD engine(304)에 보냄으로써, BFD에서 불필요한 동작을 방지하고 자원낭비를 줄일 수 있다. Session 제거의 경우에도 등록과 마찬가지로 local IP 주소와 peer IP 주소를 이용하여 IPC 메세지를 구성할 수 있다.
BFD engine(304)은 session 제거 IPC 메세지를 수신한 뒤, 해당 메세지에 담긴 local IP 주소와 peer IP 주소 쌍을 session 데이터베이스에 확인하여, 동일한 session 이 존재할 경우 해당 session에서의 BFD 패킷 전송 및 더 이상의 session 감지를 멈출 수 있다.
본 발명에서 제안하는 VRRP 라우터 구조에서는, VRRP engine(303)과 BFD engine(304)은 사이에 IPC/Event 매니저(305)가 존재하여, 이를 통해 양쪽 engine에서 IPC 또는 이벤트 메세지를 주고 받음으로써 상호 의존성을 없애고 독립적으로 동작 및 운용이 가능하다.
도 4는 본 발명의 일 실시예에 따른 session 이벤트 처리의 흐름도를 나타낸 것이다.
보다 상세하게는 도4는 VRRP engine에서 session 상태 이벤트를 수신하여 최종적으로 역할 전환 모듈을 실행하기 위한 처리 구조를 나타낸 것이다.
IPC/Event 처리 모듈(401)에서는 session 상태와 관련된 이벤트 메세지를 수신 대기 하고 있다가, session 이벤트 메세지가 수신(S402)되면 이를 분석하는 과정을 거칠 수 있다.
먼저, 이전에 등록한 session 정보 (local IP 주소, peer IP 주소)가 수신한 session 정보와 일치하는지 판단할 수 있다(S403).
동일한 session 이라고 판단되면 수신한 session 상태가 Up 인지 Down 인지 확인할 수 있다(S404). 'Session UP' 이벤트일 경우, 단순히 session 상태를 갱신하는 것으로 끝내고(S405), 'Session Down' 이벤트일 경우, 현재 session 상태 정보와 일치 여부를 확인한다(S406).
만약, 현재 session 상태가 'UP'이고, 수신한 session 상태가 'Down'이면 감시하고 있는 session 상태에 문제가 생긴 것을 확인할 수 있다.
지켜보던 session에 문제가 생긴 것을 감지하게 되면, 현재 VRRP 상태가 백업일 경우(S407), 역할 전환 모듈(408)을 호출하여 마스터 라우터로 동작하게 된다.
이러한 일련의 이벤트 메세지 처리 구조는, 메세지에 담긴 정보의 분석 및 현재 상태와의 비교로 이루어져 있기 때문에, 'Session Down' 이벤트 발생 후 빠른 처리가 가능하며 신속하게 대응할 수 있다.
도 5는 본 발명의 일 실시예에 따른 Session 등록 또는 제거 요청을 위한 IPC 메세지 구조를 나타낸 도면이다.
도 5는 VRRP engine에서 session 등록 및 제거를 위해 BFD engine에게 보내는 IPC 메세지 구조이다. 먼저, CompID 는 해당 IPC 메세지를 보내는 주체인 VRRP engine을 의미할 수 있다. Family는 session 정보에 사용될 IP 주소 체계를 나타낼 수 있다. 마지막으로, 감시하고자 하는 session의 peer IP 주소와 local IP 주소 정보를 IPC 메시지에 채워 전송할 수 있다.
도 6은 본 발명의 일 실시예에 따른 Session 등록 또는 제거 요청에 대한 응답 IPC 메세지 구조를 나타낸 도면이다. 보다 상세하게는 도 6은 BFD engine에서 수신한 session 등록/제거 요청을 처리 후, 이에 대한 응답을 보내는 IPC 메시지 구조이다.
이 때 Result 는 '성공' 와 '실패'로 나뉠 수 있다. Reason은 결과에 대한 이유를 서술하는 부분에 해당될 수 있다. 본 발명의 일 실시예에 따라 결과가 '실패' 일 경우, reason은 '잘못된 주소', '존재하지 않는 session', 'BFD 동작 오류', 등의 다양한 이유가 있을 수 있으며, 언급한 예로만 한정하지 않는다.
도 7은 본 발명의 일 실시예에 따른 Session 상태 변화에 대한 Event 메세지 구조를 나타낸 도면이다.
보다 상세하게는 도7은 BFD engine에서 감시하던 session 상태에 변화가 생겼을 경우, BFD engine에서 전송하는 Event 메시지 구조이다.
이때 Family는 session 정보에 사용될 IP 주소 체계를 나타낼 수 있다. peer IP 주소와 local IP 주소는 감시하던 session의 주소 정보에 해당될 수 있다. 마지막으로, 현재 변화가 생긴 session의 상태 정보를 'DOWN' 혹은 'UP' 형태로 State 항목에 채워 전송할 수 있다. 이 때'INIT' 상태는 BFD engine을 처음 구동시킬 때 발생시키는 상태 정보이며, 그 후 동작 과정에서 session 상태 변화 시에는 'DOWN' 또는 'UP' 형태로만 전송할 수 있다.
도 8은 본 발명의 일 실시예에 따른 VRRP(Virtual Router Redundancy Protocol) 백업 라우터가 네트워크 장애를 추적하는 방법에 대한 흐름도이다.
먼저 VRRP 엔진은 세션 등록 IPC 메시지를 IPC/Event 매니저를 통해 BFD 엔진에게 전달할 수 있다.(S810)
본 발명의 일 실시예에 따라VRRP engine에서 session을 등록하기 위한 IPC 메세지를 BFD engine에게 전달하는 프레임워크를 개시될 수 있다. VRRP engine은 session의 local IP 주소와 peer IP 주소로 구성된 IPC 메세지를 BFD engine에게 전달하며, 해당 메세지는 IPC/Event 매니저를 통해 전달될 수 있다.
VRRP 엔진은 링크(link) 상태 변화 발생시 이벤트 메시지를 수신할 수 있다. (S820)본 발명의 일 실시예에 따라 BFD engine에서 감시하고 있던 link 상태에 변화가 생겼을 경우, 해당 이벤트를 전달하는 프레임워크가 개시될 수 있다.
BFD 엔진은 link 상태 변화를 디텍팅하고, 변화 발생시 이벤트 메시지를 IPC/Event 매니저를 통해 VRRP engine에 전달한다. 이 때 BFD 엔진은 BFD 패킷을 주기적으로 송수신할 수 있다. BFD 엔진은 일정 시간이상 BFD 패킷이 수신되지 않는 경우 해당 session에 문제가 생긴 것으로 판단하고, 이벤트 메시지를 송신할 수 있다.
BFD engine 에서 감시하던 session이 down 되었을 경우, 이에 대한 'session down' 이벤트 메세지를 발생시키고, 해당 메세지는 IPC/Event 매니저를 통해 VRRP engine에게 전달될 수 있다.
본 발명의 일 실시예에 따라, IPC/Event 매니저를 통해 정보를 주고 받는 프레임워크가 개시될 수 있다. 이 때 VRRP engine과 BFD engine은 IPC/Event 매니저를 통해 정보를 주고 받을 수 있다. 제안하는 프레임워크 내에서 각 engine은 독립적으로 동작하며, 사용자가 선택적으로 하나의 engine 구동을 멈추더라도 나머지 engine 동작에 영향을 미치지 않는다.
VRRP engine은 이벤트 메시지에 포함된 정보를 분석할 수 있다. (S830)
본 발명의 일 실시예에 의하면 VRRP engine에서 session 관련 이벤트를 수신하여 처리하는 프레임워크가 개시될 수 있다. VRRP engine에서 'session down' 이벤트를 수신하면, 해당 이벤트 메세지에 담긴 session 정보가 이미 등록한 session 정보와 일치하는지 검증하는 과정을 거치고, 현재의 session 상태와 수신한 session 상태가 다른지 확인하는 과정이 수행될 수 있다.
상기 분석된 정보에 기초하여 백업 라우터가 마스터 라우터로 전환될 수 있다. (S840)
본 발명의 일 실시예에 의하면 'session down' 이벤트 수신 후, 신속히 마스터 라우터로 전환하는 방법이 개시될 수 있다. 정상적인 'session down' 이벤트 수신 후, 현재 동작하고 있는 VRRP 타이머와 관계없이 그 즉시, 마스터 라우터로의 역할 전환이 수행될 수 있다.
VRRP 엔진은 세션 제거 IPC 메시지를 IPC/Event 매니저를 통해 BFD 엔진에게 전달할 수 있다.(S850)
본 발명의 일 실시예에 따르면 VRRP engine에서 session을 제거하기 위한 IPC 메세지를 BFD engine에게 전달하는 프레임워크가 개시될 수 있다. VRRP engine에서는 session의 local IP 주소와 peer IP 주소로 구성된 IPC 메세지를 BFD engine에게 전달하며, 해당 메세지는 IPC/Event 매니저를 통해 전달될 수 있다.
또한 본 발명의 일 실시예에 따라, VRRP engine과 BFD engine 사이에 주고 받는 session 등록/제거에 대한 IPC 메세지와, session 상태 변화에 대한 Event 메시지의 구조가 개시될 수 있다.
다만 본 발명의 세션 등록(S810) 및 등록된 세션 제거(S850)는 네트워크 장애 감지를 위해 항상 수행되어야 하는 절차는 아니며, 세션이 등록된 경우 이벤트 메시지의 송수신을 통해 신속하게 네트워크 감지를 수행할 수 있는 본 발명을 적용할 수 있다. 또한 등록된 세션이 더 이상 필요하지 않은 경우 등록된 세션을 제거할 수도 있다.
본 발명의 이점 및 특징, 그것들을 달성하는 방법은 첨부되어 있는 도면과 함께 상세하게 후술되어 있는 실시예들을 참조하면 명확해질 것이다. 그러나 본 발명은 이하에서 제시되는 실시예들에 한정되는 것이 아니라 서로 다른 다양한 형태로 구현될 수 있으며, 단지 본 실시예들은 본 발명의 개시가 완전하도록 하고, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 발명의 범주를 완전하게 알려주기 위해 제공되는 것이며, 본 발명은 청구항의 범주에 의해 정의될 뿐이다.

Claims (1)

  1. VRRP(Virtual Router Redundancy Protocol) 백업 라우터가 네트워크 장애를 추적하는 방법에 있어서
    링크(link) 상태 변화 발생시 이벤트 메시지를 수신하는 단계;
    상기 이벤트 메시지에 포함된 정보를 분석하는 단계; 및
    상기 분석된 정보에 기초하여 상기 백업 라우터가 마스터 라우터로 전환되는 단계;
    를 포함하되,
    상기 이벤트 메시지에는 세션 상태가 포함되고,
    상기 이벤트 메시지에 포함된 세션 상태와 현재의 세션 상태가 다른 경우
    상기 백업 라우터가 상기 마스터 라우터로 전환되는 것을 특징으로 하는 네트워크 장애 추적 방법.
KR1020180161077A 2018-12-13 2018-12-13 실시간 오류 감지를 통한 vrrp 기반의 네트워크 장애 대응 방법 및 장치 KR20200072941A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020180161077A KR20200072941A (ko) 2018-12-13 2018-12-13 실시간 오류 감지를 통한 vrrp 기반의 네트워크 장애 대응 방법 및 장치

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020180161077A KR20200072941A (ko) 2018-12-13 2018-12-13 실시간 오류 감지를 통한 vrrp 기반의 네트워크 장애 대응 방법 및 장치

Publications (1)

Publication Number Publication Date
KR20200072941A true KR20200072941A (ko) 2020-06-23

Family

ID=71137948

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020180161077A KR20200072941A (ko) 2018-12-13 2018-12-13 실시간 오류 감지를 통한 vrrp 기반의 네트워크 장애 대응 방법 및 장치

Country Status (1)

Country Link
KR (1) KR20200072941A (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111953561A (zh) * 2020-07-28 2020-11-17 锐捷网络股份有限公司 Vrrp震荡的抑制方法及装置
WO2023273838A1 (zh) * 2021-06-29 2023-01-05 中兴通讯股份有限公司 基于bfd技术建立会话的方法、装置、网络设备及计算机存储介质

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111953561A (zh) * 2020-07-28 2020-11-17 锐捷网络股份有限公司 Vrrp震荡的抑制方法及装置
CN111953561B (zh) * 2020-07-28 2022-12-13 锐捷网络股份有限公司 Vrrp震荡的抑制方法及装置
WO2023273838A1 (zh) * 2021-06-29 2023-01-05 中兴通讯股份有限公司 基于bfd技术建立会话的方法、装置、网络设备及计算机存储介质

Similar Documents

Publication Publication Date Title
CN110912780B (zh) 一种高可用集群检测方法、系统及受控终端
US9088478B2 (en) Methods, systems, and computer readable media for inter-message processor status sharing
US7583590B2 (en) Router and method for protocol process migration
CN101557317B (zh) 双机热备组网中实现会话主动备份的系统、设备及方法
KR101706439B1 (ko) 리던던트 네트워크 접속
JP2004507169A (ja) 網フロースイッチを用いてのvpnデバイスのクラスタリング
US20080285436A1 (en) Methods, systems, and computer program products for providing site redundancy in a geo-diverse communications network
JP5024195B2 (ja) 負荷分散サーバ、ネットワーク負荷分散方法および輻輳回避方法
US9113031B2 (en) Call control for conferencing calls
US20060268729A1 (en) Methods and apparatus for monitoring link integrity for signaling traffic over a path traversing hybrid ATM/Ethernet infrastructure in support of packet voice service provisioning
EP2696542A1 (en) Method, ToR switch, and system for implementing protection switchover based on TRILL network
KR20150033681A (ko) 연결 실패 시에 홈 네트워크에 대한 재라우팅을 인에이블시키는 방법 및 시스템
US7246168B1 (en) Technique for improving the interaction between data link switch backup peer devices and ethernet switches
US10841344B1 (en) Methods, systems and apparatus for efficient handling of registrations of end devices
WO2014146541A1 (zh) Cdn与网络融合系统、调度模块选定方法及计算机存储介质
KR20200072941A (ko) 실시간 오류 감지를 통한 vrrp 기반의 네트워크 장애 대응 방법 및 장치
Kuroki et al. Scalable OpenFlow controller redundancy tackling local and global recoveries
US7359992B2 (en) Method of preserving symmetrical routing in a communication system based upon a server farm
CN112564983B (zh) 数据传输方法、装置、计算机系统和介质
CN108270593A (zh) 一种双机热备份方法和系统
CN113037622B (zh) 一种防止bfd震荡的系统及方法
US8903991B1 (en) Clustered computer system using ARP protocol to identify connectivity issues
WO2014044088A1 (zh) L2tp网络的保护方法、装置及系统
US10536875B2 (en) System and method for seamless TCP connection handoff
CN113726648A (zh) 多路径通信方法、装置、电子设备及计算机可读介质