TW201421232A - 在一冗餘群組中實施故障備援的方法、裝置與電腦程式產品 - Google Patents

在一冗餘群組中實施故障備援的方法、裝置與電腦程式產品 Download PDF

Info

Publication number
TW201421232A
TW201421232A TW101143054A TW101143054A TW201421232A TW 201421232 A TW201421232 A TW 201421232A TW 101143054 A TW101143054 A TW 101143054A TW 101143054 A TW101143054 A TW 101143054A TW 201421232 A TW201421232 A TW 201421232A
Authority
TW
Taiwan
Prior art keywords
router
virtual
standby
group
active
Prior art date
Application number
TW101143054A
Other languages
English (en)
Inventor
Johnson You-Sheng Chiang
Jeffrey Zhi-Xiong Liu
Kai Ying-Kai Wang
Daniel Hao-Ting Shih
Original Assignee
Ibm
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ibm filed Critical Ibm
Priority to TW101143054A priority Critical patent/TW201421232A/zh
Priority to US14/083,351 priority patent/US9219640B2/en
Publication of TW201421232A publication Critical patent/TW201421232A/zh
Priority to US14/472,420 priority patent/US9219641B2/en

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2002Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where interconnections or communication control functionality are redundant
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring

Abstract

本發明揭示一種在一冗餘群組中實施故障備援的方法,其中該冗餘群組包含複數個路由器,該複數個路由器包含一活動路由器及一備用路由器。該方法包含以下步驟:接收一輸入訊息;發送一確認要求,以確認代表該冗餘群組之一虛擬路由器之目前的活動路由器;及若在一預設時間內為收到該確認要求之包含一識別符之應答,則轉發該輸入訊息至送出該應答之路由器,其中送出該應答的路由器為代表該虛擬路由器之該目前的活動路由器。

Description

在一冗餘群組中實施故障備援的方法、裝置與電腦程式產品
本發明係關於使用在一包含一起運作之冗餘(redundant)或備用(standby)裝置之一冗餘(redundancy)群組的網路系統中提供零停機時間(down time)之故障備援(failover)的方法、裝置與電腦程式產品。
區域網路(LANs)通常透過一或多個路由器(router)與其他區域網路或外部網路互連,以致一區域網路上之一主機(host)能與不同之區域網路上之其他主機通訊。該主機可為一用戶端電腦(如PC)、伺服器或其他任何設置在區域網路上之網路實體。該網路實體能與不同之區域網路上之網路實體通訊。基本上,該主機僅可與自身區域網路之網段(segment)上之網路實體直接通訊。
路由器(或稱之閘道器)為在網路層(network layer)運作之硬體裝置,以於一網路架構下之區域網路或廣域網路間定封包之路由(傳遞路徑)。路由器又可稱之層3裝置。今日,路由器通常以一資訊設備(Appliance)之形式實施。資訊設備,通常也稱之為網際網路設備(Internet Appliance),為內建有網路能力且具有某一特定功能的裝置。相對於通用型(General Purpose)的電腦裝置,由於資訊設備一般係根據特定目的或特定服務而設計,以進行特定的交易(transaction),因而具有較高的效能。此外,相較於通用型電腦裝置,「資訊設備」顯得較為「封閉」,也就是隨著其所設計的目的與服務,採用特定 的作業系統與應用程式(或驅動程式)。例如:IBM WebSphere Datapower SOA Appliance(http://www.redbooks.ibm.com/abstracts/redp4366.html)、或Tivoli ISS Appliances(「IBM」、「WebSphere」、「Tivoli」為International Business Machine公司在美國及/或其他國家的註冊商標)。除路由器外,資訊設備一般也可實施為一附加式網路儲存裝置(Network Attached Storage)。
不幸的是,一路由器可能因種種因素導致整個網路無法運作,例如電源故障(power failure)、重新啟動(rebooting)或排定維修(scheduled maintenance)等。因此,今日已發展出許多不同之第一跳冗餘協定(First Hop Redundancy Protocol,FHRP),提供故障備援能力,以有效處理這個問題,並提供於恢復務網路時具有最低停機時間。在Cisco公司的設備上,也有幾個不同的選擇,包括熱備用路由器協議(Hot Standby Router Protocol,HSRP),虛擬路由器冗餘協議(Virtual Router Redundancy Protocol,VRRP)和閘道負載均衡協定(Gateway Load Balancing Protocol,GLBP)。
以熱備用路由器協定(HSRP)為例,其是Cisco公司專有之習知用來支援故障備援之系統的冗餘(redundant)協定,其更詳細描述於RFC 2281。此外,HSRP類型之系統也可參考Cisco公司之美國專利US 5,473,599及US 7,152,179。
HSRP是Cisco公司專有的協定,能使網路工程師將多個冗餘路由器配置在同一子網中,每個都可以作為一個子網路 由器(閘道器)使用。使用HSRP時,一組路由器(閘道器)將配置在一起形成一虛擬網路實體(虛擬路由器),此時一個HSRP的虛擬(virtual)IP位址和虛擬MAC位址將被創建,以供該虛擬路由器使用。在本文中,該組路由器又稱為一”冗餘群組或備用群組”。
HSRP配置中的不同路由器,將通訊並選擇一個單一主要的(primary)活動(Active)路由器。活動路由器映射本身至該虛擬路由器,即實際上由一活動路由器代表該虛擬路由器,來處理所有通訊流量(traffic flow)。此時,一個單一的備用(Standby)路由器也被選出。該選擇可透過預先配置(pre-configured)之優先權,或其他適當的準則決定。HSRP配置中,一備用路由器係連結到一活動路由器服務之網段(segment/segments),而被指派為該活動路由器的支援(back up)裝置。因此,該活動路由器與該備用路由器係共享該虛擬IP位址和虛擬MAC位址(實際上,一次僅由一路由器使用)。
活動路由器一旦失效(fail),或稱之為停機(down),其中的一個備用路由器就會接管路由器的職責並在很小的延遲後轉發(forward)所有資料封包。與此同時,若該備用群組包含不只兩個備用路由器,則一個新的備用路由器也會被選出。需說明的是,稱一路由器為活動路由器或在活動模式(Active mode)或活動態(Active state),皆意指該路由器負責一網路(如區域網路)資料封包之傳輸;而稱一路由器為備用路由器或在備用模式(Standby mode)或備用態(Standby state),則皆意指係負責資料封包傳輸之活動路由器的潛在替代品。
為方便說明的目的,圖1之範例中僅包含一個主機100,一交換機110及包含一活動路由器122及一備用路由器124之冗餘或備用群組120。如前述依HSRP協定,該備用群組120可包含一個以上之備用路由器。交換機(或稱之層2裝置)係在資料鏈結層(datalink layer)運作之硬體裝置,其分割一區域網路成分離之碰撞網區(collision domains)。交換機通常也以一根據特定目的或特定服務而設計之資訊設備形式實施。該交換機的架構則可參考例如Cisco公司的交換器產品Cisco Catalyst 3550 Series Switch。
相同備用群組120內之備用路由器124會定期(periodically)接收活動路由器122以多點傳送(multicast)或廣播的方式發送之”Hello”訊息130,以檢測活動路由器122是否失效。例如,備用路由器124啟動一保持時間定時器(Holdtime Timer)(未顯示),以等待接收來自活動路由器122之”Hello”訊息。該保持時間定時器可預設為10秒,而”Hello”訊息週期可預設為3秒。若保持時間定時器終止(expires),仍未收到該”Hello”訊息,該備用路由器124將推定該活動路由器122已失效,並進入活動態成為新活動路由器,而接管路由器的職責。與此同時,已進入活動態之備用路由器124廣播(broadcast)或以多點傳送方式發送一無償(gratuitous)位址解析協定(Address Resolution Protocol,ARP)封包(即宣告訊息)至該交換機110及備用群組120中其他備用路由 器(若該備用群組120包含一個以上之備用路由器),以宣告路由器124已接管路由器的職責成為新活動路由器。
由於該交換機110係與虛擬路由器通訊,該交換機110之位址解析協定表(ARP table)包含的是該虛擬路由器之虛擬IP位址和虛擬MAC位址。當活動路由器122失效時,改由該接管路由器的職責之備用路由器124映射至該虛擬路由器。HSRP配置中,使用虛擬路由器以代表與交換機通訊之預設路由器,而由一活動路由器代表該虛擬路由器。因此雖然實際代表該虛擬路由器之活動路由器會改變,該虛擬路由器之虛擬IP位址和虛擬MAC位址則不會改變,結果該交換機110不會被影響。
然而,習知不同之第一跳冗餘協定所提供之故障備援機制中,當交換機110收到一輸入訊息,便直接轉發該訊息至目前代表該虛擬路由器之活動路由器122。因此,若活動路由器122失效(停機),則在備用路由器接管失效之活動路由器前,皆存在以秒計之所謂黑洞(black hole)的時間間隙。該黑洞時間間隙可為「活動路由器失效」之時間點與「備用路由器檢測到活動路由器失效及藉廣播無償ARP封包至交換機及其他備用路由器以宣告其已接管而為新活動路由器」之時間點間的差值。因此在活動路由器失效後,將有以秒計之停機時間的訊息遺漏。這對一些具核心任務(mission-critical)之資訊設備(appliances)或應用(如股票交易(stock trading))而言,這以秒計之停機時間的訊息遺漏,將可能導致業務上之巨大衝擊,而為不可接受的。因此,若能提供一具零黑洞 或遠小於習知黑洞之時間間隙之故障備援機制的解決方案,則是有利的。
本發明提供一具有零黑洞或遠小於習知黑洞之時間間隙的故障備援機制,其揭示於每次交換機收到一輸入訊息時,藉由廣播ARP要求(ARP request)至備用群組中每一路由器,以解析(resolve)代表該備用群組之虛擬路由器之虛擬IP位址相應的虛擬MAC位址。該訊息可以是一封包、一TCP流(Transmission Control Protocol stream)或一交易。當活動路由器收到該ARP要求時,不僅送出ARP應答(reply)以提供該虛擬路由器之”虛擬MAC位址”來回應該ARP要求,且發送”Hello”訊息至同一備用群組內之備用路由器,以通知備用路由器,指示該ARP要求已由該活動路由器應答。交換機收到ARP應答後,便轉發該輸入訊息至該活動路由器供定路由。備用路由器收到該ARP要求,則啟動一保持時間定時器以等待活動路由器送來之”Hello”訊息。若該備用路由器於該保持時間定時器終止前收到”Hello”訊息,則該備用路由器維持備用態,且該保持時間定時器重新啟動。若該備用路由器於該保持時間定時器終止前都沒有收到”Hello”訊息,則將推定該活動路由器已失效(停機),並進入活動態成為新活動路由器,且回應該ARP要求而送出ARP應答,以提供該虛擬路由器之”虛擬MAC位址”。交換機收到來自該備用路由器之ARP應答後,便轉發該輸入訊息至該備用路由器(即新活動路由器)供定路由。
根據本發明一實施例,一種在一冗餘群組中實施故障備援的方法,其中該冗餘群組包含複數個路由器,該複數個路由器包含一活動路由器及一備用路由器。該方法包含以下步驟:接收一輸入訊息;發送一確認要求,以確認代表該冗餘群組之一虛擬路由器之目前的活動路由器;及若在一預設時間內為收到該確認要求之包含一識別符之應答,則轉發該輸入訊息至送出該應答之路由器,其中送出該應答的路由器為代表該虛擬路由器之該目前的活動路由器。
根據本發明另一實施例,一種在一冗餘群組中實施故障備援的方法,其中該冗餘群組包含複數個路由器,該複數個路由器包含一活動路由器及一備用路由器。該方法包含以下步驟:接收來自一交換機之確認要求,該確認要求係用以確認代表該冗餘群組之一虛擬路由器之目前的活動路由器;發送一包含一識別符之應答;及發送一通知訊息至該冗餘群組內之該備用路由器,以指示該確認要求已由該活動路由器應答。
根據本發明另一實施例,一種在一冗餘群組中實施故障備援的方法,其中該冗餘群組包含複數個路由器,該複數個路由器包含一活動路由器及一備用路由器。該方法包含以下步驟: 接收來自一交換機之確認要求,該確認要求係用以確認代表該冗餘群組之一虛擬路由器之目前的活動路由器;啟動一保持時間定時器,以等待該活動路由器送來之一通知訊息;及若該備用路由器於該保持時間定時器終止前,都沒有收到該通知訊息,則進入一活動態成為新活動路由器,而接管路由器的職責;且回應該確認要求而發送一包含一識別符之應答,以表明該備用路由器目前代表該虛擬路由器而為新活動路由器。
根據本發明另一實施例,一種電腦程式產品包含一儲存有程式碼之電腦可讀媒體,供於一資訊設備上執行時,實施如前述之方法,以在一冗餘群組中實施故障備援。
根據本發明另一實施例,一種資訊設備,包含:一匯流排;一記憶體,連接到該匯流排,其中該記憶體包含一組指令;一連接到該匯流排之處理單元,其中該處理單元執行該組指令,以執行如前述之方法,以在一冗餘群組中實施故障備援。
本說明書中所提及的特色、優點、或類似表達方式並不表示,可以本發明實現的所有特色及優點應在本發明之任何單一的具體實施例內。而是應明白,有關特色及優點的表達方式是指結合具體實施例所述的特定特色、優點、或特性係 包含在本發明的至少一具體實施例內。因此,本說明書中對於特色及優點、及類似表達方式的論述與相同具體實施例有關,但亦非必要。
此外,可以任何合適的方式,在一或多個具體實施例中結合本發明所述特色、優點、及特性。相關技術者應明白,在沒有特定具體實施例之一或多個特定特色或優點的情況下,亦可實施本發明。在其他例子中應明白,特定具體實施例中的其他特色及優點可能未在本發明的所有具體實施例中出現。
參考以下說明及隨附申請專利範圍或利用如下文所提之本發明的實施方式,即可更加明瞭本發明的這些特色及優點。
本說明書中「一具體實施例」或類似表達方式的引用是指結合該具體實施例所述的特定特色、結構、或特性係包括在本發明的至少一具體實施例中。因此,在本說明書中,「在一具體實施例中」及類似表達方式之用語的出現未必指相同的具體實施例。
熟此技藝者當知,本發明可實施為資訊設備、方法或作為電腦程式產品之電腦可讀媒體。因此,本發明可以實施為各種形式,例如完全的硬體實施例、完全的軟體實施例(包含韌體、常駐軟體、微程式碼等),或者亦可實施為軟體與硬體的實施形式,在以下會被稱為「電路」、「模組」或「系統」。 此外,本發明亦可以任何有形的媒體形式實施為電腦程式產品,其具有電腦可使用程式碼儲存於其上。
一個或更多個電腦可使用或可讀取媒體的組合都可以利用。舉例來說,電腦可使用或可讀取媒體可以是(但並不限於)電子的、磁的、光學的、電磁的、紅外線的或半導體的系統、裝置、設備或傳播媒體。更具體的電腦可讀取媒體實施例可以包括下列所示(非限定的例示):由一個或多個連接線所組成的電氣連接、可攜式的電腦磁片、硬碟機、隨機存取記憶體(RAM)、唯讀記憶體(ROM)、可抹除程式化唯讀記憶體(EPROM或快閃記憶體)、光纖、可攜式光碟片(CD-ROM)、光學儲存裝置、傳輸媒體(例如網際網路(Internet)或內部網路(intranet)之基礎連接)、或磁儲存裝置。需注意的是,電腦可使用或可讀取媒體更可以為紙張或任何可用於將程式列印於其上而使得該程式可以再度被電子化之適當媒體,例如藉由光學掃描該紙張或其他媒體,然後再編譯、解譯或其他合適的必要處理方式,然後可再度被儲存於電腦記憶體中。在本文中,電腦可使用或可讀取媒體可以是任何用於保持、儲存、傳送、傳播或傳輸程式碼的媒體,以供與其相連接的指令執行系統、裝置或設備來處理。電腦可使用媒體可包括其中儲存有電腦可使用程式碼的傳播資料訊號,不論是以基頻(baseband)或是部分載波的型態。電腦可使用程式碼之傳輸可以使用任何適體的媒體,包括(但並不限於)無線、有線、光纖纜線、射頻(RF)等。
用於執行本發明操作的電腦程式碼可以使用一種或多種 程式語言的組合來撰寫,包括物件導向程式語言(例如Java、Smalltalk、C++或其他類似者)以及傳統程序程式語言(例如C程式語言或其他類似的程式語言)。程式碼可以獨立軟體套件的形式完整的於使用者的電腦上執行或部分於使用者的電腦上執行,或部分於使用者電腦而部分於遠端電腦。
於以下本發明的相關敘述會參照依據本發明具體實施例之資訊設備、方法及電腦程式產品之流程圖及/或方塊圖來進行說明。當可理解每一個流程圖及/或方塊圖中的每一個方塊,以及流程圖及/或方塊圖中方塊的任何組合,可以使用電腦程式指令來實施。這些電腦程式指令可供通用型電腦或特殊電腦的處理器或其他可程式化資料處理裝置所組成的機器來執行,而指令經由電腦或其他可程式化資料處理裝置處理以便實施流程圖及/或方塊圖中所說明之功能或操作。
這些電腦程式指令亦可被儲存在電腦可讀取媒體上,以便指示電腦或其他可程式化資料處理裝置來進行特定的功能,而這些儲存在電腦可讀取媒體上的指令構成一製成品,其內包括之指令可實施流程圖及/或方塊圖中所說明之功能或操作。
電腦程式指令亦可被載入到電腦上或其他可程式化資料處理裝置,以便於電腦或其他可程式化裝置上進行一系統操作步驟,而於該電腦或其他可程式化裝置上執行該指令時產生電腦實施程序以達成流程圖及/或方塊圖中所說明之功能或操作。
其次,請參照圖2至圖4B,在圖式中顯示依據本發明各種實施例的資訊設備、方法及電腦程式產品可實施的架構、功能及操作之流程圖及方塊圖。因此,流程圖或方塊圖中的每個方塊可表示一模組、區段、或部分的程式碼,其包含一個或多個可執行指令,以實施指定的邏輯功能。另當注意者,某些其他的實施例中,方塊所述的功能可以不依圖中所示之順序進行。舉例來說,兩個圖示相連接的方塊事實上亦可以同時執行,或依所牽涉到的功能在某些情況下亦可以依圖示相反的順序執行。此外亦需注意者,每個方塊圖及/或流程圖的方塊,以及方塊圖及/或流程圖中方塊之組合,可藉由基於特殊目的硬體的系統來實施,或者藉由特殊目的硬體與電腦指令的組合,來執行特定的功能或操作。
<硬體環境>
圖2係顯示本發明一例示性實施例中可供作為交換機或路由器之資訊設備(Appliance)的硬體環境方塊示意圖。在一實施例中,該資訊設備可以是IBM WebSphere DataPower Series SOA Appliances或Tivoli ISS Appliances的硬體架構。資訊設備200具有處理器以執行專屬的應用程式;儲存裝置以儲存各種資訊及程式碼;通訊及輸出/入裝置做為與使用者溝通之介面;以及週邊元件或其他特定用途元件。在其他實施例中,本發明亦可實施為其他的形式,而具有更多或更少之其他裝置或元件。
實施為路由器的資訊設備,決定與其他區域網路或外部 網路之其他主機(或網路實體)通訊之路由,而轉發接收到之用戶端訊息至該其他主機(或網路實體)。實施為交換機的資訊設備,負責轉發由連結之主機收到之用戶端的訊息至路由器,而由該路由器決定與其他區域網路或外部網路之其他主機(或網路實體)通訊之路由;或負責將透過網路接收到之用戶端主機的訊息傳透過路由器發送給後面的網路伺服器上之一後端應用(backend)。
如圖2所示,資訊設備200可具有處理器210、記憶體220與輸入/輸出(I/O)單元240。該輸入/輸出(I/O)匯流排可為一高速串接匯流排,例如PCI-e匯流排,但其它的匯流排架構亦可以被使用。其它對輸入/輸出(I/O)匯流排的連接可以藉由直接元件互連,或是透過附加卡的方式。輸入/輸出(I/O)單元也可耦接至一硬碟機250、區域網路(LAN)配接器260。透過該區域網路配接器260,資訊設備200能經由一網路230與一用戶端電腦通信。網路亦可實施為任何型式之連線,包括固定連接之區域網路(LAN)或廣域網路(WAN)連線,或利用網際網路服務提供者來暫時撥接至網際網路,亦不限於有線無線等各種連接方式,例如透過GSM、或Wi-Fi等無線網路與用戶端電腦通信。然而應了解,雖未繪示但其他硬體及軟體組件(例如額外電腦系統、路由器、防火牆等)可包含於網路之中。記憶體220可為隨機存取記憶體(RAM)、唯讀記憶體(ROM)、可抹除程式化唯讀記憶體(EPROM或快閃記憶體)。記憶體220用以存放作業系統、專屬的主程式AP之程式碼及各種資訊。作業系統在處理器210上執行,用來協調並提供資訊設備200中各種元件的控制,而處理器210可存取記憶 體220,以執行主程式AP。
實施為交換機的資訊設備,該主程式AP可包括一本發明之”交換機處理模組”。實施為路由器的資訊設備,該主程式AP可包括一本發明之”活動路由器及備用路由器處理模組”。該”交換機處理模組”及”活動路由器及備用路由器處理模組”包括程式模組及指令,該等程式模組及指令能在一包含一起運作之冗餘或備用裝置之一冗餘群組的網路系統中提供零停機時間之故障備援。該等處理模組可以是應用程式內之模組,或以常駐程式(Daemon)之方式實施。但在其他實施例中,亦可以用其他形式之程式型態來實施。該等處理模組包括用於實施下文所說明之圖4A及4B內所說明之程序之代碼。
熟此技藝者應可知,圖2中所述資訊設備200的硬體可以依照不同的實施例而有各種變化。亦有其它的內部硬體或週邊裝置,例如快閃唯讀記憶體(Flash ROM)、等效的非揮發記憶體、或光碟機等等,可以附加或取代圖2所示的硬體。
圖3A揭示根據本發明實施例,一活動路由器正常運作時之工作示意圖。圖3B則揭示根據本發明實施例,一活動路由器於失效時實施故障備援之示意圖。
為方便說明的目的,圖3A及圖3B之範例中僅包含一個主機300,一交換機310及包含一活動路由器322及一備用路由器324之冗餘或備用群組320。如前述依HSRP協定,該備用群組320可包含一個以上之備用路由器。
如圖3A所示,假定該活動路由器322及該備用路由器324皆是正常運作(alive),於每次交換機310收到一輸入訊息時,藉由廣播方式發送ARP要求312至備用群組320中每一路由器,以解析代表該備用群組320之虛擬路由器之虛擬IP位址相應的虛擬MAC位址。當活動路由器322收到該ARP要求312時,不僅回應該ARP要求312而送出ARP應答(reply)314,以提供該虛擬路由器之”虛擬MAC位址”,且發送”Hello”訊息330至同一備用群組320內之備用路由器324,以通知備用路由器324,指示該ARP要求312已由該活動路由器322應答。藉此確保(ensure)僅會有一個路由器應答。交換機310收到ARP應答314後,便轉發該輸入訊息至該活動路由器322供定路由。該訊息可以是,但不限於,一封包、一TCP流或一交易,本發明並不限制。
備用路由器324收到該ARP要求312,則啟動一保持時間定時器(未顯示)以等待活動路由器送來之”Hello”訊息330。該保持時間定時器可預設為10秒,而”Hello”訊息週期可預設為3秒。若該備用路由器324於該保持時間定時器終止前,收到”Hello”訊息330,則該備用路由器324維持備用態,且該保持時間定時器重新啟動。
圖3B顯示,若該備用路由器324於該保持時間定時器終止前,都沒有收到”Hello”訊息330,則將推定該活動路由器322已失效(停機),並進入活動態成為新活動路由器,而接管路由器的職責;且回應該ARP要求312而送出ARP應答 316,以提供該虛擬路由器之”虛擬MAC位址”。交換機310收到ARP應答316後,便轉發該輸入訊息至該備用路由器324(即新活動路由器)供定路由。若該備用群組320包含一個以上之備用路由器,則將由該新活動路由器發送”Hello”訊息330至同一備用群組320內之其他備用路由器。
<交換機處理模組>
圖4A揭示根據本發明實施例,交換機處理模組400方法流程圖。圖4A將配合圖3A及3B以說明本發明實施例。
●步驟410:交換機310收到一輸入訊息。
●步驟420:以廣播方式發送ARP要求312至備用群組320中每一路由器,以解析代表該備用群組320之虛擬路由器之虛擬IP位址相應的虛擬MAC位址。發送ARP要求係用以確認目前之活動路由器。根據本發明實施例,交換機310係以送出包含虛擬MAC位址之ARP應答的路由器為代表該虛擬路由器之實際活動路由器。
●步驟450:確定是否在預設時間內為收到來自ARP應答314。若在預設時間內未收到來自備用群組320之一ARP應答314或ARP應答316,則重送ARP要求。
●步驟460:若在預設時間內收到一ARP應答,則轉發該輸入訊息至送出包含虛擬MAC位址之ARP應答之路由器供定路由。若該ARP應答來自備用路由器324,則表示該活動路由器322已失效(停機),此時 該備用路由器324接管路由器的職責而為新活動路由器,代表該虛擬路由器的是備用路由器324,因而轉發該訊息至該備用路由器324供定路由。
<活動路由器處理模組>
依前述步驟420,交換機310於收到一輸入訊息後,將以廣播方式發送ARP要求312至備用群組320中每一路由器。圖4B將揭示根據本發明實施例,活動路由器322及備用路由器324收到來自交換機310之ARP要求312後,活動路由器及備用路由器處理模組之方法流程圖。圖4B將配合圖3A及3B以說明本發明實施例。該活動路由器及備用路由器皆包含一活動路由器及備用路由器處理模組。
●步驟432:活動路由器322收到來自交換機310之ARP要求312。
●步驟434:送出ARP應答314至交換機310,以提供虛擬路由器之”虛擬MAC位址”。
●步驟436:,且發送”Hello”訊息330至同一備用群組320內之備用路由器324,以通知備用路由器324,指示該ARP要求312已由該活動路由器322應答。 備用路由器324收到此”Hello”訊息330,將因而重新啟動該保持時間定時器。
<備用路由器處理模組>
●步驟442:備用路由器324收到來自交換機310之ARP要求312。
●步驟444:啟動一保持時間定時器,以等待活動路由器322送來之”Hello”訊息330。
●步驟446:確定是否在保持時間定時器終止前收到來自活動路由器之“Hello”訊息330。
●步驟447:若該備用路由器324於該保持時間定時器終止前,收到”Hello”訊息330,則該備用路由器324維持備用態,且重新啟動該保持時間定時器。
●步驟448:若該備用路由器324於該保持時間定時器終止前,都沒有收到”Hello”訊息330,則將推定該活動路由器322已失效(停機),並進入活動態成為新活動路由器,而接管路由器的職責;且回應該ARP要求312而送出ARP應答316,以提供該虛擬路由器之”虛擬MAC位址”。該包含虛擬MAC位址之ARP應答表明代表該虛擬路由器之實際路由器已改變為備用路由器324。此時,將由該新活動路由器發送”Hello”訊息330。
由於本發明係於每次交換機收到一輸入訊息時,先以廣播方式發送ARP要求以確認目前之活動路由器。於確認代表虛擬路由器之實際路由器後,該交換機才轉發該輸入訊息。當一活動路由器失效後,一備用路由器將立刻接管路由器的職責。因而,若一活動路由器失效,該交換機將於收到ARP應答而確認代表虛擬路由器之實際路由器後,才轉發該輸入訊息。故除非於轉發時該新活動路由器失效,否則不會有訊息遺漏。然縱使有訊息遺漏,也僅該收到之訊息遺漏。此遺漏之訊息量也遠小於習知以秒計之黑洞的時間間隙。因此, 藉由前述本發明實施例揭示之交換機處理模組、活動路由器及備用路由器處理模組,本發明提供一具有零黑洞或遠小於習知黑洞之時間間隙的故障備援機制。
需說明的是,為提高本發明之轉發效率,該訊息可不只是一封包,而也可以是一TCP流或一交易。例如只要該交換機支援TCP流之位址解析機制。傳送TCP流將提供較封包為佳之轉發效率。此外,前述本發明實施例雖是以熱備用路由器協定(HSRP)為例,但並非是用於限定本發明。在其他實施例,本發明也可適用於其他不同之第一跳冗餘協定(FHRP),如虛擬路由器冗餘協議(VRRP)和閘道負載均衡協定(GLBP),之系統或資訊設備(appliance)。
因此,在不脫離本發明精神或必要特性的情況下,可以其他特定形式來體現本發明。應將所述具體實施例各方面僅視為解說性而非限制性。因此,本發明的範疇如隨附申請專利範圍所示而非如前述說明所示。所有落在申請專利範圍之等效意義及範圍內的變更應視為落在申請專利範圍的範疇內。
100、300‧‧‧主機
110、310‧‧‧交換機
122、322‧‧‧活動路由器
124、324‧‧‧備用路由器
120、320‧‧‧冗餘或備用群組
130、330‧‧‧”Hello”訊息
200‧‧‧資訊設備
210‧‧‧處理器
220‧‧‧記憶體
240‧‧‧輸入/輸出(I/O)單元
250‧‧‧硬碟機
260‧‧‧區域網路(LAN)配接器
230‧‧‧網路
312‧‧‧ARP要求
314、316‧‧‧ARP應答
為了立即瞭解本發明的優點,請參考如附圖所示的特定具體實施例,詳細說明上文簡短敘述的本發明。在瞭解這些圖示僅描繪本發明的典型具體實施例並因此不將其視為限制本發明範疇的情況下,參考附圖以額外的明確性及細節來說明本發明,圖式中: 圖1係顯示習知一包含一活動路由器及一備用路由器之HSRP配置之示意圖;圖2係顯示本發明一例示性實施例中可供作為交換機或路由器之資訊設備(Appliance)之硬體環境的方塊示意圖;圖3A揭示根據本發明實施例,一活動路由器正常運作時之工作示意圖;圖3B則揭示根據本發明實施例,一活動路由器於失效時實施故障備援之示意圖;圖4A揭示根據本發明實施例,交換機處理模組400方法流程圖;圖4B將揭示根據本發明實施例,活動路由器或備用路由器處理模組之方法流程圖。

Claims (19)

  1. 一種在一冗餘群組中實施故障備援的方法,其中該冗餘群組包含複數個路由器,該複數個路由器包含一活動路由器及一備用路由器,該方法包含以下步驟:接收一輸入訊息;發送一確認要求,以確認代表該冗餘群組之一虛擬路由器之目前的活動路由器;及若在一預設時間內為收到該確認要求之包含一識別符之應答,則轉發該輸入訊息至送出該應答之路由器,其中送出該應答的路由器為代表該虛擬路由器之該目前的活動路由器。
  2. 如請求項1之方法,其中該發送一確認要求係以廣播方式發送一ARP要求,以解析代表該冗餘群組之該虛擬路由器之一虛擬IP位址相應的一虛擬MAC位址,而該應答是一包含虛擬MAC位址之ARP應答。
  3. 如請求項2之方法,其進一步包含若在預設時間內未收到來自ARP應答,則重送該ARP要求。
  4. 如請求項2或3之方法,其中該冗餘群組係一熱備用路由器協定(HSRP)群組或一虛擬路由器冗餘協議(VRRP)群組。
  5. 如請求項2或3之方法,其中該輸入訊息係一封包,一 TCP流或一交易。
  6. 一種在一冗餘群組中實施故障備援的方法,其中該冗餘群組包含複數個路由器,該複數個路由器包含一活動路由器及一備用路由器,該方法包含以下步驟:接收來自一交換機之確認要求,該確認要求係用以確認代表該冗餘群組之一虛擬路由器之目前的活動路由器;發送一包含一識別符之應答;及發送一通知訊息至該冗餘群組內之該備用路由器,以指示該確認要求已由該活動路由器應答。
  7. 如請求項6之方法,其中該確認要求係一ARP要求,以解析代表該冗餘群組之虛擬路由器之一虛擬IP位址相應的一虛擬MAC位址,而該應答是一包含虛擬MAC位址之ARP應答。
  8. 如請求項7之方法,其中該通知訊息係一”Hello”訊息,而以廣播或多點傳送的方式發送,以指示該ARP要求已由該活動路由器應答。
  9. 如請求項8之方法,其中該冗餘群組係一熱備用路由器協定(HSRP)群組或一虛擬路由器冗餘協議(VRRP)群組。
  10. 如請求項8之方法,其中該輸入訊息係一封包,一TCP流或一交易。
  11. 一種在一冗餘群組中實施故障備援的方法,其中該冗餘群組包含複數個路由器,該複數個路由器包含一活動路由器及一備用路由器,該方法包含以下步驟:接收來自一交換機之確認要求,該確認要求係用以確認代表該冗餘群組之一虛擬路由器之目前的活動路由器;啟動一保持時間定時器,以等待該活動路由器送來之一通知訊息;及若該備用路由器於該保持時間定時器終止前,都沒有收到該通知訊息,則進入一活動態成為新活動路由器,而接管路由器的職責;且回應該確認要求而發送一包含一識別符之應答,以表明該備用路由器目前代表該虛擬路由器而為新活動路由器。
  12. 如請求項11之方法,其進一步包含若該備用路由器於該保持時間定時器終止前,收到該通知訊息,則該備用路由器維持一備用態,且重新啟動該保持時間定時器。
  13. 如請求項12之方法,其中該備用路由器進入一活動態成為新活動路由器,進一步包含發送一通知訊息至該冗餘群組內之其他備用路由器,以指示該確認要求已由新活動路由器應答。
  14. 如請求項11或12或13之方法,其中該確認要求係一ARP要求,以解析代表該冗餘群組之虛擬路由器之一虛擬IP位址相應的一虛擬MAC位址,而該應答是一包含虛擬MAC 位址之ARP應答。
  15. 如請求項14之方法,其中該通知訊息係一”Hello”訊息而以廣播或多點傳送的方式發送。
  16. 如請求項15之方法,其中該冗餘群組係一熱備用路由器協定(HSRP)群組或一虛擬路由器冗餘協議(VRRP)群組。
  17. 如請求項15之方法,其中該輸入訊息係一封包,一TCP流或一交易。
  18. 一種電腦程式產品包含一儲存有程式碼之電腦可讀媒體,供於一資訊設備上執行時,實施如請求項1至17中任一項之方法,以在一冗餘群組中實施故障備援。
  19. 一種資訊設備,包含:一匯流排;一記憶體,連接到該匯流排,其中該記憶體包含一組指令;一連接到該匯流排之處理單元,其中該處理單元執行該組指令,以執行如申請專利範圍第1至17項之任一項所述之方法,以在一冗餘群組中實施故障備援。
TW101143054A 2012-11-19 2012-11-19 在一冗餘群組中實施故障備援的方法、裝置與電腦程式產品 TW201421232A (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
TW101143054A TW201421232A (zh) 2012-11-19 2012-11-19 在一冗餘群組中實施故障備援的方法、裝置與電腦程式產品
US14/083,351 US9219640B2 (en) 2012-11-19 2013-11-18 Performing failover in a redundancy group
US14/472,420 US9219641B2 (en) 2012-11-19 2014-08-29 Performing failover in a redundancy group

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
TW101143054A TW201421232A (zh) 2012-11-19 2012-11-19 在一冗餘群組中實施故障備援的方法、裝置與電腦程式產品

Publications (1)

Publication Number Publication Date
TW201421232A true TW201421232A (zh) 2014-06-01

Family

ID=50729123

Family Applications (1)

Application Number Title Priority Date Filing Date
TW101143054A TW201421232A (zh) 2012-11-19 2012-11-19 在一冗餘群組中實施故障備援的方法、裝置與電腦程式產品

Country Status (2)

Country Link
US (2) US9219640B2 (zh)
TW (1) TW201421232A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI676378B (zh) * 2018-08-03 2019-11-01 思銳科技股份有限公司 網路自動鏈結備援方法與網路系統

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10581763B2 (en) 2012-09-21 2020-03-03 Avago Technologies International Sales Pte. Limited High availability application messaging layer
US9967106B2 (en) 2012-09-24 2018-05-08 Brocade Communications Systems LLC Role based multicast messaging infrastructure
US9619349B2 (en) * 2014-10-14 2017-04-11 Brocade Communications Systems, Inc. Biasing active-standby determination
WO2016132659A1 (ja) * 2015-02-18 2016-08-25 日本電気株式会社 無線通信システム、無線通信装置、無線通信方法
CN106301823B (zh) * 2015-05-19 2020-12-18 中兴通讯股份有限公司 一种关键组件的故障告警方法、装置及大数据管理系统
US10554620B2 (en) * 2015-05-29 2020-02-04 Cisco Technology, Inc. Default gateway extension
CN106789146B (zh) * 2016-04-15 2021-04-02 新华三技术有限公司 一种拓扑获得方法及装置
WO2018052046A1 (ja) * 2016-09-16 2018-03-22 Necフィールディング株式会社 監視装置、端末装置、通信システム、監視装置の制御方法、端末装置の制御方法及びプログラム
TWI666896B (zh) * 2017-12-26 2019-07-21 資易國際股份有限公司 網路設備實虛位址對應失效之自動修復方法
JP6781175B2 (ja) * 2018-02-21 2020-11-04 日本電信電話株式会社 エッジ装置、制御方法及びプログラム
US11418382B2 (en) * 2018-07-17 2022-08-16 Vmware, Inc. Method of cooperative active-standby failover between logical routers based on health of attached services
US11876709B2 (en) * 2019-06-14 2024-01-16 Nippon Telegraph And Telephone Corporation Monitoring device, redundancy switching method, redundancy switching program, and network system
US10833981B1 (en) * 2019-06-24 2020-11-10 Allot Ltd. Method, device, and system for providing hot reservation for in-line deployed network functions with multiple network interfaces
US11323310B2 (en) 2019-06-24 2022-05-03 Allot Ltd. Method, device, and system for providing hot reservation for in-line deployed network functions with multiple network interfaces
US11558240B2 (en) * 2020-03-03 2023-01-17 Arista Networks, Inc. Network element with dual independent sub network elements with seamless failover
CN111402784B (zh) * 2020-03-10 2022-02-18 苏州仰邦软件科技有限公司 一种稳定led控制器网络运行的方法及其显示屏控制系统
US11706185B2 (en) * 2021-10-29 2023-07-18 Juniper Networks, Inc. Address resolution protocol (ARP) response to ARP requests
CN114640574B (zh) * 2022-02-28 2023-11-28 天翼安全科技有限公司 一种主备设备的切换方法及装置

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5473599A (en) * 1994-04-22 1995-12-05 Cisco Systems, Incorporated Standby router protocol
US6148410A (en) * 1997-09-15 2000-11-14 International Business Machines Corporation Fault tolerant recoverable TCP/IP connection router
US7055173B1 (en) * 1997-12-19 2006-05-30 Avaya Technology Corp. Firewall pooling in a network flowswitch
US6256314B1 (en) * 1998-08-11 2001-07-03 Avaya Technology Corp. Apparatus and methods for routerless layer 3 forwarding in a network
EP1041775A1 (en) 1999-03-30 2000-10-04 International Business Machines Corporation Router monitoring in a data transmission system utilizing a network dispatcher for a cluster of hosts
JP2002057682A (ja) * 2000-08-09 2002-02-22 Hitachi Ltd ネットワークインタフェース切替え方法及びネットワークに接続可能なコンピュータ
KR20020017265A (ko) * 2000-08-29 2002-03-07 구자홍 동일 아이피 서브넷상에 구성된 서로 다른 가상랜 사이의통신방법
US7277383B2 (en) * 2001-10-05 2007-10-02 Samsung Electronics Co., Ltd. Redundancy mechanization protocol for a massively parallel router
WO2003067813A2 (en) * 2002-01-15 2003-08-14 Matsushita Electric Industrial Co., Ltd. Routing device and startup method thereof in a home network
US7486611B1 (en) 2002-05-20 2009-02-03 Cisco Technology, Inc. Standby router protocol using optimal route metric
US7152179B1 (en) 2002-09-19 2006-12-19 Cisco Technology, Inc. IP redundancy with improved failover notification
US20050111352A1 (en) 2003-11-21 2005-05-26 Boon Ho Method and system for monitoring a network containing routers using a backup routing protocol
US8213439B2 (en) 2004-01-30 2012-07-03 Hewlett-Packard Development Company, L.P. Method and system for managing a network having an HSRP group
US7924730B1 (en) * 2006-10-30 2011-04-12 Solace Systems, Inc. Method and apparatus for operations, administration and maintenance of a network messaging layer
EP2043306B1 (de) 2007-09-28 2015-04-15 Unify GmbH & Co. KG Verfahren zur Organisation von Netzknoten in einem paketorientierten Netzwerk
BRPI0722112B1 (pt) 2007-10-02 2019-12-24 Ericsson Telefon Ab L M nó de acesso, infraestrutura de rede de telecomunicação, e método e memória lida por computador para comunicação em uma rede de telecomunicação
US8166187B2 (en) 2009-01-28 2012-04-24 Cisco Technology, Inc. Distributed IP gateway based on sharing a MAC address and IP address concurrently between a first network switching device and a second network switching device
US8717888B2 (en) * 2011-10-18 2014-05-06 Cisco Technology, Inc. Optimizations for N-way gateway load balancing in fabric path switching networks

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI676378B (zh) * 2018-08-03 2019-11-01 思銳科技股份有限公司 網路自動鏈結備援方法與網路系統

Also Published As

Publication number Publication date
US20140143591A1 (en) 2014-05-22
US20140369183A1 (en) 2014-12-18
US9219641B2 (en) 2015-12-22
US9219640B2 (en) 2015-12-22

Similar Documents

Publication Publication Date Title
TW201421232A (zh) 在一冗餘群組中實施故障備援的方法、裝置與電腦程式產品
US10917262B2 (en) VXLAN packet forwarding method, device, and system
US7929420B2 (en) Method and apparatus for learning VRRP backup routers
US8509059B2 (en) Method for operating a virtual router redundancy protocol router and communication system therefor
EP3232611B1 (en) Method, device and system for performing bidirectional forwarding detection on an aggregated link
KR100703488B1 (ko) 라우터 이중화 시스템에서 백업 라우터의 상태 천이 방법및 장치
US10164824B2 (en) Indicating a master network controller in a virtual router redundancy protocol
WO2009089784A1 (fr) Procédé, système et équipement permettant l&#39;accès d&#39;un dispositif réseau à un réseau d&#39;échange de paquets
JP5419907B2 (ja) ネットワークシステム、及び通信復旧方法
EP3764619B1 (en) Information backup method and related device
US10813156B2 (en) Method and apparatus for processing network connection
WO2019080592A1 (zh) 一种发送报文的方法和设备
JP2021534669A (ja) パケット処理方法およびゲートウェイ・デバイス
EP3038296B1 (en) Pool element status information synchronization method, pool register and pool element
WO2013104279A1 (zh) Trill网络中设置cvlan的方法和装置
EP3695569B1 (en) A system and method for providing a layer 2 fast re-switch for a wireless controller
CN112564983A (zh) 数据传输方法、装置、计算机系统和介质
WO2022007861A1 (zh) 通知故障的方法和电子设备
US9746899B2 (en) At least one message to announce entry into relatively lower power state
EP4050854A1 (en) Message transmission path switching method, device and system
US11375441B2 (en) Systems and methods for connecting wireless clients to preferred edge devices in active-active deployments
WO2016082168A1 (zh) 信息传输方法、无线设备控制器、无线设备以及基站
CN116112461A (zh) 网络地址的转换方法、装置、电子设备及存储介质