TWI422189B - 檢測通信網路中失敗之方法、設備、系統及電腦程式產品 - Google Patents

檢測通信網路中失敗之方法、設備、系統及電腦程式產品 Download PDF

Info

Publication number
TWI422189B
TWI422189B TW096115303A TW96115303A TWI422189B TW I422189 B TWI422189 B TW I422189B TW 096115303 A TW096115303 A TW 096115303A TW 96115303 A TW96115303 A TW 96115303A TW I422189 B TWI422189 B TW I422189B
Authority
TW
Taiwan
Prior art keywords
adapter
activity
communication
component
network adapter
Prior art date
Application number
TW096115303A
Other languages
English (en)
Other versions
TW200805945A (en
Inventor
Binh K Hua
Sivarama K Kodukula
Original Assignee
Ibm
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ibm filed Critical Ibm
Publication of TW200805945A publication Critical patent/TW200805945A/zh
Application granted granted Critical
Publication of TWI422189B publication Critical patent/TWI422189B/zh

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/24Multipath
    • H04L45/245Link aggregation, e.g. trunking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/28Routing or path finding of packets in data switching networks using route fault recovery
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/50Reducing energy consumption in communication networks in wire-line communication networks, e.g. low power modes or reduced link rate

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Small-Scale Networks (AREA)

Description

檢測通信網路中失敗之方法、設備、系統及電腦程式產品
本揭示內容大體而言係關於通信網路。更特定言之,本揭示內容係關於用於檢測一束通信組件(諸如成束配接器)中之個別組件之失敗的方法及配置。
通信裝置(諸如伺服器、路由器、開關及電腦)之間的通信中對速度及可靠性之需要持續增大。需要有效網路資源(諸如廣播式媒體)之應用程式或其他程式的風行度持續增長。另外,使用者之數目持續增大,且隨著頻寬增大,使用者為改良之頻寬發明新的用途。因此,已近能力操作之網路中對頻寬之要求看起來將日益增大。
基於乙太網路之通信網路已在市場中風行且乙太網路技術之變化持續提供經改良之頻寬。更具體言之,乙太網路家族已經擴展以包括一快速乙太網路系統及一超高速乙太網路系統。兩種系統皆提供優於先前乙太網路組態之顯著的頻寬改良。然而,即使是此等乙太網路系統亦不能充分滿足不斷增長之需要。
為了解決此缺點,許多當前通信網路具有可縮放性特點,當對頻寬之要求增大時,其允許添加額外通信路徑。在基於乙太網路之系統中,添加諸如網路介面卡(NIC)之網路配接器有助於此等新的通信路徑。一網路配接器通常包括一配接器卡及一網路驅動器,其為用以有助於(例如)一電腦之作業系統來操作配接器卡的碼。
通常,多個配接器卡可"成束"(例如,插入)至一通信裝置中且經組態以並列傳輸並接收資料。一乙太通道驅動器通常對於乙太網路中之成束配接器實施一負載分享配置。已對於一通信裝置之叢集開發了諸如IEEE 802.3a & d之許多標準來定址成束配接器。未將成束配接器指派至一特定通信裝置,但是可基於與成束配接器之一者有關之配接器的工作負荷而將來自叢集通信裝置之傳輸指派至成束配接器的另一者。自一軟體應用之觀點,並列操作成束配接器有效地產生一單一、較高頻寬之通信通道。舉例而言,一束八個網路配接器可將資料傳輸速度倍增至一單一配接器之速度的八倍。
此外,取決於由成束配接器支援之叢集通信裝置的數目,成束配接器可經組態以處理一單一網際網路協定(IP)位址或多個IP位址的資料傳輸。因此,諸如開關、路由器及伺服器之通信裝置可經叢集且組態以共用成束配接器或可利用一包含成束配接器之專用、高頻寬通道。
支援一通信裝置之叢集的成束配接器可用以產生一高可用性叢集多重處理(HACMP)環境。一HACMP環境確保一通信路徑為可用的且通信裝置幾乎在所有的時間皆為可獲得的,從而使得極少出現停工時間。一HACMP系統中之一通信裝置亦可倂入失敗檢測機制以檢測失敗的通信通道。
在歷史上,通信網路之失敗檢測機制已利用一"心跳"機構。心跳機構藉由檢測通信通道之操作狀態(亦即,資料是否可在通道上成功傳輸)而用以檢測在一諸如HACMP之軟體應用級處的一網路配接器之操作狀態。
此等失敗檢測機制認識到不能在通道上傳輸資料且當一單一網路配接器處理通道上的通信之傳輸及接收時可使該失敗與網路配接器有關。當前失敗檢測機制之一問題為其不允許檢測一束配接器中之網路配接器的一子集。對於成束配接器而言,軟體應用程式察覺通道之操作且並非個別配接器之操作。詳言之,若一束中之一網路配接器失敗,則一乙太通道驅動器將重傳指派至失敗配接器的資料封包直至經由該束中之其他配接器發生成功傳輸。因此,通道上之資料通信降級但是未必失敗。重傳直至達成一成功通信之過程大大地減小一通信系統之效率。
上文所識別之問題部分地由本文所提供之方法及配置解決以檢測具有成束組件(諸如網路配接器及其子組件)之通信網路介面中的一失敗。一實施例包含一種用以檢測一束組件之一通信組件之一失敗的方法。該方法可包含將資料導引至一與該束中之其他通信組件共用至少一網際網路協定位址的通信組件,其中導引資料應啟動通信組件之至少一部分,且回應於通信而監視通信組件的至少該部分以確定一所監視之活動位準。該方法進一步包含比較所監視之活動位準與一預定活動位準,且在所監視之活動位準小於一預定活動位準的情況下將通信組件標記為一失敗組件。
另一實施例包含一經組態以檢測失敗之設備。該設備可包含:一訊務產生器,其經調適以產生至少一封包以起始一經由一束組件之一通信組件而導引的資料傳輸,其中該束組件經組態以共用與至少一網路位址有關之資料傳輸活動。該設備可進一步包含:一活動監視器,其用以回應於至少一封包而檢測通信組件之一所監視之活動位準;及一活動比較器,其用以比較所監視之活動位準與一預定活動位準以確定是否將通信組件識別為一失敗組件。
另一實施例包括一用以檢測成束配接器之一網路配接器之失敗的設備。該設備可包含:一計時器,其用以界定一時間間隔;一活動監視器,其用以在時間間隔期間確定一網路配接器之一活動位準且用以回應於至少一測試封包而監視網路配接器之活動;及一活動比較器,其用以比較所確定之活動位準與一預定活動位準,以在所確定之活動小於預定活動位準的情況下將網路配接器識別為一可疑配接器。設備可進一步包含:一訊務產生器,其用以將至少一測試封包傳輸至可疑配接器;及一旗標,其用以在所監視之活動小於一與至少一測試封包相關聯之計劃中的活動之情況下將可疑配接器標記為一失敗配接器。
另一實施例包括一系統。該系統可包含:成束配接器,其用以共用一資料傳輸負載;及一失敗檢測邏輯,其耦接至成束配接器以擷取一指示資料傳輸活動之第一值且基於該值而識別一可疑配接器。失敗檢測邏輯亦可經由可疑配接器而傳輸一測試封包,經由可疑配接器而擷取一指示資料傳輸活動之第二值,且基於第二值而確定是否將可疑配接器標記為一失敗配接器。
又一實施例包括一電腦程式產品,其包含一具有一電腦可讀程式之電腦可用媒體。當在一電腦上執行時,電腦可讀程式使電腦將資料導引至一與該束中之其他通信組件共用至少一網際網路協定位址的通信組件,其中導引資料應啟動通信組件之至少一部分,且回應於通信而監視通信組件之至少該部分以確定一所監視之活動位準。當在一電腦上執行時,電腦可讀程式進一步使電腦比較所監視之活動位準與一預定活動位準,且在所監視之活動位準小於一預定活動位準的情況下將通信組件識別為一失敗組件。
下文為隨附圖式中所描繪之新穎實施例的一詳細描述。實施例係詳細的以清楚地傳達主題。然而,所提供之細節的量並不意欲限制所描述之實施例的預期變化;但是反之,申請專利範圍及詳細描述將涵蓋屬於如藉由附加之申請專利範圍所界定的本教示之精神及範疇內的所有修改、均等物及替代。下文之詳細描述經設計以使得一般熟習此項技術者可理解此等實施例。
通常,本文提供用以檢測具有成束組件之通信網路中之失敗的方法及配置。雖然下文將參考配接器、組件、電路或邏輯組態描述特定實施例,但是熟習此項技術者將認識到可用其他組件及組態有利地實施本揭示內容之實施例。許多實施例可有效地檢測已成束於一通信網路中的任何組件或組件之子集的一失敗。
下文所描述之實施例檢測諸如成束配接器之一束組件的個別組件之失敗。組件經常經成束(例如,經組態)以一起工作且共用工作負荷,以使得許多組件可對於一單一電腦、開關、路由器、集線器等或其之一群組傳輸並接收資料。通常,通信裝置可經由成束配接器而與一通信網路介接。一實施例可藉由倂入配接器之媒體存取控制(MAC)位址而將一測試封包發送至該束中之一配接器。實施例接著可監視配接器以確定傳輸是否在配接器內產生活動。若未檢測到活動,則可將配接器標記為一失敗配接器。
另外的實施例可監視一配接器束之配接器以便成功傳輸及/或接收資料。在此等實施例中,若一配接器之活動不滿足或超過一預定活動位準,則一或多個測試封包可經定址以傳輸至配接器及/或自配接器傳輸。
可經由一或多個機構而完成監視一束配接器中之一配接器的活動。舉例而言,該束中之每一配接器中之一暫存器可維持自對應之配接器傳輸及/或傳輸至對應之配接器的封包之一計數或其他指示。在一些實施例中,指示可包含指示成功傳輸及/或接收資料之一計數或其他值。在其他實施例中,一電路可監視一藉由一配接器所施加至一通信媒體的信號以確定傳輸活動。在另外的實施例中,配接器可監視與一配接器相關聯之一輸入或輸出佇列的內容以確定一活動位準。且在另外的實施例中,可起始每一配接器內之自我測試機構以確定活動。亦可考慮其他監視實施例。
一旦一配接器測試失敗,即可將配接器標記為一失敗配接器,及/或一後備配接器可啟動以替代失敗配接器。亦可撤銷失敗配接器。
現轉至圖1,其中展示一通信網路100或其之至少一部分,該通信網路經調適以在一資料介面110與一資料儲存庫150之間傳輸大量的資料。舉例而言,資料儲存庫150可維持可經由儲存庫介面152而存取之大量的資料154,且資料介面110可有助於經由一儲存庫介面112而存取資料114,且經由儲存庫介面152而存取資料154。通信裝置120及160可在資料介面110與資料儲存庫150之間提供高速資料傳輸以減小在資料114與資料154之間存取的等待時間之差異。
通信網路100包含:資料介面110,其與通信裝置120耦接;及資料儲存庫150,其與通信裝置160耦接。此外,通信裝置120經由通信媒體140而與通信裝置160通信地耦接。通信裝置120及160可包括伺服器、開關、路由器、橋接器或可經由通信媒體140而進行通信之任何其他裝置。儘管將通信媒體140說明為一有線連接,但是通信媒體140亦可經由無線收發器、光纖長絲及/或其他通信媒體而實施。在一些實施例中,通信裝置120及160分別亦可包括諸如一乙太通道驅動器、一乙太網路驅動器及失敗檢測邏輯130及170之組件。
在本實施例中,通信媒體140包含具有連接器之電纜,其中連接器插入至由成束配接器124及164提供之埠中。每一埠可在通信媒體140的一電纜與成束配接器124或164的一單一配接器之間提供一實體連接。成束配接器124可包含兩個或兩個以上配接器卡,其經成束以共同承擔通信裝置120與160之間的資料傳輸責任。成束配接器124及164可為插入至通信裝置120及164中之卡槽中的電路卡且可包括一或多個後備卡,以防成束配接器之一者失敗或否則不可靠地用於在通信媒體140上傳輸資料。此外,成束配接器124及164可在通信過程中實施操作之(開放系統互連"OSI"層模型之)資料鏈路及實體層以在通信裝置120與通信裝置160之間傳送資料。
失敗檢測邏輯130可為硬體、碼或其之某組合,其經調適以檢測成束配接器124之正失敗或失敗配接器卡,且在一些實施例中,其經調適以啟動一後備配接器卡以替代失敗或正失敗配接器卡。失敗檢測邏輯130包含一時序模組132、一活動監視器/比較器134及一訊務產生器136。時序模組132可包含一時鐘或接收一時鐘信號以確定與成束配接器124之一或多個配接器卡的資料傳輸活動有關之一時間週期的到期。
活動監視器/比較器134可在時間週期期間監視與配接器卡有關之資料傳輸活動且比較活動位準與一預定活動位準。若對於成束配接器124之配接器卡而言,通常配接器卡之活動位準小於預期活動位準,則活動監視器/比較器134可指示活動位準為可疑的。在一些實施例中,指示可與一特定配接器卡有關。
在其他實施例中,活動監視器/比較器134可藉由配接器卡來監視並比較資料傳輸之其他態樣,諸如重傳請求之數目、不成功資料傳輸與成功資料傳輸之百分率及其類似物。在此等實施例中,活動監視器/比較器134可比較活動與預定值或可比較活動與成束配接器124中之其他配接器卡的活動。在另外的實施例中,可相對於關於通信媒體140上之訊務及/或對於成束配接器124所實施之負載平衡機制的啟發式資料對每一配接器卡加權活動比較。
回應於一來自活動監視器/比較器134之可疑活動位準的一指示,訊務產生器136可經由成束配接器124中之配接器的一或多者而傳輸一測試封包。在若干實施例中,訊務產生器136可包括源及/或目的MAC位址122以用於成束配接器124之一或多個個別配接器,以確保為經測試之特定配接器卡指派任務來傳輸及/或接收測試封包。舉例而言,若活動監視器/比較器134指示一特定配接器卡之活動為可疑,則訊務產生器136可傳輸一具有可疑配接器卡之源及/或目的位址的封包。在其他實施例中,失敗檢測邏輯130可以一確保每一配接器卡傳輸及/或接收封包至少一次的方式傳輸許多封包。
在訊務產生器136經由成束配接器124之配接器卡而傳輸一或多個測試封包之後,活動監視器/比較器134監視對應之配接器卡以用於傳輸及/或接收活動。若配接器卡之一或多者未能指示與測試封包有關之傳輸及/或接收活動,則失敗檢測邏輯130可藉由將一或多個位元儲存於一暫存器中而將一或多個配接器卡標記為失敗。
失敗檢測邏輯170以類似於失敗檢測邏輯130與成束配接器124之相互作用的方式與成束配接器164相互作用。然而,失敗檢測邏輯170包含記憶體以儲存MAC位址178,而失敗檢測邏輯130經由通信裝置120而存取可用之MAC位址。在許多實施例中,失敗檢測邏輯130可與失敗檢測邏輯170進行通信以識別成束配接器124及164之失敗或正失敗配接器。舉例而言,當成束配接器124之一配接器未能接收到一封包時,配接器束164之配接器或傳輸配接器可存在問題。因此,失敗檢測邏輯130可與失敗檢測邏輯170進行通信以確定失敗檢測邏輯170之一活動監視器是否指示成功傳輸封包。若成束配接器164成功地傳輸封包,但是成束配接器124在許多重傳之後未能接收到封包,則失敗配接器可為成束配接器124之部分。另一方面,若成束配接器164之配接器在許多再嘗試之後未成功地傳輸封包,則失敗配接器可為成束配接器164的部分。
參看圖2,一開放系統互連(OSI)層圖200與用於一乙太網路介面之成束配接器240相關聯。此實施例為許多可能協定之一者提供一實例。另外的實施例實施其他協定。通常,應用程式202表示:諸如一作業系統之一組指令,用以支援一作業系統之碼,用以在一由一作業系統產生之環境內執行的碼,及/或其他碼。應用程式202可確定在一乙太網路上傳輸資訊且可產生可經由一插口204傳輸之資料,該資料表示依照一所界定之協定的資訊。
傳輸控制協定/網際網路協定(TCP/IP)206包含一兩層協定以調適資訊以便在一如乙太網路的TCP/IP網路上傳輸。乙太通道驅動器220包含一用以利用乙太網路驅動器250-290及乙太網路配接器254-294作為成束配接器240的碼。詳言之,乙太通道驅動器220劃分成束配接器240之配接器254-294之間的資料傳輸責任,而諸如乙太網路驅動器270之乙太網路驅動器協調經由諸如乙太網路配接器274之單一配接器而在通信媒體上的傳輸。在本實施例中,乙太通道驅動器220維持乙太網路驅動器250及乙太網路配接器254作為一後備256且可利用後備256來替代成束配接器240之一正失敗配接器及驅動器對。
乙太通道驅動器220包含一路由器222、一媒體存取控制(MAC)位址表224及一失敗檢測邏輯230。路由器222確定一用於經由TCP/IP 206所接收之資料的路由。路由器222可將輸出資料置放於一輸出佇列中。在一些實施例中,輸出佇列可與乙太網路驅動器250-290之一特定乙太網路驅動器相關聯。在另外的實施例中,路由器222可使資料之封包與來自MAC位址表224的MAC位址相關聯以為資料之封包指派乙太網路驅動器250-290之特定乙太網路驅動器。在其他實施例中,乙太網路驅動器250-290可基於用以傳輸封包之乙太網路配接器254-294的可用性、與封包相關聯之優先權及/或其他因素而自一與成束配接器240相關聯之輸出佇列聚集封包。
失敗檢測邏輯230可測試並監視乙太網路驅動器250-290及乙太網路配接器254-294之操作以檢測失敗配接器。失敗檢測邏輯230可為乙太通道驅動器220之碼且可包含一訊務產生器232、一活動比較器234及一活動監視器236。在一些實施例中,訊務產生器232可產生一封包且藉由使封包與乙太網路驅動器280之一或多個MAC位址相關聯而將封包之傳輸及/或接收指派至乙太網路配接器284。一旦傳輸及/或接收封包,乙太網路驅動器280即可在一暫存器、TX計數器/RX計數器282中增加一或多個值。活動監視器235可檢測TX計數器/RX計數器282,且活動比較器234可比較經檢測之活動與計劃中的活動以確定乙太網路驅動器280與乙太網路配接器284是否恰當地操作。若乙太網路驅動器280及乙太網路配接器284未恰當地操作,則失敗檢測邏輯230可將乙太網路驅動器280及乙太網路配接器284標記為一失敗配接器,且在本實施例中,利用後備256。在另外的實施例中,失敗檢測邏輯230可經由硬體、應用程式202及/或其他通知裝置而傳輸失敗配接器之一通知。
在其他實施例中,失敗檢測邏輯230可具有一內部計時器且命令乙太網路驅動器250-290在一預定時間間隔期間將傳輸活動及接收活動資料儲存於暫存器、TX計數器/RX計數器252-292中。在完成時間間隔之後,活動監視器236可自TX計數器/RX計數器252-292擷取活動位準資料。活動比較器234可比較所擷取之活動資料與活動之一臨限位準,以識別看來似乎顯示異常行為之驅動器及配接器。活動位準可為對一配接器每一分鐘傳輸或接收多少封包之一量測。若失敗檢測邏輯230確定一諸如一驅動器或一配接器之組件以一可接受之方式操作,則可將計時器及暫存器重設為零且監視可持續。另一方面,若失敗檢測邏輯230確定一驅動器及/或配接器具有一低活動位準,或活動位準小於一預定位準,則可將驅動器及/或配接器識別為一可疑驅動器及/或配接器(一用於進一步測試之候選者)。
一旦識別一可疑驅動器及/或配接器,訊務產生器232即可產生一測試封包且將封包定址至可疑配接器。此一封包亦可包括一回送命令或一脈衝信號命令。在其他實施例中,訊務產生器232可請求應用程式202或其他機構產生封包且接著使封包與可疑配接器之一MAC位址相關聯。
在發送封包之後,活動監視器236可再次擷取TX計數器/RX計數器252-292的所儲存之活動資料以查看封包是否有助於任何傳輸或接收活動。在一實施例中,活動監視器236可監視對封包之一特定答覆。回送命令亦可請求一待由可疑驅動器或配接器執行之自我測試。在另外的實施例中,可藉由失敗檢測邏輯230來聚集並分析多種類型之反饋以確定一配接器是否失敗。
成束配接器240可為分別與乙太網路配接器254-294配對之許多乙太網路驅動器250-290,其經由碼及/或硬體而調適以充當一單一通信通道。可為每一乙太網路驅動器及乙太網路配接器對指派一獨佔式媒體存取控制(MAC)位址。且在本實施例中,每一乙太網路驅動器250-290可分別包含邏輯以維持TX計數器/RX計數器252-292,以有助於監視每一乙太網路驅動器及乙太網路配接器對的資料傳輸活動。此外,乙太網路配接器254-294之每一者可包含一埠以將成束配接器240連接至通信媒體。可以電路卡(可將其插入至一支架、一卡片機架、一處理裝置或一通信裝置且可將其自一支架、一卡片機架、一處理裝置或一通信裝置移除)的形式實施乙太網路配接器254-294。
在本實施例中,乙太網路驅動器250-290之每一者具有一傳輸活動監視器及計數器及一接收活動監視器及計數器以維持TX計數器/RX計數器252-292。TX計數器/RX計數器252-292儲存指示兩個相關聯之乙太網路驅動器及乙太網路配接器之過去活動的值。舉例而言,TX計數器/RX計數器252-292可儲存在一預定時間間隔期間所傳輸及所接收之封包的數目。在其他實施例中,活動監視器/計數器甚至可體現為一獨立電路卡(未圖示)。另外,活動監視器/計數器可經調適以檢測信號線上之信號轉變且對應地儲存此資料。在其他實施例中,可遠端定位暫存器、TX計數器/RX計數器252-292。
參看圖3,描繪一通信網路介面300之另一實施例。通信網路介面300包括:一通信裝置310,其具有一與成束組件350耦接之成束驅動器312及記憶體314;及一失敗檢測邏輯320。通信裝置310經由成束組件350之通信媒體354-384而發送並接收資料。且成束驅動器312分配資料傳輸負載以便在成束組件350之組件352-382之中輸出資料。
失敗檢測邏輯320可包括一處理器340,其具有一組件旗標342及一活動監視器344。失敗檢測邏輯320亦可包括記憶體330、一時鐘/計時器322、一活動比較器324及一訊務產生器326。處理器340協調對測試功能及資料之測試及使用。舉例而言,處理器340可基於預定及/或動態因素(諸如時鐘週期之推移、先前活動位準、一活動之圖案)及/或其他因素而起始測試。
在操作期間,時鐘/計時器322可經組態以界定特定時間週期,在該等時間週期期間,可進行監視過程。此等時序參數可用以啟動並撤銷許多組件或過程,且用於此啟動之時序組態可為可選擇使用者的。舉例而言,可以重現之預定間隔監視組件362-382之活動達特定持續時間之一時間週期。在本實施例中,一使用者可選擇或修改此等時間相依特點之每一者的時序。此等使用者選擇可儲存於記憶體330之活動時間週期332中。
處理器340可回應於時鐘/計時器322而自活動監視器344請求資料傳輸活動且將資料傳輸活動傳遞至活動比較器324。當藉由活動監視器344所確定之活動位準小於活動位準334之預定活動位準時,活動比較器324可對於組件352-382比較活動與儲存於記憶體330中之活動位準334,處理器340可基於結果而識別一可疑組件。接著,處理器340可啟動訊務產生器326以產生並傳輸一具有可疑組件之MAC位址的測試封包。測試封包可包括自可疑組件請求一回應之指令。活動監視器344可在發送測試封包之後監視系統之任何活動,且若未藉由活動監視器344檢測到一適當回應,則組件旗標342可標記可疑組件。
在一些實施例中,活動位準334可為初步測試量度,其可基於與成束組件350內的特定組件之活動位準或組件之平均活動位準有關的啟發式資料而更新。在其他實施例中,位準可包含所預期之中值或平均活動位準,所預期之位準的範圍及/或其他位準指示。
訊務產生器326可產生一測試封包,其具有一脈衝信號命令、一回送命令、一自我測試命令或一命令一組件答覆特定資料(諸如一對儲存於一特定記憶體位置處之內容的請求)的命令。活動監視器344亦可用來自其他組件或源之輔助獲取組件活動之結果。因此,訊務產生器326可產生封包且將封包發送至可疑或候選者組件,且若未恰當地操作組件,則通信網路介面300將不會接收一適當答覆,且可將一組件標記為一失敗組件。
當確定一組件已失敗時,失敗檢測邏輯320可啟動後備組件352且藉由利用後備組件352之MAC位址代替失敗組件之MAC位址來撤銷失敗組件。上述時間間隔及時間週期可經調整(亦即,延長或縮短)以改良失敗檢測邏輯320之效能。
成束組件350包含組件362、372及382(362-382)及一後備組件352。成束組件350可包含諸如乙太網路配接器卡之裝置且可有助於遠端裝置(未圖示)與通信裝置310之間的網路通信。線N組件382表示可用組件362及372成束之任何數目的組件。
參看圖4,揭示描繪一通信網路介面之成束通信組件的失敗檢測邏輯之一實施例之操作的流程圖400。如步驟402中所說明,可初始化失敗檢測邏輯。在初始化期間,失敗檢測邏輯可儲存一時間間隔以便獲取一通信組件之一樣本活動位準及一最小活動臨限位準,且可重設一活動計數器及一計時器。另外,失敗檢測邏輯可儲存一工作週期或時間間隔達由使用者提供之重現測試間隔。所儲存之參數可規定取樣通信組件之活動的異動之時序。在一實施例中,一乙太網路配接器為感興趣之通信組件。最小活動位準可包含成功傳輸確認與對再嘗試之請求、所成功傳輸之封包的數目、所成功接收之封包的數目及/或指示一通信組件之操作的其他因數的一比率。
在步驟404中,失敗檢測邏輯可在步驟402處之初始化期間所設定的取樣週期期間監視通信組件之活動。在決策步驟406處,一活動比較器可比較通信組件之活動位準與預定活動位準以確定通信組件之活動位準是否高於預定位準。若通信組件之活動位準高於預定位準,則失敗檢測邏輯可進行至步驟416以重設計時器及計數器,且進行至步驟404以持續監視相同或另一通信組件之活動。
當通信組件之活動位準低於預定位準時,如在步驟406處所確定,失敗檢測邏輯可定址一或多個測試封包以如步驟408中所描述地經由通信組件而傳輸並接收一或多個測試封包。在決策步驟410處,失敗檢測邏輯可回應於一或多個測試封包而確定通信組件是否展示任何活動。若檢測到一個以上臨限活動,則失敗檢測邏輯可進行至步驟416,其中重設計時器及計數器,且監視活動可持續。當檢測到少於一臨限活動位準時,在步驟412處,失敗檢測邏輯可自一指派可用性表撤銷通信組件及/或移除通信組件。指派可用性表可包含MAC位址,其可用於指派輸出封包以便在通信媒體上傳輸及/或可用於經由通信媒體而接收封包。
在步驟414處,失敗檢測邏輯可啟動一諸如一後備乙太網路配接器之後備組件以替代一失敗通信組件。在一組態中,失敗檢測邏輯可以電子郵件格式將一訊息發送至網路之一使用者或一管理者,企圖向管理者通知失敗。此一失敗檢測系統可檢測與成束組件相關聯之硬體及軟體失敗。
在另一實施例中,可跳過步驟404及406中所說明之步驟,其中在步驟402處的初始化之後,過程可以預定時間間隔(可能每十分鐘)發送測試通信且收聽一答覆。如步驟410中所說明,測試通信亦可基於檢測一閒置通信組件來啟動。
參看圖5,描繪一用以檢測成束配接器之個別配接器之失敗的失敗檢測邏輯之流程圖500。如步驟502中所說明,失敗檢測邏輯可將一傳輸計數器(TX COUNT)及接收計數器(RX COUNT)設定至一諸如零的預定或臨限值(分別為X及Y),其指示一配接器即使在低活動之週期期間應具有之一最小活動位準。根據步驟504,失敗檢測邏輯可基於一計時器來確定將在何時監視一配接器之活動且將監視多久。
計時器可具有一預定到期值且當時間週期到期時產生一警報。當時間週期到期時,如步驟508中所說明,失敗檢測邏輯可擷取配接器的所監視之傳輸計數(X')及接收計數(Y')。在決策步驟510處,失敗檢測邏輯可確定所監視之傳輸及接收計數(X'及Y')是否小於在步驟502中所設定之預期傳輸及接收計數(X及Y)。當臨限計數小於或等於所監視之計數時,如步驟511中所說明,可將傳輸計數器(TX COUNT)設定至所監視之傳輸計數(X')且可將接收計數器(RX COUNT)設定至所監視之接收計數(Y')。接著,失敗檢測邏輯可返回進行至步驟504,其中可重新起動計時器。
當所監視之計數(X'及Y')小於臨限值計數(X及Y)時,一訊務產生器可如步驟512中所說明地產生配接器之一測試封包。根據步驟513,失敗檢測邏輯可導引測試封包以經由配接器而傳輸及/或接收測試封包。在步驟514處,活動監視器可聚集所監視之傳輸及接收計數(X'及Y')。接著,如決策步驟516處所說明,活動比較器可再次比較預期傳輸及接收計數(X及Y)與所監視之傳輸及接收計數(X'及Y')以確定所監視之計數是否回應於測試封包而變化。在步驟512處,當所監視之計數回應於測試封包而變化時,可重設臨限計數(X=X'及Y=Y')。如藉由步驟518所描述,若所監視之計數未變化,則失敗檢測系統可將配接器識別為一失敗或不良配接器。接著,失敗檢測邏輯可返回至步驟504以持續監視成束配接器之剩餘者。
圖6以一方塊圖格式說明一諸如一個人電腦系統600之處理裝置。電腦系統600經說明以包括:一中央處理單元610,其可為一習知專屬資料處理器;記憶體,其包括隨機存取記憶體(RAM)612;唯讀記憶體(ROM)614;及輸入輸出(I/O)配接器622;一使用者介面配接器620;一成束配接器介面624;及一多媒體控制器626。
輸入輸出(I/O)配接器622進一步連接至且控制磁碟機647、印表機645、可移除儲存裝置646以及其他標準及專屬I/O裝置。使用者介面配接器620可被認為是一專門I/O配接器。配接器620如所說明地連接至一滑鼠640及一鍵盤641。另外,使用者介面配接器620可連接至能夠提供各種類型之使用者控制的其他裝置(諸如觸摸式顯示幕裝置(未圖示))。
成束配接器介面624經由成束配接器650而促進高頻寬資料傳輸且亦與一數據機651耦接。成束配接器介面624包含一失敗檢測邏輯625以監視成束配接器650之個別配接器的恰當操作。舉例而言,失敗檢測邏輯625可比較再嘗試與成功傳輸的一所監視之百分率與一預定百分率。對於一特定配接器而言,若所監視之百分率顯著大於預定百分率,則失敗檢測邏輯625可藉由產生用以傳輸及接收的用於特定配接器之測試封包來進一步測試配接器。若特定配接器在一預定數目的再嘗試內傳輸並接收測試封包,則可將配接器標記為可疑的,且失敗檢測邏輯625可持續監視成束配接器650。另一方面,若特定配接器未在預定數目的再嘗試內傳輸並接收測試封包,則可將配接器標記為失敗,且失敗檢測邏輯625可持續監視成束配接器650之剩餘者。
多媒體控制器626通常將包括一視訊圖形控制器,其能夠將影像顯示於監視器660上並且將音訊提供至外部組件(未說明)。另外,一諸如系統600之系統可用以執行此揭示內容內所描述之方法。
將本發明之另一實施例實施為一程式產品,其用於實施一失敗檢測邏輯(諸如參看圖1至圖6所描述之系統及方法)。本發明可採用一完全硬體實施例、一完全軟體實施例或一含有硬體與軟體元件之實施例的形式。在一實施例中,以軟體實施本發明,其包括(但不限於)韌體、駐存軟體、微碼等。
此外,本發明可採用一可自一提供程式碼之電腦可用或電腦可讀媒體存取之電腦程式產品的形式,該程式碼供或結合一電腦或任何指令執行系統使用。為了此描述,一電腦可用或電腦可讀媒體可為任何設備,其可含有、儲存、通信、傳播或輸送程式以供或結合指令執行系統、設備或裝置使用。
媒體可為一電子、磁性、光學、電磁、紅外或半導體系統(或設備或裝置)或一傳播媒體。一電腦可讀媒體之實例包括一半導體或固態記憶體、磁帶、一可移除電腦磁片、一隨機存取記憶體(RAM)、一唯讀記憶體(ROM)、一硬質磁碟及一光碟。光碟之當前實例包括緊密碟片-唯讀記憶體(CD-ROM)、緊密碟片-讀取/寫入(CD-R/W)及DVD。
一適用於儲存及/或執行程式碼之資料處理系統將包括至少一處理器,其經由一系統匯流排而直接或間接耦接至記憶體元件。記憶體元件可包括在實際執行程式碼期間所使用的區域記憶體、大容量儲存器及快取記憶體,其提供對至少某程式碼的暫時儲存以減小執行期間必須自大容量儲存器擷取碼的次數。
輸入/輸出或I/O裝置(包括(但不限於)鍵盤、顯示器、指向裝置等)可直接或經由介入I/O控制器而耦接至系統。網路配接器亦可耦接至系統以使資料處理系統能夠經由介入私人或公共網路而耦接至其他資料處理系統或遠端印表機或儲存裝置。數據機、電纜數據機及乙太網路配接器卡僅為幾個當前可用類型之網路配接器。
如上文所描述之失敗檢測邏輯可為一積體電路晶片之設計的部分。可以一圖形電腦程式化語言來產生晶片設計,且將其儲存於一電腦儲存媒體(諸如一碟片、磁帶、實體硬碟機或諸如一儲存存取網路中之虛擬硬碟機)中。若設計者未製造晶片或用以製造晶片之光微影遮罩,則設計者藉由物理方式(例如,藉由提供儲存設計之儲存媒體的一複本)或電子地(例如,經由網際網路)而將所得設計直接或間接傳輸至此等實體。接著,將所儲存之設計轉換成適當格式(例如,GDSII)以便製造光微影遮罩,光微影遮罩通常包括所討論的待形成於一晶圓上之晶片設計的多個複本。光微影遮罩用以界定待蝕刻或另外處理之晶圓(及/或其上之層)的面積。
所得積體電路晶片可由製造者以原始晶圓形式(亦即,作為一具有多個未封裝晶片之單一晶圓)作為一裸晶粒或以一封裝形式分配。在後一情況下,晶片係以一單一晶片封裝(諸如一具有附著至一母板之引線的塑膠載體或其他更高級載體)或以一多晶片封裝(諸如一具有表面互連或內埋互連之一或兩者的陶瓷載體)安裝。在任何情況下,接著將晶片與其他晶片、離散電路元件及/或其他信號處理裝置整合為(a)一中間產品(諸如一母板)或(b)一最終產品之部分。最終產品可為任何產品,其包括:在自玩具及其他低端應用至具有一顯示器、一鍵盤或其他輸入裝置的進階電腦產品之範圍中的積體電路晶片;及一中央處理器。
受益於此揭示內容的熟習此項技術者將易瞭解本揭示內容考慮用以檢測一通信系統中之失敗的方法及配置。應瞭解,詳細描述及圖式中所展示且所描述之實施例的形式將僅被視為實例。希望將下文之申請專利範圍廣泛地解釋為包含所揭示之實例實施例的所有變化。
儘管已在一些實施例中詳細描述了本揭示內容及其一些優點,但是應理解在不偏離如藉由附加之申請專利範圍所界定的揭示內容之精神及範疇的情況下可在本文中作出各種變化、替代及改變。儘管本發明之特定實施例可達成多個目標,但是並非每一屬於附加之申請專利範圍之範疇的實施例皆將達成每一目標。此外,不希望本申請案之範疇限於說明書中所描述之過程、機器、製造、物質的組合、構件、方法及步驟的特定實施例。如一般熟習此項技術者將自本發明之揭示內容易瞭解,可根據本發明利用現存或隨後待開發的執行與本文所描述之對應實施例大體上相同的功能或達成與其大體上相同的結果之過程、機器、製造、物質的組合、構件、方法或步驟。因此,附加之申請專利範圍意欲在其範疇內包括此等過程、機器、製造、物質的組合、構件、方法或步驟。
100...通信網路
110...資料介面
112...儲存庫介面
114...資料
120...通信裝置
122...目的MAC位址
124...成束配接器
130...失敗檢測邏輯
132...時序模組
134...活動監視器/比較器
136...訊務產生器
140...通信媒體/通信裝置
150...資料儲存庫
152...儲存庫介面
154...資料
160...通信裝置
164...配接器/成束配接器/配接器束
170...失敗檢測邏輯
178...MAC位址
200...開放系統互連(OSI)層圖
202...應用程式
204...插口
206...傳輸控制協定/網際網路協定(TCP/IP)
220...乙太通道驅動器
222...路由器
224...媒體存取控制(MAC)位址表
230...失敗檢測邏輯
232...訊務產生器
234...活動比較器
236...活動監視器
240...成束配接器
250...乙太網路驅動器
252...TX計數器/RX計數器
254...乙太網路配接器
256...後備
260...乙太網路驅動器
262...TX計數器/RX計數器
264...乙太網路配接器
270...乙太網路驅動器
272...TX計數器/RX計數器
274...乙太網路配接器
280...乙太網路驅動器
282...TX計數器/RX計數器
284...乙太網路配接器
290...乙太網路驅動器
292...TX計數器/RX計數器
294...乙太網路配接器
300...通信網路介面
310...通信裝置
312...成束驅動器
314...記憶體
320...失敗檢測邏輯
322...時鐘/計時器
324...活動比較器
326...訊務產生器
330...記憶體
332...活動時間週期
334...活動位準
340...處理器
342...組件旗標
344...活動監視器
350...成束組件
352...後備組件/組件
354...通信媒體
362...組件
364...通信媒體
372...組件
374...通信媒體
382...組件
384...通信媒體
600...個人電腦系統/電腦系統/系統
610...中央處理單元
612...隨機存取記憶體(RAM)
614...唯讀記憶體(ROM)
620...使用者介面配接器/配接器
622...輸入輸出(I/O)配接器
624...成束配接器介面
625...失敗檢測邏輯
626...多媒體控制器
640...滑鼠
641...鍵盤
645...印表機
646...可移除儲存裝置
647...控制磁碟機
650...成束配接器
651...數據機
660...監視器
圖1描繪經由成束配接器而互連以在一資料儲存庫與一資料介面之間傳送大量的資料之兩個通信裝置;圖2說明具有成束乙太網路配接器及一失敗檢測邏輯之通信裝置之一部分的方塊圖;圖3描繪成束組件之失敗檢測邏輯的方塊圖;圖4說明用於檢測成束組態中之組件之失敗的方法;圖5描繪用於檢測一束配接器中之一失敗配接器的方法;且圖6說明具有可用以實施本文所描述之方法之成束配接器的電腦系統。
(無元件符號說明)

Claims (29)

  1. 一種用以檢測一束網路配接器之一通信組件之一失敗的方法,該方法包含:將資料導引至與該束中之其他網路配接器共用至少一網際網路協定位址的一網路配接器,該資料之導引啟動該網路配接器,其中該束中之該等網路配接器經組態以並列接收資料,其中該束中之該等網路配接器進一步包含一通信裝置之若干網路配接器;回應於接收經導引之該資料而監視經啟動之該網路配接器以確定一所監視之活動位準;經由該通信裝置比較該所監視之活動位準與一預定活動位準;及回應於該所監視之活動位準小於該預定活動位準,將該網路配接器標記為一失敗組件。
  2. 如請求項1之方法,其進一步包含在該導引一回送命令之後確定一消逝時間,其中該資料包含該回送命令,且標記包含在該消逝時間期間在未接收到一對該回送命令之答覆的情況下將該網路配接器標記為該失敗組件。
  3. 如請求項1之方法,其進一步包含撤銷該失敗組件。
  4. 如請求項1之方法,其進一步包含啟動一後備組件以替代該失敗組件。
  5. 如請求項1之方法,其進一步包含傳輸該失敗組件之一通知。
  6. 如請求項1之方法,其中導引包含在一預先界定之時間 週期期間該網路配接器的該所監視之活動位準低於該預定活動位準的情況下導引該通信。
  7. 如請求項1之方法,其中導引包含導引一具有一與該網路配接器相關聯之媒體存取控制位址的封包。
  8. 如請求項1之方法,其中導引包含導引一具有一媒體存取控制位址的封包,該媒體存取控制位址指示一與該網路配接器相關聯之目的地。
  9. 如請求項1之方法,其中導引包含以預定時間間隔導引該資料。
  10. 如請求項1之方法,其中導引包含當該網路配接器閒置時導引該通信,其中該通信裝置進一步包含複數個路由器。
  11. 如請求項1之方法,其中監視包含檢測一傳輸活動及一接收活動之至少一者。
  12. 一種經組態以檢測失敗之設備,該設備包含:一訊務產生器,其經調適以產生至少一封包以起始一經由一束組件之一通信組件而導引的資料傳輸,其中該束組件經組態以共用與至少一網路位址有關之資料傳輸活動;一活動監視器,其用以回應於該至少一封包而檢測該通信組件之一所監視之活動位準;及一活動比較器,其用以比較該所監視之活動位準與一預定活動位準以確定是否將該通信組件識別為一失敗組件。
  13. 如請求項12之設備,其進一步包含一組件旗標以在該活動監視器檢測小於一預定活動位準的情況下將該通信組件標記為一失敗組件。
  14. 如請求項12之設備,其進一步包含一暫存器以儲存該所監視之活動位準。
  15. 如請求項12之設備,其進一步包含一處理器以控制至少一計時器、該訊務產生器、該活動監視器及該活動比較器。
  16. 如請求項12之設備,其中該至少一封包包含一測試封包,該測試封包具有該通信組件之一目的媒體存取控制位址。
  17. 如請求項12之設備,其中該通信組件為一乙太網路配接器。
  18. 如請求項12之設備,其進一步包含一後備組件。
  19. 如請求項12之設備,其中該活動包含傳輸及接收活動。
  20. 一種用以檢測成束配接器之一網路配接器之失敗的設備,該設備包含:一計時模組,其用以界定一時間間隔;一活動監視器,其用以在該時間間隔期間確定一網路配接器之一通信活動位準且用以回應於至少一測試封包而監視該網路配接器之活動,其中該成束配接器經由一驅動器之一負載分享配置而並列操作;一活動比較器,其用以比較所確定之該通信活動位準與一預定活動位準,以在該所確定之活動小於該預定活 動位準的情況下將該網路配接器識別為一可疑配接器;一訊務產生器,其用以將至少一測試封包傳輸至該可疑配接器,該活動監視器回應於該至少一測試封包之傳輸而監視活動;及一旗標,其用以在該所監視之活動小於一與該至少一測試封包相關聯之計劃中的活動的情況下將該可疑配接器標記為一失敗配接器。
  21. 如請求項20之設備,其進一步包含一處理器以基於該網路配接器之一失敗而修改一位址指派表。
  22. 如請求項20之設備,其中該網路配接器包含用以計數封包接收之邏輯。
  23. 如請求項20之設備,其中該活動監視器在該傳輸該至少一測試封包之後檢測該網路配接器的活動,且在回應於該至少一測試封包而在沒有該網路配接器之活動發生的情況下將該網路配接器標記為一失敗配接器。
  24. 一種經組態以檢測失敗之系統,其包含:成束網路配接器,其用以共用一資料傳輸負載,其中該成束網路配接器經組態以並列操作;一失敗檢測邏輯,其耦接至該等成束網路配接器以執行下列動作:擷取一指示資料傳輸活動的第一值,基於該值而識別一可疑網路配接器,經由該可疑網路配接器而傳輸一測試封包,經由該可疑網路配接器而擷取一指示資料傳輸活動 的第二值,及基於該第二值而確定是否將該可疑網路配接器標記為一失敗網路配接器。
  25. 如請求項24之系統,其中該失敗檢測邏輯進一步包含一旗標以撤銷該失敗網路配接器。
  26. 如請求項25之系統,其中該旗標經調適以啟動一後備網路配接器來替代該失敗網路配接器。
  27. 如請求項24之系統,其中該失敗檢測邏輯能夠與另一失敗檢測邏輯進行通信以識別該失敗網路配接器。
  28. 一種電腦程式產品,其包含一具有一電腦可讀程式之電腦可用媒體,其中當在一電腦上執行時,該電腦可讀程式使該電腦:將資料導引至一與該束中之其他通信組件共用至少一網際網路協定位址的通信組件,其中導引該資料應啟動該通信組件之至少一部分;回應於該通信而監視該通信組件之至少該部分以確定一所監視之活動位準;比較該所監視之活動位準與一預定活動位準;及若該所監視之活動位準小於一預定活動位準,則將該通信組件識別為一失敗組件。
  29. 如請求項28之電腦程式產品,其中當在一電腦上執行時,該電腦可讀程式進一步使該電腦啟動一後備組件以替代該失敗組件。
TW096115303A 2006-05-01 2007-04-30 檢測通信網路中失敗之方法、設備、系統及電腦程式產品 TWI422189B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US11/380,993 US7743129B2 (en) 2006-05-01 2006-05-01 Methods and arrangements to detect a failure in a communication network

Publications (2)

Publication Number Publication Date
TW200805945A TW200805945A (en) 2008-01-16
TWI422189B true TWI422189B (zh) 2014-01-01

Family

ID=38372442

Family Applications (1)

Application Number Title Priority Date Filing Date
TW096115303A TWI422189B (zh) 2006-05-01 2007-04-30 檢測通信網路中失敗之方法、設備、系統及電腦程式產品

Country Status (4)

Country Link
US (2) US7743129B2 (zh)
CN (1) CN101406004A (zh)
TW (1) TWI422189B (zh)
WO (1) WO2007125080A1 (zh)

Families Citing this family (37)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8493858B2 (en) * 2006-08-22 2013-07-23 Citrix Systems, Inc Systems and methods for providing dynamic connection spillover among virtual servers
US8312120B2 (en) * 2006-08-22 2012-11-13 Citrix Systems, Inc. Systems and methods for providing dynamic spillover of virtual servers based on bandwidth
US7913105B1 (en) * 2006-09-29 2011-03-22 Symantec Operating Corporation High availability cluster with notification of resource state changes
US7929448B2 (en) * 2006-10-17 2011-04-19 Verizon Patent And Licensing Inc. Monitoring link aggregation links
US8166156B2 (en) * 2006-11-30 2012-04-24 Nokia Corporation Failure differentiation and recovery in distributed systems
JP5318875B2 (ja) * 2007-09-13 2013-10-16 アクセディアン・ネットワークス・インコーポレーテッド 非試験トラフィックに影響を与えることなくイーサネット(登録商標)経路およびリンクを試験するためのシステム
US8867377B2 (en) * 2007-10-11 2014-10-21 Cisco Technology, Inc. Dynamic selection between active and passive probing in computer network
US8295163B1 (en) * 2007-11-16 2012-10-23 Marvell International Ltd. Reassigning signals to cable channels
US8331235B2 (en) * 2008-12-08 2012-12-11 At&T Intellectual Property I, L.P. Systems and methods to rerouting internet protocol traffic based on network user preferences
US8098572B2 (en) * 2009-02-03 2012-01-17 Google Inc. Interface monitoring for link aggregation
US9454444B1 (en) 2009-03-19 2016-09-27 Veritas Technologies Llc Using location tracking of cluster nodes to avoid single points of failure
US8213296B2 (en) * 2009-05-14 2012-07-03 Verizon Patent And Licensing Inc. Link aggregation protection
US20110004589A1 (en) * 2009-07-06 2011-01-06 Rockwell Automation Technologies, Inc. Diagnostics in a distributed directory system
US8248954B2 (en) * 2009-08-31 2012-08-21 Hubbell Incorporated System and method for enhancement of Ethernet link loss forwarding
JP5033856B2 (ja) * 2009-10-20 2012-09-26 株式会社日立製作所 ネットワーク構成の想定のための装置、システム
US8724465B2 (en) * 2009-10-28 2014-05-13 International Business Machines Corporation Zero packet loss energy efficient ethernet link transition via driver fast failover
US8458515B1 (en) 2009-11-16 2013-06-04 Symantec Corporation Raid5 recovery in a high availability object based file system
US8774010B2 (en) * 2010-11-02 2014-07-08 Cisco Technology, Inc. System and method for providing proactive fault monitoring in a network environment
US8495323B1 (en) 2010-12-07 2013-07-23 Symantec Corporation Method and system of providing exclusive and secure access to virtual storage objects in a virtual machine cluster
US9385917B1 (en) 2011-03-31 2016-07-05 Amazon Technologies, Inc. Monitoring and detecting causes of failures of network paths
US8762546B2 (en) 2011-12-13 2014-06-24 Motorola Mobility Llc Method and apparatus for adaptive network heartbeat message for TCP channel
US9479275B2 (en) * 2012-06-01 2016-10-25 Blackberry Limited Multiformat digital audio interface
CA2874899C (en) 2012-06-01 2017-07-11 Blackberry Limited Universal synchronization engine based on probabilistic methods for guarantee of lock in multiformat audio systems
CN102821008A (zh) * 2012-08-07 2012-12-12 三一重型装备有限公司 一种通信数据监控设备
US8937870B1 (en) * 2012-09-11 2015-01-20 Amazon Technologies, Inc. Network link monitoring and testing
KR101696124B1 (ko) 2012-10-22 2017-01-12 인텔 코포레이션 고성능 인터커넥트 물리 계층
TWI497968B (zh) 2012-12-25 2015-08-21 Wistron Neweb Corp 網路傳輸檢查裝置以及網路傳輸檢查方法
US9742638B1 (en) 2013-08-05 2017-08-22 Amazon Technologies, Inc. Determining impact of network failures
US9825828B2 (en) * 2014-08-26 2017-11-21 T-Mobile Usa, Inc. Cross-layer link failure alerts
US9560100B1 (en) * 2015-03-19 2017-01-31 Action Streamer, LLC Method and system for stabilizing and streaming first person perspective video
US9826013B2 (en) 2015-03-19 2017-11-21 Action Streamer, LLC Method and apparatus for an interchangeable wireless media streaming device
US10038464B2 (en) * 2015-08-20 2018-07-31 GM Global Technology Operations LLC Configurable communications module
WO2017065734A1 (en) * 2015-10-12 2017-04-20 Hewlett Packard Enterprise Development Lp Pluggable communication devices
CN105721241A (zh) * 2016-01-25 2016-06-29 汉柏科技有限公司 一种网卡收发报文的统计调试方法及系统
JP6724583B2 (ja) * 2016-06-15 2020-07-15 富士通株式会社 情報処理装置、情報処理方法、プログラム及び情報処理システム
US10291500B2 (en) 2017-01-23 2019-05-14 International Business Machines Corporation Network interface port management
US10445220B2 (en) * 2017-01-25 2019-10-15 Verizon Patent And Licensing Inc. System and methods for application activity capture, error identification, and error correction

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020018447A1 (en) * 2000-08-09 2002-02-14 Nec Corporation Method and system for routing packets over parallel links between neighbor nodes
TW548919B (en) * 1999-05-28 2003-08-21 Teradyne Inc Methods for isolating a network fault
US20050010837A1 (en) * 2003-07-10 2005-01-13 International Business Machines Corporation Method and apparatus for managing adapters in a data processing system

Family Cites Families (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5774640A (en) 1991-10-21 1998-06-30 Tandem Computers Incorporated Method and apparatus for providing a fault tolerant network interface controller
US5663950A (en) 1995-04-27 1997-09-02 International Business Machines Corporation Methods and systems for fault isolation and bypass in a dual ring communication system
US5664219A (en) 1995-06-12 1997-09-02 International Business Machines Corporation Method and system for controlling servicability of adapters connected by an I/O channel interface to a computer system
US6049825A (en) * 1997-03-19 2000-04-11 Fujitsu Limited Method and system for switching between duplicated network interface adapters for host computer communications
US6108300A (en) 1997-05-02 2000-08-22 Cisco Technology, Inc Method and apparatus for transparently providing a failover network device
US6314525B1 (en) 1997-05-13 2001-11-06 3Com Corporation Means for allowing two or more network interface controller cards to appear as one card to an operating system
US6049528A (en) 1997-06-30 2000-04-11 Sun Microsystems, Inc. Trunking ethernet-compatible networks
US7065050B1 (en) 1998-07-08 2006-06-20 Broadcom Corporation Apparatus and method for controlling data flow in a network switch
US6108200A (en) 1998-10-13 2000-08-22 Fullerton; Robert L. Handheld computer keyboard system
US6078957A (en) * 1998-11-20 2000-06-20 Network Alchemy, Inc. Method and apparatus for a TCP/IP load balancing and failover process in an internet protocol (IP) network clustering system
KR20000054938A (ko) 1999-02-01 2000-09-05 서평원 이더넷 정합장치의 패킷 처리장치 및 방법
US6601195B1 (en) 1999-09-09 2003-07-29 International Business Machines Corporation Switch adapter testing
US6868062B1 (en) * 2000-03-28 2005-03-15 Intel Corporation Managing data traffic on multiple ports
US6760859B1 (en) 2000-05-23 2004-07-06 International Business Machines Corporation Fault tolerant local area network connectivity
US6539338B1 (en) 2000-06-09 2003-03-25 3Com Corporation Self-diagnostic testing of a network interface adapter
US6639338B1 (en) * 2000-09-06 2003-10-28 Lambert Haner Controlled reluctance AC induction motor
WO2002092829A1 (fr) * 2001-05-17 2002-11-21 Takeda Chemical Industries, Ltd. Procede de production d'un peptide
US7203748B2 (en) 2002-02-15 2007-04-10 International Business Machines Corporation Method for detecting the quick restart of liveness daemons in a distributed multinode data processing system
US7167912B1 (en) * 2002-08-09 2007-01-23 Cisco Technology, Inc. Method and apparatus for detecting failures in network components
US20040165525A1 (en) 2003-02-10 2004-08-26 Invensys Systems, Inc. System and method for network redundancy
US7188273B2 (en) * 2003-11-24 2007-03-06 Tsx Inc. System and method for failover
US20050144287A1 (en) * 2003-12-11 2005-06-30 International Business Machines Corporation Computer product and system for establishing network connections
US7721150B2 (en) * 2004-03-19 2010-05-18 Intel Corporation Failover and load balancing
US7760626B2 (en) * 2004-03-31 2010-07-20 Intel Corporation Load balancing and failover
US7506214B2 (en) * 2004-04-22 2009-03-17 International Business Machines Corporation Application for diagnosing and reporting status of an adapter
US7552365B1 (en) * 2004-05-26 2009-06-23 Amazon Technologies, Inc. Web site system with automated processes for detecting failure events and for selecting failure events for which to request user feedback
US7275175B2 (en) * 2004-07-22 2007-09-25 International Business Machines Corporation Method and apparatus for high-speed network adapter failover
US20060039276A1 (en) 2004-08-18 2006-02-23 International Business Machines Corporation Failback to a primary communications adapter
JP4387968B2 (ja) * 2005-03-28 2009-12-24 富士通株式会社 障害検出装置および障害検出方法
US7872965B2 (en) * 2005-08-01 2011-01-18 Hewlett-Packard Development Company, L.P. Network resource teaming providing resource redundancy and transmit/receive load-balancing through a plurality of redundant port trunks

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW548919B (en) * 1999-05-28 2003-08-21 Teradyne Inc Methods for isolating a network fault
US20020018447A1 (en) * 2000-08-09 2002-02-14 Nec Corporation Method and system for routing packets over parallel links between neighbor nodes
US20050010837A1 (en) * 2003-07-10 2005-01-13 International Business Machines Corporation Method and apparatus for managing adapters in a data processing system

Also Published As

Publication number Publication date
WO2007125080A1 (en) 2007-11-08
TW200805945A (en) 2008-01-16
US7743129B2 (en) 2010-06-22
CN101406004A (zh) 2009-04-08
US20070255819A1 (en) 2007-11-01
US20080225733A1 (en) 2008-09-18
US7765290B2 (en) 2010-07-27

Similar Documents

Publication Publication Date Title
TWI422189B (zh) 檢測通信網路中失敗之方法、設備、系統及電腦程式產品
TWI483581B (zh) 用以搜尋網路裝置之方法及設備
US20070233855A1 (en) Adaptible keepalive for enterprise extenders
US20090070639A1 (en) Administering Correlated Error Logs In A Computer System
US20130159487A1 (en) Migration of Virtual IP Addresses in a Failover Cluster
US7788520B2 (en) Administering a system dump on a redundant node controller in a computer system
US7734948B2 (en) Recovery of a redundant node controller in a computer system
US11307945B2 (en) Methods and apparatus for detecting, eliminating and/or mitigating split brain occurrences in high availability systems
JP2006014310A (ja) 冗長接続サービスの提供方法および装置
JP2006127201A (ja) ストレージシステムおよび導通確認方法
US20050080903A1 (en) Method, system, and program for maintaining a link between two network entities
JP7180954B2 (ja) ネットワーク構成データの条件付きブロードキャストのための方法および装置
CN114371912A (zh) 数据中心的虚拟网络管理方法及数据中心系统
CN117112474B (zh) 一种通用可信的基板管理方法和系统
JP4001889B2 (ja) ネットワークにおけるバッファ・データのプリエンプティブな再送
US11632288B2 (en) Determining the impact of network events on network applications
US9014041B2 (en) Method and system for configuring a device that has failed to obtain network address
JP5084782B2 (ja) 中継機を検出する装置、方法、プログラム
JP2009238098A (ja) セッション管理方法、ストレージ装置、及び、計算機システム
US7894351B2 (en) Detection of link status in blade systems
CN117896445A (zh) 多网络协议切换传输方法、装置、电子设备及存储介质
JP3409731B2 (ja) 通信メッセージ監視システム及び方法
JP2000151741A (ja) ホストプロトコル変換装置
JP4911049B2 (ja) ディスクアレイ装置、データ記憶システム、リンク自動設定方法、及びプログラム
JP2001257703A (ja) データ通信装置

Legal Events

Date Code Title Description
MM4A Annulment or lapse of patent due to non-payment of fees