TWI661687B - 用於當備援缺陷通道時以最少連結停止時間對於路徑失效作動態連結修復之裝置、方法及電腦程式產品 - Google Patents

用於當備援缺陷通道時以最少連結停止時間對於路徑失效作動態連結修復之裝置、方法及電腦程式產品 Download PDF

Info

Publication number
TWI661687B
TWI661687B TW105128011A TW105128011A TWI661687B TW I661687 B TWI661687 B TW I661687B TW 105128011 A TW105128011 A TW 105128011A TW 105128011 A TW105128011 A TW 105128011A TW I661687 B TWI661687 B TW I661687B
Authority
TW
Taiwan
Prior art keywords
channels
channel
communication
failure
link
Prior art date
Application number
TW105128011A
Other languages
English (en)
Other versions
TW201717561A (zh
Inventor
丹尼爾M 德瑞普斯
羅蘭珠
卡文 納德利
詹姆士E 史密斯
Original Assignee
萬國商業機器公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 萬國商業機器公司 filed Critical 萬國商業機器公司
Publication of TW201717561A publication Critical patent/TW201717561A/zh
Application granted granted Critical
Publication of TWI661687B publication Critical patent/TWI661687B/zh

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B10/00Transmission systems employing electromagnetic waves other than radio-waves, e.g. infrared, visible or ultraviolet light, or employing corpuscular radiation, e.g. quantum communication
    • H04B10/03Arrangements for fault recovery
    • H04B10/038Arrangements for fault recovery using bypasses
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/28Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
    • H04L12/40Bus networks
    • H04L12/40169Flexible bus arrangements
    • H04L12/40176Flexible bus arrangements involving redundancy
    • H04L12/40182Flexible bus arrangements involving redundancy by using a plurality of communication lines
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B10/00Transmission systems employing electromagnetic waves other than radio-waves, e.g. infrared, visible or ultraviolet light, or employing corpuscular radiation, e.g. quantum communication
    • H04B10/03Arrangements for fault recovery
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery
    • H04L41/0659Management of faults, events, alarms or notifications using network fault recovery by isolating or reconfiguring faulty entities
    • H04L41/0661Management of faults, events, alarms or notifications using network fault recovery by isolating or reconfiguring faulty entities by reconfiguring faulty entities
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery
    • H04L41/0668Management of faults, events, alarms or notifications using network fault recovery by dynamic selection of recovery network elements, e.g. replacement by the most appropriate element after failure
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/10Active monitoring, e.g. heartbeat, ping or trace-route
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04QSELECTING
    • H04Q11/00Selecting arrangements for multiplex systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04QSELECTING
    • H04Q11/00Selecting arrangements for multiplex systems
    • H04Q11/0001Selecting arrangements for multiplex systems using optical switching
    • H04Q11/0062Network aspects
    • H04Q11/0071Provisions for the electrical-optical layer interface
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04QSELECTING
    • H04Q11/00Selecting arrangements for multiplex systems
    • H04Q11/0001Selecting arrangements for multiplex systems using optical switching
    • H04Q11/0062Network aspects
    • H04Q2011/0079Operation or maintenance aspects
    • H04Q2011/0081Fault tolerance; Redundancy; Recovery; Reconfigurability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04QSELECTING
    • H04Q2213/00Indexing scheme relating to selecting arrangements in general and for multiplex systems
    • H04Q2213/1301Optical transmission, optical switches

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Electromagnetism (AREA)
  • Health & Medical Sciences (AREA)
  • Cardiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Optical Communication System (AREA)

Abstract

用以修復一通訊連結失效的方法及裝置。在某些具體實施例中,裝置一般包含一控制器,其組態以初始化使用複數個通道中之一初始數量的通道來與另一裝置通訊的通訊連結。裝置也可包含複數個多工器,其組態以選擇性地耦合複數個通訊路徑與通訊連結的複數個通道。在某些具體實施例中,在一初始狀態期間,複數個路徑的第一路徑可與複數個通道的第一通道耦合,且複數個通道可包含一備援通道。控制器可決定複數個通道的其中至少一通道是否正遭受一失效,並控制多工器的其中至少一者,以藉由使用備援通道而使失效通道由複數個通道中的另一通道所取代。

Description

用於當備援缺陷通道時以最少連結停止時間對於路徑失效作動態連結修復之裝置、方法及電腦程式產品 【有關發明人或共同發明人之先前揭露的聲明】
以下揭露內容是根據35.U.S.C.102(b)(1)(A)而提交:“PCIe Gen3 I/O擴展櫃(expansion drawer)”,萬國商業機械公司,2015年6月4日,http://www-01.ibm.com/support/knowledgecenter/P8ESS/p8ham/p8ham_emx0_kickoff.htm。
本發明是有關於一種修復失效的裝置,特別是有關於一種修復一通訊連結失效(communication link failure)的裝置、方法與電腦程式產品。
現代計算系統包含經由擴展匯流排耦合至電腦處理器的週邊裝置。此一擴展匯流排可實施為PCIe匯流排,其可耦合至許多不同類型的週邊裝置。可被週邊裝置所使用之PCIe匯流排中的路徑數量可根據週邊裝置的實體結構來決定。
本發明的某些實施例提供用以修復通訊連結失效的裝置。 此裝置一般包含一控制器,其組態以初始化使用複數個通道(channel)中之一初始數量的通道來與另一裝置通訊的通訊連結。此裝置也可包含複數個多工器,其組態以選擇性地耦合複數個通訊路徑(communication lane)與通訊連結的複數個通道。其中,在一初始狀態期間,複數個路徑的第一路徑可與複數個通道的第一通道耦合,且複數個通道可包含一備援通道(spare channel)。控制器更組態以決定複數個通道的其中至少一通道是否正遭受一失效,並且控制多工器的其中至少一者,以藉由使用備援通道而使失效通道由複數個通道中的另一通道所取代。
本發明的某些實施例提供用以修復通訊連結失效的方法。此方法一般包含使用一通訊連結的複數個通道中之一初始數量的通道來與另一裝置通訊;選擇性地耦合複數個通訊路徑與通訊連結的複數個通道,其中在一初始狀態期間,複數個路徑的一第一路徑與複數個通道的一第一通道耦合,且其中複數個通道包含一備援通道;決定複數個通道的其中至少一通道是否正遭受一失效;以及控制多個多工器的其中至少一者,以藉由使用備援通道而使失效通道由複數個通道中的另一通道所取代。
本發明的某些實施例提供用以修復通訊連結失效的電腦程式產品。此電腦程式產品一般包含具有多個程式指令於其中的一電腦可讀儲存媒體,程式指令可由一處理器執行以導致處理器進行:使用一通訊連結的複數個通道中之一初始數量的通道來與另一裝置通訊;選擇性地耦合複數個通訊路徑與通訊連結的複數個通道,其中在一初始狀態期間,複數個路徑的一第一路徑與複數個通道的一第一通道耦合,且其中複數個通道包含一備援通道;決定複數個通道的其中至少一通道是否正遭受一失效;以及控制多個多工器的其中至少一者,以藉由使用備援通道而使失效通道由複數個通道中的另一通道所取代。
100‧‧‧通訊系統
102‧‧‧裝置
104‧‧‧裝置
106‧‧‧路徑
108‧‧‧光通訊介面
110‧‧‧通訊路徑
112‧‧‧光通訊介面
114‧‧‧通道
202‧‧‧多工器陣列
204‧‧‧多工器
206‧‧‧多工器
208‧‧‧多工器
210‧‧‧多工器
212‧‧‧多工器
214‧‧‧多工器陣列
216‧‧‧多工器
220‧‧‧串行器/解串行器
230‧‧‧電光轉換器
232‧‧‧電光轉換器
240‧‧‧串行器/解串行器
300‧‧‧通訊系統
圖1根據本發明的某些具體實施例描述在兩裝置之間的通訊介面。
圖2根據本發明某些具體實施例描述一光通道備援操作,其使用組態以使用備援通道取代失效通道的多工器(MUX)陣列。
圖3A至3C根據本發明的某些具體實施例描述路徑對通道的映射方案,用以在減少的連結停止時間(link down time)修復通訊連結。
圖4根據本發明的某些具體實施例描述用以修復通訊連結失效的範例操作。
圖5根據本發明的某些具體實施例描述用以修復通訊連結失效以及回復到滿載量之通訊連結的範例操作。
本發明的某些具體實施例一般關於以減少的連結停止時間將通訊連結的一失效通道由一備援通道取代。在某些具體實施例中,通訊介面可為一週邊組件快速互連(Peripheral Component Interconnect Express,PCIe)介面。PCIe匯流排可包含多個路徑,其每一者提供頻寬給連接到PCIe匯流排的一裝置。「路徑」可指一組不同的信號對,一發射對及一接收對。PCIe中的「by-N」連結可由N個路徑所組成,例如「×8」連結或槽是支援8個流量路徑往來一輸入/輸出(I/O)配接器。不同的裝置可使用不同數量的路徑來通訊。舉例來說,低速的週邊設備可使用較少的路徑,而高速的週邊設備可使用更多的路徑。因此,PCIe匯流排表示在兩裝置(例如一處理器與一週邊裝置)間的一靈活互連,因為PCIe匯流排可耦合可能需要改變操作頻寬的裝置。
圖1根據本發明的某些具體實施例描述裝置102與裝置104之間的通訊系統100。通訊系統100包含複數個路徑106,其將裝置102耦合 至光通訊介面108。光通訊介面108可組態以將路徑106耦合至複數個光通道114。亦即,光通訊介面可包含電光轉換器(CXP)230(如圖2所示,但圖1未顯示),其組態以將電信號(例如,從路徑106所接收)轉換為光信號,也將光信號轉換為電信號。光信號可經由通道114傳遞到裝置104。經由通道114所接收的光資訊可經由另一光通訊介面112的CXP轉換為電信號,並經由通訊路徑110傳遞到裝置104。光通訊介面108、112也可用以將從通道114所接收的光信號轉換為電信號,其可分別傳遞到裝置102及裝置104。
當在正常連結操作期間在一連結中發生一通道失效(例如通道114的其中至少一者),則連結可重新調校而以一減少的連結寬度來操作。亦即,可使用較少數量的路徑106及通道114用於裝置102及裝置104之間的通訊。然而,可能無法僅停用正遭受失效的通道(及對應的路徑)並使用其他操作通道繼續通訊。舉例來說,PCIe通訊可組態以使用第一通道(x1連結)、前兩個通道(x2連結)、前四個通道(x4連結)、前八個通道(x8連結)、前十六個通道(x16連結)的任何一者來通訊。因此,在x16連結中,若全部十六個通道(例如通道0到通道15)中的第二通道(例如通道1)引起一失效,則連結可能僅使用第一通道(通道0)來通訊。因此,若PCIe通訊介面的一路徑失效,則包含失效路徑的路徑塊將被排除參與一有效連結,其可能導致通訊頻寬的明顯降低。因此,降低修復失效通道所需的時間量以使通訊介面回到全頻寬是重要的。
圖2根據本發明特定具體實施例描述一光通道備援操作,其使用組態以使用備援通道取代失效通道的多工器(MUX)陣列202。如所述,至少一串行器/解串行器(SerDes)220可用以產生路徑106(如L0-L7)的信號。在某些具體實施例中,SerDes 220可為圖1中裝置102的部分。舉例來說,路徑106可經由MUX陣列202的其中至少一多工器及電光轉換器(CXP)230而耦合至複數個光通道114(如Ch0-Ch7)。控制器可由裝置102使用以經由選擇線(select line)(如sel0-sel7)控制MUX陣列202,以調整路徑106及通道114之間 的電/光連接。舉例來說,L0可經由MUX 204耦合至Ch0(例如,其中MUX 204組態以耦合節點A至節點B),但也可經由MUX 204及MUX 206耦合至通道1(例如,其中MUX 204的節點A耦合至節點C,且MUX 206的節點C耦合至節點A)。以類似的方式,L1可經由MUX 208及MUX 206耦合至Ch1、或經由MUX 208及MUX 210耦合至Ch2。
在本發明的某些具體實施例中,通道114的其中至少一者可為一備援通道。舉例來說,Ch8可指定為一備援通道。因此,若Ch7失效,則可藉由控制MUX 212將相應的路徑(如L7)耦合至備援通道(如Ch8)。此外,舉例來說,若Ch4失效,則L4可耦合至Ch5、L5可耦合至Ch6、L6可耦合至Ch7、且L7可耦合至Ch8,因此藉由使用備援通道而使通訊連結寬度回復到初始數量的有效通道(如8個通道)。
如所述,可使用類似的MUX陣列214將來自裝置104的通訊路徑110(例如由至少一serDes 240所產生)經由例如電光轉換器(CXP)232耦合至通道114。舉例而言,若MUX 212組態以將L7耦合至Ch8(例如,由於Ch7上的失效),則MUX 216也可組態以將Ch8與L7耦合,使得在L7上所傳送之來自裝置102的資訊轉移至裝置104的L7。
雖然圖2所述的備援操作允許通訊連結被修復,但通訊可能在失效通道被修復後停止一段時間。舉例來說,當以圖2所述的通道備援操作復原缺陷路徑時,可能正在啟動將連結寬度復原至滿載量的程序。此程序包含具有基本重置或熱重置的連結調訓,其可迫使整個連結協作裝置(如裝置102、104)進入重置條件並使連結從有效狀態降至非有效狀態。這造成一連結停止時間,其將在正常系統操作流程中引入一中斷。
本發明的具體實施例提供修復通訊連結並以減少的停止時間使通訊連結回到滿載量的一程序。舉例來說,在某些具體實施例中,裝置(如裝置102)可以定期輪詢(regular polling)來調查連結狀態,且若連結寬度小於初始寬度則經由通道備援將連結容量復原為全展示連結寬度。程序允 許連結再調訓(retraining),同時維持有效連結狀態而不在恢復下退回到輪詢或組態狀態(例如連結狀態狀態機(Link Status State Machine,LTSSM)狀態)。亦即,本發明具體實施例幫助在幾乎無中斷的情況下保持連結有效(例如繼續正常系統操作),同時使用根據圖2所述的光通道備援操作或其他路徑修復操作來修復失效的路徑。
用於非中斷連結操作的路徑修復方法包含PCIe路徑106、110對光通道114及失效通道切換的一預設映射方案(mapping scheme)、及一連結狀態輪詢及再調訓方案。連結狀態輪詢及再調訓方案可在系統韌體程序中執行。亦即,系統韌體程序可在通道再映射操作發生時恢復有效連結寬度並維持有效連結。
圖3A根據本發明的某些具體實施例描述通訊系統300之路徑對通道的映射方案。如所述,通訊系統300包含八個路徑(L0-L7),其選擇性地與八個有效通道(Ch0-Ch7)及一個備援通道(Ch8)耦合。如所述,L0在初始化時可映射至非備援/非切換的指定通道(如Ch0)。任何其他的通道(例如,在此例中為Ch8)可指定為備援通道。在一路徑(例如路徑106之中)及一對應通道(例如通道114之中)之間的實線表示路徑係經由MUX陣列202的其中至少一多工器耦合至對應的通道。虛線表示路徑可能被耦合至對應的通道。
當連結寬度從在初始化協定的連結寬度(N,例如x16)降低至較小的連結寬度x8、x4、x2或x1(取決於哪個路徑發生失效),連結可保持有效,只要L0為有效且不中斷。因此,路徑106映射(互連)至通道114,使得當發生通道對路徑再映射(例如使用一備援通道取代失效通道)時,L0路徑不被破壞。因此,除非連接至L0的非切換通道(如Ch0)失效,否則即使一或多個其他通道可能遭受失效,通訊仍應使用至少L0而繼續。
圖3B根據本發明的某些具體實施例描述通訊系統300,其中Ch6造成一失效。當修復通道失效時,L0可維持有效,Ch0至Ch3也是如此。 因此,當使用備援通道來取代Ch6時,可使用x4連結(Ch0-Ch3)繼續通訊。一旦通道失效已修復(例如藉由耦合L6至Ch7,以及耦合L7至原先備援的Ch8),可使用例如8個通道在滿載量下繼續通訊。
圖3C根據本發明的某些具體實施例描述通訊系統300,其中Ch1造成一失效。在此例中,在使用備援通道8修復通道失效時,可僅使用Ch0(例如x1連結)繼續通訊。
圖4根據本發明的某些具體實施例描述用以修復通訊連結失效的範例操作400。操作400可例如由一裝置(像是圖1的裝置102)的一控制器來執行。
在402,藉由使用通訊連結的複數個通道中的一初始數量的通道與另一裝置通訊而開始操作400。在404,裝置可選擇性地將複數個通訊路徑耦合至通訊連結的複數個通道,其中在初始狀態期間,複數個路徑中的第一路徑與複數個通道中的第一通道耦合。在某些具體實施例中,複數個通道可包含一備援通道。在406,裝置決定複數個通道中的至少一通道是否正遭受失效,並在408控制至少一多工器以藉由使用備援通道而使得失效的通道由複數個通道中的另一通道所取代。
圖4的操作將參照圖5的操作500作更詳細的描述。
圖5根據本發明的某些具體實施例描述用以修復通訊連結失效的範例操作500。操作500可例如由一裝置(像是圖1中之裝置102)的一控制器來執行。
操作開始於502,其中裝置執行非中斷路徑映射程序。亦即,如前述,裝置可藉由控制MUX陣列202而將L0映射至非切換通道(例如Ch0)。在504,可經由針對該裝置及其他裝置之間通訊的連結初始化程序將連結初始化至滿載量(例如使用連結寬度N的連結有效)。在506,第一裝置102可執行連結的定期輪詢,以在508決定連結寬度是否已降低。亦即,裝置可決定在步驟506所決定的連結寬度是否小於初始連結寬度N,其表示複數個 通道114的其中一通道已經失效。因此,可由減少數量的通訊路徑及通道繼續通訊。裝置可接著在510進行路徑狀態的診斷,並在512識別缺陷通道/路徑數量(例如決定對應失效通道的識別符(identifier))。舉例來說,裝置可由讀取用於缺陷路徑狀態的光收發暫存器及/或讀取用於調訓連續偵測狀態的SerDes而在非有效路徑中識別非工作的路徑(通道)。
在514,裝置可藉由例如使用圖2所述的通道備援操作以一備援通道取代失效的通道而修復通訊通道。一旦通道已修復,在516,裝置可傳送一連結寬度變化請求(link width change request)至其他裝置(如至PCIe主機),以指示連結寬度可回到初始的連結寬度N。在某些具體實施例中,在518,控制器可選擇性地傳送一連結再調訓請求(例如向上設定請求),以啟動連結的再調訓。然而,可能僅在連結寬度變化請求未能成功將連結寬度回到初始連結寬度N時,才需要再調訓請求。在520,可由回到初始連結寬度N的連結寬度以滿載量繼續裝置與其他裝置之間的通訊。
已出於說明之目的呈現本發明之各種具體實施例之描述,但其不欲為詳盡的或限於所揭示之具體實施例。在不背離所述具體實施例之範疇及精神的情況下,許多修改及變更對一般熟習此項技術者而言將是顯而易見的。本文中使用之術語經選擇以最佳解釋具體實施例之原理、實際應用或對市場上可見之技術之技術改良,或使得其他一般熟習此項技術者能夠理解本文中揭示之具體實施例。
在下文中,參考本發明之具體實施例。然而,本發明範疇並不限於特定所描述具體實施例。實情為,涵蓋以下特徵及元件(不論是否與不同具體實施例相關)之任何組合,以實施及實踐所涵蓋的具體實施例。此外,儘管本文所述的具體實施例可達成優於其他可能解決方案或優於先前技術之優點,但特定優點是否藉由給定的具體實施例達成並非對本發明範疇之限制。因此,以下態樣、特徵、具體實施例及優點僅為說明性的,且除在(多個)請求項中明確敍述以外不被視為隨附申請專利範圍之要素或 限制。同樣,對「本發明」之參考不應解釋為對本文中所揭示之任何發明性標的物的概括,且除在(多個)請求項中明確敍述以外不應被視為隨附申請專利範圍之要素或限制。
本發明之具體實施例可呈完全硬體具體實施例、完全軟體具體實施例(包括韌體、常駐軟體、微碼等)或組合軟體與硬體態樣之具體實施例的形式,該等實施例在本文中皆可通稱為「電路」、「模組」或「系統」。
本發明可為一系統、一方法及/或一電腦程式產品。電腦程式產品可包含具有多個程式指令於其中的一電腦可讀儲存媒體(或媒介),以導致一處理器實施本發明之實施例。
電腦可讀儲存媒體可為一實體裝置,其能保留或儲存被一指令執行裝置使用的多個指令。電腦可讀取儲存媒體可能為,舉例來說,但不限於,電子儲存裝置、磁性儲存裝置、光學儲存裝置、電磁儲存裝置、半導體儲存裝置,或前述之任何適合的組合。電腦可讀取儲存媒體之更具體的範例(非詳盡清單)將包括下列:一可攜式電腦磁碟、一硬碟、一隨機存取記憶體(RAM)、一唯讀記憶體(ROM)、一可抹除程式化唯讀記憶體(EPROM或快閃記憶體)、一靜態隨機存取記憶體(static random access memory,SRAM)、一可攜式唯讀光碟(portable compact disc read-only memory,CD-ROM)、一數位影音光碟(digital versatile disk,DVD)、一記憶卡(memory stick),一軟碟,一機械編碼裝置(諸如打孔卡片(punch-card)或具有指令紀錄於其上的凹槽內的突起結構),以及前述之任何合適的組合。在如文中所使用的電腦可讀取儲存媒體不應理解為暫態信號本身,例如無線電波或其他自由傳遞的電磁波、經由波導或其他傳輸媒介的電磁波(例如通過光纖電纜(fiber optic cable)的光脈衝)、或經由電線傳輸的電信號。
文中所說明的電腦可讀取程式指令可從電腦可讀取儲存媒體下載至各別運算/處理裝置,或經由網路至外部電腦或外部儲存裝置,舉例來說,網際網路、區域網路、廣域網路及/或無線網路。該網路可能包含 銅傳輸纜線、光學傳輸光纖、無線傳輸、路由器、防火牆、交換器、閘道電腦及/或邊緣伺服器。在各運算/處理裝置中的網路配接卡或網路介面皆從該網路接收電腦可讀取程式指令,並轉送該等電腦可讀取程式指令供儲存在該各自運算/處理裝置內的電腦可讀取儲存媒體中。
用於執行本發明之操作的電腦可讀取程式指令可能為組譯器指令(assembler instruction)、指令集架構(instruction-set-architecture,ISA)指令、機器指令、機器相關指令、微碼、韌體指令、狀態設定資料,或以一種或多種程式設計語言之任何組合所編寫的原始碼或目的碼任一者,包括一物件導向程式設計語言,例如Java、Smalltalk、C++或其類似物,以及慣用的程序程式設計語言,例如「C」程式設計語言或類似的程式設計語言。該等電腦可讀取程式指令可能完全在該使用者的電腦上、部分在該使用者的電腦上、作為獨立套裝軟體、部分在該使用者的電腦上且部分在遠端電腦上或完全在該遠端電腦或伺服器上執行。在該後者情境下,該遠端電腦可能透過任何類型之網路連接至該使用者的電腦,包括一區域網路(LAN)或一廣域網路(WAN),或該連接可能至外部電腦(舉例來說,透過使用網際網路服務供應商的網際網路)。在一些具體實施例中,包括例如可程式邏輯電路、場可程式閘陣列(field-programmable gate arrays,FPGA)或可程式邏輯陣列(programmable logic arrays,PLA)的電子電路,可能利用該等電腦可讀取程式指令之狀態資訊從而執行該等電腦可讀取程式指令以個性化該電子電路,而執行本發明的態樣。
本發明之態樣參照依據本發明之具體實施例之方法的流程例示圖和/或區塊圖、設備(系統)和電腦程式產品於文中說明。將可理解該等流程例示圖和/或區塊圖之各區塊,以及在該等流程例示圖和/或區塊圖中的區塊之組合,可由電腦可讀取程式指令實行。
這些電腦可讀取程式指令可能提供給通用電腦、專用電腦或其他可程式資料處理設備之處理器以產生機器,使得經由該電腦或其他 可程式資料處理設備之處理器執行的該等指令,創造用於實行在該流程圖和/或區塊圖之一個或多個區塊中所指定的該等功能/動作的手段。這些電腦可讀取程式指令亦可能儲存在可引導電腦、可程式資料處理設備和/或其他裝置以特定方式起作用的電腦可讀取儲存媒體中,使得其中儲存有指令的電腦可讀取儲存媒體包含製造之一物件,其包括實行在該流程圖和/或區塊圖之一個或多個區塊中所指定的功能/動作之態樣的指令。
該電腦可讀取程式指令亦可能載入至電腦、其他可程式資料處理設備或其他裝置上,以導致一連串操作步驟在該電腦、其他可程式設備或其他裝置上進行以產生電腦所實行的程序,使得在該電腦、其他可程式設備或其他裝置上執行的該等指令實行在該流程圖和/或區塊圖之一個或多個區塊中所指定的該等功能/動作。
在所附圖式中的該等流程圖和區塊圖例示依據本發明之各種具體實施例的系統、方法和電腦程式產品之可能實作之架構、功能和操作。就此點而言,在該等流程圖或區塊圖中的各區塊皆可能表示指令之模組、區段或部分,其包含用於實行該(等)指定邏輯功能的一個或多個可執行指令。在一些替代性實作中,註記在該區塊中的該等功能可能脫離註記在所附圖式中的次序而發生。舉例來說,連續顯示的兩個區塊依所涉及的功能而定,其實可能實質上同時執行,或該等區塊有時可能以該反向次序執行。亦應注意該等區塊圖和/或流程例示圖之各區塊,以及在該等區塊圖和/或流程例示圖中的區塊之組合,可由進行該等指定功能或動作或執行專用硬體和電腦指令之組合的專用基於硬體的系統實行。
儘管前述係針對本發明之具體實施例,但本發明之其他和進一步具體實施例可能擬出而不悖離其基本範疇,且其範疇係由接下來的諸申請專利範圍確定。

Claims (11)

  1. 一種用以修復一通訊連結失效的裝置,包含:一控制器,組態以初始化使用複數個通道中之一初始數量的通道來與另一裝置通訊的該通訊連結;複數個多工器,組態以選擇性地耦合複數個通訊路徑與該通訊連結的該複數個通道,其中,在一初始狀態期間,該複數個路徑的一第一路徑與該複數個通道的一第一通道耦合,其中該複數個通道包含一備援通道,且其中該控制器更組態以:決定該複數個通道的其中至少一通道是否正遭受一失效;以及控制該等多工器的其中至少一者,以藉由使用該備援通道而使該失效通道由該複數個通道中的另一通道所取代,其中該裝置被組態以在從當該失效被決定到當該失效通道被取代之期間,使用少於該初始數量的通道的一減少數量的通道來與其他裝置通訊,其中該控制器更組態以藉由決定用以經由該通訊連結來通訊之一些數量的通道是否小於該初始數量的通道而決定至少一通道正遭受失效。
  2. 如申請專利範圍第1項所述之裝置,其中該控制器更組態以在該失效通道由其他通道取代後,傳送一連結寬度變化請求至其他裝置,其中基於該連結寬度變化請求,用以經由該通訊連結來與其他裝置通訊的一些數量的通道回復到該初始數量的通道。
  3. 如申請專利範圍第1項所述之裝置,更包含一電光轉換器,其組態以使用至少一光纖電纜來光學地傳遞經由該複數個路徑的其中至少一者所接收之資訊。
  4. 如申請專利範圍第1項所述之裝置,其中該控制器組態以決定對應至該失效通道的一識別符。
  5. 如申請專利範圍第1項所述之裝置,其中該備援通道包含該複數個通道的最後一通道。
  6. 一種用以修復一通訊連結失效的方法,包含:使用該通訊連結的複數個通道中之一初始數量的通道來與另一裝置通訊;選擇性地耦合複數個通訊路徑與該通訊連結的該複數個通道,其中在一初始狀態期間,該複數個路徑的一第一路徑與該複數個通道的一第一通道耦合,且其中該複數個通道包含一備援通道;決定該複數個通道的其中至少一通道是否正遭受一失效;以及控制複數個多工器的其中至少一者,以藉由使用該備援通道而使該失效通道由該複數個通道中的另一通道所取代,其中在從當該失效被決定到當該失效通道被取代之期間,使用少於該初始數量的通道的一減少數量的通道來與其他裝置通訊,其中決定至少一通道正遭受失效包含決定用以經由該通訊連結來通訊之一些數量的通道是否小於該初始數量的通道。
  7. 如申請專利範圍第6項所述之方法,更包含在該失效通道由其他通道取代後,傳送一連結寬度變化請求至其他裝置,其中基於該連結寬度變化請求,用以經由該通訊連結來與其他裝置通訊的一些數量的通道回復到該初始數量的通道。
  8. 如申請專利範圍第6項所述之方法,更包含光學地傳遞經由該複數個路徑的其中至少一者所接收之資訊。
  9. 如申請專利範圍第6項所述之方法,其中一控制器組態以決定對應該失效通道的一識別符。
  10. 如申請專利範圍第6項所述之方法,其中該備援通道包含該複數個通道的最後一通道。
  11. 一種用以修復一通訊連結失效的電腦程式產品,該電腦程式產品包含具有多個程式指令於其中的一電腦可讀儲存媒體,該等程式指令可由一處理器執行以導致該處理器進行如申請專利範圍第6-10項之任一項所述之方法。
TW105128011A 2015-09-01 2016-08-31 用於當備援缺陷通道時以最少連結停止時間對於路徑失效作動態連結修復之裝置、方法及電腦程式產品 TWI661687B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US14/842,074 US9774389B2 (en) 2015-09-01 2015-09-01 Dynamic link repair from lane failure with minimal link down-time while sparing fault channels
US14/842,074 2015-09-01

Publications (2)

Publication Number Publication Date
TW201717561A TW201717561A (zh) 2017-05-16
TWI661687B true TWI661687B (zh) 2019-06-01

Family

ID=58096140

Family Applications (1)

Application Number Title Priority Date Filing Date
TW105128011A TWI661687B (zh) 2015-09-01 2016-08-31 用於當備援缺陷通道時以最少連結停止時間對於路徑失效作動態連結修復之裝置、方法及電腦程式產品

Country Status (3)

Country Link
US (2) US9774389B2 (zh)
CN (1) CN106487629B (zh)
TW (1) TWI661687B (zh)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI691852B (zh) 2018-07-09 2020-04-21 國立中央大學 用於偵測階層式系統故障之偵錯裝置及偵錯方法、電腦可讀取之記錄媒體及電腦程式產品
US11815976B2 (en) * 2019-05-22 2023-11-14 Qualcomm Incorporated Bandwidth based power management for peripheral component interconnect express devices
CN110266543A (zh) * 2019-06-27 2019-09-20 浪潮商用机器有限公司 一种服务器高速总线通信系统
CN110855792B (zh) * 2019-11-19 2023-04-18 南京领行科技股份有限公司 一种消息推送方法、装置、设备及介质
US11836101B2 (en) * 2019-11-27 2023-12-05 Intel Corporation Partial link width states for bidirectional multilane links
CN111158961B (zh) * 2019-12-28 2023-06-23 浪潮商用机器有限公司 一种线缆冗余装置及线缆冗余方法
US11817904B2 (en) * 2021-03-25 2023-11-14 Mellanox Technologies, Ltd. Optical transceiver with reduced lane utilization
US11960367B2 (en) 2021-05-24 2024-04-16 SK Hynix Inc. Peripheral component interconnect express device and operating method thereof
KR102635457B1 (ko) * 2021-05-24 2024-02-13 에스케이하이닉스 주식회사 PCIe 장치 및 이를 포함하는 컴퓨팅 시스템

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5440538A (en) * 1993-09-23 1995-08-08 Massachusetts Institute Of Technology Communication system with redundant links and data bit time multiplexing
US7801442B2 (en) * 2006-12-28 2010-09-21 Intel Corporation Redundant channel implementation to extend optical transceiver lifetime and reliability
US20110311217A1 (en) * 2009-03-04 2011-12-22 Mitsubishi Electric Corporation Optical transmission apparatus
US20140003451A1 (en) * 2012-06-29 2014-01-02 Mahesh Wagh Architected Protocol For Changing Link Operating Mode
US20140314401A1 (en) * 2013-04-18 2014-10-23 Fujitsu Limited Transmission equipment and path selection method

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6115155A (en) * 1996-10-29 2000-09-05 Chorum Technologies Inc. System for dealing with faults in an optical link
CN100396003C (zh) * 2005-09-19 2008-06-18 华为技术有限公司 一种宽带接入设备链路故障处理系统及方法
CN100555997C (zh) * 2007-01-31 2009-10-28 华为技术有限公司 异步传输模式反向复用组重新激活的方法、系统和装置
US8041210B2 (en) * 2007-04-30 2011-10-18 Finisar Corporation Parallel high-speed communication links with redundant channel architectures
US20090187683A1 (en) 2008-01-22 2009-07-23 International Business Machines Corporation Adaptive link width control
JP2010161750A (ja) 2009-01-09 2010-07-22 Sony Corp 信号送信装置、信号受信装置及び信号伝送システム
US9251055B2 (en) 2012-02-23 2016-02-02 Kabushiki Kaisha Toshiba Memory system and control method of memory system
JP5994294B2 (ja) * 2012-03-06 2016-09-21 富士通株式会社 光伝送装置および光伝送方法
US9351055B2 (en) * 2013-08-15 2016-05-24 Mellanox Technologies Ltd. High-reliability active optical cable (AOC) with redundant emitters

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5440538A (en) * 1993-09-23 1995-08-08 Massachusetts Institute Of Technology Communication system with redundant links and data bit time multiplexing
US7801442B2 (en) * 2006-12-28 2010-09-21 Intel Corporation Redundant channel implementation to extend optical transceiver lifetime and reliability
US20110311217A1 (en) * 2009-03-04 2011-12-22 Mitsubishi Electric Corporation Optical transmission apparatus
US20140003451A1 (en) * 2012-06-29 2014-01-02 Mahesh Wagh Architected Protocol For Changing Link Operating Mode
US20140314401A1 (en) * 2013-04-18 2014-10-23 Fujitsu Limited Transmission equipment and path selection method

Also Published As

Publication number Publication date
US9774389B2 (en) 2017-09-26
CN106487629B (zh) 2019-06-28
US20170063448A1 (en) 2017-03-02
TW201717561A (zh) 2017-05-16
US20170063449A1 (en) 2017-03-02
CN106487629A (zh) 2017-03-08
US9838110B2 (en) 2017-12-05

Similar Documents

Publication Publication Date Title
TWI661687B (zh) 用於當備援缺陷通道時以最少連結停止時間對於路徑失效作動態連結修復之裝置、方法及電腦程式產品
US10236973B2 (en) Rerouting bus data signals from faulty signal carriers to existing healthy signal carriers
CN110312999B (zh) 基于软件配置/策略分发的PCIe盘阵列的动态划分
US8812913B2 (en) Method and apparatus for isolating storage devices to facilitate reliable communication
US11372790B2 (en) Redundancy in a PCI express system
US9705591B2 (en) Dynamic optical channel sparing in an industry standard input/output subsystem
US20170139605A1 (en) Control device and control method
US11416051B2 (en) System and method for dynamic remote power management of information handling systems
JP2016212516A (ja) バス接続対象装置,ストレージ制御装置およびバス通信システム
US20190182141A1 (en) High-speed network apparatus and self-testing method thereof
CN112543922A (zh) 一种提高存储系统可靠性的方法和相关装置
US11817062B2 (en) System and method for overdrive setting control on a liquid crystal display
CN116204448A (zh) 一种多端口固态硬盘及其控制方法、装置、介质、服务器
US10324777B2 (en) Register-based communications interface
TWI756007B (zh) 用以進行全快閃記憶體陣列伺服器的高可用性管理的方法與設備
JP5511546B2 (ja) フォールトトレラントの計算機システム、複数の物理サーバとストレージ装置とに接続されるスイッチ装置、及び、サーバ同期制御方法
KR20210072378A (ko) 피드백 로직을 구비하는 차량의 드라이버 시스템 및 그것의 동작 방법
US12001373B2 (en) Dynamic allocation of peripheral component interconnect express bus numbers
US20230409505A1 (en) Dynamic allocation of peripheral component interconnect express bus numbers
JP6930153B2 (ja) パス切替装置、パス切替方法及びパス切替プログラム、並びに、コンピュータシステム
TWI755259B (zh) 記憶裝置以及相關快閃記憶體控制器
US20240118903A1 (en) Power conservation and standby graphics rendering in an information handling system
JP2019148986A (ja) 経路制御装置、制御方法、制御プログラム及びストレージシステム
CN115686357A (zh) 一种存储资源管理系统及存储系统

Legal Events

Date Code Title Description
MM4A Annulment or lapse of patent due to non-payment of fees