TWI588660B - 使用基板管理控制器偵測通訊匯流排上錯誤的方法以及用於網路系統的偵錯器 - Google Patents

使用基板管理控制器偵測通訊匯流排上錯誤的方法以及用於網路系統的偵錯器 Download PDF

Info

Publication number
TWI588660B
TWI588660B TW105104667A TW105104667A TWI588660B TW I588660 B TWI588660 B TW I588660B TW 105104667 A TW105104667 A TW 105104667A TW 105104667 A TW105104667 A TW 105104667A TW I588660 B TWI588660 B TW I588660B
Authority
TW
Taiwan
Prior art keywords
busbar
communication
bus
communication bus
devices
Prior art date
Application number
TW105104667A
Other languages
English (en)
Other versions
TW201719436A (zh
Inventor
黃志嘉
詹昊宇
賴德賢
顏載益
Original Assignee
廣達電腦股份有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 廣達電腦股份有限公司 filed Critical 廣達電腦股份有限公司
Publication of TW201719436A publication Critical patent/TW201719436A/zh
Application granted granted Critical
Publication of TWI588660B publication Critical patent/TWI588660B/zh

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2002Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where interconnections or communication control functionality are redundant
    • G06F11/2007Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where interconnections or communication control functionality are redundant using redundant communication media
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0793Remedial or corrective actions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/22Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
    • G06F11/2205Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing using arrangements specific to the hardware being tested
    • G06F11/221Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing using arrangements specific to the hardware being tested to test buses, lines or interfaces, e.g. stuck-at or open line faults
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/28Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
    • H04L12/40Bus networks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/50Testing arrangements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2201/00Indexing scheme relating to error detection, to error correction, and to monitoring
    • G06F2201/805Real-time
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2201/00Indexing scheme relating to error detection, to error correction, and to monitoring
    • G06F2201/85Active fault masking without idle spares

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Computer Hardware Design (AREA)
  • Debugging And Monitoring (AREA)

Description

使用基板管理控制器偵測通訊匯流排上錯誤的方法以及用於 網路系統的偵錯器
本系統及方法之實施例主要係關於一種通訊匯流排。更具體地,本系統及方法之實施例主要係關於一種具有基板管理控制器故障偵測的通訊匯流排。
通訊匯流排,例如但不限於積體電路之間(inter-integrated cir-cuit,I2C)匯流排,在電腦網路中連接主機與其他I2C裝置及元件。I2C匯流排可用於電腦網路之主機與內部或外部I2C裝置之間的通訊。不幸地,在I2C匯流排上的一些I2C裝置可造成I2C匯流排上的通訊中斷,或因各種原因而「停擺」。若發生I2C匯流排上的通訊停擺時,電腦系統可能無法正常運作。為排除I2C匯流排的通訊停擺,電腦網路必須手動地重新啟動,或必須試著找出導致匯流排停擺的I2C裝置。兩種方法都不受歡迎且繁瑣。
根據本發明之實施例,基板管理控制器(baseboard management controller,BMC)連接並監控電腦網路之I2C匯流排。BMC自動偵測I2C匯流排上的匯流排停擺(bus hang),並可重啟所有的I2C匯流排裝置。BMC識別不重置成功的I2C匯流排裝置,並阻斷與該I2C裝置的通訊。BMC在阻斷與造成匯流排停擺的該I2C裝置的通訊之後,再次重置所有的I2C裝置。BMC重新連接I2C匯流排及其餘I2C裝置,並繼續偵測I2C匯流排上的匯流排停擺。
上述實施例可具有不同特徵。BMC可偵測I2C匯流排停擺並判定BMC是否可存取I2C匯流排開關。BMC可偵測I2C匯流排停擺並重置I2C匯流排上的所有I2C裝置。
BMC可判定BMC是否可直接存取I2C匯流排開關,並可回報該I2C匯流排開關不是造成匯流排停擺的原因。BMC可判定BMC是否可利用I2C匯流排存取I2C匯流排裝置。
BMC可判定造成匯流排停擺的I2C匯流排裝置,並可將該I2C匯流排裝置回報給主機。BMC可再次重置所有的I2C裝置,並識別造成匯流排停擺的任何I2C裝置。
BMC可識別造成匯流排停擺的連接到I2C匯流排裝置的元件,並輪詢連接到I2C匯流排裝置的所有元件。BMC可阻擋未回應來自BMC之輪詢的元件所使用的I2C匯流排裝置之通道。
BMC可回報造成阻擋的元件且可回報該元件使用的通道給主機。BMC可告知主機去移除造成阻擋的元件,並偵測該元件從I2C裝置之移除。
BMC可在偵測元件從I2C裝置之移除後,回復造成阻擋的元件所使用的通道。
將理解前述之一般性描述及下述之詳細說明皆係藉由實施例以進行,並且意在提供所主張之揭露內容的進一步解釋。
200‧‧‧流程圖
202、204、206、208、210、212、214、216、218、220、222、224、226、228、230、232‧‧‧步驟
100‧‧‧電腦網路
102‧‧‧網路開關
104‧‧‧I2C匯流排開關
106‧‧‧I2C匯流排
108‧‧‧基板管理控制器
110‧‧‧資料檔案
112、114、130‧‧‧I2C裝置/I2C擴展器
116‧‧‧通道
118-126‧‧‧元件
可藉由閱覽參照以下附隨圖式所作之下述實施例之詳細說明更加地理解揭露內容:第1圖為本揭露之實施例的示例性圖式,其中電腦網路之部份被顯示為包含網路開關、具有偵錯器(fault detector)的基板管理控制器(BMC)、I2C匯流排開關及匯流排、I2C擴展器(expanders)及隔離器(isolators)、以及I2C裝置;且第2圖為本揭露之實施例的示例性流程圖,提供使用BMC監控及偵測在I2C匯流排上的錯誤之步驟。
在下述說明中,將以舉例方式來說明不同實施例,而不以限於附圖圖式之方式來說明。本揭露中的各種實施例的參照不必然係針對相同實施例,且該參照係表示針對至少一個實施例。雖然討論了特定實施方式及其他細節時,將理解其僅係為了說明之目的而進行。相關領域之通常知識者將認知到可使用其他元件及配置而不超出申請專利範圍之範疇及精神。
本揭露之實施例提供使用基板管理控制器(Baseboard Manage-ment Controller,下稱BMC)偵測通訊匯流排(例如,但不限於I2C匯流排)上的錯誤之系統及方法。BMC連接並監控電腦網路之I2C匯流排之運作。BMC自動地偵測I2C匯流排的停擺(hang)並將匯流排的停擺回報給主機。
首先,BMC藉由I2C匯流排開關(I2C bus switch)以隔離網路開關102與I2C匯流排。隔離的方式可透過短路或開路等。隔離後,BMC嘗試存取連接到I2C匯流排的I2C裝置(相當於判斷I2C匯流排是否仍然停擺)。若可存取I2C裝置,代表I2C匯流排恢復正常;若無法存取I2C裝置,則BMC透過重置線重置連接到I2C匯流排的I2C裝置,並於重置後嘗試存取I2C裝置。若仍無法存取I2C裝置,BMC仍透過重置線重置連接到I2C匯流排的I2C擴充器或隔離器。重置後,BMC判斷I2C匯流排是否仍然停擺,若I2C匯流排仍然停擺,BMC接著嘗試聯絡透過I2C匯流排連接到I2C擴充器或隔離器的元件。若一元件無法藉由其I2C裝置存取,BMC隔離(isolates)或阻擋(blocks)該元件使用的通道,回報該通道隔離。BMC同時回報該元件可被從電腦網路移除。一旦BMC偵測到該元件已被移除時,BMC嘗試回復阻擋的通道,並回報該回復之通道目前可供待加入網路之其他元件使用。
第1圖係根據本發明實施例之具有BMC偵錯器的通訊匯流排之示例圖,其中電腦網路100包含主機,諸如網路開關或CPU開關102。網路開關102被連接到I2C匯流排106。具偵錯功能之基板管理控制器(BMC)108被連接並監控I2C匯流排106。I2C裝置112、114、130也被連接到I2C匯流排106。I2C裝置112、114、130可以是各種類型的I2C裝置,例如但不限於I2C擴展器或I2C隔離器112、114,或是獨立連結至I2C匯流排106之I2C裝置130。複數個元件118-126通過I2C擴展器或I2C隔離器112、114與I2C匯流排106通訊。BMC可透過重置線重置I2C裝置112、114、130。
於一具體實施例中,I2C裝置112及114為I2C擴展器或I2C隔離器,而I2C裝置130為連結到I2C匯流排106的其他I2C裝置(非I2C擴展器或I2C隔離器)。
首先,BMC 108監控I2C匯流排106之匯流排是否停擺。當BMC偵測到匯流排停擺時,BMC 108藉由短路或開路I2C匯流排開關104(I2C bus switch)等方式以隔離網路開關102與I2C匯流排106。隔離後,BMC 108嘗試存取連接到I2C匯流排的I2C裝置112、114、130;若可存取連接到I2C匯流排的I2C裝置,代表I2C匯流排106恢復正常,BMC 108記錄匯流排停擺資料於BMC資料檔案(data log)110中。
若在隔離後仍無法存取連接到I2C匯流排的I2C裝置,即BMC 108仍然偵測到匯流排停擺,BMC 108將重置I2C匯流排106上的I2C裝置130。接著BMC 108判定是否所有重置的I2C裝置130都成功地重置,即BMC 108可存取I2C裝置130。若BMC 108仍然偵測到匯流排停擺而無法存取I2C裝置130,BMC 108將重置I2C匯流排106上的I2C擴展器或I2C隔離器112、114;接著BMC 108判定是否所有I2C裝置112、114都成功地重置而可存取。若所有I2C裝置112、114都成功地重置,則BMC 108判定I2C裝置112、114都不是匯流排停擺的原因。BMC 108記錄匯流排停擺資料於資料檔案110中。
若BMC 108偵測到連接在I2C匯流排106上之I2C裝置112、114的元件118-126中的至少其一沒有成功地重置,則匯流排停擺的原因即為該些元件118-126中的至少其一。至少在此實施例中,由於BMC 108無法直接存取元件118-126,BMC 108藉由經各相對應的I2C裝置112、114送出訊號至元件118-126中的每一個,以測試各元件118-126。
在BMC 108送出訊號給各元件118-126之後,BMC 108等待來自各元件118-126的回應。例如,BMC 108可透過I2C匯流排106通過I2C擴展器112送出訊號到多種元件,包含諸如小封裝熱插拔收發器(mall form-factor pluggable transceiver,SFP+)118、四通道小封裝收發器(quad small form-factor transceiver,QSFP+)120、以及z-四通道小封裝收發器(z-quad small form factor transceiver,z-QSFP+)122之收發器。在另一實施例中,BMC 108可透過I2C匯流排106通過I2C擴展器114送出訊號給多種元件,諸如IO擴展器(IO expand-er)124及溫度感測器126。
在等待一段預設時間後,BMC 108判定元件118-126中的哪一個不回應由BMC 108通過各相對應的I2C裝置112、114送出的訊號。BMC 108接著隔離在預設時間內不回應BMC 108送出的訊號元件118-126所使用的通道116。BMC 108記錄匯流排停擺資料於資料檔案110中。藉由隔離造成匯流排停擺的元件118-126所使用的通道116,BMC 108允許電腦網路100不需要手動重置即可運作,並避免匯流排停擺影響電腦網路100。
BMC 108可指出被BMC 108偵測的元件118-126是匯流排停擺的源頭且應被移除,例如但不限於顯示於在螢幕上的文字訊息、例如LED的視覺指示器、音頻訊號、或是所屬領域之通常知識者所習知的其他方法。
BMC 108可透過I2C匯流排106監控並偵測,是否造成匯流排停擺的元件118-126已從電腦網路100移除。一旦造成匯流排停擺的元件118-126被移除,BMC 108可回復先前元件118-126所用的通道116,並可記錄匯流排資料於資料檔案110中。BMC 108同時可透過指標及/或訊息通知主機先前被隔離的通道116已能為待連接之新元件使用。
第2圖係根據本發明之實施例的具有偵錯功能的BMC監控通訊匯流排(例如,但不限於I2C匯流排)的示例性流程圖。流程圖200包含各種步驟以詳細描述BMC在12C匯流排上的錯誤偵查,以及BMC所執行的各種校正動作。
在步驟202中,連接到I2C匯流排的BMC偵測I2C匯流排之狀態。在步驟204中,BMC偵測在I2C匯流排上之匯流排停擺(hang)。在步驟206中,BMC藉由短路或開路I2C匯流排開關104等方式以隔離網路開關102與I2C匯流排,並於隔離I2C匯流排開關後,嘗試存取在I2C匯流排上的I2C裝置。若可存取I2C裝置,代表I2C匯流排恢復正常,此時進入步驟212,紀錄並通知CPU說明I2C匯流排恢復正常;若BMC無法在I2C匯流排上存取I2C裝置,則BMC回報於I2C匯流排上仍發生匯流排停擺,此時進入步驟208,BMC重置I2C裝置130,而後嘗試存取I2C裝置130。若可存取I2C裝置130,代表I2C匯流排恢復正常,此時進入步驟212,紀錄並通知CPU說明I2C匯流排恢復正常;若仍無法在I2C匯流排上存取I2C裝置130,則進入步驟210。
在步驟210,BMC重置所有I2C擴展器112、114。若重置後,I2C匯流排仍然停擺,在步驟214,BMC判定該匯流排停擺原因是由連接到I2C擴展器的擴展器元件118-126所造成,而後進入步驟216。在重置後若I2C匯流排沒有停擺,代表I2C匯流排恢復正常,則進入步驟212,BMC回報給主機。
在步驟216,BMC透過I2C/SM匯流排輪詢連接到I2C擴展器112、114的各元件。在步驟218,BMC檢查I2C/SM匯流排之狀態。BMC接著等待來自各元件的回應。在步驟222中,BMC回報主機連接到I2C/SM匯流排的各元件是否回應來自BMC之輪詢。
若BMC沒有透過I2C/SM匯流排獲得來自至少一擴展器元件的回應,則步驟224中,BMC阻擋該元件使用的通訊通道。在步驟226中,BMC回報該至少一擴展器元件未回應BMC所送出的輪詢,以及BMC已阻擋 由未回應之擴展器元件使用之通道。只要未回應之擴展器元件仍保持連接(未移除),則該通道將保持關閉,以避免未來匯流排停擺並允許電腦網路運作。
在步驟228中,BMC使用如LED之指標來回報已判定為停擺之匯流排元件,並進一步回報已判定的擴展器元件是匯流排停擺的原因,且應該被從電腦網路移除。
BMC繼續監控I2C匯流排106、I2C裝置130、以及透過I2C/SM匯流排連接到I2C裝置的擴展器元件118-126,扣除已偵測之擴展器元件及其被阻擋之通道。BMC保持阻擋已判定的擴展器元件之通道,直到BMC偵測到已判定的擴展器元件已在步驟230中被移除。
在步驟232中,一旦BMC偵測到在步驟230中擴展器元件之移除,BMC可回復擴展器元件所使用的被阻擋之通道。在步驟212中,BMC可回報造成匯流排停擺的擴展器元件已被移除,以及由於擴展器元件造成的匯流排停擺而阻擋的通道,已可供待連接至擴展器之新元件使用。
對於所屬領域之通常知識者而言,顯而易見的是,可對目前揭露之結構做出各種修改及變更而不背離揭露內容之精神及範疇。鑒於上述內容,意在使對目前揭露內容做出的變更及修改被涵蓋於本揭露下述申請專利範圍之範疇中。
200‧‧‧流程圖
202、204、206、208、210、212、214、216、218、220、222、224、226、228、230、232‧‧‧步驟

Claims (10)

  1. 一種使用基板管理控制器偵測通訊匯流排上錯誤的方法,其包含以下步驟:一偵測步驟,藉由一基板管理控制器偵測一通訊匯流排之一匯流排停擺;一隔離步驟,藉由一通訊匯流排開關隔離該通訊匯流排;一存取步驟,該基板管理控制器存取該通訊匯流排之該匯流排停擺的一通訊匯流排裝置;一第一重置步驟,回應該存取步驟之該匯流排停擺而第一重置複數個通訊匯流排裝置中的所有通訊匯流排裝置;一第一識別步驟,回應無法回復該匯流排停擺的該第一重置步驟而識別該複數個通訊匯流排裝置中造成該匯流排停擺的該通訊匯流排裝置;一阻擋步驟,阻擋被識別為係造成該匯流排停擺的該通訊匯流排裝置;一第二重置步驟,在阻擋該複數個通訊匯流排裝置的所有通訊匯流排裝置之後,進行第二重置;以及一重新連接步驟,透過該通訊匯流排重新連接該通訊匯流排開關及該複數個通訊匯流排裝置中之其餘通訊匯流排裝置。
  2. 如申請專利範圍第1項所述之方法,進一步包含:一判定步驟,回應該偵測步驟而判定該通訊匯流排開關與該複數個通訊匯流排裝置之間的通訊;以及 一回報步驟,回應該判定步驟而回報該通訊匯流排開關與該複數個通訊匯流排裝置之間的通訊。
  3. 如申請專利範圍第1項所述之方法,進一步包含:一判定步驟,回應該第一識別步驟而判定造成該匯流排停擺的該通訊匯流排裝置;以及一回報步驟,回應該第一識別步驟而回報造成該匯流排停擺的該通訊匯流排裝置。
  4. 如申請專利範圍第1項所述之方法,進一步包含:一第二識別步驟,回應無法重置該匯流排停擺之該第二重置步驟,識別連接到造成該匯流排停擺之該通訊匯流排裝置的一通訊匯流排元件。
  5. 一種使用基板管理控制器偵測通訊匯流排上錯誤的方法,其包含:一偵測步驟,偵測連接到一通訊匯流排上的一通訊匯流排裝置之一通道的一元件之一匯流排停擺;一隔離步驟,藉由一通訊匯流排開關隔離該通訊匯流排;一存取步驟,一基板管理控制器存取該通訊匯流排之該匯流排停擺的該通訊匯流排裝置的該元件;一輪詢步驟,回應該存取步驟而輪詢連接到該通訊匯流排上之該通訊匯流排裝置的該元件;一識別步驟,回應無法回復該匯流排停擺的該輪詢步驟而識別造成該匯流排停擺的該元件;以及 一阻擋步驟,阻擋造成該匯流排停擺的該元件所使用的該通道。
  6. 如申請專利範圍第5項所述之方法,進一步包含:一第一回報步驟,回應該阻擋步驟而回報造成阻擋的該元件;以及一第二回報步驟,回應該阻擋步驟而回報造成阻擋的該元件使用的該通道。
  7. 如申請專利範圍第6項所述之方法,進一步包含:一移除步驟,回應該第一回報步驟而移除造成阻擋的該元件;一偵測步驟,回應該移除步驟而偵測造成阻擋的該元件之移除;以及一回復步驟,回應該偵測步驟而回復造成該匯流排停擺之該元件使用的該通道。
  8. 一種用於網路系統的偵錯器,其包含:一通訊匯流排,在一開關與複數個網路裝置之間;以及一基板管理控制器,以監控該通訊匯流排;一電腦可讀取媒體,儲存一指令,若執行該指令,將使包含一基板管理控制器的該開關執行包含以下步驟之操作:一偵測步驟,藉由該基板管理控制器偵測該通訊匯流排之一匯流排停擺;一隔離步驟,藉由一通訊匯流排開關隔離該通訊匯流排; 一存取步驟,該基板管理控制器存取該通訊匯流排之該匯流排停擺的一通訊匯流排裝置;一第一重置步驟,回應該存取步驟之該匯流排停擺而第一重置複數個通訊匯流排裝置中的所有通訊匯流排裝置;一第一識別步驟,回應無法回復該匯流排停擺的該第一重置步驟而識別該複數個通訊匯流排裝置中造成該匯流排停擺的該通訊匯流排裝置;一阻擋步驟,阻擋被識別為係造成該匯流排停擺的該通訊匯流排裝置;一第二重置步驟,在阻擋該複數個通訊匯流排裝置中的所有通訊匯流排裝置後,進行第二重置;以及一重新連接步驟,透過該通訊匯流排重新連接該通訊匯流排開關及該複數個通訊匯流排裝置中之其餘通訊匯流排裝置。
  9. 如申請專利範圍第8項所述之偵錯器,其運算進一步包含:一判定步驟,回應該偵測步驟而判定該通訊匯流排開關與該複數個通訊匯流排裝置之間的通訊;以及一回報步驟,回應該判定步驟而回報該通訊匯流排開關與該複數個通訊匯流排裝置之間的通訊。
  10. 如申請專利範圍第8項所述之偵錯器,其運算進一步包含:一判定步驟,回應該第一識別步驟而判定造成該匯流排停擺的該通訊匯流排裝置;以及 一回報步驟,回應該第一識別步驟而回報造成該匯流排停擺的該通訊匯流排裝置。
TW105104667A 2015-11-24 2016-02-17 使用基板管理控制器偵測通訊匯流排上錯誤的方法以及用於網路系統的偵錯器 TWI588660B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US14/950,519 US9875165B2 (en) 2015-11-24 2015-11-24 Communication bus with baseboard management controller

Publications (2)

Publication Number Publication Date
TW201719436A TW201719436A (zh) 2017-06-01
TWI588660B true TWI588660B (zh) 2017-06-21

Family

ID=58721614

Family Applications (1)

Application Number Title Priority Date Filing Date
TW105104667A TWI588660B (zh) 2015-11-24 2016-02-17 使用基板管理控制器偵測通訊匯流排上錯誤的方法以及用於網路系統的偵錯器

Country Status (3)

Country Link
US (1) US9875165B2 (zh)
CN (1) CN106789386B (zh)
TW (1) TWI588660B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI741417B (zh) * 2019-11-28 2021-10-01 旺玖科技股份有限公司 積體電路匯流排即時偵測連接狀態的裝置及方法

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10157115B2 (en) * 2015-09-23 2018-12-18 Cloud Network Technology Singapore Pte. Ltd. Detection system and method for baseboard management controller
US10296434B2 (en) * 2017-01-17 2019-05-21 Quanta Computer Inc. Bus hang detection and find out
CN107766200A (zh) * 2017-09-22 2018-03-06 郑州云海信息技术有限公司 一种i2c总线监控系统及监控方法
CN107832167B (zh) * 2017-11-30 2021-04-13 郑州云海信息技术有限公司 一种bmc故障导致无法开机的恢复方法及系统
CN108763022A (zh) * 2018-05-28 2018-11-06 深圳市瑞驰信息技术有限公司 一种基于i2c协议的智能平台管理接口系统
CN108777639A (zh) * 2018-05-30 2018-11-09 郑州云海信息技术有限公司 一种实现i2c总线数据监控与保护的设计方法
CN108920315A (zh) * 2018-06-29 2018-11-30 郑州云海信息技术有限公司 一种网卡信息的查询方法、装置、系统和可读存储介质
US10649933B1 (en) * 2019-04-22 2020-05-12 International Business Machines Corporation Select state detection and signal generation
DE102020203663A1 (de) * 2020-03-20 2021-09-23 Robert Bosch Gesellschaft mit beschränkter Haftung Integrierter Schaltkreis, eingebettetes System und Kraftfahrzeug
US11693798B2 (en) * 2020-07-10 2023-07-04 Samsung Electronics Co., Ltd. Layered ready status reporting structure
CN111858448B (zh) * 2020-07-17 2023-01-10 苏州浪潮智能科技有限公司 一种i2c死锁并恢复的方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070088988A1 (en) * 2005-10-14 2007-04-19 Dell Products L.P. System and method for logging recoverable errors
CN1991783A (zh) * 2005-12-29 2007-07-04 国际商业机器公司 检测以及校正挂起i2c总线的i2c总线监视器和方法
TW201220076A (en) * 2010-11-03 2012-05-16 Inventec Corp A method for obtaining a status signal of a storage device using a Baseboard Management Controller
CN102571478A (zh) * 2010-12-31 2012-07-11 鸿富锦精密工业(深圳)有限公司 服务器及其控制通道开关的方法

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6769078B2 (en) * 2001-02-08 2004-07-27 International Business Machines Corporation Method for isolating an I2C bus fault using self bus switching device
US6862642B1 (en) * 2001-05-15 2005-03-01 Adaptec, Inc. Expander device and method for resetting bus segments in I/O subsystem segmented with expanders
CN100517246C (zh) * 2006-03-14 2009-07-22 联想(北京)有限公司 一种计算机远程控制方法及系统
CN101132314B (zh) * 2007-09-21 2010-09-29 中兴通讯股份有限公司 实现冗余备份的方法
CN102445899A (zh) * 2010-09-30 2012-05-09 伊姆西公司 监控电路
CN104141623A (zh) * 2013-05-10 2014-11-12 鸿富锦精密工业(深圳)有限公司 风扇转速控制系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070088988A1 (en) * 2005-10-14 2007-04-19 Dell Products L.P. System and method for logging recoverable errors
CN1991783A (zh) * 2005-12-29 2007-07-04 国际商业机器公司 检测以及校正挂起i2c总线的i2c总线监视器和方法
TW201220076A (en) * 2010-11-03 2012-05-16 Inventec Corp A method for obtaining a status signal of a storage device using a Baseboard Management Controller
CN102571478A (zh) * 2010-12-31 2012-07-11 鸿富锦精密工业(深圳)有限公司 服务器及其控制通道开关的方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI741417B (zh) * 2019-11-28 2021-10-01 旺玖科技股份有限公司 積體電路匯流排即時偵測連接狀態的裝置及方法

Also Published As

Publication number Publication date
CN106789386A (zh) 2017-05-31
US20170147453A1 (en) 2017-05-25
CN106789386B (zh) 2019-06-14
TW201719436A (zh) 2017-06-01
US9875165B2 (en) 2018-01-23

Similar Documents

Publication Publication Date Title
TWI588660B (zh) 使用基板管理控制器偵測通訊匯流排上錯誤的方法以及用於網路系統的偵錯器
TWI618380B (zh) 管理方法、服務控制器裝置以及非暫態電腦可讀取媒體
US20150127814A1 (en) Monitoring Server Method
US20180107196A1 (en) Method of Detecting Home Appliance Bus Control System
WO2015039598A1 (zh) 故障定位方法及装置
US9778988B2 (en) Power failure detection system and method
EP2696534B1 (en) Method and device for monitoring quick path interconnect link
WO2017063505A1 (zh) 一种服务器硬件故障检测方法及其装置和服务器
TWI632462B (zh) 開關裝置及偵測積體電路匯流排之方法
US20150106660A1 (en) Controller access to host memory
EP2829986B1 (en) Computer system, access method and apparatus for peripheral component interconnect express endpoint devices
CN104320308B (zh) 一种服务器异常检测的方法及装置
CN106502814B (zh) 一种记录pcie设备错误信息的方法及装置
CN112422178B (zh) 光模块监控方法、电子设备及存储介质
US20140189103A1 (en) System for monitoring servers and method thereof
TW201423385A (zh) 電腦測試系統及方法
WO2016197737A1 (zh) 自检处理方法、装置及系统
US20130198362A1 (en) System for Identifying a Server to be Decommissioned
WO2024113962A1 (zh) 漏液检测线检测方法、系统、装置、服务器及电子设备
US20140359377A1 (en) Abnormal information output system for a computer system
CN113868058A (zh) 一种外设组件高速互联设备故障检测方法、装置及服务器
JP5689783B2 (ja) コンピュータ、コンピュータシステム、および障害情報管理方法
CN113992501A (zh) 一种故障定位系统、方法及计算装置
JP2019036862A5 (ja) サーバ装置、記録方法、プログラム、および記録システム、並びに情報処理装置
CN110058979A (zh) 一种温度读取失败故障的监控方法、bmc及存储介质