TW201715394A - 判斷是否發生熱插拔的方法 - Google Patents

判斷是否發生熱插拔的方法 Download PDF

Info

Publication number
TW201715394A
TW201715394A TW104134389A TW104134389A TW201715394A TW 201715394 A TW201715394 A TW 201715394A TW 104134389 A TW104134389 A TW 104134389A TW 104134389 A TW104134389 A TW 104134389A TW 201715394 A TW201715394 A TW 201715394A
Authority
TW
Taiwan
Prior art keywords
control module
value
signal
monitoring host
plug
Prior art date
Application number
TW104134389A
Other languages
English (en)
Other versions
TWI561975B (en
Inventor
林宏達
張立田
陳光兆
Original Assignee
神雲科技股份有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 神雲科技股份有限公司 filed Critical 神雲科技股份有限公司
Priority to TW104134389A priority Critical patent/TWI561975B/zh
Application granted granted Critical
Publication of TWI561975B publication Critical patent/TWI561975B/zh
Publication of TW201715394A publication Critical patent/TW201715394A/zh

Links

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

一種判斷是否發生熱插拔的方法,由一包括一第一控制模組及一第二控制模組的電腦系統執行,該第一控制模組上電啟動,而進入一初始階段,每一控制模組各自輸出一指示處於初始階段及穩定階段其中之一的狀態信號至另一控制模組,該第一控制模組根據該狀態信號判斷該第二控制模組處於初始階段或是穩定階段,若判斷處於穩定階段,則該第一控制模組判斷發生一自身熱插拔操作。

Description

判斷是否發生熱插拔的方法
本發明是有關於一種電子數位資料處理方法,特別是指一種判斷是否發生熱插拔的方法。
目前用於電腦系統的機箱(Enclosure),如集束磁碟(Just A Bunch Of Disks,JBOD)中,包含複數硬碟,及複數電連接該等硬碟的控制模組。該等控制模組電連接一監控主機,如伺服器,且支援如串列附接式小型電腦介面(Serial Attached Small Computer System Interface,SAS),並將所接收的機箱狀態,如機殼溫度、風扇轉速、硬體組態等傳送至該監控主機。
該等控制模組支援「熱插拔」,即允許在帶電的情況下除去單一個故障的控制模組,並插入正常的來替換,而不中斷集束磁碟整體的儲存服務。然而,該監控主機經由訪問該等控制模組的運作、並且獲得機箱狀態時,經常無法得知故障的控制模組和替換的控制模組發生過熱插拔,來對應更新控制模組的資訊(例如序號、料號等),以致無法確實監控該等控制模組的運作狀況,及其所傳送的機箱狀態。
因此,本發明之目的,即在提供一種判斷是否發生熱插拔的方法。
於是,本發明判斷是否發生熱插拔的方法,由一電腦系統執行,該電腦系統包括一第一控制模組及一第二控制模組,且該判斷是否發生熱插拔的方法包含一步驟(A)、一步驟(B)、一步驟(E),及一步驟(G)。
該步驟(A)是該第一控制模組上電啟動,而進入一初始階段。
該步驟(B)是每一控制模組各自輸出一指示處於初始階段及穩定階段其中之一的狀態信號至另一控制模組。
該步驟(E)是該第一控制模組根據該狀態信號判斷該第二控制模組處於初始階段或是穩定階段。
該步驟(G)是若步驟(E)判斷處於穩定階段,則該第一控制模組判斷發生一自身熱插拔操作。
本發明之功效是藉由每一控制模組於上電啟動時,根據該狀態信號,自我判斷是否發生過該熱插拔操作,以便將自身運作情況確實反映給監控主機。
1‧‧‧電腦系統
11‧‧‧監控主機
12‧‧‧機箱
13‧‧‧第一控制模組
131‧‧‧擴充單元
132‧‧‧快閃記憶體
133‧‧‧插拔旗標
134‧‧‧執行程式
14‧‧‧第二控制模組
141‧‧‧擴充單元
142‧‧‧快閃記憶體
143‧‧‧插拔旗標
144‧‧‧執行程式
15‧‧‧儲存模組
151‧‧‧硬碟
A~L‧‧‧步驟
本發明之其他的特徵及功效,將於參照圖式的實施方式中清楚地呈現,其中:圖1是一系統方塊圖,說明本發明的電腦系統;及圖2是一流程圖,說明本發明判斷是否發生熱插拔的方 法的實施例。
參閱圖1,本發明判斷是否發生熱插拔的方法由一電腦系統1執行,該電腦系統1包含一監控主機11,及一機箱(Enclosure)12。該監控主機11可以是伺服器或電腦;該機箱12包括一具有多個硬碟151的儲存模組15,及分別電連接該監控主機11與該儲存模組15的一第一控制模組13、一第二控制模組14。
每一控制模組13、14利用通用輸入輸出接腳(General-Purpose Input/Output pins,GPIO pins)與另一控制模組14、13電連接,並具有一電連接該儲存模組15並具有監控、處理及判斷等功能的擴充單元(Expander)131、141,及一電連接該擴充單元131、141並儲存一插拔旗標(SWAP flag)133、143和一執行程式134、144的快閃記憶體132、142。其中,每一控制模組13、14的擴充單元131、141能支援串列附接式小型電腦介面(Serial Attached Small Computer System Interface,SAS),且每一控制模組13、14的快閃記憶體132、142所儲存的插拔旗標133、143預設處於一未插拔指示值,如邏輯0,可受控制變換成一插拔指示值,如邏輯1。
在本實施例中,該第一控制模組13、該第二控制模組14皆為一輸入輸出模組(Input/Output Module,IOM),且彼此互相備援(Redundant),並於該電腦系統1開機啟動時,兩者的該擴充單元131、該擴充單元141分 別操作在初始階段,其中一控制模組會利用其擴充單元來決定為主控模組,另一控制模組則會決定為從屬模組,並在決定之後各自改變操作於穩定階段。作為主控模組的該控制模組利用其擴充單元監控該機箱的狀態,例如控制該機箱的電源供應器的輸出電壓、控制該機箱的風扇轉速、監看該機箱內的溫度,以及監看該等硬碟的運作狀態,並傳送硬碟資料以回應該監控主機的詢問等等。作為從屬模組的該控制模組則能於原來的主控模組無法運作時,例如系統當機、損毀、或是發生熱插拔時,切換成新的主控模組。然而進一步有關主控模組及從屬模組的決定或切換機制並非本發明的重點所在,於此不再多作說明。
參閱圖2,以下詳述本發明判斷是否發生熱插拔的方法的各個步驟。
首先,在步驟A中,該第一控制模組13上電啟動,而進入一初始(initial)階段。
在步驟B中,每一控制模組13、14各自輸出一指示處於初始階段及穩定階段其中之一的狀態信號至另一控制模組14、13。詳細來說,該第一控制模組13的擴充單元131、該第二控制模組14的擴充單元141皆會操作在一初始階段及一穩定(stable)階段的其中一者,並且該第一控制模組13的擴充單元131、該第二控制模組14的擴充單元141會將指示所處階段的該狀態信號,經由該第一控制模組13、該第二控制模組14各自的該通用輸入輸出接腳,輸出至該第二控制模組14、該第一控制模組13,以予 該擴充單元141、該擴充單元131得知,其中,該狀態信號是變換於一初始邏輯值(如邏輯0)及一穩定邏輯值(如邏輯1)兩者之一。
在步驟C中,該第一控制模組13的擴充單元131判斷是否為一執行程式重置(reset)。在本實施例中,該第一控制模組13依據其擴充單元131的暫存器(圖未示出)所記錄的一執行程式重置值,來判斷是否為該執行程式重置。若判斷結果為是,即進入步驟D,若判斷結果為否,即進到步驟E。
在步驟D中,若步驟C中的判斷結果為是,則該第一控制模組13的擴充單元131判斷為發生該執行程式重置。於此需要說明的是,由於該第一控制模組13的擴充單元131與該第二控制模組14的擴充單元141在該執行程式重置時,皆會操作於該初始階段,因而會與發生電源重置造成的重新開機啟動、或是與發生自身熱插拔操作造成開機啟動的情形無法區別,因此,藉由於步驟C判斷是否發生該執行程式重置,能避免該第一控制模組13的擴充單元131作出誤判。
在步驟E中,若步驟C中的判斷結果為否,則該第一控制模組13的擴充單元131,根據該來自該第二控制模組14的擴充單元141的狀態信號所處為該初始邏輯值或是該穩定邏輯值的何者,來判斷該第二控制模組14的擴充單元141處於該初始階段或是該穩定階段。
在步驟F中,若於步驟E中判斷處於初始階 段,則該第一控制模組13判斷為一相關於重新上電啟動的電源重置。
在步驟G,若該第一控制模組13的擴充單元131於步驟E中判斷該狀態信號處於該穩定邏輯值,則判斷該第二控制模組14的擴充單元141處於該穩定階段,且判斷該第二控制模組14的擴充單元141發生一自身熱插拔操作。
在步驟H中,該第一控制模組13的擴充單元131將該快閃記憶體131所儲存的插拔旗標,從該未插拔指示值變換成為該插拔指示值。
在步驟I中,該第一控制模組13的擴充單元131發出一指示一組態改變的通知信號,且所指示的該組態改變可相關於或不相關於該自身熱插拔操作。
在步驟J中,該第一控制模組13的擴充單元131進入一穩定階段。
在步驟K中,該監控主機11接收來自該第一控制模組13的擴充單元131的通知信號,並傳送一詢問該組態改變的詢問信號。在此要補充的是,雖然該監控主機11於接收到該第一控制模組13發生該組態改變的通知信號時會傳送出該詢問信號,但是該監控主機11未接收該通知信號時,也會週期地主動傳送該詢問信號,來詢問該第一控制模組13和該第二控制模組14是否發生該組態改變,以獲取及監控該第一控制模組13和該第二控制模組14的運作情況。
在步驟L中,該第一控制模組13的擴充單元131接收該詢問信號,並輸出一具有該插拔旗標的插拔指示值的回報信號至該監控主機11,以將發生過該自身熱插拔操作的情形反映該監控主機11。
在此說明的是,雖然本實施例是以該第一控制模組13為例,說明其上電啟動時,判斷是否發生熱插拔的方法,然而該第二控制模組14亦同樣適用本方法,而不以本實施例所述為限。
綜上所述,本發明判斷是否發生熱插拔的方法藉由每一控制模組13、14上電啟動,而進入該初始階段時,先判斷是否經過該執行程式重置、該電源重置的情形,若排除為該執行程式重置、該電源重置,即根據該另一控制模組14、13的狀態信號是否處於該穩定階段,而能自我判斷是否發生過該自身熱插拔操作,以便將自身運作情況確實反映給監控主機11,故確實能達成本發明之目的。
惟以上所述者,僅為本發明之較佳實施例而已,當不能以此限定本發明實施之範圍,即大凡依本發明申請專利範圍及專利說明書內容所作之簡單的等效變化與修飾,皆仍屬本發明專利涵蓋之範圍內。
1‧‧‧電腦系統
11‧‧‧監控主機
12‧‧‧機箱
13‧‧‧第一控制模組
131‧‧‧擴充單元
132‧‧‧快閃記憶體
133‧‧‧插拔旗標
134‧‧‧執行程式
14‧‧‧第二控制模組
141‧‧‧擴充單元
142‧‧‧快閃記憶體
143‧‧‧插拔旗標
144‧‧‧執行程式
15‧‧‧儲存模組
151‧‧‧硬碟

Claims (9)

  1. 一種判斷是否發生熱插拔的方法,由一包括一第一控制模組及一第二控制模組的電腦系統執行,且包含:(A)該第一控制模組上電啟動,而進入一初始階段;(B)每一控制模組各自輸出一指示處於初始階段及穩定階段其中之一的狀態信號至另一控制模組;(E)該第一控制模組根據該狀態信號判斷該第二控制模組處於初始階段或是穩定階段;及(G)若步驟(E)判斷處於穩定階段,則該第一控制模組判斷發生一自身熱插拔操作。
  2. 如請求項1所述判斷是否發生熱插拔的方法,該第一及該第二控制模組分別以一通用輸入輸出接腳彼此電連接,且在步驟(B)中,該第一及該第二控制模組經由各自的該通用輸入輸出接腳,將指示所處階段的該狀態信號輸出。
  3. 如請求項1所述判斷是否發生熱插拔的方法,其中,該狀態信號變換於一初始邏輯值及一穩定邏輯值兩者之一,且在該步驟(E)中,該第一控制模組依據該狀態信號所處為初始邏輯值或是穩定邏輯值的何者,來判斷該第二控制模組所處為初始階段或是穩定階段。
  4. 如請求項1所述判斷是否發生熱插拔的方法,還包含:(F)若步驟(E)判斷處於初始階段,則該第一控制模組判斷為一相關於重新上電啟動的電源重置。
  5. 如請求項1所述判斷是否發生熱插拔的方法,該第一及該第二控制模組分別具有一儲存一預設處於一未插拔指示值的插拔旗標的快閃記憶體,還包含:(H)該第一控制模組變換該插拔旗標的未插拔指示值成一插拔指示值;(I)因應該插拔指示值,該第一控制模組發出一指示一組態改變的通知信號,且所指示的該組態改變可相關於或不相關於該自身熱插拔操作;及(J)該第一控制模組進入一穩定階段。
  6. 如請求項5所述判斷是否發生熱插拔的方法,該電腦系統更包括一電連接該第一及該第二控制模組的監控主機,且還包含:(K)該監控主機接收來自該第一控制模組的通知信號,並發出一詢問該組態改變的詢問信號;及(L)該第一控制模組接收該詢問信號,並發出一具有該插拔旗標的值的回報信號至該監控主機。
  7. 如請求項1所述判斷是否發生熱插拔的方法,該電腦系統更包括一電連接該第一及該第二控制模組的監控主機,該監控主機週期地傳送一詢問一組態改變的詢問信號,且所詢問的該組態改變可相關於或不相關於該自身熱插拔操作,藉以監控該第一和該第二控制模組的運作情況。
  8. 如請求項1所述判斷是否發生熱插拔的方法,還包含在該步驟(B)和該步驟(E)之間的步驟(C): (C)該第一控制模組判斷是否為一執行程式重置,若否,即進到步驟(E)。
  9. 如請求項8所述判斷是否發生熱插拔的方法,該第一及該第二控制模組分別記錄一執行程式重置值,且在該步驟(C)中,該第一控制模組依據其所記錄的執行程式重置值,來判斷是否為該執行程式重置。
TW104134389A 2015-10-20 2015-10-20 Method for detecting hot-swap occurrence TWI561975B (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
TW104134389A TWI561975B (en) 2015-10-20 2015-10-20 Method for detecting hot-swap occurrence

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
TW104134389A TWI561975B (en) 2015-10-20 2015-10-20 Method for detecting hot-swap occurrence

Publications (2)

Publication Number Publication Date
TWI561975B TWI561975B (en) 2016-12-11
TW201715394A true TW201715394A (zh) 2017-05-01

Family

ID=58227305

Family Applications (1)

Application Number Title Priority Date Filing Date
TW104134389A TWI561975B (en) 2015-10-20 2015-10-20 Method for detecting hot-swap occurrence

Country Status (1)

Country Link
TW (1) TWI561975B (zh)

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6282596B1 (en) * 1999-03-25 2001-08-28 International Business Machines Corporation Method and system for hot-plugging a processor into a data processing system
US7673090B2 (en) * 2001-12-19 2010-03-02 Intel Corporation Hot plug interface control method and apparatus
TW548537B (en) * 2002-01-14 2003-08-21 Accton Technology Corp Circuit module capable of conducting hot swap
TW200825720A (en) * 2006-12-07 2008-06-16 Inventec Corp Method for testing the dead man timer
TW201202944A (en) * 2010-07-14 2012-01-16 Inventec Corp Method for detecting pluggable storage apparatus and electronic apparatus
CN102130669B (zh) * 2011-01-13 2013-03-13 北京星网锐捷网络技术有限公司 一种热插拔模块状态检测方法、系统、装置及网络设备
CN104731741B (zh) * 2013-12-23 2019-03-19 研祥智能科技股份有限公司 热插拔的实现方法和系统

Also Published As

Publication number Publication date
TWI561975B (en) 2016-12-11

Similar Documents

Publication Publication Date Title
TWI631466B (zh) 機箱管理系統及機箱管理方法
TWI584196B (zh) 基本輸入輸出系統回復管理系統、電腦程式產品 以及基本輸入輸出系統回復方法
US7917664B2 (en) Storage apparatus, storage apparatus control method, and recording medium of storage apparatus control program
US10846159B2 (en) System and method for managing, resetting and diagnosing failures of a device management bus
WO2021027481A1 (zh) 故障处理方法、装置、计算机设备、存储介质及存储系统
EP3349118B1 (en) Bus hang detection and find out
US20140122753A1 (en) Electronic Device, Management Method Thereof, and Rack Serving System
TWI512490B (zh) 擷取控制台訊息的系統及其方法及非暫態電腦可讀媒體
TW201227341A (en) Remote management systems and methods for servers, and computer program products thereof
US10324888B2 (en) Verifying a communication bus connection to a peripheral device
TW202137034A (zh) 自動偵測及警示計算裝置組件變更的方法和系統
CN112835519B (zh) 一种数据读取方法、装置、电子设备及存储介质
US20170139605A1 (en) Control device and control method
JP2016536735A (ja) ハードディスクおよび管理方法
JP2015114873A (ja) 情報処理装置および監視方法
TWI567539B (zh) 備用電力通訊
US11228518B2 (en) Systems and methods for extended support of deprecated products
WO2017072904A1 (ja) 計算機システム、及び、障害検知方法
TWI687790B (zh) 可偵測熱插拔次數之電子系統
US10146720B2 (en) Flexible configuration server system
TW201715394A (zh) 判斷是否發生熱插拔的方法
JP2017041110A (ja) マルチコンピュータシステム,管理装置および管理プログラム
JP2015053555A (ja) データ転送装置、およびデータ転送方法
US11074144B2 (en) Active firmware replacement in storage system and in storage controller, and computer-readable recording medium having stored therein program for active firmware replacement in controlling storage
US10977107B2 (en) Apparatus and method to control a storage device