TW202211020A - 儲存設備及其控制系統 - Google Patents

儲存設備及其控制系統 Download PDF

Info

Publication number
TW202211020A
TW202211020A TW109130874A TW109130874A TW202211020A TW 202211020 A TW202211020 A TW 202211020A TW 109130874 A TW109130874 A TW 109130874A TW 109130874 A TW109130874 A TW 109130874A TW 202211020 A TW202211020 A TW 202211020A
Authority
TW
Taiwan
Prior art keywords
control module
mode
control
operate
operating
Prior art date
Application number
TW109130874A
Other languages
English (en)
Other versions
TWI789627B (zh
Inventor
王俊傑
王振東
曾彥綸
Original Assignee
神雲科技股份有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 神雲科技股份有限公司 filed Critical 神雲科技股份有限公司
Priority to TW109130874A priority Critical patent/TWI789627B/zh
Priority to US17/467,052 priority patent/US11513697B2/en
Publication of TW202211020A publication Critical patent/TW202211020A/zh
Application granted granted Critical
Publication of TWI789627B publication Critical patent/TWI789627B/zh

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/0614Improving the reliability of storage systems
    • G06F3/0619Improving the reliability of storage systems in relation to data integrity, e.g. data losses, bit errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2053Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
    • G06F11/2089Redundant storage control functionality
    • G06F11/2092Techniques of failing over between control units
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0727Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a storage system, e.g. in a DASD or network based storage system
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0751Error or fault detection not based on redundancy
    • G06F11/0763Error or fault detection not based on redundancy by bit configuration check, e.g. of formats or tags
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0793Remedial or corrective actions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/061Improving I/O performance
    • G06F3/0613Improving I/O performance in relation to throughput
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/062Securing storage systems
    • G06F3/0622Securing storage systems in relation to access
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0629Configuration or reconfiguration of storage systems
    • G06F3/0632Configuration or reconfiguration of storage systems by initialisation or re-initialisation of storage systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0655Vertical data movement, i.e. input-output transfer; data movement between one or more hosts and one or more storage devices
    • G06F3/0659Command handling arrangements, e.g. command buffers, queues, command scheduling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/0671In-line storage system
    • G06F3/0673Single storage device

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Quality & Reliability (AREA)
  • Computer Security & Cryptography (AREA)
  • Hardware Redundancy (AREA)
  • Selective Calling Equipment (AREA)

Abstract

一種儲存設備包含一控制系統,該控制系統包括兩個主板、兩個控制模組、及兩個非揮發性記憶體。該兩個控制模組分別自該兩個非揮發性記憶體讀取一韌體程式碼以執行一韌體,以分別操作在一主控模式及一被控模式。當操作在該主控模式的該控制模組在運作過程中發生異常時,操作在該被控模式的該控制模組轉換為操作在該主控模式,並控制發生異常的該控制模組轉換為操作在一還原模式,且將對應的該揮發性記憶體所儲存的該韌體程式碼傳送至發生異常的該控制模組,以更新儲存在對應的該非揮發性記憶體。

Description

儲存設備及其控制系統
本發明是有關於一種儲存設備及其控制系統,特別是指一種具備自動修復與備援功能的儲存設備及其控制系統。
現有的企業用(Enterprise)儲存系統是屬於一種高可靠性(High availability,HA)系統,並包含一電源單元、一風扇單元、兩個主板、兩個控制模組(Input/Output module,IOM)、及至少一硬碟。該兩個控制模組分別設置在該兩個主板上,並用於監控與管理每一該硬碟、該電源單元、該風扇單元,且在上電後分別操作在一主控(Active)模式及一被控(Passive)模式,以作為一種備援系統。每一該控制模組會進行初始化以自對應的一非揮發性記憶體讀取一韌體程式碼(如Image)以執行一韌體(Firmware),而當操作在該主控模式的該控制模組發生異常時,其中一個主要的原因就是對應的該韌體發生錯誤。
為解決該韌體錯誤的問題,一種習知技術的簡單作法是將對應的該主板作更換,但須耗費不少的人力、金錢與時間。而習知技術的另一種作法是在每一該主板上,設置對應該控制模組的兩個非揮發性記憶體,並在該兩個非揮發性記憶體都儲存一樣的該韌體程式碼,即其中一者是該控制模組在上電後預設要讀取的,且其中另一者是作為後備(Backup)的,或者,其中一者儲存更新版本的該韌體程式碼,而其中另一者儲存出廠時可運作版本的該韌體程式碼。舉例來說,當操作在該主控模式的該控制模組所執行的該韌體發生錯誤時,該控制模組再讀取作為後備的該韌體程式碼,以正常運作,然而這樣的做法需要在每一該主板上,設置對應該控制模組的兩個非揮發性記憶體,不但浪費非揮發記憶體的成本,也會占用電路板的空間。再者,另一種作法是:當操作在該主控模式的該控制模組自該非揮發性記憶體所讀取並執行的該韌體程式碼導致該控制模組發生異常時,則由另一個該控制模組由操作在該被控模式轉換為該主控模式,以維持該儲存系統的正常運作。
此時,該儲存系統雖仍正常運作,但導致該控制模組發生異常的該非揮發性記憶體上的韌體仍然有待工程人員或使用者手動的作進一步地重新燒錄可正常運作的其他版本的該韌體程式碼。因此,對於企業用儲存系統是否存有其他韌體發生異常的處理辦法便成為一個待解決的問題。
因此,本發明的目的,即在提供一種具備自動修復與備援功能的儲存設備及其控制系統。
於是,本發明之一觀點,提供一種儲存設備的控制系統,適用於一電源單元、一風扇單元、及至少一硬碟,並包含兩個主板、兩個控制模組、及兩個非揮發性記憶體。該兩個控制模組分別設置在該兩個主板上,並互相電連接且都電連接該電源單元、該風扇單元、及該至少一硬碟,以用於監控與管理該電源單元、該風扇單元、及該至少一硬碟。該兩個非揮發性記憶體分別設置在該兩個主板上,並分別電連接該兩個控制模組,且都儲存一韌體程式碼。
其中,該兩個控制模組分別進行初始化以分別自該兩個非揮發性記憶體讀取該韌體程式碼以執行對應的一韌體,使得該兩個控制模組分別操作在一主控模式及一被控模式。
當操作在該主控模式的該控制模組發生異常時,操作在該被控模式的該控制模組轉換為操作在該主控模式,並控制原本操作在該主控模式的該控制模組轉換為操作在一還原模式,且將對應操作在該主控模式的該控制模組所對應的該揮發性記憶體所儲存的該韌體程式碼傳送至操作在該還原模式的該控制模組,以更新儲存在對應操作在該還原模式的該控制模組所對應的該非揮發性記憶體。
在一些實施態樣中,其中,該等控制模組之其中每一者是藉由一健康信號以使得其中另一者判斷其中該者是否發生異常。
在一些實施態樣中,其中,每一該控制模組包括用以輸出該健康信號,及用以接收對方所輸出的該健康信號的一第一匯流排。當該等控制模組之其中任一者運作正常時,對應輸出的該健康信號的邏輯值會在邏輯1及邏輯0之間跳動。而當該等控制模組之其中任一者運作異常時,對應輸出的該健康信號的邏輯值會保持在邏輯0或邏輯1。
在另一些實施態樣中,其中,每一該控制模組是藉由一第一匯流排來輸出該健康信號,並都包括一暫存器。當該等控制模組之其中一者運作正常時,利用對應的該健康信號隨時間改變其中另一者的該暫存器的數值。而當該等控制模組之其中一者運作異常時,無法利用對應的該健康信號隨時間改變其中另一者的該暫存器的數值。
在另一些實施態樣中,其中,每一該控制模組包括用以輸出一還原信號,及用以接收對方所輸出的另一還原信號的一第二匯流排。每一該控制模組根據所接收到的該還原信號以決定是否操作在該還原模式。
在另一些實施態樣中,其中,每一該控制模組包括用以傳送該韌體程式碼,及用以接收對方所傳送的該韌體程式碼的一第三匯流排。
在另一些實施態樣中,其中,該等控制模組分別被定義為一第一控制模組及一第二控制模組,該第一控制模組預設為操作在該主控模式,該第二控制模組預設為操作在該被控模式。當該第一控制模組發生異常而改為操作在該還原模式,並接收來自該第二控制模組的該韌體程式碼以更新儲存在對應的該非揮發性記憶體,進而重新執行該韌體且運作正常時,該第一控制模組改為操作在該主控模式且該第二控制模組改為操作在該被控模式。
本發明之另一觀點,提供一種儲存設備,包含一電源單元、一風扇單元、至少一硬碟、及一控制系統。該電源單元用於提供運作的電力。該風扇單元用於提供散熱。該至少一硬碟用於儲存資料。該控制系統包括兩個主板、兩個控制模組、及兩個非揮發性記憶體。
該兩個控制模組分別設置在該兩個主板上,並互相電連接且都電連接該電源單元、該風扇單元、及該至少一硬碟,以用於監控與管理該電源單元、該風扇單元、及該至少一硬碟。該兩個非揮發性記憶體分別設置在該兩個主板上,並分別電連接該兩個控制模組,且都儲存一韌體程式碼。
其中,該兩個控制模組分別進行初始化以分別自該兩個非揮發性記憶體讀取該韌體程式碼以執行對應的一韌體,使得該兩個控制模組分別操作在一主控模式及一被控模式。
當操作在該主控模式的該控制模組發生異常時,操作在該被控模式的該控制模組轉換為操作在該主控模式,並控制原本操作在該主控模式的該控制模組轉換為操作在一還原模式,且將對應操作在該主控模式的該揮發性記憶體所儲存的該韌體程式碼傳送至操作在該還原模式的該控制模組,以更新儲存在對應操作在該還原模式的該非揮發性記憶體。
在一些實施態樣中,其中,該等控制模組之其中每一者是藉由一健康信號以使得其中另一者判斷其中該者是否發生異常。
在另一些實施態樣中,其中,每一該控制模組包括用以輸出一還原信號,及用以接收對方所輸出的另一還原信號的一第一匯流排。每一該控制模組根據所接收到的該還原信號以決定是否操作在該還原模式。
本發明的功效在於:當操作在該主控模式的該控制模組在開機過程中發生異常時,藉由操作在該被控模式的該控制模組轉換為操作在該主控模式,並控制發生異常的該控制模組轉換為操作在一還原模式,且將對應的該揮發性記憶體所儲存的該韌體程式碼傳送至操發生異常的該控制模組,以更新儲存在對應的該非揮發性記憶體,進而能夠修復該非揮發性記憶體所儲存的該韌體程式碼的異常情形。
在本發明被詳細描述之前,應當注意在以下的說明內容中,類似的元件是以相同的編號來表示。
參閱圖1,本發明儲存設備之一實施例,包含一背板6、一電源單元7、一風扇單元8、一儲存單元9、及一控制系統1。該儲存設備例如是一個JBOD (Just A Bunch Of Disks);該電源單元7例如是一電源供應器,以用於提供該儲存設備運作所需要的電力;該風扇單元8例如包含多個風扇,以用於對該儲存設備提供散熱的能力;該儲存單元9例如包含至少一硬碟,以用於儲存資料;但都不以此為限。
該控制系統1包括一第一主板21、一第二主板22、一第一非揮發性記憶體31、一第二非揮發性記憶體32、一第一控制模組41、及一第二控制模組42。該第一主板21及該第二主板22例如是插設在該背板6上。該第一非揮發性記憶體31及該第二非揮發性記憶體32分別設置在該第一主板21及該第二主板22上,並分別電連接該第一控制模組41及該第二控制模組42,且都儲存一韌體程式碼。
該第一控制模組(Input/Output module,IOM)41及該第二控制模組42例如都是一積體電路晶片,且分別設置在該第一主板21及該第二主板22上,並互相電連接且都電連接該電源單元7、該風扇單元8、及該儲存單元9,以用於監控與管理該電源單元7、該風扇單元8、及該儲存單元9。舉例來說,用於監控與管理該電源供應器的相關電力供應狀態、該等風扇的轉速與對應的環境溫度、及每一該硬碟的相關運作狀態。
該第一控制模組41及該第二控制模組42藉由一第一匯流排411、一第二匯流排412、及一第三匯流排413經由該背板6形成電連接。而圖1為簡單說明起見,並未繪出實際的電連接形態,該第一匯流排411、該第二匯流排412、及該第三匯流排413可以是經由該背板6直接電連接或是間接電耦接該第一控制模組41及該第二控制模組42。
當該儲存設備上電後,也就是該控制系統1在上電後,該第一控制模組41及該第二控制模組42分別進行初始化以分別自該第一非揮發性記憶體31及該第二非揮發性記憶體32讀取該韌體程式碼以執行一韌體(Firmware),使得該第一控制模組41及該第二控制模組42分別操作在一主控(Active)模式及一被控(Passive)模式。舉例來說,該第一控制模組41操作在該主控模式,該第二控制模組42操作在該被控模式。
該第一控制模組41(或該第二控制模組42)是藉由該第一匯流排411輸出一健康信號至該第二控制模組42,且當該第一控制模組41(或該第二控制模組42)運作正常時,對應輸出的該健康信號的邏輯值會在邏輯1及邏輯0之間跳動,而當該第一控制模組41(或該第二控制模組42)運作異常時,對應輸出的該健康信號的邏輯值會保持在邏輯0或邏輯1。因此,該第二控制模組42(或該第一控制模組41)能夠藉由所接收的該健康信號判斷該第一控制模組41(或該第二控制模組42)是否發生異常。
在本實施例中,該第一匯流排411例如是該第一控制模組41及該第二控制模組42各自的兩個通用型輸入輸出(General-purpose input/output,GPIO)接腳之間的連接線所組成的匯流排,用來傳輸及接收該健康信號,該第一匯流排411也可以是該第一控制模組41及該第二控制模組42之間的一積體電路(Inter-Integrated Circuit,I2C)匯流排來傳輸及接收該健康信號。而另外在其他的實施例中,該第一控制模組41及該第二控制模組42都還包括一暫存器。當該第一控制模組41(或該第二控制模組42)運作正常時,利用對應的該健康信號隨時間改變該第二控制模組42(或該第一控制模組41)的該暫存器的數值。而當該第一控制模組41(或該第二控制模組42)運作異常時,無法利用對應的該健康信號隨時間改變該第二控制模組42(或該第一控制模組41)的該暫存器的數值,使得該第二控制模組42(或該第一控制模組41)能夠藉由根據對應的該暫存器的數值變化,來判斷該第一控制模組41(或該第二控制模組42)是否發生異常。
當操作在該主控模式的該第一控制模組41在運作過程中發生異常時,操作在該被控模式的該第二控制模組42根據判斷而轉換為操作在該主控模式,並控制原本操作在該主控模式的該第一控制模組41轉換為操作在一還原模式。更詳細地說,該第一控制模組41(或該第二控制模組42)藉由該第二匯流排412輸出該還原信號至該第二控制模組42(或該第一控制模組41)。該第一控制模組41(或該第二控制模組42)根據所接收到的該還原信號以決定是否操作在該還原模式,例如是根據該還原信號的邏輯值。在本實施例中,該第二匯流排412例如是該第一控制模組41及該第二控制模組42的兩個通用型輸入輸出接腳之間的連接線或是該第一控制模組41及該第二控制模組42之間的另一個該積體電路(I2C)匯流排,但不在此限。
接著,操作在該主控模式的該第二控制模組42將對應的該揮發性記憶體32所儲存的該韌體程式碼傳送至操作在該還原模式的該第一控制模組41,使得該第一控制模組41在該還原模式下,將所接收的該韌體程式碼更新(即重新)儲存在對應的該非揮發性記憶體31,並重新載入更新後的該韌體程式碼,以再次執行該韌體,而轉換為操作在該被控模式,進而能夠正常運作。
在本實施例中,該第一控制模組41(或該第二控制模組42)是藉由該第三匯流排413傳送或接收該韌體程式碼。在本實施例中,該第三匯流排413是另一個該積體電路(I2C)匯流排或智慧型平台管理介面(Intelligent Platform Management Interface,IPMI)匯流排,但不在此限。此外,在其他的實施例中,該第一控制模組41也可以是預設為操作在該主控模式,且該第二控制模組42是預設為操作在該被控模式。當該第一控制模組41發生異常而改為操作在該還原模式,並接收來自該第二控制模組42的該韌體程式碼以更新儲存在對應的該非揮發性記憶體,進而重新執行該韌體且運作正常時,該第一控制模組41會再改為操作在該主控模式,且因應該第一控制模組41發生異常而改為操作在該主控模式的該第二控制模組42同時再改為操作在預設的該被控模式。
要特別強調的是:當該第一控制模組41或該第二控制模組42發生異常時,運作正常的該第一控制模組41或該第二控制模組42是傳送「本身正在執行的」該韌體所對應的該韌體程式碼。此外,兩個主板(即該第一主板21及該第二主板22)都僅需要分別設置用來儲存本身正在執行的該韌體所對應的該韌體程式碼的單一個非揮發性記憶體(即該第一非揮發性記憶體31及該第二非揮發性記憶體32),且僅需要儲存一份韌體程式碼於該單一個非揮發性記憶體,不但可提供兩個主板上的控制模組(即該第一控制模組41及該第二控制模組42)執行,還可達到互相修復韌體的功能。
另外要特別補充說明的是:操作在該主控模式的該第一控制模組41及操作在該被控模式的該第二控制模組42都會監控該電源單元7、該風扇單元8、及該儲存單元9並分別記錄儲存監控所得的監控資訊,以能夠在其中一者運作異常時,即時地切換該主控模式/該被控模式並即時提供備援功能。但只有操作在該主控模式的該第一控制模組41會根據監控所獲得的該監控資訊來管理(即控制)該電源單元7、該風扇單元8、及該儲存單元9。
此外,要特別強調的是:操作在該主控模式的該第一控制模組41也會監控該第二控制模組42的該健康訊號。舉例來說,當該第一控制模組41偵測到該第二控制模組42運作異常時,也會傳送該還原訊號到該第二控制模組42,並接著傳送該第一控制模組41本身正在執行的該韌體所對應的該韌體程式碼至該第二控制模組42。該第二控制模組42於接收到由該第一控制模組41所傳送的該韌體程式碼後,以所接收的該韌體程式碼更新自身對應的該第二非揮發記憶體32內的該韌體程式碼,並於韌體更新完成後再次執行更新後的該韌體,以根據該第二主板22的一辨識碼由該還原模式切換為該被控模式,其中,由於該第一控制模組41已經是操作在該主控模式了,所以當該第一控制模組41監控到該第二控制模組42運作異常時,該第一控制模組41不轉換為操作在該被控模式,而仍然持續操作在該主控模式。
綜上所述,當操作在該主控模式的該第一控制模組41(或該第二控制模組42)在運作過程中發生異常時,藉由操作在該被控模式的該第二控制模組42(或該第一控制模組41)轉換為操作在該主控模式,並控制發生異常的該第一控制模組41(或該第二控制模組42)轉換為操作在該還原模式,且將對應的該揮發性記憶體所儲存的該韌體程式碼傳送至發生異常的該第一控制模組41(或該第二控制模組42),以供發生異常的該第一控制模組41(或該第二控制模組42)於該還原模式下,將所接收到的該韌體程式碼自動更新儲存在對應的該第一非揮發性記憶體31(或該第二非揮發性記憶體32),進而使該發生異常的該第一控制模組41(或該第二控制模組42)因為處於該還原模式,而於儲存完成所接收的該韌體程式碼後自動進行自身的重啟而載入執行所儲存的該韌體程式碼所對應的韌體而轉換操作於原先預設的模式,進而能夠修復該第一非揮發性記憶體31(或該第二非揮發性記憶體32)所儲存的該韌體程式碼的異常情形,故確實能達成本發明的目的。
惟以上所述者,僅為本發明的實施例而已,當不能以此限定本發明實施的範圍,凡是依本發明申請專利範圍及專利說明書內容所作的簡單的等效變化與修飾,皆仍屬本發明專利涵蓋的範圍內。
1:控制系統 21:第一主板 22:第二主板 31:第一非揮發性記憶體 32:第二非揮發性記憶體 41:第一控制模組 411:第一匯流排 412:第二匯流排 413:第三匯流排 42:第二控制模組 6:背板 7:電源單元 8:風扇單元 9:儲存單元
本發明的其他的特徵及功效,將於參照圖式的實施方式中清楚地呈現,其中: 圖1是一方塊圖,說明本發明儲存設備的一實施例。
1:控制系統
21:第一主板
22:第二主板
31:第一非揮發性記憶體
32:第二非揮發性記憶體
41:第一控制模組
411:第一匯流排
412:第二匯流排
413:第三匯流排
42:第二控制模組
6:背板
7:電源單元
8:風扇單元
9:儲存單元

Claims (10)

  1. 一種儲存設備的控制系統,適用於一電源單元、一風扇單元、及至少一硬碟,並包含: 兩個主板; 兩個控制模組,分別設置在該兩個主板上,並互相電連接且都電連接該電源單元、該風扇單元、及該至少一硬碟,以用於監控與管理該電源單元、該風扇單元、及該至少一硬碟;及 兩個非揮發性記憶體,分別設置在該兩個主板上,並分別電連接該兩個控制模組,且都儲存一韌體程式碼, 其中,該兩個控制模組分別進行初始化以分別自該兩個非揮發性記憶體讀取該韌體程式碼以執行對應的一韌體,使得該兩個控制模組分別操作在一主控模式及一被控模式, 當操作在該主控模式的該控制模組發生異常時,操作在該被控模式的該控制模組轉換為操作在該主控模式,並控制原本操作在該主控模式的該控制模組轉換為操作在一還原模式,且將對應操作在該主控模式的該控制模組的該揮發性記憶體所儲存的該韌體程式碼傳送至操作在該還原模式的該控制模組,以更新儲存在對應操作在該還原模式的該控制模組的該非揮發性記憶體。
  2. 如請求項1所述的儲存設備的控制系統,其中,該等控制模組之其中每一者是藉由一健康信號以使得其中另一者判斷其中該者是否發生異常。
  3. 如請求項2所述的儲存設備的控制系統,其中,每一該控制模組包括用以輸出該健康信號,及用以接收對方所輸出的該健康信號的一第一匯流排,當該等控制模組之其中任一者運作正常時,對應輸出的該健康信號的邏輯值會在邏輯1及邏輯0之間跳動,而當該等控制模組之其中任一者運作異常時,對應輸出的該健康信號的邏輯值會保持在邏輯0或邏輯1。
  4. 如請求項2所述的儲存設備的控制系統,其中,每一該控制模組是藉由一第一匯流排來輸出該健康信號,並都包括一暫存器,當該等控制模組之其中一者運作正常時,利用對應的該健康信號隨時間改變其中另一者的該暫存器的數值,而當該等控制模組之其中一者運作異常時,無法利用對應的該健康信號隨時間改變其中另一者的該暫存器的數值。
  5. 如請求項1所述的儲存設備的控制系統,其中,每一該控制模組包括用以輸出一還原信號,及用以接收對方所輸出的另一還原信號的一第二匯流排,每一該控制模組根據所接收到的該還原信號以決定是否操作在該還原模式。
  6. 如請求項1所述的儲存設備的控制系統,其中,每一該控制模組包括用以傳送該韌體程式碼,及用以接收對方所傳送的該韌體程式碼的一第三匯流排。
  7. 如請求項1所述的儲存設備的控制系統,其中,該等控制模組分別被定義為一第一控制模組及一第二控制模組,該第一控制模組預設為操作在該主控模式,該第二控制模組預設為操作在該被控模式,當該第一控制模組發生異常而改為操作在該還原模式,並接收來自該第二控制模組的該韌體程式碼以更新儲存在對應的該非揮發性記憶體,進而重新執行該韌體且運作正常時,該第一控制模組改為操作在該主控模式且該第二控制模組改為操作在該被控模式。
  8. 一種儲存設備,包含: 一電源單元,用於提供運作的電力; 一風扇單元,用於提供散熱; 至少一硬碟,用於儲存資料;及 一控制系統,包括: 兩個主板; 兩個控制模組,分別設置在該兩個主板上,並互相電連接且都電連接該電源單元、該風扇單元、及該至少一硬碟,以用於監控與管理該電源單元、該風扇單元、及該至少一硬碟;及 兩個非揮發性記憶體,分別設置在該兩個主板上,並分別電連接該兩個控制模組,且都儲存一韌體程式碼, 其中,該兩個控制模組分別進行初始化以分別自該兩個非揮發性記憶體讀取該韌體程式碼以執行對應的一韌體,使得該兩個控制模組分別操作在一主控模式及一被控模式, 當操作在該主控模式的該控制模組發生異常時,操作在該被控模式的該控制模組轉換為操作在該主控模式,並控制原本操作在該主控模式的該控制模組轉換為操作在一還原模式,且將對應操作在該主控模式的該揮發性記憶體所儲存的該韌體程式碼傳送至操作在該還原模式的該控制模組,以更新儲存在對應操作在該還原模式的該非揮發性記憶體。
  9. 如請求項8所述的儲存設備,其中,該等控制模組之其中每一者是藉由一健康信號以使得其中另一者判斷其中該者是否發生異常。
  10. 如請求項8所述的儲存設備,其中,每一該控制模組包括用以輸出一還原信號,及用以接收對方所輸出的另一還原信號的一第一匯流排,每一該控制模組根據所接收到的該還原信號以決定是否操作在該還原模式。
TW109130874A 2020-09-09 2020-09-09 儲存設備及其控制系統 TWI789627B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
TW109130874A TWI789627B (zh) 2020-09-09 2020-09-09 儲存設備及其控制系統
US17/467,052 US11513697B2 (en) 2020-09-09 2021-09-03 Storage apparatus and control system for the same

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
TW109130874A TWI789627B (zh) 2020-09-09 2020-09-09 儲存設備及其控制系統

Publications (2)

Publication Number Publication Date
TW202211020A true TW202211020A (zh) 2022-03-16
TWI789627B TWI789627B (zh) 2023-01-11

Family

ID=80469786

Family Applications (1)

Application Number Title Priority Date Filing Date
TW109130874A TWI789627B (zh) 2020-09-09 2020-09-09 儲存設備及其控制系統

Country Status (2)

Country Link
US (1) US11513697B2 (zh)
TW (1) TWI789627B (zh)

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6681339B2 (en) * 2001-01-16 2004-01-20 International Business Machines Corporation System and method for efficient failover/failback techniques for fault-tolerant data storage system
JP3714613B2 (ja) * 2001-12-12 2005-11-09 インターナショナル・ビジネス・マシーンズ・コーポレーション 記憶装置、該記憶装置を含む情報処理装置および情報記憶システムのリカバリ方法
TW200947305A (en) * 2008-05-09 2009-11-16 Hon Hai Prec Ind Co Ltd System with firmware and method thereof
US8856776B2 (en) * 2009-02-05 2014-10-07 International Business Machines Corporation Updating firmware without disrupting service
CN102455950A (zh) * 2010-10-28 2012-05-16 鸿富锦精密工业(深圳)有限公司 基板管理控制器的韧体恢复系统及方法
TW201301133A (zh) * 2011-06-29 2013-01-01 Universal Scient Ind Shanghai 可修復韌體的用戶端設備及其韌體修復方法
US9575911B2 (en) * 2014-04-07 2017-02-21 Nxp Usa, Inc. Interrupt controller and a method of controlling processing of interrupt requests by a plurality of processing units
JP6435842B2 (ja) * 2014-12-17 2018-12-12 富士通株式会社 ストレージ制御装置及びストレージ制御プログラム
US10055296B2 (en) * 2015-10-30 2018-08-21 Quanta Computer Inc. System and method for selective BIOS restoration
TWI675296B (zh) * 2018-07-25 2019-10-21 神雲科技股份有限公司 備援方法及備援系統

Also Published As

Publication number Publication date
US11513697B2 (en) 2022-11-29
TWI789627B (zh) 2023-01-11
US20220075533A1 (en) 2022-03-10

Similar Documents

Publication Publication Date Title
TWI595364B (zh) 自動修復映像檔的方法及伺服器系統
US10846159B2 (en) System and method for managing, resetting and diagnosing failures of a device management bus
CN103324495A (zh) 数据中心服务器开机管理方法及系统
TW201301134A (zh) 韌體更新系統及方法
TWI576682B (zh) 具有多機櫃管理模組的機櫃及其韌體更新方法
CN110750309B (zh) 可远程控制电子设备的系统及方法
TW201913369A (zh) 具有雙韌體儲存空間之伺服器及其韌體更新方法
US20200293306A1 (en) Off-board flash memory
CN112825011A (zh) PCIe设备的上下电控制方法以及系统
CN112181468A (zh) 一种cpld更新方法、服务器及计算机可读存储介质
CN103475514B (zh) 无bmc的节点、集群系统及bios修复和升级方法
TW202114376A (zh) 可遠端控制電子設備的系統及方法
CN218824636U (zh) 一种用于服务器硬盘背板的电源检测装置
TW201942755A (zh) 電子裝置及其操作方法
TWI789627B (zh) 儲存設備及其控制系統
CN111158963A (zh) 一种服务器固件冗余启动方法和服务器
CN109684153B (zh) 具有双韧体储存空间的服务器及其韧体更新方法
TWI753606B (zh) 主從互換式電源供應裝置及其主機、主從互換式電源供應方法及其電腦可讀取記錄媒體
US20130144457A1 (en) Server system for updating heat dissipation solution
CN114253763A (zh) 储存设备及其控制系统
CN114356062B (zh) 服务器的电源控制系统及其相关电源控制方法
CN115098324A (zh) 硬盘维护方法、装置、设备和存储介质
TW201913363A (zh) Bios切換裝置
WO2023010251A1 (zh) 显示控制方法、装置、电子设备及存储介质
WO2020011255A1 (zh) 单板、背板式交换机以及单板上下电的方法