TW201643740A - 用來管理一儲存系統之方法與裝置 - Google Patents

用來管理一儲存系統之方法與裝置 Download PDF

Info

Publication number
TW201643740A
TW201643740A TW104118454A TW104118454A TW201643740A TW 201643740 A TW201643740 A TW 201643740A TW 104118454 A TW104118454 A TW 104118454A TW 104118454 A TW104118454 A TW 104118454A TW 201643740 A TW201643740 A TW 201643740A
Authority
TW
Taiwan
Prior art keywords
group
extended control
management
management modules
control circuits
Prior art date
Application number
TW104118454A
Other languages
English (en)
Other versions
TWI560558B (en
Inventor
黃奕展
Original Assignee
群暉科技股份有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 群暉科技股份有限公司 filed Critical 群暉科技股份有限公司
Priority to TW104118454A priority Critical patent/TWI560558B/zh
Priority to CN201610004537.4A priority patent/CN106250284B/zh
Priority to US15/133,247 priority patent/US9858135B2/en
Priority to EP16170519.9A priority patent/EP3104555B1/en
Application granted granted Critical
Publication of TWI560558B publication Critical patent/TWI560558B/zh
Publication of TW201643740A publication Critical patent/TW201643740A/zh

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3034Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a storage system, e.g. DASD based or network based
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0727Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a storage system, e.g. in a DASD or network based storage system
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0751Error or fault detection not based on redundancy
    • G06F11/0754Error or fault detection not based on redundancy by exceeding limits
    • G06F11/0757Error or fault detection not based on redundancy by exceeding limits by exceeding a time limit, i.e. time-out, e.g. watchdogs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/079Root cause analysis, i.e. error or fault diagnosis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/0614Improving the reliability of storage systems
    • G06F3/0619Improving the reliability of storage systems in relation to data integrity, e.g. data losses, bit errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0653Monitoring storage devices or systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/0671In-line storage system
    • G06F3/0683Plurality of storage devices
    • G06F3/0689Disk arrays, e.g. RAID, JBOD
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0805Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability
    • H04L43/0817Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability by checking functioning
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/10Active monitoring, e.g. heartbeat, ping or trace-route
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2002Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where interconnections or communication control functionality are redundant
    • G06F11/2007Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where interconnections or communication control functionality are redundant using redundant communication media
    • G06F11/201Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where interconnections or communication control functionality are redundant using redundant communication media between storage system components
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2053Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
    • G06F11/2089Redundant storage control functionality
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1097Protocols in which an application is distributed across nodes in the network for distributed storage of data in networks, e.g. transport arrangements for network file system [NFS], storage area networks [SAN] or network attached storage [NAS]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Environmental & Geological Engineering (AREA)
  • General Health & Medical Sciences (AREA)
  • Cardiology (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • Computer Security & Cryptography (AREA)
  • Mathematical Physics (AREA)
  • Debugging And Monitoring (AREA)
  • Measuring And Recording Apparatus For Diagnosis (AREA)

Abstract

本發明提供一種用來管理一儲存系統之方法與裝置,該方法包含:於該儲存系統中之一第一擴展模組中之一第一組擴展控制電路之間提供至少一心跳監控路徑,以供為該儲存系統中之一組管理模組傳輸複數個心跳監控訊號中之至少一者,其中該第一擴展模組係用來安裝複數個共享儲存裝置中之一第一組共享儲存裝置,以及該第一組共享儲存裝置中之每一共享儲存裝置係分別耦接至該第一組擴展控制電路;以及依據該複數個心跳監控訊號進行該組管理模組之心跳監控,以供該組管理模組中之至少一者對該複數個共享儲存裝置進行高可用性管理。

Description

用來管理一儲存系統之方法與裝置
本發明係有關於高可用性管理(High Availability Management, HA Management),諸如採用序列式小型電腦系統介面(Serial Attached Small Computer System Interface,Serial Attached SCSI,可簡稱為「SAS」)技術來實施之資料儲存系統的高可用性管理,尤指一種用來管理一儲存系統之方法與相關裝置。
在網路服務已成為許多人每日生活中的一部分之際,各種問題諸如元件故障、人為過失或系統當機…等,可能造成伺服器故障(Malfunction)、及/或導致服務中斷。於是,企業營運的成本可能增加。
依據相關技術,一傳統的高可用性(High Availability, HA)架構或許能保持某些類型的網路服務不間斷。然而,可能產生額外的問題諸如一些副作用。例如:該傳統的高可用性架構中之兩個傳統的伺服器可能需要透過網路彼此監控對方。當發生網路中斷、或網路不穩定時,這些監控運作可能會造成錯誤的判斷,使得該傳統的高可用性架構錯誤地運作。又例如:為了讓該傳統的高可用性架構中之兩個傳統的伺服器彼此監控對方,可能需要設置額外的伺服器,以供進行該些監控運作。於是,相關成本對應地增加了。
由以上可知,相關技術無法在不造成額外的問題(諸如上述之副作用)的狀況下,妥善地解決既有的問題。因此,需要一種新穎的方法及相關的架構,以在較少副作用、或不造成副作用的狀況下,妥善地解決既有的問題。
本發明之目的之一在於提供一種用來管理一儲存系統之方法與相關裝置,以解決上述問題。
本發明之另一目的在於提供一種用來管理一儲存系統之方法與相關裝置,以減少該儲存系統的故障(Malfunction)之機會。
本發明之另一目的在於提供一種用來管理一儲存系統之方法與相關裝置,以妥善地控制一高可用性叢集(High Availability Cluster, HA Cluster)正常運作。
本發明之至少一較佳實施例中提供一種用來管理一儲存系統之方法,其中該儲存系統包含複數個共享儲存裝置。該方法包含:於該儲存系統中之一第一擴展模組(Expansion Module)中之一第一組擴展控制電路之間提供至少一心跳監控路徑(Heartbeat Monitoring Path),以供為該儲存系統中之一組管理模組傳輸複數個心跳監控訊號中之至少一者,其中該第一擴展模組係用來安裝該複數個共享儲存裝置中之一第一組共享儲存裝置,以及該第一組共享儲存裝置中之每一共享儲存裝置係分別耦接至該第一組擴展控制電路,以容許該組管理模組分別透過該第一組擴展控制電路控制該第一組共享儲存裝置;以及依據該複數個心跳監控訊號進行該組管理模組之心跳監控,以供該組管理模組中之至少一者對該複數個共享儲存裝置進行高可用性管理(High Availability Management, HA Management)運作。例如:該儲存系統可被建立為一高可用性叢集。
本發明於提供上述方法之同時,亦對應地提供一種用來管理一儲存系統之裝置,其中該儲存系統包含複數個共享儲存裝置。該裝置可包含:一第一擴展模組,位於該儲存系統中,用來安裝該複數個共享儲存裝置中之一第一組共享儲存裝置。例如,該第一擴展模組可包含:一第一組擴展控制電路,耦接至該儲存系統中之一組管理模組;以及至少一心跳監控路徑,位於該第一組擴展控制電路之間。尤其是,該第一組共享儲存裝置中之每一共享儲存裝置係分別耦接至該第一組擴展控制電路,以容許該組管理模組分別透過該第一組擴展控制電路控制該第一組共享儲存裝置。另外,上述之至少一心跳監控路徑係用來為該組管理模組傳輸複數個心跳監控訊號中之至少一者。此外,該裝置依據該複數個心跳監控訊號進行該組管理模組之心跳監控,以供該組管理模組中之至少一者對該複數個共享儲存裝置進行高可用性管理運作。例如:該儲存系統可被建立為一高可用性叢集。
本發明的好處之一是,本發明之方法與相關裝置可在較少副作用、或不造成副作用的狀況下,妥善地解決既有的問題。另外,本發明之方法與相關裝置可減少該儲存系統的故障之機會。例如:該高可用性叢集可確保不停歇的儲存空間服務及最大化系統可用性,進而降低無預警中斷和耗費資源的停機所帶來的風險。藉助於本發明之方法與相關裝置,不中斷的可用性之目標可輕易地達到。於是,針對該儲存系統之額外維護成本及管理時間得以減少。
第1圖為依據本發明一實施例之一種用來管理一儲存系統之裝置100的示意圖,其中該儲存系統包含複數個共享儲存裝置(例如:複數個硬式磁碟機)。依據本實施例,裝置100可包含該儲存系統中之複數個電子裝置之至少一部分(例如:一部分或全部),而該複數個共享儲存裝置(例如:複數個硬式磁碟機)可設置於該複數個電子裝置中之一個或多個電子裝置。例如:裝置100可為該複數個共享儲存裝置中之某些共享儲存裝置之一個或多個控制電路,諸如上述之一個或多個電子裝置中之一個或多個積體電路(Integrated Circuit, IC)。又例如:裝置100可為該複數個電子裝置中之一電子裝置之整體。又例如:裝置100可為該複數個電子裝置中之至少兩個電子裝置。又例如:裝置100可為該儲存系統之整體。該儲存系統的例子可包含(但不限於):採用序列式小型電腦系統介面(Serial Attached Small Computer System Interface,Serial Attached SCSI,可簡稱為「SAS」)技術來實施之資料儲存系統、採用SAS擴展器(SAS Expander)技術來實施之資料儲存系統。該複數個電子裝置的例子可包含(但不限於):採用SAS擴展器技術來實施之管理機箱(Header)、擴充式機箱(Enclosure)。
如第1圖所示,裝置100包含有:一擴展模組(Expansion Module)110,位於該儲存系統中,用來安裝該複數個共享儲存裝置中之一組共享儲存裝置{105-1, 105-2, …, 105-M},其中符號「M」可代表大於1之正整數。例如,擴展模組110可包含:一組擴展控制電路{112-1, 112-2, …, 112-N},耦接至該儲存系統中之一組管理模組,其中符號「N」可代表大於1之正整數;以及至少一心跳監控路徑(Heartbeat Monitoring Path)114(例如:一個或多個心跳監控路徑),位於該組擴展控制電路{112-1, 112-2, …, 112-N}之間。尤其是,該組共享儲存裝置{105-1, 105-2, …, 105-M}中之每一共享儲存裝置,諸如該組共享儲存裝置{105-1, 105-2, …, 105-M}中之任一共享儲存裝置105-m(符號「m」可代表落入區間[1, M]的範圍之任一正整數),係分別耦接至該組擴展控制電路{112-1, 112-2, …, 112-N},以容許該組管理模組分別透過該組擴展控制電路{112-1, 112-2, …, 112-N}控制該組共享儲存裝置{105-1, 105-2, …, 105-M}。另外,上述之至少一心跳監控路徑114可用來為該組管理模組傳輸複數個心跳監控訊號中之至少一者(例如:一個或多個心跳監控訊號)。此外,裝置100可依據該複數個心跳監控訊號進行該組管理模組之心跳監控,以供該組管理模組中之至少一者對該複數個共享儲存裝置{105-1, 105-2, …, 105-M}進行高可用性管理(High Availability Management, HA Management)運作。例如:該儲存系統可被建立為一高可用性叢集(High Availability Cluster, HA Cluster)。尤其是,該組管理模組中之任一者具備取代該組管理模組中之另一者之能力,並且該組管理模組中之每一者具備獨立地控制該複數個共享儲存裝置之能力。
請注意,該組管理模組中之任一管理模組可作為該複數個電子裝置中之一電子裝置之一例,且擴展模組110亦可作為該複數個電子裝置中之一電子裝置之一例。
實作上,該組管理模組中之每一管理模組可依據SAS擴展器技術來實施成為本實施例中所述之管理機箱,而該複數個電子裝置當中除了該組管理模組之外的任一電子裝置,諸如擴展模組110,可依據SAS擴展器技術來實施成為本實施例中所述之擴充式機箱,其中該組擴展控制電路{112-1, 112-2, …, 112-N}中之每一擴展控制電路,諸如該組擴展控制電路{112-1, 112-2, …, 112-N}中之任一擴展控制電路112-n(符號「n」可代表落入區間[1, N]的範圍之任一正整數)可包含至少一介面電路,而上述之至少一介面電路可依據SAS擴展器技術來實施成為對應的SAS介面電路。另外,該第一組擴展控制電路中之任一擴展控制電路可透過一電纜線(Cable),諸如SAS電纜線,電氣連接至該組管理模組中之對應之一管理模組。
依據本實施例,該組擴展控制電路{112-1, 112-2, …, 112-N}之間的該至少一心跳監控路徑114係為擴展模組110中之至少一內部線路(Internal Wiring)諸如多個內部線路,而非該組管理模組之間的任何網路電纜線。因此,裝置100可避免相關技術的許多問題(諸如網路線鬆脫、網路線內部斷線…等)。
依據某些實施例,該儲存系統可包含擴展模組110之複數個複製品,諸如一第一擴展模組110-1、一第二擴展模組110-2、…等。例如:該組管理模組中之每一管理模組可依據SAS擴展器技術來實施成為本實施例中所述之管理機箱,而該複數個電子裝置當中除了該組管理模組之外的任一電子裝置,諸如第一擴展模組110-1、第二擴展模組110-2、…等,可依據SAS擴展器技術來實施成為本實施例中所述之擴充式機箱。
第2圖為依據本發明一實施例之一種用來管理一儲存系統之方法200的流程圖。該方法可應用於第1圖所示之裝置100,尤其是上述之擴展模組110、及/或其複製品(例如:第一擴展模組110-1、第二擴展模組110-2、…等)。該方法說明如下。
於步驟210中,裝置100於該儲存系統中之第一擴展模組110-1中之一第一組擴展控制電路之間提供至少一心跳監控路徑,以供為該儲存系統中之該組管理模組傳輸複數個心跳監控訊號(諸如上述者)中之至少一者,其中第一擴展模組110-1係用來安裝該複數個共享儲存裝置中之一第一組共享儲存裝置(諸如一第一組硬式磁碟機),以及該第一組共享儲存裝置中之每一共享儲存裝置係分別耦接至該第一組擴展控制電路,以容許該組管理模組分別透過該第一組擴展控制電路控制該第一組共享儲存裝置。
為了便於理解,該第一組擴展控制電路可作為該組擴展控制電路{112-1, 112-2, …, 112-N}之一例,步驟210中所述之該至少一心跳監控路徑可作為上述之至少一心跳監控路徑114之一例,該第一組共享儲存裝置可作為該組共享儲存裝置{105-1, 105-2, …, 105-M}之一例。
於步驟220中,裝置100依據該複數個心跳監控訊號進行該組管理模組之心跳監控,以供該組管理模組中之至少一者對該複數個共享儲存裝置進行高可用性管理運作,其中該儲存系統係被建立為一高可用性叢集。
實作上,該組管理模組可包含至少兩個(兩個或更多個)管理模組,諸如依據SAS擴展器技術來實施之兩個管理機箱HOST1與HOST2,而該第一組擴展控制電路可包含至少兩個(兩個或更多個)擴展控制電路,諸如依據SAS擴展器技術來實施之兩個擴展器(Expander)EXPANDER1與EXPANDER2。另外,第一擴展模組110-1可依據SAS擴展器技術來實施成為擴充式機箱,以供設置該第一組擴展控制電路以及該第一組共享儲存裝置。此外,該第一組擴展控制電路(諸如這兩個擴展器EXPANDER1與EXPANDER2)可分別透過SAS電纜線電氣連接至該組管理模組(諸如這兩個管理機箱HOST1與HOST2)。
依據某些實施例,擴展模組的數量可以大於一。例如:裝置100於該儲存系統中之第二擴展模組110-2中之一第二組擴展控制電路之間提供至少一心跳監控路徑,以供為該儲存系統中之該組管理模組傳輸該複數個心跳監控訊號中之至少另一者,其中第二擴展模組110-2係用來安裝該複數個共享儲存裝置中之一第二組共享儲存裝置(諸如一第二組硬式磁碟機),以及該第二組共享儲存裝置中之每一共享儲存裝置係分別耦接至該第二組擴展控制電路,以容許該組管理模組分別透過該第二組擴展控制電路控制該第二組共享儲存裝置。
請注意,該第二組擴展控制電路亦可作為該組擴展控制電路{112-1, 112-2, …, 112-N}之一例,裝置100於該第二組擴展控制電路之間所提供之該至少一心跳監控路徑亦可作為上述之至少一心跳監控路徑114之一例,該第二組共享儲存裝置亦可作為該組共享儲存裝置{105-1, 105-2, …, 105-M}之一例。另外,該第二組擴展控制電路亦可包含至少兩個(兩個或更多個)擴展控制電路,諸如上述兩個擴展器EXPANDER1與EXPANDER2之複製品。另外,第二擴展模組110-2亦可依據SAS擴展器技術來實施成為擴充式機箱,以供設置該第二組擴展控制電路以及該第二組共享儲存裝置。此外,該第二組擴展控制電路(諸如上述兩個擴展器EXPANDER1與EXPANDER2之複製品)可分別透過SAS電纜線電氣連接至該第一組擴展控制電路(諸如上述兩個擴展器EXPANDER1與EXPANDER2)。
依據某些實施例,裝置100可利用該組管理模組中之一管理模組發出一存活指令至該第一組擴展控制電路中之一擴展控制電路,以供該擴展控制電路決定是否將該管理模組之一存活狀態或一非存活狀態通知(Notify)該第一組擴展控制電路中之另一擴展控制電路,以容許該組管理模組中之另一管理模組透過該另一擴展控制電路得知該管理模組之該存活狀態或該非存活狀態。例如:該管理模組與該另一管理模組分別為管理機箱HOST1與HOST2,且該擴展控制電路與該另一擴展控制電路分別為擴展器EXPANDER1與EXPANDER2。
依據某些實施例,裝置100可利用該組管理模組中之一管理模組發出一讀取指令至該第一組擴展控制電路中之一擴展控制電路,以透過該擴展控制電路、該第一組擴展控制電路中之另一擴展控制電路、以及該擴展控制電路與該另一擴展控制電路之間的一心跳監控路徑得知該組管理模組中之另一管理模組是否存活,其中該第一組擴展控制電路之間的該至少一心跳監控路徑可包含該擴展控制電路與該另一擴展控制電路之間的該心跳監控路徑。例如:該管理模組與該另一管理模組分別為管理機箱HOST1與HOST2,且該擴展控制電路與該另一擴展控制電路分別為擴展器EXPANDER1與EXPANDER2。
依據某些實施例,當該第一組擴展控制電路中之一擴展控制電路接收到來自該組管理模組中之相對應之一管理模組之一讀取指令時,該擴展控制電路可將該擴展控制電路之一輸出端子設定為一第一邏輯狀態,以將該管理模組之一存活狀態(諸如上述之存活狀態)通知該第一組擴展控制電路中之另一擴展控制電路,以容許該組管理模組中之另一管理模組透過該另一擴展控制電路得知該管理模組之該存活狀態。例如:該管理模組與該另一管理模組分別為管理機箱HOST1與HOST2,且該擴展控制電路與該另一擴展控制電路分別為擴展器EXPANDER1與EXPANDER2。其中,該擴展控制電路可藉由調整該輸出端子之電位來設定該輸出端子之邏輯狀態(諸如上述之第一邏輯狀態),該擴展控制電路設定該輸出端子之邏輯狀態的方法為該領域之一般技術人員所熟知,本實施例不再贅述其細節。
依據某些實施例,當該第一組擴展控制電路中之一擴展控制電路接收到來自該組管理模組中之相對應之一管理模組之一讀取指令時,該擴展控制電路可讀取該擴展控制電路之一輸入端子之訊號,以得知該第一組擴展控制電路中之另一擴展控制電路之一輸出端子)被該另一擴展控制電路所設定之邏輯狀態,諸如一第一邏輯狀態或一第二邏輯狀態(其異於該第一邏輯狀態),其中該邏輯狀態可指出該組管理模組中之另一管理模組之一存活狀態或一非存活狀態,而該擴展控制電路之該輸入端子係耦接至該另一擴展控制電路之該輸出端子。例如:該另一擴展控制電路可選擇性地將該另一擴展控制電路之該輸出端子設定為該第一邏輯狀態或該第二邏輯狀態,以對應地指出該另一管理模組之該存活狀態或該非存活狀態。因此,該管理模組可依據讀取自該擴展控制電路之該輸入端子之訊號,得知該另一管理模組係處於該存活狀態或該非存活狀態。其中,該存活狀態與該非存活狀態係分別對應於該第一邏輯狀態與該第二邏輯狀態。例如:該管理模組與該另一管理模組分別為管理機箱HOST1與HOST2,且該擴展控制電路與該另一擴展控制電路分別為擴展器EXPANDER1與EXPANDER2。
依據某些實施例,當該第一組擴展控制電路中之一擴展控制電路接收到來自該組管理模組中之相對應之一管理模組之一存活指令時,該擴展控制電路可將該擴展控制電路之一輸出端子設定為一第一邏輯狀態,以將該管理模組之一存活狀態通知該第一組擴展控制電路中之另一擴展控制電路,以容許該組管理模組中之另一管理模組透過該另一擴展控制電路得知該管理模組之該存活狀態。例如:該管理模組與該另一管理模組分別為管理機箱HOST1與HOST2,且該擴展控制電路與該另一擴展控制電路分別為擴展器EXPANDER1與EXPANDER2。
依據某些實施例,當該第一組擴展控制電路中之一擴展控制電路未接收到來自該組管理模組中之相對應之一管理模組之一存活指令的時間達到一預定時間門檻值時,該擴展控制電路可將該擴展控制電路之一輸出端子(諸如上述之輸出端子)設定為一第二邏輯狀態(其異於該第一邏輯狀態),以將該管理模組之一非存活狀態(諸如上述之非存活狀態)通知該第一組擴展控制電路中之另一擴展控制電路,以容許該組管理模組中之另一管理模組透過該另一擴展控制電路得知該管理模組之該非存活狀態。其中,該管理模組可週期性地傳送該存活指令至該第一組擴展控制電路中之相對應之該擴展控制電路。例如:該管理模組與該另一管理模組分別為管理機箱HOST1與HOST2,且該擴展控制電路與該另一擴展控制電路分別為擴展器EXPANDER1與EXPANDER2。
依據某些實施例,在該儲存系統中之任一擴展控制電路(諸如該第一組擴展控制電路中之任一者)當中,用來指出某一管理模組(諸如該組管理模組中之相對應之一管理模組)之一存活/非存活狀態之一輸出端子(諸如上述之輸出端子)之預設(Default)邏輯狀態係為一第二邏輯狀態(諸如上述之第二邏輯狀態),以模擬此管理模組之非存活狀態(諸如上述之非存活狀態)。如此,當有某問題發生(諸如沒電或韌體異常等問題)時,此擴展控制電路之該輸出端子就會處於該第二邏輯狀態。例如:該管理模組為管理機箱HOST1,且該擴展控制電路為擴展器EXPANDER1。
第3圖繪示第2圖所示之方法200於一實施例中所涉及之一控制方案。於第3圖所示之架構中,管理模組310-1與310-2(分別標示為「HOST1」與「HOST2」)可實施成為上述兩個管理機箱HOST1與HOST2,並可作為該組管理模組之一例。另外,擴展控制電路1121-1與1122-1(分別標示為「EXPANDER1」與「EXPANDER2」)可實施成為上述兩個擴展器EXPANDER1與EXPANDER2,並可作為該第一組擴展控制電路之一例。如第3圖所示,本實施例之第一擴展模組110-1可實施成為擴充式機箱,以供設置擴展控制電路1121-1與1122-1、以及該第一組硬式磁碟機諸如該些硬式磁碟機320-1,其中擴展控制電路1121-1與1122-1可分別透過SAS電纜線電氣連接至管理模組310-1與310-2。
依據本實施例,該第一組擴展控制電路之間的該至少一心跳監控路徑上之訊號傳輸可藉由利用擴展控制電路1121-1中之一通用型輸入輸出(General Purpose Input Output, GPIO)控制單元、擴展控制電路1122-1中之一通用型輸入輸出控制單元、以及擴展控制電路1121-1中之該通用型輸入輸出控制單元與擴展控制電路1122-1中之該通用型輸入輸出控制單元之間的多個線路(Wiring)來實施。例如:該些心跳監控路徑114-1可設置於第一擴展模組110-1之一印刷電路板(Printed Circuit Board, PCB),諸如第一擴展模組110-1之背板(Back Panel),其中擴展控制電路1121-1與1122-1分別耦接至此背板。請注意,擴展控制電路1121-1與1122-1之間的該些心跳監控路徑114-1均為第一擴展模組110-1中之內部線路,而非該組管理模組(諸如管理模組310-1與310-2)之間的任何網路電纜線。
由於管理機箱HOST1與HOST2以及擴展器EXPANDER1與EXPANDER2之間的電纜線均是標準SAS電纜線,且由於擴展器EXPANDER1與EXPANDER2之間的該些心跳監控路徑可實施成簡單且耐用之架構,諸如擴展器EXPANDER1與EXPANDER2之間的內部線路以及該些內部線路兩側之輸入/輸出端子(亦即,擴展器EXPANDER1與EXPANDER2各自之輸入/輸出端子),故第3圖所示之架構對於心跳監控而言相當可靠,且可避免相關技術中之問題(諸如網路不穩定、需要其它伺服器、需要額外的硬碟、需要非標準線材…等)。本實施例與前述實施例/變化例相仿之處不再重複贅述。
第4圖繪示第2圖所示之方法200於另一實施例中所涉及之一控制方案,其中第4圖所示之架構可包含第3圖所示之架構。於第4圖所示之架構中,擴展控制電路1121-2與1122-2(分別標示為「EXPANDER1」與「EXPANDER2」)可實施成為上述兩個擴展器EXPANDER1與EXPANDER2之複製品,並可作為該第二組擴展控制電路之一例。如第4圖所示,本實施例之第二擴展模組110-2可實施成為擴充式機箱,以供設置擴展控制電路1121-2與1122-2、以及該第二組硬式磁碟機諸如該些硬式磁碟機320-2,其中擴展控制電路1121-2與1122-2可分別透過SAS電纜線電氣連接至擴展控制電路1121-1與1122-1。
依據本實施例,該第二組擴展控制電路之間的該至少一心跳監控路徑上之訊號傳輸可藉由利用擴展控制電路1121-2中之一通用型輸入輸出控制單元、擴展控制電路1122-2中之一通用型輸入輸出控制單元、以及擴展控制電路1121-2中之該通用型輸入輸出控制單元與擴展控制電路1122-2中之該通用型輸入輸出控制單元之間的多個線路來實施。例如:該些心跳監控路徑114-2可設置於第二擴展模組110-2之一印刷電路板,諸如第二擴展模組110-2之背板,其中擴展控制電路1121-2與1122-2分別耦接至此背板。請注意,擴展控制電路1121-2與1122-2之間的該些心跳監控路徑114-2均為第二擴展模組110-2中之內部線路,而非該組管理模組(諸如管理模組310-1與310-2)之間的任何網路電纜線。本實施例與前述實施例/變化例相仿之處不再重複贅述。
依據某些實施例,在第一擴展模組110-1之該些心跳監控路徑114-1異常的狀況下,該組管理模組(諸如管理模組310-1與310-2)中之任一管理模組可以透過第二擴展模組110-2之該些心跳監控路徑114-2來監控該組管理模組(諸如管理模組310-1與310-2)中之另一管理模組是否存活。
依據某些實施例,在第一擴展模組110-1之該些心跳監控路徑114-1異常的狀況下,該組管理模組(諸如管理模組310-1與310-2)中之任一管理模組可以透過第4圖所示架構中之任一其它擴展模組(諸如第二擴展模組110-2、或任一後續擴展模組)之該些心跳監控路徑來監控該組管理模組(諸如管理模組310-1與310-2)中之另一管理模組是否存活。 以上所述僅為本發明之較佳實施例,凡依本發明申請專利範圍所做之均等變化、修飾及其組合,皆應屬本發明之涵蓋範圍。
100‧‧‧用來管理一儲存系統之裝置
105-1,105-2,…,105-M‧‧‧共享儲存裝置
110,110-1,110-2,…‧‧‧擴展模組
112-1,112-2,…,112-N,1121-1,1121-2,…,1122-1,1122-2,…‧‧‧擴展控制電路
114,114-1,114-2,…‧‧‧心跳監控路徑
200‧‧‧用來管理一儲存系統之方法
210‧‧‧提供心跳監控路徑之步驟
220‧‧‧進行該組管理模組之心跳監控之步驟
310-1,310-2‧‧‧管理模組
320-1,320-2,…‧‧‧硬式磁碟機
第1圖為依據本發明一實施例之一種用來管理一儲存系統之裝置的示意圖。 第2圖為依據本發明一實施例之一種用來管理一儲存系統之方法的流程圖。 第3圖繪示第2圖所示之方法於一實施例中所涉及之一控制方案。 第4圖繪示第2圖所示之方法於另一實施例中所涉及之一控制方案。
200‧‧‧用來管理一儲存系統之方法
210‧‧‧提供心跳監控路徑之步驟
220‧‧‧進行該組管理模組之心跳監控之步驟

Claims (20)

  1. 一種用來管理一儲存系統之方法,該儲存系統包含複數個共享儲存裝置,該方法包含: 於該儲存系統中之一第一擴展模組(Expansion Module)中之一第一組擴展控制電路之間提供至少一心跳監控路徑(Heartbeat Monitoring Path),以供為該儲存系統中之一組管理模組傳輸複數個心跳監控訊號中之至少一者,其中該第一擴展模組係用來安裝該複數個共享儲存裝置中之一第一組共享儲存裝置,以及該第一組共享儲存裝置中之每一共享儲存裝置係分別耦接至該第一組擴展控制電路,以容許該組管理模組分別透過該第一組擴展控制電路控制該第一組共享儲存裝置;以及 依據該複數個心跳監控訊號進行該組管理模組之心跳監控,以供該組管理模組中之至少一者對該複數個共享儲存裝置進行高可用性管理(High Availability Management, HA Management)運作,其中該儲存系統係被建立為一高可用性叢集(High Availability Cluster, HA Cluster)。
  2. 如申請專利範圍第1項所述之方法,其另包含: 於該儲存系統中之一第二擴展模組中之一第二組擴展控制電路之間提供至少一心跳監控路徑,以供為該組管理模組傳輸該複數個心跳監控訊號中之至少另一者,其中該第二擴展模組係用來安裝該複數個共享儲存裝置中之一第二組共享儲存裝置,以及該第二組共享儲存裝置中之每一共享儲存裝置係分別耦接至該第二組擴展控制電路,以容許該組管理模組分別透過該第二組擴展控制電路控制該第二組共享儲存裝置。
  3. 如申請專利範圍第1項所述之方法,其中依據該複數個心跳監控訊號進行該組管理模組之心跳監控以供該組管理模組中之該至少一者對該複數個共享儲存裝置進行該些高可用性管理運作之步驟另包含: 利用該組管理模組中之一管理模組發出一存活指令至該第一組擴展控制電路中之一擴展控制電路,以供該擴展控制電路決定是否將該管理模組之一存活狀態或一非存活狀態通知(Notify)該第一組擴展控制電路中之另一擴展控制電路,以容許該組管理模組中之另一管理模組透過該另一擴展控制電路得知該管理模組之該存活狀態或該非存活狀態。
  4. 如申請專利範圍第1項所述之方法,其中依據該複數個心跳監控訊號進行該組管理模組之心跳監控以供該組管理模組中之該至少一者對該複數個共享儲存裝置進行該些高可用性管理運作之步驟另包含: 利用該組管理模組中之一管理模組發出一讀取指令至該第一組擴展控制電路中之一擴展控制電路,以透過該擴展控制電路、該第一組擴展控制電路中之另一擴展控制電路、以及該擴展控制電路與該另一擴展控制電路之間的一心跳監控路徑得知該組管理模組中之另一管理模組是否存活,其中該第一組擴展控制電路之間的該至少一心跳監控路徑包含該擴展控制電路與該另一擴展控制電路之間的該心跳監控路徑。
  5. 如申請專利範圍第1項所述之方法,其中依據該複數個心跳監控訊號進行該組管理模組之心跳監控以供該組管理模組中之該至少一者對該複數個共享儲存裝置進行該些高可用性管理運作之步驟另包含: 當該第一組擴展控制電路中之一擴展控制電路接收到來自該組管理模組中之一管理模組之一讀取指令時,利用該擴展控制電路讀取該擴展控制電路之一輸入端子之訊號,以得知該第一組擴展控制電路中之另一擴展控制電路之一輸出端子被該另一擴展控制電路所設定之邏輯狀態,其中該邏輯狀態指出該組管理模組中之另一管理模組之一存活狀態或一非存活狀態。
  6. 如申請專利範圍第1項所述之方法,其中依據該複數個心跳監控訊號進行該組管理模組之心跳監控以供該組管理模組中之該至少一者對該複數個共享儲存裝置進行該些高可用性管理運作之步驟另包含: 當該第一組擴展控制電路中之一擴展控制電路接收到來自該組管理模組中之一管理模組之一存活指令時,將該擴展控制電路之一輸出端子設定為一第一邏輯狀態,以將該管理模組之一存活狀態通知(Notify)該第一組擴展控制電路中之另一擴展控制電路,以容許該組管理模組中之另一管理模組透過該另一擴展控制電路得知該管理模組之該存活狀態。
  7. 如申請專利範圍第1項所述之方法,其中依據該複數個心跳監控訊號進行該組管理模組之心跳監控以供該組管理模組中之該至少一者對該複數個共享儲存裝置進行該些高可用性管理運作之步驟另包含: 當該第一組擴展控制電路中之一擴展控制電路未接收到來自該組管理模組中之相對應之一管理模組之一存活指令的時間達到一預定時間門檻值時,將該擴展控制電路之一輸出端子設定為一第二邏輯狀態,以將該管理模組之一非存活狀態通知(Notify)該第一組擴展控制電路中之另一擴展控制電路,以容許該組管理模組中之另一管理模組透過該另一擴展控制電路得知該管理模組之該非存活狀態。
  8. 如申請專利範圍第1項所述之方法,其中該第一組擴展控制電路中之一擴展控制電路係透過一電纜線(Cable)電氣連接至該組管理模組中之一管理模組,並且該第一組擴展控制電路中之另一擴展控制電路係透過另一電纜線電氣連接至該組管理模組中之另一管理模組。
  9. 如申請專利範圍第1項所述之方法,其中該組管理模組中之任一者具備取代該組管理模組中之另一者之能力,以及該組管理模組中之每一者具備獨立地控制該複數個共享儲存裝置之能力。
  10. 如申請專利範圍第1項所述之方法,其中該第一組擴展控制電路之間的該至少一心跳監控路徑係為該第一擴展模組中之至少一內部線路(Internal Wiring),而非該組管理模組之間的任何網路電纜線。
  11. 一種用來管理一儲存系統之裝置,該儲存系統包含複數個共享儲存裝置,該裝置包含有: 一第一擴展模組(Expansion Module),位於該儲存系統中,用來安裝該複數個共享儲存裝置中之一第一組共享儲存裝置,其中該第一擴展模組包含: 一第一組擴展控制電路,耦接至該儲存系統中之一組管理模組,其中該第一組共享儲存裝置中之每一共享儲存裝置係分別耦接至該第一組擴展控制電路,以容許該組管理模組分別透過該第一組擴展控制電路控制該第一組共享儲存裝置;以及 至少一心跳監控路徑(Heartbeat Monitoring Path),位於該第一組擴展控制電路之間,用來為該組管理模組傳輸複數個心跳監控訊號中之至少一者,其中該裝置依據該複數個心跳監控訊號進行該組管理模組之心跳監控,以供該組管理模組中之至少一者對該複數個共享儲存裝置進行高可用性管理(High Availability Management, HA Management)運作,以及該儲存系統係被建立為一高可用性叢集(High Availability Cluster, HA Cluster)。
  12. 如申請專利範圍第11項所述之裝置,其另包含: 一第二擴展模組,位於該儲存系統中,用來安裝該複數個共享儲存裝置中之一第二組共享儲存裝置,其中該第二擴展模組包含: 一第二組擴展控制電路,耦接至該第一組擴展控制電路,其中該第二組共享儲存裝置中之每一共享儲存裝置係分別耦接至該第二組擴展控制電路,以容許該組管理模組分別透過該第二組擴展控制電路控制該第二組共享儲存裝置;以及 至少一心跳監控路徑,位於該第二組擴展控制電路之間,用來為該組管理模組傳輸該複數個心跳監控訊號中之至少另一者。
  13. 如申請專利範圍第11項所述之裝置,其中該裝置利用該組管理模組中之一管理模組發出一存活指令至該第一組擴展控制電路中之一擴展控制電路,以供該擴展控制電路決定是否將該管理模組之一存活狀態或一非存活狀態通知(Notify)該第一組擴展控制電路中之另一擴展控制電路,以容許該組管理模組中之另一管理模組透過該另一擴展控制電路得知該管理模組之該存活狀態或該非存活狀態。
  14. 如申請專利範圍第11項所述之裝置,其中該裝置利用該組管理模組中之一管理模組發出一讀取指令至該第一組擴展控制電路中之一擴展控制電路,以透過該擴展控制電路、該第一組擴展控制電路中之另一擴展控制電路、以及該擴展控制電路與該另一擴展控制電路之間的一心跳監控路徑得知該組管理模組中之另一管理模組是否存活,其中該第一組擴展控制電路之間的該至少一心跳監控路徑包含該擴展控制電路與該另一擴展控制電路之間的該心跳監控路徑。
  15. 如申請專利範圍第11項所述之裝置,其中當該第一組擴展控制電路中之一擴展控制電路接收到來自該組管理模組中之一管理模組之一讀取指令時,該擴展控制電路讀取該擴展控制電路之一輸入端子之訊號,以得知該第一組擴展控制電路中之另一擴展控制電路之一輸出端子被該另一擴展控制電路所設定之邏輯狀態,其中該邏輯狀態指出該組管理模組中之另一管理模組之一存活狀態或一非存活狀態。
  16. 如申請專利範圍第11項所述之裝置,其中當該第一組擴展控制電路中之一擴展控制電路接收到來自該組管理模組中之一管理模組之一存活指令時,該擴展控制電路將該擴展控制電路之一輸出端子設定為一第一邏輯狀態,以將該管理模組之一存活狀態通知(Notify)該第一組擴展控制電路中之另一擴展控制電路,以容許該組管理模組中之另一管理模組透過該另一擴展控制電路得知該管理模組之該存活狀態。
  17. 如申請專利範圍第11項所述之裝置,其中當該第一組擴展控制電路中之一擴展控制電路未接收到來自該組管理模組中之相對應之一管理模組之一存活指令的時間達到一預定時間門檻值時,該擴展控制電路將該擴展控制電路之一輸出端子設定為一第二邏輯狀態,以將該管理模組之一非存活狀態通知(Notify)該第一組擴展控制電路中之另一擴展控制電路,以容許該組管理模組中之另一管理模組透過該另一擴展控制電路得知該管理模組之該非存活狀態。
  18. 如申請專利範圍第11項所述之裝置,其中該第一組擴展控制電路中之一擴展控制電路係透過一電纜線(Cable)電氣連接至該組管理模組中之一管理模組,並且該第一組擴展控制電路中之另一擴展控制電路係透過另一電纜線電氣連接至該組管理模組中之另一管理模組。
  19. 如申請專利範圍第11項所述之裝置,其中該組管理模組中之任一者具備取代該組管理模組中之另一者之能力,以及該組管理模組中之每一者具備獨立地控制該複數個共享儲存裝置之能力。
  20. 如申請專利範圍第11項所述之裝置,其中該第一組擴展控制電路之間的該至少一心跳監控路徑係為該第一擴展模組中之至少一內部線路(Internal Wiring),而非該組管理模組之間的任何網路電纜線。
TW104118454A 2015-06-08 2015-06-08 Method for managing a storage system, and associated apparatus TWI560558B (en)

Priority Applications (4)

Application Number Priority Date Filing Date Title
TW104118454A TWI560558B (en) 2015-06-08 2015-06-08 Method for managing a storage system, and associated apparatus
CN201610004537.4A CN106250284B (zh) 2015-06-08 2016-01-05 用来管理一储存系统的方法与裝置
US15/133,247 US9858135B2 (en) 2015-06-08 2016-04-20 Method and associated apparatus for managing a storage system
EP16170519.9A EP3104555B1 (en) 2015-06-08 2016-05-20 Method and associated apparatus for managing a storage system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
TW104118454A TWI560558B (en) 2015-06-08 2015-06-08 Method for managing a storage system, and associated apparatus

Publications (2)

Publication Number Publication Date
TWI560558B TWI560558B (en) 2016-12-01
TW201643740A true TW201643740A (zh) 2016-12-16

Family

ID=56131300

Family Applications (1)

Application Number Title Priority Date Filing Date
TW104118454A TWI560558B (en) 2015-06-08 2015-06-08 Method for managing a storage system, and associated apparatus

Country Status (4)

Country Link
US (1) US9858135B2 (zh)
EP (1) EP3104555B1 (zh)
CN (1) CN106250284B (zh)
TW (1) TWI560558B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI676890B (zh) * 2017-12-12 2019-11-11 緯穎科技服務股份有限公司 機箱監控系統及機箱監控方法

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7035952B2 (en) * 2003-09-24 2006-04-25 Hewlett-Packard Development Company, L.P. System having storage subsystems and a link coupling the storage subsystems
TWI307034B (en) 2005-11-23 2009-03-01 Infortrend Technology Inc Storage virtualization subsystem and system with host-side redundancy via sas connectivity
US20080244620A1 (en) * 2007-03-27 2008-10-02 Brian James Cagno Dynamic Communication Fabric Zoning
JP5175483B2 (ja) * 2007-03-30 2013-04-03 株式会社日立製作所 ストレージ装置及びその制御方法
US9079562B2 (en) * 2008-11-13 2015-07-14 Avago Technologies General Ip (Singapore) Pte. Ltd. Active-active failover for a direct-attached storage system
CN101594383B (zh) * 2009-07-09 2012-05-23 浪潮电子信息产业股份有限公司 一种双控制器存储系统的服务和控制器状态监控方法
US8281071B1 (en) 2010-02-26 2012-10-02 Symantec Corporation Systems and methods for managing cluster node connectivity information
US8484416B2 (en) 2010-12-23 2013-07-09 Lsi Corporation High availability raid using low-cost direct attached raid controllers
US20120284435A1 (en) * 2011-05-03 2012-11-08 Myrah Michael G Zone group manager virtual phy
CN102799394B (zh) 2012-06-29 2015-02-25 华为技术有限公司 一种实现高可用集群的心跳服务的方法及装置
US9092398B2 (en) * 2013-02-14 2015-07-28 Avago Technologies General Ip (Singapore) Pte Ltd Restoring expander operations in a data storage switch
US9026843B2 (en) * 2013-08-05 2015-05-05 Lsi Corporation Arbitration suspension in a SAS domain
CN103475695A (zh) * 2013-08-21 2013-12-25 华为数字技术(成都)有限公司 存储系统互联方法及装置
CN103488435B (zh) * 2013-09-24 2017-08-04 华为技术有限公司 Raid子系统及其数据读写方法

Also Published As

Publication number Publication date
US9858135B2 (en) 2018-01-02
CN106250284A (zh) 2016-12-21
US20160357622A1 (en) 2016-12-08
EP3104555B1 (en) 2019-05-01
CN106250284B (zh) 2019-03-15
EP3104555A1 (en) 2016-12-14
TWI560558B (en) 2016-12-01

Similar Documents

Publication Publication Date Title
US10417167B2 (en) Implementing sideband control structure for PCIE cable cards and IO expansion enclosures
CN103117866B (zh) 交换结构管理方法和系统
US8880817B2 (en) Storage subsystem backplane management system
JP4982304B2 (ja) 電源障害の発生を把握するストレージシステム
US8074105B2 (en) High data availability SAS-based RAID system
US8745438B2 (en) Reducing impact of a switch failure in a switch fabric via switch cards
US10064304B2 (en) Separated server back plane
US8880938B2 (en) Reducing impact of a repair action in a switch fabric
US20130010787A1 (en) Rack server system
CN107294759B (zh) 服务器系统及数据存取方法
TWI546682B (zh) 藉助於混和管理路徑來管理一儲存系統之方法與裝置
US11003394B2 (en) Multi-domain data storage system with illegal loop prevention
TW201643740A (zh) 用來管理一儲存系統之方法與裝置
US7464257B2 (en) Mis-configuration detection methods and devices for blade systems
TW201310462A (zh) 背板介面電路、硬碟背板及伺服器系統
CN113220092A (zh) 服务器
WO2019047456A1 (zh) 多硬盘储存装置
US10567268B2 (en) Method for detecting topology, compute node, and storage node
US20160366024A1 (en) Method and associated apparatus for managing a storage system
TWI771053B (zh) 伺服器
CN210776487U (zh) 一种rack机柜管理系统
TWM618829U (zh) Ssd系統以及ssd控制系統
CN118295942A (zh) 数据存储装置、方法、存储介质及电子设备
TWM505642U (zh) 硬碟連接板

Legal Events

Date Code Title Description
MM4A Annulment or lapse of patent due to non-payment of fees