TWI614670B - 連鎖且可擴展之儲存系統及在一連鎖且可擴展之儲存系統中存取資料之方法 - Google Patents

連鎖且可擴展之儲存系統及在一連鎖且可擴展之儲存系統中存取資料之方法 Download PDF

Info

Publication number
TWI614670B
TWI614670B TW103102356A TW103102356A TWI614670B TW I614670 B TWI614670 B TW I614670B TW 103102356 A TW103102356 A TW 103102356A TW 103102356 A TW103102356 A TW 103102356A TW I614670 B TWI614670 B TW I614670B
Authority
TW
Taiwan
Prior art keywords
host
storage devices
storage
storage device
interface network
Prior art date
Application number
TW103102356A
Other languages
English (en)
Other versions
TW201443771A (zh
Inventor
厄爾T 柯罕
Original Assignee
Lsi公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US13/765,253 external-priority patent/US20130159622A1/en
Application filed by Lsi公司 filed Critical Lsi公司
Publication of TW201443771A publication Critical patent/TW201443771A/zh
Application granted granted Critical
Publication of TWI614670B publication Critical patent/TWI614670B/zh

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/0604Improving or facilitating administration, e.g. storage management
    • G06F3/0607Improving or facilitating administration, e.g. storage management by facilitating the process of upgrading existing storage systems, e.g. for improving compatibility between host and storage device
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0629Configuration or reconfiguration of storage systems
    • G06F3/0631Configuration or reconfiguration of storage systems by allocating resources to storage systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0646Horizontal data movement in storage systems, i.e. moving data in between storage devices or systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/0671In-line storage system
    • G06F3/0683Plurality of storage devices
    • G06F3/0685Hybrid storage combining heterogeneous device types, e.g. hierarchical storage, hybrid arrays

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Debugging And Monitoring (AREA)

Abstract

所描述實施例在一連鎖且可擴展之儲存系統中存取資料。一或多個儲存裝置之一主要代理自耦合至該主要代理之一主機接收包含一邏輯位址之一主機請求。該主要代理基於該邏輯位址判定在該等儲存裝置之至少一者中之一對應實體位址且基於該實體位址產生對在該等儲存裝置中之各經判定實體位址之一子請求。該主要代理經由可獨立於該主機操作之一儲存裝置介面網路將該等子請求發送至該等儲存裝置。該儲存裝置介面網路係將該等儲存裝置耦合至該主要代理之一同級間網路。該主要代理回應於該等子請求而接收子狀態且判定一總體狀態。該主要代理將該總體狀態提供至該主機使得該主機在無一交換器之情況下耦合至該等儲存裝置。

Description

連鎖且可擴展之儲存系統及在一連鎖且可擴展之儲存系統中存取資料之方法 相關申請案之交叉參考
本申請案係一部分連續申請案且主張2012年12月7日申請之美國專利申請案第13/702,976,號之申請日期之權益,該申請案主張2011年6月16日申請之美國臨時申請案第61/497,525號,2011年6月17日申請之國際專利申請案第PCT/US2011/040996號及2010年6月18日申請之美國臨時申請案第61/356,443號之申請日期之權益,所有申請案之教示之全文以引用方式併入本文中。
一儲存區域網路(SAN)係一種提供對整合的區塊層級儲存器(諸如,磁碟陣列及磁帶櫃)之存取至耦合至SAN之一或多個主機裝置之系統。一SAN表示作為至主機裝置之一單個邏輯介面,將藉由儲存裝置之各者實施之儲存概念地彙總至一單個邏輯儲存空間中之複數個儲存裝置。一典型SAN可係可擴展的,意謂儲存空間量(例如,儲存裝置之數目)可視不同SAN系統中之需要而改變。如所示,一SAN提供區塊層級存取,意謂檔案系統通常係由主機裝置管理。一典型SAN可採用區塊層級協定,諸如光纖通道(FC),乙太網路上之進階附接技術(ATA)(AoE),網際網路小型電腦系統介面(iSCSI)或HyperSCSI。一SAN在儲存裝置與主機裝置之間直接傳輸資料。
一網路附接儲存器(NAS)係一種將檔案層級存取提供至耦合至NAS之一或多個主機裝置之系統。不同於一SAN,NAS系統將一檔案系統提供給其之所附接儲存裝置,本質上用作為存取一或多個區域區 塊層級儲存裝置之一檔案伺服器。一典型NAS可採用檔案層級協定,諸如網路檔案系統(NFS)或伺服器訊息區塊/共同網路檔案系統(SMB/CIFS)。一SAN-NAS混合系統係將如一NAS裝置及區塊層級存取如自相同儲存系統之一SAN系統之兩個檔案層級存取提供給主機之一系統。
在SAN、NAS及SAN-NAS混合系統中,期望採用多個儲存裝置使得可藉由將複數個儲存裝置群集在一起增大總系統儲存之大小。儲存裝置之此群集通常需要與一交換器階層地通信使得儲存裝置可單獨或彙總地用於主機。
提供本【發明內容】以用一簡化形式引入下文【實施方式】中進一步描述之一系列概念。本【發明內容】不意欲識別所主張標的物之關鍵特徵或本質特徵,亦不意欲用於限制所主張標的物之範疇。
所描述實施例在一連鎖且可擴展之儲存系統中存取資料。一或多個儲存裝置之一主要代理自耦合至主要代理之一主機接收包含一邏輯位址之一主機請求。主要代理基於邏輯位址判定在儲存裝置之至少一者中之一對應實體位址且基於實體位址產生對儲存裝置中之各經判定實體位址之一子請求。主要代理經由可獨立於主機操作之一儲存裝置介面網路將子請求發送至儲存裝置。儲存裝置介面網路係將儲存裝置耦合至主要代理之一同級間網路。主要代理回應於子請求而接收子狀態且判定一總體狀態。主要代理將總體狀態提供至主機使得主機在無一交換器之情況下耦合至儲存裝置。
100‧‧‧主機裝置
101‧‧‧耦合件/連接
101(1)至101(N)‧‧‧耦合件/上游實體層鏈路或埠(PHY)
110‧‧‧主機可見儲存器/儲存裝置
110(1)至110(N)‧‧‧儲存裝置
110(A)‧‧‧儲存裝置
110(B)‧‧‧儲存裝置
110(C)‧‧‧儲存裝置
110.B1至110.Bn‧‧‧儲存裝置
120‧‧‧主機不可見儲存器/儲存裝置
120(1)至120(M)‧‧‧儲存裝置
180‧‧‧主機/儲存裝置介面
190‧‧‧插拔式儲存模組
202‧‧‧PHY介面
204‧‧‧邏輯/實體轉譯模組
206‧‧‧儲存介面
210‧‧‧固態儲存器
212‧‧‧磁性儲存器
214‧‧‧光學儲存器
216‧‧‧大容量儲存裝置
218(1)至218(N)‧‧‧下游PHY/耦合件
218(B1)至218(Zn)‧‧‧耦合件
220‧‧‧子請求模組
222‧‧‧子狀態模組
自其中元件符號標示類似或相同元件之下文詳細描述、隨附申請專利範圍及隨附圖式,所描述實施例之其他態樣、特徵及優點將變得更完整明白。
圖1展示根據例示性實施例之一可擴展儲存系統之一方塊圖;圖2展示根據例示性實施例之一可擴展儲存系統之一方塊圖;圖3展示根據例示性實施例之一可擴展儲存系統之一方塊圖;圖4展示根據例示性實施例之一可擴展儲存系統之一方塊圖;及圖5展示根據例示性實施例之一可擴展儲存系統之一方塊圖。
所描述實施例在一連鎖且可擴展之儲存系統中存取資料。一或多個儲存裝置之一主要代理自耦合至主要代理之一主機接收包含一邏輯位址之一主機請求。主要代理基於邏輯位址判定在儲存裝置之至少一者中之一對應實體位址且基於實體位址產生對在儲存裝置中之各經判定實體位址之一子請求。主要代理經由可獨立於主機操作之一儲存裝置介面網路將子請求發送至儲存裝置。儲存裝置介面網路係將儲存裝置耦合至主要代理之一同級間網路。主要代理回應於子請求而接收子狀態且判定一總體狀態。主要代理將總體狀態提供至主機使得主機在無一交換器之情況下耦合至儲存裝置。
表1定義貫穿本說明書使用之一列縮寫詞作為理解所描述實施例之一幫助:
Figure TWI614670BD00001
Figure TWI614670BD00002
在一些SAN、NAS或SAN-NAS混合系統中,儲存裝置可具有該等裝置之一主要代理,其接受經由一主機介面(HIF)協定自主機裝置接收之儲存請求。主要代理處理主機請求且產生經由一同級間協定至各儲存裝置之次要代理之一或多個子請求。次要代理接受且處理子請求,且將用於子請求之各者之子狀態資訊報告給主要代理及/或主機。主要代理視需要將子狀態累積在主機請求之一總體狀態中。代理之間之同級間通信視需要用以在主機存取及/或故障恢復期間傳達冗餘資訊。各種故障恢復技術可經由冗餘資訊再分配儲存、重指派代理且復原資料。
圖1展示一例示性可擴展儲存系統之一方塊圖,例如如關於2012年12月7日申請之美國專利申請案第13/702,976號所描述,該申請案以引用方式併入本文中。如圖1中所示,一可擴展儲存系統包含經由耦合件101耦合至插拔式儲存模組190之至少一主機裝置(100)。可將耦合件101實施為一傳輸媒體,諸如一底板、銅纜線、光纖、一或多個同軸纜線、一或多個雙絞銅線及/或一或多個射頻(RF)通道。例如,可將耦合件101實施為一FC、AoE、iSCSI或超級SCSI鏈路(例如,在一SAN系統中)或一NFS或SMB/CIFS鏈路(例如,在一NAS系統中)。
插拔式儲存模組190包含至少一主機/儲存裝置介面(展示為180)。儘管主機/儲存裝置介面180在圖1中展示為與插拔式儲存模組190整合,然而在一些實施例中,主機/儲存裝置介面180可與各主機裝置100整合。在一些實施例中,可將插拔式儲存模組190實施為一附加介面卡。如圖1中所示,插拔式儲存模組190包含主機可見儲存器110,該主機可見儲存器110包含一或多個儲存裝置110(1)至110(N)。主機可見儲存器110實施部分或全部經組態以容許藉由主機裝置100經由主機存取儲存裝置介面180之儲存器。插拔式儲存模組190亦包含主機不可見儲存器120,該主機不可見儲存器120包含一或多個儲存裝置120(1)至120(M)。主機不可見儲存器120實施不直接報告給主機裝置100且因此對主機裝置100「不可見」之儲存器。然而,對主機不可見之儲存器藉由主機可見儲存器110之元件(例如,經由同級間協定)報告給主機裝置100且可供主機裝置100間接存取。例如,儲存元件之一主要代理報告主要代理及與主要代理通信之任何次要代理之組合儲存容量,即使次要代理對主機裝置100不可見。在一些實施例中,儲存裝置110及120係實體儲存裝置,諸如固態磁碟(SSD)、硬碟機(HDD)、磁帶櫃、混合磁性及固態儲存系統或其等之一些組合。
在一起,耦合件101、111及121之組合使能夠在主機裝置100與主機可見儲存器110之間(及經由主機可見儲存器110與主機不可見儲存器120之間)傳輸請求、狀態及資料。例如,耦合件之一或多者使能夠例如藉由操作為一主控之主機裝置100之一者及操作為一受控之主機可見儲存器110之儲存元件之一者經由一主機介面協定進行傳輸。此外,耦合件之一或多者使能夠經由一同級間協定藉由操作為一主要代理之主機可見儲存器110之元件之一者及操作為一次要代理之主機不可見儲存器120之元件之一者或主機可見儲存器110之元件之另一者進行傳輸。可將耦合件111及121實施為自訂設計的通信鏈路,或實施為 符合一標準通信協定之鏈路,諸如(例如),一小型電腦系統介面(SCSI)鏈路、一串列附接SCSI(SAS)鏈路、一串列進階附接技術(SATA)鏈路、一通用串列匯流排(USB)、一光纖通道(FC)鏈路、一乙太網路鏈路(例如,一10GE鏈路)、一IEEE 802.11鏈路、一IEEE 802.15鏈路、一IEEE 802.16鏈路、一快速周邊組件互連(PCI-E)鏈路、一串列快速I/O(SRIO)鏈路、一InfiniBand鏈路或其他類似介面鏈路。
在一些實施例中,通常可將主機/儲存裝置介面180實施為一或多個PCI-E或InfiniBand交換器使得主機裝置100、耦合件101及主機/儲存裝置介面180實施一統合交換。在進一步實施例中,統合交換可操作為相對於主機可見儲存器110之一透通交換且亦可同時操作為相對於主機不可見儲存器120之一非透通交換。如圖1中所示,PCI-E交換器(例如,主機/儲存裝置介面180)係不同於儲存裝置110及120之各者之一單獨元件。
因此,以引用方式併入本文中之2012年12月7日申請之相關美國專利申請案第13/702,976號描述包含一或多個PCI-E或InfiniBand交換器(例如,主機/儲存裝置介面180)之一可擴展儲存系統。若PCI-E交換器係一非透通交換器,則交換器下之布局之細節及個別儲存裝置之組態之細節自主機裝置隱藏(例如,在附接裝置之主機初始化恢復上)。因此,採用非透通交換器,所描述實施例可選擇儲存裝置之一者用作為一主控裝置(例如,一主要代理)以處置與所有儲存裝置之所有主機通信,且選擇儲存裝置之其餘者用作為自主機裝置隱藏之受控裝置(例如,作為一次要代理),即使儲存裝置110及120之所有者可係完全複製的裝置。此外,儲存裝置之彙總群組可對主機裝置呈現為一單個儲存裝置。
其他所描述實施例可在不藉由採用「鄰對鄰」通信採用一單獨 PCI-E交換器之情況下提供可擴展功能性使得通信在無一更高層級(例如,一PCI-E階層)之一需要之情況下在儲存裝置之各者之間採用點對點鏈路。藉由諸如路由或交換之技術,儲存裝置之所有者能夠互相之間通信,即使儲存裝置之間之所有連接係點對點的。
圖2展示一例示性儲存裝置110之一方塊圖。主機裝置100經由耦合件101耦合至儲存裝置110。耦合件101與PHY介面202通信。如圖2中所示,PHY介面202包含一或多個上游實體層鏈路或埠(PHY)(展示為101)及一或多個下游PHY(展示為218(1)至218(N))。如圖2中所示,儲存裝置110包含一大容量儲存裝置216,該大容量儲存裝置216包含固態儲存器210(例如,一SSD)、磁性儲存器212(例如,一HDD或磁帶櫃)及光學儲存器214(例如,一CD或DVD)之一或多者。儲存裝置110包含儲存介面206,該儲存介面206通信至各個別儲存裝置210、212及214。邏輯/實體轉譯模組204在自主機裝置100接收之用於操作之邏輯位址與大容量儲存器216上之實體位址之間轉譯。儲存裝置110亦包含子狀態模組222及子請求模組220,子狀態模組222及子請求模組220之兩者與PHY介面202通信。
在所描述實施例中,上游PHY(例如,101)經由PCI-E階層與一主機裝置(例如,100)通信,且下游PHY(例如,218)與其他儲存裝置(例如,多個110)通信。例示性實施例可採用一固定數目之可組態PHY(例如,總共8個可組態PHY),其中一給定PHY可組態為一上游鏈路或一下游鏈路。具有可組態PHY容許輸送至主機101之頻寬(例如,上游連接性)與可擴展儲存系統之容量(例如,下游連接性)之間之一平衡。其他實施例可採用一固定數目之上游PHY及一固定數目之下游PHY,例如,2上游PHY且6下游PHY。
在各種實施例中,一儲存裝置(例如,110)之PHY101及218之一些或全部可以相同速度(例如,一相同最大速度)操作或可各以不同速 度操作。例如,一些實施例可容許PHY101及218之各者單獨支援下列之任一者或多者:PCI-E Gen1、Gen2、Gen3或Gen4,10GE,InfiniBand,SAS,SATA或用於與一或多個儲存裝置通信之一非標準協定。PHY101及218之各者耦合至整合在各儲存裝置110中之一或多個各自PHY介面。當(例如)PHY介面202係一PCI-E介面時,PCI-E介面經組態以作為下列之一或多者通信:一根複合體、一轉發點及一端點。一轉發點類似於一根複合體,其中一轉發點可在一或多個PCI-E介面之間發送以及接收訊務。一根複合體額外係一單獨PCI-E階層之一根。由於耦合至一或多個儲存裝置(例如,110)之一主機裝置(例如,100)本身係一根複合體,故若耦合至主機之儲存裝置之一或多者亦係一根複合體,則接著產生一多根PCI-E階層。
多個儲存裝置110可以任何數目之不同方式連接。圖3至圖5展示根據例示性實施例之可擴展儲存系統中之多個儲存裝置之例示性點對點連接之方塊圖。如所示,在多種實施例中,PHY及PHY控制器可經由下列耦合:如圖3中所示之一菊鏈(或視需要一迴路)、至一主機裝置之一固定、1對1互連(圖4中所示)、一完全交叉開關布局、一部分交叉開關布局、一多路網路、其等之一組合、或用於耦合多個硬體裝置之任何其他技術。在一些實施例中,儲存裝置之間之連接網路係一交換網路,然而在其他實施例中,儲存裝置之間之連接網路係一路由網路。此外,在一些實施例中,儲存裝置110之至少一些具有一不同組態之PHY,或一或多種不同類型之PHY(例如,PCI-E、10GE、InfiniBand、SAS、SATA等)。
如圖3及圖4中所示,圖3之儲存裝置110(A)至110(N)及圖4之儲存裝置110(1)至110(N)具有組態為轉發點之內置PHY介面。圖5展示一階層耦合,其中所有儲存裝置110具有組態為轉發點之PHY介面,除儲存裝置110.Z1至110.ZN具有組態為端點之PHY介面。因此,在所描述 實施例中,儲存裝置110之一或多個(例如,圖3之儲存裝置110(A)、圖4之儲存裝置110(1)至110(N)、圖5之儲存裝置110.A)耦合至主機裝置100,且所有儲存裝置直接耦合至主機裝置100(例如,如圖4中所示),或在不採用(例如)一PCI-E交換器之情況下經由其他儲存裝置間接耦合至主機裝置100。
儲存裝置110之至少一者用作為一主要代理,且儲存裝置110之至少一或多者用作為次要代理。在多種實施例中,一或多個主要代理與主機裝置100具有一直接、比次要代理更直接、更短及/或更小延時之連接。例如,如圖3中所示,儲存裝置110(A)可用作為用於儲存裝置110(B)至110(N)之主要代理,由於(例如)儲存裝置110(A)具有至主機裝置100之一直接連接,而儲存裝置110(B)至110(N)彼此依一菊鏈耦合。如圖4中所示,所有儲存裝置110(1)至110(N)能夠用作為用於自身之主要代理,其係因為各儲存裝置110(1)至110(N)具有至主機裝置100之一直接連接。各儲存裝置具有至主機裝置之一直接連接使至/自主機之頻寬能夠隨著儲存裝置之數目線性擴展。此外,讓儲存裝置之一子集(諸如,僅儲存裝置之一者)用作為一主要代理且其餘用作為次要代理在無需主機來控制複數個單獨儲存裝置之情況下實現可擴展能力。如圖5中所示,儲存裝置110.A可用作為用於儲存裝置110.B1至110.Bn之主要代理,由於(例如)儲存裝置110.A具有至主機裝置100之一直接連接,而儲存裝置110.B1可用作為用於經由耦合件218(C1)耦合之儲存裝置(未展示)之一主要代理,等等。
在所描述實施例中,將主要代理與次要代理之間之所有通信執行為對主機裝置100不可見(且,因此,對主機裝置100之PCI-E階層不可見)之鄰對鄰訊務。例如,如圖3中所示,所有鄰對鄰訊務係在耦合件218(1)至218(N)上執行,且無鄰對鄰訊務係在將儲存裝置110耦合至主機裝置100之連接101上執行。類似地,如圖4中所示,所有鄰對鄰 訊務係在耦合件218(1)至218(N)上執行,且無鄰對鄰訊務係在將儲存裝置110(1)至110(N)耦合至主機裝置100之耦合件101(1)至101(N)上執行。類似地,如圖5中所示,所有鄰對鄰訊務係在耦合件218(B1)至218(Zn)上執行,且無鄰對鄰訊務係在將儲存裝置110.A耦合至主機裝置100之耦合件101上執行。
在所描述實施例中,鄰對鄰訊務係控制訊務(諸如將藉由一主要代理接收之命令自主機裝置100轉發至儲存裝置110之一特定者及將回應(例如,完成)自儲存裝置110之特定者轉發回至一主要代理,轉發源自自主機裝置100接收之命令之資訊)、維持訊務(諸如,同步或活動信號(heartbeat))、RAID或其他資料冗餘控制或資料訊務(例如,用於RAID之差量)及其他訊務。例如,當一寫入命令在儲存裝置110之一特定者上更新一RAID條之一部分時,該特定儲存裝置將一RAID差量作為鄰對鄰訊務發送至其他儲存裝置之一或多者(例如,儲存該條之一RAID同位之儲存裝置之一者)。
如圖3至圖5中所示,耦合件101及218視需要或選擇性地具有不同頻寬及/或不同協定。例如,至主機裝置100之上游連接(例如,耦合件101)通常可係PCI-E Gen4,而多種儲存裝置110之間之下游連接(例如,耦合件218)通常可係PCI-E Gen3或一不同協定,諸如10GE、InfiniBand、SAS等。耦合件之任一者可具有一不同頻寬或不同於彼此之數目之實體鏈路。在一些實施例中,耦合件101及218之任何者之控制訊務可通過相對較低頻寬邊帶耦合傳輸,而資料訊務可通過相對較高頻寬主帶耦合傳輸。因此,在一些實施例中,可將耦合件101及218之任何者實施為使用者設計的通信鏈路或實施為符合一標準通信協定之鏈路,諸如(例如),SCSI、SAS、SATA、USB、FC、乙太網路(例如,10GE)、IEEE 802.11、IEEE 802.15、IEEE 802.16、PCI-E、SRIO、InfiniBand或其他類似介面鏈路。
在一些實施例中,諸如圖4中所示,上游至主機裝置100之一頻寬實質上等同於多種儲存裝置110之一彙總可輸送頻寬。在一些實施例中,諸如圖5中所示,通信地更靠近主機裝置100之儲存裝置110(例如,儲存裝置110.A)經組態用於高於自主機裝置100更遠地通信之儲存裝置(例如,儲存裝置110.Z1)之頻寬之一頻寬。在一些實施例中,儲存裝置110之各者可具有不同容量、性能或可實施為不同類型之儲存媒體,諸如固態磁碟(SSD)、硬碟機(HDD)、磁阻式隨機存取記憶體(MRAM)、磁帶櫃、混合磁性及固態儲存系統或其等之一些組合。
在一些實施例中,儲存裝置110之間之一連接網路使用一PCI-E協定(或其他標準協定),但以非標準方式,諸如藉由具有一圓形(迴路)互連(例如,如藉由圖3及圖4中之選用耦合件218(N)指示)。在進一步實施例中,儲存裝置110之間之連接網路能夠使用非標準頻寬、發信號、命令或協定延伸來有利地改良效能。一般而言,儲存裝置110之間之連接網路能夠以頻寬、延時及功率之一或多者中有效之一方式提供裝置間通信。
因此,如本文中描述,所描述實施例在一連鎖且可擴展之儲存系統中存取資料。一或多個儲存裝置之一主要代理自耦合至主要代理之一主機接收包含一邏輯位址之一主機請求。主要代理基於邏輯位址判定在儲存裝置之至少一者中之一對應實體位址且基於實體位址產生對儲存裝置中之各經判定實體位址之一子請求。主要代理經由可獨立於主機操作之一儲存裝置介面網路將子請求發送至儲存裝置。儲存裝置介面網路係將儲存裝置耦合至主要代理之一同級間網路。主要代理回應於子請求而接收子狀態且判定一總體狀態。主要代理將總體狀態提供至主機使得主機在無一交換器之情況下耦合至儲存裝置。
本文中參考「一個實施例」或「一實施例」意謂至少一個實施例可包含結合實施例描述之一特定特徵、結構或特性。片語「在一個 實施例中」出現在本說明書中之各種位置中不一定全部指相同實施例,獨立或替代性實施例也不一定與其他實施例互斥。對術語「實施方案」來說亦係如此。
如本申請案中所使用,詞「例示性」在本文中用以意謂用作為一實例、例證或圖解。本文中描述為「例示性」之任何態樣或設計不一定被解釋為比其他態樣或設計更佳或更有利。實情係,使用詞例示性意欲以一具體方式呈現概念。
儘管已在一軟體程式(包含可能實施為一數位信號處理器、微控制器或通用電腦)中相對於處理方塊描述例示性實施例,但所描述實施例不限於此。如熟悉此項技術者將明白,亦可將軟體之多種功能實施為電路之程序。可在(例如)一單個積體電路、一多晶片模組、一單個卡或一多卡電路組中採用此等電路。
亦可以用於實踐該等方法之方法及設備之形式具體實施所描述實施例。亦可以程式碼之形式具體實施所描述實施例,程式碼實施於非暫時性有形媒體中(諸如,磁性記錄媒體、光學記錄媒體、固態記憶體、軟式磁碟、CD-ROM、硬碟機或任何其他非暫時性機器可讀儲存媒體),其中,當將程式碼載至入一機器(諸如,一電腦)中且藉由該機器執行時,該機器變成用於實踐所描述實施例之一設備。亦可以(例如)儲存在一非暫時性機器可讀儲存媒體中、載入一機器中及/或藉由一機器執行或經由傳送媒體或載體(諸如經由電線或纜線)、經由光纖或經由電磁輻射傳送之程式碼之形式具體實施所描述實施例,其中,當將程式碼載入至一機器(諸如,一電腦)中且藉由該機器執行時,該機器變成用於實踐所描述實施例之一設備。當在一通用處理器上實施程式碼片段時,程式碼片段與處理器組合以提供類似於特定邏輯電路操作之一唯一裝置。亦可以藉由一媒體電或光學傳輸、將磁場變動儲存在一磁性記錄媒體等中、使用所描述實施例之一方法及/或 一設備產生之一位元流或信號值之其他序列之形式具體實施所描述實施例。
應瞭解本文中闡述之例示性方法之步驟不一定需要以所描述順序執行,且應瞭解此等方法之步驟之順序僅為例示性。同樣地,此等方法中可包含額外步驟,且在與多種描述實施例一致之方法中可省略或組合某些步驟。
如本文中參考一元件或一標準所使用,術語「相容」意謂元件以完全或部分藉由標準指定之一方式與其他元件通信,且將藉由其他元件被認知為以藉由標準指定之方式充分能夠與其他元件通信。相容元件不需要以藉由標準指定之一方式在內部操作。除非另有明確敘述,否則應將各數值及範圍解釋為如在值或範圍之值之前之詞「大約」或「近似」之接近。
亦為描述之目的,術語耦合(「couple」、「coupling」、「coupled」)、連接(「connect」、「connecting」或「connected」)指代其中容許在兩個或兩個以上元件之間傳輸能量,及儘管不需要,然而預期插入一或多個額外元件之本技術中已知或稍後產生之任何方式。相反地,術語「直接耦合」、「直接連接」等暗示沒有此等額外元件。信號及對應節點或埠為此處之目的可藉由相同名稱指代且可互換。
應進一步瞭解熟悉本技術者可在不脫離下文申請專利範圍中表述之範疇之情況下進行用以解釋所描述實施例之本質之已描述及圖解說明之部分之細節、材料及配置之各種改變。
100‧‧‧主機裝置
101‧‧‧耦合
110‧‧‧主機可見儲存器/儲存裝置
110(1)至110(N)‧‧‧儲存裝置
120‧‧‧主機不可見儲存器/儲存裝置
120(1)至120(M)‧‧‧儲存裝置
180‧‧‧主機/儲存裝置介面
190‧‧‧插拔式儲存模組

Claims (10)

  1. 一種在一連鎖(chained)且可擴展之儲存系統中存取資料之方法,該方法包括:藉由一或多個儲存裝置之一主要代理自經由一主機介面網路耦合至該主要代理之一主機裝置接收一主機請求,該請求用以存取該一或多個儲存裝置之一邏輯位址;藉由該主要代理基於該邏輯位址判定在該一或多個儲存裝置之至少一者中之一對應實體位址;藉由該主要代理基於該實體位址產生對應於該主機請求及該一或多個儲存裝置之至少一者中之該經判定對應實體位址之各者的一子請求;藉由該主要代理經由可獨立於該主機裝置操作之一儲存裝置介面網路將該子請求發送至該至少一儲存裝置,該儲存裝置介面網路係將該等儲存裝置耦合至該主要代理之一同級間網路;及藉由該主要代理回應於該等子請求而自該至少一儲存裝置接收各自子狀態,基於每一各自子狀態判定一總體狀態,及將該總體狀態提供至該主機裝置,其中該主機裝置在不採用一網路交換器之情況下耦合至該一或多個儲存裝置。
  2. 如請求項1之方法,其中該主機介面網路不可直接存取該儲存裝置介面網路,該方法進一步包括:藉由該等儲存裝置之各者經由與自該儲存裝置介面網路分離之該主機之一各自單獨資料通信路徑發送資料通信,藉此該主機裝置與該等儲存裝置之間之控制訊務僅在該主機 裝置與該主要代理之間,而資料通信頻寬隨著該等儲存裝置之數目擴展。
  3. 如請求項1之方法,其中,該主機介面網路及該儲存裝置介面網路包括傳送媒體,該傳送媒體包括下列之至少一者:一底板、一或多個銅纜線、一或多個光纖、一或多個同軸纜線、一或多個雙絞銅線。
  4. 如請求項3之方法,其進一步包括:選擇性地將更高頻寬儲存裝置介面網路連接提供至該一或多個儲存裝置之一子集,該一或多個儲存裝置之該子集包括接近該主機裝置定位之該等儲存裝置之一或多者。
  5. 如請求項4之方法,其中該主機介面網路包括一快速周邊組件互連Gen4網路,且該儲存裝置介面網路包括下列之一或多者:一快速周邊組件互連Gen3網路、一乙太網路、一串列附接小型電腦系統介面(SAS)網路及一串列進階附接技術(SATA)網路。
  6. 如請求項1之方法,其進一步包括:在一獨立磁碟冗餘陣列(RAID)系統中採用該一或多個儲存裝置,其中該一或多個儲存裝置包括下列之至少一者:一固態磁碟(SSD)、一硬碟機(HDD)、一磁阻式隨機存取記憶體(MRAM)、一磁帶櫃及一混合磁性及固態儲存系統。
  7. 如請求項1之方法,其進一步包括:將一頻寬提供至關於該一或多個儲存裝置之一彙總可輸送頻寬之該主機介面網路,其中:該儲存裝置介面網路包括一或多個實體鏈路,各實體鏈路具有一獨立頻寬,且該一或多個實體鏈路之各者包括(i)耦合用於傳輸控制訊務 (traffic)之一相對較低頻寬邊帶,及(ii)耦合用於傳輸使用者資料訊務之一相對較高頻寬主帶。
  8. 如請求項7之方法,其中將該頻寬提供至該主機介面網路包括:將該主機介面網路之一單獨實體鏈路提供給該等儲存裝置之各者。
  9. 一種連鎖且可擴展之儲存系統,其包括:複數個儲存裝置,該等儲存裝置之至少一者係用於該複數個儲存裝置之一或多者之一主要代理;一主機裝置,其經由一主機介面網路耦合至該至少一主要代理,其中該至少一主要代理經組態以:自該主機裝置接收一主機請求,該請求用以存取該複數個儲存裝置之一或多者之一邏輯位址;基於該邏輯位址判定在該複數個儲存裝置之一或多者之至少一者中之一對應實體位址;基於該實體位址產生對應於該主機請求及該複數個儲存裝置之該一或多者中的至少一者之該經判定對應實體位址之各者的一子請求;經由可獨立於該主機裝置操作之一儲存裝置介面網路將該子請求發送至該至少一儲存裝置,該儲存裝置介面網路係將該等儲存裝置耦合至該主要代理之一同級間(peer-to-peer)網路;及回應於該等子請求而自該至少一儲存裝置接收各自子狀態,基於每一各自子狀態判定一總體狀態,及將該總體狀態提供至該主機裝置,其中該主機裝置在不採用一網路交換器之情況下耦合至該一或多個儲存裝置,其中該主機介面網路不可直接存取該儲 存裝置介面網路。
  10. 如請求項9之系統,其中:該主機裝置與該等儲存裝置之間之控制訊務僅在該主機裝置與該至少一主要代理之間,且資料頻寬隨著該等儲存裝置之數目擴展;且該儲存裝置介面網路經組態以進行下列之至少一者:選擇性地將更高頻寬連接提供至該一或多個儲存裝置之一子集;及將關於該一或多個儲存裝置之一彙總可輸送頻寬之一頻寬提供至該主機介面網路。
TW103102356A 2013-02-12 2014-01-22 連鎖且可擴展之儲存系統及在一連鎖且可擴展之儲存系統中存取資料之方法 TWI614670B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US13/765,253 2013-02-12
US13/765,253 US20130159622A1 (en) 2010-06-18 2013-02-12 Chained, scalable storage devices

Publications (2)

Publication Number Publication Date
TW201443771A TW201443771A (zh) 2014-11-16
TWI614670B true TWI614670B (zh) 2018-02-11

Family

ID=50150544

Family Applications (1)

Application Number Title Priority Date Filing Date
TW103102356A TWI614670B (zh) 2013-02-12 2014-01-22 連鎖且可擴展之儲存系統及在一連鎖且可擴展之儲存系統中存取資料之方法

Country Status (5)

Country Link
EP (1) EP2765501A1 (zh)
JP (1) JP2014154157A (zh)
KR (1) KR102171716B1 (zh)
CN (1) CN103984638A (zh)
TW (1) TWI614670B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160259754A1 (en) * 2015-03-02 2016-09-08 Samsung Electronics Co., Ltd. Hard disk drive form factor solid state drive multi-card adapter
CN111930655B (zh) * 2016-06-06 2022-01-21 合肥沛睿微电子股份有限公司 固态硬盘控制装置与方法
US10034407B2 (en) * 2016-07-22 2018-07-24 Intel Corporation Storage sled for a data center
CN107422989B (zh) * 2017-07-27 2020-04-07 深圳市云舒网络技术有限公司 一种Server SAN系统多副本读取方法及存储系统
US10359948B2 (en) 2017-08-28 2019-07-23 International Business Machines Corporation I/O performance in heterogeneous storage environments
CN113515236A (zh) * 2021-03-22 2021-10-19 谷歌有限责任公司 协同存储架构
CN115905036A (zh) * 2021-09-30 2023-04-04 华为技术有限公司 一种数据访问系统、方法及相关设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6304980B1 (en) * 1996-03-13 2001-10-16 International Business Machines Corporation Peer-to-peer backup system with failure-triggered device switching honoring reservation of primary device
US6654831B1 (en) * 2000-03-07 2003-11-25 International Business Machine Corporation Using multiple controllers together to create data spans
US20100011177A1 (en) * 2008-07-09 2010-01-14 International Business Machines Corporation Method for migration of synchronous remote copy service to a virtualization appliance

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002108798A (ja) * 2000-09-29 2002-04-12 Hoei Sangyo Kk データ転送方法、変換基板、デバイス、データ転送装置及びデータベリファイ装置
CN1304961C (zh) * 2005-03-11 2007-03-14 清华大学 基于元数据服务器的存储虚拟化管理方法
US7882174B2 (en) * 2008-09-29 2011-02-01 Microsoft Corporation Multiple parallel user experiences provided by a single set of internet hosting machines
JP2011234311A (ja) * 2010-04-30 2011-11-17 Buffalo Inc 記憶処理装置
WO2011160094A2 (en) * 2010-06-18 2011-12-22 Sandforce, Inc. Scalable storage devices
US20120144110A1 (en) * 2010-12-02 2012-06-07 Lsi Corporation Methods and structure for storage migration using storage array managed server agents

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6304980B1 (en) * 1996-03-13 2001-10-16 International Business Machines Corporation Peer-to-peer backup system with failure-triggered device switching honoring reservation of primary device
US6654831B1 (en) * 2000-03-07 2003-11-25 International Business Machine Corporation Using multiple controllers together to create data spans
US20100011177A1 (en) * 2008-07-09 2010-01-14 International Business Machines Corporation Method for migration of synchronous remote copy service to a virtualization appliance

Also Published As

Publication number Publication date
JP2014154157A (ja) 2014-08-25
CN103984638A (zh) 2014-08-13
EP2765501A1 (en) 2014-08-13
KR102171716B1 (ko) 2020-10-29
TW201443771A (zh) 2014-11-16
KR20140101684A (ko) 2014-08-20

Similar Documents

Publication Publication Date Title
TWI614670B (zh) 連鎖且可擴展之儲存系統及在一連鎖且可擴展之儲存系統中存取資料之方法
US20130159622A1 (en) Chained, scalable storage devices
TWI307034B (en) Storage virtualization subsystem and system with host-side redundancy via sas connectivity
US8589723B2 (en) Method and apparatus to provide a high availability solid state drive
US8074105B2 (en) High data availability SAS-based RAID system
US7536508B2 (en) System and method for sharing SATA drives in active-active RAID controller system
US9411764B2 (en) Optimized redundant high availability SAS topology
JP7105870B2 (ja) データアクセス方法、装置およびシステム
US9509604B1 (en) Method of configuring a system for flow based services for flash storage and associated information structure
JP5903801B2 (ja) 通信装置およびid設定方法
US11086813B1 (en) Modular non-volatile memory express storage appliance and method therefor
TW201643730A (zh) 模組化非揮發性快閃記憶體刀鋒
TW201319824A (zh) 透過虛擬序列附接式小電腦系統介面擴展器分享的伺服器直接附接儲存器
US9547616B2 (en) High bandwidth symmetrical storage controller
JP2014154157A5 (zh)
US20100241779A1 (en) Alleviating blocking cases in a sas switch
CN105045336A (zh) Jbod
KR20170086484A (ko) 기록 요청 처리 방법, 프로세서, 그리고 컴퓨터
CN104967577A (zh) Sas交换机和服务器
US9021166B2 (en) Server direct attached storage shared through physical SAS expanders
US8255737B1 (en) System and method for a redundant communication fabric in a network storage system
JP6358483B2 (ja) 不揮発性メモリベースの記憶装置において情報をルーティングする装置および方法
US9477414B1 (en) Methods and systems for improved caching with data recovery
CN106155573B (zh) 用于存储设备扩展的方法、装置以及扩展的存储设备
US9477424B1 (en) Methods and systems for using an intelligent storage adapter for replication in a clustered environment

Legal Events

Date Code Title Description
MM4A Annulment or lapse of patent due to non-payment of fees