CN101322105A - 用于重新配置存储阵列的装置和方法 - Google Patents

用于重新配置存储阵列的装置和方法 Download PDF

Info

Publication number
CN101322105A
CN101322105A CNA2006800426578A CN200680042657A CN101322105A CN 101322105 A CN101322105 A CN 101322105A CN A2006800426578 A CNA2006800426578 A CN A2006800426578A CN 200680042657 A CN200680042657 A CN 200680042657A CN 101322105 A CN101322105 A CN 101322105A
Authority
CN
China
Prior art keywords
data storage
storage device
data
assemblies
array
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2006800426578A
Other languages
English (en)
Other versions
CN101322105B (zh
Inventor
约翰·C·埃利奥特
沙·M·R·伊斯拉姆
罗伯特·A·库博
格雷格·S·卢卡斯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of CN101322105A publication Critical patent/CN101322105A/zh
Application granted granted Critical
Publication of CN101322105B publication Critical patent/CN101322105B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/1658Data re-synchronization of a redundant component, or initial sync of replacement, additional or spare unit
    • G06F11/1662Data re-synchronization of a redundant component, or initial sync of replacement, additional or spare unit the resynchronized component or unit being a persistent storage device
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2053Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
    • G06F11/2094Redundant storage or storage space
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/0604Improving or facilitating administration, e.g. storage management
    • G06F3/0605Improving or facilitating administration, e.g. storage management by facilitating the interaction with a user or administrator
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/0614Improving the reliability of storage systems
    • G06F3/0617Improving the reliability of storage systems in relation to availability
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0629Configuration or reconfiguration of storage systems
    • G06F3/0632Configuration or reconfiguration of storage systems by initialisation or re-initialisation of storage systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/0671In-line storage system
    • G06F3/0683Plurality of storage devices
    • G06F3/0689Disk arrays, e.g. RAID, JBOD

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Quality & Reliability (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

一种用于重新配置存储阵列的方法包括提供数据存储和检索系统,所述数据存储和检索系统包括N个数据存储设备组合,其中那些N个数据存储设备组合的每个包括M个数据存储设备,其中N大于等于2,并且其中M大于或等于2。所述方法配置那些N个数据存储设备组合以包括备用数据存储设备组合和包括剩余的(N-1)个数据存储设备组合的第一存储阵列。如果检测到布置在所述第一存储阵列中的故障的数据存储设备,则所述方法与布置在所述备用数据存储设备组合中的数据存储设备结合,形成包括除了所述故障的数据存储设备外的第一存储阵列的第二存储阵列。

Description

用于重新配置存储阵列的装置和方法
技术领域
本发明涉及用于重新配置存储阵列的装置和方法。
背景技术
数据存储和检索系统被用来存储由一个或多个主机计算机系统提供的信息。这样的数据存储和检索系统接收将信息写入多个数据存储设备的请求,以及从该多个数据存储设备检索信息的请求。当接收到读取请求时,该系统从多个数据存储设备调用信息,并且可选地将该信息移动到数据高速缓冲存储器。因此,系统正连续地将信息移动到多个数据存储设备并且从多个数据存储设备移动信息,以及可选地将信息移动到数据高速缓冲存储器并且从高速缓冲存储器移动信息。
配置多个数据存储设备以形成存储阵列在本领域已知。还已知利用若干RAID协议将信息写到这样的存储阵列。
发明内容
按照本发明的一个方面,提供了一种重新配置布置在数据存储和检索系统中的存储阵列的方法,所述数据存储和检索系统包括N个数据存储设备组合,其中所述N个数据存储设备组合的每个包括M个数据存储设备,其中N大于等于2,并且其中M大于或等于2,所述方法包括步骤:配置所述N个数据存储设备组合以包括备用数据存储设备组合和第一存储阵列,该第一存储阵列包括剩余的(N-1)个数据存储设备组合的;检测故障的数据存储设备,其中所述故障的数据存储设备布置在第j数据存储设备组合,其中所述第一存储阵列包括所述第j数据存储设备组合;以及与布置在所述备用数据存储设备组合的第一数据存储设备结合形成第二存储阵列,该第二存储阵列包括除了所述故障的数据存储设备外的所述第一存储阵列。
附图说明
现在将仅仅通过示例的方式并且参照以下附图描述本发明的实施例,在附图中:
图1是显示数据存储和检索系统的一个实施例的框图;
图2是显示包括两个启动器和多个数据存储设备的图1的数据存储和检索系统的框图;
图3A是显示互连到光纤通道仲裁回路开关的多个数据存储设备的框图;
图3B是显示包括六个数据存储设备组合的多个数据存储设备的框图;
图4是显示图3B的六个数据存储设备组合、以及包括这六个组合的五个的第一存储阵列和一个备用数据存储设备组合的框图;
图5是显示布置在图4的存储阵列中的故障的数据存储设备的框图,并且图示了其中被写入该故障的设备的数据被重新构建到布置在备用数据存储设备组合中的一个实施例的方法的部分;
图6是图示了一个实施例的方法的部分的框图,其中被写到布置在包括故障的数据存储设备的数据存储设备组合中的每个可操作的数据存储设备的数据,被复制到布置在备用数据存储设备组合中的不同数据存储设备;
图7是显示包括之前指定的备用数据存储设备组合的新的存储阵列的框图;
图8显示了多个数据存储设备,其中该多个数据存储设备包括图7的存储阵列和现在指定为备用组的修复的数据存储设备组合;
图9显示了包括修复的数据存储设备组合的新的存储阵列;
图10是概述本发明的一个实施例的方法的某些步骤的流程图;
图11是概述所述方法的附加步骤的流程图;以及
图12是概述所述方法的附加步骤的流程图。
具体实施方式
本发明将被描述为体现在信息存储和检索系统中,该信息存储和检索系统包括多个数据存储设备组合,其中这些数据存储设备组合的每个包括多个数据存储设备。
现在参照图1,信息存储和检索系统100能够经由通信链路395与主机计算机390通信。图1图示的实施例显示了单个的主机计算机。在其它实施例中,信息存储和检索系统能够与多个主机计算机通信。
主机计算机390包括计算机系统(如大型机、个人计算机、工作站、以及它们的组合),该计算机系统包括操作系统,如Windows、AIX、Unix、MVS、LINUX等(Windows是微软公司的注册商标;AIX是IBM公司的注册商标以及MVS是IBM公司的商标;Unix是通过开放组(Open Group)在美国和其它国家排他许可的注册商标;并且LINUX是Linus Torvald的注册商标)。在某些实施例中,主机计算机390还包括存储管理程序。在主机计算机390中的该存储管理程序可以包括在本领域中公知的管理向和从数据存储和检索系统(如在IBM MVS操作系统中实现的IBM DFSMS)传输数据的存储管理型程序的功能。
在某些实施例中,信息存储和检索系统包括多个主机适配器。在图1的图示的实施例中,系统100包括主机适配器102-105、107-110、112-115和117-120。在其它的实施例中,信息存储和检索系统包括少于16个的主机适配器。仍在其它的实施例中,信息存储和检索系统包括多于16个的主机适配器。在某些实施例中,一个或多个的主机适配器是多端口的。不管在系统的任何实施例中布置的主机适配器的数量,这些主机适配器的每个包括对中央处理/高速缓冲存储器元件130和140具有同等访问的共享资源。
每个主机适配器可以包括:一个或多个光纤通道端口、一个或多个FICON端口、一个或多个ESCON端口、或者一个或多个SCSI端口等。每个主机适配器通过互连总线121连接到集群(cluster),使得每个集群能够处理来自任何主机适配器的I/O。在每个子系统中的内部总线分别经由在处理器部分130/140和I/O部分160/170之间的远程I/O桥155/195连接。
处理器部分130包括处理器132和高速缓冲存储器134。在某些实施例中,处理器部分130还包括存储器133。在某些实施例中,存储器设备133包括随机存取存储器。在某些实施例中,存储器设备133包括非易失性存储器。
处理器部分140包括处理器142和高速缓冲存储器144。在某些实施例中,处理器部分140还包括存储器143。在某些实施例中,存储器设备143包括随机存取存储器。在某些实施例中,存储器设备143包括非易失性存储器。
I/O部分160包括多个设备适配器161,在图1图示的实施例中,其包括设备适配器165、166、167和168。I/O部分160还包括非易失性存储器(“NVS”)162和NVS 162的电池备份164。
I/O部分170包括多个设备适配器171,在图1图示的实施例中,其包括设备适配器175、176、177和178。I/O部分170还包括非易失性存储器(“NVS”)172和NVS 172的电池备份174。
在系统的某些实施例中,一个或多个主机适配器、处理器部分130和一个或多个设备适配器被布置在信息存储和检索系统中布置的第一控制卡上。类似地,在某些实施例中,一个或多个主机适配器、处理器部分140和一个或多个设备适配器被布置在信息存储和检索系统中布置的第二控制卡上。
在图1图示的实施例中,十六个数据存储设备被组织成两个阵列,即阵列180和阵列190。在图1图示的实施例显示了两个存储设备阵列。
在某些实施例中,一个或多个数据存储设备包括多个硬盘驱动器单元。在某些实施例中,阵列180和190利用RAID协议。在某些实施例中,阵列180和190包括有时所谓的JBOD阵列,即“仅仅一束盘”,其中所述阵列没有根据RAID配置。在某些实施例中,阵列180和190包括有时所谓的SBOD阵列,即“切换的一束盘”。
图1图示的实施例显示了两个存储设备阵列。在其它实施例中,系统包括单个存储设备阵列。仍在其它实施例中,系统包括多于两个的存储设备阵列。
在图2图示的实施例中,信息存储和检索系统包括开关的双光纤通道仲裁(“FC-AL”)回路,其中启动器205a和启动器205b与两个FC-AL回路相互连接。图2图示的实施例不应该被解释为限制本发明为光纤通道网络或设备的使用。在图2图示的实施例中,两个FC-AL回路的叙述包括该装置的一个实施例。在其它实施例中,其它的网络拓扑和设备被利用,包括但不限于SAS设备和/或SATA设备。
在图2图示的实施例中,启动器205a包括多个主机适配器101(图1、2)、控制元件130(图1、2)和设备适配器165(图1、2)。在图2图示的实施例中,启动器205b包括多个主机适配器111(图1、2)、控制元件140(图1、2)和设备适配器175(图1、2)。
每个FC-AL回路包含一个或多个本地控制器,如本地控制器210、220、230、240、250和260。每个本地控制器包括:开关、处理器和微代码。在某些实施例中,开关包括光纤通道开关。在某些实施例中,处理器包括SCSI附件服务(SCSI Enclosure Service,SES)处理器。例如,本地控制器210、220、230、240、250和260分别包括处理器212、222、232、242、252和262。类似地,本地控制器210、220、230、240、250和260分别包括开关214、224、234、244、254和264。此外,本地控制器210、220、230、240、250和260分别包括微代码216、226、236、246、256和266。
与多个数据存储设备270结合的本地控制器210包括第一开关域。与多个数据存储设备270结合的本地控制器240包括第二开关域。
现在参照图3A,在某些实施例中,所述装置还包括相连一个或多个开关到一个或多个数据存储设备的中平面(midplane)。在图3A图示的实施例中,控制器210(图2、3)包括光纤通道开关214(图2、3)和SES处理器212(图2、3)。多个通信链路320将光纤通道开关214互连到中平面310。多个通信链路340将数据存储设备270(图2、3)与中平面310互连。
控制器240(图2、3)包括光纤通道开关244(图2、3)和SES处理器242(图2、3)。多个通信链路330将光纤通道开关244互连到中平面310。
信号由开关214经由通信链路320、通信链路340和中平面310提供给数据存储设备270。类似地,信号由开关244经由通信链路330、通信链路340和中平面310提供给数据存储设备270。
在图3B图示的实施例中,数据存储设备270被布置在六个分开的数据存储设备组合中。参照图3A和3B,图3A的数据存储设备1、2和3包括图3B的数据存储设备组合350。图3A的数据存储设备4、5和6包括图3B的数据存储设备组合355。图3A的数据存储设备7、8和9包括图3B的数据存储设备组合360。图3A的数据存储设备10、11和12包括图3B的数据存储设备组合365。图3A的数据存储设备13、14和15包括图3B的数据存储设备组合370。图3A的数据存储设备16、17和18包括图3B的数据存储设备组合375。
在某些实施例中,数据存储设备组合350、355、360、365、370和375包括数据存储设备的逻辑分组。在某些实施例中,数据存储设备组合350、355、360、365、370和375包括数据存储设备的物理分组,其中每个物理分组包括三个数据存储设备和这三个数据存储设备与中平面310的相关联的互连。
在某些实施例中,数据存储设备的每个这种物理分组包括整体(integral)组合。在某些实施例中,数据存储设备的每个这种物理分组包括服务边界,其中在该组合中布置的任何一个数据存储设备的修复或替换要求从数据存储和检索系统移除整个数据存储设备组合。
图4显示了图3B的六个数据存储设备组合。现在参照图3B和4,每个数据存储设备组合的地址、配置和状态已知并且由SES处理器212和SES处理器242监视。现在参照图2和3,SES处理器212和242将每个数据存储设备组合以及在布置这些组合中的每个数据存储设备的状态报告给启动器205a(图2)和启动器205b(图2)。
本发明包括用于配置包括N个存储设备组合的存储阵列的方法,其中这N个存储设备组合的每个包括M个数据存储设备。例如,在图4图示的实施例中,存储阵列410包括五(5)个分开的存储设备组合,其中这五(5)个组合中的每个包括三(3)个数据存储设备。这是在图4图示的实施例中的情形,N是5并且M是3。
现在参照图10,在步骤1010,所述方法提供数据存储和检索系统,包括N个数据存储设备组合,其中这些数据存储设备组合的每个包括M个数据存储设备,其中N大于或等于2,并且其中M大于或等于2。作为示例,在图4图示的实施例中,申请人的数据存储和检索系统包括六(6)个数据存储设备组合,其中这些数据存储设备组合的每个包括三(3)个数据存储设备。在某些实施例中,步骤1010的数据存储和检索系统由数据存储服务提供商拥有和/或操作,其中该提供商提供数据存储服务给一个或多个数据存储服务客户。
在步骤1020,所述方法配置N个数据存储设备组合以包括备用数据存储设备组合和包括剩余的(N-1)个数据存储设备组合的第一存储阵列。在图4图示的实施例中,数据存储设备组合350、355、360、365和370被配置在存储阵列410中。数据存储设备组合375包括备用数据存储设备组合,其中包括组合375的数据存储设备是备用驱动器,使得这些备用驱动器不在存储阵列410中被配置。
在某些实施例中,步骤1020由处理器执行,如在数据存储和检索系统中布置的处理器132(图1)或处理器142(图1)。在某些实施例中,步骤1020由启动器执行,如布置在数据存储和检索系统中的启动器205a(图2)和启动器205b(图2)。在某些实施例中,步骤1020由与数据存储和检索系统通信的主机计算机执行。
在步骤1030,数据存储和检索系统从互连的主机计算机接收第一数据。在某些实施例中,步骤1030的第一数据包括从客户的主机计算机提供给数据存储和检索系统的客户数据。
在步骤1040,所述方法将步骤1030的第一数据写到步骤1020的第一存储阵列。在某些实施例中,步骤1040包括利用RAID协议将该第一数据写入第一存储阵列。在某些实施例中,该RAID协议包括但不限于RAID 1协议。在某些实施例中,RAID协议包括但不限于RAID 5协议。在某些实施例中,RAID协议包括但不限于RAID 10协议。在某些实施例中,步骤1040包括利用客户定义的存储协议将该第一数据写入第一存储阵列,其中该客户定义的存储协议包括将第一数据写入多于1的数据存储设备。
现在参照图5和10,在步骤1050,所述方法检测故障的数据存储设备(如存储设备510),其中步骤1020的第一存储阵列(如存储阵列410(图4))包括该故障的设备。在某些实施例中,步骤1050由SES处理器(如与故障设备通信的SES处理器212(图2)、或SES处理器222(图2)、或SES处理器232(图2)、或SES处理器242(图2)、或SES处理器252(图2)、或SES处理器262(图2))执行。在某些实施例中,步骤1050由存储RAID控制器启动器(如启动器205a(图2)或启动器205b(图2))执行。
所述方法从步骤1050转到步骤1060,其中所述方法与备用数据存储设备(如存储设备520(图5))结合,形成包括第一存储阵列的第二存储阵列,所述备用数据存储设备布置在备用数据存储设备组合(如组合375(图4))中,其中该第二存储阵列不包括故障的数据存储设备(如设备510(图5))。在某些实施例中,步骤1060由布置在数据存储和检索系统中的处理器(如处理器132(图1)或142(图1))执行。在某些实施例中,步骤1060由布置在数据存储和检索系统中的启动器(如启动器205a(图2)或启动器205b(图2))执行。在某些实施例中,步骤1060由与数据存储和检索系统通信的主机计算机执行。
所述方法从步骤1060转到步骤1070,其中所述方法将写到故障的数据存储设备(如数据存储设备510(图5))的第一数据,重建到在步骤1060的第二存储阵列中配置的新添加的数据存储设备(如设备520(图5))。在某些实施例中,步骤1070的重建方法是在步骤1040选择的存储协议的功能。例如,如果使用RAID 1协议,则步骤1070包括为故障的存储设备标识“镜像的”存储设备,并且将数据从该“镜像的”设备复制到步骤1060的新选择的数据存储设备。另一方面,如果在步骤1040选择RAID 5协议,则步骤1070包括使用本领域技术人员公知的方法和XOR功能重建写到故障的存储设备的数据。
在某些实施例中,步骤1070由在数据存储和检索系统中布置的处理器(如处理器132(图1)或处理器142(图1))执行。在某些实施例中,步骤1070由在数据存储和检索系统中布置的启动器(如启动器205a(图2)或启动器205b(图2))执行。在某些实施例中,步骤1070由与数据存储和检索系统通信的主机计算机执行。
在步骤1080,数据存储和检索系统接收第二数据,即在配置步骤1060的第二存储阵列之后接收的数据。在某些实施例中,步骤1080的第二数据包括由与数据存储和检索系统(如系统100)通信的、一个或多个客户拥有的和/或操作的主机计算机提供的客户数据。所述方法从步骤1080转到步骤1090,其中所述方法将步骤1080的第二数据写到步骤1060的第二存储阵列。
在某些实施例中,所述方法在步骤1090结束。在其它实施例中,并且现在参照图6和11,所述方法从步骤1090转到步骤1110,其中所述方法将写到布置在包括如数据存储设备组合370的故障的数据存储设备的数据存储设备组合中的每个操作的数据存储设备(如数据存储设备610和630)的第一数据和第二数据,拷贝到在如组合375的数据存储设备组合中布置的不同的数据存储设备(如设备620和640),(如该数据存储设备组合包括在步骤1060(图10)的第二存储阵列中配置的数据存储设备设备520(图5))。
所述方法从步骤1110转到步骤1120,其中所述方法与备用数据存储设备组合(如组375)结合,形成包括第一存储阵列的第三存储阵列(如存储阵列710(图7)),其中第三存储阵列不包括包括故障的数据存储设备(如设备510)的数据存储设备组合(如组合375)。在某些实施例中,步骤1120由在数据存储和检索系统中布置的处理器(如处理器132(图1)或处理器142(图1)的处理器)执行。在某些实施例中,步骤1120由在数据存储和检索系统中布置的启动器(如启动器205a(图2)或启动器205b(图2))执行。在某些实施例中,步骤1120由与数据存储和检索系统通信的主机计算机执行。
在步骤1130,所述方法从数据存储和检索系统移除包括故障的数据存储设备的数据存储设备组合。在某些实施例中,步骤1130由数据存储和检索系统的拥有者/操作者执行。在其它实施例中,步骤1130由现场服务人员执行。
在步骤1140,所述方法确定是否故障的数据存储设备能够被修复。在某些实施例中,步骤1140还包括确定是否故障的数据存储设备能够被及时修复,即在希望的时间间隔内修复。如果所述方法在步骤1140确定故障的数据存储设备不能够被修复,或者不能在希望的时间间隔内修复,则所述方法从步骤1140转到步骤1150,其中所述方法提供替换数据存储设备。所述方法从步骤1150转到步骤1160,其中所述方法利用步骤1150的替换数据存储设备修复在步骤1130中被移除的数据存储设备组合。所述方法从步骤1160转到步骤1180。
如果所述方法在步骤1140确定故障的数据存储设备能够被修复或者在希望的时间间隔内被修复,则所述方法从步骤1140转到步骤1170,其中所述方法修复故障的数据存储设备。所述方法从步骤1170转到步骤1180,其中所述方法在数据存储和检索系统中安装包括被修复/被替换的数据存储设备820的数据存储设备组合(图8)。
所述方法从步骤1180转到步骤1210(图12),其中所述方法确定是否重新配置步骤1120的第三存储阵列。在某些实施例中,步骤1210(图12)由数据存储和检索系统的拥有者/操作者执行。在某些实施例中,步骤1210(图12)由与数据存储和检索系统通信的主机计算机执行。
参照图8和12,如果所述方法选择不重新配置第三存储阵列,则所述方法从步骤1210转到步骤1220,其中所述方法指定在步骤1180中安装的数据存储设备组合(如组810)为备用数据存储设备组合。在某些实施例中,步骤1220由在数据存储和检索系统中布置的处理器(如处理器132或处理器142(图1))执行。在某些实施例中,步骤1220由在数据存储和检索系统中布置的启动器(如启动器205a(图2)或启动器205b(图2))执行。在某些实施例中,步骤1220由与数据存储和检索系统通信的主机计算机执行。所述方法从步骤1220转到步骤1030,并且如在此描述的那样继续。
现在参照图8、9、10、11和12,如果所述方法选择重新配置步骤1120的第三存储阵列以包括在步骤1180安装的数据存储设备组合,则所述方法从步骤1210转到步骤1230,其中所述方法将写到在步骤1020(图10)的备用数据存储设备组合中布置的每个数据存储设备的第一和第二数据拷贝到包括在步骤1180(图11)安装的数据存储设备组合(如组合810(图8))的数据存储设备的不同的一个。例如,使用图9图示的实施例,步骤1230包括从数据存储设备520拷贝第一和第二数据到数据存储设备820,并且包括从数据存储设备620拷贝第一和第二数据到数据存储设备610,并且包括从数据存储设备640拷贝第一和第二数据到数据存储设备630。
所述方法从步骤1230转到步骤1240,其中所述方法与在步骤1180(图11)安装的数据存储设备组合(如组合810(图8))结合,形成包括第三存储阵列(如阵列710(图7、8))的第四存储阵列(如存储阵列920),其中该第四存储阵列不包括之前在步骤1020(图10)指定的备用组合(如组合375)的数据存储设备组合。在某些实施例中,步骤1240由在数据存储和检索系统中布置的处理器(如处理器132(图1)或处理器142(图1))执行。在某些实施例中,步骤1240由在数据存储和检索系统中布置的启动器(如启动器205a(图2)或启动器205b(图2))执行。在某些实施例中,步骤1240由与数据存储和检索系统通信的主机计算机执行。
所述方法从步骤1240转到步骤1250,其中所述方法将之前在步骤1020(图10)指定的备用组、和之前在步骤1120(图11)的第三存储阵列中配置的数据存储设备组合(如组合375),指定为备用数据存储设备组合。在某些实施例中,步骤1250由在数据存储和检索系统中布置的处理器(如处理器132(图1)或处理器142(图1))执行。在某些实施例中,步骤1250由在数据存储和检索系统中布置的启动器(如启动器205a(图2)或启动器205b(图2))执行。在某些实施例中,步骤1250由与数据存储和检索系统通信的主机计算机执行。所述方法从步骤1250转到步骤1030,并且如在此描述的那样继续。
在某些实施例中,在图10、11和/或12中描述的个别步骤可以被组合、删除和重新排序。
在某些实施例中,本发明包括驻留在布置于中央处理/高速缓冲存储器元件130(图1、2)和140(图1、2)的存储器中的指令,其中这些指令分别由处理器(如处理器132(图1)或处理器142(图1))执行,以执行在图10中描述的步骤1020、1030、1040、1050、1060、1070、1080和/或1090、和/或在图11中描述的步骤1110和/或1120、和/或在图12中描述的步骤1210、1220、1230、1240和/或1250。
在其它实施例中,本发明包括驻留在任何其它的计算机程序产品中的指令,其中这些指令由系统100外部或内部的计算机执行,以执行在图10中描述的步骤1020、1030、1040、1050、1060、1070、1080和/或1090,和/或在图11描述的步骤1110和/或1120、和/或在图12描述的步骤1210、1220、1230、1240和/或1250。在任何一种情形中,各指令可以在信息存储介质中编码,该信息存储介质包括:例如磁信息存储介质、光信息存储介质、电子信息存储介质等。对于“电子信息存储介质”,申请人意指:例如,如PROM、EPROM、快闪PROM、致密闪存、智能介质等的器件。
尽管已经详细说明本发明的优选实施例,但是可以出现对这些实施例的修改和改编而不偏离在权利要求中阐明的本发明的范围对于本领域技术人员是显而易见的。

Claims (17)

1.一种重新配置在包括N个数据存储设备组合的数据存储和检索系统中布置的存储阵列的方法,其中所述N个数据存储设备组合的每个包括M个数据存储设备,其中N大于等于2,并且其中M大于或等于2,所述方法包括步骤:
配置所述N个数据存储设备组合以包括备用数据存储设备组合和包括剩余的(N-1)个数据存储设备组合的第一存储阵列;
检测故障的数据存储设备,其中所述故障的数据存储设备被布置在第j数据存储设备组合中,其中所述第一存储阵列包括所述第j数据存储设备组合;以及
与布置在所述备用数据存储设备组合中的第一数据存储设备结合,形成包括除了所述故障的数据存储设备外的所述第一存储阵列的第二存储阵列。
2.如权利要求1所述的方法,其中所述检测步骤由与所述N个数据存储设备组合的每个互连的SCSI附件服务SES处理器执行。
3.如权利要求2所述的方法,其中配置步骤和形成第二存储阵列步骤由与SES处理器互连的启动器执行。
4.如前面任何一项权利要求所述的方法,还包括各步骤:
在检测所述故障的数据存储设备之前将第一数据写到所述存储阵列;
在所述第一数据存储设备上重建写到所述故障的数据存储设备的第一数据;
将第二数据写到所述第二存储阵列。
5.如权利要求4所述的方法,还包括各步骤:
将写到布置在所述第j数据存储设备组合中的每个操作的数据存储设备的第一数据和第二数据复制到不同的数据存储设备,而不是布置在备用数据存储设备组合中的所述第一数据存储设备;
与所述备用数据存储设备组合结合,形成包括除了所述第j数据存储设备组合的所述第一存储阵列的第三存储阵列。
6.如权利要求3至5任何一项所述的方法,其中所述复制步骤和形成第三存储阵列步骤由启动器执行。
7.如权利要求5所述的方法,还包括各步骤:
从所述数据存储和检索系统移除所述第j数据存储设备组合;
确定是否所述故障的数据存储设备能够被修复;
如果所述故障的数据存储设备能够被修复,则通过修复所述故障的数据存储设备修复所述第j数据存储设备组合,
如果所述故障的数据存储设备不能够被修复:
则提供替换数据存储设备;
通过用所述替换数据存储设备替换所述故障的数据存储设备,修复所述第j数据存储设备组合。
8.如权利要求7所述的方法,还包括步骤:在所述数据存储和检索系统中安装所述被修复的第j数据存储设备组合。
9.权利要求8所述的方法,还包括步骤:指定所述被修复的第j数据存储设备组合为备用数据存储设备组合。
10.如权利要求9所述的方法,其中所述指定步骤由所述启动器执行。
11.如权利要求8所述的方法,还包括各步骤:
将写到布置在所述备用数据存储设备组合中的每个数据存储设备的第一数据和第二数据,复制到布置在所述被修复的第j数据存储设备组合中的不同的数据存储设备;
与所述被修复的第j数据存储设备组合结合,形成包括除了所述备用数据存储设备组合的所述第三存储阵列的第四存储阵列。
12.一种计算机程序产品,包括计算机可用的介质,其包含布置于其中计算机可读的程序代码,用来重新配置布置在数据存储和检索系统中的包括N个数据存储设备组合的存储阵列,其中所述N个数据存储设备组合的每个包括M个数据存储设备,其中N大于或等于2,并且其中M大于或等于2,该计算机可读程序代码在被执行时执行如权利要求1至11任何一项中定义的各步骤。
13.一种用于提供数据存储服务给数据存储服务用户的方法,包括各步骤:
由数据存储服务提供商提供包括N个数据存储设备组合的数据存储和检索系统,其中所述N个数据存储设备组合的每个包括M个数据存储设备,其中N大于或等于2,并且其中M大于或等于2;
配置所述N数据存储设备组合以包括备用数据存储设备组合和包括剩余的(N-1)个数据存储设备组合的第一存储阵列;
接收第一用户数据;
将所述第一用户数据写入所述第一存储阵列;
检测故障的数据存储设备,其中所述故障的数据存储设备被布置在第j数据存储设备组合中,其中所述第一存储阵列包括所述第j数据存储设备组合;
与布置在所述备用数据存储设备组合中的第一数据存储设备结合,形成包括除了所述故障的数据存储设备外的所述第一存储阵列的第二存储阵列;
在所述第一数据存储设备上重建写到所述故障的数据存储设备的第一数据;
接收第二用户数据;
将所述第二用户数据写到所述第二存储阵列。
14.如权利要求13所述的方法,还包括步骤:
将第一用户数据和第二用户数据从布置在所述第j数据存储设备组合中的每个可操作的数据存储设备,复制到布置在备用数据存储设备组合中的不同于所述第一数据存储设备的不同的数据存储设备;
与所述备用数据存储设备组合结合,形成包括除了所述第j数据存储设备组合的所述第一存储阵列的第三存储阵列。
15.一种布置在数据存储和检索系统内的开关域,包括:
SCSI附件服务SES处理器;
与所述SES处理器互连的开关;
与所述开关通信的N个数据存储设备组合,其中所述N个数据存储设备组合的每个包括M个数据存储设备,其中N大于或等于2,并且其中M大于或等于2。
16.如权利要求15所述的开关域,还包括:
中平面;
互连所述中平面和所述开关的第一多个通信链路;以及
将所述N个数据存储设备组合与所述中平面互连的第二多个通信链路。
17.一种数据存储和检索系统,包括:
SCSI附件服务SES处理器;
与所述SES处理器互连的开关;
与所述开关通信的N个数据存储设备组合,其中所述N个数据存储设备组合的每个包括M个数据存储设备,其中N大于或等于2,并且其中M大于或等于2;
中平面;
互连所述中平面和所述开关的第一多个通信链路;以及
将所述N个数据存储设备组合与所述中平面互连的第二多个通信链路。
CN2006800426578A 2005-11-16 2006-11-09 用于重新配置存储阵列的装置和方法 Expired - Fee Related CN101322105B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US11/281,307 2005-11-16
US11/281,307 US7418623B2 (en) 2005-11-16 2005-11-16 Apparatus and method to reconfigure a storage array
PCT/EP2006/068272 WO2007057339A2 (en) 2005-11-16 2006-11-09 Apparatus and method to reconfigure a storage array

Publications (2)

Publication Number Publication Date
CN101322105A true CN101322105A (zh) 2008-12-10
CN101322105B CN101322105B (zh) 2010-12-08

Family

ID=37963503

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2006800426578A Expired - Fee Related CN101322105B (zh) 2005-11-16 2006-11-09 用于重新配置存储阵列的装置和方法

Country Status (5)

Country Link
US (1) US7418623B2 (zh)
EP (1) EP1949237B1 (zh)
JP (1) JP4963123B2 (zh)
CN (1) CN101322105B (zh)
WO (1) WO2007057339A2 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102522121A (zh) * 2011-12-13 2012-06-27 记忆科技(深圳)有限公司 固态硬盘自动修复的方法及其固态硬盘
WO2018029584A1 (en) * 2016-08-10 2018-02-15 International Business Machines Corporation Mass storage devices packages and software-defined arrays of such packages

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070113006A1 (en) * 2005-11-16 2007-05-17 Elliott John C Apparatus and method to configure one or more storage arrays
US7506200B2 (en) * 2006-01-25 2009-03-17 International Business Machines Corporation Apparatus and method to reconfigure a storage array disposed in a data storage system
US7506201B2 (en) * 2006-08-28 2009-03-17 International Business Machines Corporation System and method of repair management for RAID arrays
US7941628B2 (en) * 2007-09-04 2011-05-10 International Business Machines Corporation Allocation of heterogeneous storage devices to spares and storage arrays
KR20110088240A (ko) * 2010-01-28 2011-08-03 삼성전자주식회사 스토리지 시스템과 상기 시스템의 데이터 처리 방법
US8566354B2 (en) * 2010-04-26 2013-10-22 Cleversafe, Inc. Storage and retrieval of required slices in a dispersed storage network
JP5776436B2 (ja) 2011-08-22 2015-09-09 富士通株式会社 ストレージシステム、ストレージ制御装置およびストレージ制御方法
US9655284B2 (en) 2013-06-11 2017-05-16 Seagate Technology Llc Modular fan assembly
US9468126B2 (en) 2013-06-11 2016-10-11 Seagate Technology Llc Multi-device storage enclosure with extendable device support sleds
US9192078B2 (en) 2013-06-11 2015-11-17 Seagate Technology Llc Maintaining thermal uniformity among devices in a multi-device enclosure
JP6213130B2 (ja) * 2013-10-09 2017-10-18 富士通株式会社 ストレージ制御装置、ストレージ制御プログラム及びストレージ制御方法
WO2015175720A1 (en) * 2014-05-13 2015-11-19 Netapp, Inc. Storage operations utilizing a multiple-data-storage-devices cartridge
US9430152B2 (en) 2014-05-13 2016-08-30 Netapp, Inc. Data device grouping across data storage device enclosures for synchronized data maintenance
US9766677B2 (en) 2014-05-13 2017-09-19 Netapp, Inc. Cascading startup power draws of enclosures across a network
US9557938B2 (en) 2014-05-13 2017-01-31 Netapp, Inc. Data retrieval based on storage device activation schedules
US9424156B2 (en) * 2014-05-13 2016-08-23 Netapp, Inc. Identifying a potential failure event for a data storage device
US9430149B2 (en) 2014-05-13 2016-08-30 Netapp, Inc. Pipeline planning for low latency storage system
US9241427B1 (en) 2014-07-30 2016-01-19 Seagate Technology Llc Airfoil to provide directed cooling
CN111124263B (zh) 2018-10-31 2023-10-27 伊姆西Ip控股有限责任公司 用于管理多个盘的方法、电子设备以及计算机程序产品
US10983885B2 (en) * 2018-11-29 2021-04-20 International Business Machines Corporation Recovering storage devices in a storage array having errors
US11455402B2 (en) 2019-01-30 2022-09-27 Seagate Technology Llc Non-volatile memory with precise write-once protection

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5146588A (en) 1990-11-26 1992-09-08 Storage Technology Corporation Redundancy accumulator for disk drive array memory
US5301297A (en) 1991-07-03 1994-04-05 Ibm Corp. (International Business Machines Corp.) Method and means for managing RAID 5 DASD arrays having RAID DASD arrays as logical devices thereof
JP2912802B2 (ja) * 1993-10-14 1999-06-28 富士通株式会社 ディスクアレイ装置の故障対処方法および装置
US5632012A (en) * 1993-11-24 1997-05-20 Storage Technology Corporation Disk scrubbing system
US5566316A (en) * 1994-02-10 1996-10-15 Storage Technology Corporation Method and apparatus for hierarchical management of data storage elements in an array storage device
JPH0916343A (ja) * 1995-06-30 1997-01-17 Toshiba Corp ディスクドライブシステム
US5951691A (en) * 1997-05-16 1999-09-14 International Business Machines Corporation Method and system for detection and reconstruction of corrupted data in a data storage subsystem
US6725392B1 (en) * 1999-03-03 2004-04-20 Adaptec, Inc. Controller fault recovery system for a distributed file system
US6598174B1 (en) * 2000-04-26 2003-07-22 Dell Products L.P. Method and apparatus for storage unit replacement in non-redundant array
US6990547B2 (en) 2001-01-29 2006-01-24 Adaptec, Inc. Replacing file system processors by hot swapping
US7017107B2 (en) * 2001-04-30 2006-03-21 Sun Microsystems, Inc. Storage array employing scrubbing operations at the disk-controller level
JP2002358795A (ja) * 2001-05-31 2002-12-13 Hitachi Ltd 不揮発性半導体記憶装置および製造方法
US6845465B2 (en) 2001-09-17 2005-01-18 Sun Microsystems, Inc. Method and system for leveraging spares in a data storage system including a plurality of disk drives
US6880101B2 (en) * 2001-10-12 2005-04-12 Dell Products L.P. System and method for providing automatic data restoration after a storage device failure
US6751136B2 (en) 2002-06-17 2004-06-15 Lsi Logic Corporation Drive failure recovery via capacity reconfiguration
US7024586B2 (en) * 2002-06-24 2006-04-04 Network Appliance, Inc. Using file system information in raid data reconstruction and migration
JP2004272527A (ja) * 2003-03-07 2004-09-30 Hitachi Ltd ディスクアレイ装置および障害回復制御方法
JP2005050007A (ja) * 2003-07-31 2005-02-24 Hitachi Ltd ストレージシステムおよびその利用方法
US7225208B2 (en) * 2003-09-30 2007-05-29 Iron Mountain Incorporated Systems and methods for backing up data files
JP4493321B2 (ja) * 2003-11-19 2010-06-30 株式会社日立製作所 ディスクアレイ装置及びデータ退避方法
JP4426262B2 (ja) * 2003-11-26 2010-03-03 株式会社日立製作所 ディスクアレイ装置及びディスクアレイ装置の障害回避方法
US7308532B1 (en) * 2004-11-12 2007-12-11 Sun Microsystems, Inc. Method for dynamically implementing N+K redundancy in a storage subsystem

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102522121A (zh) * 2011-12-13 2012-06-27 记忆科技(深圳)有限公司 固态硬盘自动修复的方法及其固态硬盘
CN102522121B (zh) * 2011-12-13 2015-09-02 记忆科技(深圳)有限公司 固态硬盘自动修复的方法及其固态硬盘
WO2018029584A1 (en) * 2016-08-10 2018-02-15 International Business Machines Corporation Mass storage devices packages and software-defined arrays of such packages
GB2567766A (en) * 2016-08-10 2019-04-24 Ibm Mass storage devices packages and software-defined arrays of such packages

Also Published As

Publication number Publication date
WO2007057339A2 (en) 2007-05-24
US7418623B2 (en) 2008-08-26
JP4963123B2 (ja) 2012-06-27
US20070109883A1 (en) 2007-05-17
WO2007057339A3 (en) 2008-05-22
JP2009516282A (ja) 2009-04-16
EP1949237A2 (en) 2008-07-30
EP1949237B1 (en) 2014-02-26
CN101322105B (zh) 2010-12-08

Similar Documents

Publication Publication Date Title
CN101322105B (zh) 用于重新配置存储阵列的装置和方法
CN100458677C (zh) 配置一个或多个存储阵列的装置与方法
CN1968292B (zh) 在存储阵列中分配网络地址的系统与方法
US8626936B2 (en) Protocol independent server replacement and replication in a storage area network
US6571354B1 (en) Method and apparatus for storage unit replacement according to array priority
CN100480980C (zh) 重新配置布置在数据存储系统中的存储阵列的装置和方法
KR20110044858A (ko) 데이터 센터들에 걸쳐 데이터 서버들내 데이터 무결정의 유지
AU692316B2 (en) Recovery method for a high availability data processing system
CN102576323B (zh) 一种促进存储系统中的数据的复制的方法和系统
CN107870731B (zh) 独立盘冗余阵列系统的管理方法和电子设备
CN103136075A (zh) 磁盘系统、数据保存装置以及磁盘设备
US8015437B2 (en) Restoring data to a distributed storage node
CN101957728B (zh) 用于向本地物理卷复制远程虚拟卷的装置和方法
US20070234107A1 (en) Dynamic storage data protection
US7506201B2 (en) System and method of repair management for RAID arrays
JP2005122453A (ja) ストレージ装置のディスクコントローラ制御方式およびストレージ装置
WO2010100018A1 (en) Managing redundant non-volatile storage backup in a multi-cluster data storage system
US7743201B2 (en) Apparatus and method to assign addresses to a plurality of information storage devices
CN112445652A (zh) 远程复制系统
US8443235B2 (en) Storage system and known problem information management method
Warrick et al. The IBM TotalStorage DS6000 series: Concepts and architecture

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20101208

Termination date: 20181109

CF01 Termination of patent right due to non-payment of annual fee