CN103136075A - 磁盘系统、数据保存装置以及磁盘设备 - Google Patents

磁盘系统、数据保存装置以及磁盘设备 Download PDF

Info

Publication number
CN103136075A
CN103136075A CN2012105132417A CN201210513241A CN103136075A CN 103136075 A CN103136075 A CN 103136075A CN 2012105132417 A CN2012105132417 A CN 2012105132417A CN 201210513241 A CN201210513241 A CN 201210513241A CN 103136075 A CN103136075 A CN 103136075A
Authority
CN
China
Prior art keywords
disc driver
data
mentioned
unit
stand
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2012105132417A
Other languages
English (en)
Inventor
斋藤伸介
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Buffalo Inc
Original Assignee
Buffalo Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Buffalo Inc filed Critical Buffalo Inc
Publication of CN103136075A publication Critical patent/CN103136075A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2053Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
    • G06F11/2094Redundant storage or storage space
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/08Error detection or correction by redundancy in data representation, e.g. by using checking codes
    • G06F11/10Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's
    • G06F11/1076Parity data used in redundant arrays of independent storages, e.g. in RAID systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/1658Data re-synchronization of a redundant component, or initial sync of replacement, additional or spare unit
    • G06F11/1662Data re-synchronization of a redundant component, or initial sync of replacement, additional or spare unit the resynchronized component or unit being a persistent storage device
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2211/00Indexing scheme relating to details of data-processing equipment not covered by groups G06F3/00 - G06F13/00
    • G06F2211/10Indexing scheme relating to G06F11/10
    • G06F2211/1002Indexing scheme relating to G06F11/1076
    • G06F2211/1059Parity-single bit-RAID5, i.e. RAID 5 implementations

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明提供一种磁盘系统、数据保存装置以及磁盘设备,当检测出数据阵列(10)内的磁盘驱动器(12)发生故障时,向备用设备(2)询问是否存在满足与检测出故障的磁盘驱动器(12)相同的容量且当前未被使用的条件的磁盘驱动器(22),从响应了该询问的备用设备(2)接收与满足条件的磁盘驱动器(22)相关的信息,将该满足条件的磁盘驱动器(22)作为检测出故障的磁盘驱动器(12)的代替进行挂载。

Description

磁盘系统、数据保存装置以及磁盘设备
技术领域
本发明涉及一种磁盘系统、数据保存装置以及磁盘设备。
背景技术
随着数字数据的重要性的增加,设备发生故障时的数据保护成为重要的课题。在这样的背景下,作为使用多个磁盘装置来构成存在冗余性的数据保存机构的方法,想到被称为RAID(Redundant Arrays of Inexpensive Disks:磁盘阵列)的磁盘系统(Patterson,David,Garth A.Gibson,Randy  Katz(1988).”ACase for Redundant Arrays of InexpensiveDisks(RAID)”.SIGMOD Conference.pp.109-116.)。
如图7例示那样,该磁盘系统基本具备磁盘控制器11’、多个(n台)磁盘驱动器12’a、12’b、…12’n。在该磁盘系统中,例如,使用被称为5级RAID的技术时的动作如下。
磁盘控制器11’接收成为写入对象的数据,将接收到的该数据分割成数据块。磁盘控制器11’对分割获得的每n-1个的数据块进行奇偶信息(parity)的运算,生成至少一个由n-1个数据块和奇偶信息构成的组。然后,磁盘控制器11’将这些由n-1个数据块和奇偶信息构成的组分散地写入到n台磁盘装置中。此时,针对每个由n-1个数据块和奇偶信息构成的组,将保存奇偶信息的磁盘装置从磁盘驱动器12’a依次切换到12’n。
如果事先这样设定,则即使假如一个磁盘驱动器12’x发生故障,也能够根据其它磁盘驱动器中保存的数据块以及奇偶信息来再现原来的数据块。另外,根据再现得到的原来的数据块、奇偶信息,能够再现由n-1个数据块和奇偶信息构成的组(RAID的重构)。
例如,日本特开2005-293547号公报中公开的技术所涉及的装置具备多个磁盘单元。公开如下的技术:该磁盘单元各自具备多个磁盘驱动器,由这些磁盘驱动器分别构成RAID。在此,在某一个磁盘驱动器发生故障时,将该发生故障的磁盘驱动器作为故障驱动器,从单元ID与故障驱动器的单元ID不同的单元搜索作为备用的驱动器,如果搜索到的话,通过后台处理执行RAID组的数据重构。
然而,在上述装置中,并非只要是被设定为备用的磁盘装置就一定能够代替故障磁盘,没有考虑与可代替性相关的条件。也就是说,需要在磁盘单元中包含的磁盘装置能够相互作为备用进行动作这样的条件下构成单元。在实际的运用中不能够容易地使这样的条件满足。
本发明是鉴于上述实际情况而完成的,其目的之一在于提供一种适合实际运用的能够提高可用性的磁盘系统、数据保存装置以及磁盘设备。
发明内容
本发明的一个方式所涉及的磁盘系统具备:数据保存装置,其保存数据,具备至少一个数据阵列,该至少一个数据阵列分别包含构成RAID的多个磁盘驱动器;以及备用设备,其包含至少一个作为备用的磁盘驱动器,该磁盘系统还具备:检测上述数据阵列内的磁盘驱动器的故障的单元;向上述备用设备询问是否存在满足与检测出故障的磁盘驱动器相同的容量且当前未被使用的条件的磁盘驱动器的单元;以及从响应了上述询问的上述备用设备接收与满足上述条件的磁盘驱动器相关的信息并将满足该条件的磁盘驱动器作为上述检测出故障的磁盘驱动器的代替而进行挂载的单元。
本发明的另一个方式所涉及的数据保存装置,其保存数据,具备至少一个数据阵列,能够进行通信地与包含至少一个作为备用的磁盘驱动器的备用设备连接,该至少一个数据阵列分别包含构成RAID的多个磁盘驱动器,该数据保存装置还具备:检测上述数据阵列内的磁盘驱动器的故障的单元;向上述备用设备询问是否存在满足与检测出故障的磁盘驱动器相同的容量且当前未被使用的条件的磁盘驱动器的单元;以及从响应了上述询问的上述备用设备接收与满足上述条件的磁盘驱动器相关的信息并将满足该条件的磁盘驱动器作为上述检测出故障的磁盘驱动器的代替而进行挂载的单元。
另外,在上述数据保存装置中,也可以经由通信单元与上述备用设备之间进行通信,该通信单元包括:控制信息通信单元,其发送接收询问和与磁盘驱动器相关的信息;以及数据通信单元,其发送记录在作为备用的磁盘驱动器中的数据或者从该作为备用的磁盘驱动器读取的数据。
本发明的再一个方式所涉及的磁盘设备,其包含至少一个作为备用的磁盘驱动器,能够进行通信地与数据保存装置连接,该数据保存装置保存数据,具备至少一个数据阵列,该至少一个数据阵列分别包含构成RAID的多个磁盘驱动器,该磁盘设备还具备:从上述数据保存装置接收上述作为备用的磁盘驱动器中是否存在满足与检测出故障的磁盘驱动器相同的容量且当前未被使用的条件的磁盘驱动器的询问的单元;响应上述询问而搜索上述作为备用的磁盘驱动器中的满足上述条件的磁盘驱动器的单元;以及当搜索到满足上述条件的磁盘驱动器时将用于挂载通过该搜索找到的磁盘驱动器的信息发送到作为上述询问的源的数据保存装置的单元。此时,也可以还具备显示单元,该显示单元显示表示通过上述搜索找到的磁盘驱动器的挂载目的地的信息。
通过上面的结构,还能够适合实际的运用,提高可用性。
附图说明
图1是表示本发明的实施方式的一个侧面(aspect)所涉及的磁盘系统的结构例的框图。
图2是表示本发明的实施方式的一个侧面所涉及的数据阵列的磁盘控制器的例子的功能框图。
图3是表示本发明的实施方式的一个侧面所涉及的备用设备的磁盘控制器的例子的功能框图。
图4是表示本发明的实施方式的一个侧面所涉及的数据阵列中的数据的保存状况的例子的说明图。
图5是表示本发明的实施方式的一个侧面所涉及的磁盘系统的动作例的流程图。
图6是表示本发明的实施方式的一个侧面所涉及的备用设备的其它例子的结构框图。
图7是表示一般的数据阵列的结构例的框图。
具体实施方式
如图1例示那样,本发明的实施方式的一个侧面所涉及的磁盘系统包含:数据保存装置1,其具备至少一个数据阵列10;以及备用设备2,其包含至少一个作为备用的磁盘驱动器。
数据保存装置1的数据阵列10构成为分别包含磁盘控制器11、多个磁盘驱动器12a、12b、…12n以及通信部13。另外,备用设备2是磁盘设备,构成为包含磁盘控制器21、至少一个磁盘驱动器22(在存在多个的情况下为22a、22b、…22n)以及通信部23。
在数据阵列10和备用设备2的壳体内,例如,如图1的其概要所图示那样,磁盘驱动器12、磁盘驱动器22排列成一列(或者也可以为n×m台的矩阵状)。
数据阵列10的磁盘控制器11例如包含CPU等处理器、存储器等存储部、以及因特尔公司生产的82801IB ICH9RAID(ICH9R)等I/O控制器、其它外围电路(时钟发生器、电源管理电路、USB(Universal Serial Bus:通用串行总线)接口电路等)。
该磁盘控制器11通过处理器按照保存在该存储部的程序进行动作来实现下面的功能。即,该磁盘控制器11从使用者接收构成RAID的磁盘数量、指定的RAID的等级,在该指定的方式中,通过多个磁盘驱动器12a、12b、…12n构成RAID。另外,该磁盘控制器11作为检测磁盘驱动器12a、12b、…12n的故障的单元而发挥功能。然后,磁盘控制器11当检测出某一磁盘驱动器12发生故障时,经由通信部13向备用设备2询问是否存在满足与检测出该故障的磁盘驱动器12相同的容量且当前未被使用的条件的磁盘驱动器22。然后,备用设备2响应该询问,发送与满足具有与检测出故障的磁盘驱动器12相同的容量且当前未被使用的条件的磁盘驱动器22相关的信息,磁盘控制器11当经由通信部13接收到该信息时,将满足该条件的磁盘驱动器22作为检测出故障的磁盘驱动器12的代替而进行挂载,在由使用者重新指定的方式中重构RAID。关于该磁盘控制器11的详细动作在后面说明。
通信部13在磁盘阵列10与备用设备2之间发送接收信息。关于该通信部13的具体结构,根据磁盘阵列10与备用设备2进行怎样的配置而不同,但例如在它们被收纳于同一个服务器机架的情况下,该通信部13也可以是USB接口。另外,在磁盘阵列10与备用设备2经由因特网等网络通信线路相互进行连接的情况下,通信部13也可以是网卡。在任意的情况下只要通信的内容是遵循SCSI(Small Computer System Interface:小型计算机系统接口)的通信即可。此外,经由网络进行SCSI的通信的方法中例如有iSCSI(除RFC3720以外)。在利用iSCSI的情况下,磁盘阵列10侧的磁盘控制器11作为发起端而进行动作。
备用设备2具备与数据阵列10相同的结构,但磁盘控制器21的动作与数据阵列10的磁盘控制器11中的动作不同。即,该磁盘控制器21另外还包含例如CPU等处理器、存储器等存储部、以及因特尔公司生产的82801IB ICH9 RAID(ICH9R)等I/O控制器、其它外围电路(时钟发生器、电源管理电路、USB接口电路等)。
在该磁盘控制器21中也是处理器按照保存在该存储部的程序进行动作。并且,磁盘控制器21经由通信部23从数据保存装置1中所包含的任意的数据阵列10接收是否存在满足与检测出故障的磁盘驱动器12相同的容量且当前未被使用的条件的磁盘驱动器22的询问。磁盘控制器21响应该询问,搜索作为备用的磁盘驱动器22中的满足接收到的条件的磁盘驱动器22。
在此,当磁盘控制器21找到满足接收到的条件的磁盘驱动器22时,将用于挂载该找到的磁盘驱动器22的信息发送到作为询问源的数据保存装置1的数据阵列10。关于该磁盘控制器21的动作,在后面详细说明。此外,在利用iSCSI的情况下,该磁盘控制器21作为目标端而进行动作。
通信部23与磁盘阵列10之间发送接收信息。关于该通信部23,也与磁盘阵列10的通信部13同样地,其具体的结构能够根据磁盘阵列10与备用设备2进行怎样的配置来适当地设为USB接口、网络接口等。
在此,说明数据阵列10的磁盘控制器11以及备用设备2的磁盘控制器21的动作。如图2例示的那样,各数据阵列10的磁盘控制器11在功能上构成为包含数据处理部31、故障检测部32、询问部33、挂载控制部34以及RAID重构部35。另外,如图3例示的那样,磁盘控制器21在功能上构成为包含询问接收部36、搜索部37、信息提供部38以及数据处理部39。
各数据阵列10的磁盘控制器11的数据处理部31按照来自使用者的指示,对构成RAID的磁盘驱动器12a、12b、…、12n进行访问,对该磁盘驱动器12a、12b、…、12n进行数据的读取和写入。
故障检测部32检查数据处理部31是否能够向磁盘驱动器12写入数据或从磁盘驱动器12读取数据。故障检测部32当检测出与某一磁盘驱动器12之间的数据写入或数据读取失败时,针对该数据写入或数据读取失败的磁盘驱动器12,输出表示该磁盘驱动器12发生了故障的信息(故障报告信息)。另外,此时,故障检测部32也可以使未图示的蜂鸣器响铃,或者使LED设备闪烁等来向使用者报告故障。
当故障检测部32输出故障报告信息时,询问部33参照该故障报告信息将发生了故障的磁盘驱动器12确定为故障驱动器。询问部33获取表示故障驱动器的容量的信息。作为一例,询问部33对故障驱动器发送询问结构信息的信号。当故障驱动器侧响应该信号而发送包含扇区大小和最大扇区地址的信息时,询问部33从故障驱动器接收该信息,根据这些信息对故障驱动器的容量进行运算来获取到该容量。
然后,询问部33经由通信部13将是否存在未使用的磁盘驱动器22的询问与该获取到的故障驱动器的容量的信息一起发送给备用设备2。在此,设为预先设定了备用设备2的网络地址、USB的地址等。
询问部33当从备用设备2接收到与满足具备所要求的容量且未使用的条件的磁盘驱动器22(下面称为备用驱动器)相关的信息时,向挂载控制部34输出该接收到的信息。具体来说,该信息是备用驱动器的挂载所需的信息,在利用iSCSI的情况下,相当于确定作为备用设备2(目标端)侧的登记节点的备用驱动器的信息。
此外,询问部33在预定的时间内没有来自备用设备2的响应或者没有接收到与具备所要求的容量且未使用的备用驱动器相关的信息的情况下,再次使未图示的蜂鸣器响铃或者使LED设备闪烁等来向使用者报告不存在备用驱动器。
当接收到备用驱动器的挂载所需的信息时,挂载控制部34利用该信息对备用设备2上的备用驱动器进行挂载。作为一例,在利用iSCSI输入确定备用驱动器的登记节点的信息作为挂载所需的信息的情况下,挂载控制部34执行对该登记节点进行挂载的处理。
RAID重构部35利用备用驱动器作为故障驱动器的代替,将记录在故障驱动器的信息再现并写入备用驱动器内。作为一例,设为最初利用四台磁盘驱动器12a、12b、12c、12d进行RAID 5的运用。在该状态下,如图4例示那样,处于如下状态:以磁盘驱动器12a中记录有数据块A、D、G、磁盘驱动器12b中记录有数据块B、E以及与数据块G、H、I相关的奇偶信息P3......之类的方式保存数据。在此,在磁盘驱动器12b发生故障而成为故障驱动器的情况下,RAID重构部35根据保存在磁盘驱动器12a、12c、12d中的数据块A、C以及奇偶信息P1来再现数据块B的数据,并保存到作为备用驱动器被挂载的备用设备的磁盘驱动器22。另外,RAID重构部35根据其它磁盘驱动器12a、12c、12d中保存的信息再现被保存在故障驱动器中的数据块E、奇偶信息P3,并保存到该被挂载的备用驱动器。
由此,RAID重构部35通过磁盘驱动器12a、12c、12d以及备用驱动器构成RAID 5。下面,在使用者对磁盘驱动器12b进行修理或者将其更换为新的磁盘驱动器等使该数据阵列10内的故障驱动器恢复到正常的状态之前,磁盘控制器11通过磁盘驱动器12a、12c、12d以及备用驱动器继续进行RAID 5的运用。
另外,当检测到使用者对磁盘驱动器12b进行修理或者将其更换为其它磁盘驱动器等使该数据阵列10内的故障驱动器恢复到了正常的状态时(也可以检测到使用者按下复位的按钮),磁盘控制器11将备用驱动器内的数据拷贝到恢复到正常状态的磁盘驱动器12(在之前的例中,为磁盘驱动器12b),将备用驱动器进行卸载。然后,磁盘控制器11之后恢复为通过数据阵列10内的磁盘驱动器12构成RAID,继续数据的写入和读取的处理。
另外,在使用者进行维护检查等时,也可以从备用设备2中拔出作为备用驱动器的磁盘驱动器22,并物理性地与数据阵列10的故障驱动器进行更换来继续进行运用。在该情况下,对备用设备2侧的磁盘控制器21事先进行设定使得在卸载时也不对磁盘驱动器22进行格式化。
在该情况下,当检测出恢复到正常的状态时(也可以检测到使用者按下复位的按钮),磁盘控制器11仍然将作为备用驱动器的磁盘驱动器22用作发生了故障的磁盘驱动器12b的代替(作为新的磁盘驱动器12b),恢复为通过数据阵列10内的磁盘驱动器12a、12b、12c、12d构成RAID,继续数据的写入和读取处理。
另一方面,备用设备2侧的磁盘控制器21的询问接收部36从某一个数据阵列10经由通信部23接收例如是否存在满足与故障驱动器相同容量且当前未被使用之类的条件的磁盘驱动器22的询问。然后,询问接收部36将该接收到的询问中包含的条件输出到搜索部37。
搜索部37接收与条件相关的信息。而且,搜索备用设备2内的磁盘驱动器22中的满足接收到的条件的磁盘驱动器22。作为一例,这里的条件中包含与故障驱动器的容量相关的信息,因此,搜索部37搜索容量与该信息所表示的容量相同且当前未被使用(没有被任何处挂载)的磁盘驱动器22。搜索部37如果找到了满足接收到的条件的磁盘驱动器22,则将指定该找到的磁盘驱动器22的信息输出到信息提供部38。另外,搜索部37如果无法找到满足接收到的条件的磁盘驱动器22,则也可以作为错误而结束处理。
信息提供部38从搜索部37接收指定被搜索部37找到的磁盘驱动器22的信息。而且,信息提供部38生成在数据阵列10侧挂载被该信息指定的磁盘驱动器22所需的信息。信息提供部38将该生成的信息发送到作为通过询问接收部36接收到的询问的发送源的数据阵列10。
例如,在利用iSCSI的情况下,信息提供部38将被搜索部37找到的磁盘驱动器22定义为目标端。在进行该定义时,信息提供部38对该磁盘驱动器22设定固有的名称(targetname)。而且,将该设定的名称作为挂载所需的信息发送到作为询问的发送源的数据阵列10。此外,事先进行登记到访问控制列表等其它所需的设定。
数据处理部39按照从作为磁盘驱动器22的挂载目的地的数据阵列10接收到的数据的写入和读取的指示,访问磁盘驱动器22来进行数据的读取和写入。
另外,当磁盘驱动器22被数据阵列10卸载时,该数据处理部39也可以对该被卸载的磁盘驱动器22进行格式化,并设为未使用的状态。
本实施方式的一个侧面所涉及的磁盘系统具备上面的结构,并进行如下的动作。具体来说,在下面的例子中,设为磁盘系统中包含的N台数据阵列10是机架挂载型的装置。而且,设为组装有配置了N台该数据阵列10的机架。另外,在下面的例子中,备用设备2另外还具备与数据阵列10相同结构的装置,与数据阵列10一起被组装于同一机架,通过USB、网络等通信单元进行连接。
另外,在此,设为一部分数据阵列10中内置的磁盘驱动器12的数量是四台,容量都是1TB,设为其它数据阵列10中内置的磁盘驱动器12的数量是四台,容量是2TB。而且,设为备用设备2中,两台磁盘驱动器22a、22b为1TB的容量,两台磁盘驱动器22c、22d为2TB的容量,最初都未使用。并且,在下面的例子中,设为用各数据阵列10构成RAID 5。
如图5所示,最初,各数据阵列10的磁盘控制器11按照来自使用者的指示,访问构成RAID的磁盘驱动器12a、12b、12c、12d来进行数据的读取和写入(S1)。
在此,在一个数据阵列10(设为磁盘容量为1TB)中,当磁盘驱动器12b发生故障时,该数据阵列10的磁盘控制器11检测出对该磁盘驱动器12b(故障驱动器)的访问故障(S2),输出故障报告信息(S3)。磁盘控制器11获取表示故障驱动器的容量的信息(S4)。在此的例子中,磁盘控制器11获取到“1TB”的信息。
磁盘控制器11经由通信部13将是否存在未使用的磁盘驱动器22的询问与该获取到的故障驱动器的容量的信息(“1TB”)一起发送给备用设备2(S5)。
备用设备2侧的磁盘控制器21经由通信部23从包含该故障驱动器的数据阵列10接收表示故障驱动器的容量的信息、以及是否存在满足容量与该容量相同且当前未被使用之类的条件的磁盘驱动器22的询问。
备用设备2的磁盘控制器21搜索内置的磁盘驱动器22中的满足接收到的条件的磁盘驱动器22(S6)。此处的例子中,搜索1TB的未使用磁盘,因此磁盘控制器21找到磁盘驱动器22a。
磁盘控制器21生成在数据阵列10侧挂载该找到的磁盘驱动器22a所需的信息(S7)。具体来说,磁盘控制器21为了通过iSCSI挂载磁盘驱动器22a,将该磁盘驱动器22a定义为目标端,例如,设定spare 1tb.no 1.com.foo.bar之类的名称。而且,磁盘控制器21将该设定的名称等挂载所需的信息发送到作为询问的发送源的数据阵列10侧(S8)。此外,事先另外进行登记到访问控制列表等其它所需的设定。
包含故障驱动器的数据阵列10的磁盘控制器11当接收到挂载所需的信息时,执行将以该信息表示的目标端的磁盘驱动器22a作为备用驱动器进行挂载的处理(S9)。具体来说,如上所述,磁盘控制器11使用在磁盘控制器21侧定义的目标端的名称,对该名称的目标端(登记节点)进行登记的处理作为iSCSI的发起端侧的处理。
磁盘控制器11使用备用驱动器作为故障驱动器的代替,在备用驱动器内再现并写入记录在故障驱动器中的信息,来重构RAID 5(S10)。此时,经由通信部13和通信部23向备用设备2侧的磁盘控制器21进行指示,来达成经由通信部13和通信部23对备用驱动器进行写入、从备用驱动器进行数据的读取。即,磁盘控制器21按照从作为挂载目的地的数据阵列10接收的数据的读取和写入的指示,对磁盘驱动器22进行访问,来执行数据的读取和写入。
由此,在数据阵列10侧,能够维持RAID结构而继续进行运用。另外,与在数据阵列10中分别设置一台备用驱动器的情况相比,在本实施方式中只要根据故障率适当地设置备用设备2即可,因此能够提高磁盘驱动器的使用率。
此外,此处的例子中,在备用设备2内置的磁盘驱动器22中存在多个例如满足接收到的条件的磁盘驱动器22的情况下等,对于磁盘控制器21选择哪个磁盘驱动器22作为备用驱动器的方法不作特别规定,如果满足条件,可以设第几号的磁盘驱动器22为备用驱动器,但也可以如下设置。
即,包含故障驱动器的数据阵列10的磁盘控制器11在进行询问时,向备用设备2侧传达表示故障驱动器在数据阵列10内的磁盘驱动器12中是第几号的磁盘驱动器的信息(磁盘顺序信息)。在备用设备2中,也可以搜索满足与询问相关的条件的磁盘驱动器22,并且判断在通过搜索找到的磁盘驱动器22中是否存在处于通过所传达的磁盘顺序信息表示的位置的磁盘驱动器,如果存在这种磁盘驱动器,即使存在其它满足条件的磁盘驱动器,也将用于挂载处于通过该所传达的磁盘顺序信息表示的位置的磁盘驱动器的信息发送到数据阵列10侧。
若事先这样设定,假设在从备用设备2拔出成为备用驱动器的磁盘驱动器22并物理性地与数据阵列10的故障驱动器进行更换来继续进行运用的情况下(如已经说明的那样,在该情况下事先设定为在卸载时也不对磁盘驱动器22进行格式化),拔出的磁盘驱动器22的位置与作为更换的对象的故障驱动器的位置尽可能相同,因此存在对于使用者来说容易了解作业的优点。
并且,在本实施方式的一个侧面中,如已经说明的那样,也可以经由因特网等网络通信线路将数据阵列10与备用设备2能够进行通信地进行连接。在这样能够远程配置备用设备2的情况下,也可以配置多个作为备用设备2而发挥功能的装置,提供利用备用设备2的服务。
在这样远程地配置的情况下,在备用设备2侧,也可以使用两台以上的作为备用驱动器的磁盘驱动器22,对数据的写入进行镜像处理。也就是说,在该情况下,在图5的步骤S6中,备用设备2的磁盘控制器21在内置的磁盘驱动器22中搜索到多台满足接收到的条件的磁盘驱动器22。
在之前的例子中,搜索1TB的未使用磁盘,因此,磁盘控制器21找出磁盘驱动器22a和磁盘驱动器22b。
而且,在步骤S7中,磁盘控制器21通过镜像处理使用该找出的磁盘驱动器22a、22b,因此形成与磁盘驱动器22a或磁盘驱动器22b相同容量的逻辑磁盘驱动器,生成用于在数据阵列10侧挂载该逻辑磁盘驱动器所需的信息。逻辑磁盘驱动器的形成等被众所周知,因此在此省略详细的说明。
数据阵列10侧的磁盘控制器11当作为故障驱动器的代替而将该逻辑磁盘驱动器作为备用驱动器进行挂载时,之后,按照对该备用驱动器进行数据写入的指示,磁盘控制器21对磁盘驱动器22a、22b执行相同数据的写入(镜像处理)。
之后,在成为能够暂时停止运用的阶段,对磁盘控制器21指示停止镜像处理的控制。当磁盘控制器21按照该指示停止镜像处理的控制时,备用设备2的管理者从备用设备2取出任意一个磁盘驱动器22,并配送到包含故障驱动器的数据阵列10的使用者侧。由使用者侧将该配送的磁盘驱动器22与故障驱动器进行更换来安装到数据阵列10中,继续进行运用。
此外,在停止运用的过程中(磁盘驱动器22的配送过程中),产生需要进行运用的情况下,在数据阵列10侧挂载之前的逻辑磁盘驱动器来继续进行运用。这样,磁盘控制器21停止了镜像处理的控制,因此按照来自数据阵列10侧的对备用驱动器进行数据写入的指示,对没有取出的磁盘驱动器22(例如磁盘驱动器22a)进行数据的写入。另外,磁盘控制器21按照来自数据阵列10侧的对备用驱动器进行数据读取的指示,从作为该写入目的地的磁盘驱动器22(在该例子中为磁盘驱动器22a)读取数据,发送到数据阵列10。
在该情况下,在使用者侧,在将该配送的磁盘驱动器22b与故障驱动器进行更换来安装到数据阵列10后,通过挂载的备用驱动器进行恢复。也就是说,将数据从磁盘驱动器22a恢复到配送的磁盘驱动器22b。这样,在本实施方式中,能够容易地在使用者侧进行运用。
并且,如图6例示的那样,本实施方式的一个侧面所涉及的备用设备2还可以具备与每个磁盘驱动器22对应的液晶显示器等显示部24。该显示部24按照从磁盘控制器21输入的指示显示信息。在本实施方式的其它侧面所涉及的例子中,磁盘控制器21将与挂载相关的信息显示到与被数据阵列10挂载的磁盘驱动器22对应的显示部24。
在此,与挂载相关的信息例如包含指定数据阵列的信息(也可以是对每个数据阵列10预先设定的识别信息、IP地址等地址信息)、挂载目的地的磁盘驱动器的编号(相当于表示故障驱动器的位置的信息)。该显示例如为“数据阵列#8驱动器#3、RAID构成中”等之类的信息。
另外,在此之前的说明中,通信部13和通信部23没有特别将控制信息和数据的通信路径相分离,但也可以将这些通信路径分开设定,其中,该控制信息是从数据阵列10向备用设备2进行与是否存在能够成为备用驱动器的磁盘驱动器22相关的询问、对其进行的响应等与磁盘驱动器22相关的控制信息,该数据是向磁盘驱动器22写入或者从磁盘驱动器22读取的数据。
例如,也可以通信部13和通信部23都具备第一USB端口、第二USB端口这两个USB端口。经由作为控制信息通信单元的第一USB端口发送接收控制信息,经由作为数据通信单元的第二USB端口发送接收数据。另外,也可以与网络接口的情况同样地,通信部13和通信部23具备第一网络接口、第二网络接口这两个网络接口,经由作为控制信息通信单元的第一网络接口发送接收控制信息,经由作为数据通信单元的第二网络接口发送接收数据。
根据本实施方式,即使处于混有不同容量的磁盘驱动器的实际的运用环境下,选择适当的与故障驱动器容量相同的磁盘驱动器用作作为备用的磁盘驱动器,能够提高可利用性(可用性)。

Claims (5)

1.一种磁盘系统,具备:
数据保存装置,其保存数据,具备至少一个数据阵列,该至少一个数据阵列分别包含构成磁盘阵列即RAID的多个磁盘驱动器;
备用设备,其包含至少一个作为备用的磁盘驱动器;
检测上述数据阵列内的磁盘驱动器的故障的单元;
向上述备用设备询问是否存在满足与检测出故障的磁盘驱动器相同的容量且当前未被使用的条件的磁盘驱动器的单元;以及
从响应了上述询问的上述备用设备接收与满足上述条件的磁盘驱动器相关的信息并将满足该条件的磁盘驱动器作为上述检测出故障的磁盘驱动器的代替而进行挂载的单元。
2.一种数据保存装置,其保存数据,具备至少一个数据阵列,能够进行通信地与包含至少一个作为备用的磁盘驱动器的备用设备连接,该至少一个数据阵列分别包含构成磁盘阵列即RAID的多个磁盘驱动器,该数据保存装置还具备:
检测上述数据阵列内的磁盘驱动器的故障的单元;
向上述备用设备询问是否存在满足与检测出故障的磁盘驱动器相同的容量且当前未被使用的条件的磁盘驱动器的单元;以及
从响应了上述询问的上述备用设备接收与满足上述条件的磁盘驱动器相关的信息并将满足该条件的磁盘驱动器作为上述检测出故障的磁盘驱动器的代替而进行挂载的单元。
3.根据权利要求2所述的数据保存装置,其特征在于,
经由通信单元与上述备用设备之间进行通信,
该通信单元包括:
控制信息通信单元,其发送接收询问和与磁盘驱动器相关的信息;以及
数据通信单元,其发送记录在作为备用的磁盘驱动器中的数据或者从该作为备用的磁盘驱动器读取的数据。
4.一种磁盘设备,其包含至少一个作为备用的磁盘驱动器,能够进行通信地与数据保存装置连接,该数据保存装置保存数据,具备至少一个数据阵列,该至少一个数据阵列分别包含构成磁盘阵列即RAID的多个磁盘驱动器,该磁盘设备还具备:
从上述数据保存装置接收上述作为备用的磁盘驱动器中是否存在满足与检测出故障的磁盘驱动器相同的容量且当前未被使用的条件的磁盘驱动器的询问的单元;
响应上述询问而搜索上述作为备用的磁盘驱动器中的满足上述条件的磁盘驱动器的单元;以及
当搜索到满足上述条件的磁盘驱动器时将用于挂载通过该搜索找到的磁盘驱动器的信息发送到作为上述询问的源的数据保存装置的单元。
5.根据权利要求4所述的磁盘驱动器,其特征在于,
还具备显示单元,该显示单元显示表示通过上述搜索找到的磁盘驱动器的挂载目的地的信息。
CN2012105132417A 2011-12-05 2012-12-04 磁盘系统、数据保存装置以及磁盘设备 Pending CN103136075A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2011266078A JP2013117922A (ja) 2011-12-05 2011-12-05 ディスクシステム、データ保持装置、及びディスクデバイス
JP2011-266078 2011-12-05

Publications (1)

Publication Number Publication Date
CN103136075A true CN103136075A (zh) 2013-06-05

Family

ID=48495927

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2012105132417A Pending CN103136075A (zh) 2011-12-05 2012-12-04 磁盘系统、数据保存装置以及磁盘设备

Country Status (3)

Country Link
US (1) US20130145209A1 (zh)
JP (1) JP2013117922A (zh)
CN (1) CN103136075A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104268038A (zh) * 2014-10-09 2015-01-07 浪潮(北京)电子信息产业有限公司 磁盘阵列的高可用系统
CN113297015A (zh) * 2020-04-07 2021-08-24 阿里巴巴集团控股有限公司 磁盘恢复方法以及装置
CN114415979A (zh) * 2022-03-29 2022-04-29 浙江大华技术股份有限公司 存储装置的处理方法、计算机设备及存储装置

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9921783B2 (en) * 2013-09-25 2018-03-20 Lenovo (Singapore) Pte Ltd. Dynamically allocating temporary replacement storage for a drive in a raid array
JP2015082313A (ja) * 2013-10-24 2015-04-27 富士通株式会社 Raid構成管理装置、raid構成管理プログラムおよびraid構成管理方法
US10725865B2 (en) 2015-02-25 2020-07-28 Hitachi Ltd. Storage unit and storage device
US9965369B2 (en) 2015-04-28 2018-05-08 Viasat, Inc. Self-organized storage nodes for distributed delivery network
CN105045691B (zh) * 2015-07-16 2018-06-22 浪潮(北京)电子信息产业有限公司 一种故障检测方法和系统
US9755979B2 (en) 2015-11-19 2017-09-05 Viasat, Inc. Enhancing capacity of a direct communication link

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1679000A (zh) * 2002-06-24 2005-10-05 网络装置公司 在raid数据重建和转移中使用文件系统信息
CN1234071C (zh) * 2002-07-26 2005-12-28 国际商业机器公司 对不完全raid盘写进行可靠故障转移的方法和设备
US20100332893A1 (en) * 2007-09-18 2010-12-30 International Business Machines Corporation Method for managing a data storage system
CN101968754A (zh) * 2009-07-27 2011-02-09 英业达股份有限公司 磁盘阵列重建方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1679000A (zh) * 2002-06-24 2005-10-05 网络装置公司 在raid数据重建和转移中使用文件系统信息
CN1234071C (zh) * 2002-07-26 2005-12-28 国际商业机器公司 对不完全raid盘写进行可靠故障转移的方法和设备
US20100332893A1 (en) * 2007-09-18 2010-12-30 International Business Machines Corporation Method for managing a data storage system
CN101968754A (zh) * 2009-07-27 2011-02-09 英业达股份有限公司 磁盘阵列重建方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104268038A (zh) * 2014-10-09 2015-01-07 浪潮(北京)电子信息产业有限公司 磁盘阵列的高可用系统
CN113297015A (zh) * 2020-04-07 2021-08-24 阿里巴巴集团控股有限公司 磁盘恢复方法以及装置
CN114415979A (zh) * 2022-03-29 2022-04-29 浙江大华技术股份有限公司 存储装置的处理方法、计算机设备及存储装置
CN114415979B (zh) * 2022-03-29 2022-07-15 浙江大华技术股份有限公司 存储装置的处理方法、计算机设备及存储装置

Also Published As

Publication number Publication date
US20130145209A1 (en) 2013-06-06
JP2013117922A (ja) 2013-06-13

Similar Documents

Publication Publication Date Title
CN103136075A (zh) 磁盘系统、数据保存装置以及磁盘设备
CN101322105B (zh) 用于重新配置存储阵列的装置和方法
US9769259B2 (en) Network storage systems having clustered RAIDs for improved redundancy and load balancing
CN100353328C (zh) 用于控制存储的装置和方法
CN102024044B (zh) 分布式文件系统
EP1895414B1 (en) Storage control apparatus and failure recovery method for storage control apparatus
US7111084B2 (en) Data storage network with host transparent failover controlled by host bus adapter
JP2005326935A (ja) 仮想化ストレージを備える計算機システムの管理サーバおよび障害回避復旧方法
CN108153622B (zh) 一种故障处理的方法、装置和设备
CN102880522B (zh) 面向硬件故障的系统关键文件故障纠正方法及装置
CN100368976C (zh) 盘阵列设备和数据备份方法
JP2008299481A (ja) ストレージシステム及び複数拠点間でのデータコピー方法
CN103049400A (zh) 一种磁盘重构方法及其装置
JP5982909B2 (ja) 制御装置、ストレージ装置、ストレージ装置の試験方法及びストレージ装置の試験プログラム
US8099634B2 (en) Autonomic component service state management for a multiple function component
US11025518B2 (en) Communicating health status when a management console is unavailable
US20080244306A1 (en) Storage system and management method for the same
US8381027B1 (en) Determining alternate paths in faulted systems
US10642705B2 (en) Storage system and storage method
US7299385B2 (en) Managing a fault tolerant system
JPH09269871A (ja) ディスクアレイ装置におけるデータ再冗長化方式
CN102314322A (zh) 一种基于raid阵列的数据处理方法和设备
EP2645250A2 (en) Storage system, storage apparatus, and data restoration method
US10915405B2 (en) Methods for handling storage element failures to reduce storage device failure rates and devices thereof
CN104699564A (zh) 一种采用Raid0磁盘组服务器的自动恢复方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20130605