WO2012017641A1 - アレイ管理装置、方法、集積回路およびプログラム - Google Patents

アレイ管理装置、方法、集積回路およびプログラム Download PDF

Info

Publication number
WO2012017641A1
WO2012017641A1 PCT/JP2011/004369 JP2011004369W WO2012017641A1 WO 2012017641 A1 WO2012017641 A1 WO 2012017641A1 JP 2011004369 W JP2011004369 W JP 2011004369W WO 2012017641 A1 WO2012017641 A1 WO 2012017641A1
Authority
WO
WIPO (PCT)
Prior art keywords
array
storage
failure
concern
failures
Prior art date
Application number
PCT/JP2011/004369
Other languages
English (en)
French (fr)
Inventor
紹二 大坪
幸 裕弘
吉希 寺田
勝彦 廣瀬
Original Assignee
パナソニック株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by パナソニック株式会社 filed Critical パナソニック株式会社
Publication of WO2012017641A1 publication Critical patent/WO2012017641A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2053Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
    • G06F11/2094Redundant storage or storage space
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/008Reliability or availability analysis

Definitions

  • the present invention relates to an array management apparatus and method for managing an array that manages a plurality of storages with a predetermined RAID configuration.
  • RAID Redundant Array of Inexpensive Disks
  • RAID Redundant Array of Inexpensive Disks
  • the allowable number of failures indicating the number of storage failures allowed by the array is determined by the RAID level, the number of storages managed by the array (see the number 6E), and the like. .
  • the allowable number of failures is one.
  • the allowable number of failures is two (see FIG. 22).
  • spare storage is in a standby state until the storage managed by the array fails.
  • the failed storage is logically exchanged with the spare storage.
  • a method has been proposed in which the storage is replaced with spare storage.
  • the above conventional technology is a technology for replacing a storage that is highly likely to fail with a spare storage.
  • the above prior art cannot determine whether or not a plurality of storages fail in units of arrays to be managed. Accordingly, there is a case where another storage is used in vain even though the array does not originally need to be replaced.
  • An object of the present invention is to solve the above-described conventional problems, and to provide an array management apparatus capable of reducing the failure rate of an array of failure concern without wastefully using another storage.
  • an array management apparatus of the present invention is an array management apparatus that manages a plurality of arrays that manage a plurality of storages with a predetermined RAID configuration.
  • the allowable number of failures indicating the number of storage failures allowed by the array is calculated for each array, the number of possible failures indicating the number of storage devices with a possibility of failure is calculated for each array, and the plurality of arrays Among the plurality of storages managed by the identified failure concern array, the failure concern array specifying unit for specifying the failure concern array in which the number of failure concerns exceeds the allowable number of failures, and the plurality of storages managed by the specified failure concern array
  • a sound storage specifying unit that identifies a sound storage that is a storage that is less likely to fail than the specified storage that is concerned about failure, and an exchange unit that exchanges the specified questionable storage and the specified sound storage. Is an array management apparatus.
  • FIG. 1 is an implementation image diagram according to Embodiment 1 of the present invention.
  • FIG. 2 is a configuration diagram of an example of the array management apparatus according to the first embodiment of the present invention.
  • FIG. 3 is a system configuration diagram of an example of the array management apparatus according to the first embodiment of the present invention.
  • FIG. 4 is a configuration diagram of an example of the array management apparatus according to the first embodiment of the present invention.
  • FIG. 5 is a system configuration diagram of an example of the array management apparatus according to the first embodiment of the present invention.
  • FIG. 6 is a flowchart showing the flow of processing of the array management unit in the first embodiment of the present invention.
  • FIG. 7 is a flowchart showing a processing flow of the failure concern array specifying unit in the first embodiment of the present invention.
  • FIG. 1 is an implementation image diagram according to Embodiment 1 of the present invention.
  • FIG. 2 is a configuration diagram of an example of the array management apparatus according to the first embodiment of the present invention.
  • FIG. 3 is
  • FIG. 8 is a flowchart for acquiring the allowable number of failures for each array according to the first embodiment of the present invention.
  • FIG. 9 is a flowchart for acquiring the number of feared failures for each array according to the first embodiment of the present invention.
  • FIG. 10 is a flowchart for acquiring the degree of failure concern for each storage according to the first embodiment of the present invention.
  • FIG. 11 is a flowchart for calculating the degree of concern for failure according to the first embodiment of the present invention.
  • FIG. 12 is a flowchart showing the flow of processing of the failure concern storage specifying unit in the first embodiment of the present invention.
  • FIG. 13 is a flowchart showing the flow of processing of the healthy storage specifying unit in the first embodiment of the present invention.
  • FIG. 14 is a flowchart in which the replacement target array specifying process is added to the process flow of the array management unit according to the first embodiment of the present invention.
  • FIG. 15 is a flowchart showing a process flow of the replacement target array specifying unit in the first embodiment of the present invention.
  • FIG. 16 is a flowchart for calculating the number of replacements for each array in the first embodiment of the present invention.
  • FIG. 17 is a flowchart showing the flow of processing of the array management unit in the second embodiment of the present invention.
  • FIG. 18 is a flowchart showing the flow of processing of the storage replacement determination unit in the second embodiment of the present invention.
  • FIG. 19 is a diagram illustrating a management table.
  • FIG. 20 is a diagram illustrating a plurality of arrays before replacement and a plurality of arrays after replacement.
  • FIG. 21 is a diagram showing the number of replacements of each array.
  • FIG. 22 shows an array.
  • FIG. 23 is a diagram showing a management table and the like.
  • FIG. 24 is a diagram illustrating a specific example of the system.
  • FIG. 25 is a diagram illustrating the allowable number of failures and the number of failures.
  • FIG. 26 is a flowchart showing the flow of processing when the occurrence of a storage failure is taken into consideration.
  • FIG. 27 is a flowchart of the process of identifying the failure concern array in S1710 of FIG.
  • FIG. 28 is a flowchart showing details of the process in S1820 of FIG.
  • the array management apparatus of the embodiment manages an array management apparatus (array management unit 100, array 61, 62, etc. in FIG. 20) that manages a plurality of arrays 6 that manage a plurality of storages 4A (FIG. 22) with a predetermined RAID configuration. Digital recorder 10, system 1, array management unit 7). From the RAID configuration of each array 6, an allowable number of failures 6D (FIG. 25, for example, 2) that indicates the number of storage failures allowed by each array 6 is calculated for each array 6, and there is a possibility of failure storage that may fail. The number 6A (FIG. 22) of fear of failure indicating the number of 4a (FIG. 22) is calculated for each array 6, and the number 6A of fear of failure (first array in FIG.
  • a failure concern storage identification unit 102 is provided that identifies a failure concern storage (storage 4aXa in FIG. 20) from among the plurality of storages 4A managed by the identified failure concern array.
  • a healthy storage (storage 4bXa in FIG. 20) that is a storage for exchanging with the identified failure concern storage (storage 4aXa) and is less likely to fail than the identified failure concern storage (storage 4aXa). Etc.) is provided.
  • a replacement unit 105 is provided for exchanging the identified failure concern storage (storage 4aXa) and the identified healthy storage (storage 4bXa or the like).
  • a plurality of storages 4 including a plurality of storages 4A1 (FIG. 20) constituting the first array 61 (FIG. 20) and a plurality of storages 4A2 constituting the second array 62.
  • a part of (FIG. 24) (such as the two storages 4 from the top in FIG. 24) is provided in the first residence (the first part 1Ha), and the other part is the second May be provided in the second residence 1Hb.
  • the failure concern array specifying unit may specify the first array 61 from a plurality of arrays (the first and second arrays 61, 62, etc.).
  • the replacement target array specifying unit inside or outside the array management apparatus specifies the second array 62 from the plurality of arrays 61 and 62.
  • the exchange unit includes the possibility-of-failure storage 4aXa included in the specified first array 61 and the possibility of failure described above in the specified storage-related storage included in the specified second array 62. It may be replaced with the healthy storage 4bXa, which has a lower possibility of failure.
  • the sound storage 4bXa included in the second array 62 having the relatively small number 6Ab1 of fear of failure may be specified, and the specified sound storage 4bXa may be replaced with the specified failure concern storage 4aXa.
  • the sound storage specifying unit may specify a storage (storage 4bXa or the like) that is not the storage 4A1 managed by the failure concern array 61 as the sound storage 4bXa.
  • the specified healthy storage 4bXa may be included in an exchange target array (second array 62) included in a plurality of arrays (first, second arrays 61, 62, etc.).
  • the replacement target array 62 is an array (second array 62) different from the failure concern array 61, and the replacement target array (second array 62) includes one failure concern storage 4aXa and Even if the number 6Abx (2 in FIG. 25) of the fear of failure of the replacement target array 62N after the replacement with the healthy storage 4bXa does not exceed the allowable number of failures 6D (2 in FIG. 25) of the replacement target array 62 Good.
  • the entire array failure rate can be reduced by exchanging with a healthy replacement target array (second array 62).
  • the replacement target array is an array in which the number 6A (FIG. 22) of fear of failure is smaller than the allowable number of failures 6D, that is, the surplus number 6C is 1 or more.
  • the number of healthy storages specified in the replacement target array may be two or more, for example.
  • the number of healthy storages identified is less than the surplus number 6C (the maximum replaceable number in FIG. 18) (FIG. 18). In other cases, the number may be larger than the surplus number 6C (see YES in S1640).
  • the replacement target array is healthy, but if it is larger than the surplus number 6C (YES in S1640), it is exceptionally unhealthy and unusable. Sound.
  • the number of the healthy storages to be identified (the number that needs to be relieved) is equal to or less than the surplus number 6C (maximum replaceable number) (NO in S1640), it is as follows. In other words, in that case, when up to the healthy storage is replaced, there is no excess storage that is a healthy storage in which the number of feared failures after the replacement of the healthy storage exceeds the allowable failure number 6C. On the other hand, when the surplus number is greater than 6C (YES in S1640), there is excess storage.
  • the array management apparatus further includes a storage replacement determination unit 106, and the storage replacement determination unit 106 exchanges the specified failure concern storage and the specified healthy storage included in the replacement target array. After that, it is determined whether or not the number of feared failures of the replacement target array exceeds the allowable failure number 6D of the replacement target array (whether or not the healthy storage is excess storage) (S1630 in FIG. 18). In the case where it is determined that the storage unit is exceeded (determined that it is excess storage) (YES in S1640), the specified failure concern storage for any specified healthy storage And the specified healthy storage may not be exchanged (S1660).
  • any specified healthy storage is not replaced (S1660), and a large amount of data (for example, several gigabytes to several tens of bytes) Gigabyte) data transfer (unnecessary processing) is avoided, and deterioration caused by the data transfer can be avoided. As a result, deterioration due to data transfer can be sufficiently reduced to the extent necessary for this type of system (see FIG. 24).
  • FIG. 1 is an implementation image diagram of the array management apparatus of the first embodiment.
  • the digital recorder 10 is connected to the storages 11 to 18 via the networks 20 to 28.
  • the digital recorder 10 has the purpose of managing and storing digital data such as image data taken by a digital camera.
  • the digital recorder 10 can store the digital data redundantly in the storages 11 to 18 by incorporating the array management unit 100 (FIG. 2 and the like) inside.
  • the networks 20 to 28 may be wireless as well as wired. Also, instead of the networks 20 to 28, USB (Universal Serial Bus), eSATA (External Serial ATA), IEEE 1394 (The Institute of Electrical and Electronic Electronics Engineers, Inc. 1394), IDE (Integrated Drive Electronics), Serial ATA (Advanced A communication bus such as Technology (Attachment), SCSI (Small Computer System Interface), or SAS (Serial Attached SCSI) may be used. In addition to using these communication buses, storages corresponding to the communication bus may be used as the storages 11 to 18. The storages 11 to 18 may be stored inside the housing of the digital recorder 10.
  • USB Universal Serial Bus
  • eSATA Extended Serial ATA
  • IEEE 1394 The Institute of Electrical and Electronic Electronics Engineers, Inc. 1394
  • IDE Integrated Drive Electronics
  • Serial ATA Advanced A communication bus such as Technology (Attachment), SCSI (Small Computer System Interface), or SAS (Serial Attached SCSI)
  • the array management apparatus may be considered to be, for example, the system 1, may be considered to be composed only of the digital recorder 10 in the system 1, and is a functional block realized in the digital recorder 10. It may be considered that it consists only of the array management unit 100.
  • FIG. 2 is a configuration diagram of an example of the array management apparatus according to the first embodiment of the present invention.
  • the array management device is a device that manages a storage array (such as an array (storage array) 61).
  • a storage array is a device that enables data to be stored redundantly in a plurality of storages included in the storage array by using a technique such as RAID.
  • the array management apparatus includes a plurality of storage arrays 61 to 62 and an array management unit 100 for managing the plurality of storage arrays 61 and the like.
  • one or more spare storages 5 which are storages not managed by the array may be further provided.
  • an embodiment that does not include a spare storage will be described, and an embodiment that includes a spare storage will be described in a third embodiment to be described later.
  • the array management unit 100 includes a failure concern array identification unit 101 that identifies a failure concern array, a failure concern storage identification unit 102 that identifies failure concern storage, a healthy storage identification unit 104 that identifies sound storage, and a failure concern storage. And an exchange unit 105 that performs logical exchange with the healthy storage (see FIG. 4).
  • the failure concern array is an array in which data loss of stored data may occur due to failure of storage managed by the array.
  • the failure-prone storage is a storage in which a failure is a concern.
  • the sound storage is storage that has no fear of failure.
  • the array management unit 100 may further include a replacement target array specifying unit 103 (FIG. 2) for specifying a replacement target array in addition to the above.
  • a replacement target array specifying unit 103 FIG. 2 for specifying a replacement target array in addition to the above.
  • the replacement target array is an array that manages sound storage that can be a target of storage replacement with the failure concern array.
  • the array management unit 100 may perform processing for determining whether or not the failure concern in the failure concern array is resolved by logical replacement of the failure concern storage and the healthy storage.
  • a storage replacement determination unit 106 (FIG. 2) that determines whether to perform replacement by performing this processing may be provided.
  • the array management unit 100 (see FIG. 4) that does not include the replacement target array specifying unit 103 (FIG. 2) is, for example, a replacement target array specifying unit provided outside the array management unit 100 (outside the digital recorder 10). 103 may be used or may have other forms.
  • the components 101 to 106 can be realized by LSI (Large Scale Integration).
  • an integrated circuit 100L in which the functions of the failure concern array specifying unit 101 and the like are realized may be provided.
  • the integrated circuit 100L may be provided in the digital recorder 10, for example.
  • the integrated circuit 100L may be a part or all of the array management unit 100, for example.
  • FIG. 3 is a system configuration diagram of the array management apparatus according to the first embodiment.
  • the digital recorder 10 includes a ROM 301 that records various processing programs, a CPU 302 that performs overall processing, a RAM 303 that temporarily records data, and a lower-level transfer control unit 304 that controls data transfer between the storages 11 to 18. And a higher-order transfer control unit 305 that controls data transfer with other devices such as a digital camera.
  • the components 101 to 106 are stored as programs in the ROM 301, for example, and the processing of each component is executed by the CPU 302.
  • the digital recorder 10 may include a computer (information processing apparatus) that performs information processing by the CPU 302 or the like.
  • the computer may store programs such as the failure concern array specifying unit 101 in the ROM 301 or the like.
  • the functions of the failure concern array specifying unit 101 and the like may be realized in the digital recorder 10 by executing each stored program by a computer.
  • FIG. 5 a case where there is no failure concern array specifying unit 101 or the like is illustrated.
  • FIG. 6 is a flowchart showing a processing flow of the array management unit 100 in the present embodiment.
  • the failure concern array identification unit 101 identifies the failure concern array.
  • the failure concern storage identification unit 102 identifies the failure concern storage from the storages managed by the failure concern array.
  • the sound storage specifying unit 104 specifies the sound storage to be replaced.
  • the exchange unit 105 performs a logical exchange between the storage concerned with failure and the healthy storage.
  • FIG. 7 is a flowchart showing the process flow of S410 of FIG.
  • failure concern array specifying unit 101 The operation of the failure concern array specifying unit 101 will be described in detail with reference to FIG.
  • the allowable number of failures indicating the number of storage failures allowed by the array is specified for each array.
  • failure concern number 6A indicating the number of failure concern storages that may fail is specified for each array.
  • the failure allowable number and the failure concern number specified in S510 and S520 are used, and in S530, an array in which the failure concern number exceeds the failure allowable number is set as a failure concern array.
  • an array having two units of fear of failure and one unit of allowable number of failures satisfies the condition of S530, and thus can be a failure concern array.
  • an array in which the number of feared failures exceeds the allowable number of failures may be specified as the failure-related array.
  • the threshold value Ta is the same value (for example, two) as the value of the allowable failure number 6D (FIGS. 22 and 25), and is a value determined by the allowable failure number 6D.
  • the array (first array 61) in which the number of feared failures (deteriorated number) 6A is the number of feared failures 6Aa2 within the range Ra (FIG. 25) larger than the threshold value Ta (first array 61) is the failure concern array. It may be specified.
  • FIG. 20 which will be described later, an example in which the first array 61 of FIG. 20 is specified as a failure concern array is shown.
  • failure concern array candidates when there are a plurality of arrays that may be a failure concern array (failure concern array candidates), for example, from the number of failure concerns (for example, the failure concern number 6Aa2 in FIG. 25) to the allowable number of failures (failure in FIG. 25).
  • the array having the largest number obtained by subtracting the allowable number 6D) may be the failure concern array.
  • an arbitrary array may be selected from a plurality of arrays (failure concern array candidates) that can be a failure concern array. Further, the values of the number of possible failures (for example, those exceeding the allowable number of failures) may be selected in descending order of the allowable number of failures, and the processing of S420 to S440 in FIG. 6 may be sequentially performed on each array. good.
  • FIG. 8 is a flowchart showing the process flow of S510 in FIG.
  • a RAID level indicating the type of RAID configuration in the array is acquired.
  • branching is performed as follows according to the acquired RAID level.
  • the number of storages managed by the array is acquired in S630, and the number obtained by subtracting 1 from the number of storages is set as the allowable number of failures in the array in S640.
  • RAID level is any one of 2 to 5
  • 1 is set as the allowable number of failures in the array in S650.
  • RAID level is 6, in S660, 2 is set as the allowable number of failures in the array (see the allowable failure number 6D in FIG. 22).
  • redundancy management method such as triple parity
  • the allowable number of failures is calculated according to the characteristics of the redundancy management method.
  • FIG. 9 is a flowchart showing the process flow of S520 of FIG.
  • a failure concern level indicating the level of concern that a storage failure will occur for all storages managed by the array is acquired for each storage. That is, the failure concern degree of each storage is acquired.
  • the number of storages whose failure concern degree exceeds a predetermined value is set as the failure concern number in the array.
  • the predetermined value is 0.2.
  • FIG. 10 is a flowchart showing the process flow of S710 of FIG.
  • the acquired warranty period information may be, for example, the warranty period (data) 100f1 illustrated in FIG.
  • storage drive time information is acquired.
  • the drive time information acquired is, for example, the time from the current date to the start date specified by specifying the date when the use of the storage is started. May be specified. More specifically, for example, the acquired drive time information may be the use start date (data) 100f2 shown in FIG.
  • a failure concern degree is calculated in S830.
  • the calculated failure concern degree is set as the storage failure concern degree.
  • information recorded in the ROM in advance may be used, or may be acquired using the Internet.
  • storage self-diagnosis information (such as SM ART) may be used as a method of acquiring storage drive time information.
  • the elapsed time from the first startup the read error rate, the write error rate, the number of data rewrites, the number of times the power is turned on, the operating temperature, and the impact due to acceleration above a predetermined value
  • Information such as the number of times the power is received, the cumulative value of the power-on time, and the cumulative value of the read / write operation time may be acquired.
  • FIG. 11 is a flowchart showing the flow of the process of S830 in FIG.
  • S910 it is determined whether the driving time exceeds the guaranteed time.
  • S920 the result of determination in S910 is received, and branching is performed as follows.
  • the predetermined value is set as the failure concern level in S930. As an example, it is 0.
  • the degree of concern is calculated so that the degree of concern increases with the increase of the driving time in S940, and the degree of concern is determined to be a concern about failure in S950.
  • the degree of concern about the failure of the storage acquired from FIG. 10 is as follows.
  • the degree of failure concern it is affected by the elapsed time from the first startup, the read error rate, the write error rate, the number of data rewrites, the number of times the power is turned on, the operating temperature, and the acceleration exceeding the specified value.
  • information on the number of times that the power has been turned on, a cumulative value of the time during which the power is turned on, a cumulative value of the time during which the read / write operation is performed may be used.
  • the failure concern degree may be calculated using these.
  • the calculated failure concern degree is, for example, whether or not the driving time (for example, the time from the current date to the start date of use 100f2) exceeds the guaranteed time (guaranteed period 100f1). (See failure concern degree 100fx in FIG. 23).
  • FIG. 12 is a flowchart showing the process flow of S420 of FIG.
  • the degree of concern for failure is calculated for each storage for all the storages included in the failure concern array.
  • a storage having a failure concern degree exceeding a predetermined value is designated as a failure concern storage.
  • processing flow of S1010 is the same as the processing of the flowchart of FIG. Note that instead of executing the calculation of the concern degree of failure, the value calculated in the process of S410 can be recorded and used in S420.
  • FIG. 13 is a flowchart showing the flow of the process of S430 in FIG.
  • the failure concern degree in the failure concern storage is set as a failure concern reference value.
  • a storage in which the failure concern degree does not exceed the failure concern reference value is set as a healthy storage.
  • the failure concern level reference value is 0.5
  • a storage with a failure concern level of 0.1 matches the condition of S1120 and can be a sound storage.
  • a corresponding arbitrary storage is selected as the healthy storage from the plurality of healthy storage candidates.
  • a plurality of healthy storages may be selected, and the processing of S440 in FIG. 6 may be performed in order for each healthy storage.
  • the storage managed by the failure concern array may be excluded from the selection target.
  • processing described with reference to FIGS. 14 and 15 below may be performed.
  • FIG. 14 is a flowchart showing the flow of processing for specifying the replacement target array before specifying the healthy storage.
  • the replacement target array before specifying the healthy storage (S430), the replacement target array may be specified, and the healthy storage may be selected from the storages managed by the specified replacement target array (FIG. 6). 14 S1210, S430, etc.).
  • FIG. 15 is a flowchart showing the process flow of S1210.
  • the values acquired in the processing of S410 can be recorded and used in S1210.
  • an array in which the allowable number of failures exceeds the number of feared failures is set as the replacement target array.
  • an array having two failure tolerance units and one failure concern unit number satisfies the condition of S1310, and thus can be replaced.
  • the threshold value Tb may be a value obtained by subtracting 1 (see an increased number 6F, which will be described later) from the value of the allowable number of failures 6D (FIGS. 25 and 22), for example.
  • FIG. 20 which will be described later, an example in which the second array 62 of FIG. 20 is specified as the replacement target array is shown.
  • the number of possible failures is determined from the allowable number of failures (for example, the allowable number of failures 6D in FIG. 22).
  • the array with the largest value is the replacement target array.
  • an arbitrary array may be selected from a plurality of arrays that can be replaced.
  • an array may be selected in descending order of the value obtained by subtracting the number of feared failures from the allowable number of failures, and the processing of S430 to S440 in FIG. 14 may be performed on each array in order.
  • the number of storages for which healthy storage is replaced in each array is described below. It is also possible to specify the healthy storages of the calculated number of exchanges in S430 and repeat the process of S440 to perform the exchange for each array in order.
  • the replacement target array may be specified (S1210).
  • the storage of the specified replacement target array may be specified as a healthy storage.
  • processing described with reference to FIG. 16 below may be performed.
  • FIG. 16 is a flowchart of a process for calculating the number of replacements of each array in a plurality of arrays that can be replaced.
  • the value obtained by subtracting the allowable failure number from the failure concern number in the failure concern array is set as the concern-resolving necessary number.
  • the number of replacements in each array is initialized to 0 for all replacement target array candidates.
  • the remaining number of replaceable units in each array is initialized with a value obtained by subtracting the number of possible failures from the allowable number of failures.
  • the largest replaceable remaining number is specified from all the replacement target array candidates, and the value of the remaining replaceable number specified at that time is set as the maximum replaceable remaining number.
  • the number of replacement of the selected array is increased by 1, and the remaining number of replaceable arrays of the selected array is decreased by 1.
  • S1480 it is determined whether the total number of replacements in all the arrays is less than the number necessary to eliminate the concern.
  • an array with the number of exchanges of 1 or more calculated by the above processing is used as an exchange target array, and the number of storages for which healthy storage is exchanged is the number of exchanges calculated above.
  • FIG. 21 is a diagram showing initial values, the number of exchanges, and the like in the process of selecting arrays A and B.
  • the necessary number of concerns to be identified in S1410 is 2, and the replacement target array candidates are array A, array B, and array C (first row in the table of FIG. 21).
  • the initial value of the remaining exchangeable number is set to 2 in array A, 2 in array B, and 1 in array C (second row).
  • the array A and the array B are selected as the replacement target arrays according to the flowchart of FIG. 16 (third row). The number of exchanges at that time is one for both array A and array B (fourth row).
  • a logical storage that is a virtual storage managed by a part or all of one or a plurality of physical storages is used instead of a physical storage. May be.
  • the storage drive time information and the guarantee time information in S810 and S820 are the drive time information and guarantee of the physical storage that manages the logical storage. Use time information.
  • the failure concern level is calculated in S710 for all the managed physical storages, and the storage value with the highest failure concern level is obtained. Adopt as the degree of concern about failure in logical storage.
  • FIG. 17 is a flowchart showing a processing flow of the array management unit 100 in the present embodiment.
  • the storage replacement determination unit 106 determines whether to replace the failure concern array and the healthy storage.
  • the exchange is performed only when it is determined to be performed (YES in S1520, S440), and when it is determined not to be performed, it may not be performed (NO in S1520).
  • FIG. 18 is a flowchart showing the process flow of S1510 of FIG.
  • the value obtained by subtracting the allowable number of failures from the number of possible failures in the failure concerned array is set as the necessary number for solving the concern.
  • the value obtained by subtracting the number of failure concerns from the allowable number of failures in the replacement target array is set as the maximum replaceable number.
  • S1630 it is determined whether the concern-required required number (S1610) exceeds the maximum replaceable number (S1620).
  • the number of failure concerns when the number of failure concerns is 4 and the allowable number of failures is 2, the number of concerns necessary to be solved is 2.
  • the maximum replaceable number when the allowable number of failures is 2 and the number of possible failures is 1, the maximum replaceable number is 1. Therefore, since the necessary number of concerns needs to exceed the maximum replaceable number, it is determined that the replacement is not performed (YES in S1640, S1660).
  • S1210 there may be a plurality of arrays (exchange target array candidates) that can become replacement target arrays.
  • the maximum number of replaceable units in S1620 is calculated for all replacement target array candidates, and the maximum of all replacement target array candidates is calculated.
  • the total value of the replaceable number may be the maximum replaceable number in S1630.
  • the form of processing for determining whether or not to exchange may be specifically the above-described form or another form.
  • a predetermined setting such as a setting in the array management unit 100
  • a determination is made to replace (S1520). YES), if not set, it may be determined not to replace (NO in S1520).
  • the processing flow of the array management unit 100 in this embodiment is the same as that in FIG.
  • the sound storage specifying unit 104 specifies sound storage.
  • all spare storages can be treated as sound storages. Further, the spare storage may be selected as a healthy storage with priority over the storage managed by the array.
  • FIG. 26 is a flowchart showing the flow of processing when the occurrence of a storage failure is taken into consideration.
  • the processing other than S1710 is the same as the processing in the step corresponding to that step in FIG.
  • the processing in each step of S420, S430, and S440 in FIG. 26 is the same as the processing in S420 of FIG.
  • FIG. 27 is a flowchart showing details of the processing for identifying the failure concern array in S1710 of FIG.
  • an array in which the sum of the number of failed storages acquired in S1820 and the number of feared failures exceeds the allowable number of failures is defined as a failure-aware array.
  • FIG. 28 is a flowchart showing details of the processing in S1820 of FIG.
  • a failed storage is detected for all the storages managed by the array. That is, out of all the storages, the failed storage is detected and specified.
  • the failure storage detection method includes general methods such as the presence / absence of a response to a storage access request, a method based on an error response, a method based on ECC parity mismatch, and a method based on file system mount failure.
  • the method in the above may be used.
  • the storage in which the failure is a concern and the storage in one of the arrays in which the failure is not a concern are exchanged.
  • the processing of S710 may be executed only when a storage failure is detected in S1910.
  • the array management apparatus of this embodiment is typically realized as an LSI which is a semiconductor integrated circuit. These may be individually made into one chip, or may be made into one chip so as to include a part or all of them.
  • the name used here is LSI, but it may also be called IC, system LSI, super LSI, or ultra LSI depending on the degree of integration.
  • circuit integration is not limited to LSI's, and implementation using dedicated circuitry or general purpose processors is also possible.
  • An FPGA Field Programmable Gate Array
  • reconfigurable processor that can reconfigure the connection and setting of circuit cells inside the LSI may be used.
  • a drawing device suitable for various purposes can be configured by combining a semiconductor chip on which the array management apparatus of this embodiment is integrated and a display for drawing an image.
  • the present invention can be used as information drawing means in mobile phones, televisions, digital video recorders, digital video cameras, car navigation systems, and the like.
  • a display a cathode ray tube (CRT), a liquid crystal, a PDP (plasma display panel), a flat display such as an organic EL, a projection display typified by a projector, or the like can be combined.
  • the possibility of occurrence of a failure is estimated from the drive time and the number of storages where the possibility of failure exceeds the threshold (the number of possible failures) is calculated. Then, an array having a high risk of data loss (failure concern array) is identified from the number of failure concerns and the allowable number of failures determined by the RAID level, the number of storages managed by the array, and the like. Then, only the storage that is included in the failure concern array and has a high possibility of occurrence of a failure is replaced with a storage that has a low possibility of occurrence of the failure. As a result, it is possible to reduce the concern of data loss in the failure concern array without using another storage wastefully.
  • FIG. 24 shows the system 1.
  • the system 1 shown in FIG. 1 specifically, for example, as shown in FIG. 24, the first portion 1Ha provided in the first residence and the second portion provided in the second residence. 2 portion 1Hb. More specifically, for example, distribution to three or more houses may be performed. That is, for example, there may be third to Tth residences (3 ⁇ T).
  • the system 1 may include third to Tth portions provided in the third to Tth residences. Each of the third to Tth portions may be provided with one or more of a plurality of storages 4 to be described later.
  • the system 1 may further include other parts.
  • the first residence is a residence of a child couple who is used to operating devices such as home appliances (digital recorder 10, digital recorder 10b, etc.), and the second residence is a parent couple who is not used to the operation. May be a dwelling.
  • the system 1 may be, for example, a consumer system that does not include an enterprise device.
  • the digital recorder 10 and the plurality of storages 4 are home appliances.
  • the system 1 is a system that exists in the enterprise system such as a business system and does not have a human equivalent to a professional administrator.
  • a plurality of storages 4 may be provided.
  • a part of the plurality of storages 4 provided may be provided in the first part 1Ha, and the other part may be provided in the second part 1Hb.
  • an array management unit 100 for controlling the operation of each storage 4 may be provided.
  • the one or more storages 4 included in the system 1 may be so-called online storage (not shown).
  • the array management unit 100 may be, for example, a functional block in the digital recorder 10 provided in the first portion 1Ha and connected to the television in the first residence.
  • the system 1 may have a plurality of array management units 7.
  • each array management unit 7 may have the same function as the function of the array management unit 100 of the digital recorder 10.
  • one of the plurality of array management units 7 may be included in the digital recorder 10b (FIG. 24) provided in the second portion 1Hb.
  • One of the plurality of array management units 7 may be provided in one storage 4 (storage 4c) provided in the second portion 1Hb.
  • One of the plurality of array management units 7 may be provided in a dedicated device (not shown) for managing the array.
  • the array management unit 100 may control the operation of each storage 4 when, for example, the array management unit 7 that executes control is selected from the plurality of array management units 7. Note that this selection process may be performed through communication between a plurality of array management units 7, for example.
  • the array management unit 100 provided in the digital recorder 10 may control the operation of each storage 4 provided in the second portion 1Hb, for example, via the Internet INT.
  • such an array 6 may be configured by two or more storages 4A (FIG. 22) among the plurality of storages 4 included in the system 1.
  • the number 6E of FIG. 22 indicates the number of storages 4 (four in FIG. 22) included in the two or more storages 4A constituting the array 6.
  • the failure allowable number 6D (for example, two) indicates the number of data loss in the array 6 when a failure occurs in the number of storages 4 larger than the allowable failure number 6D. In other words, no data loss occurs when a failure occurs in the number of storages 4 of the number of allowable failures 6D or less.
  • the number of storage 4 in which a failure has occurred is 0, for example.
  • the storage 4 is a storage 4a that is prone to failure and has (large) deterioration, or a storage 4b that hardly has a failure and does not have (large) deterioration.
  • FIG. 23 shows a management table (data 100T).
  • the above determination may be performed by, for example, the storage determination unit 100f in FIG.
  • the data 100fd (management table 100T) shown in FIG. 23 includes a guarantee period 100f1 of the storage 4 to be determined and a use start date 100f2.
  • warranty period 100f1 is, for example, data indicating a period of reference values published by the manufacturer of the storage 4 as a period during which no failure occurs.
  • the use start date 100f2 is data indicating the date on which use of the storage 4 is started.
  • the use start date 100f2 indicates data indicating the time from the current date to the indicated use start date as the drive time of the storage 4 by indicating the use start date of the storage 4. It is.
  • the drive time information described above may be, for example, the use start date 100f2.
  • the drive time information (use start date 100f2) may be stored in the storage 4, and the stored drive time information may be acquired by the array management unit 100 and used.
  • the failure concern degree 100fx may be calculated from such data 100fd (storage determination unit 100f).
  • the calculated failure concern degree 100fx is a value larger than a predetermined threshold (for example, a constant, the above-described failure concern degree reference value, etc.), the storage 4 deteriorates (large). This indicates that it is determined that the storage 4a has.
  • a predetermined threshold for example, a constant, the above-described failure concern degree reference value, etc.
  • the storage 4 deteriorates (large). This indicates that it is determined that the storage 4a has.
  • the calculated failure concern degree 100fx is a value equal to or smaller than the threshold value (for example, a value smaller than the threshold value), it indicates that the storage 4b does not have.
  • this calculation method may be specifically the method shown in FIG. That is, for example, the calculated failure concern degree 100fx corresponds to whether or not the driving time (such as “current date” ⁇ “use start date 100f2”) exceeds the guaranteed time (guaranteed period 100f1). (Refer to the description of “current date-start date of use> warranty period?” In FIG. 23).
  • data 100 fd of the storage 4 may be stored in association with each storage 4. In the determination, the data 100fd associated with the storage 4 to be determined may be used.
  • the number of deteriorated units (the number of failure concerns) 6A (FIG. 22, for example, 1 unit) indicating the number of storages 4A determined as the storage 4a is calculated. May be.
  • this calculation may be performed by, for example, the array processing unit 100a illustrated in FIG.
  • the failure concern array specifying unit 101 and the replacement target array specifying unit 103 described above may be included in the array processing unit 100a and may be a part of the array processing unit 100a.
  • the allowable number of failures 6D for example, two
  • two failure-prone numbers 6Aa1 and 6Aa2 one and three
  • the second array 62 shows the two failure concern numbers 6Ab1 and 6Ab2 (one and two).
  • the calculated number of degraded arrays 6 (number of feared failures) 6A described above is the number of degraded items (number of potential concerns 6Aa1, 6Ab1) equal to or less than the threshold T (the threshold Ta or the threshold Tb in FIG. 25).
  • the threshold value T the number of possible failures 6Aa2, 6Ab2 (array processing unit 100a in FIG. 22).
  • the array 6 may be detected whether the array 6 is an array in which the number of deteriorated units 6A is smaller than the threshold value T and is small and is unlikely to cause data loss, or is larger than the threshold value T and is likely to cause data loss.
  • FIG. 20 shows the system 1.
  • system 1M system 1 before the storage is replaced
  • system 1N lower system 1
  • a plurality of arrays 6 may be configured.
  • first array 61M and the second array 62M in the upper stage of FIG. 20 indicate the first array 61 and the second array 62 before the storage is replaced, and the lower first array.
  • 61N and the second array 62N indicate the first array 61 and the second array 62 after the replacement.
  • the allowable number of failures 6D (FIG. 22) of the plurality of arrays 6 may be the same.
  • the allowable number of faults 6D shown in FIG. 25 indicates the same number as that of each other.
  • the first array 61 (first array 61M) may be specified (array processing unit 100a).
  • the second array 62 (second array) detected from among the plurality of arrays 6 to have a small number of deteriorated units 6A (the number of failure fear units 6Ab1, one unit) that is equal to or less than the threshold value T (threshold value Tb). 62M) may also be specified (array processing unit 100a).
  • the threshold Ta is, for example, the same value (two) as the value of the allowable number of failures 6D (two) of the array (first array 61) where detection is performed.
  • the specified first array 61 (first array 61M) has a number of deteriorated units (the number 6Aa2, the number of failure fears) that is larger than the threshold Ta (two units) of the same number as the allowable number of failures 6D of the first array 61. 3).
  • the failure concern number 6Aa2 of the identified first array 61 is the number in the range Ra larger than the threshold Ta shown in FIG.
  • the number 6Aa2 (three) of fear of failure is schematically indicated by three “deterioration” characters attached to the first array 61M.
  • the threshold value Tb may be, for example, a value obtained by subtracting 1 from the allowable number of failures 6D (FIG. 25, 2) of the array in which detection is performed (second array 62). .
  • the number of deteriorated 6Bs of the second array 62 to be detected may be such a number of deteriorated items (the number of failure fears 6Ab1, 1) equal to or less than the threshold Tb (1) reduced by 1.
  • the failure concern number 6Ab1 of the second array 62 specified is the number in the range Rb shown in FIG.
  • FIG. 20 the number 6Ab1 (1 unit) of which there is a possibility of failure is schematically shown by one “deterioration” character attached to the second array 62M.
  • the above-described failure concern array may be, for example, the first array 61 specified.
  • the above-described replacement target array may be the second array 62.
  • the storage 4aXa (FIG. 20) including the deterioration included in the specified first array 61 and the storage 4bXa (FIG. 20) including the deterioration included in the specified second array 62 are included. They may be exchanged (exchange unit 105).
  • exchange performed is, for example, a so-called logical exchange.
  • the exchange that is performed may be referred to as a swap, for example.
  • the storage 4aXa of the first array 61 to be replaced is, for example, two or more degraded storages 4a (FIGS. 20 and 22) of the first array 61.
  • the storage 4bXa (FIG. 20) of the second array 62 to be replaced is one of the two or more storage 4b (FIGS. 20 and 22) having no deterioration included in the second array 62.
  • the storage 4b specified by the sound storage specifying unit 104 may be used.
  • the data of the storage 4aXa of the first array 61 may be moved to a predetermined storage unit (not shown). After this movement, the data in the storage 4bXa in the second array 62 (second array 62M) may be moved to the storage 4aXa in the first array 61. Thereafter, the data in the storage 4aXa in the first array 61 after being moved to the storage unit may be moved to the storage 4bXa in the second array 62.
  • the data in the storage 4aXa and the data in the storage 4bXa may be exchanged to exchange data (actual data exchange control unit 105a in FIG. 23).
  • each storage 4 is included by the data 100T of FIG.
  • an array 6 (number or the like) including the storage 4 may be stored in association with each storage 4 (each column in the table of FIG. 23).
  • the storage 4aXa (for example, the third storage) is included in the first array 61
  • the storage 4bXa (for example, the fifth storage) is included in the second array 62 (FIG. 23).
  • the data 100T is updated (changed) when the storage is replaced, and after the update, the storage 4aXa is included in the second array 62, and the storage 4bXa is included in the first array 61. (Table updating unit 105b).
  • the data 100T may be stored, for example, by the management table storage unit 100S (FIG. 23).
  • the management table storage unit 100S may specifically be a part of the array management unit 100, for example. That is, for example, the management table storage unit 100S may be a part of the exchange unit 105 or a part of the lower-level transfer control unit 304.
  • the management table storage unit 100S may have other forms.
  • each storage 4 (storage 4aXa, 4bXa) may be subjected to the following control before updating. That is, before the update, control may be performed so that the array 6 (the first array 61 and the second array 62) indicated to include the storage 4 is operated as the storage 4.
  • each storage 4 (storage 4aXa, 4bXa) may be subjected to the following control after the update.
  • the array 6 (second array 62, first array 61) indicated to be included may be controlled to operate as the storage 4.
  • These controls may be performed by, for example, the lower-level transfer control unit 304 (FIGS. 23, 3 and 7).
  • communication of data written and read by an application executed in the digital recorder 10 may be performed via the higher-order transfer control unit 305 (FIG. 3). Then, the low-order transfer control unit 304 may execute writing and reading of data to be communicated with respect to the appropriate array 6.
  • the deterioration number 6A (the number of failure concerns) of the array 6 (see the first array 61) including the storage 4aXa having deterioration is equal to the threshold T ( In the case of the number of deteriorated units (threshold failure number 6Aa1) equal to or less than the threshold value Ta), the exchange with the storage 4bXa that does not have deterioration is not performed.
  • the system 1 is a consumer system and the cost that can be borne by the user is smaller than the cost that can be borne by an enterprise device or the like, the generated cost is It can be made at a lower cost for consumer use.
  • the storage 4bXa that is exchanged and has no deterioration may be included in the second array 62.
  • the storage 4bXa may be a storage 4 that stores and uses data even before replacement. That is, the storage 4bXa is not a spare storage (see the background art description).
  • the spare storage is, for example, a storage that does not store data before the spare storage is used for replacement.
  • the spare storage can be made unnecessary, and the number of spare storages 5 (FIG. 2) provided can be reduced.
  • the storage 4bXa to be replaced is the storage 4 included in the second array 62 that has a small number of deteriorated units (the number 6Ab1 that is likely to fail).
  • FIG. 20 it is schematically indicated by a circle added to the second array 62N that the storage 4a having deterioration in the second array 62N is sufficiently small.
  • system 1 may be provided with one or more spare storages 5 (FIG. 2).
  • the plurality of storages 4 included in the system may include one or more spare storages 5 (FIG. 2).
  • each spare storage 5 is, for example, a storage 4 that does not store data and is not used before the spare storage 5 is replaced.
  • the spare storage 5 may be specified as the storage 4 to be exchanged with the storage 4aXa of the specified first array 61 (the healthy storage specifying unit 104).
  • the identified spare storage 5 may be replaced with the storage 4aXa of the first array 61 (exchange unit 105).
  • the number of spare storages 5 may be decreased by one for each replacement.
  • the spare storage 5 may be specified before the number becomes zero, and the storage 4 (storage 4bXa) included in the array 6 may be specified after the number becomes zero.
  • the spare storage 5 is specified as the storage 4 to be replaced, the data is transferred from the storage 4 to be replaced (spare storage 5) to the storage 4aXa having the above-described deterioration. Such processing may not be performed.
  • the number of the arrays 6 included in the system 1 may be two, three, or another number.
  • a plurality of arrays 6 (second array 62 and third array 63) having a deteriorated number (failure allowable number) 6A smaller than the threshold Tb (FIG. 25) may be specified by the array processing unit 100a. .
  • one storage 4aXa (FIG. 20) having degradation in the first array 61 may be replaced with the storage 4bXa having no degradation in the specified second array 62.
  • the other storage 4aXb having deterioration in the first array 61 may be exchanged with the storage 4bXb having no deterioration in the specified third array 63.
  • a plurality of storage 4aX having deterioration may be replaced with a plurality of storage 4bX having no deterioration.
  • the plurality of storage 4bX having no deterioration are included in, for example, a plurality of different arrays 6 (second array 62 and third array 63) as shown in FIG. May be.
  • the plurality of storage 4bX having no deterioration may be included in the same array 6 (for example, the second array 62) (not shown).
  • processing corresponding to the sum of the surplus number 6C (FIG. 22) in the plurality of specified replacement target arrays may be performed.
  • processing may be performed in accordance with the number of units (the necessary number for solving the concern) obtained by subtracting the allowable number of failures 6D from the number of storage 4a having degradation in the failure concern array (first array 61).
  • the replacement is performed only when the sum of the surplus number 6C is larger than the necessary number to solve the concern, and when it is not large, one storage 4 may not be replaced.
  • the storage 4 having the sum of the surplus number 6C may be replaced (see FIG. 16).
  • FIG. 19 shows an example of the data structure of the data 100T.
  • the specific data configuration of the data 100T may be various configurations.
  • each storage 4 (number, etc.) included in the array 6 may be stored.
  • the data 100fd (FIG. 23) may not be included in the data 100T.
  • the threshold T is the number determined from the allowable number of faults 6D of the array 6. That is, the threshold T is the same number (threshold Ta) as the allowable failure number 6D, or the number by which 1 is subtracted (threshold Tb).
  • the range R (the range Ra greater than the threshold Ta and the range Rb equal to or less than the threshold Tb in FIG. 25) is specified by the threshold T.
  • the deteriorated number 6A number of feared failures
  • a range R for example, a range Ra
  • the storage is exchanged only when it is determined to be within the range R (exchange between the storages 4aXa and 4bXa). When it is determined that it is outside the range R, the exchange is not performed.
  • the known prior art lacks some or all of the plurality of configurations and does not produce a synergistic effect.
  • the present technology is different from the conventional example.
  • the array management device of the present invention can be used for various purposes.
  • this array management apparatus may be an information display device that stores displayed information by a plurality of arrays.

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Debugging And Monitoring (AREA)

Abstract

 デジタルレコーダー(10)は、無駄に別のストレージを使用してしまうことなく、かつ、故障懸念アレイの故障率を下げることができ、複数のアレイの中から、故障懸念台数が故障許容台数を超える故障懸念アレイを特定する故障懸念アレイ特定部(101)と、特定された前記故障懸念アレイが管理する故障懸念ストレージと、特定された健全ストレージとを交換する交換部(105)とを備える。

Description

アレイ管理装置、方法、集積回路およびプログラム
 本発明は、複数のストレージを所定のRAID構成で管理するアレイを管理するアレイ管理装置および方法に関するものである。
 ストレージアレイ装置では、大容量化および高性能化を図ると共に、必要な信頼性を確保するためのRAID(Redundant Arrays of Inexpensive Disks)技術が一般的に用いられている。RAIDでは、その構成の種類により、複数の形態が存在する。そして、それらの形態のうちで、レベル1からレベル6までの各形態では、冗長化構成による、信頼性の向上を図ることが可能であることは良く知られている。
 このようなストレージアレイ装置では、アレイが管理するストレージに障害が発生した時、アレイは縮退(degrade)状態となる。故障ストレージを、正常なストレージと交換後、アレイが管理する他のストレージから、データを復旧し、交換を行った正常なストレージへ、復旧データをコピーすることで、アレイは、縮退状態から通常状態へ復旧する。
 また、アレイが許容する、ストレージの故障台数を示す故障許容台数(図22の故障許容台数6Dを参照)は、RAIDレベル、および、アレイが管理するストレージ台数(台数6E参照)等により決定される。例えば、RAID5では、最大で一重故障を許容するため、故障許容台数は1台となる。一方、RAID6では、一重故障および二重故障を許容するため、故障許容台数は、2台となる(図22参照)。故障許容台数を超える多重故障が発生した場合、回復不能なデータ損失が発生する。
 さらに、スペアストレージを用いることで、更なる信頼性の向上を図るストレージアレイ装置も存在する。一般的に、スペアストレージは、アレイが管理するストレージが故障するまでは、待機状態であり、アレイが管理するストレージにおいて故障が発生した時には、故障したストレージは、スペアストレージと論理的に交換される。加えて、例えば、アレイが管理するストレージの、故障発生の可能性を推測し、故障発生前に、スペアストレージに、データのコピーを行う手法、あるいは、故障発生の可能性が高いストレージを、アレイから外し、スペアストレージと交換する手法が提案されている。
 このような、従来の技術としては、例えば特許文献1、特許文献2に記載された技術が知られている。
特開2005-122338号公報 特開2008-250566号公報
 上記従来技術は、故障する可能性が高いストレージを、スペアストレージと交換する技術である。しかし、上記従来技術は、複数のストレージを、管理するアレイ単位で故障するかどうか判断することができない。従って、本来、ストレージを交換する必要がないアレイであるにも関わらず、無駄に別のストレージを使用してしまう場合が発生してしまう。
 さらに、上記従来手法は、スペアストレージの使用を前提としているが、スペアストレージの使用は、コストの増加を意味する。
 つまり、アレイの故障率を下げるために、無駄にストレージを使用してしまうという課題がある。
 本発明は、上記従来の課題を解決するものであり、無駄に別のストレージを使用してしまうことなく、かつ、故障懸念アレイの故障率を下げることができるアレイ管理装置を提供することを目的とする。
 上記目的を達成するために、本発明のアレイ管理装置は、複数のストレージを所定のRAID構成で管理するアレイを、複数管理するアレイ管理装置であって、前記各アレイのRAID構成から、前記各アレイが許容する、ストレージの故障台数を示す故障許容台数を前記アレイ毎に算出し、故障する可能性がある故障懸念ストレージの台数を示す故障懸念台数を前記アレイ毎に算出し、前記複数のアレイの中から、前記故障懸念台数が、前記故障許容台数を超える故障懸念アレイを特定する故障懸念アレイ特定部と、特定された前記故障懸念アレイが管理する前記複数のストレージの中から、前記故障懸念ストレージを特定する故障懸念ストレージ特定部と、特定された前記故障懸念ストレージと交換するためのストレージであって、特定された前記故障懸念ストレージよりも、故障する可能性が低いストレージである健全ストレージを特定する健全ストレージ特定部と、前記特定された故障懸念ストレージと前記特定された健全ストレージとを交換する交換部とを備えるアレイ管理装置である。
 本発明によれば、無駄に別のストレージを使用してしまうことなく、かつ、故障懸念アレイの故障率を下げることができるという効果が得られる。
図1は、本発明の実施形態1における実施イメージ図である。 図2は、本発明の実施形態1におけるアレイ管理装置の一例の構成図である。 図3は、本発明の実施形態1におけるアレイ管理装置の一例のシステム構成図である。 図4は、本発明の実施形態1におけるアレイ管理装置の一例の構成図である。 図5は、本発明の実施形態1におけるアレイ管理装置の一例のシステム構成図である。 図6は、本発明の実施形態1におけるアレイ管理部の処理の流れを示すフロー図である。 図7は、本発明の実施形態1における故障懸念アレイ特定部の処理の流れを示すフロー図である。 図8は、本発明の実施形態1における故障許容台数をアレイ毎に取得するフロー図である。 図9は、本発明の実施形態1における故障懸念台数をアレイ毎に取得するフロー図である。 図10は、本発明の実施形態1における故障懸念度をストレージ毎に取得するフロー図である。 図11は、本発明の実施形態1における故障懸念度を算出するフロー図である。 図12は、本発明の実施形態1における故障懸念ストレージ特定部の処理の流れを示すフロー図である。 図13は、本発明の実施形態1における健全ストレージ特定部の処理の流れを示すフロー図である。 図14は、本発明の実施形態1におけるアレイ管理部の処理の流れにおいて、交換対象アレイの特定処理を追加したフロー図である。 図15は、本発明の実施形態1における交換対象アレイ特定部の処理の流れを示すフロー図である。 図16は、本発明の実施形態1における、交換対象アレイに対して各アレイの交換数を算出するフロー図である。 図17は、本発明の実施形態2におけるアレイ管理部の処理の流れを示すフロー図である。 図18は、本発明の実施形態2におけるストレージ交換判断部の処理の流れを示すフロー図である。 図19は、管理テーブルを示す図である。 図20は、交換前の複数のアレイと、交換後の複数のアレイを示す図である。 図21は、各アレイの交換数等を示す図である。 図22は、アレイを示す図である。 図23は、管理テーブル等を示す図である。 図24は、システムの具体例を示す図である。 図25は、故障許容台数、および故障懸念台数を示す図である。 図26は、ストレージ故障の発生を考慮した場合の処理の流れを示したフローチャートである。 図27は、図26のS1710の故障懸念アレイを特定する処理のフローチャートである。 図28は、図27のS1820の処理の詳細を示すフローチャートである。
 以下、本発明の実施形態におけるアレイ管理装置について、図面を参照しながら説明する。
 実施形態のアレイ管理装置は、複数のストレージ4A(図22)を所定のRAID構成で管理するアレイ6を、複数(図20のアレイ61~62等)管理するアレイ管理装置(アレイ管理部100、デジタルレコーダー10、システム1、アレイ管理部7)である。各アレイ6のRAID構成から、各アレイ6が許容する、ストレージの故障台数を示す故障許容台数6D(図25、例えば2台)をアレイ6毎に算出し、故障する可能性がある故障懸念ストレージ4a(図22)の台数を示す故障懸念台数6A(図22)をアレイ6毎に算出し、複数のアレイ(アレイ61、62等)の中から、故障懸念台数6A(図20の第1のアレイ61での3台)が、故障許容台数6D(例えば、図22での2台)を超える故障懸念アレイ(第1のアレイ61)を特定する故障懸念アレイ特定部101を備える。特定された故障懸念アレイが管理する複数のストレージ4Aの中から、故障懸念ストレージ(図20のストレージ4aXa)を特定する故障懸念ストレージ特定部102を備える。特定された故障懸念ストレージ(ストレージ4aXa)と交換するためのストレージであって、特定された故障懸念ストレージ(ストレージ4aXa)よりも、故障する可能性が低いストレージである健全ストレージ(図20のストレージ4bXa等)を特定する健全ストレージ特定部104を備える。特定された故障懸念ストレージ(ストレージ4aXa)と、特定された健全ストレージ(ストレージ4bXa等)とを交換する交換部105を備える。
 これにより、無駄に別のストレージを使用してしまうことなく、かつ、故障懸念アレイの故障率を下げることができる。
 つまり、具体的には、例えば、第1のアレイ61(図20)を構成する複数のストレージ4A1(図20)と、第2のアレイ62を構成する複数のストレージ4A2とを含む複数のストレージ4(図24)のうちの一部(図24での、上から2つのストレージ4など)は、第1の住居(にある第1の部分1Ha)に設けられ、他の一部は、第2の住居(にある第2の部分1Hb)に設けられてもよい。故障懸念アレイ特定部は、複数のアレイ(第1、第2のアレイ61、62など)から、第1のアレイ61を特定してもよい。特定される当該アレイ(第1のアレイ61)においては、故障懸念台数(図25の故障懸念台数6Aa2、3台)が、故障許容台数6D(2台)から決まる予め定められた第1の閾値Ta(故障許容台数6D(2台)と同じ台数(2台))よりも大きくてもよい。当該アレイ管理装置の内部または外部などにある交換対象アレイ特定部は、複数のアレイ61、62から第2のアレイ62を特定する。特定される当該アレイ(第2のアレイ62)においては、故障懸念台数(故障懸念台数6Ab1)が、故障許容台数6D(2台)から決まる予め定められた第2の閾値Tb(2-1=1台)以下でもよい。交換部は、特定された第1のアレイ61に含まれる、故障する可能性がある故障懸念ストレージ4aXaを、特定された第2のアレイ62に含まれる、当該故障懸念ストレージでの上述の可能性よりも低い、故障する可能性を有する前記健全ストレージ4bXaと交換してもよい。
 こうして、比較的小さい故障懸念台数6Ab1を有する第2のアレイ62に含まれる健全ストレージ4bXaが特定されて、特定された健全ストレージ4bXaと、特定された故障懸念ストレージ4aXaとが交換されてもよい。
 こうして、特定された健全ストレージ4bXaと、特定された故障懸念ストレージ4aXaとの交換のみがされて、他の交換がされず、適切な交換のみがされ、不適切な交換がされるのが回避できる。
 そして、例えば、健全ストレージ特定部は、健全ストレージ4bXaとして、故障懸念アレイ61が管理するストレージ4A1ではないストレージ(ストレージ4bXa等)を特定してもよい。
 これにより、同一のアレイ内での交換(第1のアレイ61のストレージ同士での交換)を行わないことで、無駄な処理を減らすことができる。
 そして、例えば、特定される健全ストレージ4bXaは、複数のアレイ(第1、第2のアレイ61、62等)に含まれる交換対象アレイ(第2のアレイ62)に含まれてもよい。当該交換対象アレイ62は、故障懸念アレイ61とは異なるアレイ(第2のアレイ62)であり、交換対象アレイ(第2のアレイ62)は、1台の故障懸念ストレージ4aXaと、1台の前記健全ストレージ4bXaとが交換された後における、交換対象アレイ62Nの故障懸念台数6Abx(図25では2台)が、交換対象アレイ62の故障許容台数6D(図25では2台)を超えないアレイでもよい。
 これにより、健全な交換対象アレイ(第2のアレイ62)との間での交換をすることで、全体のアレイ故障率を減らすことができる。
 ここで、交換対象アレイは、故障懸念台数6A(図22)が、故障許容台数6Dよりも小さく、つまり、余裕台数6Cが1以上であるアレイである。
 そして、交換対象アレイにおける、特定される健全ストレージの個数は、例えば、2個以上でもよい。
 具体的には、例えば、ある場合には、特定される健全ストレージの個数(図18における懸念解消必要台数)が、余裕台数6C(図18の最大交換可能台数)以下である一方で(図18のS1640のNOを参照)、別の場合には、余裕台数6Cよりも多くてもよい(S1640のYESを参照)。
 そして、余裕台数6C以下である場合には(S1640のNO)、交換対象アレイは、健全であるが、余裕台数6Cより多い場合には(S1640のYES)、例外的に、健全ではなく、不健全である。
 なお、ここで、特定される健全ストレージの個数(懸念解消必要台数)が、余裕台数6C(最大交換可能台数)以下である場合には(S1640のNO)、次の通りである。つまり、その場合には、その健全ストレージまでが交換されると、その健全ストレージの交換の後における故障懸念台数が、故障許容台数6Cを超えてしまう健全ストレージである超過ストレージがない。一方で、余裕台数6Cより多い場合には(S1640のYES)、超過ストレージがある。
 そこで、例えば、アレイ管理装置は、さらに、ストレージ交換判断部106を備え、ストレージ交換判断部106は、特定された故障懸念ストレージと、交換対象アレイに含まれる、特定された健全ストレージとが交換された後における、当該交換対象アレイの故障懸念台数が、当該交換対象アレイの故障許容台数6Dを超えるか否か(当該健全ストレージが、超過ストレージであるか否か)を判断し(図18のS1630を参照)、交換部は、超えるとの判断(超過ストレージであるとの判断)がされた場合には(S1640のYES)、特定された、何れの健全ストレージについても、特定された故障懸念ストレージと、特定された健全ストレージとの間の交換をしなくてもよい(S1660)。
 これにより、超過ストレージがあると判断され、交換対象アレイが健全でなく、健全な交換対象アレイが存在しない場合には(S1640のYES)、無駄な処理(交換に伴う、データ転送など)を行わない。このことで、処理量を減らすことができる。
 つまり、これにより、超過ストレージがないと判断される場合には(S1640のNO)、交換がされて(S1650)、データ損失の発生が回避されることが維持できる。
 一方で、超過ストレージがあると判断される場合には(S1640のYES)、特定された、何れの健全ストレージについても、交換がされず(S1660)、大量のデータ(例えば、数ギガバイト~数10ギガバイト)のデータ転送(無駄な処理)がされるのが回避され、そのデータ転送で生じる劣化が回避できる。これにより、この種のシステム(図24を参照)で必要な程度に十分に、データ転送による劣化が小さくできる。
 これにより、データ損失の発生回避が維持されるのに加えて、劣化が十分に小さいことが両立できる。
 (実施形態1)
  (1-1.概要)
 まず、本発明の実施形態1のアレイ管理装置の概要について説明する。
 図1は、実施形態1のアレイ管理装置の実施イメージ図である。
 例えば、デジタルレコーダー10は、ネットワーク20~28により、ストレージ11~18と接続される。デジタルレコーダー10は、デジタルカメラで撮影された、画像データ等のデジタルデータの管理・保存することを、目的として有する。デジタルレコーダー10は、アレイ管理部100(図2等)を内部に組み込むことにより、デジタルデータを、ストレージ11~18に冗長化保存することを可能とする。
 なお、ネットワーク20~28は、有線はもちろん、無線を用いても良い。また、ネットワーク20~28の代わりに、USB(Universal Serial Bus)、eSATA(External Serial ATA)、IEEE1394(The Institute of Electrical and Electronics Engineers, Inc. 1394)、IDE(Integrated Drive Electronics)、シリアルATA(Advanced Technology Attachment)、SCSI(Small Computer System Interface)、SAS(Serial Attached SCSI)等の通信バスを用いてもよい。そして、これらの通信バスを用いると共に、ストレージ11~18として、前記通信バスに対応するストレージを用いても良い。また、ストレージ11~18は、デジタルレコーダー10の筐体内部に格納されても良い。
 なお、実施形態のアレイ管理装置は、例えば、システム1であると考えられてもよいし、システム1における、デジタルレコーダー10のみからなると考えられてもよいし、デジタルレコーダー10に実現される機能ブロックであるアレイ管理部100のみからなると考えられてもよい。
 以上が、アレイ管理装置の概要についての説明である。
  (1-2.構成)
 次に、本発明の実施形態1のアレイ管理装置の構成について説明する。
 図2は、本発明の実施形態1におけるアレイ管理装置の一例の構成図である。
 アレイ管理装置は、ストレージアレイ(アレイ(ストレージアレイ)61等)を管理する装置である。
 ストレージアレイは、RAID等の技術を用いることで、当該ストレージアレイに含まれる複数のストレージに対して、データを冗長化保存することを可能とする装置である。
 アレイ管理装置は、複数のストレージアレイ61~62と、それら複数のストレージアレイ61等を管理するためのアレイ管理部100とを備える。
 なお、より具体的には、例えば、アレイによって管理されないストレージであるスペアストレージ5の1台以上をさらに備えても良い。実施形態1では、スペアストレージを備えない実施の形態について説明し、スペアストレージを備える実施の形態については、後述の実施形態3にて説明する。
 アレイ管理部100は、故障懸念アレイを特定する故障懸念アレイ特定部101と、故障懸念ストレージを特定する故障懸念ストレージ特定部102と、健全ストレージを特定する健全ストレージ特定部104と、故障懸念ストレージと、健全ストレージとの間の論理的交換を行う交換部105とを備える(図4参照)。
 ここで、故障懸念アレイは、アレイが管理するストレージの故障による、格納されるデータのデータ損失の発生が懸念されるアレイである。そして、故障懸念ストレージは、故障が懸念されるストレージである。そして、健全ストレージは、故障の懸念を持たないストレージである。
 なお、さらに具体的には、アレイ管理部100は、上記に加えて、さらに、交換対象アレイを特定する交換対象アレイ特定部103(図2)を備えても良い。
 ここで、交換対象アレイは、故障懸念アレイとのストレージ交換の対象となり得る健全ストレージを管理するアレイである。
 さらに、アレイ管理部100は、上記に加えて、故障懸念ストレージと、健全ストレージとの論理的交換により、故障懸念アレイにおける故障の懸念が解消されるかを判断する処理がされてもよい。つまり、この処理をすることで、交換を実施するかを決定するストレージ交換判断部106(図2)を備えても良い。
 なお、交換対象アレイ特定部103(図2)を備えないアレイ管理部100(図4参照)は、例えば、アレイ管理部100の外部(デジタルレコーダー10の外部)に設けられた交換対象アレイ特定部103を利用してもよいし、その他の形態を有してもよい。
 なお、実施形態1では、上記の判断を行わない実施の形態について説明し、上記の判断を行う実施の形態については、実施形態2にて説明する。
 なお、上記構成要素101~106については、LSI(Large Scale Integration)により実現することもできる。
 つまり、例えば、これら故障懸念アレイ特定部101等の機能が実現された集積回路100Lが設けられてもよい。そして、この集積回路100Lは、例えば、デジタルレコーダー10に設けられてもよい。そして、集積回路100Lは、例えば、アレイ管理部100の一部または全部でもよい。
 図3は、実施形態1におけるアレイ管理装置のシステム構成図である。
 デジタルレコーダー10は、各種処理プログラムを記録するROM301と、全体の処理を司るCPU302と、一時的にデータを記録するRAM303と、ストレージ11~18とのデータ転送を制御する下位側転送制御部304と、デジタルカメラ等、他の装置とのデータ転送を制御する上位側転送制御部305とを備える。なお、構成要素101~106については、例えば、ROM301内にプログラムとして保存され、CPU302により、それぞれの構成要素の処理が実行される。
 なお、こうして、例えば、デジタルレコーダー10は、CPU302等により情報処理を行うコンピュータ(情報処理装置)を含んでもよい。そして、このコンピュータにより、ROM301等で、故障懸念アレイ特定部101等のプログラムがそれぞれ記憶されてもよい。そして、記憶された、それぞれのプログラムがコンピュータにより実行されることにより、故障懸念アレイ特定部101等の機能が、デジタルレコーダー10に実現されてもよい。
 なお、図5においては、故障懸念アレイ特定部101等のないケースが例示される。
 以上が本発明の実施形態のアレイ管理装置の構成についての説明である。
  (1-3.動作)
 次に、アレイ管理装置の動作について説明する。
 図6は、本実施形態におけるアレイ管理部100の処理の流れを示すフローチャートである。
 S410では、故障懸念アレイ特定部101により、故障懸念アレイの特定を行う。
 S420では、故障懸念ストレージ特定部102により、故障懸念アレイが管理するストレージの中から、故障懸念ストレージの特定を行う。
 S430では、健全ストレージ特定部104により、交換対象となる健全ストレージの特定を行う。
 S440では、交換部105により、故障懸念ストレージと、健全ストレージとの論理的交換を行う。
 なお、上記処理を定期的に実行しても良い。
 図7は、図6のS410の処理の流れを示すフローチャートである。
 故障懸念アレイ特定部101の動作について、図7を用いて詳しく説明する。
 まず、S510では、アレイが許容するストレージの故障台数を示す故障許容台数(図22の故障許容台数6Dを参照)を、アレイ毎に特定する。
 S520では、故障する可能性がある故障懸念ストレージの台数を示す故障懸念台数(故障懸念台数6Aを参照)を、アレイ毎に特定する。
 S510とS520にて特定した、故障許容台数および故障懸念台数を利用し、S530では、故障懸念台数が、故障許容台数を超えるアレイを、故障懸念アレイとする。例として、故障懸念台数が2台、故障許容台数が1台のアレイは、S530の条件に合致するため、故障懸念アレイとなり得る。
 なお、このように、例えば、故障懸念台数が故障許容台数を超えるアレイが、故障懸念アレイとして特定されてもよい。
 つまり、例えば、故障懸念台数(劣化台数)6A(図22)が、閾値Ta(図25)よりも大きい(閾値Taを超える)故障懸念台数6Aa2であるアレイが、故障懸念アレイとして特定されてもよい。ここで、閾値Taは、故障許容台数6D(図22、図25)の値と同じ値(例えば2台)であり、故障許容台数6Dにより決まる値である。なお、換言すれば、故障懸念台数(劣化台数)6Aが、この閾値Taよりも大きい範囲Ra(図25)内の故障懸念台数6Aa2であるアレイ(第1のアレイ61)が、故障懸念アレイとして特定されてもよい。
 なお、後述される図20においては、図20の第1のアレイ61が、故障懸念アレイとして特定される例が、示される。
 S530にて、故障懸念アレイとなり得るアレイ(故障懸念アレイ候補)が複数存在する場合には、例えば、故障懸念台数(例えば、図25の故障懸念台数6Aa2など)から故障許容台数(図25の故障許容台数6D)を減じた数が、最大のアレイを、故障懸念アレイとしてもよい。
 なお、故障懸念アレイとなり得る複数のアレイ(故障懸念アレイ候補)の中から、任意のアレイを選択しても良い。また、故障懸念台数(例えば、故障許容台数以上のもの)から故障許容台数を減じた値が大きい順に選択し、図6のS420~S440の処理を、それぞれのアレイに対して、順に行っても良い。
 図8は、図7のS510の処理の流れを示すフローチャートである。
 まず、S610では、アレイにおけるRAID構成の種類を示すRAIDレベルを取得し、S620では、取得されたRAIDレベルに応じて、以下の通り分岐する。
 前記RAIDレベルが1の場合、S630にて、アレイが管理するストレージ台数を取得し、S640にて、上記ストレージ台数から1を減じた台数を、アレイにおける故障許容台数とする。
 例として、3台のストレージに対して、RAID1を用いて、同一のデータの書き込みを行い、つまり、書き込みを行うデータを、3台のストレージの何れにも書き込む冗長化アレイの場合を考える。この場合、アレイが管理するストレージ台数は、3台であるため、故障許容台数は2となる。
 また、前記RAIDレベルが、2ないし5の何れか1つである場合、S650にて、1を、アレイにおける故障許容台数とする。
 また、前記RAIDレベルが6の場合、S660にて、2を、アレイにおける故障許容台数とする(図22の故障許容台数6Dを参照)。
 S670にて、分岐の処理がされることにより、上記の処理を、全てのアレイに対して繰り返し行う。つまり、それぞれのアレイについて、上記の処理が行われる。
 なお、RAIDレベルが、1ないし6の何れにも該当しない冗長化管理手法(トリプルパリティなど)を用いても良い。RAIDレベルが、1ないし6の何れにも該当しない冗長化管理手法を用いる場合、冗長化管理手法の特性に応じて、故障許容台数の算出を行う。
 図9は、図7のS520の処理の流れを示すフローチャートである。
 まず、S710では、アレイが管理する全ストレージに対して、ストレージ故障が発生する懸念の高さを示す故障懸念度を、ストレージ毎に取得する。つまり、それぞれのストレージの故障懸念度が取得される。
 S720では、故障懸念度が所定値を超えるストレージの台数を、アレイにおける故障懸念台数とする。例として、所定値は、0.2とする。
 S730にて、分岐の処理がされて、上記の処理を、全てのアレイに対して繰り返し行う。
 図10は、図9のS710の処理の流れを示すフローチャートである。
 まず、S810では、ストレージ保証期間情報を取得する。なお、取得される保証期間情報は、具体的には、例えば、図23に示される保証期間(のデータ)100f1でもよい。
 S820では、ストレージの駆動時間情報を取得する。なお、取得される駆動時間情報は、例えば、ストレージの使用が開始された年月日を特定することにより、現在の年月日から、特定される、開始の年月日までの時間を駆動時間として特定してもよい。より具体的には、例えば、取得される駆動時間情報は、図23に示される使用開始年月日(のデータ)100f2でもよい。
 S810とS820にて取得した、保証期間情報と駆動時間情報とを利用して、S830では、故障懸念度の算出を行う。S840では、上記算出した故障懸念度を、ストレージの故障懸念度とする。
 S850にて、分岐の処理をして、上記の処理を、全てのストレージに対して繰り返し行う。
 なお、ストレージの保証期間情報の取得方法として、予めROMに記録された情報を用いても良いし、インターネットを用いて、取得しても良い。
 さらに、ストレージの駆動時間情報の取得方法として、ストレージの自己診断情報(S.M.A.R.T.など)を用いても良い。
 さらに、ストレージの故障懸念度の算出を行うために、初回起動からの経過時間、読込みエラー発生率、書き込みエラー発生率、データの書き換え回数、電源投入回数、動作温度、所定値以上の加速度による衝撃を受けた回数、電源が投入されている時間の累積値、読み書き動作が行われている時間の累積値などの情報を取得しても良い。
 図11は、図10のS830の処理の流れを示すフローチャートである。
 まず、S910では、駆動時間が、保証時間を超えるかの判断を行い、S920では、S910での判断の結果を受けて、以下の通り分岐を行う。
 駆動時間が保証時間を超えないとの判断がされた場合(S920のNO)、S930にて、所定値を、故障懸念度とする。例として、0とする。
 駆動時間が保証時間を超える場合(S920のYES)、S940にて、駆動時間の増加に伴い、懸念度が増大するように、懸念度を算出し、S950にて、上記懸念度を、故障懸念度とする。例として、駆動時間を60000時間、保証時間を40000時間とした時には、駆動時間から保証時間を減じた値(20000時間)に対して、保証時間(40000時間)を除した値(20000時間÷40000時間=0.5、つまり50%)を算出し、0.5を故障懸念度とする。
 なお、図10により取得した、ストレージの故障懸念度について、次の通りである。つまり、故障懸念度の算出を行うために、初回起動からの経過時間、読込みエラー発生率、書き込みエラー発生率、データの書き換え回数、電源投入回数、動作温度、所定値以上の加速度による衝撃を受けた回数の情報、電源が投入されている時間の累積値、読み書き動作が行われている時間の累積値などを用いてもよい。これらを用いて、故障懸念度の算出を行っても良い。
 このように、算出される故障懸念度は、例えば、駆動時間(例えば、現在の年月日から、使用開始年月日100f2までの時間)が、保証時間(保証期間100f1)を超えるか否かに基づいた値でもよい(図23の故障懸念度100fxを参照)。
 図12は、図6のS420の処理の流れを示すフローチャートである。
 次に、故障懸念ストレージ特定部102の動作について、図12を用いて、詳しく説明する。
 まず、S1010では、故障懸念アレイに含まれる、全てのストレージに対して、故障懸念度を、ストレージ毎に算出する。
 S1020にて、故障懸念度が、所定値を超えるストレージを、故障懸念ストレージとする。
 なお、S1010の処理の流れについては、図10のフローチャートの処理と同一であるため、詳しい説明を省略する。なお、故障懸念度の算出を実行する代わりに、S410の処理の内部で算出した値を記録しておき、S420において使用することもできる。
 図13は、図6のS430の処理の流れを示すフローチャートである。
 次に、健全ストレージ特定部104の動作について、図13を用いて、詳しく説明する。S1110にて、故障懸念ストレージにおける故障懸念度を、故障懸念度基準値とする。
 なお、S1010の処理については、図10のフローチャートの処理と同一であるため、詳しい説明を省略する。なお、故障懸念度の算出を実行する代わりに、S410の処理の内部で算出した値を記録しておき、S430において使用することもできる。
 S1120にて、故障懸念度が、故障懸念度基準値を超えないストレージを、健全ストレージとする。例として、故障懸念度基準値を0.5としたとき、故障懸念度が0.1のストレージは、S1120の条件に合致するため、健全ストレージとなり得る。
 なお、健全ストレージとなり得るストレージ(健全ストレージ候補)が、複数存在する場合、例えば、それら複数の健全ストレージ候補から、該当する、任意のストレージを、健全ストレージとして選択する。また、例えば、複数の健全ストレージを選択し、図6のS440の処理を、それぞれの健全ストレージに対して、順に行っても良い。
 なお、健全ストレージを選択する際に、故障懸念アレイが管理するストレージについては、選択の対象から除外しても良い。
 なお、より具体的には、例えば、以下の図14、図15を参照して説明される処理が行われてもよい。
 図14は、健全ストレージの特定を行う前に、交換対象アレイの特定を行う処理の流れを示すフローチャートである。
 つまり、図6において、健全ストレージの特定(S430)を行う前に、交換対象アレイの特定を行い、特定された交換対象アレイが管理するストレージの中から、健全ストレージを選択しても良い(図14のS1210、S430等を参照)。
 図15は、S1210の処理の流れを示すフローチャートである。
 次に、交換対象アレイ特定部103の動作について、図15を用いて、詳しく説明する。
 なお、S510、S520の処理については、それぞれ、図8、図9のフローチャートの処理と同一であるため、詳しい説明を省略する。
 なお、故障許容台数、故障懸念台数をアレイ毎に取得する代わりに、S410の処理の内部で取得した値を記録しておき、S1210において使用することもできる。
 S1310では、故障許容台数が、故障懸念台数を超えるアレイを、交換対象アレイとする。例として、故障許容台数が2台、故障懸念台数が1台のアレイは、S1310の条件に合致するため、交換対象アレイとなり得る。
 つまり、こうして、例えば、故障懸念台数6A(図22)が、閾値Tb(図25)以下で、閾値Tb以下の範囲Rb内の故障懸念台数6Ab1であるアレイが、交換対象アレイとして特定されてもよい。そして、閾値Tbは、上述のように、例えば、故障許容台数6D(図25、図22)の値から1(後述される、増加台数6Fを参照)が減じられた値でもよい。
 なお、後述される図20においては、図20の第2のアレイ62が、交換対象アレイとして特定される例が、示される。
 S1310にて、交換対象アレイとなり得るアレイ(交換対象アレイ候補)が、複数存在する場合、故障許容台数(例えば、図22の故障許容台数6D)から、故障懸念台数(例えば、故障懸念台数6Ab1)を減じた値(図22の交換可能残台数6Cを参照)が最大のアレイを、交換対象アレイとする。
 なお、交換対象アレイとなり得る複数のアレイの中から、任意のアレイを選択しても良い。また、故障許容台数から、故障懸念台数を減じた値が大きい順に、アレイを選択し、図14のS430~S440の処理を、それぞれのアレイに対して、順に行っても良い。
 また、さらに具体的には、例えば、S1310にて、交換対象となり得るアレイが複数存在する場合、各アレイにおいて、健全ストレージを交換するストレージ数を、以下で説明される、図16のフローチャートの処理により算出し、算出された交換数だけの健全ストレージを、S430にて特定し、S440の処理を繰り返して交換する処理を、それぞれのアレイに対して順に行っても良い。
 こうして、S410、S420、S430の処理(図6、図14)がされるのに際して、具体的には、例えば、交換対象アレイの特定がされてもよい(S1210)。
 そして、S430では、特定された交換対象アレイのストレージが、健全ストレージとして特定されてもよい。
 また、例えば、以下の図16を参照して説明される処理が行われてもよい。
 図16は、交換対象となり得る複数のアレイにおいて、各アレイの交換数を算出する処理のフローチャートである。
 まず、S1410では、故障懸念アレイにおける故障懸念台数から、故障許容台数を減じた値を、懸念解消必要台数とする。
 S1420では、全交換対象アレイ候補に対して、各アレイにおける交換数を0に初期化する。
 S1430では、全交換対象アレイ候補において、各アレイにおける交換可能残台数を、故障許容台数から故障懸念台数を減じた値で、初期化する。
 S1440にて、全交換対象アレイ候補の中で、交換可能残台数が最大のものを特定し、その時の、特定された、交換可能残台数の値を、最大交換可能残台数とする。
 S1450では、前記最大交換可能残台数が0超であるかを判断し、処理を分岐する。
 最大交換可能残台数が0超で無いと判断される場合(S1450のNO)、処理を抜け、S1490を実行する。
 一方、最大交換可能残台数が0超であると判断される場合(S1450のYES)、S1460にて、全交換対象アレイ候補の中で、交換可能残台数の値が最大であるアレイの中から、任意のアレイを選択する(S1460)。
 そして、S1470にて、前記選択アレイの交換数を、1増加させると共に、前記選択アレイの交換可能残台数を、1減少させる。S1480にて、全アレイにおける交換数の合算値が、懸念解消必要台数未満であるかを判断する。
 全アレイにおける交換数の合算値が、懸念解消必要台数未満で無いと判断される場合(S1480のNO)、処理を抜け、S1490を実行する。
 一方、全アレイにおける交換数の合算値が、懸念解消必要台数未満であると判断される場合(S1480のYES)、S1440~S1470の処理を、繰り返す。つまり、S1450において、最大交換可能残台数が0超でない状態と判断される状態となるか((S1450のNO)、または、S1480において、全アレイにおける交換数の合算値が、懸念解消必要台数未満でないと判断される状態となるまで(S1480のNO)、S1440~S1470の処理を、繰り返す。
 S1490では、上記の処理により算出した、交換数が1以上のアレイを、交換対象アレイとし、健全ストレージの交換を行うストレージ台数を、上記で算出した交換数とする。
 図21は、アレイA、Bが選択される処理における、初期値、交換数などを示す図である。
 例として、S1410において特定される懸念解消必要台数を2、交換対象アレイ候補を、アレイA、アレイB、アレイCの3台とする(図21の表の第1行)。そして、S1430における、交換可能残台数の初期値を、それぞれ、アレイAにおいて2、アレイBにおいて2、アレイCにおいて1とする(第2行)。こうした時、図16のフローチャートにより、交換対象アレイとして、アレイA、アレイBが選択される(第3行)。また、その時の交換数は、アレイA、アレイB共に、1台となる(第4行)。
 なお、さらに具体的には、例えば、ストレージとして、物理ストレージの代わりに、1台もしくは複数台の物理ストレージの、一部もしくは全ての領域により管理される仮想的ストレージである、論理ストレージを利用しても良い。
 なお、具体的には、例えば、ストレージとして、論理ストレージを利用する場合には、S810、S820における、ストレージの駆動時間情報、保証時間情報として、論理ストレージを管理する物理ストレージの駆動時間情報、保証時間情報を使用する。ただし、論理ストレージが、複数の物理ストレージにより管理されている場合、例えば、管理している全物理ストレージに対して、S710の故障懸念度の算出を行い、最も故障懸念度が高いストレージの値を、論理ストレージにおける故障懸念度として採用する。
 以上が、本発明の実施形態1のアレイ管理装置の動作についての説明である。
 次にその他の実施の形態について説明する。
 (実施形態2)
 本実施形態では、ストレージ交換判断部106による判断処理を行う場合について、説明を行う。
 図17は、本実施形態におけるアレイ管理部100の処理の流れを示すフローチャートである。
 S410、S420、S430、S440、S1210の処理は、実施形態1で説明した処理と同一であるため、詳しい説明を省略する。
 S1510では、ストレージ交換判断部106により、故障懸念アレイと、健全ストレージとの交換を行うかどうか判断する。
 S1520では、S1510の判断の結果を受けて、交換を行うと判断された場合には(S1520のYES)、S440の交換処理を行い、交換を行わないと判断された場合には(S1520のNO)、交換処理を行わないように分岐する。
 なお、上記処理を、定期的に実行しても良い。
 こうして、より具体的には、例えば、故障懸念アレイと、健全ストレージとの交換を行う否かの判断がされてもよい(S1520)。そして、行うと判断された場合にのみ、交換が行われ(S1520のYES、S440)、行わないと判断された場合には、行われなくてもよい(S1520のNO)。
 図18は、図17のS1510の処理の流れを示すフローチャートである。
 次に、ストレージ交換判断部106の動作について、図18を用いて、詳しく説明する。
 S1610にて、故障懸念アレイにおいての、故障懸念台数から、故障許容台数を減じた値を、懸念解消必要台数とする。
 S1620にて、交換対象アレイにおいての、故障許容台数から、故障懸念台数を減じた値を、最大交換可能台数とする。
 S1630にて、懸念解消必要台数(S1610)が、最大交換可能台数(S1620)を超えるかの判断を行う。
 S1640では、S1630の判断の結果を受けて、懸念解消必要台数が、最大交換可能台数を超えると判断される場合には(S1640のYES)、交換を行わないと判断し(S1660)、超えない場合には(S1640のNO)、交換を行うと判断する(S1650)。
 例として、故障懸念アレイにおいて、故障懸念台数が4、故障許容台数が2の場合、懸念解消必要台数は2となる。また、交換対象アレイにおいて、故障許容台数が2、故障懸念台数が1の場合、最大交換可能台数は、1となる。従って、懸念解消必要台数が、最大交換可能台数を超えるため、交換を行わないと判断する(S1640のYES、S1660)。
 なお、具体的には、S1210において、交換対象アレイとなり得るアレイ(交換対象アレイ候補)が、複数存在してもよい。
 そして、このように、S1210で、交換対象アレイ候補が複数存在する場合において、全ての交換対象アレイ候補に対して、S1620の、最大交換可能台数の算出を行い、全ての交換対象アレイ候補における最大交換可能台数の合算値を、S1630における最大交換可能台数としても良い。
 例として、交換対象アレイとなり得るアレイ(交換対象アレイ候補)が2つ存在し、それぞれの交換対象アレイ候補の最大交換可能台数が1であるとする。このとき、それらの、交換対象アレイ候補の最大交換可能台数の合算値が、1+1=2となる。そして、懸念解消必要台数が、2である場合を想定する。この場合、懸念解消必要台数(2)が、交換対象アレイ候補の最大交換可能台数の合算値(2)を超えないため、交換を行うと判断する(S1640のNO、S1650)。
 なお、交換をするか否かの判断(図17のS1510、S440)の処理の形態は、具体的には、上述の形態でもよいし、他の形態でもよい。例えば、具体的には、この判断においては、ユーザによる、アレイ管理部100への設定などの、予め定められた設定(コンフィギュレーション)がされた場合には、交換をする判断がされ(S1520のYES)、設定されない場合には、交換をしないとの判断がされてもよい(S1520のNO)。
 (実施形態3)
 本実施形態では、スペアストレージを用いる場合について説明を行う。
 本実施形態におけるアレイ管理部100の処理の流れは、図6と同一となる。
 S410、S420、S440の処理は実施形態1と同一であるため、詳しい説明を省略する。
 S430では、健全ストレージ特定部104により、健全ストレージの特定を行う。
 なお、S430において、全てのスペアストレージを、健全ストレージとして扱うこともできる。また、スペアストレージを、アレイにより管理されているストレージよりも優先的に健全ストレージとして選択しても良い。
 (実施形態4)
 本実施形態4では、ストレージ故障の発生を検出した場合について、説明を行う。
 図26は、ストレージ故障の発生を考慮した場合の処理の流れを示したフローチャートである。
 図26における、S1710以外での処理は、図6における、そのステップに対応するステップでの処理と同一となる。図26における、S420、S430、S440のそれぞれのステップでの処理については、実施形態1の図6のS420等の処理と同一であるため、詳しい説明を省略する。
 図27は、図26のS1710における、故障懸念アレイを特定する処理の詳細を示すフローチャートである。
 次に、図26のS1710における、故障懸念アレイを特定する処理のフローを、図27を用いて、より詳細に説明する。
 まず、S510で、故障許容台数を、アレイ毎に取得する。なお、S510の処理の詳細は、実施形態1における、図7のS510での処理と同一であるため、詳しい説明を省略する。
 次に、S1820で、故障ストレージ台数と、故障懸念台数とのそれぞれを、アレイ毎に取得する。
 次に、S1830で、S1820で取得された故障ストレージ台数と、故障懸念台数との合計が、故障許容台数を超えるアレイを、故障懸念アレイとする。
 図28は、図27のS1820の処理の詳細を示すフローチャートである。
 次に、図28を用いて、図27のS1820について、より詳細に説明する。
 まず、S1910で、アレイが管理する全ストレージに対して、故障しているストレージを検出する。つまり、全ストレージのうちから、故障しているストレージが検出され、特定される。
 なお、故障ストレージの検出方法は、例えば、ストレージアクセス要求への応答の有無や、エラー応答に基づく方法、ECCパリティの不整合に基づく方法、ファイルシステムのマウント失敗に基づく方法など、一般的な手法での方法等でもよい。
 このS1910以降の、S710、S720、S730での処理は、実施形態1で説明した、図9のS710等での処理と同一であるため、詳しい説明を省略する。
 本実施形態4では、例えば、故障許容台数が2台である、RAID6などのアレイにおいて、1台のストレージ故障が発生し、さらに、別の1台のストレージの故障が懸念される場合において、次の通りである。
 つまり、この場合において、故障が懸念されるストレージと、故障が懸念されないアレイのうちの1台のストレージとを交換する。
 このことにより、ストレージ故障が発生したアレイの中で、更にもう1台のストレージ故障が発生する可能性を低減することが出来、その結果、データ消失の可能性を低減することが出来る、という効果を有する。
 また、図28において、S710の処理は、S1910で、ストレージ故障を検出した場合にのみ、実行するとしても良い。
 これにより、不必要な故障懸念ストレージ確認処理を省略することで、電力消費低減や、ストレージ長寿命化を実現できるという効果を有する。
 (その他)
 なお、本実施例のアレイ管理装置は、典型的には、半導体集積回路であるLSIとして実現される。これらは、個別に1チップ化されてもよいし、一部または全てを含むように、1チップ化されても良い。ここでは、LSIとしたが、集積度の違いにより、IC、システムLSI、スーパーLSI、ウルトラLSIと呼称されることもある。
 また、集積回路化の手法は、LSIに限るものではなく、専用回路または汎用プロセッサで実現しても良い。LSI製造後に、プログラムすることが可能なFPGA(Field Programmable Gate Array)や、LSI内部の回路セルの接続や設定を再構成可能なリコンフィギュラブル・プロセッサを利用しても良い。
 さらには、半導体技術の進歩、または、派生する別技術により、LSIに置き換わる集積回路化の技術が登場すれば、当然、その技術を用いて、機能ブロックの集積化を行っても良い。バイオ技術の適応などが可能性として有り得る。
 さらに、加えて、本実施形態のアレイ管理装置を集積化した半導体チップと、画像を描画するためのディスプレイとを組み合わせて、様々な用途に応じた描画機器を構成することができる。携帯電話やテレビ、デジタルビデオレコーダー、デジタルビデオカメラ、カーナビゲーション等における情報描画手段として、本発明を利用することが可能である。ディスプレイとしては、ブラウン管(CRT)の他、液晶やPDP(プラズマディスプレイパネル)、有機ELなどのフラットディスプレイ、プロジェクターを代表とする投射型ディスプレイなどと組み合わせることが可能である。
 要約すれば、こうして、ストレージアレイ内の個々のストレージ毎に、駆動時間等から、故障発生の可能性を推測し、故障発生の可能性が閾値を超えるストレージ数(故障懸念台数)を算出する。そして、故障懸念台数と、RAIDレベルや、アレイが管理するストレージ数等により決定される故障許容台数とから、データ損失発生の懸念が高いアレイ(故障懸念アレイ)を特定する。そして、故障懸念アレイに含まれる、故障発生の可能性が高いストレージのみが、故障発生の可能性が、より低いストレージと交換される。このことにより、無駄に別のストレージを使用することなく、故障懸念アレイにおける、データ損失の懸念を低下させることができる。
 図24により、システム1が示される。
 なお、図1に示されるシステム1は、具体的には、例えば、図24に示されるように、第1の住居に設けられた第1の部分1Haと、第2の住居に設けられた第2の部分1Hbとを含んでもよい。なお、より具体的には、例えば、3つ以上の住居への分散がされてもよい。つまり、例えば、第3~第Tの住居があってもよい(3≦T)。そして、システム1は、第3~第Tの住居に設けられた、第3~第Tの部分を含んでもよい。そして、第3~第Tの部分のそれぞれは、後述される複数のストレージ4のうちの1つ以上が設けられてもよい。なお、システム1は、さらに、その他の部分を含んでもよい。
 ここで、例えば、第1の住居は、家電製品等の機器(デジタルレコーダー10、デジタルレコーダー10b等)の操作に慣れた子供夫婦の住居で、第2の住居は、操作に慣れていない親夫婦の住居でもよい。
 つまり、システム1は、例えば、エンタプライズ機器を含まない、民生用のシステムでもよい。例えば、デジタルレコーダー10、複数のストレージ4のうちの一部または全部は、家電である。
 つまり、具体的には、システム1は、業務システムなどの、エンタプライズ系においては存在する、専門の管理者に相当する人間が存在しないシステムなどである。
 そして、このようなシステム1において、次の動作がされてもよい。
 つまり、システム1において、複数のストレージ4(図1のストレージ11~18参照)が設けられてもよい。
 そして、設けられる複数のストレージ4のうちの一部は、第1の部分1Haに設けられ、他の一部は、第2の部分1Hbに設けられてもよい。
 そして、それぞれのストレージ4の動作を制御するアレイ管理部100(図2を参照)が設けられてもよい。
 なお、システム1に含まれる1つまたは複数のストレージ4は、いわゆるオンラインストレージ(図略)でもよい。
 アレイ管理部100は、例えば、第1の部分1Haに設けられた、第1の住居にあるテレビに接続されたデジタルレコーダー10における機能ブロックでもよい。
 なお、システム1は、複数のアレイ管理部7を有してもよい。ここで、例えば、それぞれのアレイ管理部7は、デジタルレコーダー10のアレイ管理部100の機能と同様の機能を有してもよい。
 なお、例えば、これら複数のアレイ管理部7のうちの1つを、第2の部分1Hbに設けられたデジタルレコーダー10b(図24)が有してもよい。また、複数のアレイ管理部7のうちの1つは、第2の部分1Hbに設けられた1つのストレージ4(ストレージ4c)に設けられてもよい。複数のアレイ管理部7のうちの1つは、アレイの管理のための専用の装置(図略)に設けられてもよい。
 そして、アレイ管理部100は、例えば、これらの複数のアレイ管理部7のうちから、制御を実行するアレイ管理部7として選択された場合に、それぞれのストレージ4の動作を制御してもよい。なお、この選択の処理は、例えば、複数のアレイ管理部7の間の通信を通じて行われてもよい。
 なお、デジタルレコーダー10に設けられたアレイ管理部100は、例えば、インターネットINTを介して、第2の部分1Hbに設けられた、それぞれのストレージ4の動作を制御してもよい。
 図22により、アレイ6(図2等参照)が示される。
 そして、システム1に含まれる複数のストレージ4のうちの、2以上のストレージ4A(図22)により、このようなアレイ6が構成されてもよい。
 ここで、図22の台数6Eにより、アレイ6を構成する2以上のストレージ4Aに含まれる、ストレージ4の台数(図22では、4台)が示される。
 そして、故障許容台数6D(例えば2台)により、当該故障許容台数6Dよりも多い台数のストレージ4で、故障が発生した場合に、アレイ6において、データ損失が発生する台数が示される。すなわち、当該故障許容台数6D以下の台数のストレージ4で、故障が発生した場合には、データ損失が発生しない。
 なお、故障が発生したストレージ4の台数は、例えば0台である。
 そして、ストレージ4が、故障が発生し易く、(大きな)劣化を有するストレージ4aであるか、故障が発生し難く、(大きな)劣化を有さないストレージ4bであるかが判定されてもよい。
 図23により、管理テーブル(データ100T)が示される。
 上述の判定は、例えば、図23のストレージ判定部100fにより行われてもよい。
 ここで、図23に示されるデータ100fd(管理テーブル100T)は、判定がされるストレージ4の保証期間100f1と、使用開始年月日100f2とを含む。
 ここで、保証期間100f1は、例えば、故障が生じない期間として、ストレージ4のメーカにより公表された参考値の期間を示すデータ等である。そして、使用開始年月日100f2は、ストレージ4の使用が開始された年月日を示すデータ等である。
 なお、使用開始年月日100f2は、ストレージ4の使用開始年月日を示すことにより、現在の年月日から、示される使用開始年月日までの時間を、ストレージ4の駆動時間として示すデータである。先述された駆動時間情報は、例えば、この使用開始年月日100f2でもよい。
 なお、駆動時間情報(使用開始年月日100f2)は、ストレージ4に記憶され、記憶された駆動時間情報がアレイ管理部100に取得されて、利用されてもよい。
 そして、このようなデータ100fdから、故障懸念度100fxが算出されてもよい(ストレージ判定部100f)。
 ここで、算出される故障懸念度100fxは、予め定められた閾値(例えば、定数、先述の故障懸念度基準値など)よりも大きい値である場合には、ストレージ4が、(大きな)劣化を有するストレージ4aと判定されたことを示す。そして、算出される故障懸念度100fxは、逆に、当該閾値以下の値(例えば、当該閾値より小さい値)である場合には、有さないストレージ4bであることを示す。
 この故障懸念度100fxが算出されることにより、ストレージ4aであるか、ストレージ4bであるかの判定がされてもよい。
 なお、この算出の方法は、具体的には、先述の図11等での方法でもよい。つまり、例えば、算出される故障懸念度100fxは、駆動時間(「現在の年月日」-「使用開始年月日100f2」など)が、保証時間(保証期間100f1)を超えるか否かに対応した値などでもよい(図23の「現在年月-使用開始年月>保証期間?」の記載を参照)。
 なお、図23により示されるように、それぞれのストレージ4に対応付けて、そのストレージ4のデータ100fdが記憶されてもよい。そして、判定に際して、判定がされるストレージ4に対応付けられたデータ100fdが利用されてもよい。
 そして、アレイ6に含まれる複数のストレージ4A(図22)のうちで、ストレージ4aと判定されたストレージ4Aの個数を示す劣化台数(故障懸念台数)6A(図22、例えば1台等)が算出されてもよい。
 なお、この算出は、例えば、図22に示されるアレイ処理部100aにより行われてもよい。先述された、故障懸念アレイ特定部101および交換対象アレイ特定部103は、具体的には、例えば、このアレイ処理部100aに含まれ、アレイ処理部100aの一部などでもよい。
 図25により、故障許容台数6D(例えば2台)と、第1のアレイ61(後述の図20)の2つの故障懸念台数6Aa1、6Aa2(1台、3台)と、第2のアレイ62(図20)の2つの故障懸念台数6Ab1、6Ab2(1台、2台)とが示される。
 そして、先述された、算出された、アレイ6の劣化台数(故障懸念台数)6Aが、閾値T(図25の閾値Taまたは閾値Tb)以下の劣化台数(故障懸念台数6Aa1、6Ab1)であるか、閾値Tよりも大きい劣化台数(故障懸念台数6Aa2、6Ab2)であるかが検知されてもよい(図22のアレイ処理部100a)。
 つまり、アレイ6が、劣化台数6Aが閾値T以下で、小さく、データの損失が発生し難いアレイか、閾値Tより大きく、データの損失が発生し易いアレイかが検知されてもよい。
 図20により、システム1が示される。
 なお、図20の上段のシステム1(システム1M)は、ストレージの交換がされる前におけるシステム1を示し、下段のシステム1(システム1N)は、交換がされた後のシステム1を示す。
 システム1においては、複数のアレイ6(例えば、図20の第1のアレイ61、第2のアレイ62など)が構成されてもよい。
 なお、ここで、図20上段の第1のアレイ61M、第2のアレイ62Mは、ストレージの交換がされる前の第1のアレイ61、第2のアレイ62を示し、下段の第1のアレイ61N、第2のアレイ62Nは、交換がされた後の第1のアレイ61、第2のアレイ62を示す。
 ここで、例えば、設けられた複数のアレイ6(第1のアレイ61、第2のアレイ62等)の故障許容台数6D(図22)は、互いに同じでもよい。例えば、図25に示される故障許容台数6Dは、このような、互いに同じである台数を示す。
 そして、複数のアレイ6(第1のアレイ61、第2のアレイ62)のうちから、閾値T(閾値Ta)よりも大きい劣化台数(故障懸念台数6Aa2、3台)を有することが検知される第1のアレイ61(第1のアレイ61M)が特定されてもよい(アレイ処理部100a)。
 また、これらの複数のアレイ6のうちから、閾値T(閾値Tb)以下の小さい劣化台数6A(故障懸念台数6Ab1、1台)を有することが検知される第2のアレイ62(第2のアレイ62M)も特定されてもよい(アレイ処理部100a)。
 ここで、閾値Taは、図25に示されるように、例えば、検知が行われるアレイ(第1のアレイ61)の故障許容台数6D(2台)の値と同じ値(2台)である。
 つまり、特定される第1のアレイ61(第1のアレイ61M)は、第1のアレイ61の故障許容台数6Dと同じ台数の閾値Ta(2台)よりも大きい劣化台数(故障懸念台数6Aa2、3台)を有する。
 なお、換言すれば、特定される第1のアレイ61の故障懸念台数6Aa2は、図25に示される、閾値Taより大きい範囲Ra内の台数である。
 なお、図20においては、この故障懸念台数6Aa2(3台)が、第1のアレイ61Mに付された、3個の「劣化」の文字により模式的に示される。
 一方、図25に示されるように、閾値Tbは、例えば、検知が行われるアレイ(第2のアレイ62)の故障許容台数6D(図25、2台)から、1が減じられた値でもよい。
 つまり、検知される第2のアレイ62の劣化台数6Bは、このような、1が減じられた閾値Tb(1台)以下の劣化台数(故障懸念台数6Ab1、1台)でもよい。
 つまり、特定される第2のアレイ62の故障懸念台数6Ab1は、図25に示される、閾値Tb以下である範囲Rb内の台数である。
 なお、図20では、この故障懸念台数6Ab1(1台)が、第2のアレイ62Mに付された、1個の「劣化」の文字により、模式的に示される。
 なお、先述された故障懸念アレイは、例えば、特定される、この第1のアレイ61でもよい。そして、先述された交換対象アレイは、この第2のアレイ62でもよい。
 そして、特定された第1のアレイ61に含まれる、劣化を有するストレージ4aXa(図20)と、特定された第2のアレイ62に含まれる、劣化を有さないストレージ4bXa(図20)とが交換されてもよい(交換部105)。
 なお、行われる交換は、例えば、いわゆる論理的な交換である。行われる交換は、例えば、スワップと呼ばれてもよい。
 なお、交換がされる、第1のアレイ61のストレージ4aXaは、例えば、第1のアレイ61の2以上の、劣化を有するストレージ4a(図20、22)の中から、故障懸念ストレージ特定部102により特定されるストレージ4aでもよい。
 同様に、例えば、交換がされる、第2のアレイ62のストレージ4bXa(図20)は、第2のアレイ62が有する、2以上の、劣化を有さないストレージ4b(図20、22)の中から、健全ストレージ特定部104により特定されるストレージ4bでもよい。
 そして、さらに具体的には、例えば、ストレージの交換がされるのに際して、第1のアレイ61のストレージ4aXaのデータが、予め定められた記憶部(図略)に移動されてもよい。この移動の後に、第2のアレイ62(第2のアレイ62M)のストレージ4bXaのデータが、第1のアレイ61のストレージ4aXaに移動されてもよい。そして、この後に、上記の記憶部に移動された後における、第1のアレイ61のストレージ4aXaのデータが、第2のアレイ62のストレージ4bXaに移動されてもよい。
 つまり、こうして、ストレージ4aXaのデータと、ストレージ4bXaのデータとが交換されて、データの交換が行われてもよい(図23の実データ交換制御部105a)。
 そして、図23のデータ100Tにより、それぞれのストレージ4が、何れのアレイ6に含まれるかが特定されてもよい。つまり、例えば、それぞれのストレージ4(図23の表の各列)に対応付けて、そのストレージ4が含まれるアレイ6(の番号等)が記憶されてもよい。
 そして、ストレージの交換の前においては、記憶されるデータ100T(図23)により、次のことが示されてもよい。そのこととは、ストレージ4aXa(例えば3番のストレージ)が、第1のアレイ61に含まれ、ストレージ4bXa(例えば5番のストレージ)が、第2のアレイ62に含まれることである(図23の、データ100Tの表の第1~第3行等)。
 そして、データ100Tは、ストレージの交換に際して更新(変更)されて、更新の後においては、ストレージ4aXaが第2のアレイ62に含まれ、ストレージ4bXaが、第1のアレイ61に含まれることを示してもよい(テーブル更新部105b)。
 なお、データ100Tは、例えば、管理テーブル記憶部100S(図23)により記憶されてもよい。なお、管理テーブル記憶部100Sは、具体的には、例えば、アレイ管理部100の一部でもよい。つまり、例えば、管理テーブル記憶部100Sは、交換部105の一部でもよいし、下位側転送制御部304の一部でもよい。また、管理テーブル記憶部100Sは、その他の形態を有してもよい。
 そして、それぞれのストレージ4(ストレージ4aXa、4bXa)は、更新の前においては、次の制御がされてもよい。つまり、更新の前において、そのストレージ4が含まれることが示されるアレイ6(第1のアレイ61、第2のアレイ62)のストレージ4としての動作をさせる制御がされてもよい。
 そして、それぞれのストレージ4(ストレージ4aXa、4bXa)は、更新の後においては、次の制御がされてもよい。つまり、更新の後において、含まれることが示されるアレイ6(第2のアレイ62、第1のアレイ61)のストレージ4としての動作をさせる制御がされてもよい。
 これらの制御は、例えば、下位側転送制御部304(図23、図3、図7)により行われてもよい。
 なお、例えば、デジタルレコーダー10で実行されるアプリケーションが書き込み、読み出しをするデータの通信が、上位側転送制御部305(図3)を介して行われてもよい。そして、下位側転送制御部304が、通信がされるデータの書き込み、読み出しを、適切なアレイ6に対して実行してもよい。
 これにより、システム1において、劣化を有するストレージ4aXaがあっても、劣化を有するストレージ4aXaが含まれるアレイ6(第1のアレイ61を参照)の劣化台数6A(故障懸念台数)が、閾値T(閾値Ta)以下の劣化台数(故障懸念台数6Aa1)である場合には、劣化を有さないストレージ4bXaとの間での交換が、行われない。
 これにより、交換の回数が少なくできる。
 なお、これにより、ひいては、交換に伴う、ストレージ4aXaなどの各装置の駆動が回避されて、各装置の寿命が長くされ、コストが小さくできる。
 これにより、システム1が、民生用のシステムで、ユーザの負担が可能であるコストが、エンタプライズ機器などで、負担が可能であるコストよりも小さいにも関わらず、発生するコストが、そのような、民生用での、より小さいコストにできる。
 他方で、アレイ6(第1のアレイ61)の劣化台数6A(故障懸念台数)が、閾値T(閾値Ta)よりも大きい劣化台数(故障懸念台数6Aa2)である場合には、交換が行われる。
 これにより、第1のアレイ61で、データの損失が発生してしまうことが回避できる。
 これにより、適切な、十分に小さいコストと、データの損失の発生の回避とが両立できる。
 そして、このように、より具体的には、例えば、交換が行われる、劣化を有さないストレージ4bXaは、第2のアレイ62に含まれてもよい。
 つまり、このストレージ4bXaは、交換の前までも、データを記憶し、利用されるストレージ4でもよい。すなわち、このストレージ4bXaは、スペアストレージ(背景技術の説明を参照)ではない。ここで、スペアストレージは、例えば、そのスペアストレージが交換に利用される前には、データの記憶をしないストレージである。
 このため、交換がされるにも関わらず、スペアストレージが不要にできたり、設けられるスペアストレージ5(図2)の個数が少なくできる。
 これにより、ひいては、例えば、スペアストレージの購入、駆動、および保守などに要する費用が不要になるなどして、必要なコストが、より確実に、適切な、十分に小さいコストにできる。
 そして、一方で、交換がされるストレージ4bXaは、小さい劣化台数(故障懸念台数6Ab1)を有する第2のアレイ62に含まれるストレージ4である。
 このため、交換の後における第2のアレイ62Nでの、劣化を有するストレージ4aの個数が小さくできて、交換の後に、第2のアレイ62Nで、データの損失が発生することが回避できる(少なくできる)。なお、図20においては、第2のアレイ62Nでの、劣化を有するストレージ4aが十分に少ないことが、第2のアレイ62Nに付された丸印により模式的に示される。
 これにより、スペアストレージでないストレージ(第2のアレイ62のストレージ)との交換がされるにも関わらず、第1のアレイ61以外(第2のアレイ62)で、データ損失が発生してしまうことが回避されて、データ損失の発生が、確実に回避できる。
 なお、システム1には、1個以上のスペアストレージ5(図2)が設けられてもよい。
 つまり、システムに含まれる複数のストレージ4は、1個以上のスペアストレージ5(図2)を含んでもよい。
 ここで、それぞれのスペアストレージ5は、例えば、そのスペアストレージ5が交換される前においては、データの記憶をせず、利用されないストレージ4などである。
 そして、ある局面においては、特定された第1のアレイ61のストレージ4aXaと交換がされるストレージ4として、スペアストレージ5が特定されてもよい(健全ストレージ特定部104)。
 そして、特定されたスペアストレージ5が、第1のアレイ61のストレージ4aXaと交換されてもよい(交換部105)。
 なお、具体的には、例えば、スペアストレージ5の個数が、交換の度に、1個ずつ少なくなってもよい。そして、個数が、0個になるよりも前には、スペアストレージ5が特定され、0個になって以後には、アレイ6に含まれるストレージ4(ストレージ4bXa)が特定されてもよい。
 なお、交換がされるストレージ4として、スペアストレージ5が特定された場合には、上述された、劣化を有するストレージ4aXaへの、交換がされるストレージ4(スペアストレージ5)からの、データの移動などの処理は、されなくてもよい。
 なお、図20により、第3のアレイ63が示される。
 なお、システム1に含まれるアレイ6の個数は、2個でもよいし、3個でもよいし、他の個数でもよい。
 そして、劣化台数(故障許容台数)6Aが、閾値Tb(図25)より小さい複数のアレイ6(第2のアレイ62と、第3のアレイ63)が、アレイ処理部100aにより特定されてもよい。
 そして、第1のアレイ61における、劣化を有する一方のストレージ4aXa(図20)が、特定された第2のアレイ62の、劣化を有さないストレージ4bXaと交換されてもよい。
 そして、第1のアレイ61における、劣化を有する他方のストレージ4aXbが、特定された第3のアレイ63の、劣化を有さないストレージ4bXbと交換されてもよい。
 こうして、複数の、劣化を有するストレージ4aXが、複数の、劣化を有さないストレージ4bXと交換されてもよい。
 そして、それらの、複数の、劣化を有さないストレージ4bXは、図20に示されるように、例えば、互いに異なる複数のアレイ6(第2のアレイ62と、第3のアレイ63)に含まれてもよい。
 なお、それらの、複数の、劣化を有さないストレージ4bXは、互いに同一のアレイ6(例えば、第2のアレイ62)に含まれてもよい(図略)。
 そして、例えば、特定された複数の交換対象アレイ(第2のアレイ62、第3のアレイ63等)における余裕台数6C(図22)の和に応じた処理がされてもよい。
 そして、故障懸念アレイ(第1のアレイ61)における、劣化を有するストレージ4aの個数から、故障許容台数6Dが減じられた台数(懸念解消必要台数)に応じた処理がされてもよい。
 つまり、上記の、余裕台数6Cの和が、懸念解消必要台数よりも多い場合にのみ、交換が行われ、多くない場合には、1つのストレージ4の交換もされなくてもよい。
 また、例えば、余裕台数6Cの和が、懸念解消必要台数よりも多くない場合でも、余裕台数6Cの和の台数のストレージ4については、交換がされてもよい(図16を参照)。
 なお、図19により、データ100Tのデータ構成の一例が示される。
 データ100Tの具体的なデータ構成は、種々の構成であってよい。
 例えば、図19に示されるように、データ100Tでは、アレイ6毎に、そのアレイ6に含まれる、それぞれのストレージ4(の番号等)を記憶してもよい。
 また、データ100fd(図23)は、データ100Tに含まれなくてもよい。
 なお、このように、閾値T(閾値Ta、閾値Tb)は、アレイ6の故障許容台数6Dから決まる台数である。つまり、閾値Tは、故障許容台数6Dと同じ台数(閾値Ta)、または、1が減じられた台数(閾値Tb)などである。
 この閾値Tにより、範囲R(図25における、閾値Taより大きい範囲Ra、閾値Tb以下の範囲Rb)が特定される。
 そして、それぞれのアレイ6(第1のアレイ61、第2のアレイ62)について、そのアレイ6の劣化台数6A(故障懸念台数)が、範囲R(例えば範囲Ra)内か否かの判定がされる。そして、範囲R内と判定される場合にのみ、ストレージの交換(ストレージ4aXa、4bXaの間の交換)がされ、範囲R外と判定される場合には、交換がされない。
 こうして、システム1においては、アレイ毎に判定がされ、アレイ毎の判定に基づいて、交換するか否かが変更される。このような処理をしない技術に基づいて、システム1に想到することは困難である。
 こうして、複数の構成が組み合わせられて、組み合わせからの相乗効果が生じる。これに対して、知られる従来例では、これらの複数の構成のうちの一部または全部を欠き、相乗効果は生じない。この点で、本技術は、従来例とは相違する。
 なお、上記のシステムにおける、単なる細部については、例えば、単なる、公知の技術が適用されただけの形態にされてもよいし、更なる改良発明が施された形態などにされてもよいし、如何なる形態にされてもよい。
 以上、実施形態および変形例を説明したが、本発明は、これらの実施の形態および変形例に限定されるものではない。本発明の主旨を逸脱しない範囲で、これらの実施の形態および変形例に対して当業者が思いつく各種変形を施して得られる形態や、これらの実施の形態および変形例における構成要素を任意に組み合わせて実現される形態も、本発明に含まれる。
 本発明のアレイ管理装置は、様々な用途に利用可能である。
 具体的には、例えば、携帯電話や携帯音楽プレーヤー、デジタルカメラ、デジタルビデオカメラ等の電池駆動の携帯表示端末や、テレビ、デジタルビデオレコーダー、カーナビゲーション等の高解像度の情報表示機器において利用される。そして、これらの情報表示端末等における、メニュー表示や、Webブラウザ、エディタ、EPG、地図表示、テレビ放送の表示等における情報表示手段として、利用価値が高い。つまり、例えば、本アレイ管理装置は、表示される情報を、複数のアレイにより記憶する情報表示機器等でもよい。
 5 スペアストレージ
 10 デジタルレコーダー
 11~18 ストレージ
 20~28 ネットワーク
 61~62 ストレージアレイ
 100 アレイ管理部
 101 故障懸念アレイ特定部
 102 故障懸念ストレージ特定部
 103 交換対象アレイ特定部
 104 健全ストレージ特定部
 105 交換部
 106 ストレージ交換判断部
 301 ROM
 302 CPU
 303 RAM
 304 下位側転送制御部
 305 上位側転送制御部

Claims (11)

  1.  複数のストレージを所定のRAID構成で管理するアレイを、複数管理するアレイ管理装置であって、
     前記各アレイのRAID構成から、前記各アレイが許容する、ストレージの故障台数を示す故障許容台数を前記アレイ毎に算出し、
     故障する可能性がある故障懸念ストレージの台数を示す故障懸念台数を前記アレイ毎に算出し、
     前記複数のアレイの中から、前記故障懸念台数が、前記故障許容台数を超える故障懸念アレイを特定する故障懸念アレイ特定部と、
     特定された前記故障懸念アレイが管理する前記複数のストレージの中から、前記故障懸念ストレージを特定する故障懸念ストレージ特定部と、
     特定された前記故障懸念ストレージと交換するためのストレージであって、特定された前記故障懸念ストレージよりも、故障する可能性が低いストレージである健全ストレージを特定する健全ストレージ特定部と、
     特定された前記故障懸念ストレージと、特定された前記健全ストレージとを交換する交換部とを備えるアレイ管理装置。
  2.  前記健全ストレージ特定部は、前記健全ストレージとして、前記故障懸念アレイが管理するストレージではないストレージを特定する請求項1記載のアレイ管理装置。
  3.  特定される前記健全ストレージは、複数の前記アレイに含まれる交換対象アレイに含まれ、
     当該交換対象アレイは、前記故障懸念アレイとは異なるアレイであり、
     前記交換対象アレイは、前記故障懸念ストレージと、前記健全ストレージとが交換された後における、前記交換対象アレイの前記故障懸念台数が、前記交換対象アレイの前記故障許容台数を超えないアレイである請求項1又は2に記載のアレイ管理装置。
  4.  前記アレイ管理装置は、さらに、ストレージ交換判断部を備え、
     前記ストレージ交換判断部は、特定された前記故障懸念ストレージと、交換対象アレイに含まれる、特定された前記健全ストレージとが交換された後における、当該交換対象アレイの前記故障懸念台数が、当該交換対象アレイの前記故障許容台数を超えるか否かを判断し、
     前記交換部は、超えるとの判断がされた場合には、特定された前記故障懸念ストレージと、特定された前記健全ストレージとの間の交換をしない請求項1又は2に記載のアレイ管理装置。
  5.  前記故障懸念アレイ特定部は、前記各ストレージの保証期間を示す保証期間情報および駆動時間を示す駆動時間情報を用いて、前記各ストレージが故障する可能性を示す故障懸念度を、前記ストレージ毎に算出し、
     前記故障懸念アレイ特定部は、前記各ストレージの前記故障懸念度を用いて、故障する可能性がある前記故障懸念ストレージの台数を示す前記故障懸念台数を、前記アレイ毎に算出し、
     前記故障懸念ストレージ特定部は、前記故障懸念度を用いて、特定された前記故障懸念アレイが管理する前記複数のストレージの中から、前記故障懸念ストレージを特定し、
     前記健全ストレージ特定部は、前記故障懸念度を用いて、特定された前記交換対象アレイが管理する前記複数のストレージの中から、前記健全ストレージを特定する請求項1~4の何れか1項に記載のアレイ管理装置。
  6.  交換対象アレイ特定部を備え、
     第1の前記アレイを構成する前記複数のストレージと、第2の前記アレイを構成する前記複数のストレージとを含む複数の前記ストレージのうちの一部は、第1の住居に設けられ、
     他の一部は、第2の住居に設けられ、
     前記故障懸念アレイ特定部は、複数の前記アレイから、当該アレイにおいては、前記故障懸念台数が、前記故障許容台数から決まる予め定められた第1の閾値よりも大きい第1のアレイを特定し、
     前記交換対象アレイ特定部は、複数の前記アレイから、当該アレイにおいては、前記故障懸念台数が、前記故障許容台数から決まる予め定められた第2の閾値以下である第2のアレイを特定し、
     前記交換部は、特定された第1の前記アレイに含まれる、故障する可能性がある前記故障懸念ストレージを、特定された第2の前記アレイに含まれる、当該故障懸念ストレージでの前記可能性よりも低い、故障する可能性を有する前記健全ストレージと交換する請求項1記載のアレイ管理装置。
  7.  前記交換対象アレイ特定部は、複数の第2の前記アレイを特定し、
     それぞれの第2の前記アレイでの前記故障懸念台数は、前記第2の閾値以下であり、
     前記交換部は、第1の前記アレイに含まれる、複数の前記故障懸念ストレージを、特定された複数の第2の前記アレイの前記健全ストレージと交換する請求項6記載のアレイ管理装置。
  8.  当該アレイ管理装置は、前記第1の住居に設けられたデジタルレコーダーと、前記第2の住居に設けられたデジタルレコーダーと、1つの前記ストレージとの中の1つである請求項7記載のアレイ管理装置。
  9.  複数のストレージを所定のRAID構成で管理するアレイを、複数管理するアレイ管理方法であって、
     前記各アレイのRAID構成から、前記各アレイが許容する、ストレージの故障台数を示す故障許容台数を前記アレイ毎に算出し、
     故障する可能性がある故障懸念ストレージの台数を示す故障懸念台数を前記アレイ毎に算出し、
     前記複数のアレイの中から、前記故障懸念台数が、前記故障許容台数を超える故障懸念アレイを特定する故障懸念アレイ特定ステップと、
     特定された前記故障懸念アレイが管理する前記複数のストレージの中から、前記故障懸念ストレージを特定する故障懸念ストレージ特定ステップと、
     特定された前記故障懸念ストレージと交換するためのストレージであって、特定された前記故障懸念ストレージよりも、故障する可能性が低いストレージである健全ストレージを特定する健全ストレージ特定ステップと、
     特定された前記故障懸念ストレージと、特定された前記健全ストレージとを交換する交換ステップとを含むアレイ管理方法。
  10.  複数のストレージを所定のRAID構成で管理するアレイを、複数管理する集積回路であって、
     前記各アレイのRAID構成から、前記各アレイが許容する、ストレージの故障台数を示す故障許容台数を前記アレイ毎に算出し、
     故障する可能性がある故障懸念ストレージの台数を示す故障懸念台数を前記アレイ毎に算出し、
     前記複数のアレイの中から、前記故障懸念台数が、前記故障許容台数を超える故障懸念アレイを特定する故障懸念アレイ特定部と、
     特定された前記故障懸念アレイが管理する前記複数のストレージの中から、前記故障懸念ストレージを特定する故障懸念ストレージ特定部と、
     特定された前記故障懸念ストレージと交換するためのストレージであって、特定された前記故障懸念ストレージよりも、故障する可能性が低いストレージである健全ストレージを特定する健全ストレージ特定部と、
     特定された前記故障懸念ストレージと、特定された前記健全ストレージとを交換する交換部とを備える集積回路。
  11.  コンピュータに、複数のストレージを所定のRAID構成で管理するアレイを、複数管理させるためのコンピュータプログラムであって、
     前記各アレイのRAID構成から、前記各アレイが許容する、ストレージの故障台数を示す故障許容台数を前記アレイ毎に算出し、
     故障する可能性がある故障懸念ストレージの台数を示す故障懸念台数を前記アレイ毎に算出し、
     前記複数のアレイの中から、前記故障懸念台数が、前記故障許容台数を超える故障懸念アレイを特定する故障懸念アレイ特定ステップと、
     特定された前記故障懸念アレイが管理する前記複数のストレージの中から、前記故障懸念ストレージを特定する故障懸念ストレージ特定ステップと、
     特定された前記故障懸念ストレージと交換するためのストレージであって、特定された前記故障懸念ストレージよりも、故障する可能性が低いストレージである健全ストレージを特定する健全ストレージ特定ステップと、
     特定された前記故障懸念ストレージと、特定された前記健全ストレージとを交換する交換ステップとを前記コンピュータに実行させるためのコンピュータプログラム。
PCT/JP2011/004369 2010-08-03 2011-08-02 アレイ管理装置、方法、集積回路およびプログラム WO2012017641A1 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2010174171 2010-08-03
JP2010-174171 2010-08-03

Publications (1)

Publication Number Publication Date
WO2012017641A1 true WO2012017641A1 (ja) 2012-02-09

Family

ID=45559163

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2011/004369 WO2012017641A1 (ja) 2010-08-03 2011-08-02 アレイ管理装置、方法、集積回路およびプログラム

Country Status (1)

Country Link
WO (1) WO2012017641A1 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013254423A (ja) * 2012-06-08 2013-12-19 Canon Inc 情報処理装置及びその制御方法、並びにプログラム
WO2015132690A1 (en) * 2014-03-06 2015-09-11 International Business Machines Corporation Reliabilty enhancement in a distributed storage system

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006040416A (ja) * 2004-07-28 2006-02-09 Sanyo Electric Co Ltd コンテンツ記録装置
JP2008197886A (ja) * 2007-02-13 2008-08-28 Nec Corp ストレージ装置及びその制御方法
JP2008250566A (ja) * 2007-03-29 2008-10-16 Nec Corp ディスクアレイ装置、該装置の運用方法、およびプログラム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006040416A (ja) * 2004-07-28 2006-02-09 Sanyo Electric Co Ltd コンテンツ記録装置
JP2008197886A (ja) * 2007-02-13 2008-08-28 Nec Corp ストレージ装置及びその制御方法
JP2008250566A (ja) * 2007-03-29 2008-10-16 Nec Corp ディスクアレイ装置、該装置の運用方法、およびプログラム

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013254423A (ja) * 2012-06-08 2013-12-19 Canon Inc 情報処理装置及びその制御方法、並びにプログラム
WO2015132690A1 (en) * 2014-03-06 2015-09-11 International Business Machines Corporation Reliabilty enhancement in a distributed storage system
US9336091B2 (en) 2014-03-06 2016-05-10 International Business Machines Corporation Reliability enhancement in a distributed storage system
GB2538206A (en) * 2014-03-06 2016-11-09 Ibm Reliability enhancement in a distributed storage system
JP2017507427A (ja) * 2014-03-06 2017-03-16 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation 分散データ・ストレージ・システムにおけるデータ回復を向上させる方法、システム、およびコンピュータ・プログラム
US9946602B2 (en) 2014-03-06 2018-04-17 International Business Machines Corporation Reliability enhancement in a distributed storage system
US10223207B2 (en) 2014-03-06 2019-03-05 International Business Machines Corporation Reliability enhancement in a distributed storage system
DE112015000384B4 (de) 2014-03-06 2021-12-02 International Business Machines Corporation Erhöhen der Zuverlässigkeit in einem verteilten Speichersystem

Similar Documents

Publication Publication Date Title
CN107870730B (zh) 用于管理存储系统的方法和系统
US10191676B2 (en) Scalable storage protection
US8171379B2 (en) Methods, systems and media for data recovery using global parity for multiple independent RAID levels
US8332354B1 (en) Asynchronous replication by tracking recovery point objective
CN107515726B (zh) 用于管理存储设备的方法和系统
US20160070490A1 (en) Storage control device and storage system
JP2016530637A (ja) Raidパリティストライプ再構成
US20140304548A1 (en) Intelligent and efficient raid rebuild technique
US20100229033A1 (en) Storage management device, storage management method, and storage system
US9104604B2 (en) Preventing unrecoverable errors during a disk regeneration in a disk array
JP2013047913A (ja) 情報処理装置、情報処理装置の制御方法、制御ツール、及びホスト装置
CN105144074A (zh) 使用混合存储器设备的块存储
US9535619B2 (en) Enhanced reconstruction in an array of information storage devices by physical disk reduction without losing data
US20170139605A1 (en) Control device and control method
US8370688B2 (en) Identifying a storage device as faulty for a first storage volume without identifying the storage device as faulty for a second storage volume
US7992072B2 (en) Management of redundancy in data arrays
WO2013080299A1 (ja) データ管理装置、データコピー方法、およびプログラム
US20130191833A1 (en) System and method for assuring performance of data scrubbing operations
JP5668163B2 (ja) 情報処理装置
US9286163B2 (en) Data recovery scheme based on data backup status
WO2012017641A1 (ja) アレイ管理装置、方法、集積回路およびプログラム
US20190354433A1 (en) Parity log with by-pass
US11126486B2 (en) Prediction of power shutdown and outage incidents
JP6190488B2 (ja) 情報記録システム
JP2014032679A (ja) ホスト装置および制御ツール

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 11814278

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 11814278

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: JP