WO2012105260A1 - 記憶装置 - Google Patents

記憶装置 Download PDF

Info

Publication number
WO2012105260A1
WO2012105260A1 PCT/JP2012/000695 JP2012000695W WO2012105260A1 WO 2012105260 A1 WO2012105260 A1 WO 2012105260A1 JP 2012000695 W JP2012000695 W JP 2012000695W WO 2012105260 A1 WO2012105260 A1 WO 2012105260A1
Authority
WO
WIPO (PCT)
Prior art keywords
drive device
recording medium
data
drive
storage device
Prior art date
Application number
PCT/JP2012/000695
Other languages
English (en)
French (fr)
Inventor
中尾 政仁
伊藤 基志
Original Assignee
パナソニック株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by パナソニック株式会社 filed Critical パナソニック株式会社
Priority to JP2012555761A priority Critical patent/JPWO2012105260A1/ja
Priority to US13/820,192 priority patent/US20130166945A1/en
Publication of WO2012105260A1 publication Critical patent/WO2012105260A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/08Error detection or correction by redundancy in data representation, e.g. by using checking codes
    • G06F11/10Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's
    • G06F11/1076Parity data used in redundant arrays of independent storages, e.g. in RAID systems
    • G06F11/1088Reconstruction on already foreseen single or plurality of spare disks

Definitions

  • the present invention relates to a storage device, and more particularly to a disk array device using a plurality of recording media.
  • An example of a high-performance storage device is a disk array device.
  • a disk array device performs high-performance disk systems by performing parallel processing using a plurality of drive devices.
  • a hard disk drive device is generally used as the drive device, but the hard disk drive device is a storage device that is relatively susceptible to failure. Therefore, fault tolerance (high reliability) is obtained by configuring a RAID (Redundant Array of Inexpensive Disk) and adding redundancy.
  • RAID Redundant Array of Inexpensive Disk
  • fault tolerance high reliability
  • a disk array device using an optical disk drive device fault tolerance (high reliability) can be obtained by adopting a RAID configuration as in the case of the hard disk drive device described above (see, for example, Patent Document 1). .
  • FIG. 1 shows a configuration example of a disk array device using an optical disk drive device.
  • the disk array device 1001 includes a control device 1002, a plurality of recording media 1003, a plurality of drive devices 1004, a plurality of storage devices 1005, and a plurality of transport devices 1006.
  • the control device 1002 performs transfer processing between the external processing device and the drive device 1004 in accordance with a request from an external processing device (not shown).
  • the disk array device 1001 includes n + m transport devices 1006. Even if some of the transport devices 1006 fail, a drive device corresponding to the recording medium 1003 can be obtained by using the transport device 1006 that has not failed. 1004 can be conveyed.
  • the recording medium 1003 forms a parity group with m + n sheets, user data is recorded on the m recording media 1003, and parity data is recorded on the n recording media 1003.
  • the disk array device 1001 includes m + n drive devices 1004, and m + n recording media 1003 constituting a parity group are mounted.
  • the disk array device 1001 can reproduce data based on data read from the remaining recording media 1003 even when data cannot be reproduced on n or less recording media 1003 among the recording media 1003 constituting the parity group. The missing data can be restored.
  • Table 1 shows whether or not data restoration is possible in the disk array device shown in FIG.
  • the drive device 2004-a-1 is loaded with the recording medium 2003-a-1
  • the drive device 2004-b-1 is loaded with the recording medium 2003-b-1
  • the drive device 2004-c-1 is loaded.
  • a recording medium 2003-c-1 is loaded. Parity data is recorded on one of the plurality of recording media, and correction is possible if there is a failure of one or less recording media.
  • the cause of the inability to reproduce data from the recording medium may be a failure of the recording medium itself or a drive device loaded with the recording medium.
  • a failure of the recording medium itself or a drive device loaded with the recording medium when there is one or less recording medium failure or one drive device failure or less, error correction is possible and data can be restored.
  • Table 1 with respect to a combination of a recording medium and a drive device in which a failure has occurred, a combination that can restore data is indicated by “ ⁇ ” and a combination that cannot restore data is indicated by “X”.
  • the present invention provides a disk array device that has a high probability that data can be restored even when failures exceeding the number of errors that can be corrected by RAID configuration occur.
  • the storage device of the present invention includes a storage device that stores a plurality of removable recording media, a plurality of drive devices that are loaded with the recording medium and that record and reproduce data, and the storage device and the drive device.
  • a storage device including a plurality of conveying devices that convey the recording medium between them, and a control device that controls the operation of the drive device and the conveying device, wherein the recording medium is a medium in a predetermined number of units. Forming a group, and the medium group has redundancy capable of restoring data even if the data of at least one recording medium belonging to the same medium group cannot be reproduced.
  • the recording medium can be taken out from the apparatus and transported to a desired drive apparatus.
  • the plurality of drive apparatuses include a first drive apparatus and a second drive apparatus.
  • the transport device uses a second recording medium that failed to reproduce the data to the second drive device different from the first drive device.
  • the second drive device attempts to reproduce data from the recording medium that has been transported to the drive device and failed to reproduce data.
  • the second drive device is a drive device not loaded with a recording medium belonging to the same medium group as the recording medium loaded in the first drive device.
  • identification information of a drive device having high reproduction performance among the plurality of drive devices is held, and the second drive device is a drive device that matches the identification information.
  • the storage device further includes a detection unit that detects a drive device having high reproduction performance from the plurality of drive devices.
  • the detection unit preferentially inspects a drive device that is frequently used for recording parity data or a drive device that is used for recording parity data for a long time.
  • the storage device further includes a spare recording medium, and when the second drive device has succeeded in reproducing data from the recording medium conveyed from the first drive device, the storage device All data of the recording medium conveyed from one drive device is copied to the spare recording medium.
  • the recording medium transported from the first drive device when data reproduction of the recording medium transported from the first drive device is successful by the second drive device, the recording medium transported from the first drive device All data is overwritten on the same recording medium.
  • the storage device further includes an inspection unit that detects a quality of a signal reproduced from the recording medium, and the second drive device transports the first drive device from the first drive device.
  • the inspection unit inspects the signal quality of the recording data of the recording medium conveyed from the first drive device, and only the data having a predetermined quality or less is the same recording medium Overwrite to.
  • the storage device further includes a playback performance determination unit that determines whether there is a problem in playback performance of the first drive device.
  • the storage device further includes a playback performance determination unit that determines whether there is a problem in playback performance of the first drive device, and the second drive device causes the first drive device to determine whether there is a problem.
  • the first drive device All the data of the transported recording medium is copied to the spare recording medium.
  • the spare recording medium on which the data is copied is loaded into the first drive device, and recording or reproduction is performed.
  • the storage device further includes a playback performance determination unit that determines whether there is a problem in playback performance of the first drive device, and the second drive device causes the first drive device to determine whether there is a problem.
  • the first drive device All the data of the transported recording medium is overwritten on the same recording medium.
  • the recording medium on which the data is overwritten is loaded into the first drive device, and recording or reproduction is performed.
  • the storage device further includes an inspection unit that detects a quality of a signal reproduced from the recording medium, and when the number of times of parity data replacement recording becomes a predetermined number or more, the inspection unit The signal quality of the user data paired with the parity data is inspected, and the user data is alternately recorded on the basis of a stricter standard than the case of less than the predetermined number of times.
  • the storage device further includes a spare drive device, and when the reproduction performance determination unit determines that there is a problem with the first drive device, the storage device is configured to store the first drive device in the storage device. Replace with a spare drive unit.
  • the reproduction performance determination unit determines that there is a problem with the first drive device when the reproduction performance of the first drive device is equal to or lower than a predetermined value.
  • the storage device further includes a result holding unit that holds a test result of playback performance at the start of use of the first drive device, and the playback performance determination unit includes the first drive.
  • the reproduction performance of the apparatus is deteriorated by a predetermined amount or more than the reproduction performance at the start of use, it is determined that there is a problem with the first drive.
  • the storage device further includes a search unit that searches for operating statuses of the plurality of drive devices, and when the spare drive device has already been used, the first drive device Use another drive device that is not running.
  • the storage device further includes a search unit that searches for operating statuses of the plurality of drive devices, and the reproduction performance determination unit determines that there is a problem with the first drive device The first drive device is replaced with another drive device that is not operating.
  • the recording medium that has failed in data reproduction is transported to a second drive device different from the first drive device, and second The data reproduction is attempted with the drive device.
  • FIG. 3 is a diagram showing the configuration of the disk array device according to the first embodiment of the present invention.
  • the disk array device 3001 includes a control device 3002, a plurality of recording media 3003, a plurality of drive devices 3004, a plurality of storage devices 3005, and a plurality of transport devices 3006.
  • the disk array device 3001 is a fault-tolerant (highly reliable) storage device in which a RAID is configured using a plurality of drive devices 3004.
  • the recording medium 3003 is an optical disk.
  • the control device 3002 performs transfer processing between the external processing device and the drive device 3004 and controls the transport device 3006 in accordance with a request from an external processing device (not shown).
  • the control device 3002 may be constructed by hardware or software.
  • the storage device 3005 stores a plurality of recording media 3003.
  • the conveyance device 3006 conveys the recording medium 3003 between the storage device 3005 and the drive device 3004.
  • the transport device 3006 can transport an arbitrary recording medium 3003 to an arbitrary drive device 3004.
  • the recording medium 3003 is a recording medium capable of recording data.
  • the recording medium 3003 may be a rewritable recording medium that can be recorded a plurality of times, or a write-once recording medium that can be recorded only once.
  • the drive device 3004 performs recording and reproduction on the recording medium 3003 transported and loaded by the transport device 3006.
  • a spare recording medium (3003-a-4, 3003-b-4, 3003-c-4) and a spare drive are used in addition to those used in the normal state.
  • Devices (3004-a-4, 3004-b-4, 3004-c-4) are provided.
  • the number of spare recording media 3003 and spare drive devices 3004 is not limited to a specific number. Further, the spare recording medium 3003 and the spare drive device 3004 may not be provided.
  • FIG. 4 shows a RAID configuration of the recording medium 3003.
  • the recording medium 3003 includes a group (3003-a-1, 3003-b-1, 3003-c-1), a group (3003-a-2, 3003-b-2, 3003-c-2), a group (3003-a-3, 3003-b-3, 3003-c-3), and each group constitutes RAID4.
  • one of the three recording media 3003 is a parity recording medium. As a result, even if a failure occurs in one of the recording media 3003 and data cannot be read, the parity function restores the data in the recording medium 3003 in which the failure occurred from the remaining two pieces of data. It becomes possible to do.
  • the group for performing the RAID configuration is not limited to the above combination.
  • the group (3003-a-2, 3003-b-1, 3003-c-1) the group (3003-a- It is possible to change the combination in the a, b, and c columns on the vertical axis, such as 1, 3003-b-3, 3003-c-2).
  • the number of recording media 3003 for RAID configuration is three for ease of explanation, but it may be composed of four or more. Further, the number of recording media 3003 loaded in each storage device 3005 may be four or more.
  • the number of parity recording media is one in RAID 4, but the parity may be distributed to the recording media in units called stripes as in RAID 5, or per stripe as in RAID 6. Two or more parities may be used.
  • three spare recording media (3003-a-4, 3003-b-4, 3003-c-4) are provided, but the number is not limited to a specific number. Further, the spare recording medium 3003 may not be provided.
  • Fig. 5 shows the RAID configuration of the drive unit.
  • the drive device 3004 includes a group (3004-a-1, 3004-b-1, 3004-c-1), a group (3004-a-2, 3004-b-2, 3004-c-2), a group (3004-a-3, 3004-b-3, 3004-c-3), and each group constitutes RAID4.
  • One of the three drive devices 3004 is called a parity drive device.
  • the parity drive device here is loaded with a parity recording medium.
  • Drive device 3004 is shown.
  • the group for performing the RAID configuration is not limited to the above combination, but the group (3004-a-2, 3004-b-1, 3004-c-1) and the group (3004-a-1). , 3004-b-3, 3004-c-2), and the like, it is possible to change the combination in the a, b, and c columns on the vertical axis. Also, the group (3004-a-1, 3004-a-2, 3004-a-3), the group (3004-b-1, 3004-b-2, 3004-b-3), and the group (3004- As in c-1, 3004-c-2, 3004-c-3), a group may be formed only within the same vertical axis of a, b, c.
  • the recording media 3003 constituting a RAID group may be sequentially played back by a single drive device 3004.
  • the reproduced data is stored in an external storage device (not shown) until the data is reproduced from the last recording medium 3003.
  • spare drive devices (3004-a-4, 3004-b-4, 3004-c-4) are provided, the number is not limited to a specific number. Further, the spare drive device 3004 may not be provided.
  • FIG. 6 shows an example of a specific configuration of the first embodiment of the present invention.
  • the failure of the recording medium 3003 will be described.
  • a failure of the recording medium 3003 there are a case where data cannot be reproduced due to a damage such as a large scratch on the surface of the recording medium 3003, a case where the recording mark disappears due to aging deterioration, and the data cannot be reproduced.
  • the disk array apparatus 3001 relies on data restoration using the parity function. Therefore, as a matter of course, when a failure exceeding the limit of correction by the parity function occurs in the recording medium 3003, data restoration is impossible.
  • the drive device 3004 has a difference in performance of elements constituting the device such as laser diode wavelength and noise level difference, transmission path characteristic difference, pickup lens accuracy, focus adjustment, tilt adjustment, spherical aberration adjustment, reproduction power control, etc. Differences in the quality of the reproduced signal also occur due to device adjustment / control errors. A difference in the quality of the reproduction signal by the drive device 3004 is referred to as a reproduction performance difference. For this reason, when the same recording medium 3003 in which quality degradation has occurred is reproduced by a plurality of drive devices 3004, the reproduction performance differs depending on the individual drive devices 3004. There is an impossible drive device 3004.
  • each drive apparatus 3004 includes a drive group 1 (3004-a-1, 3004-b-1, 3004-c-1) and a drive group 2 (3004-a-2, 3004). -B-2, 3004-c-2) and drive group 3 (3004-a-3, 3004-b-3, 3004-c-3), and each drive group constitutes a RAID
  • each drive group constitutes a RAID
  • the groups (3003-a-1, 3003-b-1, 3003-c-1) constituting the RAID of the recording medium 3003 are transported by the transport apparatuses 3006-a, 3006-b, 3006-c.
  • a RAID configuration is constructed by being transported to and filled in an arbitrary drive device 3004.
  • a case where a failure occurs in two recording media 3003 among the three recording media 3003-a-1, 3003-b-1, and 3003-c-1 and data reproduction cannot be performed will be described.
  • data reproduction is performed using a drive device that is different from the drive device in which the recording medium of the failed media group (parity group) is loaded. Try.
  • the recording medium 3003 is sequentially loaded from the drive device 3004-a-1 to another drive device 3004-a-2 and 3004-a-3 by the transport device 3006-a to reproduce the data.
  • the transport device 3006-b sequentially loads from the drive device 3004-b-1 to another drive device 3004-b-2, 3004-b-3 to reproduce the data.
  • the transport device 3006-c sequentially loads from the drive device 3004-c-1 to another drive device 3004-c-2, 3004-c-3 to reproduce the data. In this way, even when a failure occurs in two or more recording media, by using the reproduction performance difference of the drive device 3004, in the case of a failure due to signal quality deterioration due to aging of the recording medium. It is possible to improve the data restoration probability.
  • the recording medium 3003 constituting the RAID group can be sequentially reproduced by conveying the recording medium 3003 by the conveying device 3006. Yes, if one drive device 3004 is normal, all the recording media 3003 in the group can be reproduced. In this case, it is assumed that the other recording medium 3003 data reproduced until the data reproduction from the last recording medium 3003 is completed is stored in an external storage device (not shown).
  • Table 2 is a table showing an example when data restoration is possible in the present embodiment. Table 2 shows that the data restoration probability is improved by adopting the configuration of the disk array device 3001. In Table 2, if two of the drive devices 3004 have a failure and one of the recording media 3003 has a failure, the drive device 3004 that has no failure reproduces all the recording media 3003 that have no failure. By doing so, the data can be restored, so “ ⁇ ” is displayed. In Table 2, “ ⁇ ” indicates a case where the data restoration probability is improved by using the performance difference of the drive device 3004. Table 2 shows only the case of group 1 (3004-a-1, 3004-b-1, 3004-c-1) of the drive device 3004 for ease of explanation.
  • the configuration of the disk array device 3001 of the present invention three recording media 3003 and nine drive devices 3004 are used. However, the configuration is composed of four or more recording media 3003 and ten or more drive devices 3004. Also good.
  • the disk array device includes a plurality of detachable recording media, a storage device that stores the plurality of recording media, and a plurality of recording media that are loaded with each recording medium and that perform recording and reproduction.
  • the recording medium 3003 forms a medium group in units of a predetermined number. Further, the medium group has a redundancy that allows data to be restored even if the data of at least one recording medium belonging to the medium group cannot be reproduced. Further, the transport device can take out the recording medium from an arbitrary storage device and transport it to an arbitrary drive device.
  • the recording medium in which data reproduction has failed is transferred to a drive device different from that in which data reproduction has failed by the transport device. Carry it and try to replay data.
  • data can be reproduced even when a failure exceeding the correction limit redundant by the RAID configuration occurs. For example, even when a failure occurs in two or more recording media, by using the reproduction performance difference of the drive device 3004, in the case of a failure due to signal quality deterioration due to aging of the recording medium, data restoration is performed. It is possible to improve the probability.
  • the performance information of the drive device 3004 may be held in a storage memory (not shown) in the control device, and the drive device 3004 having the best performance may be preferentially played back.
  • the drive device 3004 itself also deteriorates in reproduction performance due to deterioration of characteristics of each element constituting the device due to deterioration over time, increase in device adjustment / control error due to component distortion due to long-term stress, and positional deviation, etc. Therefore, the performance of the drive device 3004 may be periodically inspected, and the result may be stored in a storage memory in the control device 3002.
  • the disk array device of the present embodiment may hold identification information of a drive device with high reproduction performance from among a plurality of drive devices. At this time, the recording medium of the drive device that has failed in data reproduction may be transported to the drive device that matches the identification information to attempt data reproduction.
  • the recording medium 3003 used for the inspection may be obtained by reproducing the data already recorded on the recording medium 3003 by each drive device 3004. Alternatively, the recording medium 3003 for performance inspection may be separately held and used. May be.
  • an index for comparing the reproduction performance of the drive device 3004 there is a correlation with the error rate of the binarization result obtained when the modulation degree, beta, jitter, error rate, and PRML signal processing method are used. There are indicators for signal quality.
  • the quality of data recorded on the recording medium 3003 may be deteriorated.
  • whether the cause of the failure of data reproduction is the reproduction performance of the drive device 3004 or the recording medium. It can be determined whether the signal quality is 3003.
  • the recording medium in which the reproduction error has occurred is transported to another drive device 3004 and reproduced (S1002). Then, it is determined whether or not reproduction is possible (S1003).
  • reproduction is impossible it means that reproduction is not possible with other (plural) drive devices 3004. In this case, it is determined that the recording medium is deteriorated (S1004).
  • reproduction is possible it can be determined that the drive has deteriorated (S1005).
  • the performance of the drive device may be inspected by using the inspection recording medium 3003 or the like. In that case, it can be determined that the drive is the cause.
  • the performance of each drive device 3004 can be inspected to determine whether the drive device has deteriorated. As a result, it is possible to determine whether the recording medium has deteriorated or another cause.
  • the disk array device of this embodiment may further include a spare recording medium. At this time, if the data reproduction of the recording medium transported from the drive device that has failed in data reproduction is successful, all the data on the recording medium transported from the drive device that has failed in data reproduction is copied to the spare recording medium. May be.
  • the disk array device of this embodiment may further include a spare recording medium.
  • the drive device refers to the inspection unit for detecting the quality of the signal reproduced from the recording medium, the result holding unit for holding the result of the inspection unit for each drive device, and the result of the result holding unit to A playback performance determination unit that determines whether there is a problem in the playback performance of the drive device that has failed to be played back may be included.
  • the control device 3002 may fulfill the functions of the inspection unit, the result holding unit, and the reproduction performance determination unit.
  • the disk array device of the present embodiment succeeds in data reproduction of the recording medium conveyed from the drive device that has failed in data reproduction, and the reproduction performance determination unit determines that there is no problem in reproduction performance, All data on the recording medium may be copied to a spare recording medium.
  • a spare recording medium on which data is copied may be loaded into a drive device that has failed to reproduce data, and recording or reproduction may be performed.
  • recording or reproduction can be performed by loading a normal spare recording medium into the drive apparatus in which data reproduction has failed. Can be used again.
  • the exchanged recording medium 3003 has exactly the same data, and is copied as it is, including the file position and sector information (management information). Therefore, any update of the file system of the other recording medium 3003 is made. It is possible to restore the disk array device to the original state without performing the process.
  • the data may not be reproducible due to a change in the mark such as a recording mark becoming smaller due to deterioration over time.
  • the signal quality is restored. In this way, the reliability of the disk array device can be improved by the improved recording medium.
  • the disk array device of this embodiment succeeds in data reproduction of the recording medium transported from the drive device in which data reproduction has failed, all the data of the recording medium transported from the drive device in which data reproduction has failed is recorded. The same recording medium may be overwritten.
  • the disk array device of the present embodiment includes an inspection unit that detects the quality of a signal reproduced from a recording medium, a result holding unit that holds the result of the inspection unit for each drive device, and a result of the result holding unit.
  • a playback performance determination unit that determines whether or not there is a problem in the playback performance of the drive device that has failed in data playback may be included.
  • the disk array device of the present embodiment succeeds in data reproduction of the recording medium conveyed from the drive device that has failed in data reproduction, and the reproduction performance determination unit determines that there is no problem in reproduction performance, All data on the recording medium may be overwritten on the same recording medium.
  • the recording medium on which the data is overwritten may be loaded into a drive device that has failed in data reproduction, and recording or reproduction may be performed. If data playback has failed due to deterioration of the recorded data, normal recording or playback can be performed by loading the overwritten recording medium in the drive device that has failed in data playback. The device can be used again.
  • the index for confirming the signal quality of the recording medium indicates the signal quality correlated with the error rate of the binarization result obtained when the modulation degree, beta, jitter, error rate, and PRML signal processing method are used. Indicators.
  • phase-change recording film is composed of a metal compound, and becomes crystalline or amorphous depending on the cooling rate after a temperature exceeding the crystal point and the melting point is applied. Such a temperature change gives the recording film deterioration similar to metal fatigue.
  • RAID4 a parity data part common to RAID4, RAID5, and RAID6, but the fact that the parity data part has a higher number of rewrites than the user data part.
  • the ratio of user data is much higher, such as adding one parity data to eight user data.
  • eight user data are D1, D2, D3,..., D8, and one parity data is P.
  • the parity data P must always be rewritten, so the number of rewrites of the parity data P increases.
  • Table 3 shows an example of the relationship between the number of rewrites of user data and the number of rewrites of parity data in RAID4.
  • Table 3 shows the number of rewrites of the parity data P when the user data D1 to D8 are rewritten once each by eight rewrites of the RAID group.
  • the parity data P is rewritten 8 times, although each of the user data D1 to D8 is rewritten once.
  • the recording medium 3003 is provided with a spare area for replacing the deteriorated area.
  • the number of times the parity data P deteriorates and is alternately recorded becomes a predetermined number or more (for example, half of the ratio of user data and parity data)
  • the user data belonging to the same stripe is inspected to obtain the above signal quality.
  • the threshold value at this time is a stricter threshold value than the case where the number of times the parity data P is alternately recorded is less than the predetermined number.
  • the disk array apparatus may further include an inspection unit that detects the quality of a signal reproduced from the recording medium. At this time, the inspection unit inspects the signal quality of the user data paired with the parity data when the number of parity data replacement recordings given for redundancy exceeds a predetermined number, and a threshold value that is stricter than usual. Alternate recording may also be performed. Note that the recording medium 3003 may be replaced instead of the early replacement recording of user data.
  • the drive device 3004 also deteriorates over time.
  • a spindle motor that rotates the recording medium 3003, a traverse motor that moves a pickup that reads and writes signals from the recording medium 3003, and a mechanical component that supports them are more likely to deteriorate as the number of movements increases.
  • RAID 4 there is a parity disk in which only parity data is recorded.
  • parity drive that frequently installs the parity disk. There is a fact that this parity drive has a large number of accesses. For example, when an instruction for rewriting D2 to D2 ′ is received from an external processing device (not shown), there are the following two methods for obtaining the parity data P ′ to be newly generated.
  • the parity data P is accessed when any of the user data D1 to D8 is rewritten, the number of accesses of the parity data increases. That is, the number of accesses to the parity drive device increases, and the spindle motor, the traverse motor, and related mechanical parts are rapidly deteriorated.
  • an apparatus for performance inspection may be selected depending on the number of times the parity recording medium is mounted and the length of time.
  • the disk array device of the present embodiment may have a detection unit that detects a drive device with high reproduction performance from among a plurality of drive devices. At this time, the detection unit may preferentially check a drive device that is frequently used for recording parity data or has a long time used for recording parity data.
  • the performance degradation of the drive device 3004 may cause a decrease in the reliability of the disk array device 3001. Therefore, when the reproduction performance obtained from the periodic reproduction performance inspection results is not more than a predetermined value as described above, the drive device 3004 is automatically replaced with a spare drive device 3004, thereby providing a disk array device. The reliability of 3001 can be improved.
  • the disk array device of this embodiment may have a spare drive device.
  • the disk array device of the present embodiment includes an inspection unit that detects the quality of a signal reproduced from a recording medium, a result holding unit that holds the result of the inspection unit for each drive device, and a result of the result holding unit.
  • the information processing apparatus may further include a reproduction performance determination unit that determines whether or not there is a problem with the reproduction performance of the drive device that has failed in data reproduction.
  • the reproduction performance determination unit determines that there is a problem with the drive device that has failed to reproduce data
  • the drive device that has failed to reproduce data is regarded as a spare drive device. It may be exchanged.
  • the control device controls the drive device 3004 not reproducing data among the other drive devices 3004 constituting the disk array device 3001.
  • the disk array is searched until the failed drive device 3004 is replaced with a normal drive device 3004 by using the drive device 3004 searched by the device 3002 instead of the failed drive device 3004.
  • the reliability and further availability of the device 3001 can be increased.
  • the disk array device of the present embodiment may further include a spare drive device and a search unit that searches for the operating status of the drive device. At this time, if a spare drive device has already been used, a drive device that has failed in data reproduction may be replaced with a drive device that is not operating.
  • the disk array device of the present embodiment includes an inspection unit that detects the quality of a signal reproduced from a recording medium, a result holding unit that holds the result of the inspection unit for each drive device, and a result of the result holding unit.
  • a playback performance determination unit that determines whether there is a problem in the playback performance of the drive device that has failed in data playback may be further included.
  • the drive device that is not operating the drive device that has failed in data reproduction. May be substituted.
  • the criterion for determining the deterioration of the reproduction performance of the drive device 3004 may be whether or not the reproduction performance of the drive device 3004 is below a predetermined value as described above.
  • the playback performance determination unit may determine that there is a problem with the drive device when the playback performance of the drive device that has failed in data playback is below a predetermined value.
  • the disk array device is started (S701).
  • construction is performed with an arbitrary RAID (S702), and operations such as recording and reproduction are performed as a disk array device.
  • the RAID configuration can be any configuration such as RAID4, RAID5, RAID6, and the like, and the number of drive devices 3004 to be configured can be any number.
  • This determination can be made by making the determination as shown in FIG. If it is determined in S704 that the recording medium is the cause, data recovery is performed (S705).
  • the media data may be restored by recording all data on the unused recording medium 3003 or the spare recording medium 3003 and replacing the recording medium 3003. Only data in an area where data has deteriorated may be recorded in an unused area of the recording medium 3003 or an area for alternate recording.
  • the data restoration if the recording medium that failed to reproduce the data can be reproduced by transporting it to another drive device and reproducing it using the difference in drive performance, the reproduced data is used for the restoration. When data cannot be reproduced by another drive device 3004, it is possible to use data restored by the RAID parity function.
  • the drive device 3004 is broken or degraded (S706). If it is determined that there is neither failure nor deterioration, it is determined that data reproduction has failed due to an influence other than the drive factor, such as an external impact, and the operation is continued. On the other hand, when it is determined that the drive device 3004 has failed or deteriorated, the drive device 3004 is replaced. First, the presence / absence of a spare drive device is inspected (S707). If there is a spare drive device, the failed or degraded drive device is replaced with a spare drive device (S708), and the RAID is reconstructed (S702).
  • the failed or degraded drive device is replaced with a new drive device outside the disk array device (S709), and the operation of the disk array device is continued.
  • S708 is to transport the recording medium 3003 loaded in the failed or deteriorated drive device to the spare drive device.
  • the drive device is replaced with a new drive device outside the disk array device. Means.
  • the use status of the drive device 3004 in the disk array device is searched (S710), and the failed or degraded drive
  • the device 3004 is replaced with an unused drive device (S711).
  • S711 is to transport the recording medium 3003 loaded in the failed or deteriorated drive device to an unused drive device.
  • the RAID is reconstructed using the drive device 3004 replaced in S711 (S712).
  • the RAID reconstruction in S712 is temporarily performed using an unused drive device until the failed or degraded drive device is replaced with a new drive device (S713).
  • the reproduction performance of the drive device 3004 at the time of start of use is stored in the storage memory in the control device 3002, and the reproduction performance of the drive device 3004 at the time of periodic reproduction performance inspection is stored in the storage memory. It may be determined that the reproduction performance of the drive device 3004 has deteriorated when the reproduction performance that has been maintained deteriorates by a predetermined level or more. That is, in the disk array device according to the present embodiment, the reproduction performance determination unit determines that there is a problem with the drive when the reproduction performance of the drive device that has failed in data reproduction is deteriorated by a predetermined amount or more than the reproduction performance at the start of use. You may judge.
  • any The configuration of the disk array device 3001 may be configured such that the RAID device is configured by selecting the drive device 3004 having the highest performance in the order of the number of drive devices 3004 and the drive device 3004 that is not selected is a spare drive device 3004. Good.
  • the reliability of the disk array device 3001 can be further increased.
  • the RAID configuration It may be determined that the reproduction performance of the drive device 3004 being used has deteriorated and replaced with a spare drive device 3004.
  • the replaced drive device 3004 is determined to have deteriorated in reproduction performance and has a predetermined reproduction performance or higher, it may be retained as a spare drive device 3004.
  • the reference of the reproduction performance targeted for judging the deterioration of the reproduction performance is set as the reproduction performance of the drive apparatus 3004 having the best reproduction performance among the spare drive apparatuses 3004.
  • a replacement with a new drive device 3004 outside the configuration of the disk array device 3001 is requested.
  • the request for replacement may be indicated by blinking of an LED or display on a liquid crystal screen.
  • the performance of the newly incorporated drive device 3004 is inspected, and the playback performance is determined based on the result.
  • the RAID may be reconfigured so that a good drive device 3004 is used preferentially.
  • the failed or degraded drive device is replaced with a spare drive device (S803), and then the RAID is reconfigured in S802.
  • replacement is performed with a drive device having the best performance among the spare drive devices.
  • the failed or degraded drive device is replaced with a new drive device (S709), and the performance of the new drive device is checked (S805), and then the operation is continued.
  • the new drive device becomes a spare drive device, but when the drive device is replaced next time, a performance test is performed to confirm the performance ranking in the spare drive.
  • the use status of the drive device is searched in S710, and the failed or degraded drive device is replaced with an unused drive device (S804).
  • the unused drive device to be replaced is replaced with the drive device having the best performance when there are a plurality of unused drive devices.
  • the performance test of the new drive device is performed (S806).
  • the RAID is reconfigured using the result in S806 (S802).
  • the disk array device may be operated.
  • processes having the same contents as those in FIGS. 7 and 8 are denoted by the same reference numerals, and the same description is not repeated.
  • step S902 it is determined whether the drive performance has deteriorated.
  • the criterion for determining the drive performance degradation in S902 can be a case where the performance in S801 and the performance inspected in S903, which will be described later, is deteriorated more than a predetermined value, or a case where a predetermined value or more is arbitrarily determined. .
  • the drive device 3004 constituting the RAID can always be a drive device with good performance.
  • the amount of deterioration due to aging of recorded data differs depending on the recording layer in media with multiple recording layers, so the above signal quality is detected for data other than the layer where data reproduction was difficult
  • the data may be overwritten only when it is equal to or less than the predetermined value.
  • the disk array device of this embodiment may further include an inspection unit that detects the quality of a signal reproduced from the recording medium. At this time, the disk array device of this embodiment inspects the recording quality of the predetermined data recorded on the recording medium when the data reproduction of the recording medium transported from the drive device that has failed in the data reproduction succeeds. However, only data having a predetermined quality or less may be overwritten.
  • the recording medium is an optical disk
  • the present invention is not limited to the optical disk.
  • the recording medium may be a semiconductor memory such as a flash memory or a magnetic tape.
  • the present invention is applicable to a storage device that constructs a RAID using a plurality of removable recording media.
  • the disk array device has a control device that reproduces a recording medium by using the reproduction performance difference of the drive device, so that the fault tolerance (reliability) can be improved, and it can be used for an archive system or the like. Can be applied.

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)

Abstract

 本発明の記憶装置は、着脱可能な複数の記録媒体を用いてRAIDを構成する。第1のドライブ装置で記録媒体のデータ再生に失敗した場合、搬送装置は、データ再生に失敗した記録媒体を第1のドライブ装置とは異なる第2のドライブ装置に搬送し、データ再生に失敗した記録媒体からのデータ再生を第2のドライブ装置により試みる。これにより、RAID構成の誤り訂正可能な数を超える障害が発生した場合においても、データを復元できる確率を高くすることができる。

Description

記憶装置
 本発明は、記憶装置に関し、特に複数の記録媒体を用いたディスクアレイ装置に関する。
 高性能の記憶装置の一例として、ディスクアレイ装置がある。ディスクアレイ装置は、複数のドライブ装置を用いて並列処理することによって、ディスクシステムの高性能化を行っている。また、ドライブ装置としては一般的にハードディスクドライブ装置が用いられているが、ハードディスクドライブ装置は比較的に故障が発生しやすい記憶装置である。そのため、RAID(Redundant Arrays of Inexpensive Disk)を構成して冗長性を付加することによって、耐障害性(高信頼性)を獲得している。
 また、近年では、保存するデータの容量が飛躍的に増加しており、ハードディスクドライブ装置を用いたディスクアレイ装置では、容量を確保するためにハードディスクドライブ装置を増やしている。すると、ハードディスクドライブ装置の数に比例して、消費エネルギーも大きく増加する。この消費エネルギーの増大は、地球環境を守る上で望ましくない。その為、エネルギー消費の少ないディスクアレイ装置が求められおり、その一つとして、光ディスクドライブ装置を用いたディスクアレイ装置が注目されている。
 光ディスクドライブ装置を用いたディスクアレイ装置においても、上記のハードディスクドライブ装置の場合と同様にRAID構成にすることで耐障害性(高信頼性)を獲得することができる(例えば、特許文献1参照)。
 光ディスクドライブ装置を用いたディスクアレイ装置の構成例を図1に示す。ディスクアレイ装置1001は、制御装置1002、複数の記録媒体1003、複数のドライブ装置1004、複数の収納装置1005、複数の搬送装置1006を備える。
 制御装置1002は外部の処理装置(図示せず)からの要求にしたがって、外部処理装置とドライブ装置1004の間で転送処理を行う。
 ディスクアレイ装置1001はn+m台の搬送装置1006を備えており、そのうちの一部の搬送装置1006が故障したとしても、故障していない搬送装置1006を用いることで、記録媒体1003を対応するドライブ装置1004に搬送することが可能である。
 記録媒体1003は、m+n枚でパリティグループを構成しており、m枚の記録媒体1003にユーザデータが記録され、n枚の記録媒体1003にパリティデータが記録される。また、ディスクアレイ装置1001はm+n台のドライブ装置1004を備えており、パリティグループを構成するm+n枚の記録媒体1003が装着される。ディスクアレイ装置1001では、パリティグループを構成する記録媒体1003のうちのn枚以下の記録媒体1003でデータ再生ができなくなった場合でも、残りの記録媒体1003から読み出したデータに基づいて、その再生できなかったデータを復元することができる。
特開平10-254639号公報
 しかしながら、上記ディスクアレイ装置の構成では、RAID構成の誤り訂正が可能な数を超える障害が記録媒体に発生した場合に対しての考慮がなされておらず、誤り訂正可能な数を超える障害が記録媒体に発生した場合には、データの復元ができないという課題を有していた。
 ここで、パリティ機能によってデータの復元ができない場合の例を、図2と表1を使って説明する。表1は、図2に示すディスクアレイ装置でデータ復元が可能か否かを示す表である。図2では、ドライブ装置2004-a-1に記録媒体2003-a-1が装填され、ドライブ装置2004-b-1に記録媒体2003-b-1が装填され、ドライブ装置2004-c-1に記録媒体2003-c-1が装填されている。複数の記録媒体のうちの1枚にはパリティデータが記録されており、記録媒体1枚以下の障害であれば訂正が可能である。
Figure JPOXMLDOC01-appb-T000001
 記録媒体からデータ再生ができない原因としては、記録媒体自身の障害、または記録媒体が装填されたドライブ装置の障害が考えられる。図2のディスクアレイ装置では、記録媒体の障害が1枚以下またはドライブ装置の障害が1台以下の場合、誤り訂正が可能であるため、データの復元が可能である。表1では、障害が発生している記録媒体とドライブ装置の組み合わせに対して、データの復元が可能な組み合わせを“○”、データの復元が不可能な組み合わせを“×”で示している。
 表1に示すように、誤り訂正可能な数を超えた障害が記録媒体またはドライブ装置に発生した場合は、パリティ機能を用いでもデータの復元が不可能となってしまう。
 本発明は、RAID構成の誤り訂正可能な数を超える障害が発生した場合においても、データを復元できる確率が高いディスクアレイ装置を提供する。
 本発明の記憶装置は、着脱可能な複数の記録媒体を格納する収納装置と、前記記録媒体が装填され、データの記録および再生を行う複数のドライブ装置と、前記収納装置と前記ドライブ装置との間で前記記録媒体を搬送する複数の搬送装置と、前記ドライブ装置および前記搬送装置の動作を制御する制御装置と、を備えた記憶装置であって、前記記録媒体は、所定数の単位で媒体グループを形成し、前記媒体グループは、同じ媒体グループに属する少なくとも1つの記録媒体のデータが再生できなくても、データの復元が可能な冗長度を有し、前記搬送装置は、所望の前記収納装置から前記記録媒体を取り出して、所望の前記ドライブ装置に搬送することが可能であり、前記複数のドライブ装置には第1のドライブ装置および第2のドライブ装置が含まれており、第1のドライブ装置で前記記録媒体のデータ再生に失敗した場合、前記搬送装置は、データ再生に失敗した前記記録媒体を前記第1のドライブ装置とは異なる第2のドライブ装置に搬送し、データ再生に失敗した前記記録媒体からのデータ再生を前記第2のドライブ装置により試みる。
 ある実施形態によれば、前記第2のドライブ装置は、前記第1のドライブ装置に装填されていた記録媒体と同じ媒体グループに属する記録媒体を装填していないドライブ装置である。
 ある実施形態によれば、前記複数のドライブ装置のうちの再生性能の高いドライブ装置の識別情報を保持し、前記第2のドライブ装置は、前記識別情報に合致するドライブ装置である。
 ある実施形態によれば、前記記憶装置は、前記複数のドライブ装置の中から再生性能の高いドライブ装置を検出する検出部をさらに備える。
 ある実施形態によれば、前記検出部は、パリティデータの記録に用いられた頻度が高いドライブ装置、またはパリティデータの記録に用いられた時間が長いドライブ装置を優先的に検査する。
 ある実施形態によれば、前記記憶装置は予備の記録媒体をさらに備え、前記第2のドライブ装置により、前記第1のドライブ装置から搬送された前記記録媒体のデータ再生に成功した場合、前記第1のドライブ装置から搬送された前記記録媒体の全てのデータを前記予備の記録媒体に複製する。
 ある実施形態によれば、前記第2のドライブ装置により、前記第1のドライブ装置から搬送された前記記録媒体のデータ再生に成功した場合、前記第1のドライブ装置から搬送された前記記録媒体の全てのデータを同じ前記記録媒体に上書きする。
 ある実施形態によれば、前記記憶装置は、前記記録媒体から再生される信号の品質を検出する検査部をさらに備え、前記第2のドライブ装置により、前記第1のドライブ装置から搬送された前記記録媒体のデータ再生に成功した場合、前記検査部は、前記第1のドライブ装置から搬送された前記記録媒体の記録データの信号品質を検査し、所定の品質以下のデータのみを同じ前記記録媒体に上書きする。
 ある実施形態によれば、前記記憶装置は、前記第1のドライブ装置の再生性能に問題があるか否かを判断する再生性能判断部をさらに備える。
 ある実施形態によれば、前記記憶装置は、前記第1のドライブ装置の再生性能に問題があるか否かを判断する再生性能判断部をさらに備え、前記第2のドライブ装置により、前記第1のドライブ装置から搬送された前記記録媒体のデータ再生に成功し、且つ、前記再生性能判断部が前記第1のドライブ装置の再生性能に問題がないと判断した場合、前記第1のドライブ装置から搬送された前記記録媒体の全てのデータを前記予備の記録媒体に複製する。
 ある実施形態によれば、前記データが複製された前記予備の記録媒体を、前記第1のドライブ装置に装填し、記録または再生を行う。
 ある実施形態によれば、前記記憶装置は、前記第1のドライブ装置の再生性能に問題があるか否かを判断する再生性能判断部をさらに備え、前記第2のドライブ装置により、前記第1のドライブ装置から搬送された前記記録媒体のデータ再生に成功し、且つ、前記再生性能判断部が前記第1のドライブ装置の再生性能に問題がないと判断した場合、前記第1のドライブ装置から搬送された前記記録媒体の全てのデータを同じ前記記録媒体に上書きする。
 ある実施形態によれば、前記データが上書きされた前記記録媒体を、前記第1のドライブ装置に装填し、記録または再生を行う。
 ある実施形態によれば、前記記憶装置は、前記記録媒体から再生される信号の品質を検出する検査部をさらに備え、パリティデータの交替記録回数が所定回数以上になった場合、前記検査部は前記パリティデータと対を成すユーザデータの信号品質を検査し、前記所定回数未満の場合よりも厳しい基準に基づいてユーザデータの交替記録を行なう。
 ある実施形態によれば、前記記憶装置は、予備のドライブ装置をさらに備え、前記再生性能判断部によって前記第1のドライブ装置に問題があると判断された場合、前記第1のドライブ装置を前記予備のドライブ装置と交換する。
 ある実施形態によれば、前記再生性能判断部は、前記第1のドライブ装置の再生性能が所定以下であった場合に前記第1のドライブ装置に問題があると判断する。
 ある実施形態によれば、前記記憶装置は、前記第1のドライブ装置の使用開始時の再生性能の検査結果を保持する結果保持部をさらに備え、前記再生性能判断部は、前記第1のドライブ装置の再生性能が、前記使用開始時の再生性能よりも所定以上劣化した場合に、前記第1のドライブに問題があると判断する。
 ある実施形態によれば、前記記憶装置は、前記複数のドライブ装置の稼働状況を探索する探索部をさらに備え、前記予備のドライブ装置が既に使用されていた場合には、前記第1のドライブ装置を稼動していない別のドライブ装置で代用する。
 ある実施形態によれば、前記記憶装置は、前記複数のドライブ装置の稼働状況を探索する探索部をさらに備え、前記再生性能判断部によって前記第1のドライブ装置に問題があると判断された場合、前記第1のドライブ装置を稼動していない別のドライブ装置で代用する。
 本発明によれば、第1のドライブ装置で記録媒体のデータ再生に失敗した場合、そのデータ再生に失敗した記録媒体を第1のドライブ装置とは異なる第2のドライブ装置に搬送し、第2のドライブ装置によりデータ再生を試みる。これにより、RAID構成の誤り訂正可能な数を超える障害が発生した場合においても、データを復元できる確率を高くすることができる。
ディスクアレイ装置の構成を示す図である。 ディスクアレイ装置でデータが復元できない例を説明する図である。 本発明の実施形態におけるディスクアレイ装置の構成を示す図である。 本発明の実施形態における記録媒体のRAIDの構成例を示す図である。 本発明の実施形態におけるドライブ装置のRAIDの構成例を示す図である。 本発明の実施形態におけるディスクアレイ装置の構成を示す図である。 本発明の実施形態におけるディスクアレイ装置の動作を示すフローチャートである。 本発明の実施形態におけるディスクアレイ装置の動作を示すフローチャートである。 本発明の実施形態におけるディスクアレイ装置の動作を示すフローチャートである。 本発明の実施形態におけるデータ再生エラーの原因を判断する動作を示すフローチャートである。
 以下、本発明の実施形態について図面を参照しながら説明する。
 (実施形態1)
 図3は、本発明の実施形態1におけるディスクアレイ装置の構成を示す図である。
 ディスクアレイ装置3001は、制御装置3002と、複数の記録媒体3003と、複数のドライブ装置3004と、複数の収納装置3005と、複数の搬送装置3006とを備える。ディスクアレイ装置3001は、複数のドライブ装置3004を用いてRAIDを構成した耐障害性(高信頼性)の記憶装置である。この例では、記録媒体3003は光ディスクである。
 制御装置3002は外部の処理装置(図示せず)からの要求にしたがって、外部の処理装置とドライブ装置3004の間の転送処理や、搬送装置3006の制御を行う。ここで、制御装置3002は、ハードウェアによって構築してもよいし、ソフトウェアによって構築してもよい。また、収納装置3005には、複数の記録媒体3003が収納さている。
 搬送装置3006は、収納装置3005とドライブ装置3004との間で記録媒体3003を搬送する。ここで、搬送装置3006は、任意の記録媒体3003を任意のドライブ装置3004に搬送することが可能である。
 記録媒体3003は、データを記録可能な記録媒体である。ここで、記録媒体3003は、複数回の記録が可能な書換型の記録媒体でもよいし、1回のみの記録が可能な追記型の記録媒体でもよい。
 ドライブ装置3004は、搬送装置3006によって搬送および装填された記録媒体3003に、記録や再生を行う。
 ここで、記録媒体3003とドライブ装置3004では、通常状態で使用する為のもの以外に、予備の記録媒体(3003-a-4、3003-b-4、3003-c-4)と予備のドライブ装置(3004-a-4、3004-b-4、3004-c-4)が設けられている。予備の記録媒体3003、予備のドライブ装置3004共にその数は特定の数に限定されない。また、予備の記録媒体3003や予備のドライブ装置3004を備えない構成としてもよい。
 図4に記録媒体3003のRAIDの構成を示す。記録媒体3003は、グループ(3003-a-1、3003-b-1、3003-c-1)と、グループ(3003-a-2、3003-b-2、3003-c-2)と、グループ(3003-a-3、3003-b-3、3003-c-3)とに分けられて、それぞれのグループにてRAID4を構成する。ここでは、3枚の記録媒体3003の中の1枚をパリティ記録媒体とする。これによって、記録媒体3003の1枚に障害が発生し、データの読み出しが不可能となった場合においても、パリティ機能によって、残りの2枚のデータから障害が発生した記録媒体3003のデータを復元することが可能となる。
 ここで、RAID構成を行うグループとしては、上記の組み合わせに限定するものではなく、例えば、グループ(3003-a-2、3003-b-1、3003-c-1)、グループ(3003-a-1、3003-b-3、3003-c-2)とする等、縦軸のa、b、c列内での組み合わせの変更は可能である。
 なお、本実施形態においては、説明を容易にするためにRAID構成を行う記録媒体3003の数を3枚としているが4枚以上で構成してもよい。また、各収納装置3005に装填されている記録媒体3003の数も4枚以上としてもよい。
 また、本実施形態においては、RAID4でパリティ記録媒体の数を1枚としたが、RAID5のようにストライプと呼ばれる単位でパリティを記録媒体に分散してもよいし、RAID6のようにストライプ当たりのパリティを2つ以上としてもよい。
 ここで、図4においては、3台の予備の記録媒体(3003-a-4、3003-b-4、3003-c-4)を備えているが、特定の枚数に限定するものではない。また、予備の記録媒体3003を備えない構成にしてもよい。
 図5にドライブ装置のRAID構成を示す。ドライブ装置3004は、グループ(3004-a-1、3004-b-1、3004-c-1)と、グループ(3004-a-2、3004-b-2、3004-c-2)と、グループ(3004-a-3、3004-b-3、3004-c-3)とに分けられて、それぞれのグループにてRAID4を構成する。3台のドライブ装置3004の中の1台をパリティドライブ装置と呼ぶこととするが、実際のRAIDの構成は記録媒体3003に依存するため、ここでのパリティドライブ装置とは、パリティ記録媒体が装填されたドライブ装置3004を示す。ここで、ドライブ装置3004の1台に障害が発生し、データの読み出しが不可能になった場合においても、パリティ機能によって、残りの2台のドライブ装置3004で読み出したデータから、障害が発生したドライブ装置3004が再生すべきデータを復元することが可能となる。
 ここで、RAID構成を行うグループとしては、上記の組み合わせに限定するものではなく、グループ(3004-a-2、3004-b-1、3004-c-1)と、グループ(3004-a-1、3004-b-3、3004-c-2)との2つのグループとする等、縦軸のa、b、c列内での組み合わせの変更は可能である。また、グループ(3004-a-1、3004-a-2、3004-a-3)と、グループ(3004-b-1、3004-b-2、3004-b-3)と、グループ(3004-c-1、3004-c-2、3004-c-3)とのように、a、b、cの同じ縦軸内のみでグループを構成してもよい。
 更には、複数のドライブ装置3004を用いず、1台のドライブ装置3004によって、RAIDのグループを構成する記録媒体3003を順次再生してもよい。この場合、最後の記録媒体3003からデータが再生されるまでに再生されたデータは外部記憶装置(図示せず)に保存しておくものとする。
 また、本実施形態においては、説明を容易にするためにRAID構成を行うドライブ装置3004を3台としているが4台以上で構成してもよい。
 また、図5においては、3台の予備のドライブ装置(3004-a-4、3004-b-4、3004-c-4)を備えているが、特定の台数に限定するものではない。また、予備のドライブ装置3004備えない構成にしてもよい。
 図6は、本発明の実施形態1の具体的な構成の一例を示す。
 まず初めに、記録媒体3003の障害についての説明を行う。記録媒体3003の障害としては、記録媒体3003の表面に大きな傷などの破壊が発生してデータを再生できない場合、経年劣化によって記録マークが消失してしまいデータを再生できない場合、などが発生する。このような障害が発生した場合は、通常、各記録媒体3003の単体でのデータの復元は不可能な為、ディスクアレイ装置3001においては、パリティ機能を用いてのデータの復元が頼りとなる。従って、当然ではあるが、パリティ機能による訂正の限界を超える障害が記録媒体3003に発生した場合には、データの復元は不可能となる。しかしながら、記録媒体3003の障害の中でも、経年劣化によって徐々に信号の品質が劣化する場合においては、記録マークが完全に消失していないにも関わらずデータの再生が不可能な状態となってしまう場合がある。パリティ機能による訂正限界を超える障害が記録媒体に発生した場合であっても、ある工夫を施すことで、上記のような信号の品質劣化による障害を救うことができれば、再びデータの復元が可能となりうる。即ち、ディスクアレイ装置3001の信頼性を向上させることが可能となる。
 ここで、ドライブ装置3004の性能について説明する。ドライブ装置3004は、レーザーダイオードの波長やノイズレベル差、伝送路特性差、ピックアップのレンズ精度等の装置を構成する要素の性能差や、フォーカス調整、チルト調整、球面収差調整、再生パワー制御等の装置の調整/制御誤差によっても再生信号の品質に差が発生する。上記のドライブ装置3004による再生信号の品質の差を再生性能差と呼ぶ。この為、複数のドライブ装置3004で、品質劣化が生じた同一の記録媒体3003を再生すると、個々のドライブ装置3004によって再生性能が異なるため、データの再生が可能なドライブ装置3004とデータの再生が不可能なドライブ装置3004とが存在する。
 次に、上記のドライブ装置3004の再生性能差を利用した動作の具体例を、図6を用いて説明する。上記図5で示したように、各ドライブ装置3004は、ドライブグループ1(3004-a-1、3004-b-1、3004-c-1)と、ドライブグループ2(3004-a-2、3004-b-2、3004-c-2)と、ドライブグループ3(3004-a-3、3004-b-3、3004-c-3)とに分けられて、それぞれのドライブグループにてRAIDを構成することが可能であるが、縦軸a、b、c列内での組み合わせの変更は可能であり、また、a、b、cの同じ縦軸内のみでグループを構成してもよい。
 また、実際には記録媒体3003のRAIDを構成しているグループ(3003-a-1、3003-b-1、3003-c-1)が、搬送装置3006-a、3006-b、3006-cによって、任意のドライブ装置3004に搬送され充填されることでRAID構成が構築される。
 ここで、記録媒体3003-a-1、3003-b-1、3003-c-1の3枚の中で2枚の記録媒体3003に障害が発生し、データ再生ができなくなった場合について説明する。このように、2枚以上の記録媒体3003に障害が発生した場合は、障害が発生した媒体グループ(パリティグループ)の記録媒体が装填されているドライブ装置とは異なるドライブ装置を用いて、データ再生を試みる。例えば、搬送装置3006-aによってドライブ装置3004-a-1から別のドライブ装置3004-a-2および3004-a-3に記録媒体3003を順次装填し、データを再生する。また、搬送装置3006-bによって、ドライブ装置3004-b-1から別のドライブ装置3004-b-2、3004-b-3に順次装填し、データを再生する。また、搬送装置3006-cによって、ドライブ装置3004-c-1から別のドライブ装置3004-c-2、3004-c-3に順次装填し、データを再生する。このようにすることで、2枚以上の記録媒体に障害が発生した場合においても、ドライブ装置3004の再生性能差を用いることで、記録媒体の経年劣化による信号品質の劣化にともなう障害の場合には、データの復元確率の向上を図ることが可能となる。
 更には、複数のドライブ装置3004を用いず、1台のドライブ装置3004でも、搬送装置3006によって記録媒体3003を搬送することによって、RAIDのグループを構成する記録媒体3003を順次再生することが可能であり、1台のドライブ装置3004が正常であればグループ内の全ての記録媒体3003を再生することが可能である。この場合、最後の記録媒体3003からのデータの再生が完了するまでに再生された他の記録媒体3003データは外部記憶装置(図示せず)に保存しておくものとする。
 表2は、本実施形態におけるデータ復元が可能な場合の一例を示す表である。表2は、ディスクアレイ装置3001の構成とすることによってデータ復元確率が向上することを示している。表2において、ドライブ装置3004の中で2台に障害があり、且つ、記録媒体3003の中で1枚に障害がある場合は、障害がないドライブ装置3004で障害がない記録媒体3003を全て再生することで、データ復元ができるため、“○”となる。表2において“△”は、ドライブ装置3004の性能差を利用することでデータ復元確率が向上した場合を示す。また、表2においては、説明を容易にするために、ドライブ装置3004のグループ1(3004-a-1、3004-b-1、3004-c-1)の場合のみを示している。
Figure JPOXMLDOC01-appb-T000002
 図2のディスクアレイ装置の構成では表1に示すように多くの場合にデータ復元が不可能となったが、本発明の構成により、1台のドライブ装置3004でもデータの復元が可能となり、また、ドライブ装置3004の再生性能差を利用することによって、表2に示すように多くの場合にデータ復元の確率の向上を図ることが可能となる。
 なお、本発明のディスクアレイ装置3001の構成では、記録媒体3003を3枚、ドライブ装置3004を9台用いていたが、4枚以上の記録媒体3003、10台以上のドライブ装置3004によって構成してもよい。
 以上のように、本実施形態のディスクアレイ装置は、着脱可能な複数枚の記録媒体と、複数の記録媒体を格納する収納装置と、各々の記録媒体が装填され、記録および再生を行う複数のドライブ装置と、収納装置とドライブ装置との間で記録媒体を搬送する複数の搬送装置と、複数のドライブ装置と複数の搬送装置を制御する制御装置とを有する。
 このとき、記録媒体3003は、所定の枚数の単位で媒体グループを形成する。また、媒体グループは、媒体グループに属する少なくとも1つの記録媒体のデータが再生できなくても、データの復元が可能な冗長度を有する。また、搬送装置は、任意の収納装置から記録媒体を取り出して、任意のドライブ装置に搬送することが可能である。
 本実施形態のディスクアレイ装置は、あるドライブ装置で記録媒体のデータ再生に失敗した場合には、搬送装置によって、データ再生に失敗した記録媒体を、データ再生に失敗したものとは異なるドライブ装置に搬送して、データ再生を試みる。
 以上の構成によって、RAID構成によって冗長された訂正限界を超える障害が発生した場合においても、データの再生を可能とする。例えば、記録媒体の2枚以上に障害が発生した場合においても、ドライブ装置3004の再生性能差を用いることで、記録媒体の経年劣化による信号品質の劣化にともなう障害の場合には、データの復元確率の向上を図ることが可能となる。
 ここで、ドライブ装置3004の性能情報を制御装置内の記憶メモリ(図示せず)に保持しておき、最も性能の良いドライブ装置3004で優先的に再生を行ってもよい。
 また、ドライブ装置3004自体も、経年劣化により装置を構成する各要素の特性が劣化したり、長年の応力による部品の歪や位置ズレによる装置の調整/制御誤差が大きくなる等によって再生性能が劣化するため、定期的にドライブ装置3004の性能を検査し、その結果を制御装置3002内の記憶メモリに保持してもよい。
 すなわち、本実施形態のディスクアレイ装置は、複数のドライブ装置の中から、再生性能の高いドライブ装置の識別情報を保持してもよい。このとき、データ再生に失敗したドライブ装置の記録媒体を、識別情報に合致するドライブ装置に搬送し、データ再生を試みてもよい。
 この検査に用いる記録媒体3003は、既に記録媒体3003に記録されているデータを各ドライブ装置3004で再生することから求めてもよいし、性能検査用の記録媒体3003を別途保持しておいて使用してもよい。
 ここで、ドライブ装置3004の再生性能を比較するための指標としては、変調度、ベータ、ジッタ、エラーレート、PRML信号処理方式を用いた場合に得られる2値化結果の誤り率と相関のある信号品質を示す指標等がある。
 更に上記の様にドライブ装置3004を交換することによってデータの再生が可能となった場合は、記録媒体3003に記録されているデータの品質が劣化していることが考えられる。特に、上述したように制御装置3002内の記憶メモリに保持しているドライブ装置3004の性能結果を参照すれば、データの再生が失敗した原因が、ドライブ装置3004の再生性能であるのか、記録媒体3003の信号品質であるのかの判断ができる。
 ここで、具体的な判断の方法を図10のフローチャートを用いて説明する。
 ドライブ劣化が原因か、記録媒体劣化が原因かの判断を開始後(S1001)、まず、他のドライブ装置3004に、再生エラーになった記録媒体を搬送して再生する(S1002)。そして、再生可能かどうかの判断を行う(S1003)。ここで、再生が不可能であった場合は、他の(複数の)ドライブ装置3004でも再生できないということになり、この場合は、記録媒体の劣化と判断する(S1004)。一方、再生可能であった場合は、ドライブ劣化と判断することができる(S1005)。
 ここで、ドライブが原因と判断する場合に、検査用の記録媒体3003等を使用する等して、ドライブ装置の性能を検査してもよい。その場合、より確実にドライブが原因であると判断できる。ここで、検査結果によって、ドライブ性能に問題ないとなった場合には、再生エラーは、外部からの衝撃等、別の原因で発生したものと判断することができる。また、S1002で他のドライブ装置で再生する前に、各ドライブ装置3004の性能を検査し、ドライブ装置が劣化しているかどうかの判断を行うことができる。その結果、記録媒体劣化なのか、別の原因なのかの判断が可能となる。
 なお、ドライブ劣化が原因か記録媒体劣化が原因かの判断手順は、図10に示す例に限られるものではなく、同様の効果が得られるものであればよい。
 その原因の切り分けの結果、記録媒体3003の信号品質に問題があると判断された場合、使用していない記録媒体3003、若しくは、予備の記録媒体3003に全てのデータを記録し直し、記録媒体3003を入れ替えることが望ましい。
 すなわち、本実施形態のディスクアレイ装置は、予備の記録媒体を更に有していてもよい。このとき、データ再生に失敗したドライブ装置から搬送された記録媒体のデータ再生に成功した場合、データ再生に失敗したドライブ装置から搬送された記録媒体の全てのデータを、予備の記録媒体に複製してもよい。
 また、本実施形態のディスクアレイ装置は、予備の記録媒体を更に有していてもよい。さらに、ドライブ装置は、記録媒体から再生される信号の品質を検出する検査部と、各々のドライブ装置に対する検査部の結果を保持する結果保持部と、結果保持部の結果を参照して、データ再生に失敗したドライブ装置の再生性能に問題があるか否かを判断する再生性能判断部とを有していてもよい。なお、制御装置3002が上記の検査部、結果保持部および再生性能判断部の機能を果たしてもよい。
 このとき、本実施形態のディスクアレイ装置は、データ再生に失敗したドライブ装置から搬送された記録媒体のデータ再生に成功し、再生性能判断部が再生性能に問題がないと判断した場合には、記録媒体の全てのデータを、予備の記録媒体に複製してもよい。
 なお、データが複製された予備の記録媒体を、データ再生に失敗したドライブ装置に装填し、記録または再生を行ってもよい。記録媒体が原因でデータ再生に失敗していた場合には、データ再生に失敗したドライブ装置に正常な予備の記録媒体を装填することで正常な記録または再生を行うことができるため、そのドライブ装置を再度利用することができる。
 この場合、入れ替えを行なった記録媒体3003は全く同一のデータとなり、ファイルの位置やセクタ情報(管理情報)も含めて、そのまま複製されているので、他の記録媒体3003のファイルシステムなど一切の更新を行わずにディスクアレイ装置を元の状態に復元することが可能となる。
 また、書換型の記録媒体の場合には、経年劣化によって記録マークが小さくなる等のマークの変化によってデータ再生ができなくなっていることもあるので、再生できたデータを同じ位置に上書きすることによっても信号品質が復活する。このようにして、改善された記録媒体によってディスクアレイ装置の信頼性向上が可能となる。
 すなわち、本実施形態のディスクアレイ装置は、データ再生に失敗したドライブ装置から搬送された記録媒体のデータ再生に成功した場合、データ再生に失敗したドライブ装置から搬送された記録媒体の全てのデータを、同じ記録媒体に上書きしてもよい。
 また、本実施形態のディスクアレイ装置は、記録媒体から再生される信号の品質を検出する検査部と、各々のドライブ装置に対する検査部の結果を保持する結果保持部と、結果保持部の結果を参照して、データ再生に失敗したドライブ装置の再生性能に問題があるか否かを判断する再生性能判断部とを有していてもよい。このとき、本実施形態のディスクアレイ装置は、データ再生に失敗したドライブ装置から搬送された記録媒体のデータ再生に成功し、再生性能判断部が再生性能に問題がないと判断した場合には、その記録媒体の全てのデータを、同じ記録媒体に上書きしてもよい。
 なお、データが上書された記録媒体を、データ再生に失敗したドライブ装置に装填し、記録または再生を行ってもよい。記録データの劣化が原因でデータ再生に失敗していた場合には、データ再生に失敗したドライブ装置に上書き後の記録媒体を装填することで正常な記録または再生を行うことができるため、そのドライブ装置を再度利用することができる。
 ここで、記録媒体の信号品質を確認する指標は、変調度、ベータ、ジッタ、エラーレート、PRML信号処理方式を用いた場合に得られる2値化結果の誤り率と相関のある信号品質を示す指標等である。
 相変化という現象を記録原理として用いた記録媒体3003において、その劣化の原因として、書き換えられた回数による劣化であるサイクル劣化と呼ばれるものがある。相変化する記録膜は、金属化合物を組成としており、結晶点および融点を越える温度を加えられた後、冷却する速度によって、結晶もしくはアモルファスになる。このような温度変化が、金属疲労に似た劣化を記録膜に与える。RAID4、RAID5、RAID6に共通で、ユーザデータの部分とパリティデータの部分とがあることは、既に述べた通りであるが、ユーザデータの部分に比べ、パリティデータの部分は書換え回数が多いという事実がある。一般的に、RAID4やRAID5を構成する場合、8つのユーザデータに、1つのパリティデータを付加する、といったように、ユーザデータの方の比率がずっと高い。ここで、8つのユーザデータを、D1、D2、D3、・・・、D8とし、1つのパリティデータをPとする。ユーザデータD1~D8のどれかが書き換わると、常にパリティデータPが書き換わる必要があるので、パリティデータPの書き換え回数が多くなるのである。
 ここで、表3にRAID4でのユーザデータの書き換え回数とパリティデータの書き換え回数の関係の一例を示す。表3では、RAIDのグループの8回の書き換えで、ユーザデータD1~D8がそれぞれ1回ずつ書き換えられた場合のパリティデータPの書き換え回数を示す。表3の例では、各ユーザデータD1~D8は1回の書き換えであるにも関わらず、パリティデータPは8回書き換えられる事になる。
Figure JPOXMLDOC01-appb-T000003
 このパリティデータPの書換え回数が多くなる事実を利用して、パリティデータPの劣化度合いを監視することで、ユーザデータD1~D8の劣化度合いを推定することが可能である。通常、記録媒体3003には、劣化した領域を交替するスペア領域が用意されている。パリティデータPが劣化して交替記録された回数が所定回数以上(例えば、ユーザデータとパリティデータの比の半分とか)になったら、同じストライプに属するユーザデータを検査して、上記の信号品質に対して幾分か閾値を厳しく(例えばエラーレートの閾値を通常の半分にする)して早めに交替記録することで、同じストライプに属する複数のユーザデータが一度に再生不能になる事態を回避することができる。このときの閾値はパリティデータPが交替記録された回数が所定回数未満の場合よりも厳しい閾値となる。
 本実施形態のディスクアレイ装置は、記録媒体から再生される信号の品質を検出する検査部を更に有していてもよい。このとき、検査部は、冗長度の為に付与されたパリティデータの交替記録回数が所定回数を超えた場合に、パリティデータと対を成すユーザデータの信号品質を検査し、通常よりも厳しい閾値で交替記録を行なってもよい。なお、ユーザデータの早めの交替記録の代わりに記録媒体3003の交換を行ってもよい。
 また、上述したように、ドライブ装置3004も、経年劣化する。例えば、記録媒体3003を回転させるスピンドルモータや、記録媒体3003から信号を読み書きするピックアップを動かすトラバースモータや、それらを支える機構部品とかも、動く回数が多いほど劣化し易い。これまで説明したようにRAID4の場合、パリティデータばかり記録されるパリティディスクがある。そのパリティディスクを頻繁に装着するパリティドライブがある。このパリティドライブはアクセス回数が多いという事実がある。例えば、外部の処理装置(図示せず)から、D2をD2’に書き換える命令を受けた場合、新しく生成されるべきパリティデータP’を求めるには、次の2つの方法がある。排他的論理和の演算子を+と表すこととすると、
 P’=D1+D2’+D3+D4+D5+D6+D7+D8
もしくは、
 P’=D2+D2’+P
の2つである。明らかに後者の方が、データの読み出し量もデータの演算量も少なく、性能が良くなる方法と分かる。つまり、パリティデータP’を求める方法として、後者の方法を用いるのが一般的である。
 従って、ユーザデータD1~D8の何れの書き換えの際にも、パリティデータPはアクセスされるので、パリティデータはアクセス回数が多くなる。つまり、パリティドライブ装置へのアクセス回数が多くなり、スピンドルモータやトラバースモータや関連する機構部品の劣化が早く進む。
 この事実を利用して、定期的なドライブ装置3004の性能検査を行なう上で、パリティドライブ装置を優先的に検査することが望ましいと云える。更に云うと、パリティ記録媒体を装着した回数や時間の長さで、性能検査する装置を選択してもよい。
 すなわち、本実施形態のディスクアレイ装置は、複数のドライブ装置の中から、再生性能の高いドライブ装置を検出する検出部を有していてもよい。このとき、検出部は、パリティデータの記録に用いられた頻度が高い、もしくはパリティデータの記録に用いられた時間が長いドライブ装置を、優先的に検査してもよい。
 上述のように、記録媒体3003の信号品質に問題がないにも関わらず、ドライブ装置3004の性能劣化が原因となることで、ディスクアレイ装置3001の信頼性の低下を引き起こしてしまう場合がある。そこで、上述のように定期的な再生性能の検査結果によって得られた再生性能が所定以下であった場合にはドライブ装置3004を予備のドライブ装置3004と自動的に交換することによって、ディスクアレイ装置3001の信頼性の向上させることが可能となる。
 すなわち、本実施形態のディスクアレイ装置は、予備のドライブ装置を有していてもよい。また、本実施形態のディスクアレイ装置は、記録媒体から再生される信号の品質を検出する検査部と、各々のドライブ装置に対する検査部の結果を保持する結果保持部と、結果保持部の結果を参照して、データ再生に失敗したドライブ装置の再生性能に問題があるか否かを判断する再生性能判断部とを更に有していてもよい。このとき、本実施形態のディスクアレイ装置は、再生性能判断部によって、データ再生に失敗したドライブ装置に問題があると判断された場合には、データ再生に失敗したドライブ装置を予備のドライブ装置と交換してもよい。
 また、予備のドライブ装置3004が無い、若しくは、既に使用されている場合においては、ディスクアレイ装置3001を構成している他のドライブ装置3004の中でデータ再生をしていないドライブ装置3004を制御装置3002によって探索し、探索されたドライブ装置3004を障害の発生したドライブ装置3004の代わりに使用することで、障害の発生したドライブ装置3004を正常なドライブ装置3004に交換されるまでの間、ディスクアレイ装置3001の信頼性、更には、可用性を高めることも可能となる。
 すなわち、本実施形態のディスクアレイ装置は、予備のドライブ装置と、ドライブ装置の稼働状況を探索する探索部を更に有していてもよい。このとき、予備のドライブ装置が既に使用されている場合には、データ再生に失敗したドライブ装置を稼動していないドライブ装置で代用してもよい。
 また、本実施形態のディスクアレイ装置は、記録媒体から再生される信号の品質を検出する検査部と、各々のドライブ装置に対する検査部の結果を保持する結果保持部と、結果保持部の結果を参照して、データ再生に失敗したドライブ装置の再生性能に問題があるか否かを判断する再生性能判断部と、を更に有していてもよい。このとき、本実施形態のディスクアレイ装置は、再生性能判断部によってデータ再生に失敗したドライブ装置に問題があると判断された場合には、データ再生に失敗したドライブ装置を稼動していないドライブ装置で代用してもよい。
 なお、ドライブ装置3004の再生性能の劣化の判断を行う基準は、上記のようにドライブ装置3004の再生性能が所定以下か否かであってもよい。
 すなわち、本実施形態のディスクアレイ装置において、再生性能判断部は、データ再生に失敗したドライブ装置の再生性能が、所定以下であった場合に、ドライブ装置に問題があると判断してもよい。
 または、最も再生性能の良いドライブ装置3004との再生性能差が所定以上になった場合にドライブ装置3004の再生性能が劣化したと判断してもよい。
 図7のフローチャートを用いてディスクアレイ装置3001の動作の一例を説明する。
 まず、ディスクアレイ装置の使用を開始する(S701)。次に、任意のRAIDで構築を行い(S702)、ディスクアレイ装置として記録・再生等の動作を行う。ここで、RAID構成はRAID4、RAID5、RAID6、等の任意の構成にすることが可能であり、また、構成を行うドライブ装置3004の台数は任意の台数で行うことが可能である。更には、実際にRAID構成を行うドライブ装置3004以外にも、予備のドライブ装置を備えておくことも可能である。そして、ディスクアレイ装置の使用中にデータ再生に失敗したかどうかの検出を行う(S703)。ここで、データ再生の失敗が発生していない場合は、そのまま動作を継続する。一方、データ再生に失敗した場合は、その失敗が、ドライブが原因なのか、記録媒体が原因なのかを判断する。ここでの判断は、前述の図10の様に行うことで可能となる。また、S704において、記録媒体が原因と判断した場合には、データの修復を行う(S705)。ここで、メディアデータの修復は、前述の様に、使用していない記録媒体3003や予備の記録媒体3003に全てのデータを記録して、記録媒体3003を入替えしてもよいし、部分的にデータが劣化している領域のデータのみを記録媒体3003の未使用領域や、交替記録用の領域に記録してもよい。ここで、データの修復において、データ再生に失敗した記録媒体を他のドライブ装置に搬送して再生することでドライブ性能差を用いてデータを再生できた場合は、その再生データを用いて修復し、他のドライブ装置3004でも再生できない場合は、RAIDのパリティ機能によって復元したデータを用いる事が可能である。
 一方、ドライブ装置が原因と判断した場合は、ドライブ装置3004が故障又は劣化しているかを判断する(S706)。ここで、故障でも劣化でも無いと判断された場合は、外部からの衝撃等、ドライブ要因以外の影響によってデータ再生を失敗したと判断して動作を継続する。一方、ドライブ装置3004の故障又は劣化と判断した場合は、ドライブ装置3004の交換作業を行う。まず、予備ドライブ装置の有無を検査する(S707)。予備ドライブ装置がある場合は、故障又は劣化したドライブ装置を予備ドライブ装置と入替えし(S708)、RAIDを再構築する(S702)。その後、故障又は劣化したドライブ装置をディスクアレイ装置外の新品のドライブ装置との交換を行い(S709)、ディスクアレイ装置の動作を継続する。ここで、S708は、故障又は劣化したドライブ装置に装填されている記録媒体3003を、予備ドライブ装置に搬送することであり、S709ではドライブ装置をディスクアレイ装置外の新規のドライブ装置に交換することを意味する。
 一方、予備ドライブが使用済みの為に存在しない場合や、元々、予備ドライブ装置を備えていない場合は、ディスクアレイ装置中のドライブ装置3004の使用状況を検索し(S710)、故障又は劣化したドライブ装置3004を未使用ドライブ装置と入替えする(S711)。ここでS711は、故障又は劣化したドライブ装置に装填されている記録媒体3003を、未使用のドライブ装置に搬送することである。S711で入替えしたドライブ装置3004を用いてRAIDの再構築を行う(S712)。ここで、S712でのRAID再構築は、故障又は劣化したドライブ装置を新規ドライブ装置に交換する(S713)まで、未使用ドライブ装置を用いて一時的に行うものである。よって、S713が実行されるまでに、一時的に使用していた未使用ドライブが、元々構成されていたRAIDによって使用される場合は、S710~S712を繰り返すことになる。また、未使用ドライブ装置が無い場合においては、故障又は劣化したドライブ装置3004が属していたRAID構成の他のドライブ装置3004に、故障又は劣化したドライブ装置に装填されていた記録媒体3003を搬送して再生を行うことも可能である。この場合は、1台のドライブ装置3004で複数の記録媒体3003を再生することになるので、再生したデータは外部記憶装置(図示せず)に保存しておくものとする。そして、S713での新規ドライブ装置との交換後に、S702によってRAIDの再構築を行う。
 なお、図7のフローチャートに示す動作は一例であり、本発明はこれに限られるものではなく、同様の効果が得られるものであればよい。
 また、使用を開始した時点でのドライブ装置3004の再生性能の情報を制御装置3002内の記憶メモリに保持しておき、定期的な再生性能の検査時のドライブ装置3004の再生性能が記憶メモリに保持されていた再生性能に対して、所定以上劣化した場合にドライブ装置3004の再生性能が劣化したと判断してもよい。すなわち、本実施形態のディスクアレイ装置において、再生性能判断部は、データ再生に失敗したドライブ装置の再生性能が、使用開始時の再生性能よりも所定以上劣化した場合に、ドライブに問題があると判断してもよい。
 なお、上記の制御装置3001内の記憶メモリに保持されているドライブ装置3004の性能情報や、検査用の記録媒体を用いて検査されたドライブ装置3004の使用開始時の再生性能に基づいて、任意の数のドライブ装置3004の中から、性能の良いドライブ装置3004の順に選択してRAIDの構成を行い、選択から外れたドライブ装置3004を予備のドライブ装置3004とするディスクアレイ装置3001の構成としてもよい。上記のように性能の良いドライブ装置3004を優先的に使用したRAID構成にすることによって、ディスクアレイ装置3001の信頼性をさらに高くすることが可能となる。
 なお、ドライブ装置3004の再生性能の劣化の判断を行う基準として、RAID構成に使用されているドライブ装置3004の再生性能が予備のドライブ装置3004の再生性能よりも低下した場合には、RAID構成に使用されているドライブ装置3004の再生性能が劣化したと判断して、予備のドライブ装置3004と交換してもよい。ここで、再生性能が劣化したと判断して交換したドライブ装置3004が所定の再生性能以上であれば、予備のドライブ装置3004として保持しておいてもよい。また、再生性能の劣化を判断するために対象とする再生性能の基準を、予備のドライブ装置3004の中で最も再生性能の良いドライブ装置3004の再生性能として、RAIDを構成するドライブ装置3004の交換を行うか否かを判断してもよい。上記のようにRAIDを構成するドライブ装置3004を交換するか否かの判断を、予備のドライブ装置3004の中で最も再生性能の良いドライブ装置3004の再生性能との比較によって判断することで、ディスクアレイ装置3001を構成するドライブ装置3004の中で特性の良いドライブ装置3004を優先的に使用したRAIDの構成となり、ディスクアレイ装置3001の信頼性を高い状態で保つことが可能となる。
 なお、ドライブ装置3004の性能が所定以下と判断された場合には、ディスクアレイ装置3001の構成外の新しいドライブ装置3004と交換を要求するものとする。例えば、LEDの点滅や液晶画面の表示によって、交換の要求を示してもよい。
 ここで、ドライブ装置3004の交換によって、ディスクアレイ装置3001に新しいドライブ装置3004が組み込まれた場合には、新たに組み込まれたドライブ装置3004の性能の検査を行い、その結果に基づいて、再生性能の良いドライブ装置3004を優先して使用するようにRAIDを再構成してもよい。
 ここで、図8のフローチャートを参照しながら、ディスクアレイ装置の動作の一例を説明する。ここで、図7と同様の内容の処理については、同じ参照符号を付し、同じ説明の繰り返しは省略する。
 図8において、ディスクアレイ装置の使用開始後(S701)、全ドライブ装置の性能を検査する(S801)。そして、性能の良いドライブ装置3004を優先してRAIDを構成し、全ドライブ装置の中で性能が悪い方のドライブ装置を予備ドライブとする(S802)。その後は、S707まで図7と同様の動作を行うため説明は省略する。
 S707で予備ドライブ装置が有ると判断した場合は、故障又は劣化したドライブ装置を予備ドライブ装置と入替えした後(S803)、S802でRAIDを再構成する。ここで、入替えを行う予備ドライブ装置が複数存在する場合には、予備ドライブ装置の中でも性能が最も良いドライブ装置と入替えを行う。その後、故障又は劣化したドライブ装置は新規ドライブ装置と交換し(S709)、新規ドライブ装置の性能検査を行った後(S805)、動作を継続する。ここで、新規ドライブ装置は、予備ドライブ装置となるが、次回、ドライブ装置の交換が発生した場合に、予備ドライブの中での性能順位を確認するために、性能検査を行う。
 一方、予備ドライブ装置が存在しない場合、S710でドライブ装置の使用状況を検索し、故障又は劣化したドライブ装置を未使用ドライブ装置と入替える(S804)。ここで、入替えを行う未使用ドライブ装置は、未使用ドライブ装置が複数ある場合は、最も性能が良いドライブ装置に入替えを行う。その後、S712、S713を実行した後、新規ドライブ装置の性能検査を行う(S806)。そして、S806での結果を用いて、RAIDを再構成する(S802)。
 図8の動作にすることによって、故障又は劣化したドライブ装置を予備ドライブ装置に交換する時には、予備ドライブの中で最も性能の良いドライブ装置を選択することが可能となる。
 なお、図8のフローチャートにしめす動作は一例であり、本発明はこれに限られるものではなく、同様の効果が得られるものであればよい。
 また、図9のフローチャートに示すように、ディスクアレイ装置を動作させてもよい。ここで、図7および8と同様の内容の処理については、同じ参照符号を付し、同じ説明の繰り返しは省略する。
 図9において、S704までは、図8と同様なので、説明は省略する。S704でドライブが原因だと判断した場合に、ドライブ故障であるかどうかを判断する(S901)。ドライブ故障で無い場合は、ドライブ性能が劣化であるかどうかを判断する(S902)。S902において、ドライブ性能が劣化しているかどうかを判断する。ここで、S902でのドライブ性能劣化の判断基準としては、S801や後述のS903で検査した性能に対して所定以上劣化した場合や、任意に定めた所定値以上になった場合とすることができる。よって、劣化していないと判断した場合は、劣化しているとの判断基準までの劣化でなくても、まったく劣化していないわけではなく、多少の劣化が発生している可能性がある。この場合は、RAIDを構成しているドライブ装置と予備ドライブ装置の性能が入替わる場合がある。その為、ドライブ性能劣化が発生していないと判断した場合は、S802によってRAIDを再構築する。
 そして、S901でドライブが故障していると判断した場合や、S902でドライブ性能が劣化していると判断した場合は、S707で予備ドライブ装置が存在するかどうかを判断する。その後、S709までの処理およびS713までの処理は、図8の場合と同様で有るので説明を省略する。S709またはS713の後は、新規ドライブ装置の性能を検査し(S903)、その後、S802によってRAIDを再構成する。
 図9の動作にすることによって、RAIDを構成しているドライブ装置3004は、常に性能の良いドライブ装置とすることが可能となる。
 ここで、S709、S713で新規ドライブに交換した後に、S801で全ドライブ装置の性能検査を行うようにすることも可能である。この場合、データ再生をしたドライブ装置3004以外のドライブ装置3004の経年劣化によるドライブ性能の変化にも対応でき、最新のドライブ装置3004の性能の順位でRAIDを構成することが可能となる。
 なお、図9のフローチャートに示す動作は一例であり、本発明はこれに限られるものではなく、同様の効果が得られるものであればよい。
 なお、記録されたデータの経年劣化による劣化量は、複数の記録層を持つメディアでは、記録層によって異なるため、データの再生が困難であった層以外のデータに関しては、上記の信号品質を検出し、所定以下であった場合にのみデータの上書きを行ってもよい。
 なお、記録されたデータは、記録されてからの経過時間によって劣化が進むため、劣化判定用に再生したデータが記録された時期よりも以前に記録されたデータのみを上書きしてもよいし、上記の信号品質を検出し、所定以下であった場合にのみ、データの上書きを行ってもよい。
 すなわち、本実施形態のディスクアレイ装置は、記録媒体から再生される信号の品質を検出する検査部を更に有していてもよい。このとき、本実施形態のディスクアレイ装置は、データ再生に失敗したドライブ装置から搬送された記録媒体のデータ再生に成功した場合には、記録媒体に記録されている所定のデータの記録品質を検査し、所定の品質以下のデータのみを上書き記録してもよい。
 なお、記録媒体は光ディスクであるとして上記の説明を行なってきたが、本発明は光ディスクに限定されない。例えば、記録媒体はフラッシュメモリ等の半導体メモリや磁気テープであってもよい。着脱可能な複数の記録媒体を用いてRAIDを構築する記憶装置に本発明は適用可能である。
 本発明にかかるディスクアレイ装置は、ドライブ装置の再生性能差を用いて記録媒体を再生する制御装置を有することで、耐障害性(信頼性)を高めることができ、アーカイブシステム等の用途にも応用できる。
1001、3001 ディスクアレイ装置
1002、3002 制御装置
1003、2003-a-1、2003-b-1、2003-c-1、3003-a-1~3003-a-4、3003-b-1~3003-b-4、3003-c-1~3003-c-4 記録媒体
1004、2004-a-1、2004-b-1、2004-c-1、3004-a-1~3004-a-4、3004-b-1~3004-b-4、3004-c-1~3004-c-4 ドライブ装置
1005、3005-a、3005-b、3005-c 収納装置
1006、3006-a、3006-b、3006-c 搬送装置

Claims (19)

  1.  着脱可能な複数の記録媒体を格納する収納装置と、
     前記記録媒体が装填され、データの記録および再生を行う複数のドライブ装置と、
     前記収納装置と前記ドライブ装置との間で前記記録媒体を搬送する複数の搬送装置と、
     前記ドライブ装置および前記搬送装置の動作を制御する制御装置と、
     を備えた記憶装置であって、
     前記記録媒体は、所定数の単位で媒体グループを形成し、
     前記媒体グループは、同じ媒体グループに属する少なくとも1つの記録媒体のデータが再生できなくても、データの復元が可能な冗長度を有し、
     前記搬送装置は、所望の前記収納装置から前記記録媒体を取り出して、所望の前記ドライブ装置に搬送することが可能であり、
     前記複数のドライブ装置には第1のドライブ装置および第2のドライブ装置が含まれており、
     第1のドライブ装置で前記記録媒体のデータ再生に失敗した場合、前記搬送装置は、データ再生に失敗した前記記録媒体を前記第1のドライブ装置とは異なる第2のドライブ装置に搬送し、データ再生に失敗した前記記録媒体からのデータ再生を前記第2のドライブ装置により試みる、記憶装置。
  2.  前記第2のドライブ装置は、前記第1のドライブ装置に装填されていた記録媒体と同じ媒体グループに属する記録媒体を装填していないドライブ装置である、請求項1に記載の記憶装置。
  3.  前記複数のドライブ装置のうちの再生性能の高いドライブ装置の識別情報を保持し、
     前記第2のドライブ装置は、前記識別情報に合致するドライブ装置である、請求項1に記載の記憶装置。
  4.  前記複数のドライブ装置の中から再生性能の高いドライブ装置を検出する検出部をさらに備える、請求項3に記載の記憶装置。
  5.  前記検出部は、パリティデータの記録に用いられた頻度が高いドライブ装置、またはパリティデータの記録に用いられた時間が長いドライブ装置を優先的に検査する、請求項4に記載の記憶装置。
  6.  予備の記録媒体をさらに備え、
     前記第2のドライブ装置により、前記第1のドライブ装置から搬送された前記記録媒体のデータ再生に成功した場合、前記第1のドライブ装置から搬送された前記記録媒体の全てのデータを前記予備の記録媒体に複製する、請求項1から5のいずれかに記載の記憶装置。
  7.  前記第2のドライブ装置により、前記第1のドライブ装置から搬送された前記記録媒体のデータ再生に成功した場合、前記第1のドライブ装置から搬送された前記記録媒体の全てのデータを同じ前記記録媒体に上書きする、請求項1から5のいずれかに記載の記憶装置。
  8.  前記記録媒体から再生される信号の品質を検出する検査部をさらに備え、
     前記第2のドライブ装置により、前記第1のドライブ装置から搬送された前記記録媒体のデータ再生に成功した場合、前記検査部は、前記第1のドライブ装置から搬送された前記記録媒体の記録データの信号品質を検査し、所定の品質以下のデータのみを同じ前記記録媒体に上書きする、請求項1から5のいずれかに記載の記憶装置。
  9.  前記第1のドライブ装置の再生性能に問題があるか否かを判断する再生性能判断部をさらに備える、請求項1から5のいずれかに記載の記憶装置。
  10.  前記第1のドライブ装置の再生性能に問題があるか否かを判断する再生性能判断部をさらに備え、
     前記第2のドライブ装置により、前記第1のドライブ装置から搬送された前記記録媒体のデータ再生に成功し、且つ、前記再生性能判断部が前記第1のドライブ装置の再生性能に問題がないと判断した場合、前記第1のドライブ装置から搬送された前記記録媒体の全てのデータを前記予備の記録媒体に複製する、請求項6に記載の記憶装置。
  11.  前記データが複製された前記予備の記録媒体を、前記第1のドライブ装置に装填し、記録または再生を行う、請求項6または10に記載の記憶装置。
  12.  前記第1のドライブ装置の再生性能に問題があるか否かを判断する再生性能判断部をさらに備え、
     前記第2のドライブ装置により、前記第1のドライブ装置から搬送された前記記録媒体のデータ再生に成功し、且つ、前記再生性能判断部が前記第1のドライブ装置の再生性能に問題がないと判断した場合、前記第1のドライブ装置から搬送された前記記録媒体の全てのデータを同じ前記記録媒体に上書きする、請求項1から5のいずれかに記載の記憶装置。
  13.  前記データが上書きされた前記記録媒体を、前記第1のドライブ装置に装填し、記録または再生を行う、請求項7、8および12のいずれかに記載の記憶装置。
  14.  前記記録媒体から再生される信号の品質を検出する検査部をさらに備え、
     パリティデータの交替記録回数が所定回数以上になった場合、前記検査部は前記パリティデータと対を成すユーザデータの信号品質を検査し、前記所定回数未満の場合よりも厳しい基準に基づいてユーザデータの交替記録を行なう、請求項1から5のいずれかに記載の記憶装置。
  15.  予備のドライブ装置をさらに備え、
     前記再生性能判断部によって前記第1のドライブ装置に問題があると判断された場合、前記第1のドライブ装置を前記予備のドライブ装置と交換する、請求項9に記載の記憶装置。
  16.  前記再生性能判断部は、前記第1のドライブ装置の再生性能が所定以下であった場合に前記第1のドライブ装置に問題があると判断する、請求項9または15に記載の記憶装置。
  17.  前記第1のドライブ装置の使用開始時の再生性能の検査結果を保持する結果保持部をさらに備え、
     前記再生性能判断部は、前記第1のドライブ装置の再生性能が、前記使用開始時の再生性能よりも所定以上劣化した場合に、前記第1のドライブに問題があると判断する、請求項9または15に記載の記憶装置。
  18.  前記複数のドライブ装置の稼働状況を探索する探索部をさらに備え、
     前記予備のドライブ装置が既に使用されていた場合には、前記第1のドライブ装置を稼動していない別のドライブ装置で代用する、請求項15から17のいずれかに記載の記憶装置。
  19.  前記複数のドライブ装置の稼働状況を探索する探索部をさらに備え、
     前記再生性能判断部によって前記第1のドライブ装置に問題があると判断された場合、前記第1のドライブ装置を稼動していない別のドライブ装置で代用する、請求項9に記載の記憶装置。
PCT/JP2012/000695 2011-02-04 2012-02-02 記憶装置 WO2012105260A1 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2012555761A JPWO2012105260A1 (ja) 2011-02-04 2012-02-02 記憶装置
US13/820,192 US20130166945A1 (en) 2011-02-04 2012-02-02 Storage device

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2011-022371 2011-02-04
JP2011022371 2011-02-04

Publications (1)

Publication Number Publication Date
WO2012105260A1 true WO2012105260A1 (ja) 2012-08-09

Family

ID=46602482

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2012/000695 WO2012105260A1 (ja) 2011-02-04 2012-02-02 記憶装置

Country Status (3)

Country Link
US (1) US20130166945A1 (ja)
JP (1) JPWO2012105260A1 (ja)
WO (1) WO2012105260A1 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014199578A (ja) * 2013-03-29 2014-10-23 富士通株式会社 ストレージ制御装置、ストレージ制御プログラム及びストレージ制御方法
US10042582B2 (en) 2015-08-28 2018-08-07 Panasonic Intellectual Property Management Co., Ltd. Data erasing method

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103959384A (zh) * 2012-10-01 2014-07-30 松下电器产业株式会社 信号质量信息修正装置、信号质量信息修正方法以及信息再生系统
JP2014186779A (ja) * 2013-03-25 2014-10-02 Hitachi-Lg Data Storage Inc データアーカイブシステムおよび品質検査方法
US9530442B1 (en) * 2015-09-23 2016-12-27 Western Digital Technologies, Inc. Enhanced low overhead data protection in data storage drives
US9952927B2 (en) * 2016-01-27 2018-04-24 Futurewei Technologies, Inc. Data protection for cold storage system

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08263226A (ja) * 1995-03-23 1996-10-11 Toshiba Corp 情報記憶装置
JPH10254639A (ja) 1997-03-14 1998-09-25 Hitachi Ltd 記憶装置システム
JPH10320132A (ja) * 1997-05-16 1998-12-04 Hitachi Ltd 情報記憶システムの制御方法および情報記憶システム
JP2003202965A (ja) * 2002-01-08 2003-07-18 Toshiba Corp コンピュータシステムおよび情報記録装置のメンテナンス支援方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08263226A (ja) * 1995-03-23 1996-10-11 Toshiba Corp 情報記憶装置
JPH10254639A (ja) 1997-03-14 1998-09-25 Hitachi Ltd 記憶装置システム
JPH10320132A (ja) * 1997-05-16 1998-12-04 Hitachi Ltd 情報記憶システムの制御方法および情報記憶システム
JP2003202965A (ja) * 2002-01-08 2003-07-18 Toshiba Corp コンピュータシステムおよび情報記録装置のメンテナンス支援方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014199578A (ja) * 2013-03-29 2014-10-23 富士通株式会社 ストレージ制御装置、ストレージ制御プログラム及びストレージ制御方法
US10042582B2 (en) 2015-08-28 2018-08-07 Panasonic Intellectual Property Management Co., Ltd. Data erasing method

Also Published As

Publication number Publication date
US20130166945A1 (en) 2013-06-27
JPWO2012105260A1 (ja) 2014-07-03

Similar Documents

Publication Publication Date Title
US10635537B2 (en) Raid data loss prevention
US7587631B2 (en) RAID controller, RAID system and control method for RAID controller
WO2012105260A1 (ja) 記憶装置
US20150012775A1 (en) Redundant array of independent disks (raid) system backup management
US9377969B2 (en) Information processing device, information processing method, and information storage medium, including storage of information indicating which medium among plural media has a recording failure area and a position in the medium of the recording failure area
US9740440B2 (en) Separating a hybrid asymmetric mix of a RAID 1 mirror and a parity-based RAID array
US20060077726A1 (en) Data transfer method, storage apparatus and computer-readable storage medium
US20050283654A1 (en) Method and apparatus for decreasing failed disk reconstruction time in a raid data storage system
US7992072B2 (en) Management of redundancy in data arrays
JP6867591B2 (ja) ストレージ制御装置、ストレージ制御方法およびストレージ制御プログラム
US20150347224A1 (en) Storage control apparatus and method therefor
JP2015138372A (ja) 書込検査プログラム,情報処理装置,及び書込検査方法
JP2006079219A (ja) ディスクアレイ制御装置およびディスクアレイ制御方法
US20130212428A1 (en) Information storage medium library array apparatus, information recording method and information recording program
JP2013054792A (ja) 追記型情報記録媒体、情報記録装置、情報再生装置、情報記録方法、および情報再生方法
JP4143040B2 (ja) ディスクアレイ制御装置、同装置に適用されるデータ欠損検出時の処理方法及びプログラム
JP2009151681A (ja) ディスクアレイ装置
JP6799752B2 (ja) 光ディスク装置、光ディスク読み出し方法
JP5914885B2 (ja) 記録再生装置および記録再生方法
US20130227217A1 (en) Archive system and processing method
JP4218636B2 (ja) 可搬メディアを収納する記憶装置
KR101048997B1 (ko) 디스크 어레이 기록 장치 및 그 기록 제어 방법
JP2010049394A (ja) 磁気ディスクの書き込み障害の検出と回復を行うディスクアレイシステム、方法およびプログラム
CN115565598A (zh) Raid阵列磁盘暂时失效的数据存储与修复方法及系统
JP3665921B2 (ja) アレイ型記憶装置およびアレイ型記憶管理方法

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 12742680

Country of ref document: EP

Kind code of ref document: A1

WWE Wipo information: entry into national phase

Ref document number: 2012555761

Country of ref document: JP

WWE Wipo information: entry into national phase

Ref document number: 13820192

Country of ref document: US

WWE Wipo information: entry into national phase

Ref document number: 2012742680

Country of ref document: EP

NENP Non-entry into the national phase

Ref country code: DE