WO2018193608A1 - Storage system, control method for storage device, and storage control device - Google Patents

Storage system, control method for storage device, and storage control device Download PDF

Info

Publication number
WO2018193608A1
WO2018193608A1 PCT/JP2017/015988 JP2017015988W WO2018193608A1 WO 2018193608 A1 WO2018193608 A1 WO 2018193608A1 JP 2017015988 W JP2017015988 W JP 2017015988W WO 2018193608 A1 WO2018193608 A1 WO 2018193608A1
Authority
WO
WIPO (PCT)
Prior art keywords
power consumption
restriction
drive
semiconductor drive
nonvolatile semiconductor
Prior art date
Application number
PCT/JP2017/015988
Other languages
French (fr)
Japanese (ja)
Inventor
征之 兒玉
昌弘 鶴谷
Original Assignee
株式会社日立製作所
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社日立製作所 filed Critical 株式会社日立製作所
Priority to PCT/JP2017/015988 priority Critical patent/WO2018193608A1/en
Publication of WO2018193608A1 publication Critical patent/WO2018193608A1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/28Supervision thereof, e.g. detecting power-supply failure by out of limits supervision
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F12/00Accessing, addressing or allocating within memory systems or architectures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Definitions

  • the present invention relates to a flash drive, a storage system including the flash drive, and a control method thereof.
  • Flash drives and SSDs (Solid State Drives) using NAND Flash Memory are becoming cheaper and larger in capacity due to higher integration of NAND Flash Memory.
  • HDD Hard Disk Drive
  • AFA All Flash Array
  • NAND Flash Memory has a feature that it consumes a large amount of power when performing Write.
  • power consumption and heat generation associated with the power increase.
  • the SSD has a feature of performing autonomous data movement (for example, garbage collection) within a NAND Flash Memory chip or between chips by a drive controller as an internal process. For this reason, the amount of writing to the NAND Flash Memory chip inside the SSD, that is, the power consumption cannot be controlled only by limiting the write amount by the storage controller of the AFA.
  • autonomous data movement for example, garbage collection
  • AFA has power restrictions due to the installation environment of power supply equipment and air conditioning equipment, power supply units that can be mounted, and cooling performance that discharges heat generated by power consumption. Therefore, by providing a power limiting system as in Patent Document 1 for an SSD mounted on an AFA in the past and performing a uniform power limitation on all SSDs in accordance with the amount of power of the mounted device, The power restrictions of AFA are observed.
  • Flash drives such as SSD can improve performance by increasing simultaneous access to NAND Flash Memory chip during Write.
  • the power consumption increases by increasing the number of simultaneous accesses, it is necessary to determine the upper limit of SSD power according to the storage system to be mounted and to limit the write performance according to the determined upper limit.
  • the power constraint on the SSD and the write processing of the storage controller are not linked, even if there is a power margin as an AFA, the write performance is uniformly affected by the power upper limit setting of the SSD itself. For this reason, the AFA has a problem in that the performance of the entire AFA is limited to the SSD in which the write is concentrated even though there is a power margin.
  • the present invention is a storage device including a storage device including a plurality of nonvolatile semiconductor drives, and a control device that includes a processor and a memory to control the storage device, and the processor includes the nonvolatile semiconductor drive And when the processor detects a non-volatile semiconductor drive whose write load exceeds a predetermined threshold, the processor selects the non-volatile semiconductor drive as a power consumption restriction relaxation target, and the processor Selects a non-volatile semiconductor drive that can allow a reduction in power consumption as a non-restricted target for power consumption, and the processor limits the power consumption. After reducing the power consumption of the nonvolatile semiconductor drive to be strengthened, Cost increases the power consumption of the power of the restriction relaxation target nonvolatile semiconductor drive.
  • FIG. 3 is a diagram illustrating a physical structure of a storage system and a configuration of a parity group according to an embodiment of this invention.
  • 5 is a flowchart illustrating an example of processing performed by the storage controller according to the embodiment of this invention. It is a figure which shows the Example of this invention and shows an example of an enclosure cooling state table.
  • FIG. 3 is a diagram showing an embodiment of the present invention and showing a physical structure of a storage system and a configuration of a parity group when a flash drive failure occurs. It is a figure which shows the Example of this invention and shows an example of the drive operation mode state table at the time of failure of a flash drive. It is a figure which shows the Example of this invention and shows an example of the drive operation mode state table during RAID structure reconstruction.
  • FIG. 1 is a block diagram showing an example of the storage system of the present invention.
  • FIG. 1 shows a configuration of a storage system in which a host 100 and a storage system 101 are connected.
  • the host 100 executes the application and issues commands such as Read and Write to the storage system 101.
  • the host 100 is a computer including an interface for connecting to the storage system 101, a CPU (Central Processing Unit), a memory, and the like.
  • a CPU Central Processing Unit
  • the storage system 101 includes a storage controller 102 and a drive enclosure 103.
  • the storage controller 102 has one or more controller units 104 mounted therein.
  • the controller unit 104 includes a front-end interface (FE I / F in the figure) 110, a CPU 111, a memory 112, a back-end interface (BE I / F in the figure) 113, and a control I / F 114.
  • FE I / F front-end interface
  • CPU 111 central processing unit
  • memory 112 a memory 112
  • BE I / F in the figure back-end interface
  • control I / F 114 a protocol such as FC (Fibre Channel) or IP can be adopted.
  • FC Fibre Channel
  • IP IP
  • SAS Serial Attached SCSI
  • NVMe Non-Volatile Memory Host Host Controller Interface
  • the drive enclosure 103 includes enclosure interfaces (ENC I / F in the figure) 120-1 and 120-2, power supply and fan units 121-1 and 121-2, and a plurality of flash drives (nonvolatile semiconductor drives) 122. Is done.
  • controller units 104-1 and 104-2 are each set to two.
  • enclosure interface (ENC I / F) 120-1 and 120-2 are each set to two.
  • power supply and fan units 121-1 and 121-2 are each set to two.
  • other configurations are possible.
  • a plurality of drive enclosures 103 can be connected to one storage controller 102.
  • the front-end interface (FE I / F) 110 of the storage controller 102 is connected to the host 100 via a network (not shown) and mediates communication with the host 100.
  • the CPU 111 executes various processes using each program, management information, etc. stored in the memory 112.
  • the CPUs 111 mounted on each controller unit 104 can communicate with each other to ensure data consistency and perform processing and data synchronization.
  • the memory 112 stores a program executed by the CPU 111, management information used by the program, and the like.
  • the memory 112 may be used for other purposes, such as storing a cache of data accessed by the host 100.
  • the memory 112 is known to be composed of SDRAM (Synchronous Dynamic Random Access Memory), but may be composed of memory elements other than those described above.
  • each controller unit 104 is connected to the flash drive 122 via the enclosure interface (ENC I / F) 120-1 and 120-2, and the CPU 111 accesses the flash drive 122. To mediate.
  • control I / F 114 of each controller unit 104 is connected to the power supply and fan unit 121 mounted on the drive enclosure 103 via enclosure interfaces 120-1 and 120-2, and mediates control of fan cooling performance.
  • the enclosure interface 120 mediates communication between the controller unit 104 and the power supply / fan unit 121 and the flash drive 122.
  • the communication performed by the control I / F 114 can be mediated by the back-end interface 113, the installation and communication of the control I / F 114 are not necessary.
  • the enclosure interface 120 is unnecessary in the configuration in which the back-end interface 113 of the controller unit 104 and the flash drive 122 can be directly connected.
  • the case where the storage controller 102 and the drive enclosure 103 are mounted as a single enclosure corresponds to the above case.
  • the power supply and fan unit 121 supplies power to the entire drive enclosure 103 and performs cooling to prevent temperature rise of the flash drive 122 by blowing air with an air cooling fan (not shown).
  • the air cooling fan included in the power supply and fan unit 121 functions as a cooling device.
  • the rotation speed of the air cooling fan can be controlled from the controller unit 104 via the control I / F 114 and the enclosure interface 120. It is assumed that a predetermined cooling performance equal to or less than the maximum cooling performance can be obtained by changing the rotation speed of the air cooling fan.
  • stepwise control of the rotation speed of the air cooling fan it is possible to implement stepwise control of the rotation speed of the air cooling fan.
  • the power supply and the fan unit 121 are not necessarily integrated, and may be separately mounted.
  • an example in which cooling is performed by an air cooling fan has been described.
  • any cooling device capable of controlling the cooling performance may be used.
  • a water cooling type cooling device may be employed.
  • the flash drive 122 is a device in which a NAND flash memory is mounted as a nonvolatile storage area.
  • the flash drive 122 may use a highly reliable technology such as RAID (Redundant Arrays of Independent Disks) by grouping a plurality of flash drives into units called parity groups.
  • RAID Redundant Arrays of Independent Disks
  • FIG. 2 is a block diagram showing programs and information stored in the memory 112 of the controller unit 104.
  • the memory 112 includes a storage control program 150 for controlling the flash drive 122 of the drive enclosure 103 as a storage device, a power performance optimization program 200, a write load monitoring program 201, an optimum power allocation calculation program 202, and drive operation.
  • a mode change notification program 203 and a cooling performance control program 204 are stored.
  • the memory 112 includes, as data used by the control program, an enclosure power upper limit table 210, an enclosure cooling capacity table 211, an enclosure cooling state table 212, an installed drive information table 220, and a parity group configuration information table 221.
  • the IO pattern learning table 222 and the drive operation mode state table 223 are also held. Note that the memory 112 may also hold control programs other than those described above, control data, and the like.
  • the storage control program 150 receives a read request or a write request from the host 100 and controls reading / writing of the flash drive 122 in the drive enclosure 103.
  • the power performance optimization program 200 links the write load monitoring program 201, the optimal power allocation calculation program 202, the drive operation mode change notification program 203, and the cooling performance control program 204 to optimize the power and performance of the storage system 101. Turn into.
  • the write load monitoring program 201 monitors the write processing load on each flash drive 122 and monitors the occurrence of bottlenecks.
  • the write processing load for example, IOPS (Input / Output Operations Per Second) of the Write command can be used.
  • the writing speed (MB / S) for each flash drive 122 may be used.
  • the write load monitoring program 201 measures IOPS (load information) for each flash drive 122, and determines that the load of the flash drive 122 in which the IOPS exceeds a preset first threshold is “high load”. Further, the write load monitoring program 201 treats the flash drive 122 determined to be “high load” as a bottleneck.
  • IOPS load information
  • the optimal power allocation calculation program 202 operates when a bottleneck is detected by the write load monitoring program 201. This program is based on the write load information of the flash drive 122, the number of flash drives 122 mounted in the drive enclosure 103, the operation mode set for each flash drive 122, and the upper limit of power supplied by the drive enclosure 103. In addition, it is determined whether or not the power distribution can be increased for the flash drive 122 that is a bottleneck.
  • the optimum power allocation calculation program 202 determines that it is possible to increase the distribution of power consumption to the bottleneck flash drive 122, as described later, the power consumption of the bottleneck flash drive 122 is increased.
  • the operation mode of the flash drive 122 is determined.
  • the operation mode of the flash drive 122 selects a mode ID that relaxes the restriction on power consumption.
  • the operation mode of the flash drive 122 to be reduced is determined in order to reduce the allocation of power consumption to the flash drive 122 that can reduce power consumption among the other flash drives 122.
  • a mode ID that strengthens the restriction on power consumption is selected.
  • the optimum power allocation calculation program 202 is a “medium load” drive in which Write processing IOPS is equal to or lower than the first threshold and equal to or higher than the second threshold as the flash drive 122 that reduces allocation of power consumption. Are selected for reduction. However, the second threshold value is smaller than the first threshold value.
  • the flash drive 122 that is the target of power consumption reduction may be a drive that does not have a problem in write performance even if power consumption is reduced.
  • the optimal power allocation calculation program 202 changes a drive whose write processing IOPS is equal to or lower than the first threshold among the flash drives 122 whose write load state 2234 is “high load” to “medium load”, The operation mode 2233 can be changed to “2” to reduce the allocated power consumption.
  • the drive operation mode change notification program 203 is actually used when the optimum power allocation calculation program 202 determines to change the allocation of power consumption for each flash drive 122 or when returning to the state before the change. To change the operation mode.
  • the cooling performance control program 204 determines whether or not the cooling performance has been changed when it is determined by the optimum power allocation calculation program 202 to change the power consumption allocation for each flash drive 122. In other words, the cooling performance control program 204 controls the power supply and the fan unit 121 to change the rotation speed of the fan when the fan rotation speed needs to be changed or when returning to the state before the change.
  • the CPU 111 operates as a functional unit that provides a predetermined function by processing according to each program.
  • the CPU 111 functions as a power performance optimization unit by performing processing according to the power performance optimization program 200.
  • the CPU 111 also operates as a function unit that provides each function of a plurality of processes executed by each program.
  • a computer and a computer system are an apparatus and a system including these functional units.
  • Information such as programs and tables for realizing each function of the controller unit 104 is stored in a storage subsystem, a nonvolatile semiconductor memory, a hard disk drive, a nonvolatile storage device such as an SSD, or a computer reading such as an IC card, an SD card, a DVD, etc. It can be stored on possible non-transitory data storage media.
  • FIGS. 3A to 3F show that the power performance optimization program 200, the write load monitoring program 201, the optimum power allocation calculation program 202, the drive operation mode change notification program 203, and the cooling performance control program 204 are operated. It is a figure which shows an example of the information used.
  • FIG. 3A is a diagram illustrating an example of the enclosure power upper limit table 210.
  • the enclosure power upper limit table 210 includes an enclosure ID 2101 for storing identification information of each drive enclosure 103, a chassis power upper limit 2102 set for each drive enclosure 103, and an upper limit value of power supplied to a single flash drive installed in the drive enclosure 103. Is included in one entry.
  • FIG. 1 shows an example in which the drive enclosure 103 is one, a plurality of drive enclosures 103 can be connected to the storage controller 102. For this reason, the drive enclosure 103 is specified by the enclosure ID 2101.
  • the housing power upper limit 2102 has been degraded due to a failure of the power source and fan unit 121-1 or 121-2 even when a plurality of power sources and fan units 121-1 and 121-2 are constantly supplied with power.
  • the upper limit value (maximum value) that can be supplied is shown.
  • the maximum supply power (maximum as a rating, not a momentary one) when a redundant power supply (two units) is adopted needs to be a power that can be supplied even during degeneration. .
  • the maximum supply power is the power that can be supplied by 2 units when one unit fails. In this case, the sum of 2 units is the maximum supply power. It becomes.
  • the information in the enclosure power upper limit table 210 is set in advance by a management computer or the like (not shown).
  • FIG. 3B is a diagram illustrating an example of the enclosure cooling capacity table 211.
  • the enclosure cooling capacity table 211 includes an enclosure ID 2111 for storing identification information of each drive enclosure 103, a maximum cooling performance 2112 for storing the maximum value of the cooling capacity set for each drive enclosure 103, and the cooling capacity of the drive enclosure 103.
  • the standard cooling performance 2113 for storing the rated value and the cooling function degeneration cooling performance 2114 for storing the cooling capability at the time of degeneration of the power supply and fan unit 121 when the power supply and fan unit 121 are made redundant are combined into one. Include in entry.
  • the maximum cooling performance 2112 indicates the cooling performance (W) when the cooling device including the redundant system is operated to the maximum out of the cooling performance of each drive enclosure 103.
  • the standard cooling performance 2113 indicates the cooling performance of the power supply and fan unit 121 in the standard load state.
  • the cooling performance 2114 when the cooling function is reduced indicates the maximum cooling performance when the redundant system is degenerated.
  • FIG. 3C is a diagram illustrating an example of the enclosure cooling state table 212.
  • the enclosure cooling state table 212 includes an enclosure ID 2121 that stores identification information of each drive enclosure 103, a cooling performance 2122 that indicates the cooling performance of each drive enclosure 103 that is currently connected to the controller unit 104, and the redundant system is degenerated.
  • One entry includes a cooling state degeneration presence / absence 2123 indicating whether or not there is.
  • the enclosure cooling state table 212 is periodically updated by the controller unit 104 and updated to the latest state.
  • FIG. 3D is a diagram illustrating an example of the mounted drive information table 220.
  • the mounted drive information table 220 includes an enclosure ID 2201 that stores an identifier of the drive enclosure 103 in which the flash drive 122 is mounted, a drive ID 2202 that stores an identifier for each flash drive 122, and an operation mode that can be changed by the flash drive 122.
  • Mode number 2203 for storing the number
  • mode 1 power 2204 for storing the power consumption (W) when the operation mode is 1
  • mode 1 write performance for storing the write performance (MB / s) when the operation mode is 1.
  • mode 2 power 2206 for storing power consumption (W) when the operation mode is 2
  • mode 2 write performance 2207 for storing write performance (MB / s) when the operation mode is 2
  • operation not shown Power consumption and writing when mode is 3 Including the performance to one of the entry.
  • the information in the mounted drive information table 220 is set in advance by a management computer (not shown) or the like.
  • FIG. 3E is a diagram illustrating an example of the parity group configuration information table 221.
  • the parity group configuration information table 221 holds the combination information of the flash drive 122 groups constituting the RAID as a combination of a drive ID and a parity group ID.
  • the parity group configuration information table 221 includes an enclosure ID 2211 that stores an identifier of the drive enclosure 103 in which the flash drive 122 is mounted, a drive ID 2212 that stores an identifier for each flash drive 122, and a parity group to which the flash drive 122 belongs.
  • One entry includes a parity group ID 2213 for storing an identifier and a power allocation change enable / disable flag 2214 for setting whether or not to change the allocation of power consumption.
  • a drive set as a spare drive so that availability can be maintained by changing the role of the flash drive 122 in which a failure has occurred can be identified as “SPARE” in the parity group ID 2213. Note that the mapping of SPARE with a specific parity group ID can be changed to a value suitable for each storage system.
  • the power allocation change enable / disable flag 2214 sets whether or not to allow a change in power allocation. If the power allocation change enable / disable flag 2214 is “permitted”, the power consumption change by the storage controller 102 is accepted, and if it is “no”, the power consumption change is rejected.
  • the flash drive 122 is used in RAID 5 or RAID 6 is shown, but the present invention is not limited to this.
  • the flash drives 122 can be managed by a group of storage areas instead of a parity group.
  • the IO pattern learning table 222 records or learns the data access history for each flash drive 122 or parity group 601 to 605.
  • history information to be recorded and information to be learned include access source host 100 information, access destination flash drive 122 information, access destination parity group information, access command information, and access frequency.
  • FIG. 3F is a diagram illustrating an example of the drive operation mode state table 223.
  • the drive operation mode state table 223 holds the operation status of the flash drive 122 currently mounted in each drive enclosure 103.
  • the drive operation mode state table 223 includes an enclosure ID 2231 that stores an identifier of the drive enclosure 103, a drive ID 2232 that stores an identifier for each flash drive 122, an operation mode 2233 that stores an operation mode for each flash drive 122, and a flash drive.
  • Each entry includes a write load state 2234 for storing a write load state for each 122.
  • the write load state for each flash drive 122 is high load if the above-mentioned IOPS exceeds the first threshold, medium load if the IOPS is below the first threshold, and exceeds the second threshold, and second If it is below this threshold value, it can be set as a low load.
  • the resolution of the write load does not necessarily need to be three stages of high load, medium load, and low load, and finer resolution can be adopted.
  • FIG. 4 is a block diagram showing an example of the configuration of the flash drive 122.
  • the flash drive 122 includes a disk interface (DISK I / F in the figure) 400, a drive controller 401, a memory 402, a plurality of flash memory access channels 403, and a plurality of flash memory chips 404.
  • the disk interface 400 is connected to the controller unit 104 via the enclosure interface 120 and the back-end interface 113.
  • the connection between the enclosure interface 120 and the back-end interface 113 is shown as an example of two systems for redundancy.
  • the drive controller 401 is a type of CPU that processes commands received from the disk interface 400.
  • the drive controller 401 executes the chip control program 420 stored in the memory 402, refers to the data, and executes various processes.
  • the memory 402 stores programs and data executed by the drive controller 401.
  • the memory 402 holds an operation mode change program 10, an operation mode table 411, and a chip control program 420.
  • the memory 402 may be used for storing other control programs and cache data.
  • the memory 402 can be composed of SDRAM (Synchronous Dynamic Random Access Memory), but may be composed of memory elements other than those described above.
  • the chip control program 420 processes a command received by the disk interface 400 and controls reading and writing to the flash memory chip 404.
  • the chip control program 420 controls autonomous data movement (for example, garbage collection and leveling of the number of writes) according to the storage status of valid data in the flash memory chip 404 and the number of rewrites.
  • autonomous data movement for example, garbage collection and leveling of the number of writes
  • the flash memory access channel 403 is a path for connecting the drive controller 401 and the flash memory chip 404 and accessing the drive controller 401.
  • the number of flash memory access channels 403 differs depending on the drive controller 401 to be used, and the larger the number, the more flash memory chips 404 can be connected. Also, by simultaneously activating a plurality of flash memory access channels 403, it becomes possible to access a plurality of flash memory chips 404 at the same time, improving performance while consuming a large amount of power during Write.
  • the flash memory chip 404 is a NAND flash memory chip connected to the drive controller 401 via the flash memory access channel 403, and stores actual data and the like. A plurality of flash memory chips 404 are connected to each flash memory access channel 403.
  • the operation mode change program 410 is a program stored in the memory 402 and executed by the drive controller 401.
  • the operation mode change program 410 changes the operation mode of the flash drive 122 in accordance with an instruction from the controller unit 104.
  • the operation mode of the flash drive 122 is stored in the operation mode table 411.
  • the operation mode table 411 is stored in the memory 402 and is referred to when the operation mode is changed by the operation mode change program 410.
  • Information included in the operation mode table 411 is collected by the controller unit 104 and set in the mounted drive information table 220.
  • FIG. 5 is a diagram illustrating an example of information held in the operation mode table 411.
  • the operation mode table 411 includes a mode ID 4111 that can be set in the flash drive 122, drive power consumption (W) 4112 in the operation mode, write performance (MB / s) 4113 in the operation mode, and flash memory at the time of writing.
  • Write multiplicity 4114 indicating the number of simultaneous accesses to the chip 404 is held as a combination of mode IDs.
  • the maximum value of power consumption is controlled by the write multiplicity 4114 indicating the number of simultaneous accesses to the flash memory chip 404 at the time of writing to the flash drive 122.
  • the mode ID 1
  • the number of simultaneous accesses to the flash memory chip 404 at the time of writing becomes 256, and the power consumption is maximized and the write performance is maximized.
  • the mode ID 3
  • the number of simultaneous accesses to the flash memory chip 404 at the time of writing is 64, and the power consumption is minimum and the writing performance is minimum.
  • mode ID 2
  • the number of simultaneous accesses to the flash memory chip 404 at the time of writing is 128, and the power consumption and the writing performance are intermediate values.
  • the flash drive 122 having a larger number of modes to be held than in FIG. 5 can be configured.
  • the performance information can be configured to include a range such as a minimum value or a maximum value. Further, the above information may be collected and used by the controller unit 104.
  • the mode ID (operation mode) 4111 of the flash drive 122 has been shown as an example of three stages, but can be changed by increasing or decreasing the write multiplicity classification to be written simultaneously.
  • the power consumption and the write performance are controlled in the operation mode of the flash drive 122 is shown, but the present invention is not limited to this.
  • the power consumption and write performance of the flash drive 122 may be controlled by the write multiplicity of the flash drive 122.
  • FIG. 6 is a diagram showing the physical structure of the storage system 101 and the structure of the parity group.
  • FIG. 6 shows an example in which the storage controller 102 and the drive enclosure 103 are mounted as different enclosures and connected by cables.
  • the enclosure controller 102 can be identified by setting the enclosure IDs so that they do not overlap.
  • 24 flash drives 122 are mounted on the drive enclosure 103, but it is not always necessary to mount all of them.
  • the configuration of these parity groups 601 to 605 is also shown as an example, and it is possible to adopt a different configuration or a configuration in which no parity group is set.
  • connection between the power supply and fan unit on the storage controller 102 side, the host 100, and the host 100 and the front end interface 110 is omitted.
  • FIG. 7 is a flowchart showing an example of processing performed by the storage controller.
  • a control method in the storage system 101 as illustrated in FIGS. 1 and 6, that is, processing of the power performance optimization program 200 will be described using flowcharts.
  • the power performance optimization program 200 and the like shown in this flowchart are loaded into the memory 112 and executed by the CPU 111 of the controller unit 104, but function as a part of the storage control program 150 that controls the entire storage system 101. Also good. This process is repeatedly executed.
  • the storage control program 150 that controls the entire storage system 101 calls the power performance optimization program 200 to start processing (700).
  • the power performance optimization program 200 detects the state of the power supply and the fan unit 121 mounted in the drive enclosure 103, and determines whether there is an abnormality such as degeneration of the cooling device (720). The power performance optimization program 200 proceeds to step 701 if degeneration has not occurred in the power source and fan unit 121, and proceeds to step 710 if degeneration has occurred.
  • the power performance optimization program 200 starts the write load monitoring program 201.
  • the write load monitoring program 201 detects the load (for example, IOPS) of the flash drive 122 mounted in the drive enclosure 103, and the bottleneck (load is detected) when the IOPS exceeds a preset first threshold. (Concentrated) device.
  • the write load monitoring program 201 detects the load of each flash drive 122 and calculates the load state in three stages (high load, medium load, and low load) from the first threshold and the second threshold as described above.
  • the drive operation mode state table 223 is updated.
  • the power performance optimization program 200 acquires the detection result of the write load monitoring program 201 and determines whether or not there is a flash drive 122 that is a bottleneck in the write process.
  • the power performance optimization program 200 proceeds to step 703 if the write processing load is concentrated and there is a flash drive 122 that is a bottleneck, and proceeds to step 710 if there is no bottleneck.
  • step 703 the power performance optimization program 200 activates the optimum power allocation calculation program 202.
  • the optimal power allocation calculation program 202 first reads the drive operation mode state table 223 and identifies the flash drive 122 with a high write load.
  • the optimum power allocation calculation program 202 relaxes the limitation on the power consumption of the flash drive 122 whose write load status 2234 of the drive operation mode status table 223 is “high load” and selects it as an increase target to increase the allocation of power consumption. .
  • the present invention is not limited to the above, and the parity group to which the flash drive 122 having a high write load belongs may be used as the flash drive 122 whose power consumption is to be increased.
  • the optimum power allocation calculation program 202 refers to the parity group configuration information table 221, and among the flash drives 122 in which the power allocation change enable / disable flag 2214 is set to “permitted”, the drive that can shift to the operation mode with low power consumption.
  • the flash drive 122 whose load state 2234 is “medium load” is selected as a power consumption reduction target (power consumption restriction enhancement target).
  • the optimal power allocation calculation program 202 selects the flash drive 122 whose load state 2234 is “medium load”. However, the optimal power allocation calculation program 202 refers to the IO pattern learning table 222, You may make it select as the flash drive 122 which lowers
  • the optimum power allocation calculation program 202 indicates that the number of flash drives 122 that can be changed to the low power consumption operation mode is the sum of the power consumption of the flash drives 122 to be increased in power consumption and the consumption of other flash drives 122.
  • the total sum of the powers only needs to be equal to or less than the chassis power upper limit 2102 of the enclosure power upper limit table 210.
  • the optimum power allocation calculation program 202 calculates the total power value, the value of the enclosure power upper limit 2102 obtained from the enclosure power upper limit table 210, and the value of the maximum cooling performance 2112 of the enclosure cooling capacity table 211. Each is compared to determine whether to change the power allocation.
  • the optimum power allocation calculation program 202 proceeds to step 705 in order to change the power allocation when the total power value is lower than both the value of the chassis power upper limit 2102 and the value of the maximum cooling performance 2112. On the other hand, if the total power value exceeds either the value of the chassis power upper limit 2102 or the value of the maximum cooling performance 2112, the optimum power allocation calculation program 202 prohibits the power allocation change and returns to step 720. Repeat the above process.
  • the optimum power allocation calculation program 202 does not use an operation mode in which the drive power consumption in the operation mode table 411 is larger than the single drive supply power upper limit 2103 in the enclosure power upper limit table 210.
  • step 705 the power performance optimization program 200 activates the drive operation mode change notification program 203 in order to change the operation mode of each flash drive 122.
  • the drive operation mode change notification program 203 updates the operation mode 2233 of the drive operation mode state table 223 for the flash drive 122 whose mode ID has been changed.
  • the power performance optimization program 200 starts the cooling performance control program 204.
  • the cooling performance control program 204 determines whether the cooling performance needs to be enhanced.
  • the cooling performance control program 204 refers to the cooling performance 2122 of the enclosure cooling state table 212 and strengthens the cooling performance 2122 if the total power value calculated by the optimum power allocation calculation program 202 exceeds the cooling performance 2122. Proceed to step 707.
  • the cooling performance control program 204 maintains the cooling performance 2122 and proceeds to step 708.
  • step 707 the cooling performance control program 204 increases the rotational speed of the cooling fan mounted on the power supply and fan unit 121. After the cooling fan rotation speed change is completed, the power performance optimization program 200 starts the drive operation mode change notification program 203 again. If the designed cooling performance exceeds all the modes of each flash drive 122, the cooling performance control program 204 and its reference information can be omitted.
  • the power (operation mode) allocated to the flash drive 122 by the series of processing in steps 701 to 708 is changed according to the write load status, and the write performance is changed by changing the operation mode of the flash drive 122 that has become a bottleneck. And the overall performance of the storage system 101 is improved.
  • the write load monitoring program 201 monitors whether the write load is concentrated on the specific flash drive 122 (702). If the load is not concentrated, the process proceeds to step 710.
  • step 710 the power performance optimization program 200 determines whether or not the power allocation of the flash drive 122 has been changed. If it has been changed, the process proceeds to step 711 to start processing for returning the operation mode.
  • step 710 determines that the power allocation has not been changed. If it is determined in step 710 that the power allocation has not been changed, the process returns to step 720 and the above processing is repeated. That is, when the cooling device is degenerated and the power consumption of the flash drive 122 is not changed, the power performance optimization program 200 prohibits the power consumption allocation change.
  • the drive operation mode change notification program 203 updates the operation mode 2233 of the drive operation mode state table 223 for the flash drive 122 whose mode ID has been changed.
  • the power performance optimization program 200 starts the cooling performance control program 204.
  • step 712 the cooling performance control program 204 refers to the enclosure cooling state table 212 and determines whether or not the cooling performance has been enhanced (changed). If the cooling performance is strengthened (changed), the process proceeds to step 713 and the cooling performance control program 204 changes the rotation speed of the cooling fan mounted on the power supply and fan unit 121 to the normal state.
  • the cooling performance control program 204 updates the cooling performance 2122 of the enclosure cooling state table 212 to a value corresponding to the rotational speed by reducing the rotational speed.
  • the cooling performance corresponding to the rotation speed of the cooling fan is set in advance.
  • the drive operation mode change notification program 203 updates the operation mode 2233 of the drive operation mode state table 223 for the flash drive 122 whose mode ID has been changed.
  • the power allocation state is optimized by performing the processing from 710 to 714. Then, control is performed so that the power supply and fan unit 121 can operate even in a degenerated state.
  • control in step 720 can be expanded, and for example, when the power supply and fan unit 121 is degenerated, all the flash drives 122 can be changed to a mode with less power consumption.
  • the maximum cooling performance of the power supply and fan unit 121 can be lowered, and the cost of the storage system 101 can be reduced by adopting a lower priced power supply and fan unit 121.
  • termination condition of the power performance optimization program 200 shown in this flowchart is not explicitly shown, but it is assumed that the termination is performed according to the termination condition of the program that controls the entire storage system.
  • FIG. 7 An example in which power optimization is performed according to the flowchart of the present invention shown in FIG. 7 will be described with reference to FIGS. 8A, 8B, 9A, and 9B.
  • FIG. 8A is a diagram illustrating an example of the enclosure cooling state table 212 before the power allocation is changed.
  • FIG. 8B is a diagram illustrating an example of the drive operation mode state table 223 before the power allocation is changed.
  • FIG. 9A is a diagram showing an example of the enclosure cooling state table 212 after the power allocation is changed.
  • FIG. 8B is a diagram showing an example of the drive operation mode state table 223 after the power allocation is changed.
  • the write load is concentrated on the parity group 2 (602), resulting in a high load and a bottleneck.
  • the parity group 1 (601), the parity group 3 (603), and the spare group (605) are in a low load state, and the parity group 4 (604) is in a medium load state.
  • FIG. 9A and FIG. 9B show the result of performing the power reallocation by the power performance optimization program 200 on the storage system 101 in this state.
  • the write load from the host 100 as shown in FIGS. 6, 8A, 8B, 9A, and 9B is predicted using the IO pattern learning table 222, and the power allocation is recalculated (703). In addition to the above, it can also be applied to the write processing generated by the storage controller 102 itself. A specific example is shown using FIG.
  • FIG. 10 is a diagram showing the physical structure of the storage system 101 and the configuration of the parity group when the flash drive 122 fails.
  • FIG. 11 shows the state of the flash drive 122 in FIG.
  • FIG. 11 is a diagram illustrating an example of a drive operation mode state table when a failure occurs in the flash drive.
  • Parity group 1 (degenerate) 601A is in a state where redundancy by RAID 5 is lost, and since one flash drive 122 of parity group 1 (active spare) 601B is added, the RAID configuration of storage controller 102 A rebuild is performed.
  • the data is read from the three flash drives 122 belonging to the parity group 1 (degenerate) 601A, the parity calculation is performed, and the calculation result is written to the flash drive 122 of the parity group 1 (active spare) 601B. .
  • Read is concentrated on the flash drive 122 of the parity group 1 (degenerate) 601A, while Write is concentrated on the flash drive 122 of the parity group 1 (active spare) 601B.
  • the power performance optimization program 200 including the processing shown in FIG. 7 of the present invention, the power of the storage system 101 can be optimized and the performance can be improved.
  • FIG. 12 is a diagram showing an example of a drive operation mode state table during reconstruction of a RAID configuration.
  • the operation mode of the flash drive 122 belonging to the parity group 1 (active spare) 601B is changed to the mode ID.
  • the rebuilding time of the RAID configuration can be greatly shortened.
  • parity group configuration information table 221 by having a plurality of power allocation change enable / disable flags, for example, in the case of data access from the host 100 and in the case of access such as RAID configuration reconstruction by the storage controller 102, respectively Implementations that change the range of power reallocation are also possible.
  • the storage controller 102 when the storage controller 102 detects the flash drive 122 in which writing is concentrated, the allocation of power consumption of the flash drive 122 with a low writing load is reduced.
  • the storage controller 102 can improve the performance of the entire storage system 101 within the range of power that can be supplied by increasing the power by relaxing the restriction on the power consumption of the flash drive 122 where writing is concentrated. .
  • the flash drive 122 in which writing is concentrated has a write load exceeding the first threshold value and is subject to power consumption restriction relaxation, and the flash drive 122 with a low writing load has a power consumption that can allow a reduction in power consumption. It is a target for power reduction (target for tightening restrictions).
  • the cooling performance can be increased, so that the flash drive 122 can be prevented from overheating and the performance of the flash drive 122 can be stabilized. it can.
  • the selection of the flash drive 122 whose power consumption is to be increased and the selection of the flash drive 122 whose power consumption is to be reduced are not limited to the above embodiment.
  • the operation mode may be set to “3” with all but the flash drive 122 whose power consumption is to be increased as the power consumption reduction target, depending on the balance between the performance required for the storage system 101 and the power consumption. Can be changed as appropriate.
  • the flash drive 122 employing the NAND flash memory as the nonvolatile semiconductor memory is shown as the nonvolatile semiconductor drive.
  • the present invention is not limited to this example. Therefore, the present invention can be applied to a nonvolatile semiconductor drive in which power consumption increases with the increase of.
  • this invention is not limited to the above-mentioned Example, Various modifications are included.
  • the above-described embodiments are described in detail for easy understanding of the present invention, and are not necessarily limited to those having all the configurations described.
  • a part of the configuration of one embodiment can be replaced with the configuration of another embodiment, and the configuration of another embodiment can be added to the configuration of one embodiment.
  • any of the additions, deletions, or substitutions of other configurations can be applied to a part of the configuration of each embodiment, either alone or in combination.
  • each of the above-described configurations, functions, processing units, processing means, and the like may be realized by hardware by designing a part or all of them with, for example, an integrated circuit.
  • each of the above-described configurations, functions, and the like may be realized by software by the processor interpreting and executing a program that realizes each function.
  • Information such as programs, tables, and files that realize each function can be stored in a memory, a hard disk, a recording device such as an SSD (Solid State Drive), or a recording medium such as an IC card, an SD card, or a DVD.
  • control lines and information lines indicate what is considered necessary for the explanation, and not all the control lines and information lines on the product are necessarily shown. Actually, it may be considered that almost all the components are connected to each other.

Abstract

Provided is a storage device having a storage device including a plurality of nonvolatile semiconductor drives and a control device which includes a processor and a memory and controls the storage device. The processor measures a drive write load of each of the nonvolatile semiconductor drives, selects, in the case where a nonvolatile semiconductor drive, the write load of which exceeds a predetermined threshold value is detected, the nonvolatile semiconductor drive as a drive to be subjected to relaxation of restriction on power consumption, and selects, from among the nonvolatile semiconductor drives except the drive to be subjected to the relaxation of the restriction on the power consumption, a nonvolatile semiconductor drive capable of accepting a reduction in power consumption as a drive to be subjected to strengthening of restriction on power consumption. After the power consumption of the nonvolatile semiconductor drive to be subjected to the strengthening of the restriction on the power consumption is reduced, the processor increases the power consumption of the nonvolatile semiconductor drive to be subjected to the relaxation of the restriction on the power consumption.

Description

ストレージシステム、ストレージ装置の制御方法およびストレージ制御装置Storage system, storage device control method, and storage control device
 本発明は、フラッシュドライブおよびフラッシュドライブからなるストレージシステムおよびその制御方法に関する。 The present invention relates to a flash drive, a storage system including the flash drive, and a control method thereof.
 NAND Flash Memoryを利用したフラッシュドライブ、SSD(Solid State Drive)は、NAND Flash Memoryの高集積化により低価格化、大容量化が進んでいる。これにより、従来HDD(Hard Disk Drive)を使用していたストレージシステムでもHDDの代わりにSSDを搭載する製品が登場している。 Flash drives and SSDs (Solid State Drives) using NAND Flash Memory are becoming cheaper and larger in capacity due to higher integration of NAND Flash Memory. As a result, even in a storage system that conventionally uses an HDD (Hard Disk Drive), a product in which an SSD is installed instead of the HDD has appeared.
 特に、すべてのドライブをSSDにより構成したストレージ製品は、AFA(All Flash Array)と呼ばれるが、これらの製品でも多数のSSDを搭載した製品が登場している。これらのAFAでは、SSDに対しても高い性能が要求されるため、SSDは性能を向上させるために、複数のNAND Flash Memoryチップへ同時にアクセスを行っている。 In particular, storage products in which all drives are configured with SSDs are called AFA (All Flash Array), but these products are also equipped with a large number of SSDs. Since these AFAs require high performance for SSDs, SSDs simultaneously access a plurality of NAND Flash Memory chips in order to improve performance.
 NAND Flash Memoryは、従来のHDD等と異なり、Writeを行う際に大きな電力を消費するという特徴を有するが、上述のように同時アクセス数が大きくなるほど消費電力と、電力に伴う発熱が大きくなる。 Unlike the conventional HDD, NAND Flash Memory has a feature that it consumes a large amount of power when performing Write. However, as the number of simultaneous accesses increases as described above, power consumption and heat generation associated with the power increase.
 また、SSDは内部の処理としてドライブコントローラによるNAND Flash Memoryチップ内やチップ間での自律的なデータ移動(例えば、ガベージコレクション)を行うという特徴を有している。このため、AFAのストレージコントローラによるWrite量の制限のみでは、SSD内部のNAND Flash Memoryチップへの書込み量、すなわち消費電力を制御することができない。 In addition, the SSD has a feature of performing autonomous data movement (for example, garbage collection) within a NAND Flash Memory chip or between chips by a drive controller as an internal process. For this reason, the amount of writing to the NAND Flash Memory chip inside the SSD, that is, the power consumption cannot be controlled only by limiting the write amount by the storage controller of the AFA.
 しかしながら、AFAには電源設備や空調設備等の設置環境や搭載可能な電源ユニットや、電力消費によって発生した熱を排出する冷却性能などに起因する電力的な制約が存在する。そのため、従来はAFAに搭載するSSDに対し、特許文献1のような電力的制限システムを設け、搭載する装置の電力量に合わせて、全てのSSDに対して一律の電力制限を行うことで、AFAの電力的な制約を守っている。 However, AFA has power restrictions due to the installation environment of power supply equipment and air conditioning equipment, power supply units that can be mounted, and cooling performance that discharges heat generated by power consumption. Therefore, by providing a power limiting system as in Patent Document 1 for an SSD mounted on an AFA in the past and performing a uniform power limitation on all SSDs in accordance with the amount of power of the mounted device, The power restrictions of AFA are observed.
特開2016-212580号公報JP 2016-212580 A
 SSDなどのフラッシュドライブは、Write時のNAND Flash Memoryチップへの同時アクセスを増やすことにより性能を向上することができる。しかし、同時アクセス数を増やすことにより消費電力も増大するため、搭載するストレージシステムによって、SSDの電力的な上限を決め、決定された上限に従ってWrite性能を制限する必要がある。 Flash drives such as SSD can improve performance by increasing simultaneous access to NAND Flash Memory chip during Write. However, since the power consumption increases by increasing the number of simultaneous accesses, it is necessary to determine the upper limit of SSD power according to the storage system to be mounted and to limit the write performance according to the determined upper limit.
 上記従来例のAFAでは、搭載するSSDに対して一律に電力の制限を行っているが、通常の運用において、全てのSSDに対して最大性能でWriteが行われることは稀である。 In the above-described conventional AFA, power is uniformly limited for the mounted SSD, but in normal operation, writing is rarely performed with the maximum performance for all SSDs.
 しかしながら、SSDへの電力制約と、ストレージコントローラのWrite処理とは連動していないため、AFAとして電力的に余裕があったとしても、SSD自体の電力上限設定によりWrite性能も一律に影響を受ける。そのため、AFAとしては電力的には余裕があるにも関わらず、Writeが集中したSSDにAFA全体の性能が制限されてしまうという課題があった。 However, since the power constraint on the SSD and the write processing of the storage controller are not linked, even if there is a power margin as an AFA, the write performance is uniformly affected by the power upper limit setting of the SSD itself. For this reason, the AFA has a problem in that the performance of the entire AFA is limited to the SSD in which the write is concentrated even though there is a power margin.
 本発明は、複数の不揮発性半導体ドライブを含むストレージ装置と、プロセッサとメモリとを含んで前記ストレージ装置を制御する制御装置と、を有するストレージ装置であって、前記プロセッサは、前記不揮発性半導体ドライブの書き込み負荷をそれぞれ測定し、前記プロセッサは、前記書き込み負荷が所定の閾値を超える不揮発性半導体ドライブを検出した場合には、当該不揮発性半導体ドライブを消費電力の制限緩和対象として選択し、前記プロセッサは、前記消費電力の制限緩和対象以外の不揮発性半導体ドライブのうち、消費電力の低下を許容可能な不揮発性半導体ドライブを消費電力の制限強化対象として選択し、前記プロセッサは、前記消費電力の制限強化対象の不揮発性半導体ドライブの消費電力を低下させた後に、前記消費電力の制限緩和対象の不揮発性半導体ドライブの消費電力を増大させる。 The present invention is a storage device including a storage device including a plurality of nonvolatile semiconductor drives, and a control device that includes a processor and a memory to control the storage device, and the processor includes the nonvolatile semiconductor drive And when the processor detects a non-volatile semiconductor drive whose write load exceeds a predetermined threshold, the processor selects the non-volatile semiconductor drive as a power consumption restriction relaxation target, and the processor Selects a non-volatile semiconductor drive that can allow a reduction in power consumption as a non-restricted target for power consumption, and the processor limits the power consumption. After reducing the power consumption of the nonvolatile semiconductor drive to be strengthened, Cost increases the power consumption of the power of the restriction relaxation target nonvolatile semiconductor drive.
 ストレージシステムの書き込み量および供給可能な電力の上限に合わせて、不揮発性半導体ドライブの電力を最適化することにより、ストレージシステム全体の書き込み性能を向上させることが可能となる。 It is possible to improve the write performance of the entire storage system by optimizing the power of the nonvolatile semiconductor drive according to the upper limit of the write amount of the storage system and the power that can be supplied.
本発明の実施例を示し、ストレージシステムの一例を示すブロック図である。It is a block diagram which shows the Example of this invention and shows an example of a storage system. 本発明の実施例を示し、ストレージコントローラのメモリに格納されるプログラムおよびデータの一例を示すブロック図である。It is a block diagram which shows the Example of this invention and shows an example of the program and data which are stored in the memory of a storage controller. 本発明の実施例を示し、エンクロージャ電力上限テーブルの一例を示す図である。It is a figure which shows the Example of this invention and shows an example of an enclosure electric power upper limit table. 本発明の実施例を示し、エンクロージャ冷却能力テーブルの一例を示す図である。It is a figure which shows the Example of this invention and shows an example of an enclosure cooling capacity table. 本発明の実施例を示し、エンクロージャ冷却状態テーブルの一例を示す図である。It is a figure which shows the Example of this invention and shows an example of an enclosure cooling state table. 本発明の実施例を示し、搭載ドライブ情報テーブルの一例を示す図である。It is a figure which shows the Example of this invention and shows an example of the mounted drive information table. 本発明の実施例を示し、パリティグループ構成情報テーブルの一例を示す図である。It is a figure which shows the Example of this invention and shows an example of a parity group structure information table. 本発明の実施例を示し、ドライブ稼働モード状態テーブルの一例を示す図であるIt is a figure which shows the Example of this invention and shows an example of a drive operation mode state table. 本発明の実施例を示し、フラッシュドライブの構成の一例を示すブロック図である。It is a block diagram which shows the Example of this invention and shows an example of a structure of a flash drive. 本発明の実施例を示し、フラッシュドライブのメモリに格納される稼働モードテーブルの一例を示す図である。It is a figure which shows the Example of this invention and shows an example of the operation mode table stored in the memory of a flash drive. 本発明の実施例を示し、ストレージシステムの物理的構造とパリティグループの構成を示す図である。FIG. 3 is a diagram illustrating a physical structure of a storage system and a configuration of a parity group according to an embodiment of this invention. 本発明の実施例を示し、ストレージコントローラで行われる処理の一例を示すフローチャートである。5 is a flowchart illustrating an example of processing performed by the storage controller according to the embodiment of this invention. 本発明の実施例を示し、エンクロージャ冷却状態テーブルの一例を示す図である。It is a figure which shows the Example of this invention and shows an example of an enclosure cooling state table. 本発明の実施例を示し、ドライブ稼働モード状態テーブルの一例を示す図である。It is a figure which shows the Example of this invention and shows an example of a drive operation mode state table. 本発明の実施例を示し、稼働モードを変更した後のエンクロージャ冷却状態テーブルの一例を示す図である。It is a figure which shows an Example of this invention and shows an example of the enclosure cooling state table after changing the operation mode. 本発明の実施例を示し、稼働モードを変更した後のドライブ稼働モード状態テーブルの一例を示す図である。It is a figure which shows an Example of this invention and shows an example of the drive operation mode state table after changing an operation mode. 本発明の実施例を示し、フラッシュドライブの故障発生時のストレージシステムの物理的構造とパリティグループの構成を示す図である。FIG. 3 is a diagram showing an embodiment of the present invention and showing a physical structure of a storage system and a configuration of a parity group when a flash drive failure occurs. 本発明の実施例を示し、フラッシュドライブの故障発生時のドライブ稼働モード状態テーブルの一例を示す図である。It is a figure which shows the Example of this invention and shows an example of the drive operation mode state table at the time of failure of a flash drive. 本発明の実施例を示し、RAID構成再構築中のドライブ稼働モード状態テーブルの一例を示す図である。It is a figure which shows the Example of this invention and shows an example of the drive operation mode state table during RAID structure reconstruction.
 以下、本発明の一実施形態について添付図面を用いて説明する。 Hereinafter, an embodiment of the present invention will be described with reference to the accompanying drawings.
 図1は、本発明のストレージシステムの一例を示すブロック図である。図1はホスト100とストレージシステム101を接続したストレージシステムの構成を示している。 FIG. 1 is a block diagram showing an example of the storage system of the present invention. FIG. 1 shows a configuration of a storage system in which a host 100 and a storage system 101 are connected.
 ホスト100はアプリケーションを実行し、ストレージシステム101に対してReadや、Writeなどのコマンドを発行する。なお、図示は省略するが、ホスト100はストレージシステム101と接続するためのインタフェースと、CPU(Central Processing Unit)及びメモリなどを含む計算機である。 The host 100 executes the application and issues commands such as Read and Write to the storage system 101. Although not shown, the host 100 is a computer including an interface for connecting to the storage system 101, a CPU (Central Processing Unit), a memory, and the like.
 ストレージシステム101は、ストレージコントローラ102とドライブエンクロージャ103から構成される。ストレージコントローラ102は、内部にコントローラユニット104を1つ以上搭載する。 The storage system 101 includes a storage controller 102 and a drive enclosure 103. The storage controller 102 has one or more controller units 104 mounted therein.
 図示の例では2つのコントローラユニット104-1、104-2で構成される。以下の説明ではコントローラユニットを特定しない場合には「-」以降を省略した符号「104」を用いる。なお、他の構成要素の符号についても同様である。 In the example shown in the figure, it is composed of two controller units 104-1 and 104-2. In the following description, when the controller unit is not specified, the symbol “104” in which “−” and the subsequent parts are omitted is used. The same applies to the reference numerals of other components.
 コントローラユニット104は、フロントエンドインタフェース(図中FE I/F)110と、CPU111と、メモリ112と、バックエンドインタフェース(図中BE I/F)113及び制御I/F114を有する。フロントエンドインタフェース110としては、FC(Fibre Channel)やIP等のプロトコルを採用することができる。また、バックエンドインタフェース113としては、SAS(Serial Attached SCSI)やNVMe(Non-Volatile Memory Host Controller Interface)を採用することができる。 The controller unit 104 includes a front-end interface (FE I / F in the figure) 110, a CPU 111, a memory 112, a back-end interface (BE I / F in the figure) 113, and a control I / F 114. As the front end interface 110, a protocol such as FC (Fibre Channel) or IP can be adopted. As the back-end interface 113, SAS (Serial Attached SCSI) or NVMe (Non-Volatile Memory Host Host Controller Interface) can be employed.
 ドライブエンクロージャ103は、エンクロージャインタフェース(図中ENC I/F)120-1、120-2と、電源およびファンユニット121-1、121-2と、複数のフラッシュドライブ(不揮発性半導体ドライブ)122から構成される。 The drive enclosure 103 includes enclosure interfaces (ENC I / F in the figure) 120-1 and 120-2, power supply and fan units 121-1 and 121-2, and a plurality of flash drives (nonvolatile semiconductor drives) 122. Is done.
 本実施例では冗長化のためにコントローラユニット104-1、104-2と、エンクロージャインタフェース(ENC I/F)120-1、120-2、電源およびファンユニット121-1、121-2をそれぞれ2つ搭載した構成を例としているが、上記以外の構成も可能である。 In this embodiment, for redundancy, controller units 104-1 and 104-2, enclosure interface (ENC I / F) 120-1 and 120-2, power supply and fan units 121-1 and 121-2 are each set to two. However, other configurations are possible.
 またフラッシュドライブ122についても、搭載台数を変更可能である。また、ドライブエンクロージャ103は、1つのストレージコントローラ102に対して複数接続することも可能である。 Also, the number of mounted flash drives 122 can be changed. A plurality of drive enclosures 103 can be connected to one storage controller 102.
 ストレージコントローラ102のフロントエンドインタフェース(FE I/F)110は、ホスト100とネットワーク(図示省略)を介して接続され、ホスト100との通信を仲介する。 The front-end interface (FE I / F) 110 of the storage controller 102 is connected to the host 100 via a network (not shown) and mediates communication with the host 100.
 CPU111はメモリ112に格納された各プログラム、管理情報等を使用して、各種処理を実行する。また、各コントローラユニット104に搭載するCPU111は相互に通信し、データの一貫性を確保したり、処理やデータの同期を行うことができる。 The CPU 111 executes various processes using each program, management information, etc. stored in the memory 112. In addition, the CPUs 111 mounted on each controller unit 104 can communicate with each other to ensure data consistency and perform processing and data synchronization.
 メモリ112は、CPU111が実行するプログラムや、プログラムが使用する管理情報等を格納する。このメモリ112には、その他の情報、例えばホスト100がアクセスするデータのキャッシュを格納するなどの用途に使用してもよい。 The memory 112 stores a program executed by the CPU 111, management information used by the program, and the like. The memory 112 may be used for other purposes, such as storing a cache of data accessed by the host 100.
 また、メモリ112は、SDRAM(Synchronous Dynamic Random Access Memory)で構成されることが知られているが、上記以外の記憶素子で構成されてもよい。 The memory 112 is known to be composed of SDRAM (Synchronous Dynamic Random Access Memory), but may be composed of memory elements other than those described above.
 各コントローラユニット104のバックエンドインタフェース(BE I/F)113は、エンクロージャインタフェース(ENC I/F)120-1、120-2を介してフラッシュドライブ122と接続され、CPU111がフラッシュドライブ122へアクセスするのを仲介する。 The back-end interface (BE I / F) 113 of each controller unit 104 is connected to the flash drive 122 via the enclosure interface (ENC I / F) 120-1 and 120-2, and the CPU 111 accesses the flash drive 122. To mediate.
 各コントローラユニット104の制御I/F114は、ドライブエンクロージャ103に搭載される電源およびファンユニット121に対してエンクロージャインタフェース120-1、120-2を介して接続され、ファン冷却性能の制御を仲介する。 The control I / F 114 of each controller unit 104 is connected to the power supply and fan unit 121 mounted on the drive enclosure 103 via enclosure interfaces 120-1 and 120-2, and mediates control of fan cooling performance.
 エンクロージャインタフェース120は、コントローラユニット104と電源およびファンユニット121、フラッシュドライブ122との通信を仲介する。なお、制御I/F114で行う通信がバックエンドインタフェース113にて仲介できる場合は、制御I/F114の搭載と通信は不要である。また、コントローラユニット104のバックエンドインタフェース113とフラッシュドライブ122を直接接続できるような構成では、エンクロージャインタフェース120は不要である。例えばストレージコントローラ102とドライブエンクロージャ103を単一筺体として実装するような場合が上記のケースに該当する。 The enclosure interface 120 mediates communication between the controller unit 104 and the power supply / fan unit 121 and the flash drive 122. In addition, when the communication performed by the control I / F 114 can be mediated by the back-end interface 113, the installation and communication of the control I / F 114 are not necessary. Further, the enclosure interface 120 is unnecessary in the configuration in which the back-end interface 113 of the controller unit 104 and the flash drive 122 can be directly connected. For example, the case where the storage controller 102 and the drive enclosure 103 are mounted as a single enclosure corresponds to the above case.
 電源およびファンユニット121は、ドライブエンクロージャ103全体に電力を供給するとともに、空冷ファン(図示省略)で送風を行ってフラッシュドライブ122の温度上昇を防ぐために冷却を行う。なお、電源およびファンユニット121に含まれる空冷ファンは、冷却装置として機能する。 The power supply and fan unit 121 supplies power to the entire drive enclosure 103 and performs cooling to prevent temperature rise of the flash drive 122 by blowing air with an air cooling fan (not shown). The air cooling fan included in the power supply and fan unit 121 functions as a cooling device.
 空冷ファンの回転速度は、コントローラユニット104から制御I/F114、エンクロージャインタフェース120を介して制御可能とする。空冷ファンの回転速度を変更することによって、最大冷却性能以下の所定の冷却性能が得られるものとする。 The rotation speed of the air cooling fan can be controlled from the controller unit 104 via the control I / F 114 and the enclosure interface 120. It is assumed that a predetermined cooling performance equal to or less than the maximum cooling performance can be obtained by changing the rotation speed of the air cooling fan.
 なお、空冷ファンの回転速度については、段階的な制御を行う実装も可能である。なお、電源およびファンユニット121は必ずしも一体である必要はなく、分離した実装をしてもよい。本実施例では、空冷ファンによる冷却を行う例を示したが、冷却性能を制御可能な冷却装置であれば良く、例えば、水冷式の冷却装置を採用しても良い。 Note that it is possible to implement stepwise control of the rotation speed of the air cooling fan. Note that the power supply and the fan unit 121 are not necessarily integrated, and may be separately mounted. In this embodiment, an example in which cooling is performed by an air cooling fan has been described. However, any cooling device capable of controlling the cooling performance may be used. For example, a water cooling type cooling device may be employed.
 フラッシュドライブ122は、NAND Flash Memoryを不揮発性の記憶領域として搭載した装置である。このフラッシュドライブ122は、複数をパリティグループという単位にまとめて、RAID(Redundant Arrays of Independent Disks)のような高信頼化技術を使用してもよい。 The flash drive 122 is a device in which a NAND flash memory is mounted as a nonvolatile storage area. The flash drive 122 may use a highly reliable technology such as RAID (Redundant Arrays of Independent Disks) by grouping a plurality of flash drives into units called parity groups.
 図2は、コントローラユニット104のメモリ112に格納されるプログラムおよび情報を示すブロック図である。 FIG. 2 is a block diagram showing programs and information stored in the memory 112 of the controller unit 104.
 メモリ112には、ストレージ装置としてのドライブエンクロージャ103のフラッシュドライブ122を制御するストレージ制御プログラム150と、電力性能最適化プログラム200と、Write負荷監視プログラム201と、最適電力割り当て計算プログラム202と、ドライブ稼働モード変更通知プログラム203と、冷却性能制御プログラム204が格納される。 The memory 112 includes a storage control program 150 for controlling the flash drive 122 of the drive enclosure 103 as a storage device, a power performance optimization program 200, a write load monitoring program 201, an optimum power allocation calculation program 202, and drive operation. A mode change notification program 203 and a cooling performance control program 204 are stored.
 また、メモリ112には上記制御用プログラムが使用するデータとして、エンクロージャ電力上限テーブル210と、エンクロージャ冷却能力テーブル211と、エンクロージャ冷却状態テーブル212と、搭載ドライブ情報テーブル220と、パリティグループ構成情報テーブル221と、IOパタン学習テーブル222と、ドライブ稼働モード状態テーブル223も保持される。なお、メモリ112は、上記以外の制御用プログラムや、制御データなども保持してよい。 In addition, the memory 112 includes, as data used by the control program, an enclosure power upper limit table 210, an enclosure cooling capacity table 211, an enclosure cooling state table 212, an installed drive information table 220, and a parity group configuration information table 221. The IO pattern learning table 222 and the drive operation mode state table 223 are also held. Note that the memory 112 may also hold control programs other than those described above, control data, and the like.
 ストレージ制御プログラム150は、ホスト100からのRead要求やWrite要求を受け付けて、ドライブエンクロージャ103内のフラッシュドライブ122の読み書きを制御する。 The storage control program 150 receives a read request or a write request from the host 100 and controls reading / writing of the flash drive 122 in the drive enclosure 103.
 電力性能最適化プログラム200は、Write負荷監視プログラム201と、最適電力割り当て計算プログラム202と、ドライブ稼働モード変更通知プログラム203と、冷却性能制御プログラム204を連動させ、ストレージシステム101の電力と性能を最適化する。 The power performance optimization program 200 links the write load monitoring program 201, the optimal power allocation calculation program 202, the drive operation mode change notification program 203, and the cooling performance control program 204 to optimize the power and performance of the storage system 101. Turn into.
 Write負荷監視プログラム201は、各フラッシュドライブ122に対するWrite処理の負荷を監視し、ボトルネックの発生を監視する。Write処理の負荷としては、例えば、WriteコマンドのIOPS(Input/Output Operations Per Second)を用いることができる。あるいは、フラッシュドライブ122毎の書き込み速度(MB/S)を用いても良い。 The write load monitoring program 201 monitors the write processing load on each flash drive 122 and monitors the occurrence of bottlenecks. As the write processing load, for example, IOPS (Input / Output Operations Per Second) of the Write command can be used. Alternatively, the writing speed (MB / S) for each flash drive 122 may be used.
 Write負荷監視プログラム201は、フラッシュドライブ122毎にIOPS(負荷情報)を測定し、IOPSが予め設定した第1の閾値を超えたフラッシュドライブ122の負荷を「高負荷」と判定する。また、Write負荷監視プログラム201は、「高負荷」と判定されたフラッシュドライブ122をボトルネックとして扱う。 The write load monitoring program 201 measures IOPS (load information) for each flash drive 122, and determines that the load of the flash drive 122 in which the IOPS exceeds a preset first threshold is “high load”. Further, the write load monitoring program 201 treats the flash drive 122 determined to be “high load” as a bottleneck.
 最適電力割り当て計算プログラム202は、Write負荷監視プログラム201によってボトルネックの発生が検出された場合に稼働する。このプログラムは、フラッシュドライブ122のWrite負荷情報と、ドライブエンクロージャ103に搭載されたフラッシュドライブ122の台数と、各フラッシュドライブ122に設定された稼働モードと、ドライブエンクロージャ103が供給する電力の上限を元に、ボトルネックとなっているフラッシュドライブ122に対して電力の配分を増やすことができるか否かを判定する。 The optimal power allocation calculation program 202 operates when a bottleneck is detected by the write load monitoring program 201. This program is based on the write load information of the flash drive 122, the number of flash drives 122 mounted in the drive enclosure 103, the operation mode set for each flash drive 122, and the upper limit of power supplied by the drive enclosure 103. In addition, it is determined whether or not the power distribution can be increased for the flash drive 122 that is a bottleneck.
 最適電力割り当て計算プログラム202は、ボトルネックのフラッシュドライブ122に消費電力の配分を増やすことが可能と判定した場合には、後述するように、ボトルネックのフラッシュドライブ122の消費電力を増大させるため、当該フラッシュドライブ122の稼働モードを決定する。なお、フラッシュドライブ122の稼働モードは、消費電力の制限を緩和するモードIDを選択する。 When the optimum power allocation calculation program 202 determines that it is possible to increase the distribution of power consumption to the bottleneck flash drive 122, as described later, the power consumption of the bottleneck flash drive 122 is increased. The operation mode of the flash drive 122 is determined. The operation mode of the flash drive 122 selects a mode ID that relaxes the restriction on power consumption.
 一方、他のフラッシュドライブ122のうち消費電力を削減可能なフラッシュドライブ122には消費電力の割り当てを削減させるため、削減対象のフラッシュドライブ122の稼働モードを決定する。削減対象のフラッシュドライブ122の稼働モードは、消費電力の制限を強化するモードIDを選択する。 On the other hand, the operation mode of the flash drive 122 to be reduced is determined in order to reduce the allocation of power consumption to the flash drive 122 that can reduce power consumption among the other flash drives 122. As the operation mode of the flash drive 122 to be reduced, a mode ID that strengthens the restriction on power consumption is selected.
 本実施例の最適電力割り当て計算プログラム202は、消費電力の割り当てを削減するフラッシュドライブ122として、Write処理のIOPSが第1の閾値以下で、かつ、第2の閾値以上の「中負荷」のドライブを削減対象として選択する。但し、第2の閾値は、第1の閾値よりも小さい。 The optimum power allocation calculation program 202 according to the present embodiment is a “medium load” drive in which Write processing IOPS is equal to or lower than the first threshold and equal to or higher than the second threshold as the flash drive 122 that reduces allocation of power consumption. Are selected for reduction. However, the second threshold value is smaller than the first threshold value.
 なお、本実施例は、これに限定されるものではなく、消費電力の削減対象とするフラッシュドライブ122は、消費電力を削減してもWrite性能に問題のないドライブであれば良い。例えば、最適電力割り当て計算プログラム202は、Write負荷状態2234が「高負荷」のフラッシュドライブ122のうち、Write処理のIOPSが第1の閾値以下となったドライブを「中負荷」に変更して、稼働モード2233を「2」に変更して割り当て消費電力を削減させことができる。 Note that the present embodiment is not limited to this, and the flash drive 122 that is the target of power consumption reduction may be a drive that does not have a problem in write performance even if power consumption is reduced. For example, the optimal power allocation calculation program 202 changes a drive whose write processing IOPS is equal to or lower than the first threshold among the flash drives 122 whose write load state 2234 is “high load” to “medium load”, The operation mode 2233 can be changed to “2” to reduce the allocated power consumption.
 ドライブ稼働モード変更通知プログラム203は、最適電力割り当て計算プログラム202によってフラッシュドライブ122毎の消費電力の割り当てを変更することが決定された場合や、変更前の状態へ戻す際に、実際にフラッシュドライブ122と通信を行い、稼働モードの変更を行う。 The drive operation mode change notification program 203 is actually used when the optimum power allocation calculation program 202 determines to change the allocation of power consumption for each flash drive 122 or when returning to the state before the change. To change the operation mode.
 冷却性能制御プログラム204は、最適電力割り当て計算プログラム202によりフラッシュドライブ122毎の消費電力の割り当てを変更することが決定された場合に、冷却性能の変更の有無を判定する。すなわち、冷却性能制御プログラム204は、ファン回転速度の変更が必要となった場合や、変更前の状態に戻す際に、電源およびファンユニット121を制御してファンの回転速度を変更する。 The cooling performance control program 204 determines whether or not the cooling performance has been changed when it is determined by the optimum power allocation calculation program 202 to change the power consumption allocation for each flash drive 122. In other words, the cooling performance control program 204 controls the power supply and the fan unit 121 to change the rotation speed of the fan when the fan rotation speed needs to be changed or when returning to the state before the change.
 CPU111は、各プログラムに従って処理することによって、所定の機能を提供する機能部として稼働する。例えば、CPU111は、電力性能最適化プログラム200に従って処理することで電力性能最適化部として機能する。他のプログラムについても同様である。さらに、CPU111は、各プログラムが実行する複数の処理のそれぞれの機能を提供する機能部としても稼働する。計算機及び計算機システムは、これらの機能部を含む装置及びシステムである。 The CPU 111 operates as a functional unit that provides a predetermined function by processing according to each program. For example, the CPU 111 functions as a power performance optimization unit by performing processing according to the power performance optimization program 200. The same applies to other programs. Furthermore, the CPU 111 also operates as a function unit that provides each function of a plurality of processes executed by each program. A computer and a computer system are an apparatus and a system including these functional units.
 コントローラユニット104の各機能を実現するプログラム、テーブル等の情報は、ストレージサブシステムや不揮発性半導体メモリ、ハードディスクドライブ、SSD等の不揮発性記憶デバイス、または、ICカード、SDカード、DVD等の計算機読み取り可能な非一時的データ記憶媒体に格納することができる。 Information such as programs and tables for realizing each function of the controller unit 104 is stored in a storage subsystem, a nonvolatile semiconductor memory, a hard disk drive, a nonvolatile storage device such as an SSD, or a computer reading such as an IC card, an SD card, a DVD, etc. It can be stored on possible non-transitory data storage media.
 図3A~図3Fは、上記電力性能最適化プログラム200と、Write負荷監視プログラム201と、最適電力割り当て計算プログラム202と、ドライブ稼働モード変更通知プログラム203と、冷却性能制御プログラム204が稼働する際に使用される情報の一例を示す図である。 FIGS. 3A to 3F show that the power performance optimization program 200, the write load monitoring program 201, the optimum power allocation calculation program 202, the drive operation mode change notification program 203, and the cooling performance control program 204 are operated. It is a figure which shows an example of the information used.
 図3Aは、エンクロージャ電力上限テーブル210の一例を示す図である。エンクロージャ電力上限テーブル210は、各ドライブエンクロージャ103の識別情報を格納するエンクロージャID2101と、ドライブエンクロージャ103毎に設定された筺体電力上限2102と、ドライブエンクロージャ103に搭載するフラッシュドライブ単体に対する供給電力の上限値を格納する単体ドライブ供給電力上限2103とを一つのエントリに含む。 FIG. 3A is a diagram illustrating an example of the enclosure power upper limit table 210. The enclosure power upper limit table 210 includes an enclosure ID 2101 for storing identification information of each drive enclosure 103, a chassis power upper limit 2102 set for each drive enclosure 103, and an upper limit value of power supplied to a single flash drive installed in the drive enclosure 103. Is included in one entry.
 図1では、ドライブエンクロージャ103がひとつの例を示したが、ストレージコントローラ102には、複数のドライブエンクロージャ103を接続することができる。このため、エンクロージャID2101によってドライブエンクロージャ103を特定する。 Although FIG. 1 shows an example in which the drive enclosure 103 is one, a plurality of drive enclosures 103 can be connected to the storage controller 102. For this reason, the drive enclosure 103 is specified by the enclosure ID 2101.
 また、筺体電力上限2102は、複数の電源およびファンユニット121-1、121-2が常時給電する場合も、電源およびファンユニット121-1もしくは121-2が故障などの原因により停止し、縮退した場合においても供給可能な電力上限値(最大値)を示す。本実施例のように、冗長化電源(2台)を採用している場合の最大供給電力(瞬間的なものではなく定格としての最大)は、縮退時でも供給可能な電力である必要がある。たとえば、2台冗長構成の場合は、1台故障時でも稼働することが必須なため、生き残った1台で供給可能な電力が最大供給電力となる。また3台冗長構成の場合で1台までの故障を許容する場合は、1台故障時に2台による供給でまかなえるだけの電力が最大供給電力となり、この場合は2台分の和が最大供給電力となる。 Further, the housing power upper limit 2102 has been degraded due to a failure of the power source and fan unit 121-1 or 121-2 even when a plurality of power sources and fan units 121-1 and 121-2 are constantly supplied with power. In this case, the upper limit value (maximum value) that can be supplied is shown. As in this embodiment, the maximum supply power (maximum as a rating, not a momentary one) when a redundant power supply (two units) is adopted needs to be a power that can be supplied even during degeneration. . For example, in the case of a two-unit redundant configuration, since it is essential to operate even when one unit fails, the power that can be supplied by one surviving unit is the maximum supply power. In addition, in the case of 3 units redundant configuration, if up to 1 unit is tolerated, the maximum supply power is the power that can be supplied by 2 units when one unit fails. In this case, the sum of 2 units is the maximum supply power. It becomes.
 なお、エンクロージャ電力上限テーブル210の情報は、図示しない管理計算機等によって予め設定される。 The information in the enclosure power upper limit table 210 is set in advance by a management computer or the like (not shown).
 図3Bは、エンクロージャ冷却能力テーブル211の一例を示す図である。エンクロージャ冷却能力テーブル211は、各ドライブエンクロージャ103の識別情報を格納するエンクロージャID2111と、ドライブエンクロージャ103毎に設定された冷却能力の最大値を格納する最大冷却性能2112と、ドライブエンクロージャ103の冷却能力の定格値を格納する標準冷却性能2113と、電源およびファンユニット121が冗長化されている場合には電源およびファンユニット121の縮退時の冷却能力を格納する冷却機能縮退時冷却性能2114とを一つのエントリに含む。 FIG. 3B is a diagram illustrating an example of the enclosure cooling capacity table 211. The enclosure cooling capacity table 211 includes an enclosure ID 2111 for storing identification information of each drive enclosure 103, a maximum cooling performance 2112 for storing the maximum value of the cooling capacity set for each drive enclosure 103, and the cooling capacity of the drive enclosure 103. The standard cooling performance 2113 for storing the rated value and the cooling function degeneration cooling performance 2114 for storing the cooling capability at the time of degeneration of the power supply and fan unit 121 when the power supply and fan unit 121 are made redundant are combined into one. Include in entry.
 最大冷却性能2112は、各ドライブエンクロージャ103が有する冷却性能のうち、冗長系も含めた冷却装置を最大限稼働させた場合の冷却性能(W)を示す。標準冷却性能2113は、電源およびファンユニット121の標準負荷状態での冷却性能を示す。冷却機能縮退時冷却性能2114は、冗長系が縮退した際の最大冷却性能を示す。 The maximum cooling performance 2112 indicates the cooling performance (W) when the cooling device including the redundant system is operated to the maximum out of the cooling performance of each drive enclosure 103. The standard cooling performance 2113 indicates the cooling performance of the power supply and fan unit 121 in the standard load state. The cooling performance 2114 when the cooling function is reduced indicates the maximum cooling performance when the redundant system is degenerated.
 なお、エンクロージャ冷却能力テーブル211の情報は、図示しない管理計算機等によって予め設定される。 Note that information in the enclosure cooling capacity table 211 is set in advance by a management computer or the like (not shown).
 図3Cは、エンクロージャ冷却状態テーブル212の一例を示す図である。エンクロージャ冷却状態テーブル212は、各ドライブエンクロージャ103の識別情報を格納するエンクロージャID2121と、現在コントローラユニット104に接続されているドライブエンクロージャ103毎の冷却性能を示す冷却性能2122と、冗長系が縮退しているか否かを示す冷却状態縮退有無2123とを一つのエントリに含む。 FIG. 3C is a diagram illustrating an example of the enclosure cooling state table 212. The enclosure cooling state table 212 includes an enclosure ID 2121 that stores identification information of each drive enclosure 103, a cooling performance 2122 that indicates the cooling performance of each drive enclosure 103 that is currently connected to the controller unit 104, and the redundant system is degenerated. One entry includes a cooling state degeneration presence / absence 2123 indicating whether or not there is.
 このエンクロージャ冷却状態テーブル212は、コントローラユニット104によって定期的に更新され、最新の状態へと更新される。 The enclosure cooling state table 212 is periodically updated by the controller unit 104 and updated to the latest state.
 図3Dは、搭載ドライブ情報テーブル220の一例を示す図である。搭載ドライブ情報テーブル220は、フラッシュドライブ122が搭載されているドライブエンクロージャ103の識別子を格納するエンクロージャID2201と、フラッシュドライブ122毎の識別子を格納するドライブID2202と、フラッシュドライブ122で変更可能な稼働モードの数を格納するモード数2203と、稼働モードが1の場合の消費電力(W)を格納するモード1電力2204と、稼働モードが1の場合の書き込み性能(MB/s)を格納するモード1Write性能2205と、稼働モードが2の場合の消費電力(W)を格納するモード2電力2206と、稼働モードが2の場合の書き込み性能(MB/s)を格納するモード2Write性能2207と、図示しない稼働モードが3の場合の消費電力と書き込み性能を一つのエントリに含む。 FIG. 3D is a diagram illustrating an example of the mounted drive information table 220. The mounted drive information table 220 includes an enclosure ID 2201 that stores an identifier of the drive enclosure 103 in which the flash drive 122 is mounted, a drive ID 2202 that stores an identifier for each flash drive 122, and an operation mode that can be changed by the flash drive 122. Mode number 2203 for storing the number, mode 1 power 2204 for storing the power consumption (W) when the operation mode is 1, and mode 1 write performance for storing the write performance (MB / s) when the operation mode is 1. 2205, mode 2 power 2206 for storing power consumption (W) when the operation mode is 2, mode 2 write performance 2207 for storing write performance (MB / s) when the operation mode is 2, and operation not shown Power consumption and writing when mode is 3 Including the performance to one of the entry.
 図3DではWrite性能のみを保持しているが、読み込み性能等の性能情報を保持してもよい。また、消費電力と書き込み性能のフィールドは、モード数2203に応じて設定すればよい。 In FIG. 3D, only Write performance is retained, but performance information such as read performance may be retained. The power consumption and write performance fields may be set according to the number of modes 2203.
 なお、搭載ドライブ情報テーブル220の情報は、図示しない管理計算機等によって予め設定される。 The information in the mounted drive information table 220 is set in advance by a management computer (not shown) or the like.
 図3Eは、パリティグループ構成情報テーブル221の一例を示す図である。パリティグループ構成情報テーブル221は、RAIDを構成するフラッシュドライブ122群の組み合わせ情報を、ドライブIDとパリティグループIDの組み合わせとして保持する。 FIG. 3E is a diagram illustrating an example of the parity group configuration information table 221. The parity group configuration information table 221 holds the combination information of the flash drive 122 groups constituting the RAID as a combination of a drive ID and a parity group ID.
 パリティグループ構成情報テーブル221は、フラッシュドライブ122が搭載されているドライブエンクロージャ103の識別子を格納するエンクロージャID2211と、フラッシュドライブ122毎の識別子を格納するドライブID2212と、フラッシュドライブ122が所属するパリティグループの識別子を格納するパリティグループID2213と、消費電力の割り当て変更の可否を設定する電力割当変更可否フラグ2214とを一つのエントリに含む。 The parity group configuration information table 221 includes an enclosure ID 2211 that stores an identifier of the drive enclosure 103 in which the flash drive 122 is mounted, a drive ID 2212 that stores an identifier for each flash drive 122, and a parity group to which the flash drive 122 belongs. One entry includes a parity group ID 2213 for storing an identifier and a power allocation change enable / disable flag 2214 for setting whether or not to change the allocation of power consumption.
 また、障害が発生したフラッシュドライブ122と役割を交代することで可用性を維持できるようにスペアドライブとして設定したドライブについても、パリティグループID2213に「SPARE」として識別可能とする。なお、SPAREの具体的なパリティグループIDとのマッピングは、ストレージシステムごとに適した値へ変更することが可能である。 Also, a drive set as a spare drive so that availability can be maintained by changing the role of the flash drive 122 in which a failure has occurred can be identified as “SPARE” in the parity group ID 2213. Note that the mapping of SPARE with a specific parity group ID can be changed to a value suitable for each storage system.
 電力割当変更可否フラグ2214は、電力割り当ての変更を許可するか否かを設定する。電力割当変更可否フラグ2214が「可」であれば、ストレージコントローラ102による消費電力の変更を受け入れ、「否」であれば消費電力の変更を拒否する。 The power allocation change enable / disable flag 2214 sets whether or not to allow a change in power allocation. If the power allocation change enable / disable flag 2214 is “permitted”, the power consumption change by the storage controller 102 is accepted, and if it is “no”, the power consumption change is rejected.
 なお、本実施例ではフラッシュドライブ122をRAID5やRAID6で利用する例を示すが、これに限定されるものではない。例えば、ひとつの記憶領域を複数のフラッシュドライブ122で構成する場合、パリティグループに代わって記憶領域のグループでフラッシュドライブ122を管理することができる。 In this embodiment, an example in which the flash drive 122 is used in RAID 5 or RAID 6 is shown, but the present invention is not limited to this. For example, when one storage area is configured by a plurality of flash drives 122, the flash drives 122 can be managed by a group of storage areas instead of a parity group.
 IOパタン学習テーブル222は、各フラッシュドライブ122もしくはパリティグループ601~605ごとのデータアクセス履歴などを記録あるいは学習する。具体的に記録する履歴内容や学習する情報としては、アクセス元のホスト100の情報や、アクセス先のフラッシュドライブ122の情報や、アクセス先のパリティグループの情報や、アクセスコマンドの情報や、アクセス頻度の情報、アクセスデータサイズの情報、アクセス時間の情報、アクセス周期の情報などを用いたものが可能であるが、上記以外の情報、履歴、性能情報を記録してもよい。 The IO pattern learning table 222 records or learns the data access history for each flash drive 122 or parity group 601 to 605. Specifically, history information to be recorded and information to be learned include access source host 100 information, access destination flash drive 122 information, access destination parity group information, access command information, and access frequency. Information, access data size information, access time information, access cycle information, and the like, but other information, history, and performance information may be recorded.
 図3Fは、ドライブ稼働モード状態テーブル223の一例を示す図である。ドライブ稼働モード状態テーブル223は、現在各ドライブエンクロージャ103に搭載されているフラッシュドライブ122の稼働状況を保持する。 FIG. 3F is a diagram illustrating an example of the drive operation mode state table 223. The drive operation mode state table 223 holds the operation status of the flash drive 122 currently mounted in each drive enclosure 103.
 ドライブ稼働モード状態テーブル223は、ドライブエンクロージャ103の識別子を格納するエンクロージャID2231と、フラッシュドライブ122毎の識別子を格納するドライブID2232と、フラッシュドライブ122毎の稼働モードを格納する稼働モード2233と、フラッシュドライブ122ごとに書き込みの負荷状態を格納するWrite負荷状態2234とを一つのエントリに含む。 The drive operation mode state table 223 includes an enclosure ID 2231 that stores an identifier of the drive enclosure 103, a drive ID 2232 that stores an identifier for each flash drive 122, an operation mode 2233 that stores an operation mode for each flash drive 122, and a flash drive. Each entry includes a write load state 2234 for storing a write load state for each 122.
 フラッシュドライブ122ごとに書き込みの負荷状態は、前述のIOPSが第1の閾値を超えていれば高負荷、第1の閾値以下で、かつ、第2の閾値を超えていれば中負荷、第2の閾値以下であれば低負荷とすることができる。なお、Write負荷の分解能は、必ずしも高負荷、中負荷、低負荷の三段階である必要はなく、より細かな分解能を採用することが可能である。 The write load state for each flash drive 122 is high load if the above-mentioned IOPS exceeds the first threshold, medium load if the IOPS is below the first threshold, and exceeds the second threshold, and second If it is below this threshold value, it can be set as a low load. The resolution of the write load does not necessarily need to be three stages of high load, medium load, and low load, and finer resolution can be adopted.
 図4は、フラッシュドライブ122の構成の一例を示すブロック図である。フラッシュドライブ122は、ディスクインタフェース(図中DISK I/F)400と、ドライブコントローラ401と、メモリ402と、複数のフラッシュメモリアクセスチャネル403と、複数のフラッシュメモリチップ404から構成される。 FIG. 4 is a block diagram showing an example of the configuration of the flash drive 122. The flash drive 122 includes a disk interface (DISK I / F in the figure) 400, a drive controller 401, a memory 402, a plurality of flash memory access channels 403, and a plurality of flash memory chips 404.
 ディスクインタフェース400は、エンクロージャインタフェース120と、バックエンドインタフェース113を介してコントローラユニット104に接続される。なお、本実施例では、エンクロージャインタフェース120とバックエンドインタフェース113との接続は、冗長化のため2系統の例を示すが、1系統による接続でもよい。 The disk interface 400 is connected to the controller unit 104 via the enclosure interface 120 and the back-end interface 113. In the present embodiment, the connection between the enclosure interface 120 and the back-end interface 113 is shown as an example of two systems for redundancy.
 ドライブコントローラ401は、ディスクインタフェース400から受け取ったコマンドを処理するCPUの一種である。ドライブコントローラ401は、メモリ402に格納したチップ制御プログラム420を実行して、データを参照し、各種処理を実行する。 The drive controller 401 is a type of CPU that processes commands received from the disk interface 400. The drive controller 401 executes the chip control program 420 stored in the memory 402, refers to the data, and executes various processes.
 メモリ402は、ドライブコントローラ401が実行するプログラムやデータを格納する。本実施例では、メモリ402が、稼働モード変更プログラム10と稼働モードテーブル411と、チップ制御プログラム420が保持される。 The memory 402 stores programs and data executed by the drive controller 401. In this embodiment, the memory 402 holds an operation mode change program 10, an operation mode table 411, and a chip control program 420.
 なお、メモリ402は、上記の他の制御プログラムやキャッシュデータの格納などに使用してもよい。また、メモリ402は、SDRAM(Synchronous Dynamic Random Access Memory)で構成することができるが、上記以外の記憶素子で構成されてもよい。 The memory 402 may be used for storing other control programs and cache data. The memory 402 can be composed of SDRAM (Synchronous Dynamic Random Access Memory), but may be composed of memory elements other than those described above.
 チップ制御プログラム420は、ディスクインタフェース400が受け取ったコマンドを処理して、フラッシュメモリチップ404への読み書きを制御する。 The chip control program 420 processes a command received by the disk interface 400 and controls reading and writing to the flash memory chip 404.
 また、チップ制御プログラム420は、フラッシュメモリチップ404の有効データの格納状況や書き換え回数などにより、自律的なデータ移動(例えば、ガベージコレクションや、書込み回数の平準化)を制御する。 Also, the chip control program 420 controls autonomous data movement (for example, garbage collection and leveling of the number of writes) according to the storage status of valid data in the flash memory chip 404 and the number of rewrites.
 フラッシュメモリアクセスチャネル403は、ドライブコントローラ401とフラッシュメモリチップ404を接続し、ドライブコントローラ401がアクセスするための経路である。 The flash memory access channel 403 is a path for connecting the drive controller 401 and the flash memory chip 404 and accessing the drive controller 401.
 フラッシュメモリアクセスチャネル403は、使用するドライブコントローラ401によって数が異なっており、数が多いほど多くのフラッシュメモリチップ404を接続することができる。また、このフラッシュメモリアクセスチャネル403を同時に複数活性化することにより、複数のフラッシュメモリチップ404に同時アクセスすることが可能となり、性能が向上する一方、Write時には大きな電力を消費する。 The number of flash memory access channels 403 differs depending on the drive controller 401 to be used, and the larger the number, the more flash memory chips 404 can be connected. Also, by simultaneously activating a plurality of flash memory access channels 403, it becomes possible to access a plurality of flash memory chips 404 at the same time, improving performance while consuming a large amount of power during Write.
 フラッシュメモリチップ404は、ドライブコントローラ401に対してフラッシュメモリアクセスチャネル403経由で接続されるNAND Flash Memoryチップであり、実際のデータなどを格納する。各フラッシュメモリアクセスチャネル403にはそれぞれ複数のフラッシュメモリチップ404が接続される。 The flash memory chip 404 is a NAND flash memory chip connected to the drive controller 401 via the flash memory access channel 403, and stores actual data and the like. A plurality of flash memory chips 404 are connected to each flash memory access channel 403.
 稼働モード変更プログラム410は、メモリ402に格納されて、ドライブコントローラ401によって実行されるプログラムのである。稼働モード変更プログラム410は、コントローラユニット104からの指示に従って、フラッシュドライブ122の稼働モードを変更する。 The operation mode change program 410 is a program stored in the memory 402 and executed by the drive controller 401. The operation mode change program 410 changes the operation mode of the flash drive 122 in accordance with an instruction from the controller unit 104.
 フラッシュドライブ122の稼働モードは、稼働モードテーブル411に格納されている。稼働モードテーブル411は、メモリ402に格納され、稼働モード変更プログラム410による稼働モードの変更時に参照される。また、稼働モードテーブル411に含まれる情報はコントローラユニット104により収集され、搭載ドライブ情報テーブル220に設定される。 The operation mode of the flash drive 122 is stored in the operation mode table 411. The operation mode table 411 is stored in the memory 402 and is referred to when the operation mode is changed by the operation mode change program 410. Information included in the operation mode table 411 is collected by the controller unit 104 and set in the mounted drive information table 220.
 図5は、稼働モードテーブル411に保持される情報の一例を示す図である。稼働モードテーブル411は、フラッシュドライブ122に設定可能なモードID4111と、当該稼働モードにおけるドライブの消費電力(W)4112と、当該稼働モードにおけるWrite性能(MB/s)4113と、書き込み時のフラッシュメモリチップ404への同時アクセス数を示すWrite多重度4114とをモードIDの組み合わせとして保持する。 FIG. 5 is a diagram illustrating an example of information held in the operation mode table 411. The operation mode table 411 includes a mode ID 4111 that can be set in the flash drive 122, drive power consumption (W) 4112 in the operation mode, write performance (MB / s) 4113 in the operation mode, and flash memory at the time of writing. Write multiplicity 4114 indicating the number of simultaneous accesses to the chip 404 is held as a combination of mode IDs.
 本実施例では、フラッシュドライブ122の書き込み時のフラッシュメモリチップ404への同時アクセス数を示すWrite多重度4114で、消費電力の最大値を制御する。 In this embodiment, the maximum value of power consumption is controlled by the write multiplicity 4114 indicating the number of simultaneous accesses to the flash memory chip 404 at the time of writing to the flash drive 122.
 モードID=1のときに、書き込み時のフラッシュメモリチップ404への同時アクセス数=256となって、消費電力が最大、かつ、書き込み性能が最高となる。一方、モードID=3のときには、書き込み時のフラッシュメモリチップ404への同時アクセス数=64となって、消費電力が最小、かつ、書き込み性能が最低となる。 When the mode ID = 1, the number of simultaneous accesses to the flash memory chip 404 at the time of writing becomes 256, and the power consumption is maximized and the write performance is maximized. On the other hand, when the mode ID is 3, the number of simultaneous accesses to the flash memory chip 404 at the time of writing is 64, and the power consumption is minimum and the writing performance is minimum.
 モードID=2のときには、書き込み時のフラッシュメモリチップ404への同時アクセス数=128となって、消費電力と書き込み性能は中間の値となる。 When mode ID = 2, the number of simultaneous accesses to the flash memory chip 404 at the time of writing is 128, and the power consumption and the writing performance are intermediate values.
 図5では、Write性能以外の情報を記載していないが、上記以外の情報を保持してもよい。また、保持されるモード数についても、図5より多くなっているフラッシュドライブ122も構成可能である。さらに、性能情報などは最低値や最高値など、範囲を含む構成も可能である。また、上記の情報はコントローラユニット104によって収集、使用されてもよい。 In FIG. 5, information other than the write performance is not described, but information other than the above may be retained. Further, the flash drive 122 having a larger number of modes to be held than in FIG. 5 can be configured. Furthermore, the performance information can be configured to include a range such as a minimum value or a maximum value. Further, the above information may be collected and used by the controller unit 104.
 なお、フラッシュドライブ122のモードID(稼働モード)4111は、3段階の例を示したが、同時に書き込むWrite多重度の区分を増減することで変更することができる。なお、本実施例ではフラッシュドライブ122の稼働モードで消費電力およびWrite性能を制御する例を示すが、これに限定されるものではない。例えば、フラッシュドライブ122のWrite多重度で、フラッシュドライブ122の消費電力および書き込み性能を制御するようにしてもよい。 Note that the mode ID (operation mode) 4111 of the flash drive 122 has been shown as an example of three stages, but can be changed by increasing or decreasing the write multiplicity classification to be written simultaneously. In the present embodiment, an example in which the power consumption and the write performance are controlled in the operation mode of the flash drive 122 is shown, but the present invention is not limited to this. For example, the power consumption and write performance of the flash drive 122 may be controlled by the write multiplicity of the flash drive 122.
 図6は、ストレージシステム101の物理的構造とパリティグループの構成を示す図である。図6では、ストレージコントローラ102とドライブエンクロージャ103が異なる筺体として実装され、それぞれケーブルで接続された例を示している。 FIG. 6 is a diagram showing the physical structure of the storage system 101 and the structure of the parity group. FIG. 6 shows an example in which the storage controller 102 and the drive enclosure 103 are mounted as different enclosures and connected by cables.
 なお、本発明はこれに限定されるものではなく、ストレージコントローラ102とドライブエンクロージャ103が一体の筺体として実装されてもよい。また、ドライブエンクロージャ103は、ストレージシステム101として1台実装され、識別用のIDとしてエンクロージャID=00を有しているが、複数台のドライブエンクロージャ103を接続してもよい。 Note that the present invention is not limited to this, and the storage controller 102 and the drive enclosure 103 may be mounted as an integral casing. Further, one drive enclosure 103 is mounted as the storage system 101 and has an enclosure ID = 00 as an identification ID, but a plurality of drive enclosures 103 may be connected.
 なお、複数のドライブエンクロージャ103をストレージコントローラ102に接続する場合は、エンクロージャIDを重複しないように設定するなどし、ストレージコントローラ102から識別可能とする。また、図示の例ではフラッシュドライブ122を、ドライブエンクロージャ103に24台実装した構成であるが、必ずしも全台実装する必要はない。 Note that when a plurality of drive enclosures 103 are connected to the storage controller 102, the enclosure controller 102 can be identified by setting the enclosure IDs so that they do not overlap. In the illustrated example, 24 flash drives 122 are mounted on the drive enclosure 103, but it is not always necessary to mount all of them.
 本実施例では、各フラッシュドライブ122はすべて同一のモデルとし、稼働モードテーブル411として図5に示すモードを有するものとする。また各フラッシュドライブ122には、それぞれパリティグループ601~605を設定している。 In this embodiment, it is assumed that all the flash drives 122 have the same model and have the mode shown in FIG. 5 as the operation mode table 411. Parity groups 601 to 605 are set in each flash drive 122, respectively.
 パリティグループ1(パリティグループID=1)601は、4台のフラッシュドライブ122で構成される。パリティグループ2(パリティグループID=2)602は、8台のフラッシュドライブ122で構成される。 Parity group 1 (parity group ID = 1) 601 is composed of four flash drives 122. Parity group 2 (parity group ID = 2) 602 is composed of eight flash drives 122.
 パリティグループ3(パリティグループID=3)603は、4台のフラッシュドライブ122で構成される。パリティグループ4(パリティグループID=4)604は、6台のフラッシュドライブ122で構成される。 Parity group 3 (parity group ID = 3) 603 includes four flash drives 122. Parity group 4 (parity group ID = 4) 604 includes six flash drives 122.
 スペアグループ(パリティグループID=SPARE)605は、2台のフラッシュドライブ122で構成される。これらのパリティグループ601~605の構成についても一例として示しており、異なる構成やパリティグループを設定しない構成を採用することが可能である。 The spare group (parity group ID = SPARE) 605 is composed of two flash drives 122. The configuration of these parity groups 601 to 605 is also shown as an example, and it is possible to adopt a different configuration or a configuration in which no parity group is set.
 なお、図示の例ではストレージコントローラ102側の電源およびファンユニットに相当する部分と、ホスト100と、ホスト100とフロントエンドインタフェース110との結線は省略した。 In the example shown in the drawing, the connection between the power supply and fan unit on the storage controller 102 side, the host 100, and the host 100 and the front end interface 110 is omitted.
 図7は、ストレージコントローラで行われる処理の一例を示すフローチャートである。以下では、フローチャートを用いて、図1および図6に示されるようなストレージシステム101における制御方法、すなわち電力性能最適化プログラム200の処理を説明する。 FIG. 7 is a flowchart showing an example of processing performed by the storage controller. Hereinafter, a control method in the storage system 101 as illustrated in FIGS. 1 and 6, that is, processing of the power performance optimization program 200 will be described using flowcharts.
 なお、本フローチャートで示す電力性能最適化プログラム200等は、コントローラユニット104のCPU111によりメモリ112へロードされて実行されるが、ストレージシステム101全体を制御するストレージ制御プログラム150の一部として機能してもよい。また、この処理は、繰り返して実行される。 The power performance optimization program 200 and the like shown in this flowchart are loaded into the memory 112 and executed by the CPU 111 of the controller unit 104, but function as a part of the storage control program 150 that controls the entire storage system 101. Also good. This process is repeatedly executed.
 まず、コントローラユニット104では、ストレージシステム101全体を制御するストレージ制御プログラム150が電力性能最適化プログラム200を呼び出して処理を開始する(700)。 First, in the controller unit 104, the storage control program 150 that controls the entire storage system 101 calls the power performance optimization program 200 to start processing (700).
 電力性能最適化プログラム200は、ドライブエンクロージャ103に搭載された電源およびファンユニット121の状態を検出し、冷却装置の縮退などの異常の有無を判定する(720)。電力性能最適化プログラム200は、電源およびファンユニット121で縮退が発生していなければステップ701へ進み、縮退が発生していればステップ710に進む。 The power performance optimization program 200 detects the state of the power supply and the fan unit 121 mounted in the drive enclosure 103, and determines whether there is an abnormality such as degeneration of the cooling device (720). The power performance optimization program 200 proceeds to step 701 if degeneration has not occurred in the power source and fan unit 121, and proceeds to step 710 if degeneration has occurred.
 なお、冗長化された冷却装置(空冷ファン)に縮退が発生している場合は、ボトルネックを解消させるためのフラッシュドライブ122の消費電力の割り当て変更は禁止される。 Note that if the redundant cooling device (air cooling fan) is degenerated, changing the allocation of the power consumption of the flash drive 122 to eliminate the bottleneck is prohibited.
 ステップ701では、電力性能最適化プログラム200が、Write負荷監視プログラム201を起動する。Write負荷監視プログラム201は、ドライブエンクロージャ103に搭載されたフラッシュドライブ122の負荷(例えば、IOPS)をそれぞれ検出し、IOPSが予め設定した第1の閾値を超えたフラッシュドライブ122をボトルネック(負荷が集中)のデバイスと判定する。 In step 701, the power performance optimization program 200 starts the write load monitoring program 201. The write load monitoring program 201 detects the load (for example, IOPS) of the flash drive 122 mounted in the drive enclosure 103, and the bottleneck (load is detected) when the IOPS exceeds a preset first threshold. (Concentrated) device.
 Write負荷監視プログラム201は、各フラッシュドライブ122の負荷を検出し、上述のように第1の閾値と第2の閾値から3段階(高負荷、中負荷、低負荷)の負荷状態を算出してドライブ稼働モード状態テーブル223を更新する。 The write load monitoring program 201 detects the load of each flash drive 122 and calculates the load state in three stages (high load, medium load, and low load) from the first threshold and the second threshold as described above. The drive operation mode state table 223 is updated.
 電力性能最適化プログラム200は、Write負荷監視プログラム201の検出結果を取得して、Write処理でボトルネックとなっているフラッシュドライブ122があるか否かを判定する。 The power performance optimization program 200 acquires the detection result of the write load monitoring program 201 and determines whether or not there is a flash drive 122 that is a bottleneck in the write process.
 電力性能最適化プログラム200は、Write処理の負荷が集中して、ボトルネックになっているフラッシュドライブ122が存在する場合はステップ703へ進み、ボトルネックが存在しない場合にはステップ710へ進む。 The power performance optimization program 200 proceeds to step 703 if the write processing load is concentrated and there is a flash drive 122 that is a bottleneck, and proceeds to step 710 if there is no bottleneck.
 ステップ703では、電力性能最適化プログラム200が、最適電力割り当て計算プログラム202を起動する。 In step 703, the power performance optimization program 200 activates the optimum power allocation calculation program 202.
 最適電力割り当て計算プログラム202は、まずドライブ稼働モード状態テーブル223を読み込んで、Write負荷の高いフラッシュドライブ122を特定する。最適電力割り当て計算プログラム202は、ドライブ稼働モード状態テーブル223のWrite負荷状態2234が「高負荷」のフラッシュドライブ122の消費電力の制限を緩和して、消費電力の割り当てを増大させる増大対象として選択する。 The optimal power allocation calculation program 202 first reads the drive operation mode state table 223 and identifies the flash drive 122 with a high write load. The optimum power allocation calculation program 202 relaxes the limitation on the power consumption of the flash drive 122 whose write load status 2234 of the drive operation mode status table 223 is “high load” and selects it as an increase target to increase the allocation of power consumption. .
 なお、上記に限定されるものではなく、Write負荷の高いフラッシュドライブ122が所属するパリティグループを消費電力の増大対象のフラッシュドライブ122としてもよい。 Note that the present invention is not limited to the above, and the parity group to which the flash drive 122 having a high write load belongs may be used as the flash drive 122 whose power consumption is to be increased.
 最適電力割り当て計算プログラム202は、パリティグループ構成情報テーブル221を参照して、電力割当変更可否フラグ2214が「可」に設定されたフラッシュドライブ122のうち、低消費電力の稼働モードへ移行可能なドライブとして、負荷状態2234が「中負荷」のフラッシュドライブ122を消費電力の削減対象(消費電力の制限強化対象)として選択する。 The optimum power allocation calculation program 202 refers to the parity group configuration information table 221, and among the flash drives 122 in which the power allocation change enable / disable flag 2214 is set to “permitted”, the drive that can shift to the operation mode with low power consumption. As described above, the flash drive 122 whose load state 2234 is “medium load” is selected as a power consumption reduction target (power consumption restriction enhancement target).
 なお、上記では最適電力割り当て計算プログラム202は、負荷状態2234が「中負荷」のフラッシュドライブ122を選択する例を示したが、最適電力割り当て計算プログラム202がIOパタン学習テーブル222を参照して、Write負荷が低い状態で推移すると予測されるフラッシュドライブ122のWrite性能を引き下げる、すなわち低消費電力の稼働モードに変更可能なフラッシュドライブ122として選択するようにしても良い。 In the above description, the optimal power allocation calculation program 202 selects the flash drive 122 whose load state 2234 is “medium load”. However, the optimal power allocation calculation program 202 refers to the IO pattern learning table 222, You may make it select as the flash drive 122 which lowers | writes the write performance of the flash drive 122 anticipated to change in the state with low write load, ie, can be changed into the operation mode of low power consumption.
 また、最適電力割り当て計算プログラム202は、低消費電力の稼働モードに変更可能なフラッシュドライブ122の数は、消費電力の増大対象のフラッシュドライブ122の消費電力の和と、その他のフラッシュドライブ122の消費電力の和の総和がエンクロージャ電力上限テーブル210の筺体電力上限2102以下になればよい。 Further, the optimum power allocation calculation program 202 indicates that the number of flash drives 122 that can be changed to the low power consumption operation mode is the sum of the power consumption of the flash drives 122 to be increased in power consumption and the consumption of other flash drives 122. The total sum of the powers only needs to be equal to or less than the chassis power upper limit 2102 of the enclosure power upper limit table 210.
 最適電力割り当て計算プログラム202は、上記選択結果に基づいて、Write負荷の高いフラッシュドライブ122をモードID(4111)=1に設定して最大の消費電力で最大のWrite性能2205に設定する。一方、最適電力割り当て計算プログラム202は、低消費電力の稼働モードに変更可能なフラッシュドライブ122をモードID=3に設定し、最小の消費電力で最低限のWrite性能に設定する。 Based on the selection result, the optimum power allocation calculation program 202 sets the flash drive 122 having a high write load to mode ID (4111) = 1 and sets the maximum write performance 2205 with the maximum power consumption. On the other hand, the optimal power allocation calculation program 202 sets the flash drive 122 that can be changed to the low power consumption operation mode to mode ID = 3, and sets the minimum write performance with the minimum power consumption.
 また、最適電力割り当て計算プログラム202は、増大対象と削減対象以外のフラッシュドライブ122をモードID=2で稼働させた場合の全てのフラッシュドライブ122の消費電力の合計電力値を計算する。 Also, the optimum power allocation calculation program 202 calculates the total power value of the power consumption of all the flash drives 122 when the flash drives 122 other than the increase target and the reduction target are operated with mode ID = 2.
 次に、ステップ704では、最適電力割り当て計算プログラム202が、合計電力値と、エンクロージャ電力上限テーブル210から得られる筺体電力上限2102の値と、エンクロージャ冷却能力テーブル211の最大冷却性能2112の値とをそれぞれ比較を行い、電力割り当ての変更を行うか否かを判定する。 Next, in step 704, the optimum power allocation calculation program 202 calculates the total power value, the value of the enclosure power upper limit 2102 obtained from the enclosure power upper limit table 210, and the value of the maximum cooling performance 2112 of the enclosure cooling capacity table 211. Each is compared to determine whether to change the power allocation.
 最適電力割り当て計算プログラム202は、合計電力値が筺体電力上限2102の値と、最大冷却性能2112の値の両方を下回る場合は、電力割り当ての変更を行うためステップ705へ進む。一方、最適電力割り当て計算プログラム202は、合計電力値が筺体電力上限2102の値と、最大冷却性能2112の値のいずれか一方を超える場合は、電力割り当ての変更を禁止してステップ720へ戻って上記処理を繰り返す。 The optimum power allocation calculation program 202 proceeds to step 705 in order to change the power allocation when the total power value is lower than both the value of the chassis power upper limit 2102 and the value of the maximum cooling performance 2112. On the other hand, if the total power value exceeds either the value of the chassis power upper limit 2102 or the value of the maximum cooling performance 2112, the optimum power allocation calculation program 202 prohibits the power allocation change and returns to step 720. Repeat the above process.
 なお、最適電力割り当て計算プログラム202は、稼働モードテーブル411のドライブ消費電力が、エンクロージャ電力上限テーブル210の単体ドライブ供給電力上限2103より大きな稼働モードは使用しない。 Note that the optimum power allocation calculation program 202 does not use an operation mode in which the drive power consumption in the operation mode table 411 is larger than the single drive supply power upper limit 2103 in the enclosure power upper limit table 210.
 ステップ705では、各フラッシュドライブ122の稼働モードを変更するために、電力性能最適化プログラム200がドライブ稼働モード変更通知プログラム203を起動する。 In step 705, the power performance optimization program 200 activates the drive operation mode change notification program 203 in order to change the operation mode of each flash drive 122.
 ドライブ稼働モード変更通知プログラム203は、ドライブ稼働モード状態テーブル223を参照し、低消費電力の稼働モードに変更する削減対象のフラッシュドライブ122について、稼働モードをモードID=3に変更してモード変更操作を行う。ドライブ稼働モード変更通知プログラム203は、モードIDを変更したフラッシュドライブ122について、ドライブ稼働モード状態テーブル223の稼働モード2233を更新する。 The drive operation mode change notification program 203 refers to the drive operation mode state table 223 and changes the operation mode to mode ID = 3 for the flash drive 122 to be reduced to be changed to the operation mode with low power consumption. I do. The drive operation mode change notification program 203 updates the operation mode 2233 of the drive operation mode state table 223 for the flash drive 122 whose mode ID has been changed.
 次に、電力性能最適化プログラム200は、冷却性能制御プログラム204を起動する。ステップ706で、冷却性能制御プログラム204は、冷却性能の強化が必要か否かを判定する。冷却性能制御プログラム204は、エンクロージャ冷却状態テーブル212の冷却性能2122を参照して、最適電力割り当て計算プログラム202が算出した合計電力値が冷却性能2122を超えていれば、冷却性能2122を強化するためステップ707へ進む。一方、冷却性能制御プログラム204は、合計電力値が冷却性能2122以下であれば、冷却性能2122を維持するのでステップ708へ進む。 Next, the power performance optimization program 200 starts the cooling performance control program 204. In step 706, the cooling performance control program 204 determines whether the cooling performance needs to be enhanced. The cooling performance control program 204 refers to the cooling performance 2122 of the enclosure cooling state table 212 and strengthens the cooling performance 2122 if the total power value calculated by the optimum power allocation calculation program 202 exceeds the cooling performance 2122. Proceed to step 707. On the other hand, if the total power value is equal to or lower than the cooling performance 2122, the cooling performance control program 204 maintains the cooling performance 2122 and proceeds to step 708.
 ステップ707では、冷却性能制御プログラム204が、電源およびファンユニット121に搭載された冷却ファンの回転速度を増大させる。冷却ファンの回転速度変更が完了した後、電力性能最適化プログラム200は、再度ドライブ稼働モード変更通知プログラム203を起動する。なお、あらかじめ設計した冷却性能が、各フラッシュドライブ122のすべてのモードにおいて上回るような場合は、この冷却性能制御プログラム204およびその参照情報は省略することができる。 In step 707, the cooling performance control program 204 increases the rotational speed of the cooling fan mounted on the power supply and fan unit 121. After the cooling fan rotation speed change is completed, the power performance optimization program 200 starts the drive operation mode change notification program 203 again. If the designed cooling performance exceeds all the modes of each flash drive 122, the cooling performance control program 204 and its reference information can be omitted.
 再度起動されたドライブ稼働モード変更通知プログラム203は、ドライブ稼働モード状態テーブル223を参照し、Write負荷の高いフラッシュドライブ122のうち、増大対象のフラッシュドライブ122の稼働モードをモードID=1に変更してモード変更操作を行う(708)。ドライブ稼働モード変更通知プログラム203は、モードIDを変更したフラッシュドライブ122について、ドライブ稼働モード状態テーブル223の稼働モード2233を更新する。 The drive operation mode change notification program 203 restarted refers to the drive operation mode state table 223 and changes the operation mode of the flash drive 122 to be increased among the flash drives 122 having a high write load to mode ID = 1. Then, a mode change operation is performed (708). The drive operation mode change notification program 203 updates the operation mode 2233 of the drive operation mode state table 223 for the flash drive 122 whose mode ID has been changed.
 上記ステップ701~708の一連の処理によりフラッシュドライブ122に割り当てられる電力(稼働モード)が、Write負荷状況により変更され、またボトルネックとなっていたフラッシュドライブ122の稼働モードを変更することでWrite性能が向上し、ストレージシステム101全体の性能が向上する。 The power (operation mode) allocated to the flash drive 122 by the series of processing in steps 701 to 708 is changed according to the write load status, and the write performance is changed by changing the operation mode of the flash drive 122 that has become a bottleneck. And the overall performance of the storage system 101 is improved.
 また、Write負荷監視プログラム201により特定のフラッシュドライブ122に対してWrite負荷が集中していないかを監視し(702)、負荷が集中していない場合は、ステップ710へ進む。 Further, the write load monitoring program 201 monitors whether the write load is concentrated on the specific flash drive 122 (702). If the load is not concentrated, the process proceeds to step 710.
 ステップ710では、電力性能最適化プログラム200が、フラッシュドライブ122の電力の割り当ての変更が行われているか否かを判定する。変更されていれば、ステップ711に進んで稼働モードを元に戻す処理を開始する。 In step 710, the power performance optimization program 200 determines whether or not the power allocation of the flash drive 122 has been changed. If it has been changed, the process proceeds to step 711 to start processing for returning the operation mode.
 一方、ステップ710の判定で、なお、電力の割り当てが変更されていない場合にはステップ720に戻って上記処理を繰り返す。すなわち、冷却装置に縮退が発生し、かつ、フラッシュドライブ122の消費電力の変更が行われていない場合には、電力性能最適化プログラム200は、消費電力の割り当て変更を禁止する。 On the other hand, if it is determined in step 710 that the power allocation has not been changed, the process returns to step 720 and the above processing is repeated. That is, when the cooling device is degenerated and the power consumption of the flash drive 122 is not changed, the power performance optimization program 200 prohibits the power consumption allocation change.
 ステップ711では、まず、ドライブ稼働モード変更通知プログラム203が、ドライブ稼働モード状態テーブル223を参照し、稼働モードがモードID=1に設定されているフラッシュドライブ122に対して、モードID=2への変更を行う。 In step 711, first, the drive operation mode change notification program 203 refers to the drive operation mode state table 223 and sets the mode ID = 2 to the flash drive 122 whose operation mode is set to mode ID = 1. Make a change.
 ドライブ稼働モード変更通知プログラム203は、モードIDを変更したフラッシュドライブ122について、ドライブ稼働モード状態テーブル223の稼働モード2233を更新する。 The drive operation mode change notification program 203 updates the operation mode 2233 of the drive operation mode state table 223 for the flash drive 122 whose mode ID has been changed.
 次に、電力性能最適化プログラム200は、冷却性能制御プログラム204を起動する。 Next, the power performance optimization program 200 starts the cooling performance control program 204.
 ステップ712で、冷却性能制御プログラム204は、エンクロージャ冷却状態テーブル212を参照し、冷却性能の強化(変更)が行われているか否かを判定する。冷却性能の強化(変更)が行われている場合は、ステップ713へ進んで冷却性能制御プログラム204は、電源およびファンユニット121に搭載された冷却ファンの回転速度を通常の状態に変更する。 In step 712, the cooling performance control program 204 refers to the enclosure cooling state table 212 and determines whether or not the cooling performance has been enhanced (changed). If the cooling performance is strengthened (changed), the process proceeds to step 713 and the cooling performance control program 204 changes the rotation speed of the cooling fan mounted on the power supply and fan unit 121 to the normal state.
 冷却性能制御プログラム204は、回転速度を低下させて、エンクロージャ冷却状態テーブル212の冷却性能2122を回転速度に応じた値に更新する。なお、冷却ファンの回転速度に応じた冷却性能が予め設定されている。 The cooling performance control program 204 updates the cooling performance 2122 of the enclosure cooling state table 212 to a value corresponding to the rotational speed by reducing the rotational speed. The cooling performance corresponding to the rotation speed of the cooling fan is set in advance.
 一方、冷却性能の強化(変更)が行われていなければステップ714へ進む。 On the other hand, if the cooling performance is not enhanced (changed), the process proceeds to step 714.
 この後、電力性能最適化プログラム200は、再度ドライブ稼働モード変更通知プログラム203を起動し、ドライブ稼働モード状態テーブル223を参照し、稼働モードがモードID=3に設定されているフラッシュドライブ122に対して、モードID=2への変更を行う(714)。ドライブ稼働モード変更通知プログラム203は、モードIDを変更したフラッシュドライブ122について、ドライブ稼働モード状態テーブル223の稼働モード2233を更新する。 Thereafter, the power performance optimization program 200 activates the drive operation mode change notification program 203 again, refers to the drive operation mode state table 223, and for the flash drive 122 whose operation mode is set to mode ID = 3. Then, the mode ID is changed to 2 (714). The drive operation mode change notification program 203 updates the operation mode 2233 of the drive operation mode state table 223 for the flash drive 122 whose mode ID has been changed.
 上記ステップ710~714の処理によって、各フラッシュドライブ122の電力割り当てが変更されていた状態から、ボトルネックが解消されて電力割り当てが元に戻り、各フラッシュドライブ122への電力の割り当てが均一に戻される。 From the state in which the power allocation of each flash drive 122 has been changed by the processing in steps 710 to 714 above, the bottleneck is resolved and the power allocation is restored, and the power allocation to each flash drive 122 is returned uniformly. It is.
 また、電力性能最適化プログラム200によりドライブエンクロージャ103に搭載される電源およびファンユニット121に縮退などの異常が検出された場合、710から714の処理を行うことで、電力割り当ての状態を最適化前の状態に戻し、電源およびファンユニット121が縮退した状態でも稼働可能なように制御を行う。 Also, when an abnormality such as degeneration is detected in the power supply and fan unit 121 mounted on the drive enclosure 103 by the power performance optimization program 200, the power allocation state is optimized by performing the processing from 710 to 714. Then, control is performed so that the power supply and fan unit 121 can operate even in a degenerated state.
 一方、冷却性能が十分に高い場合は、ステップ720に示すような電源およびファンユニット121が縮退した場合の制御は省略することが可能である。 On the other hand, when the cooling performance is sufficiently high, it is possible to omit the control when the power source and the fan unit 121 are degenerated as shown in step 720.
 さらに、ステップ720の制御を拡張し、例えば電源およびファンユニット121が縮退した場合は全フラッシュドライブ122を消費電力の少ないモードに変更させるような実装も可能である。このような拡張を行うと、電源およびファンユニット121の最大冷却性能を下げることができ、より低価格な電源およびファンユニット121を採用することでストレージシステム101のコストを下げることが可能となる。 Furthermore, the control in step 720 can be expanded, and for example, when the power supply and fan unit 121 is degenerated, all the flash drives 122 can be changed to a mode with less power consumption. When such expansion is performed, the maximum cooling performance of the power supply and fan unit 121 can be lowered, and the cost of the storage system 101 can be reduced by adopting a lower priced power supply and fan unit 121.
 なお、本フローチャートで示された電力性能最適化プログラム200の終了条件については明示的に示していないが、ストレージシステムの全体を制御するプログラムの終了条件にしたがって終了されるものとする。 Note that the termination condition of the power performance optimization program 200 shown in this flowchart is not explicitly shown, but it is assumed that the termination is performed according to the termination condition of the program that controls the entire storage system.
 図7に示した本発明によるフローチャートに従って、電力最適化を行った例を図8A、図8B、図9A、図9Bを用いて説明する。 An example in which power optimization is performed according to the flowchart of the present invention shown in FIG. 7 will be described with reference to FIGS. 8A, 8B, 9A, and 9B.
 図8Aは、電力の割り当て変更前のエンクロージャ冷却状態テーブル212の一例を示す図である。図8Bは、電力の割り当て変更前のドライブ稼働モード状態テーブル223の一例を示す図である。 FIG. 8A is a diagram illustrating an example of the enclosure cooling state table 212 before the power allocation is changed. FIG. 8B is a diagram illustrating an example of the drive operation mode state table 223 before the power allocation is changed.
 図9Aは、電力の割り当て変更後のエンクロージャ冷却状態テーブル212の一例を示す図である。図8Bは、電力の割り当て変更後のドライブ稼働モード状態テーブル223の一例を示す図である。 FIG. 9A is a diagram showing an example of the enclosure cooling state table 212 after the power allocation is changed. FIG. 8B is a diagram showing an example of the drive operation mode state table 223 after the power allocation is changed.
 図8A、図8Bに示すのは、図6に示したストレージコントローラ102およびドライブエンクロージャ103からなるストレージシステム101において、すべてのフラッシュドライブ122がモードID=2で稼働している状態を示す。図示の例では、パリティグループ2(602)にWrite負荷が集中して高負荷となり、ボトルネックになっている状況を示す。 8A and 8B show a state in which all flash drives 122 are operating in mode ID = 2 in the storage system 101 including the storage controller 102 and the drive enclosure 103 shown in FIG. In the illustrated example, the write load is concentrated on the parity group 2 (602), resulting in a high load and a bottleneck.
 図示の例では、パリティグループ1(601)と、パリティグループ3(603)、スペアグループ(605)は低負荷の状態であり、パリティグループ4(604)は中負荷の状況である。 In the illustrated example, the parity group 1 (601), the parity group 3 (603), and the spare group (605) are in a low load state, and the parity group 4 (604) is in a medium load state.
 この状態のストレージシステム101に対し、電力性能最適化プログラム200による電力の再割り当てを行った結果を図9A、図9Bに示す。 FIG. 9A and FIG. 9B show the result of performing the power reallocation by the power performance optimization program 200 on the storage system 101 in this state.
 Write負荷が集中しているパリティグループ2(602)はモードID(稼働モード2233)=1に変更されて消費電力が増大され、パリティグループ1(601)と、パリティグループ3(603)と、スペアグループ(605)はモードID=3へ変更されて消費電力が削減され、パリティグループ4(604)はモードID=2のままとなっている。また、ドライブエンクロージャ103の冷却性能も360Wから375Wへと強化されている。 The parity group 2 (602) in which the write load is concentrated is changed to mode ID (operation mode 2233) = 1 to increase power consumption, and the parity group 1 (601), parity group 3 (603), and spare The group (605) is changed to mode ID = 3 to reduce power consumption, and the parity group 4 (604) remains mode ID = 2. Also, the cooling performance of the drive enclosure 103 is enhanced from 360 W to 375 W.
 以上のように、本発明を適用することで、パリティグループ601~605間のWrite負荷の違いに対して、電力と性能の最適化を行うことが可能となる。 As described above, by applying the present invention, it is possible to optimize the power and performance against the difference in write load between the parity groups 601 to 605.
 また、図6、図8A、図8B、図9A、図9Bのような、ホスト100からのWrite負荷を、IOパタン学習テーブル222を使用して予測し、電力割り当ての再計算(703)の際に使用する以外に、ストレージコントローラ102自身が生成するWrite処理に関しても適用しうる。図10を用いて、具体的な例を示す。 Also, the write load from the host 100 as shown in FIGS. 6, 8A, 8B, 9A, and 9B is predicted using the IO pattern learning table 222, and the power allocation is recalculated (703). In addition to the above, it can also be applied to the write processing generated by the storage controller 102 itself. A specific example is shown using FIG.
 図10は、フラッシュドライブ122の故障発生時のストレージシステム101の物理的構造とパリティグループの構成を示す図である。 FIG. 10 is a diagram showing the physical structure of the storage system 101 and the configuration of the parity group when the flash drive 122 fails.
 図6と同様のストレージコントローラ102とドライブエンクロージャ103から構成されるストレージシステム101において、各フラッシュドライブ122はすべて同一のモデルとし、稼働モードテーブル411として図5に示すモードを有するものとする。 In the storage system 101 composed of the storage controller 102 and the drive enclosure 103 similar to those in FIG. 6, all the flash drives 122 are assumed to have the same model and have the mode shown in FIG.
 フラッシュドライブ122にはパリティグループ601~605が設定されている。図示の例では、RAID5として構築されたパリティグループID=1に所属する1台が、故障フラッシュドライブ1010となっている状況とする。 Parity groups 601 to 605 are set in the flash drive 122. In the example shown in the figure, it is assumed that one unit belonging to parity group ID = 1 constructed as RAID 5 is a failed flash drive 1010.
 コントローラユニット104は、パリティグループID=1の3台のフラッシュドライブ122からなるパリティグループをパリティグループ1(縮退)601Aとする。そして、コントローラユニット104は、故障フラッシュドライブ1010の代わりにパリティグループID=SPAREのフラッシュドライブ122から代替ドライブとして割り当てられたフラッシュドライブ122をパリティグループ1(アクティブスペア)601Bとする。 The controller unit 104 sets a parity group including three flash drives 122 with parity group ID = 1 as parity group 1 (degenerate) 601A. Then, the controller unit 104 sets the flash drive 122 assigned as an alternative drive from the flash drive 122 with the parity group ID = SPARE instead of the failed flash drive 1010 as the parity group 1 (active spare) 601B.
 上記以外のフラッシュドライブ122については、それぞれパリティグループ2(パリティグループID=2)602は、8台のフラッシュドライブ122で構成される。パリティグループ3(パリティグループID=3)603は、4台のフラッシュドライブ122で構成される。 For the flash drives 122 other than the above, each parity group 2 (parity group ID = 2) 602 is configured with eight flash drives 122. Parity group 3 (parity group ID = 3) 603 is composed of four flash drives 122.
 パリティグループ4(パリティグループID=4)604は、6台のフラッシュドライブ122で構成される。スペアグループ(パリティグループID=SPARE)605は、1台のフラッシュドライブ122で構成される。 Parity group 4 (parity group ID = 4) 604 is composed of six flash drives 122. The spare group (parity group ID = SPARE) 605 is composed of one flash drive 122.
 図10におけるフラッシュドライブ122の状態を図11に示す。図11は、フラッシュドライブの故障発生時のドライブ稼働モード状態テーブルの一例を示す図である。 FIG. 11 shows the state of the flash drive 122 in FIG. FIG. 11 is a diagram illustrating an example of a drive operation mode state table when a failure occurs in the flash drive.
 パリティグループ1(縮退)601Aは、RAID5による冗長性がなくなった状態であり、これに対しパリティグループ1(アクティブスペア)601Bのフラッシュドライブ122が1台追加されるため、ストレージコントローラ102によるRAID構成の再構築が行われる。 Parity group 1 (degenerate) 601A is in a state where redundancy by RAID 5 is lost, and since one flash drive 122 of parity group 1 (active spare) 601B is added, the RAID configuration of storage controller 102 A rebuild is performed.
 具体的には、パリティグループ1(縮退)601Aに所属する3台のフラッシュドライブ122からデータを読みだし、パリティ計算を行ってパリティグループ1(アクティブスペア)601Bのフラッシュドライブ122に計算結果をWriteする。 Specifically, the data is read from the three flash drives 122 belonging to the parity group 1 (degenerate) 601A, the parity calculation is performed, and the calculation result is written to the flash drive 122 of the parity group 1 (active spare) 601B. .
 この時、パリティグループ1(縮退)601Aのフラッシュドライブ122にはReadが集中し、一方パリティグループ1(アクティブスペア)601Bのフラッシュドライブ122にはWriteが集中する。 At this time, Read is concentrated on the flash drive 122 of the parity group 1 (degenerate) 601A, while Write is concentrated on the flash drive 122 of the parity group 1 (active spare) 601B.
 このような状況においても、本発明図7で示した処理を含む電力性能最適化プログラム200を適用することで、ストレージシステム101の電力の最適化と性能の向上を図ることができる。 Even in such a situation, by applying the power performance optimization program 200 including the processing shown in FIG. 7 of the present invention, the power of the storage system 101 can be optimized and the performance can be improved.
 図12は、RAID構成の再構築中のドライブ稼働モード状態テーブルの一例を示す図である。図12に示すように、パリティグループ1(縮退)601Aに属するフラッシュドライブ122の稼働モードをモードID=3に変更し、パリティグループ1(アクティブスペア)601Bに属するフラッシュドライブ122の稼働モードをモードID=1に変更することで、RAID構成の再構築時間を大幅に短縮することができる。 FIG. 12 is a diagram showing an example of a drive operation mode state table during reconstruction of a RAID configuration. As shown in FIG. 12, the operation mode of the flash drive 122 belonging to the parity group 1 (degeneration) 601A is changed to mode ID = 3, and the operation mode of the flash drive 122 belonging to the parity group 1 (active spare) 601B is changed to the mode ID. By changing to = 1, the rebuilding time of the RAID configuration can be greatly shortened.
 なお、パリティグループ構成情報テーブル221において、電力割当変更可否フラグを複数有することで、例えばホスト100からのデータアクセスの場合と、ストレージコントローラ102によるRAID構成再構築のようなアクセスの場合とで、それぞれ電力の再割り当てを行う範囲を変更するような実装も可能である。 In the parity group configuration information table 221, by having a plurality of power allocation change enable / disable flags, for example, in the case of data access from the host 100 and in the case of access such as RAID configuration reconstruction by the storage controller 102, respectively Implementations that change the range of power reallocation are also possible.
 以上のように、本実施例ではストレージコントローラ102が、書き込みが集中するフラッシュドライブ122を検出すると、書き込みの負荷が低いフラッシュドライブ122の消費電力の割り当てを低減する。そして、ストレージコントローラ102は、書き込みが集中するフラッシュドライブ122の消費電力の制限を緩和して電力を増大させることで、供給可能な電力の範囲内でストレージシステム101全体の性能を向上させることができる。 As described above, in this embodiment, when the storage controller 102 detects the flash drive 122 in which writing is concentrated, the allocation of power consumption of the flash drive 122 with a low writing load is reduced. The storage controller 102 can improve the performance of the entire storage system 101 within the range of power that can be supplied by increasing the power by relaxing the restriction on the power consumption of the flash drive 122 where writing is concentrated. .
 なお、書き込みが集中するフラッシュドライブ122は、Write負荷が第1の閾値を超えて、消費電力の制限緩和対象であり、書き込みの負荷が低いフラッシュドライブ122は、消費電力の低下を許容可能な消費電力の削減対象(制限の強化対象)である。 Note that the flash drive 122 in which writing is concentrated has a write load exceeding the first threshold value and is subject to power consumption restriction relaxation, and the flash drive 122 with a low writing load has a power consumption that can allow a reduction in power consumption. It is a target for power reduction (target for tightening restrictions).
 さらに、フラッシュドライブ122へ消費電力の割り当てを増大させる場合には、冷却性能の増大を実施することができるため、フラッシュドライブ122の発熱による過熱を防いで、フラッシュドライブ122の性能を安定させることができる。 Further, when the allocation of power consumption to the flash drive 122 is increased, the cooling performance can be increased, so that the flash drive 122 can be prevented from overheating and the performance of the flash drive 122 can be stabilized. it can.
 <まとめ>
 消費電力の増大対象のフラッシュドライブ122の選択と、消費電力の削減対象のフラッシュドライブ122の選択は、上記実施例に限定されるものではない。例えば、消費電力の増大対象のフラッシュドライブ122以外の全てを消費電力の削減対象として稼働モードを「3」に設定してもよく、ストレージシステム101に要求される性能と消費電力のバランスに応じて、適宜変更することができる。
<Summary>
The selection of the flash drive 122 whose power consumption is to be increased and the selection of the flash drive 122 whose power consumption is to be reduced are not limited to the above embodiment. For example, the operation mode may be set to “3” with all but the flash drive 122 whose power consumption is to be increased as the power consumption reduction target, depending on the balance between the performance required for the storage system 101 and the power consumption. Can be changed as appropriate.
 また、上記従来例では、不揮発性半導体メモリとしてNAND型フラッシュメモリを採用したフラッシュドライブ122を不揮発性半導体ドライブとして採用した例を示したが、これに限定されるものではなく、データの同時書き込み数の増大に伴って消費電力も増大する不揮発性半導体ドライブに適用することができる。 In the above conventional example, the flash drive 122 employing the NAND flash memory as the nonvolatile semiconductor memory is shown as the nonvolatile semiconductor drive. However, the present invention is not limited to this example. Therefore, the present invention can be applied to a nonvolatile semiconductor drive in which power consumption increases with the increase of.
 なお、本発明は上記した実施例に限定されるものではなく、様々な変形例が含まれる。例えば、上記した実施例は本発明を分かりやすく説明するために詳細に記載したものであり、必ずしも説明した全ての構成を備えるものに限定されるものではない。また、ある実施例の構成の一部を他の実施例の構成に置き換えることが可能であり、また、ある実施例の構成に他の実施例の構成を加えることも可能である。また、各実施例の構成の一部について、他の構成の追加、削除、又は置換のいずれもが、単独で、又は組み合わせても適用可能である。 In addition, this invention is not limited to the above-mentioned Example, Various modifications are included. For example, the above-described embodiments are described in detail for easy understanding of the present invention, and are not necessarily limited to those having all the configurations described. Further, a part of the configuration of one embodiment can be replaced with the configuration of another embodiment, and the configuration of another embodiment can be added to the configuration of one embodiment. In addition, any of the additions, deletions, or substitutions of other configurations can be applied to a part of the configuration of each embodiment, either alone or in combination.
 また、上記の各構成、機能、処理部、及び処理手段等は、それらの一部又は全部を、例えば集積回路で設計する等によりハードウェアで実現してもよい。また、上記の各構成、及び機能等は、プロセッサがそれぞれの機能を実現するプログラムを解釈し、実行することによりソフトウェアで実現してもよい。各機能を実現するプログラム、テーブル、ファイル等の情報は、メモリや、ハードディスク、SSD(Solid State Drive)等の記録装置、または、ICカード、SDカード、DVD等の記録媒体に置くことができる。 In addition, each of the above-described configurations, functions, processing units, processing means, and the like may be realized by hardware by designing a part or all of them with, for example, an integrated circuit. In addition, each of the above-described configurations, functions, and the like may be realized by software by the processor interpreting and executing a program that realizes each function. Information such as programs, tables, and files that realize each function can be stored in a memory, a hard disk, a recording device such as an SSD (Solid State Drive), or a recording medium such as an IC card, an SD card, or a DVD.
 また、制御線や情報線は説明上必要と考えられるものを示しており、製品上必ずしも全ての制御線や情報線を示しているとは限らない。実際には殆ど全ての構成が相互に接続されていると考えてもよい。 Also, the control lines and information lines indicate what is considered necessary for the explanation, and not all the control lines and information lines on the product are necessarily shown. Actually, it may be considered that almost all the components are connected to each other.

Claims (11)

  1.  複数の不揮発性半導体ドライブを含むストレージ装置と、
     プロセッサとメモリとを含んで前記ストレージ装置を制御する制御装置と、を有するストレージシステムであって、
     前記プロセッサは、前記不揮発性半導体ドライブの書き込み負荷をそれぞれ測定し、
     前記プロセッサは、前記書き込み負荷が所定の閾値を超える不揮発性半導体ドライブを検出した場合には、当該不揮発性半導体ドライブを消費電力の制限緩和対象として選択し、
     前記プロセッサは、前記消費電力の制限緩和対象以外の不揮発性半導体ドライブのうち、消費電力の低下を許容可能な不揮発性半導体ドライブを消費電力の制限強化対象として選択し、
     前記プロセッサは、前記消費電力の制限強化対象の不揮発性半導体ドライブの消費電力を低下させた後に、前記消費電力の制限緩和対象の不揮発性半導体ドライブの消費電力を増大させることを特徴とするストレージシステム。
    A storage device including a plurality of nonvolatile semiconductor drives;
    A storage system including a processor and a memory to control the storage device,
    The processor measures the write load of the nonvolatile semiconductor drive,
    When the processor detects a nonvolatile semiconductor drive in which the write load exceeds a predetermined threshold, the processor selects the nonvolatile semiconductor drive as a power consumption restriction relaxation target,
    The processor selects a non-volatile semiconductor drive that is allowed to reduce power consumption from non-volatile semiconductor drives other than the power consumption restriction relaxation target, as a power consumption restriction strengthening target,
    The processor increases the power consumption of the non-volatile semiconductor drive subject to the restriction of power consumption after reducing the power consumption of the non-volatile semiconductor drive subject to the restriction of power consumption restriction. .
  2.  請求項1に記載のストレージシステムであって、
     前記ストレージ装置は、
     前記不揮発性半導体ドライブを冷却する冷却装置を含み、
     前記プロセッサは、
     前記消費電力の制限緩和対象の不揮発性半導体ドライブの消費電力を増大する際に、前記冷却装置の冷却性能を強化することを特徴とするストレージシステム。
    The storage system according to claim 1,
    The storage device
    A cooling device for cooling the nonvolatile semiconductor drive,
    The processor is
    A storage system that enhances the cooling performance of the cooling device when increasing the power consumption of a nonvolatile semiconductor drive subject to relaxation of the power consumption restriction.
  3.  請求項1に記載のストレージシステムであって、
     前記プロセッサは、
     前記消費電力の制限強化対象と制限緩和対象の不揮発性半導体ドライブの消費電力を変更した後に、前記不揮発性半導体ドライブの書き込み負荷をそれぞれ測定し、前記書き込み負荷が所定の閾値を超える不揮発性半導体ドライブがない場合には、前記消費電力の制限緩和対象の不揮発性半導体ドライブと、前記消費電力の制限強化対象の不揮発性半導体ドライブの消費電力を元に戻すことを特徴とするストレージシステム。
    The storage system according to claim 1,
    The processor is
    After changing the power consumption of the non-volatile semiconductor drive subject to restriction restriction and restriction relaxation, the nonvolatile semiconductor drive measures the write load of the non-volatile semiconductor drive, and the write load exceeds a predetermined threshold If there is no power consumption, the storage system is characterized in that the power consumption of the non-volatile semiconductor drive subject to the restriction of power consumption restriction and the non-volatile semiconductor drive subject to the restriction restriction of power consumption is restored.
  4.  請求項3に記載のストレージシステムであって、
     前記ストレージ装置は、
     前記不揮発性半導体ドライブを冷却する冷却装置を含み、
     前記プロセッサは、
     前記消費電力の制限緩和対象の不揮発性半導体ドライブと、前記消費電力の制限強化対象の不揮発性半導体ドライブの消費電力を元に戻す際に、前記冷却装置の冷却性能を元に戻すことを特徴とするストレージシステム。
    The storage system according to claim 3,
    The storage device
    A cooling device for cooling the nonvolatile semiconductor drive,
    The processor is
    When the power consumption of the non-volatile semiconductor drive subject to the restriction of power consumption restriction and the non-volatile semiconductor drive subject to the restriction restriction of power consumption is restored, the cooling performance of the cooling device is restored. Storage system.
  5.  請求項1に記載のストレージシステムであって、
     前記ストレージ装置は、
     前記不揮発性半導体ドライブを冷却する冗長化された冷却装置を含み、
     前記プロセッサは、
     前記冗長化された冷却装置に縮退が発生している場合は、前記書き込み負荷が所定の閾値を超える不揮発性半導体ドライブを検出した場合でも、前記消費電力の変更を禁止することを特徴とするストレージシステム。
    The storage system according to claim 1,
    The storage device
    A redundant cooling device for cooling the nonvolatile semiconductor drive;
    The processor is
    When degeneration occurs in the redundant cooling device, the change in power consumption is prohibited even when a nonvolatile semiconductor drive having a write load exceeding a predetermined threshold is detected. system.
  6.  請求項1に記載のストレージシステムであって、
     前記メモリは、
     前記不揮発性半導体ドライブ毎に前記消費電力の変更を許容するか否かを予め設定した電力割り当て変更可否フラグを格納し、
     前記プロセッサは、前記消費電力の制限緩和対象以外の不揮発性半導体ドライブのうち、前記電力割り当て変更可否フラグが前記消費電力の変更を許容する不揮発性半導体ドライブから、消費電力の低下を許容可能な不揮発性半導体ドライブを消費電力の制限強化対象として選択することを特徴とするストレージシステム。
    The storage system according to claim 1,
    The memory is
    Storing a power allocation change enable / disable flag set in advance as to whether or not to allow change of the power consumption for each nonvolatile semiconductor drive;
    The processor is a non-volatile semiconductor drive that is allowed to reduce power consumption from a non-volatile semiconductor drive that is allowed to change the power consumption among non-volatile semiconductor drives that are not targeted for relaxation of the power consumption restriction. A storage system characterized in that a selectable semiconductor drive is selected as a target for enforcing a restriction on power consumption.
  7.  請求項1に記載のストレージシステムであって、
     前記不揮発性半導体ドライブは、
     当該不揮発性半導体ドライブに設定された書き込みの多重度に応じた稼働モードで前記消費電力を制限することを特徴とするストレージシステム。
    The storage system according to claim 1,
    The nonvolatile semiconductor drive is
    A storage system, wherein the power consumption is limited in an operation mode corresponding to the multiplicity of writing set in the nonvolatile semiconductor drive.
  8.  請求項1に記載のストレージシステムであって、
     前記プロセッサは、
     前記不揮発性半導体ドライブの書き込み負荷として、当該不揮発性半導体ドライブに対する書き込みのIOPSを用いることを特徴とするストレージシステム。
    The storage system according to claim 1,
    The processor is
    A storage system, wherein write IOPS for the nonvolatile semiconductor drive is used as a write load of the nonvolatile semiconductor drive.
  9.  請求項1に記載のストレージシステムであって、
     前記プロセッサは、
     前記消費電力の制限緩和対象の不揮発性半導体ドライブの消費電力と、前記消費電力の制限強化対象の不揮発性半導体ドライブの消費電力の総和が、電源で供給可能な電力以下となるように、前記消費電力の制限強化対象の不揮発性半導体ドライブを選択することを特徴とするストレージシステム。
    The storage system according to claim 1,
    The processor is
    The power consumption is reduced so that the sum of the power consumption of the nonvolatile semiconductor drive subject to relaxation of the power consumption restriction and the power consumption of the nonvolatile semiconductor drive subject to restriction of power consumption is less than or equal to the power that can be supplied by the power source. A storage system, wherein a non-volatile semiconductor drive to be subjected to power restriction is selected.
  10.  プロセッサとメモリとを含む制御装置で、複数の不揮発性半導体ドライブを含むストレージ装置を制御するストレージ装置の制御方法であって、
     前記プロセッサは、前記不揮発性半導体ドライブの書き込み負荷をそれぞれ測定する第1のステップと、
     前記プロセッサは、前記書き込み負荷が所定の閾値を超える不揮発性半導体ドライブを検出した場合には、当該不揮発性半導体ドライブを消費電力の制限緩和対象として選択する第2のステップと、
     前記プロセッサは、前記消費電力の制限緩和対象以外の不揮発性半導体ドライブのうち、消費電力の低下を許容可能な不揮発性半導体ドライブを消費電力の制限強化対象として選択する第3のステップと、
     前記プロセッサは、前記消費電力の制限強化対象の不揮発性半導体ドライブの消費電力を低下させた後に、前記消費電力の制限緩和対象の不揮発性半導体ドライブの消費電力を増大させる第4のステップと、
    を含むことを特徴とするストレージ装置の制御方法。
    A storage device control method for controlling a storage device including a plurality of nonvolatile semiconductor drives in a control device including a processor and a memory,
    The processor includes a first step of measuring a write load of the nonvolatile semiconductor drive;
    The processor, when detecting a nonvolatile semiconductor drive in which the write load exceeds a predetermined threshold, selecting the nonvolatile semiconductor drive as a power consumption restriction relaxation target; and
    The processor selects a non-volatile semiconductor drive that is allowed to reduce power consumption among non-volatile semiconductor drives other than the power consumption restriction relaxation target as a power consumption restriction strengthening target;
    A fourth step of increasing the power consumption of the non-volatile semiconductor drive targeted for relaxation of the restriction of power consumption after reducing the power consumption of the non-volatile semiconductor drive targeted for strengthening of the restriction of power consumption;
    A method for controlling a storage apparatus.
  11.  プロセッサとメモリとを含んで、複数の不揮発性半導体ドライブを含むストレージ装置を制御するストレージ制御装置であって、
     前記プロセッサは、前記不揮発性半導体ドライブの書き込み負荷をそれぞれ測定し、
     前記プロセッサは、前記書き込み負荷が所定の閾値を超える不揮発性半導体ドライブを検出した場合には、当該不揮発性半導体ドライブを消費電力の制限緩和対象として選択し、
     前記プロセッサは、前記消費電力の制限緩和対象以外の不揮発性半導体ドライブのうち、消費電力の低下を許容可能な不揮発性半導体ドライブを消費電力の制限強化対象として選択し、
     前記プロセッサは、前記消費電力の制限強化対象の不揮発性半導体ドライブの消費電力を低下させた後に、前記消費電力の制限緩和対象の不揮発性半導体ドライブの消費電力を増大させることを特徴とするストレージ制御装置。
    A storage control device for controlling a storage device including a plurality of nonvolatile semiconductor drives, including a processor and a memory,
    The processor measures the write load of the nonvolatile semiconductor drive,
    When the processor detects a nonvolatile semiconductor drive in which the write load exceeds a predetermined threshold, the processor selects the nonvolatile semiconductor drive as a power consumption restriction relaxation target,
    The processor selects a non-volatile semiconductor drive that is allowed to reduce power consumption from non-volatile semiconductor drives other than the power consumption restriction relaxation target, as a power consumption restriction strengthening target,
    The storage control is characterized in that the processor increases the power consumption of the non-volatile semiconductor drive targeted for relaxation of the power consumption restriction after reducing the power consumption of the non-volatile semiconductor drive targeted for strengthening the restriction of power consumption. apparatus.
PCT/JP2017/015988 2017-04-21 2017-04-21 Storage system, control method for storage device, and storage control device WO2018193608A1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
PCT/JP2017/015988 WO2018193608A1 (en) 2017-04-21 2017-04-21 Storage system, control method for storage device, and storage control device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2017/015988 WO2018193608A1 (en) 2017-04-21 2017-04-21 Storage system, control method for storage device, and storage control device

Publications (1)

Publication Number Publication Date
WO2018193608A1 true WO2018193608A1 (en) 2018-10-25

Family

ID=63856539

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2017/015988 WO2018193608A1 (en) 2017-04-21 2017-04-21 Storage system, control method for storage device, and storage control device

Country Status (1)

Country Link
WO (1) WO2018193608A1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114110964A (en) * 2021-11-26 2022-03-01 珠海格力电器股份有限公司 Switching control method and device based on FLASH FLASH memory and air conditioner

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10307648A (en) * 1997-05-09 1998-11-17 Toshiba Corp Computer system and its cleaning control method
JP2012523593A (en) * 2009-07-15 2012-10-04 株式会社日立製作所 Storage system and control method of storage device
JP2016184371A (en) * 2015-03-27 2016-10-20 富士通株式会社 Storage control unit, storage unit and storage control program

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10307648A (en) * 1997-05-09 1998-11-17 Toshiba Corp Computer system and its cleaning control method
JP2012523593A (en) * 2009-07-15 2012-10-04 株式会社日立製作所 Storage system and control method of storage device
JP2016184371A (en) * 2015-03-27 2016-10-20 富士通株式会社 Storage control unit, storage unit and storage control program

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114110964A (en) * 2021-11-26 2022-03-01 珠海格力电器股份有限公司 Switching control method and device based on FLASH FLASH memory and air conditioner
CN114110964B (en) * 2021-11-26 2022-11-18 珠海格力电器股份有限公司 Switching control method and device based on FLASH FLASH memory and air conditioner

Similar Documents

Publication Publication Date Title
US10241877B2 (en) Data storage system employing a hot spare to proactively store array data in absence of a failure or pre-failure event
US10372185B2 (en) Enhanced power control of data storage arrays
US7434097B2 (en) Method and apparatus for efficient fault-tolerant disk drive replacement in raid storage systems
US9519554B2 (en) Storage system with rebuild operations
KR102414047B1 (en) Convergence memory device and method thereof
US11137940B2 (en) Storage system and control method thereof
US20090271564A1 (en) Storage system
KR20130091628A (en) System and method for improved rebuild in raid
JP2016530637A (en) RAID parity stripe reconstruction
US8495295B2 (en) Mass storage system and method of operating thereof
JP2007323224A (en) Flash memory storage system
JP2007156597A (en) Storage device
JP6515752B2 (en) Storage control device, control method, and control program
US20200285551A1 (en) Storage system, data management method, and data management program
KR20110084873A (en) Power and performance management using maidx and adaptive data placement
CN111164567A (en) Method and apparatus for selecting power states in a memory device
WO2018193608A1 (en) Storage system, control method for storage device, and storage control device
US9569329B2 (en) Cache control device, control method therefor, storage apparatus, and storage medium
US11385815B2 (en) Storage system
US9032150B2 (en) Storage apparatus and control method of storage apparatus
US20140244928A1 (en) Method and system to provide data protection to raid 0/ or degraded redundant virtual disk
US20120215966A1 (en) Disk array unit and control method thereof
US10712956B2 (en) Management method and storage system using the same
JP4714720B2 (en) Storage device, control method therefor, and disk device
JP2024033475A (en) storage system

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 17906271

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 17906271

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: JP