WO2015128955A1 - 記憶デバイス、記憶デバイスを有する装置、及び記憶制御方法 - Google Patents

記憶デバイス、記憶デバイスを有する装置、及び記憶制御方法 Download PDF

Info

Publication number
WO2015128955A1
WO2015128955A1 PCT/JP2014/054643 JP2014054643W WO2015128955A1 WO 2015128955 A1 WO2015128955 A1 WO 2015128955A1 JP 2014054643 W JP2014054643 W JP 2014054643W WO 2015128955 A1 WO2015128955 A1 WO 2015128955A1
Authority
WO
WIPO (PCT)
Prior art keywords
data
write
compressed
storage medium
logical
Prior art date
Application number
PCT/JP2014/054643
Other languages
English (en)
French (fr)
Inventor
水島 永雅
純司 小川
篤志 河村
Original Assignee
株式会社日立製作所
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社日立製作所 filed Critical 株式会社日立製作所
Priority to PCT/JP2014/054643 priority Critical patent/WO2015128955A1/ja
Priority to US15/110,310 priority patent/US10444992B2/en
Priority to JP2016504903A priority patent/JP6134857B2/ja
Publication of WO2015128955A1 publication Critical patent/WO2015128955A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11CSTATIC STORES
    • G11C7/00Arrangements for writing information into, or reading information out from, a digital store
    • G11C7/10Input/output [I/O] data interface arrangements, e.g. I/O data control circuits, I/O data buffers
    • G11C7/1006Data managing, e.g. manipulating data before writing or reading out, data bus switches or control circuits therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/0604Improving or facilitating administration, e.g. storage management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F12/00Accessing, addressing or allocating within memory systems or architectures
    • G06F12/02Addressing or allocation; Relocation
    • G06F12/0223User address space allocation, e.g. contiguous or non contiguous base addressing
    • G06F12/023Free address space management
    • G06F12/0238Memory management in non-volatile memory, e.g. resistive RAM or ferroelectric memory
    • G06F12/0246Memory management in non-volatile memory, e.g. resistive RAM or ferroelectric memory in block erasable memory, e.g. flash memory
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/0614Improving the reliability of storage systems
    • G06F3/0616Improving the reliability of storage systems in relation to life time, e.g. increasing Mean Time Between Failures [MTBF]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0638Organizing or formatting or addressing of data
    • G06F3/0644Management of space entities, e.g. partitions, extents, pools
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0662Virtualisation aspects
    • G06F3/0665Virtualisation aspects at area level, e.g. provisioning of virtual or logical volumes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/067Distributed or networked storage systems, e.g. storage area networks [SAN], network attached storage [NAS]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/0671In-line storage system
    • G06F3/0673Single storage device
    • G06F3/0679Non-volatile semiconductor memory device, e.g. flash memory, one time programmable memory [OTP]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2212/00Indexing scheme relating to accessing, addressing or allocation within memory systems or architectures
    • G06F2212/40Specific encoding of data in memory or cache
    • G06F2212/401Compressed data

Definitions

  • the present invention generally relates to storage control, for example, control for reducing the amount of data written to a storage medium in a storage device.
  • a storage device generally includes a storage medium and a medium controller that controls I / O (Input / Output) of data with respect to the storage medium.
  • I / O Input / Output
  • an apparatus having a storage device for example, there is a storage apparatus or a host apparatus that performs data I / O to the storage apparatus.
  • a batch erasable nonvolatile semiconductor memory As a storage medium, for example, a batch erasable nonvolatile semiconductor memory has been developed.
  • An example of such a nonvolatile semiconductor memory is a flash memory.
  • a flash memory (typically, a NAND flash memory) has a plurality of blocks, and each block has a plurality of pages. Data I / O is performed in page units, and data is erased in block units. The erase time is shorter than the write time. Therefore, the update of the recording data (written data) in the flash memory is generally performed as follows.
  • the medium controller reads the recording data (data before updating) from the page, creates the updating data by reflecting the write target data in at least a part of the recording data, writes the updating data to the empty page, and records data Is invalidated (processing for disabling reference from the host device of the storage device). Then, when the empty page is exhausted, the media controller deletes the data from the blocks that are all invalid pages (invalidated pages), thereby setting the invalid pages as empty pages.
  • Each page includes a plurality of (for example, 16) sectors. Since writing is performed in units of pages, it is necessary to rewrite one page including the sector even if only one sector is rewritten.
  • Flash memory generally has a limit on the number of times data can be erased.
  • a block in which the number of times of erasure has increased due to concentration of data rewriting cannot be erased and becomes unusable. For this reason, it is necessary to prevent the data erasure process from being concentrated on a specific block.
  • data errors in the data in the page increase with time, so the media controller performs an operation called “refresh” that moves data that has passed for a certain time from writing to another page.
  • a deduplication technique such as that disclosed in Patent Document 1 in order to shorten the data erasing time or reduce the number of times of erasing.
  • the deduplication technique when a logical address provided to a host device and a physical address of an actual storage area are managed in association with each other, a plurality of logical address spaces (for example, logical pages) in which duplicate data is stored are stored. This is a technique for associating with one physical address space (for example, physical page) in which the data is stored.
  • the deduplication technique the amount of data written to the storage medium can be reduced, and the life of the flash memory can be extended in a storage device using the flash memory as a storage medium.
  • Patent Document 1 allocates one physical page to a plurality of logical pages having overlapping data, thereby reducing the write amount (the amount of data written to the flash memory). However, only a slight data update is performed on each of those logical pages, and the data in each update destination logical page is excluded from the object of deduplication. A new physical page in which is written is allocated. As a result, the amount of writing increases.
  • This type of problem is not limited to logical pages that are deduplicated. For example, for a logical page that has not been deduplicated, update data is written to a new physical page (ie, the physical page is newly consumed) with only a slight data update for that logical page.
  • this kind of problem is not limited to the flash memory, but may also be applied to other types of storage media that have a limited number of erasures (number of rewrites).
  • An object of the present invention is to reduce the amount of writing to a storage medium of a storage device.
  • the storage device has a storage medium and a medium controller that controls I / O to the storage medium and provides a logical space based on the storage medium to the host device.
  • the logical space is composed of a plurality of logical areas. For each logical area, a reference data range exists on the storage medium.
  • the medium controller receives a write command designating the write destination logical address from the host device, and reads the reference data from the reference data range corresponding to the write destination logical area to which the write destination logical address belongs.
  • the medium controller creates differential data that is an exclusive OR of the first data that is the reference data and the second data that is either the data based on the write data according to the write command and the write data.
  • the medium controller creates compressed difference data by compressing the difference data, writes the compressed difference data to the storage medium, and associates the difference data range, which is the range in which the compressed difference data is written, with the write destination logical area.
  • the media controller receives a read command from the higher-level device that has the same logical area as the write destination logical area as the read source, the media controller and the difference associated with the read source logical area Based on the data, the read data according to the read command can be restored.
  • the amount of writing in the storage medium in the storage device can be reduced, thereby extending the life of the storage medium.
  • FIG. 1 shows a configuration of an FM module according to the embodiment.
  • FIG. 2A shows a data format (plain text state) for a single allocation page.
  • FIG. 2B shows the sector format (plaintext state) for the duplicate allocation page.
  • FIG. 2C shows a code part format for the duplicate allocation page.
  • FIG. 3 shows an example of a data write method to the flash memory and a data storage state.
  • FIG. 4A shows an address conversion table.
  • FIG. 4B shows a duplicate count table.
  • FIG. 5 is a flowchart of the write command process.
  • FIG. 6 is a flowchart of the entire write process for a single allocation page.
  • FIG. 7 is a flowchart of partial write processing for a single allocation page.
  • FIG. 8 is a flowchart of the entire write process for the duplicate allocation page.
  • FIG. 9 is a flowchart of partial write processing for a duplicate allocation page.
  • FIG. 10 is a conceptual diagram of the entire write process for a single allocation page.
  • FIG. 11 is a conceptual diagram of partial write processing for a single allocation page.
  • FIG. 12 is a conceptual diagram of the entire write process for the duplicate allocation page.
  • FIG. 13 is a conceptual diagram of partial write processing for a duplicate allocation page.
  • FIG. 14 shows a configuration of a computer system having the storage apparatus according to the embodiment.
  • FIG. 15A shows two methods of forming user data for a single allocation page.
  • FIG. 15B shows two methods of forming user data for the duplicate allocation page.
  • FIG. 16 shows the configuration of the host.
  • kkk table information may be described using the expression “kkk table”, but the information may be expressed using a data structure other than the table. In order to show that it does not depend on the data structure, the “kkk table” can be called “kkk information”.
  • the communication interface device may be abbreviated as “I / F”, and the flash memory may be abbreviated as “FM”.
  • FIG. 14 shows a configuration of a computer system having a storage apparatus according to the embodiment.
  • the computer system includes a storage device 1400, a host (host computer) 1421, and a management computer 1420.
  • the host 1421 may be connected to the storage apparatus 1400 via a communication network such as a SAN (Storage Area Network) 1410.
  • the management computer 1420 may be connected to the storage apparatus 1400 via a communication network (not shown) such as a LAN (Local Area Network).
  • the host 1421 and the management computer 1420 may be connected to the same communication network.
  • the storage apparatus 1400 includes a plurality of FM modules 100 and a storage controller 1401 that controls I / O for the plurality of FM modules 100.
  • the storage controller 1401 receives the command transmitted from the host 1421, interprets the command, and reads / writes data in the storage area of the storage apparatus 1400.
  • the storage apparatus 1400 includes an HI / F (I / F that communicates with the host 1421) 1431, an SI / F (I / F that communicates with the FM module 100) 1451, and an MI / F (management computer 1420).
  • (I / F) 1430 that communicates, a memory 1442, and a CPU 1441 connected thereto.
  • the HI / F 1431 is an I / F that accepts an I / O request or a control command from the host 1421.
  • the S-I / F 1451 is an I / F that transmits data and control commands to the FM module 100.
  • the MI / F 1430 is an I / F that receives control commands and the like related to management and maintenance from the management computer 1420.
  • the CPU 1441 functions as an arithmetic processing device, and has a function of controlling the operation of the entire storage device 1400 according to various programs, arithmetic parameters, and the like stored in the memory 1442. Specifically, for example, the CPU 1441 processes user data input / output (data I / O) between the storage apparatus 1400 and the host in accordance with an I / O request or the like from the host 1421, and sends the user to the FM module 100. A write command for writing data is issued to the FM module 100, and a read command for reading user data from the FM module 100 is issued to the FM module 100. In addition, the CPU 1441 creates a guarantee code (described later) for the user data received from the host 1421 and assigns it to the user data.
  • a guarantee code (described later) for the user data received from the host 1421 and assigns it to the user data.
  • the memory 1442 stores management information in addition to various programs and calculation parameters.
  • the memory 1442 has a cache memory area.
  • the cache memory area temporarily stores user data to be written to the FM module 100 and user data read from the FM module 100.
  • the “user data” may be mainly read / write target data in accordance with a read / write request (I / O request) from the host 1421 for the storage controller 1401, and FM.
  • a read / write request I / O request
  • FM controller 103 see FIG. 1 in the module 100, data to be read / written according to a read / write command from the storage controller 1401 may be used.
  • FIG. 14 six FM modules 100 are provided, but the number of FM modules 100 is not limited to this example.
  • the internal configuration of the FM module 100 will be described later in detail with reference to FIG.
  • the FM module 100 exists in the storage apparatus 1400.
  • the present invention is not limited to this example, and the FM module 100 may exist outside the storage apparatus 1400.
  • the host 1421 is connected to the storage apparatus 1400 via the SAN 1410, and transmits a data read / write request (I / O request) to the storage apparatus 1400.
  • the host 1421 may be, for example, a personal computer, a workstation, or a main frame.
  • a block protocol such as SCSI (Small Computer System Interface) may be used.
  • the management computer 1420 may be, for example, a personal computer, a workstation, or a mainframe.
  • the management computer 1420 may manage the storage device 1400 and the like.
  • the host device of the FM module 100 is the storage controller 1401.
  • the FM module includes a flash memory 105 including a plurality of FM chips, and an FM controller 103 that controls I / O for the flash memory 105.
  • an example of features and handling of the flash memory 105 will be described.
  • the flash memory 105 has a feature that the minimum erase unit is larger than the minimum write unit. Specifically, for example, the flash memory 105 (each FM chip) has a plurality of blocks (physical blocks), and each block has a plurality of (for example, 256) pages (physical pages). Data is erased in block units, and data is read and written in page units. The page size is 8640 bytes, for example.
  • the flash memory 105 cannot directly overwrite data due to its characteristics. That is, when data is rewritten, the FM controller 103 saves other valid data stored in the block including the data to another block, and erases the data from the original block. Then, the FM controller 103 rewrites data by writing new data to the erased block in units of pages.
  • the data rewriting process in the flash memory 105 involves erasing data in block units (physical block units).
  • the time required for erasing one block of data in the flash memory 105 is longer than the time required for writing one page of data (for example, about one digit longer). Therefore, if data erasure for one block is executed every time in order to rewrite data for one page, the data rewriting performance of the flash memory 105 deteriorates. It is necessary to write data using an algorithm that can hide the time to erase data from the flash memory 105.
  • each block of the flash memory 105 has a limited number of erasures. For example, an erase count of up to 10,000 times per block is guaranteed. In this case, when data rewriting concentrates on one block and the erase count of the block exceeds the guaranteed count (upper limit), data erase may not be possible, and the block becomes unusable thereafter. There is a problem that the number of usable blocks decreases. Therefore, it is necessary to perform the erase count leveling process by exchanging stored data between a block with a large erase count and a block with a small erase count so that the erase process for a specific block is not concentrated.
  • the flash memory 105 has a feature that, for a page once written, data errors increase with time even if data is held.
  • the FM controller 103 adds in advance a parity based on an error correction code (ECC) to data to be written on the page.
  • ECC error correction code
  • the FM controller 103 reads data that has passed a certain time after writing, corrects it using the parity while there are few data errors, and performs refresh processing to move the corrected data to another page. Even when this process is executed, the FM controller 103 needs to equalize the number of times of erasure and consider the influence on the performance.
  • the FM controller 103 dynamically associates the logical address provided to the host device with the physical address of the actual storage area in order to conceal the erasure time and level the number of erasures.
  • a conversion process from a logical address to a physical address is performed at the time of writing. That is, the host device may write data into the logical address space by dynamically changing the correspondence between the logical address provided to the host device and the physical address of the flash memory 105 by the FM controller 103.
  • the FM controller 103 manages the address so that the host device does not need to be aware of the change of the physical address accompanying the additional writing to the unused page at the time of data writing.
  • the deduplication technique is a technique for associating a plurality of logical address spaces in which duplicate data is stored with one physical address space in which the data is stored.
  • the amount of writing in the flash memory 105 can be reduced by deduplication technology.
  • format processing is considered as a case where application of the deduplication technique is considered effective.
  • the storage controller 1401 executes format processing for the purpose of detecting the abnormal part and initializing stored data. Specifically, for example, the storage controller 1401 writes simple pattern data (for example, all-zero data in which all bits are “0”) in which specific values are continuous in all storage areas based on the FM module 100.
  • the formatting process unnecessarily increases the number of rewrites in a storage medium such as the flash memory 105 where the number of rewrites is limited.
  • the flash memory 105 employs a method of appending to unused pages for data rewriting, if the consumption of unused pages increases, data erasure processing that requires processing time must be executed frequently. Don't be.
  • the format process is a process that reduces unused pages and impairs performance. Therefore, in this embodiment, the deduplication technology is applied to the FM module 100, thereby reducing the amount of data written, and thereby extending the life of the flash memory 105.
  • the FM controller 103 checks the pattern of the data to be written or receives a notification from the storage controller 1401 (for example, the write command from the storage controller 1401 is set with a value that indicates the format. Therefore, it can be detected that the data to be written is data to be written by the formatting process.
  • the storage apparatus 1400 can detect bit corruption that occurs in user data due to a hardware failure or the like, and user data writing to or reading from an illegal address caused by an internal control error or the like. Therefore, the storage controller 1401 divides the user data to be written into sector units (for example, one sector is 512 bytes) and consists of a plurality of sector data, and assigns a guarantee code of a predetermined length (for example, 16 bytes) to each. .
  • the guarantee code includes a CRC (Cyclic Redundancy Check) calculated from each sector data in order for the CPU 1441 to detect garbled user data.
  • the guarantee code may include related information (hereinafter, metadata) of user data that can be freely set by the storage apparatus vendor.
  • the metadata includes, for example, information such as a logical storage location of user data in the computer system (specifically, for example, logical volume number and logical sector address), information such as user data update date and time, and It may be at least one of information such as a generation number of user data.
  • the logical volume is a logical storage device provided to the host 1421 by the storage apparatus 1400. In the I / O request from the host 1421, the logical address of the logical volume is specified. One or more logical pages provided by each of the one or more FM modules 100 correspond to the area according to the logical address (area in the logical volume).
  • the storage controller 1401 determines the logical address specified by the I / O command transmitted to the FM module 100 based on the logical address specified by the I / O request.
  • the guarantee code value differs for each sector data, so even if the sector data has the same value, the guarantee code is different. There may be a problem that deduplication cannot be performed.
  • the FM controller 103 first separates the sector data and the guarantee code from the user data including the guarantee code, and collects only the sector data (hereinafter referred to as the sector portion).
  • a collection of only guarantee codes (hereinafter referred to as a code part), which is a target of data sharing at the time of deduplication, is managed separately from the sector part.
  • the sector part and the code part are stored in the flash memory 105 as independent ones. Note that user data that is not subjected to de-duplication processing is stored in the flash memory 105 without being separated into a sector part and a code part.
  • the logical page when the data of a physical page storing data for a certain logical page is shared as data for another logical page by performing deduplication processing, the logical page The page is referred to as a “duplicate assignment page”. In addition, when the data of a physical page storing data for a certain logical page is not shared as data for any other logical page, the logical page is referred to as a “single allocation page”. And
  • the FM controller 103 further reduces the amount of writing in the flash memory 105 by compressing data stored in the flash memory 105 using a lossless compression algorithm.
  • a lossless compression algorithm For example, the LZ77 algorithm is applied as the lossless compression algorithm.
  • the data reduction effect by compression is high for data that includes a lot of long and continuous patterns having the same value (for example, zero).
  • the FM module 100 includes a flash memory 105 composed of a plurality of FM chips, and an FM controller 103 that controls read / write with respect to the flash memory 105.
  • the FM controller 103 includes a host I / F 102 connected to a host device (storage controller 1401), a DRAM (Dynamic Random Access Memory) 106 that is an example of a memory (for example, a volatile memory), and a controller main body connected to them. 101.
  • the controller main body 101 includes a compression / decompression circuit 104 and an XOR circuit 107.
  • the controller main body 101 may include a processor (microprocessor) that controls the host I / F 102, the flash memory 105, and the DRAM 106.
  • the processor interprets a read / write command received through the upper I / F 102, transmits / receives read / write data, causes the compression / decompression circuit 104 to perform data compression / decompression, and causes the XOR circuit 107 to perform exclusive logic It is possible to execute sum calculation and to transfer data between the flash memory 105 and the DRAM 106.
  • the host I / F 102 receives user data according to the write command issued from the host device from the host device, or transmits user data according to the read command issued from the host device to the host device.
  • the compression / decompression circuit 104 may be an arithmetic unit implemented as hardware (logic circuit) in the FM controller 103, and reversibly convert plaintext (plaintext data) using a predetermined lossless transformation compression algorithm (for example, LZ77 algorithm).
  • Compressed data can be created by compression, or original plaintext data can be created by decompressing the compressed data.
  • the XOR circuit 107 may be an arithmetic unit implemented as hardware (logic circuit) in the FM controller 103, and can calculate exclusive OR of two pieces of data having the same size, and create data having the same size as those.
  • the exclusive OR is an operation that creates 0 when there is an equal value at the same position of two data, and creates 1 when there is a different value. Therefore, the more similar the two data input to the XOR circuit 107, the more the data to be created becomes data that has a long zero value and includes many continuous patterns. Note that the amount of data can be greatly reduced by compressing such data using the above compression algorithm.
  • the DRAM 106 temporarily stores write data received from the host device (data written to the flash memory 105) and read data transmitted to the host device (data read from the flash memory 105).
  • the DRAM 106 functions as a write buffer that temporarily stores data to be written to the flash memory 105.
  • the DRAM 106 functions as a read buffer that temporarily stores data read from the flash memory 105.
  • the DRAM 106 functions as a transfer source of data compressed / decompressed by the compression / decompression circuit 104 and a transfer destination of compression / decompression result data (compressed data / plaintext data).
  • the DRAM 106 functions as a transfer source of two data for which an exclusive OR is calculated by the XOR circuit 107 and a transfer destination of the creation result data by the XOR circuit 107.
  • FIG. 2A shows a data format of plain text user data (plain text state user data) written on a single allocation page.
  • the user data (Di, Gi) 200 including the guarantee code has a length of 8448 bytes in a plain text state and includes 16 512-byte sector data (201, 202, 203,..., 204), Byte guarantee codes (211, 212, 213,..., 214) are added.
  • the FM controller 103 compresses the plain text user data of the single allocation page and writes the compressed user data (compressed user data) to the flash memory 105.
  • the user data of the single allocation page is the user data itself
  • the user data of the single allocation page is the reference data (8448 bytes) and the difference data ( 8448 bytes).
  • the FM controller 103 compresses the user data itself and writes it in the flash memory 105.
  • the FM controller 103 compresses the reference data and the difference data and writes them separately to the flash memory 105.
  • the FM controller 103 decompresses the reference data and the difference data read from the flash memory 105 by the compression / decompression circuit 104 to return to the plain text state. It is necessary to create exclusive OR data of the state reference data and difference data from the XOR circuit 107.
  • FIG. 15A is a conceptual diagram of two formation methods.
  • the user data itself in the first forming method may also be referred to as “reference data”.
  • the amount of writing in the flash memory 105 can be reduced by applying the second formation method to the user data of the single allocation page.
  • the reason is as follows.
  • the difference between user data before update and user data after update is only the 100th bit (only 1 bit).
  • the reference data is user data before update
  • the difference data is data in which the 100th bit is 1 and all the remaining bits are 0.
  • the pre-update user data remains in the flash memory 105 as valid data
  • the compressed differential data is further written as valid data.
  • the difference data is data including a pattern having a long zero value and a continuous pattern
  • the amount of difference data in the compressed state becomes very small.
  • the total size of the compressed pre-update user data and the compressed differential data is smaller than the size of the compressed post-update user data.
  • the write amount of the flash memory 105 can be reduced and the life of the flash memory 105 can be extended.
  • FIG. 2B shows the data format of the plaintext sector part which is a sector part separated from the plaintext user data of the overlapping allocation page.
  • the sector part Dj220 has a length of 8192 bytes in a plain text state and is composed of 16 pieces of 512-byte sector data (221, 222, 223,..., 224).
  • FIG. 2C shows the data format of the plaintext code part separated from the plaintext user data on the duplicate allocation page.
  • the code part Gj230 has a length of 256 bytes and is composed of 16 16-byte guarantee codes (231, 232, 233,..., 234).
  • the flash memory 105 is written with a sector portion in which the plaintext sector portion according to the format of FIG. 2B is compressed and a plaintext code portion according to the format of FIG. 2C.
  • the FM module 100 there are two formation methods for the sector portion of the overlapping allocation page.
  • the sector part of the overlapping allocation page is the sector part itself separated from the user data.
  • it is an exclusive OR of the reference data (8192 bytes) and the difference data (8192 bytes).
  • the sector portion itself is compressed and written to the flash memory 105.
  • the reference data and the difference data are compressed and written to the flash memory 105 separately.
  • the FM controller 103 decompresses the reference data and the difference data read from the flash memory 105 by the compression / decompression circuit 104, respectively, and the exclusive OR data of the reference data and the difference data in the plaintext state Is created by the XOR circuit 107.
  • the sector part of the overlapping allocation page is a sector part according to the first forming method
  • the sector part itself is shared by a plurality of logical pages. That is, the sector part in the physical page allocated to the overlapping allocation page is shared by a plurality of logical pages (duplicated allocation page).
  • FIG. 15B is a conceptual diagram showing how user data A and D to which the first forming method is applied and user data B and C to which the second forming method is applied share reference data, for example.
  • the sector part itself in the first forming method is also referred to as reference data.
  • the write amount of the flash memory 105 can be reduced. The reason is as follows.
  • the difference between the sector portion of user data A and the sector portion of user data B is only the 100th bit (only 1 bit).
  • the prior art including Patent Document 1
  • the two are determined to be different data and are not managed as duplicate allocation pages, but are compressed separately and stored in the flash memory 105.
  • the second forming method is applied to the sector portion of the user data B, so that the sector portion of the user data A becomes reference data, and the data in which the 100th bit is 1 and all the remaining bits are 0 This is the difference data B.
  • the compressed reference data (sector portion) and the compressed difference data B are written in the flash memory 105.
  • the difference data B is data including a pattern having a long zero value and a continuous pattern
  • the size is very small.
  • the amount of writing is smaller than when the sector portion of user data A and the sector portion of user data B are separately compressed and written to the flash memory 105.
  • deduplication is applied not only when the sector portions of a plurality of logical pages completely match, but also when there are many portions matching the sector portions of the plurality of logical pages.
  • the amount of writing to the flash memory 105 can be reduced, and the life of the flash memory 105 can be extended.
  • the fill (pattern) means data (user data, sector part or code part), and the white paint means dummy data (null data).
  • the FM controller 103 compresses the reference data and difference data according to the data format of FIG. 2A or FIG. 2B by the compression / decompression circuit 104 in order to reduce the writing amount of the flash memory 105.
  • the size of the compressed data varies depending on the original plaintext data (structure of plaintext data). The size of data including many patterns having the same value continues to be reduced by compression, but the size of data including many random patterns may be increased by compression.
  • the compressed data and the code portion according to the data format of FIG. 2C are temporarily stored in the write buffer on the DRAM 106 until being written to the flash memory 105 as shown on the left side of FIG.
  • the FM controller 103 concatenates the compressed data in the write buffer to create data of the maximum size that does not exceed the page size 311 (concatenated). If the total data is less than the page size 311, dummy data is linked to the linked data to create data of the page size 311), and the created data is used as an unused page 305 ( For example, write to the physical page P4). Writing data in units of pages is sometimes called “page writing”. Parity (not shown) based on the error correction code is added to the page write data. In order to provide a parity write destination area, the physical page size (8640 bytes) of the flash memory 105 is larger than the size of one logical page (8448 bytes).
  • the right side of FIG. 3 shows an example of a state in which compressed data and code portions are stored in the physical pages P0 to P3 (301, 302, 303, 304) of the flash memory 105.
  • the reference data of the single allocation pages L0 and L6 and the difference data of the duplicate allocation page L4 are stored.
  • the physical page P1 stores reference data shared by the duplicate allocation pages L1, L3, L4, and L7.
  • difference data of the single allocation page L0 and reference data of the single allocation page L5 are stored.
  • the physical page P3 stores the code portions of the overlapping allocation pages L1, L3, L4, and L7 and the reference data of the single allocation page L2.
  • the address conversion table 400 in FIG. 4A holds information including a logical page address 410, a reference data storage destination 420, a difference flag 430, a difference data storage destination 440, a duplication flag 450, and a code part address 460 for each logical page. .
  • the logical page address 410 is the top logical address of the logical page.
  • the reference data storage location 420 is information including a physical address Pi [Ni] (page address Pi, sector number Ni) for storing reference data and a storage sector size.
  • the difference flag 430 indicates whether there is a difference.
  • the difference flag 430 is “OFF” (meaning no difference), and the logical page has applied the second formation method.
  • the difference flag 430 is “ON” (meaning that there is a difference).
  • the difference data storage destination 440 is information that is effective when the difference flag 430 is ON, and is information including a physical address Pi [Ni] (page address Pi, sector number Ni) for storing difference data and a storage sector size. is there.
  • the duplication flag 450 indicates whether the logical page is applied with the deduplication technology. When the logical page is a single allocation page, the duplication flag 450 is “OFF” (meaning that the deduplication technique is not applied). When the logical page is a duplication allocation page, the duplication flag 450 is “ON”. (Meaning that deduplication technology is applied).
  • the code part address 460 is valid information when the duplication flag 450 is “ON”, and includes information including a physical address Pi [Ni] (page address Pi, sector number Ni) for storing the code part of user data. It is. Since the size of the code part is 256 bytes and the storage sector size is fixed at 1, the code part address 460 may not include the storage sector size.
  • the address conversion table 400 in FIG. 4A holds, for example, information according to the storage state shown on the right side of FIG. 3 (for example, information on logical pages L0 to L7).
  • the logical page L0 is a single allocation page to which the second formation method is applied
  • the logical pages L1, L3, and L7 are overlapping allocation pages to which the first formation method is applied, respectively.
  • L2, L5, and L6 are each a single allocation page to which the first formation method is applied
  • the logical page L4 is a duplicate allocation page to which the second formation method is applied.
  • the duplication count table 470 of FIG. 4B holds information including a reference data address 480 and a shared count 490 for each reference data shared by a plurality of duplicate assignment pages.
  • the reference data address 480 is information including a physical address Pi [Ni] (page address Pi, sector number Ni) for storing reference data.
  • the sharing count 490 represents the number of logical pages (duplicate allocation pages) that share reference data.
  • the FM controller 103 of the FM module 100 selects an optimum method for forming the update target user data by this processing in order to reduce the write amount of the flash memory 105.
  • the FM controller 103 calculates the logical page address Lk to which the logical address Wa designated by the write command belongs (step 501). The FM controller 103 determines whether the duplication flag 450 corresponding to the calculated logical page address Lk is “OFF” or “ON” (step 502). If it is “OFF” (single allocation page), the process proceeds to step 503, and if it is “ON” (duplicate allocation page), the process proceeds to step 504.
  • step 503 the FM controller 103 determines whether the number of write data sectors according to the write command is the page size (16 sectors) or smaller. If it is the page size, the FM controller 103 executes the entire write processing of the single allocation page in step 600. Otherwise, the FM controller 103 executes partial write processing of the single allocation page in step 700.
  • step 504 the FM controller 103 determines whether the number of sectors of the write data written by the write command is the page size (16 sectors) or smaller. If it is the page size, the FM controller 103 executes the entire write processing of the duplicate allocation page in step 800. Otherwise, the FM controller 103 executes the partial write process for the duplicate allocation page in step 900.
  • FIG. 10 shows the entire write process of the single allocation page.
  • This process is a process of selecting a new formation method of the user data when the user data of the logical page Lk is updated to the write data Wd. That is, the first formation method is selected and the write data Wd is written as new reference data, or the second formation method is selected and the difference data from the write data Wd without changing the current reference data Whether to write is divided.
  • Data 1010 is compressed data of the current reference data, and is stored in the flash memory 105. In order to create difference data of the second forming method, it is necessary to read and decompress the compressed data, and calculate (1040) an exclusive OR with the write data Wd.
  • Data 1020 is compressed data of new reference data for the first forming method
  • data 1030 is compressed data of difference data for the second forming method.
  • the FM controller 103 selects a smaller write size to the flash memory 105. If the data 1020 is smaller, the FM controller 103 writes the data 1020 and selects the first formation method. If the data 1030 is smaller, the FM controller 103 writes the data 1030 and selects the second formation method. If the sizes are the same, the FM controller 103 writes the data 1020 and selects the first formation method. This is because in the second forming method, the reference data and the difference data must be read when the user data is read, and the read performance is inferior.
  • the difference data includes many consecutive zero values and can be compressed to be smaller. Therefore, it is advantageous to select the second formation method. .
  • the FM controller 103 When the FM controller 103 receives a read command for reading the write data Wd written by the method described with reference to FIG. 10 from the host device (storage controller 1401), the FM controller 103 based on the address conversion table 400.
  • the write data Wd can be restored, and the write data Wd can be transmitted as read data to the host device.
  • the restored write data Wd is (1) data generated by expanding the data 1020, or (2) differential data (new) obtained by expanding the data 1030 and the data 1010. This is an exclusive OR with reference data obtained by decompression.
  • FIG. 11 shows a partial write process for a single allocation page.
  • This process is a process of selecting a new method for forming the rewritten user data when a part of the user data of the logical page Lk is rewritten with the write data Wd. That is, the first formation method is selected and the rewritten user data is written as new reference data, or the second formation method is selected and the rewritten user data without changing the current reference data. Whether to write the difference data.
  • Data 1110 is the compressed data of the current reference data
  • data 1120 is the compressed data of the current differential data, both of which are stored in the flash memory 105.
  • the FM controller 103 reads and expands the data 1110 and 1120, respectively, calculates the exclusive OR of the two (1150), and creates the current user data.
  • the FM controller 103 rewrites a part of the current user data with the write data Wd to create new user data (1160), and calculates the exclusive OR of the new user data and the current reference data (1170). ) To create new difference data.
  • Data 1130 is compressed data of new reference data for the first forming method
  • data 1140 is compressed data of difference data for the second forming method.
  • the FM controller 103 selects a smaller write size to the flash memory 105. If the data 1130 is smaller, the FM controller 103 writes the data 1130 and selects the first formation method. If the data 1140 is smaller, the FM controller 103 writes the data 1140 and selects the second formation method. If the sizes are the same, the FM controller 103 writes the data 1130 and selects the first formation method. This is because in the second forming method, the reference data and the difference data must be read when the user data is read, and the read performance is inferior.
  • the smaller the size of the write data Wd (the smaller the rewrite amount), the more the new difference data contains many consecutive zero values and can be compressed to a smaller size. Therefore, the selection of the second formation method is advantageous.
  • the FM controller 103 receives the write data Wd based on the address conversion table 400 when receiving a read command for the write data Wd written by the method described with reference to FIG.
  • the data can be restored and the write data Wd can be transmitted as read data to the host device.
  • the restored write data Wd is (1) partial data extracted from data generated by decompressing the data 1130, or (2) differential data (2) obtained by decompressing the data 1140. New) and the partial data extracted from the exclusive OR of the reference data obtained by expanding the data 1110.
  • FIG. 12 shows the entire write process of the duplicate allocation page.
  • This process is a process of selecting a new page type of the logical page Lk and a new formation method of the user data when the user data of the logical page Lk is updated to the write data Wd. That is, the first formation method of the single allocation page is selected and the write data Wd is written as new reference data, or the second formation method of the duplicate allocation page is selected and the current reference data is not changed. The difference data (difference data from the write data Wd) and the code part are written.
  • Data 1210 is compressed data of the current reference data and is stored in the flash memory 105.
  • the data 1210 is read and expanded, and the exclusive OR with the sector portion separated (1240) from the write data Wd is calculated (1250). There is a need.
  • Data 1220 is compressed data of new reference data for the first formation method of the single allocation page
  • data 1230 is compression data of differential data and write data for the second formation method of the duplicate allocation page. This is data in which a code part separated (1250) from Wd is connected.
  • the FM controller 103 selects a smaller write size to the flash memory 105. When the data 1220 is smaller, the FM controller 103 writes the data 1220 and selects the first formation method of the single allocation page. If the data 1230 is smaller, the FM controller 103 writes the data 1230 and selects the second method for forming the duplicate allocation page. If the sizes are the same, the FM controller 103 writes the data 1220 and selects the first formation method of the single allocation page. This is because, in the second method for forming the duplicate allocation page, the reference data, the difference data, and the code part must be read when reading the user data, and the read performance is poor.
  • the difference data includes more consecutive zero values and can be compressed smaller.
  • the FM controller 103 receives the write data Wd based on the address conversion table 400 when receiving a read command for the write data Wd written by the method described with reference to FIG.
  • the data can be restored and the write data Wd can be transmitted as read data to the host device.
  • the restored write data Wd is (1) data generated by decompressing the data 1220, or (2) differential data (new) obtained by decompressing the compressed differential data in the data 1230. And the reference data obtained by expanding the data 1210, and the code part (new) of the data 1230.
  • FIG. 13 shows a partial write process for a duplicate allocation page.
  • This process is a process of selecting a new page type of the logical page Lk and a new formation method of the rewritten user data when a part of the user data of the logical page Lk is rewritten with the write data Wd. That is, select the first formation method of the single assignment page and write the rewritten user data as new reference data, or select the second formation method of the duplicate assignment page and change the current reference data Without writing, it is determined whether to write the difference data (the difference data with the rewritten user data) and the code part.
  • the data 1310 is the compressed data of the current reference data
  • the data 1320 is the compressed data of the current differential data
  • the data 1330 is the current code part, and these are stored in the flash memory 105.
  • the FM controller 103 calculates (1360) the exclusive OR of the reference data and the difference data that has been read and further expanded, and reads the exclusive OR data created by the calculation (1360).
  • the code part is synthesized (1370) to create the current user data.
  • the FM controller 103 rewrites a part of the current user data with the write data Wd to create new user data (1380), separates the new user data (1390), the current reference data, Is calculated (1300) to create new difference data.
  • Data 1340 is compressed data of new reference data for the first forming method of the single allocation page
  • data 1350 is compressed data of differential data and the new user for the second forming method of the duplicate allocation page. This is data in which a code part separated (1390) from data is connected.
  • the FM controller 103 selects a smaller write size to the flash memory 105. If the data 1340 is smaller, the FM controller 103 writes the data 1340 and selects the first formation method of the single allocation page. If the data 1350 is smaller, the FM controller 103 writes the data 1350 and selects the second method for forming the duplicate allocation page. If the sizes are the same, the FM controller 103 writes the data 1340 and selects the first formation method of the single allocation page. This is because, in the second method for forming the duplicate allocation page, the reference data, the difference data, and the code part must be read when reading the user data, and the read performance is poor.
  • the FM controller 103 receives the write data Wd based on the address conversion table 400 when receiving a read command for the write data Wd written by the method described with reference to FIG.
  • the data can be restored and the write data Wd can be transmitted as read data to the host device.
  • the restored write data Wd is (1) partial data extracted from data generated by decompressing the data 1340, or (2) obtained by decompressing the compressed differential data in the data 1350.
  • the partial data extracted from the data composed of the exclusive OR of the difference data (new) and the reference data obtained by expanding the data 1310 and the code part (new) of the data 1350 is there.
  • the FM controller 103 acquires the reference data storage destination 420 (physical address Px [Nx] and storage sector size Sx) corresponding to the logical page address Lk calculated in step 501 (step 601).
  • the FM controller 103 reads the compressed reference data (compressed reference data) of the logical page Lk from the physical area represented by the reference data storage destination 420, and expands the compressed reference data to obtain the reference data (plaintext state). ) Is restored (step 602).
  • the FM controller 103 creates the difference data of the logical page Lk by calculating the exclusive OR of the reference data of the logical page Lk (reference data restored in step 602) and the write data Wd. Compressed difference data is created by compressing the difference data (step 603).
  • the FM controller 103 creates compressed write data by compressing the write data Wd (step 604).
  • the FM controller 103 compares the size of the result data (compression difference data) in step 603 with the size of the result data (compression write data) in step 604, selects the smaller one, and writes it to the flash memory 105 (step 605). ). If the sizes are the same, the result data in step 604 is selected.
  • step 603 When the result data of step 603 is selected, the user data of the logical page Lk is applied with the second forming method, so the FM controller 103 sets the difference flag 430 corresponding to the logical page Lk to “ON”.
  • step 604 When the result data of step 604 is selected, the user data of the logical page Lk is applied to the first forming method, and therefore the difference flag 430 corresponding to the logical page Lk is set to “OFF” (step 606). .
  • the FM controller 103 acquires the reference data storage destination 420 (physical address Px [Nx] and storage sector size Sx) corresponding to the logical page address Lk calculated in step 501 (step 701).
  • the FM controller 103 reads the compressed reference data of the logical page Lk from the physical area represented by the reference data storage destination 420, and decompresses the compressed reference data to restore the reference data (plain text state) (step 702). .
  • step 703 the FM controller 103 checks the difference flag 430 corresponding to the logical page Lk. If “OFF”, the process proceeds to step 704, and if “ON”, the process proceeds to step 705.
  • step 704 since there is no difference data, the FM controller 103 sets the result data (restored reference data) in step 702 as the current user data of the logical page Lk, and transitions to step 708.
  • step 705 the FM controller 103 obtains the differential data storage destination 440 (physical address Py [Ny] and storage sector size Sy) corresponding to the logical page address Lk in order to obtain the current differential data.
  • the FM controller 103 reads the compressed differential data (compressed differential data) of the logical page Lk from the physical area represented by the differential data storage destination 440, and expands the compressed differential data to obtain differential data (plaintext state). Is restored (step 706).
  • the FM controller 103 creates the current user data of the logical page Lk by calculating the exclusive logical sum of the reference data of the logical page Lk and the difference data (step 707). Thereafter, the process proceeds to step 708.
  • Step 708 the FM controller 103 rewrites the portion of the address Wa designated by the write command with the write data Wd in the current user data of the logical page Lk, and creates new user data of the logical page Lk.
  • the FM controller 103 creates new differential data of the logical page Lk by calculating an exclusive OR of the current reference data of the logical page Lk and the new user data, and compresses the new differential data Thus, compressed difference data is created (step 709).
  • the FM controller 103 creates compressed user data by compressing new user data of the logical page Lk (step 710).
  • the FM controller 103 compares the size of the result data (compression difference data) at step 709 with the size of the result data (compression user data) at step 710, selects the smaller one, and writes it to the flash memory 105 (step 711). ). If the sizes are the same, the result data of step 710 is selected.
  • the user data of the logical page Lk is applied with the second forming method, and the FM controller 103 sets the difference flag 430 corresponding to the logical page address Lk to “ON”.
  • the user data of the logical page Lk is applied to the first forming method, and the difference flag 430 corresponding to the logical page address Lk is set to “OFF” (712) ).
  • the FM controller 103 acquires the reference data storage destination 420 (physical address Px [Nx] and storage sector size Sx) corresponding to the logical page address Lk calculated in step 501 (step 801).
  • the FM controller 103 reads the compressed reference data of the logical page Lk from the physical area represented by the reference data storage destination 420, and decompresses the compressed reference data to restore the reference data (plain text state) (step 802). .
  • the FM controller 103 creates differential data of the logical page Lk by calculating an exclusive OR of the reference data of the logical page Lk and the sector part separated from the write data Wd, and compresses the differential data.
  • compressed difference data is created (step 803).
  • the FM controller 103 sets the code part separated from the write data Wd as a new code part of the logical page Lk (step 804) and combines it with the result data (compression difference data) of step 803 (step 805).
  • the FM controller 103 creates compressed write data by compressing the write data Wd (step 806).
  • the FM controller 103 compares the size of the result data in step 805 (compressed differential data + new code part) with the size of the result data in step 806 (compressed write data), selects the smaller one, and writes it to the flash memory 105. (Step 807). If the sizes are the same, the result data in step 806 is selected.
  • step 805 When the result data of step 805 is selected, the user data of the logical page Lk is applied with the second forming method, so the FM controller 103 sets the difference flag 430 corresponding to the logical page address Lk to “ON”. If the result data of step 806 is selected, the user data of the logical page Lk is applied to the first forming method, and therefore the difference flag 430 corresponding to the logical page address Lk is set to “OFF” (step) 808).
  • the FM controller 103 acquires the reference data storage destination 420 (physical address Px [Nx] and storage sector size Sx) corresponding to the logical page address Lk calculated in step 501 (step 901).
  • the FM controller 103 reads the compressed reference data (compressed reference data) of the logical page Lk from the physical area represented by the reference data storage destination 420, and expands the compressed reference data to obtain the reference data (plaintext state). ) Is restored (step 902).
  • step 903 the FM controller 103 checks the difference flag 430 corresponding to the logical page Lk. If “OFF”, the process proceeds to step 904, and if “ON”, the process proceeds to step 906.
  • step 904 the FM controller 103 acquires the code part address 460 (physical address Pz [Nz]) corresponding to the logical page Lk.
  • the FM controller 103 reads the current code part of the logical page Lk from the physical area represented by the code part address 460, combines the code part with the reference data obtained in step 902, and then creates the logical page Lk. Current user data is created (step 905). Thereafter, the process proceeds to step 909.
  • step 906 the FM controller 103 obtains the current difference data and code part, the difference data storage destination 440 (physical address Py [Ny] and storage sector size Sy) and code part address corresponding to the logical page Lk. 460 (physical address Pz [Nz]) is acquired.
  • the FM controller 103 reads the compressed differential data of the logical page Lk from the physical area represented by the differential data storage destination 440, and decompresses the compressed differential data to restore the differential data (plain text state) (step 907). ).
  • the FM controller 103 reads the code part of the logical page Lk from the physical area represented by the code part address 460 (Pz [Nz]) acquired in step 906, and excludes the reference data and difference data of the logical page Lk.
  • the logical user is calculated and the current user data of the logical page Lk is created by synthesizing the code portion of the read logical page Lk with the calculation result (step 908). Thereafter, the process proceeds to step 909.
  • step 909 the FM controller 103 rewrites the portion of the address Wa designated by the write command with the write data Wd in the current user data of the logical page Lk, and creates new user data of the logical page Lk.
  • the FM controller 103 creates new differential data of the logical page Lk by calculating the exclusive OR of the current reference data of the logical page Lk and the sector part of the new user data, and compresses the differential data Thus, compressed difference data is created (step 910). Then, the FM controller 103 combines the result data (compressed difference data) with the code part separated from the new user data (step 911).
  • the FM controller 103 creates compressed user data by compressing new user data of the logical page Lk (step 912).
  • the FM controller 103 compares the size of the result data in step 911 (compressed differential data + code part) with the size of the result data in step 912 (compressed user data), selects the smaller one, and writes it to the flash memory 105. (Step 913). If the sizes are the same, the result data in step 912 is selected.
  • step 911 When the result data of step 911 is selected, the user data of the logical page Lk is applied with the second forming method, and therefore the FM controller 103 sets the difference flag 430 corresponding to the logical page address Lk to “ON”. If the result data in step 912 is selected, the user data of the logical page Lk is applied to the first forming method, and the difference flag 430 corresponding to the logical page address Lk is set to “OFF” (step 914).
  • step 505 the FM controller 103 determines whether the difference flag 430 of the logical page address Lk is set to “OFF” or “ON” in the last step of the entire write processing and partial write processing of the single allocation page. Check out. In the case of “OFF”, it means that the first forming method has been reached, and the process proceeds to Step 506. In the case of “ON”, it means that the second forming method has been reached, and the process proceeds to Step 508.
  • step 506 the FM controller 103 updates the reference data storage destination 420 corresponding to the logical page address Lk to the physical address and storage sector size of the new reference data (compressed state) written to the flash memory 105. Then, the FM controller 103 invalidates the reference data before update remaining in the physical address Px [Nx] (step 507). This completes the write command process.
  • step 508 the FM controller 103 updates the differential data storage destination 440 corresponding to the logical page address Lk to the physical address and storage sector size of the new differential data (compressed state) written to the flash memory 105. If the difference data before update is left in the physical address Py [Ny] (that is, if the difference flag 430 is ON before the write process), the FM controller 103 invalidates it. This completes the write command processing.
  • step 509 the FM controller 103 determines whether the difference flag 430 of the logical page Lk is set to “OFF” or “ON” in the last step of the entire write process and partial write process of the duplicate allocation page. Investigate. In the case of “OFF”, it means that the first method for forming a single allocation page has been reached, and the process proceeds to step 510. In the case of “ON”, this means that the second method for forming a duplicate allocation page has been reached, and the process proceeds to step 514.
  • step 510 the FM controller 103 updates the reference data storage destination corresponding to the logical page address Lk to the physical address and storage sector size of the new reference data (compressed state) written to the flash memory 105.
  • the FM controller 103 in the duplication count table 470 The shared count value corresponding to the reference data is decremented by 1 (step 511). Further, if the value of the shared count becomes 0 by this subtraction, there is no logical page using the reference data before update anymore, so the FM controller 103 invalidates the reference data before update. (Step 512).
  • the FM controller 103 changes the logical page Lk to a single allocation page by setting the duplication flag 450 corresponding to the logical page address Lk to “OFF” (step 513). This completes the write command processing.
  • the FM controller 103 updates the differential data storage destination 440 corresponding to the logical page address Lk to the physical address and storage sector size of the new differential data (compressed state) written to the flash memory 105, and the logical page address.
  • the code part address 460 corresponding to Lk is updated to the physical address of the new code part written in the flash memory 105, and the code part before update at the physical address Pz [Nz] is invalidated. If the difference data before update is left in the physical address Py [Ny] (that is, if the difference flag 430 is “ON” before the write process), the FM controller 103 determines the difference before the update. Also invalidate the data. This completes the write command processing.
  • the user data before the update is not invalidated and the updated user data itself is not written, but the user data before and after the update is written.
  • the compressed differential data which is the exclusive OR of is written.
  • a method of creating differential data by exclusive OR is employed. This method is characterized in that even if a large number of updated parts are scattered in one physical page, it is not necessary to manage the position of each updated part one by one. Thereby, since the size of the management information regarding the difference can be reduced, there is an effect that the memory capacity can be saved.
  • the data when there is no compression effect on data (at least one of the reference data and the difference data), the data may be written to the flash memory 105 in a plain text state. If the data is written in a plain text state, the read processing performance of the FM module 100 is improved because the decompression time can be reduced when the data is read.
  • the FM controller 103 does not perform the subsequent compression process, and the flash memory Even if the difference data is not written to 105 and the difference flag 430 corresponding to the logical page Lk is set to “OFF” (the first forming method not using the difference data is selected), the write command processing is immediately finished. Good. Thereby, the write amount of the flash memory 105 can be reduced. Further, the time for compressing the differential data and the time for writing to the flash memory 105 can be reduced, and the write command processing performance of the FM module 100 is improved.
  • the FM controller 103 determines the difference flag corresponding to the logical page Lk.
  • the write command processing may be terminated without setting user data (update data) by setting 430 to “ON” (selecting the second forming method using difference data). That is, the write command process may be terminated without creating compressed user data and performing the comparison as described above.
  • the FM controller 103 sets the difference flag 430 corresponding to the logical page Lk to “ON” (The write command processing may be completed without performing compression processing of user data (sector portion) by selecting a second formation method using difference data. That is, the write command process may be terminated without creating compressed user data and performing the comparison as described above.
  • the FM controller 103 sets the difference flag 430 corresponding to the logical page Lk to “OFF” (The write command processing may be completed without selecting the first formation method that does not use the difference data and generating and compressing the difference data.
  • the data size does not necessarily have to be compared on at least one of the single allocation page and the duplicate allocation page.
  • the first formation method may be selected after the second formation method is selected a certain number of times, and then the second formation method may be selected again a certain number of times.
  • the apparatus having the FM module 100 is not limited to the storage apparatus 1400, but may be a host 1421 as shown in FIG.
  • the host 1421 (for example, a server device) may include an I / F 1604, an FM module 100, and a CPU 1602 connected to the I / F 1604 (the host 1421 may further include a storage device of a different type from the FM module 100 (for example, DRAM).
  • the whole or a part of the FM module 100 may be used as a cache memory for data input / output by the host 1421.
  • the CPU 1602 may be the host device of the FM module 100. Since the host 1421 may execute an application that frequently rewrites data in the cache memory, the FM module 100 according to the present embodiment that can reduce the write amount of the flash memory 105 is also effective for the host 1421.

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Techniques For Improving Reliability Of Storages (AREA)

Abstract

 記憶デバイスは、複数の論理領域で構成された記憶媒体に基づく論理空間を上位装置に提供し、各論理領域について、基準データ範囲が記憶媒体に存在する。記憶デバイスは、ライト先論理アドレスが属するライト先論理領域に対応した基準データ範囲から基準データをリードし、基準データである第1データと、ライトデータに基づくデータとライトデータとのいずれかである第2データとの排他的論理和である差分データを作成する。記憶デバイスは、差分データを圧縮することにより圧縮差分データを作成し、圧縮差分データを記憶媒体にライトし、圧縮差分データがライトされた範囲である差分データ範囲をライト先論理領域に関連付ける。

Description

記憶デバイス、記憶デバイスを有する装置、及び記憶制御方法
 本発明は、概して、記憶制御に関し、例えば、記憶デバイス内の記憶媒体に書き込まれるデータの量を削減するための制御に関する。
 記憶デバイスは、一般に、記憶媒体と、記憶媒体に対するデータのI/O(Input/Output)を制御する媒体コントローラとを有する。記憶デバイスを有する装置として、例えば、ストレージ装置、又は、ストレージ装置にデータのI/Oを行うホスト装置がある。
 記憶媒体として、例えば、一括消去可能な不揮発性半導体メモリが開発されている。このような不揮発性半導体メモリとしては、例えば、フラッシュメモリがある。フラッシュメモリ(典型的にはNAND型フラッシュメモリ)は、複数のブロックを有し、各ブロックは、複数のページを有する。ページ単位でデータのI/Oが行われ、ブロック単位でデータが消去される。消去時間は書込み時間に比べて短い。そこで、フラッシュメモリの記録データ(書込み済のデータ)の更新は、一般に、次のように行われる。すなわち、媒体コントローラが、記録データ(更新前のデータ)をページから読み出し、記録データの少なくとも一部にライト対象データを反映することにより更新データを作成し、更新データを空ページに書き込み、記録データを記憶しているページを無効化(記憶デバイスの上位装置からの参照を不可とする処理)する。そして、媒体コントローラは、空ページが枯渇した場合には、全てが無効ページ(無効化されたページ)となったブロックからデータを消去することにより、無効ページを空ページとする。
 各ページは、複数(例えば16個)のセクタを含む。ページ単位で書込みが行われるので、1セクタだけを書き換えるためであってもそのセクタを含む1ページを書き換える必要がある。
 フラッシュメモリは、一般に、データの消去回数に制限がある。データの書き換えが集中して消去回数が増大したブロックは、データの消去ができなくなり使用不能となってしまう。このため、特定のブロックにデータ消去処理が集中しないようにする必要がある。また、フラッシュメモリでは、ページ内のデータが、時間とともにデータ誤りが増加してしまうため、媒体コントローラは、書き込まれてから一定時間経過したデータを別ページに移動するリフレッシュと呼ばれる動作を行う。
 このような特性を持つフラッシュメモリにおいては、データの消去時間を短縮させたり、消去回数を低減させたりするために、特許文献1のような重複排除技術を用いることが考えられる。重複排除技術は、上位装置に提供する論理アドレスと実際の記憶領域の物理アドレスとが対応付けて管理されている場合に、重複するデータが格納された複数の論理アドレス空間(例えば論理ページ)を、当該データが格納された1つの物理アドレス空間(例えば物理ページ)に対応付ける技術である。重複排除技術を利用することにより、記憶媒体に書き込まれるデータの量を削減することができ、フラッシュメモリを記憶媒体とする記憶デバイスにおいて、フラッシュメモリの長寿命化を図ることができる。
特表2013-532853号公報
 特許文献1の重複排除技術は、重複するデータを持つ複数の論理ページに対して1つの物理ページを割り当てることで、書込み量(フラッシュメモリに書き込まれるデータの量)を低減化する。しかし、それらの論理ページの各々に対してわずかなデータ更新が行われるだけで、各更新先論理ページ内のデータは、重複排除の対象から外れてしまい、各更新先論理ページには、更新データが書き込まれた新たな物理ページが割り当てられることになる。これにより、書込み量が増加する。
 この種の問題は、重複排除されている論理ページに限られない。例えば、重複排除されていない論理ページについて、その論理ページに対してわずかなデータ更新があっただけで、更新データが新たな物理ページに書き込まれる(つまり、物理ページが新たに消費される)。
 また、この種の問題は、フラッシュメモリに限らず、消去回数(書き換え回数)に制限のある他種の記憶媒体についても有り得る。
 本発明の目的は、記憶デバイスの記憶媒体への書込み量を削減することにある。
 記憶デバイスは、記憶媒体と、記憶媒体に対するI/Oを制御し記憶媒体に基づく論理空間を上位装置に提供する媒体コントローラとを有する。論理空間は、複数の論理領域で構成されている。各論理領域について、基準データ範囲が記憶媒体に存在する。媒体コントローラは、ライト先論理アドレスを指定したライトコマンドを上位装置から受信し、ライト先論理アドレスが属するライト先論理領域に対応した基準データ範囲から基準データをリードする。媒体コントローラは、基準データである第1データと、ライトコマンドに従うライトデータに基づくデータとライトデータとのいずれかである第2データとの排他的論理和である差分データを作成する。媒体コントローラは、差分データを圧縮することにより圧縮差分データを作成し、圧縮差分データを記憶媒体にライトし、圧縮差分データがライトされた範囲である差分データ範囲をライト先論理領域に関連付ける。媒体コントローラは、ライト先論理領域と同じ論理領域をリード元としたリードコマンドを上位装置から受信した場合、リード元論理領域に関連付けられている基準データと、リード元論理領域に関連付けられている差分データとを基に、リードコマンドに従うリードデータを復元することができる。
 記憶デバイス内の記憶媒体の書込み量を削減することができ、以って、記憶媒体の長寿命化を図ることができる。
図1は、実施例に係るFMモジュールの構成を示す。 図2Aは、単独割当ページのためのデータフォーマット(平文状態)を示す。 図2Bは、重複割当ページのためのセクタ部フォーマット(平文状態)を示す。 図2Cは、重複割当ページのためのコード部フォーマットを示す。 図3は、フラッシュメモリへのデータライト方法とデータ格納状態の例を示す。 図4Aは、アドレス変換テーブルを示す。 図4Bは、重複カウントテーブルを示す。 図5は、ライトコマンド処理のフローチャートである。 図6は、単独割当ページに対する全体ライト処理のフローチャートである。 図7は、単独割当ページに対する部分ライト処理のフローチャートである。 図8は、重複割当ページに対する全体ライト処理のフローチャートである。 図9は、重複割当ページに対する部分ライト処理のフローチャートである。 図10は、単独割当ページに対する全体ライト処理の概念図である。 図11は、単独割当ページに対する部分ライト処理の概念図である。 図12は、重複割当ページに対する全体ライト処理の概念図である。 図13は、重複割当ページに対する部分ライト処理の概念図である。 図14は、実施例に係るストレージ装置を有する計算機システムの構成を示す。 図15Aは、単独割当ページのユーザデータの2通りの形成方法を示す。 図15Bは、重複割当ページのユーザデータの2通りの形成方法を示す。 図16は、ホストの構成を示す。
 以下、一実施例を説明する。
 以下の説明では、「kkkテーブル」の表現にて情報を説明することがあるが、情報は、テーブル以外のデータ構造で表現されていてもよい。データ構造に依存しないことを示すために「kkkテーブル」を「kkk情報」と呼ぶことができる。
 また、以下の説明では、通信インターフェイスデバイスを「I/F」と略記することがあり、フラッシュメモリを「FM」と略記することがある。
 以下、実施例に係る記憶デバイスが適用されたFMモジュールと、そのFMモジュールを有するストレージ装置を説明する。
 図14は、実施例に係るストレージ装置を有する計算機システムの構成を示す。
 計算機システムは、ストレージ装置1400と、ホスト(ホスト計算機)1421と、管理計算機1420とを有する。ホスト1421は、SAN(Storage Area Network)1410のような通信ネットワークを介してストレージ装置1400に接続されてよい。管理計算機1420は、LAN(Local Area Network)のような通信ネットワーク(図示せず)を介してストレージ装置1400に接続されてよい。ホスト1421及び管理計算機1420は同じ通信ネットワークに接続されてよい。
 ストレージ装置1400は、複数のFMモジュール100と、複数のFMモジュール100に対するI/Oを制御するストレージコントローラ1401とを有する。ストレージコントローラ1401は、ホスト1421から送信されたコマンドを受信し、そのコマンドを解釈して、ストレージ装置1400の記憶領域内のデータのリード/ライトを実行する。ストレージ装置1400は、H-I/F(ホスト1421と通信するI/F)1431、S-I/F(FMモジュール100と通信するI/F)1451、M-I/F(管理計算機1420と通信するI/F)1430、メモリ1442、及び、それらに接続されたCPU1441を有する。
 H-I/F1431は、ホスト1421からのI/Oリクエストや制御コマンドなどを受け付けるI/Fである。S-I/F1451は、FMモジュール100にデータや制御コマンドを送信するI/Fである。また、M-I/F1430は、管理計算機1420からの管理や保守に関する制御コマンド等を受け付けるI/Fである。
 CPU1441は、演算処理装置として機能し、メモリ1442に記憶されている各種プログラムや演算パラメータ等にしたがって、ストレージ装置1400全体の動作を制御する機能を有する。具体的には、例えば、CPU1441は、ホスト1421からのI/Oリクエスト等に従い、ストレージ装置1400とホストとの間のユーザデータの入出力(データI/O)を処理し、FMモジュール100にユーザデータをライトするためのライトコマンドをFMモジュール100に発行したり、FMモジュール100からユーザデータをリードしたりするためのリードコマンドをFMモジュール100に発行したりする。また、CPU1441は、ホスト1421から受け付けたユーザデータに対して保証コード(後述。)を作成して、ユーザデータに付与する。メモリ1442は、各種プログラムや演算パラメータ等の他、管理情報を記憶する。また、メモリ1442は、キャッシュメモリ領域を有する。キャッシュメモリ領域は、FMモジュール100にライトするユーザデータや、FMモジュール100からリードしたユーザデータを一時的に格納する。なお、本実施例の説明において、「ユーザデータ」とは、ストレージコントローラ1401にとっては、主に、ホスト1421からのリード/ライトリクエスト(I/Oリクエスト)に従うリード/ライト対象のデータでよく、FMモジュール100内のFMコントローラ103(図1参照)にとっては、ストレージコントローラ1401からのリード/ライトコマンドに従うリード/ライト対象のデータでよい。
 図14では、FMモジュール100は6つ備えられている構成としているが、FMモジュール100の数はかかる例に限定されない。FMモジュール100の内部構成については、図1を用いて後で詳細に説明する。なお、本実施例では、FMモジュール100は、ストレージ装置1400内に存在するが、かかる例に限定されず、FMモジュール100を、ストレージ装置1400の外に存在してもよい。
 ホスト1421は、SAN1410を介してストレージ装置1400と接続され、ストレージ装置1400にデータのリード/ライトリクエスト(I/Oリクエスト)を送信する。また、ホスト1421は、例えば、パーソナルコンピュータ、ワークステーション又はメインフレームでよい。ホストとストレージ装置1400との通信は、例えば、SCSI(Small Computer System Interface)などのブロックプロトコルが用いられてよい。
 管理計算機1420は、例えば、パーソナルコンピュータや、ワークステーション又はメインフレームでよい。管理計算機1420は、ストレージ装置1400等を管理してよい。
 図14の構成によれば、FMモジュール100の上位装置は、ストレージコントローラ1401である。FMモジュールは、後に図1を参照して説明するように、複数のFMチップで構成されたフラッシュメモリ105と、フラッシュメモリ105に対するI/Oを制御するFMコントローラ103とを有する。以下、フラッシュメモリ105の特徴と扱い方の一例を説明する。
 フラッシュメモリ105は、最小消去単位が最小書き込み単位に比べて大きいという特徴を有する。具体的には、例えば、フラッシュメモリ105(各FMチップ)は、複数のブロック(物理ブロック)を有し、各ブロックが、複数(例えば256個)のページ(物理ページ)を有する。ブロック単位でデータが消去され、ページ単位でデータの読み書きが実行される。ページのサイズは例えば8640バイトである。フラッシュメモリ105は、その特性上、データを直接上書きすることができない。すなわち、データを書き換える場合、FMコントローラ103は、そのデータを含むブロック内に記憶している有効な他のデータを別のブロックに退避させて、元のブロックからデータを消去する。そして、FMコントローラ103は、消去したブロックに新しいデータをページ単位で書き込むことにより、データの書き換えを行う。
 このように、フラッシュメモリ105におけるデータの書き換え処理では、ブロック単位(物理ブロック単位)のデータの消去が伴う。しかしながら、フラッシュメモリ105の1ブロック分のデータ消去にかかる時間は、1ページ分のデータを書き込むのに要する時間と比べて長い時間(例えば約1桁分長い時間)がかかる。したがって、1ページ分のデータを書き換えるために毎回1ブロック分のデータ消去を実行すると、フラッシュメモリ105のデータ書き換え性能が低下してしまう。フラッシュメモリ105からデータを消去する時間を隠ぺいできるアルゴリズムでデータを書き込むことが必要となる。
 通常、フラッシュメモリ105に対してデータの書き換えを行う場合には、データを書き換えるごとにデータを消去することは行わず、データが記録されていない未使用ページ(空の物理ページ)にデータを追記する方式によってデータの書き換えが行われる。しかし、データの書き換え処理が度重なって実行されると、フラッシュメモリ105内の未使用ページが枯渇してしまうため、フラッシュメモリ105に書き込まれている無効データ(書き換えた後の旧データなど)を消去して、ページを再利用可能な状態にする必要が生じる。そこで、FMコントローラ103は、旧データを含むブロック内の有効なデータのみを別のブロック内の未使用ページにコピーし、コピー元のブロックからデータを消去して未使用ブロックとして再生するブロック再生処理を実行する。この処理は、フラッシュメモリ105のデータを高速に書き換えるには必須の処理であり、特に無効データが多くなったブロックが優先的にコピー元のブロックとされる。
 一方、フラッシュメモリ105の各ブロックは、消去回数に制限がある。例えば、1ブロック当たり1万回までの消去回数が保証される。この場合、データの書き換えが1つのブロックに集中して、当該ブロックの消去回数が保証回数(上限)を超えると、データ消去ができなくなることがあり、そのブロックは以降使用不能となってしまい、使用可能なブロック数が減少するという問題がある。そこで、特定ブロックに対する消去処理が集中しないように、消去回数の多いブロックと少ないブロックの間で格納データを交換するなどして消去回数の平準化処理を行う必要がある。
 また、フラッシュメモリ105は、一度書き込みしたページについては、データを保持しておくだけでも時間経過とともにデータ誤りが増加していくという特徴を有する。データ誤りによるデータ損失を回避するために、FMコントローラ103は、ページに書き込むデータに誤り訂正符号(ECC:Error Correction Code)に基づくパリティがあらかじめ付加する。FMコントローラ103は、書き込み後一定時間を経過したデータを読み出し、データ誤りが少ないうちに当該パリティを用いてそれを訂正して、訂正後のデータを別ページに移動するリフレッシュ処理を行う。なお、この処理を実行する場合にも、FMコントローラ103は、消去回数を平準化したり、性能に対する影響を考慮したりする必要がある。
 このように、FMコントローラ103は、消去時間を隠ぺいしたり消去回数を平準化したりするために、上位装置に提供する論理アドレスと実際の記憶領域の物理アドレスとを動的に対応づけ、データの書き込みの際に論理アドレスから物理アドレスへの変換処理を行う。すなわち、上位装置に提供する論理アドレスとフラッシュメモリ105の物理アドレスとの対応を動的にFMコントローラ103により変更することにより、上位装置は、論理アドレス空間にデータを書き込めばよい。データ書き込み時における未使用ページへの追記に伴う物理アドレスの変更を上位装置が意識しなくてもよいように、FMコントローラ103はアドレスを管理する。
 さて、フラッシュメモリ105を有するFMモジュール100において、論理アドレスと物理アドレスとを対応付けて管理している場合、重複排除技術を適用することが有効である。重複排除技術とは、重複するデータが格納された複数の論理アドレス空間を、当該データが格納された1つの物理アドレス空間に対応付ける技術である。重複排除技術により、フラッシュメモリ105の書込み量を削減できる。特に、重複排除技術の適用が有効と考えられるケースとして、フォーマット処理が考えられる。
 ストレージコントローラ1401は、FMモジュール100の使用を開始する際に、その異常個所の検知や格納データの初期化を目的として、フォーマット処理を実行する。具体的には、例えば、ストレージコントローラ1401は、FMモジュール100に基づく全記憶領域に、特定の値が連続する単純パタンのデータ(例えば全ビットが「0」のデータであるオールゼロデータ)を書き込む。しかし、フォーマット処理は、フラッシュメモリ105のように書き換え回数が制限されている記憶媒体において、不必要に書き換え回数を増加させる。また、フラッシュメモリ105は、データの書き換えに対して未使用ページへの追記方式を採用しているため、未使用ページの消費が増えると、処理時間のかかるデータ消去処理を頻繁に実行しなければならない。すなわち、フォーマット処理は、未使用ページが減少させ且つ性能を損なう処理である。そこで、本実施例では、FMモジュール100に重複排除技術が適用され、それにより、データの書込み量が低減し、以って、フラッシュメモリ105の長寿命化が図られる。なお、FMコントローラ103は、書込み対象のデータのパタンをチェックすることにより、或いは、ストレージコントローラ1401からの通知により(例えば、ストレージコントローラ1401からのライトコマンドにフォーマットであることを意味する値が設定されていることにより)、書込み対象のデータがフォーマット処理により書き込まれるデータであることを検出できる。
 さらに、ストレージ装置1400は、ハードウェア障害などによりユーザデータに発生するビット化けや、内部制御エラーなどによって発生する不正アドレスへのユーザデータ書き込みや不正アドレスからのユーザデータ読み込みを検出することができる。そのため、ストレージコントローラ1401は、書き込むユーザデータをセクタ単位(例えば1セクタは512バイト)に分けて複数のセクタデータで構成し、それぞれに対して所定長さ(例えば16バイト)の保証コードを付与する。一般に、保証コードは、CPU1441がユーザデータのビット化けを検出することを目的に各セクタデータから算出されるCRC(Cyclic Redundancy Check)を含む。また、保証コードは、ストレージ装置ベンダが自由に設定できるユーザデータの関連情報(以下、メタデータ)を含んでよい。メタデータは、例えば、計算機システムにおけるユーザデータの論理的な格納位置のような情報(具体的には、例えば、論理ボリューム番号や論理セクタアドレスなど)、ユーザデータの更新日時のような情報、及び、ユーザデータの世代番号のような情報のうちの少なくとも1つでよい。なお、論理ボリュームは、ストレージ装置1400によりホスト1421に提供される論理的な記憶デバイスである。ホスト1421からのI/Oリクエストでは、論理ボリュームの論理アドレスが指定される。その論理アドレスに従う領域(論理ボリュームにおける領域)に、1以上のFMモジュール100の各々が提供する1以上の論理ページが対応する。I/Oリクエストで指定されている論理アドレスを基に、FMモジュール100に送信されるI/Oコマンドで指定される論理アドレスがストレージコントローラ1401により決められる。
 保証コードが付与されたセクタデータから構成されるユーザデータに対して重複排除を行う場合、保証コード値がセクタデータ毎に異なるため、セクタデータが同じ値であっても保証コードに差異があるため重複排除を行うことができないという問題が発生することがある。
 そこで、FMコントローラ103は、重複排除処理を行う際には、まず、保証コードを含むユーザデータから、セクタデータと保証コードとを分離し、セクタデータのみを集めたもの(以下、セクタ部)を重複排除時のデータ共有の対象とし、保証コードのみを集めたもの(以下、コード部)を、セクタ部とは別に管理する。セクタ部及びコード部は、それぞれ独立したものとしてフラッシュメモリ105に格納される。なお、重複排除処理を行わないユーザデータについては、セクタ部とコード部への分離は行われずにフラッシュメモリ105に格納される。
 以下の説明においては、重複排除処理を行うことによって、或る論理ページのためのデータを格納している物理ページのデータが、他の論理ページのためのデータとして共有されている場合、その論理ページを、「重複割当ページ」と呼ぶこととする。また、ある論理ページのためのデータを格納している物理ページのデータが、他のどの論理ページのためのデータとしても共有されていない場合、その論理ページを、「単独割当ページ」と呼ぶこととする。
 FMコントローラ103は、さらに、フラッシュメモリ105に格納するデータを可逆圧縮アルゴリズムによって圧縮することにより、フラッシュメモリ105の書込み量を削減する。可逆圧縮アルゴリズムとしては、例えばLZ77アルゴリズムを適用する。このアルゴリズムによれば、例えば、同じ値(例えばゼロ)が長く連続するパタンを多く含むデータについては圧縮によるデータ削減効果が高い。
 次に、図1を参照しながら、FMモジュール100の構成を説明する。
 FMモジュール100は、複数のFMチップで構成されたフラッシュメモリ105と、フラッシュメモリ105に対するリード/ライトを制御するFMコントローラ103とを有する。FMコントローラ103は、上位装置(ストレージコントローラ1401)に接続される上位I/F102、メモリ(例えば揮発性メモリ)の一例であるDRAM(Dynamic Random Access Memory)106、及び、それらに接続されたコントローラ本体101を有する。コントローラ本体101は、圧縮伸張回路104及びXOR回路107を含む。コントローラ本体101は、上位I/F102、フラッシュメモリ105及びDRAM106を制御するプロセッサ(マイクロプロセッサ)を含んでよい。プロセッサは、上位I/F102を通じて受信したリード/ライトコマンドを解釈したり、リード/ライトデータを送受信したり、圧縮伸張回路104にデータの圧縮/伸張を実行させたり、XOR回路107に排他的論理和計算を実行させたり、フラッシュメモリ105とDRAM106との間のデータ転送を実行したりできる。
 上位I/F102は、上位装置から発行されたライトコマンドに従うユーザデータを上位装置から受信したり、上位装置から発行されたリードコマンドに従うユーザデータを上位装置に送信したりする。
 圧縮伸張回路104は、FMコントローラ103内にハードウェア(論理回路)として実装された演算器でよく、所定の可逆変換圧縮アルゴリズム(例えばLZ77アルゴリズム)によって、平文(平文状態のデータ)を可逆的に圧縮することにより圧縮データ(圧縮状態のデータ)を作成すしたり、圧縮データを伸張することにより元の平文データを作成したりできる。
 XOR回路107は、FMコントローラ103内にハードウェア(論理回路)として実装された演算器でよく、同じサイズの2つのデータの排他的論理和を計算し、それらと同じサイズのデータを作成できる。排他的論理和とは、2つのデータの同じ位置に等しい値があると0を作成し、異なる値があると1を作成する演算である。よって、XOR回路107に入力される2つのデータがよく似たデータであるほど、作成されるデータはゼロ値が長く連続するパタンが多く含まれるデータとなる。なお、このようなデータは、上記の圧縮アルゴリズムで圧縮することでデータ量を大きく削減することができる。
 DRAM106は、上位装置から受信したライトデータ(フラッシュメモリ105に書き込まれるデータ)、及び、上位装置へ送信するリードデータ(フラッシュメモリ105から読み出されたデータ)を一時的に格納する。また、DRAM106は、フラッシュメモリ105にライトされるデータを一時的に格納するライトバッファとして機能する。また、DRAM106は、フラッシュメモリ105からリードしたデータを一時的に格納するリードバッファとして機能する。また、DRAM106は、圧縮伸張回路104により圧縮/伸張するデータの転送元、および、圧縮/伸張の結果データ(圧縮データ/平文データ)の転送先として機能する。また、DRAM106は、XOR回路107により排他的論理和を計算する2つのデータの転送元、および、XOR回路107による作成結果データの転送先として機能する。
 次に、図2A、図2B、図2Cを参照しながら、フラッシュメモリ105に書き込まれるデータに適用されるデータフォーマットについて説明する。
 図2Aは、単独割当ページに書き込まれる平文ユーザデータ(平文状態のユーザデータ)のデータフォーマットを示す。
 保証コードを含むユーザデータ(Di,Gi)200は、平文状態で8448バイトの長さを持ち、16個の512バイトのセクタデータ(201、202、203、…、204)を含み、それぞれに16バイトの保証コード(211、212、213、…、214)が付加されている。
 FMコントローラ103は、単独割当ページの平文ユーザデータを圧縮し圧縮ユーザデータ(圧縮状態のユーザデータ)をフラッシュメモリ105に書き込む。本実施例では、単独割当ページのユーザデータについて2通りの形成方法がある。第1の形成方法によれば、単独割当ページのユーザデータは、ユーザデータそのものであり、第2の形成方法によれば、単独割当ページのユーザデータは、基準データ(8448バイト)と差分データ(8448バイト)の排他的論理和である。第1の形成方法によれば、FMコントローラ103は、ユーザデータそのものを圧縮してフラッシュメモリ105に書き込む。第2の形成方法によれば、FMコントローラ103は、基準データおよび差分データをそれぞれ圧縮して別々にフラッシュメモリ105に書き込む。そのため、FMコントローラ103は、第2の形成方法に従うユーザデータを復元するには、フラッシュメモリ105から読み出した基準データおよび差分データをそれぞれ圧縮伸張回路104により伸張して平文状態に戻し、さらに、平文状態の基準データ及び差分データの排他的論理和データをXOR回路107より作成する必要がある。
 図15Aは、2通りの形成方法の概念図である。ここでは、第1の形成方法におけるユーザデータそのものも「基準データ」と呼ぶことがある。
 本実施例によれば、単独割当ページのユーザデータに第2の形成方法を適用することで、フラッシュメモリ105の書込み量を削減できる。その理由を以下に示す。
 例えば、更新前のユーザデータと更新後のユーザデータの違いは100ビット目だけ(1ビットだけ)であるとする。従来技術によれば、違いがわずか1ビットでも、更新前のユーザデータを無効化し、更新後のユーザデータを圧縮してフラッシュメモリ105へ格納しなければならない。しかし、本実施例の第2の形成方法によれば、基準データが、更新前のユーザデータであり、差分データが、100ビット目が1で残り全部のビットが0のデータである。これにより、フラッシュメモリ105に更新前のユーザデータが有効データのまま残り、圧縮された差分データが更に有効データとして書き込まれる。このとき、差分データは、ゼロ値が長く連続するパタンを含むデータであるため、圧縮状態の差分データの量は非常に小さくなる。結果として、圧縮された更新後ユーザデータのサイズよりも、圧縮された更新前ユーザデータと圧縮された差分データの合計サイズの方が小さい。
 このように、本実施例によれば、更新前後のユーザデータに一致する部分が多い場合に、フラッシュメモリ105の書込み量を削減でき、フラッシュメモリ105の長寿命化を図ることができる。
 一方、図2Bは、重複割当ページの平文ユーザデータから分離されたセクタ部である平文セクタ部のデータフォーマットを示す。セクタ部Dj220は、平文状態で8192バイトの長さを持ち、16個の512バイトのセクタデータ(221、222、223、…、224)で構成される。
 図2Cは、重複割当ページの平文ユーザデータから分離された平文コード部のデータフォーマットを示す。コード部Gj230は、256バイトの長さを持ち、16個の16バイトの保証コード(231、232、233、…、234)で構成される。
 重複割当ページのユーザデータとして、フラッシュメモリ105には、図2Bのフォーマットに従う平文セクタ部が圧縮されたセクタ部と、図2Cのフォーマットに従う平文コード部とが書き込まれる。FMモジュール100では、重複割当ページのセクタ部について2通りの形成方法がある。第1の形成方法によれば、重複割当ページのセクタ部は、ユーザデータから分離されたセクタ部そのものである。第2の形成方法によれば、基準データ(8192バイト)と差分データ(8192バイト)の排他的論理和である。第1の形成方法の場合、セクタ部そのものが圧縮されてフラッシュメモリ105に書き込まれる。第2の形成方法の場合、基準データおよび差分データがそれぞれ圧縮され別々にフラッシュメモリ105に書き込まれる。そのため、セクタ部を復元するには、FMコントローラ103は、フラッシュメモリ105から読み出した基準データおよび差分データをそれぞれ圧縮伸張回路104により伸張し、平文状態の基準データ及び差分データの排他的論理和データをXOR回路107により作成する。FMモジュール100では、重複割当ページのセクタ部が第1の形成方法に従うセクタ部の場合、セクタ部そのものが複数の論理ページで共有される。すなわち、重複割当ページに割り当てられた物理ページ内のセクタ部が、複数の論理ページ(重複割当ページ)で共有される。一方、重複割当ページのセクタ部が第2の形成方法に従うセクタ部の場合、基準データが、複数の論理ページ(重複割当ページ)で共有され、差分データが、重複割当ページ毎に個別に管理される。なお、重複割当ページのコード部は、どちらの形成方法の場合も、重複割当ページ毎に個別に管理される。図15Bは、例えば、第1の形成方法を適用したユーザデータAとD、第2の形成方法を適用したユーザデータBとCが、基準データを共有している様子を示した概念図である。ここでは、第1の形成方法におけるセクタ部そのものも基準データと呼ぶことにする。
 本実施例によれば、重複割当ページのセクタ部において、第1の形成方法に加えて第2の形成方法も適用するため、フラッシュメモリ105の書込み量を削減することができる。その理由を以下に示す。
 例えば、図15Bにおいて、ユーザデータAのセクタ部とユーザデータBのセクタ部の違いが100ビット目だけ(1ビットだけ)であるとする。従来技術(特許文献1も含む)が適用された場合、両者は異なるデータと判断され、重複割当ページとして管理されず、それぞれ別々に圧縮してフラッシュメモリ105へ格納される。本実施例では、ユーザデータBのセクタ部に第2の形成方法が適用されることで、ユーザデータAのセクタ部が基準データとなり、100ビット目が1で残り全部のビットが0のデータが差分データBとなる。これにより、フラッシュメモリ105には、圧縮された基準データ(セクタ部)と、圧縮された差分データBが書き込まれる。このとき、差分データBはゼロ値が長く連続するパタンを含むデータであるため、サイズは非常に小さくなる。結果として、ユーザデータAのセクタ部とユーザデータBのセクタ部を別々に圧縮してフラッシュメモリ105へ書き込まれるよりも、書込み量が少なくなる。
 このように、本実施例によれば、複数の論理ページのセクタ部が完全に一致する場合のみならず、複数の論理ページのセクタ部に一致する部分が多い場合にも、重複排除を適用することで、フラッシュメモリ105の書込み量を削減でき、フラッシュメモリ105の長寿命化を図ることができる。
 次に、図3を参照しながら、フラッシュメモリ105へのデータライト方法を示す。なお、図3において、塗りつぶし(模様)は、データ(ユーザデータ、セクタ部又はコード部)であることを意味し、白塗りは、ダミーデータ(ヌルデータ)であることを意味する。
 これまで説明してきたように、FMコントローラ103は、図2Aまたは図2Bのデータフォーマットに従う基準データや差分データを、フラッシュメモリ105の書込み量を削減するために、圧縮伸張回路104により圧縮してからフラッシュメモリ105に書き込む。圧縮データのサイズは元の平文データ(平文データの構成)によって様々である。同じ値が連続するパタンを多く含むデータのサイズは圧縮により小さくなるが、ランダムパタンを多く含むデータのサイズは圧縮により大きくなることがある。それらの圧縮データ、および図2Cのデータフォーマットに従うコード部は、図3の左側に示すように、フラッシュメモリ105へライトされるまでDRAM106上のライトバッファで一時的に格納される。フラッシュメモリ105は、ページ単位でしかライトできないという特徴を持つため、FMコントローラ103は、ライトバッファの中の圧縮データを連結して、ページサイズ311を超えない最大サイズのデータを作り(連結されたデータの合計がページサイズ311に満たない場合は、連結されたデータにダミーデータを連結することでページサイズ311のデータを作り)、その作られたデータを、フラッシュメモリ105の未使用ページ305(例えば、物理ページP4)にライトする。ページ単位にデータをライトすることを「ページライト」と呼ぶことがある。ページライトのデータには誤り訂正符号に基づくパリティ(図示せず)が付加される。パリティの書込み先領域を提供するために、フラッシュメモリ105の物理ページのサイズ(8640バイト)は1つの論理ページのサイズ(8448バイト)よりも大きくなっている。
 図3の右側には、フラッシュメモリ105の物理ページP0~P3(301、302、303、304)に、圧縮データやコード部が格納されている状態の一例を示す。物理ページP0には、単独割当ページL0及びL6のそれぞれの基準データと、重複割当ページL4の差分データが格納されている。物理ページP1には、重複割当ページL1、L3、L4及びL7が共有する基準データが格納されている。物理ページP2には、単独割当ページL0の差分データ、及び、単独割当ページL5の基準データが格納されている。物理ページP3には、重複割当ページL1、L3、L4及びL7のそれぞれのコード部と、単独割当ページL2の基準データが格納されている。
 次に、図4A、図4Bを参照しながら、フラッシュメモリ105にユーザデータがどのように格納されているかをFMコントローラ103が管理するために、DRAM106上に作成するアドレス変換テーブルと重複カウントテーブルについて説明する。
 図4Aのアドレス変換テーブル400は、論理ページ毎に、論理ページアドレス410、基準データ格納先420、差分フラグ430、差分データ格納先440、重複フラグ450及びコード部アドレス460を含んだ情報を保持する。
 論理ページアドレス410は、論理ページの先頭の論理アドレスである。
 基準データ格納先420は、基準データを格納する物理アドレスPi[Ni](ページアドレスPi、セクタ番号Ni)と格納セクタサイズを含んだ情報である。
 差分フラグ430は、差分の有無を表す。論理ページが第1の形成方法を適用した単独割当ページまたは重複割当ページである場合、差分フラグ430は「OFF」であり(差分無しを意味し)、論理ページが第2の形成方法を適用した単独割当ページまたは重複割当ページである場合、差分フラグ430は「ON」である(差分有りを意味する)。
 差分データ格納先440は、差分フラグ430がONである場合に有効な情報であり、差分データを格納する物理アドレスPi[Ni](ページアドレスPi、セクタ番号Ni)と格納セクタサイズを含む情報である。
 重複フラグ450は、重複排除技術が適用された論理ページか否かを表す。論理ページが単独割当ページである場合、重複フラグ450は「OFF」であり(重複排除技術が適用されていないことを意味し)、論理ページが重複割当ページである場合、重複フラグ450は「ON」である(重複排除技術が適用されていることを意味する)。
 コード部アドレス460は、重複フラグ450が「ON」である場合に有効な情報であり、ユーザデータのコード部を格納する物理アドレスPi[Ni](ページアドレスPi、セクタ番号Ni)を含んだ情報である。なお、コード部のサイズは256バイトであり、格納セクタサイズは1で固定となるため、コード部アドレス460は、格納セクタサイズは含まないでよい。
 なお、図4Aのアドレス変換テーブル400は、一例として、図3の右側に示した格納状態に従う情報(例えば論理ページL0~L7の情報)を保持している。論理ページL0は、第2の形成方法を適用している単独割当ページであり、論理ページL1、L3及びL7は、それぞれ、第1の形成方法を適用している重複割当ページであり、論理ページL2、L5及びL6は、それぞれ、第1の形成方法を適用している単独割当ページであり、論理ページL4は、第2の形成方法を適用している重複割当ページである。
 図4Bの重複カウントテーブル470は、複数の重複割当ページによって共有されている基準データ毎に、基準データアドレス480及び共有カウント490を含んだ情報を保持する。
 基準データアドレス480は、基準データを格納する物理アドレスPi[Ni](ページアドレスPi、セクタ番号Ni)を含んだ情報である。
 共有カウント490は、基準データを共有する論理ページ(重複割当ページ)の数を表す。
 なお、図4Bの重複カウントテーブル470は、具体例として、図3の右側に示した格納状態、すなわち、物理ページP1のセクタ番号0から格納されている基準データを4個の論理ページL1、L3、L4及びL7が共有していることを表している。
 次に、図5を参照しながら、FMモジュール100が上位装置(ストレージコントローラ1401)からのライトコマンドに従いユーザデータを更新する時の処理について説明する。FMモジュール100のFMコントローラ103は、フラッシュメモリ105の書込み量を小さくするために、この処理によって更新対象ユーザデータの形成方法として最適なものを選択する。
 まず、FMコントローラ103は、ライトコマンドで指定された論理アドレスWaが属する論理ページアドレスLkを算出する(ステップ501)。FMコントローラ103は、算出した論理ページアドレスLkに対応した重複フラグ450が「OFF」か「ON」かを判断する(ステップ502)。「OFF」(単独割当ページ)ならば、ステップ503に遷移し、「ON」(重複割当ページ)ならば、ステップ504に遷移する。
 ステップ503では、FMコントローラ103は、ライトコマンドに従うライトデータのセクタ数がページサイズ(16セクタ)であるか、それよりも小さいサイズであるかを判断する。ページサイズであるならば、FMコントローラ103は、ステップ600の単独割当ページの全体ライト処理を実行する。さもなくば、FMコントローラ103は、ステップ700の単独割当ページの部分ライト処理を実行する。
 ステップ504では、FMコントローラ103は、ライトコマンドによってライトされるライトデータのセクタ数がページサイズ(16セクタ)であるか、それよりも小さいサイズであるかを判断する。ページサイズであるならば、FMコントローラ103は、ステップ800の重複割当ページの全体ライト処理を実行する。さもなくば、FMコントローラ103は、ステップ900の重複割当ページの部分ライト処理を実行する。
 ここで、図10~図13を用いて、ステップ600の単独割当ページの全体ライト処理、ステップ700の単独割当ページの部分ライト処理、ステップ800の重複割当ページの全体ライト処理、ステップ900の重複割当ページの部分ライト処理のそれぞれを詳細に説明する。
 図10は、単独割当ページの全体ライト処理を示す。
 この処理は、論理ページLkのユーザデータをライトデータWdに更新する際に、そのユーザデータの新しい形成方法を選択する処理である。すなわち、第1の形成方法を選択して、ライトデータWdを新しい基準データとして書き込むか、もしくは第2の形成方法を選択して、現在の基準データを変更せずにライトデータWdとの差分データを書き込むかが分かれる。
 データ1010は、現在の基準データの圧縮データであり、フラッシュメモリ105に格納されている。第2の形成方法の差分データを作成するためには、その圧縮データをリードして伸張し、ライトデータWdと排他的論理和を計算(1040)する必要がある。
 データ1020は、第1の形成方法のための新しい基準データの圧縮データであり、データ1030は、第2の形成方法のための差分データの圧縮データである。FMコントローラ103は、フラッシュメモリ105へのライトサイズが小さいほうを選ぶ。データ1020の方が小さい場合は、FMコントローラ103は、データ1020をライトして第1の形成方法を選ぶ。データ1030の方が小さい場合は、FMコントローラ103は、データ1030をライトして第2の形成方法を選ぶ。なお、サイズが同じなら、FMコントローラ103は、データ1020をライトして第1の形成方法を選ぶ。なぜなら、第2の形成方法では、ユーザデータのリード時に基準データと差分データの2つを読み出さなければならず、リード性能が劣るからである。
 この処理では、ライトデータWdが現在の基準データとよく似たデータパタンであるほど、差分データはゼロ値の連続が多く含まれて小さく圧縮できるため、第2の形成方法の選択が有利になる。
 なお、FMコントローラ103は、図10を参照して説明した方法でライトされたライトデータWdをリード対象としたリードコマンドを上位装置(ストレージコントローラ1401)から受信した場合、アドレス変換テーブル400を基に、ライトデータWdを復元し、ライトデータWdをリードデータとして上位装置に送信することができる。復元されたライトデータWdは、(1)データ1020を伸張することにより生成されたデータであるか、又は、(2)データ1030を伸張することにより得られた差分データ(新)とデータ1010を伸張することにより得られた基準データとの排他的論理和である。
 図11は、単独割当ページの部分ライト処理を示す。
 この処理は、論理ページLkのユーザデータの一部をライトデータWdで書き換える際に、書き換え後のユーザデータの新しい形成方法を選択する処理である。すなわち、第1の形成方法を選択して、書き換え後のユーザデータを新しい基準データとして書き込むか、もしくは第2の形成方法を選択して、現在の基準データを変更せずに書き換え後のユーザデータとの差分データを書き込むかが分かれる。
 データ1110は、現在の基準データの圧縮データであり、データ1120は、現在の差分データの圧縮データであり、ともにフラッシュメモリ105に格納されている。第2の形成方法の差分データを作成するためには以下の処理を行う必要がある。すなわち、FMコントローラ103は、データ1110及び1120をそれぞれリードして伸張し、両者の排他的論理和を計算(1150)して現在のユーザデータを作成する。次に、FMコントローラ103は、ライトデータWdで現在のユーザデータの一部を書き換えて新しいユーザデータを作成し(1160)、新しいユーザデータと現在の基準データとの排他的論理和を計算(1170)して新しい差分データを作成する。
 データ1130は、第1の形成方法のための新しい基準データの圧縮データであり、データ1140は、第2の形成方法のための差分データの圧縮データある。FMコントローラ103は、フラッシュメモリ105へのライトサイズが小さいほうを選ぶ。データ1130の方が小さい場合は、FMコントローラ103は、データ1130をライトして第1の形成方法を選ぶ。データ1140の方が小さい場合は、FMコントローラ103は、データ1140をライトして第2の形成方法を選ぶ。なお、サイズが同じなら、FMコントローラ103は、データ1130をライトして第1の形成方法を選ぶ。なぜなら、第2の形成方法では、ユーザデータのリード時に基準データと差分データの2つを読み出さなければならず、リード性能が劣るからである。
 この処理では、ライトデータWdのサイズが小さい程(書き換え量が小さい程)、新しい差分データはゼロ値の連続が多く含まれて小さく圧縮できるため、第2の形成方法の選択が有利になる。
 なお、FMコントローラ103は、図11を参照して説明した方法でライトされたライトデータWdをリード対象としたリードコマンドを上位装置から受信した場合、アドレス変換テーブル400を基に、ライトデータWdを復元し、ライトデータWdをリードデータとして上位装置に送信することができる。復元されたライトデータWdは、(1)データ1130を伸張することにより生成されたデータから抽出された部分データであるか、又は、(2)データ1140を伸張することにより得られた差分データ(新)とデータ1110を伸張することにより得られた基準データとの排他的論理和から抽出された部分データである。
 図12は、重複割当ページの全体ライト処理を示す。
 この処理は、論理ページLkのユーザデータをライトデータWdに更新する際に、論理ページLkの新しいページ種別と、そのユーザデータの新しい形成方法を選択する処理である。すなわち、単独割当ページの第1の形成方法を選択して、ライトデータWdを新しい基準データとして書き込むか、もしくは重複割当ページの第2の形成方法を選択して、現在の基準データを変更せずに差分データ(ライトデータWdとの差分データ)とコード部とを書き込むかが分かれる。
 データ1210は、現在の基準データの圧縮データであり、フラッシュメモリ105に格納されている。重複割当ページの第2の形成方法の差分データを作成するためには、データ1210をリードして伸張し、ライトデータWdから分離(1240)したセクタ部と排他的論理和を計算(1250)する必要がある。
 データ1220は、単独割当ページの第1の形成方法のための新しい基準データの圧縮データであり、データ1230は、重複割当ページの第2の形成方法のための差分データの圧縮データと、ライトデータWdから分離(1250)したコード部とが連結されたデータである。FMコントローラ103は、フラッシュメモリ105へのライトサイズが小さいほうを選ぶ。データ1220の方が小さい場合は、FMコントローラ103は、データ1220をライトして単独割当ページの第1の形成方法を選ぶ。データ1230の方が小さい場合は、FMコントローラ103は、データ1230をライトして重複割当ページの第2の形成方法を選ぶ。なお、サイズが同じなら、FMコントローラ103は、データ1220をライトして単独割当ページの第1の形成方法を選ぶ。なぜなら、重複割当ページの第2の形成方法では、ユーザデータのリード時に基準データと差分データとコード部の3つを読み出さなければならず、リード性能が劣るからである。
 この処理では、ライトデータWdのセクタ部が現在の基準データとよく似たデータパタンであるほど、差分データはゼロ値の連続が多く含まれて小さく圧縮できるため、重複割当ページの第2の形成方法の選択が有利になる。
 なお、FMコントローラ103は、図12を参照して説明した方法でライトされたライトデータWdをリード対象としたリードコマンドを上位装置から受信した場合、アドレス変換テーブル400を基に、ライトデータWdを復元し、ライトデータWdをリードデータとして上位装置に送信することができる。復元されたライトデータWdは、(1)データ1220を伸張することにより生成されたデータであるか、又は、(2)データ1230における圧縮差分データを伸張することにより得られた差分データ(新)とデータ1210を伸張することにより得られた基準データとの排他的論理和と、データ1230のうちのコード部(新)とで構成されたデータである。
 図13は、重複割当ページの部分ライト処理を示す。
 この処理は、論理ページLkのユーザデータの一部をライトデータWdで書き換える際に、論理ページLkの新しいページ種別と、書き換え後のユーザデータの新しい形成方法を選択する処理である。すなわち、単独割当ページの第1の形成方法を選択して、書き換え後のユーザデータを新しい基準データとして書き込むか、もしくは重複割当ページの第2の形成方法を選択して、現在の基準データを変更せずに差分データ(書き換え後のユーザデータとの差分データ)とコード部とを書き込むかが分かれる。
 データ1310は、現在の基準データの圧縮データであり、データ1320は、現在の差分データの圧縮データであり、データ1330は、現在のコード部であり、それらはフラッシュメモリ105に格納されている。重複割当ページの第2の形成方法の差分データを作成するためには以下の処理を行う必要がある。すなわち、FMコントローラ103は、リードしてさらに伸張した、基準データと差分データとの排他的論理和を計算(1360)し、その計算(1360)により作成された排他的論理和データに、リードしたコード部を合成(1370)して現在のユーザデータを作成する。次に、FMコントローラ103は、ライトデータWdで現在のユーザデータの一部を書き換えて新しいユーザデータを作成し(1380)、新しいユーザデータから分離(1390)したセクタ部と、現在の基準データとの排他的論理和を計算(1300)して新しい差分データを作成する。
 データ1340は、単独割当ページの第1の形成方法のための新しい基準データの圧縮データであり、データ1350は、重複割当ページの第2の形成方法のための差分データの圧縮データと、新しいユーザデータから分離(1390)したコード部とが連結されたデータである。FMコントローラ103は、フラッシュメモリ105へのライトサイズが小さいほうを選ぶ。データ1340の方が小さい場合は、FMコントローラ103は、データ1340をライトして単独割当ページの第1の形成方法を選ぶ。データ1350の方が小さい場合は、FMコントローラ103は、データ1350をライトして重複割当ページの第2の形成方法を選ぶ。なお、サイズが同じなら、FMコントローラ103は、データ1340をライトして単独割当ページの第1の形成方法を選ぶ。なぜなら、重複割当ページの第2の形成方法では、ユーザデータのリード時に基準データと差分データとコード部の3つを読み出さなければならず、リード性能が劣るからである。
 この処理では、ライトデータWdが小さい程(書き換え量が小さい程)、新しい差分データはゼロ値の連続が多く含まれて小さく圧縮できるため、重複割当ページの第2の形成方法の選択が有利になる。
 なお、FMコントローラ103は、図13を参照して説明した方法でライトされたライトデータWdをリード対象としたリードコマンドを上位装置から受信した場合、アドレス変換テーブル400を基に、ライトデータWdを復元し、ライトデータWdをリードデータとして上位装置に送信することができる。復元されたライトデータWdは、(1)データ1340を伸張することにより生成されたデータから抽出された部分データであるか、又は、(2)データ1350における圧縮差分データを伸張することにより得られた差分データ(新)とデータ1310を伸張することにより得られた基準データとの排他的論理和と、データ1350のうちのコード部(新)とで構成されたデータから抽出された部分データである。
 ステップ600の単独割当ページの全体ライト処理の流れについて、図6を参照しながら説明する。なお、以下、説明の冗長を避けるため、FMコントローラ103の圧縮伸張回路104による圧縮/伸張を、FMコントローラ103による圧縮/伸張と説明し、FMコントローラ103のXOR回路107による排他的論理和の計算を、FMコントローラ103による排他的論理和の計算と説明する。また、ステップ501で算出した論理ページアドレスLkが属する論理ページを「論理ページLk」と言う。
 まず、FMコントローラ103は、ステップ501で算出した論理ページアドレスLkに対応した基準データ格納先420(物理アドレスPx[Nx]と格納セクタサイズSx)を取得する(ステップ601)。FMコントローラ103は、その基準データ格納先420が表す物理領域から、論理ページLkの圧縮基準データ(圧縮されている基準データ)をリードし、その圧縮基準データを伸張することで基準データ(平文状態)を復元する(ステップ602)。
 次に、FMコントローラ103は、論理ページLkの基準データ(ステップ602で復元された基準データ)とライトデータWdとの排他的論理和を計算することで論理ページLkの差分データを作成し、その差分データを圧縮することで圧縮差分データを作成する(ステップ603)。
 一方で、FMコントローラ103は、ライトデータWdを圧縮することで圧縮ライトデータを作成する(ステップ604)。
 FMコントローラ103は、ステップ603の結果データ(圧縮差分データ)のサイズとステップ604の結果データ(圧縮ライトデータ)のサイズとを比較し、小さい方を選択してフラッシュメモリ105へライトする(ステップ605)。なお、サイズが同じならステップ604の結果データが選択される。
 ステップ603の結果データを選択した場合は、論理ページLkのユーザデータは第2の形成方法の適用になるので、FMコントローラ103は、論理ページLkに対応した差分フラグ430を「ON」に設定し、ステップ604の結果データを選択した場合は、論理ページLkのユーザデータは第1の形成方法の適用になるので、論理ページLkに対応した差分フラグ430を「OFF」に設定する(ステップ606)。
 以上で単独割当ページの全体ライト処理が終わり、図5のステップ505に遷移する。
 ステップ700の単独割当ページの部分ライト処理の流れについて、図7を参照しながら説明する。
 まず、FMコントローラ103は、ステップ501で算出した論理ページアドレスLkに対応した基準データ格納先420(物理アドレスPx[Nx]と格納セクタサイズSx)を取得する(ステップ701)。FMコントローラ103は、その基準データ格納先420が表す物理領域から、論理ページLkの圧縮基準データをリードし、その圧縮基準データを伸張することで基準データ(平文状態)を復元する(ステップ702)。
 次に、ステップ703として、FMコントローラ103は、論理ページLkに対応した差分フラグ430を調べ、「OFF」ならばステップ704に、「ON」ならばステップ705に遷移する。
 ステップ704では、FMコントローラ103は、差分データが存在しないので、ステップ702の結果データ(復元された基準データ)を論理ページLkの現在のユーザデータとし、ステップ708に遷移する。
 一方、ステップ705では、FMコントローラ103は、現在の差分データを得るため、論理ページアドレスLkに対応した差分データ格納先440(物理アドレスPy[Ny]と格納セクタサイズSy)を取得する。FMコントローラ103は、その差分データ格納先440が表す物理領域から、論理ページLkの圧縮差分データ(圧縮された差分データ)をリードし、その圧縮差分データを伸張することにより差分データ(平文状態)を復元する(ステップ706)。そして、FMコントローラ103は、論理ページLkの基準データと差分データとの排他的論理和を計算することで論理ページLkの現在のユーザデータを作成する(ステップ707)。その後、ステップ708に遷移する。
 ステップ708では、FMコントローラ103は、論理ページLkの現在のユーザデータにおいて、ライトコマンドで指定されたアドレスWaの部分をライトデータWdで書き換え、論理ページLkの新しいユーザデータを作成する。
 次に、FMコントローラ103は、論理ページLkの現在の基準データと新しいユーザデータとの排他的論理和を計算することで論理ページLkの新しい差分データを作成し、その新しい差分データを圧縮することにより圧縮差分データを作成する(ステップ709)。
 一方で、FMコントローラ103は、論理ページLkの新しいユーザデータを圧縮することにより圧縮ユーザデータを作成する(ステップ710)。
 FMコントローラ103は、ステップ709の結果データ(圧縮差分データ)のサイズとステップ710の結果データ(圧縮ユーザデータ)のサイズとを比較し、小さい方を選択してフラッシュメモリ105へライトする(ステップ711)。なお、サイズが同じならステップ710の結果データが選択される。
 ステップ709の結果データを選択した場合は、論理ページLkのユーザデータは第2の形成方法の適用になるので、FMコントローラ103は、論理ページアドレスLkに対応した差分フラグ430を「ON」に設定し、ステップ710の結果データを選択した場合は、論理ページLkのユーザデータは第1の形成方法の適用になるので、論理ページアドレスLkに対応した差分フラグ430を「OFF」に設定する(712)。
 以上で単独割当ページの部分ライト処理が終わり、図5のステップ505に遷移する。
 ステップ800の重複割当ページの全体ライト処理の流れについて、図8を参照しながら説明する。
 まず、FMコントローラ103は、ステップ501で算出した論理ページアドレスLkに対応した基準データ格納先420(物理アドレスPx[Nx]と格納セクタサイズSx)を取得する(ステップ801)。FMコントローラ103は、その基準データ格納先420が表す物理領域から、論理ページLkの圧縮基準データをリードし、その圧縮基準データを伸張することで基準データ(平文状態)を復元する(ステップ802)。
 次に、FMコントローラ103は、論理ページLkの基準データとライトデータWdから分離したセクタ部との排他的論理和を計算することにより論理ページLkの差分データを作成し、その差分データを圧縮することにより圧縮差分データを作成する(ステップ803)。さらに、FMコントローラ103は、ライトデータWdから分離したコード部を論理ページLkの新しいコード部とし(ステップ804)、それをステップ803の結果データ(圧縮差分データ)に結合する(ステップ805)。
 一方で、FMコントローラ103は、ライトデータWdを圧縮することにより圧縮ライトデータを作成する(ステップ806)。
 FMコントローラ103は、ステップ805の結果データ(圧縮差分データ+新しいコード部)のサイズとステップ806の結果データ(圧縮ライトデータ)のサイズとを比較し、小さい方を選択してフラッシュメモリ105へライトする(ステップ807)。なお、サイズが同じならステップ806の結果データが選択される。
 ステップ805の結果データを選択した場合は、論理ページLkのユーザデータは第2の形成方法の適用になるので、FMコントローラ103は、論理ページアドレスLkに対応した差分フラグ430を「ON」に設定し、ステップ806の結果データを選択した場合は、論理ページLkのユーザデータは第1の形成方法の適用になるので、論理ページアドレスLkに対応した差分フラグ430を「OFF」に設定する(ステップ808)。
 以上で重複割当ページの全体ライト処理が終わり、図5のステップ509に遷移する。
 ステップ900の重複割当ページの部分ライト処理の流れについて、図9を参照しながら説明する。
 まず、FMコントローラ103は、ステップ501で算出した論理ページアドレスLkに対応した基準データ格納先420(物理アドレスPx[Nx]と格納セクタサイズSx)を取得する(ステップ901)。FMコントローラ103は、その基準データ格納先420が表す物理領域から、論理ページLkの圧縮基準データ(圧縮されている基準データ)をリードし、その圧縮基準データを伸張することで基準データ(平文状態)を復元する(ステップ902)。
 次に、ステップ903として、FMコントローラ103は、論理ページLkに対応した差分フラグ430を調べ、「OFF」ならばステップ904に、「ON」ならばステップ906に遷移する。
 ステップ904では、FMコントローラ103は、論理ページLkに対応したコード部アドレス460(物理アドレスPz[Nz])を取得する。FMコントローラ103は、そのコード部アドレス460が表す物理領域から、論理ページLkの現在のコード部をリードし、そのコード部を、ステップ902で得られた基準データと合成して、論理ページLkの現在のユーザデータを作成する(ステップ905)。その後、ステップ909に遷移する。
 一方、ステップ906では、FMコントローラ103は、現在の差分データとコード部を得るため、論理ページLkに対応した差分データ格納先440(物理アドレスPy[Ny]と格納セクタサイズSy)及びコード部アドレス460(物理アドレスPz[Nz])を取得する。FMコントローラ103は、そのた差分データ格納先440が表す物理領域から、論理ページLkの圧縮差分データをリードし、その圧縮差分データを伸張することにより差分データ(平文状態)を復元する(ステップ907)。そして、FMコントローラ103は、ステップ906で取得されたコード部アドレス460(Pz[Nz])が表す物理領域から論理ページLkのコード部をリードし、論理ページLkの基準データと差分データとの排他的論理和を計算し、その計算結果に、上記リードした論理ページLkのコード部を合成することで、論理ページLkの現在のユーザデータを作成する(ステップ908)。その後、ステップ909に遷移する。
 ステップ909では、FMコントローラ103は、論理ページLkの現在のユーザデータにおいて、ライトコマンドで指定されたアドレスWaの部分をライトデータWdで書き換え、論理ページLkの新しいユーザデータを作成する。
 次に、FMコントローラ103は、論理ページLkの現在の基準データと新しいユーザデータのセクタ部との排他的論理和を計算することで論理ページLkの新しい差分データを作成し、その差分データを圧縮することにより圧縮差分データを作成する(ステップ910)。そして、FMコントローラ103は、その結果データ(圧縮差分データ)に、新しいユーザデータから分離したコード部を結合する(ステップ911)。
 一方で、FMコントローラ103は、論理ページLkの新しいユーザデータを圧縮することにより圧縮ユーザデータを作成する(ステップ912)。
 FMコントローラ103は、ステップ911の結果データ(圧縮差分データ+コード部)のサイズとステップ912の結果データ(圧縮ユーザデータ)のサイズとを比較し、小さい方を選択してフラッシュメモリ105へライトする(ステップ913)。なお、サイズが同じならステップ912の結果データが選択される。
 ステップ911の結果データを選択した場合は、論理ページLkのユーザデータは第2の形成方法の適用になるので、FMコントローラ103は、論理ページアドレスLkに対応した差分フラグ430を「ON」に設定し、ステップ912の結果データを選択した場合は、論理ページLkのユーザデータは第1の形成方法の適用になるので、論理ページアドレスLkに対応した差分フラグ430を「OFF」に設定する(ステップ914)。
 以上で重複割当ページの部分ライト処理が終わり、図5のステップ509に遷移する。
 次に、図5のステップ505以降を参照しながら、図6、図7の2つのライト処理の後の処理について説明する。
 ステップ505では、FMコントローラ103は、単独割当ページの全体ライト処理、部分ライト処理のそれぞれ最後のステップにおいて、論理ページアドレスLkの差分フラグ430が「OFF」に設定されたか「ON」に設定されたかを調べる。「OFF」の場合は、第1の形成方法になったことを意味し、ステップ506に遷移する。「ON」の場合は、第2の形成方法になったことを意味し、ステップ508に遷移する。
 ステップ506では、FMコントローラ103は、論理ページアドレスLkに対応した基準データ格納先420を、フラッシュメモリ105にライトした新しい基準データ(圧縮状態)の物理アドレスと格納セクタサイズに更新する。そして、FMコントローラ103は、物理アドレスPx[Nx]に残された更新前の基準データを無効化する(ステップ507)。以上で、ライトコマンド処理が終わる。
 ステップ508では、FMコントローラ103は、論理ページアドレスLkに対応した差分データ格納先440を、フラッシュメモリ105にライトした新しい差分データ(圧縮状態)の物理アドレスと格納セクタサイズに更新する。FMコントローラ103は、物理アドレスPy[Ny]に更新前の差分データが残されていれば(つまり、ライト処理の前、差分フラグ430がONであった場合は)、それを無効化する。以上でライトコマンド処理が終わる。
 次に、図5のステップ509以降を参照しながら、図8、図9の2つのライト処理の後の処理について説明する。
 ステップ509では、FMコントローラ103は、重複割当ページの全体ライト処理、部分ライト処理のそれぞれ最後のステップにおいて、論理ページLkの差分フラグ430が「OFF」に設定されたか「ON」に設定されたかを調べる。「OFF」の場合は、単独割当ページの第1の形成方法になったことを意味し、ステップ510に遷移する。「ON」の場合は、重複割当ページの第2の形成方法になったことを意味し、ステップ514に遷移する。
 ステップ510では、FMコントローラ103は、論理ページアドレスLkに対応した基準データ格納先を、フラッシュメモリ105にライトした新しい基準データ(圧縮状態)の物理アドレスと格納セクタサイズに更新する。これによって、物理アドレスPx[Nx]に残された更新前の基準データを共有している論理ページの数は1つ減ることになるので、FMコントローラ103は、重複カウントテーブル470において、更新前の基準データに対応する共有カウントの値を1つ減算する(ステップ511)。さらに、この減算によって共有カウントの値が0になったならば、もう更新前の基準データを利用している論理ページは存在しないことになるので、FMコントローラ103は、更新前の基準データを無効化する(ステップ512)。そして、FMコントローラ103は、論理ページアドレスLkに対応した重複フラグ450を「OFF」に設定することで論理ページLkを単独割当ページに変更する(ステップ513)。以上でライトコマンド処理が終わる。
 ステップ514では、FMコントローラ103は、論理ページアドレスLkに対応した差分データ格納先440を、フラッシュメモリ105にライトした新しい差分データ(圧縮状態)の物理アドレスと格納セクタサイズに更新し、論理ページアドレスLkに対応したコード部アドレス460を、フラッシュメモリ105にライトした新しいコード部の物理アドレスに更新し、物理アドレスPz[Nz]にある更新前のコード部を無効化する。物理アドレスPy[Ny]に更新前の差分データが残されていれば(つまり、ライト処理の前、差分フラグ430が「ON」であった場合は)、FMコントローラ103は、その更新前の差分データも無効化する。以上でライトコマンド処理が終わる。
 上述した実施例によれば、更新前後のユーザデータの差分が少ない場合には、更新前のユーザデータが無効化されて更新後のユーザデータそれ自体が書き込まれるのではなく、更新前後のユーザデータの排他的論理和である差分データが圧縮されたものが書き込まれる傾向にある。これにより、フラッシュメモリ105の書込み量を削減でき、フラッシュメモリ105の長寿命化を図ることができる。
 また、本実施例では、差分データを排他的論理和で作成する方法が採用されている。この方法は、更新された部分が1つの物理ページ内に数多く散在していても、各々の更新部分の位置を1つ1つ管理する必要がないという特徴がある。これにより、差分に関する管理情報のサイズを小さくできるので、メモリ容量を節約できる効果がある。
 なお、単独割当ページの全体ライト処理600、単独割当ページの部分ライト処理700、重複割当ページの全体ライト処理800、及び、重複割当ページの部分ライト処理900のうちの少なくとも1つにおいては、幾つかの変形例も可能である。
 第1の変形例では、データ(基準データ及び差分データの少なくとも一方)の圧縮効果がない場合には、データは、平文状態のままフラッシュメモリ105にライトされてよい。データが平文状態でライトされれば、そのデータをリードする際に伸張処理の時間が削減できるため、FMモジュール100のリード応答性能が向上する。
 第2の変形例では、XOR回路107によって作成された差分データが全てゼロ値(所定ビット値又は所定バイト値)からなるデータの場合、FMコントローラ103は、以降の圧縮処理をせず、フラッシュメモリ105に差分データをライトせず、論理ページLkに対応した差分フラグ430を「OFF」に設定(差分データを利用しない第1の形成方法を選択)して、すぐにライトコマンド処理を終えてもよい。これにより、フラッシュメモリ105の書込み量を削減できる。また、差分データの圧縮処理時間、フラッシュメモリ105へのライトの時間も削減でき、FMモジュール100のライトコマンド処理性能も向上する。
 第3の変形例では、XOR回路107によって作成された差分データにおける非ゼロ値の数が所定個数以下ならば(つまり更新部分が少なければ)、FMコントローラ103は、論理ページLkに対応した差分フラグ430を「ON」に設定(差分データを利用する第2の形成方法を選択)して、ユーザデータ(更新データ)の圧縮処理を行うことなくライトコマンド処理を終えてもよい。つまり、圧縮ユーザデータを作成して上述したような比較を行うことなく、ライトコマンド処理が終了してよい。
 第4の変形例では、ユーザデータのセクタ部のサイズが所定サイズ以下ならば(つまり更新部分が少なければ)、FMコントローラ103は、論理ページLkに対応した差分フラグ430を「ON」に設定(差分データを利用する第2の形成方法を選択)して、ユーザデータ(セクタ部)の圧縮処理を行うことなくライトコマンド処理を終えてもよい。つまり、圧縮ユーザデータを作成して上述したような比較を行うことなく、ライトコマンド処理が終了してよい。
 第5の変形例では、ライトコマンドに従うライトデータがオールゼロなどの固定パタン(例えばフォーマットのためのデータ)ならば、FMコントローラ103は、論理ページLkに対応した差分フラグ430を「OFF」に設定(差分データを利用しない第1の形成方法を選択)して、差分データの生成及び圧縮処理を行うことなくライトコマンド処理を終えてもよい。
 以上、幾つかの実施例及び変形例を説明したが、これらは本発明の説明のための例示であって、本発明の範囲をこれらの実施例及び変形例にのみ限定する趣旨ではない。本発明は、他の種々の形態でも実施することが可能である。
 例えば、単独割当ページと重複割当ページの少なくとも一方において、必ずしもデータサイズの比較は行われなくてもよい。例えば、一定回数第2の形成方法が選択された後に第1の形成方法が選択されその後再び一定回数第2の形成方法が選択されるといったことが行われてもよい。
 また、例えば、FMモジュール100を有する装置は、ストレージ装置1400に限らず、図16に示すように、ホスト1421であってもよい。例えば、ホスト1421(例えばサーバ装置)は、I/F1604、FMモジュール100及びそれらに接続されたCPU1602を有してよい(ホスト1421は、更に、FMモジュール100とは別の種類の記憶デバイス(例えばDRAM)を有してもよい)。FMモジュール100の全部又は一部は、ホスト1421により入出力されるデータのキャッシュメモリとして利用されてよい。図16では、FMモジュール100の上位装置はCPU1602でよい。ホスト1421では、キャッシュメモリのデータを頻繁に書き換えるようなアプリケーションを実行することがあるため、フラッシュメモリ105の書込み量を削減できる本実施例に従うFMモジュール100は、ホスト1421にも有効である。
100…FMモジュール、103…FMコントローラ、104…圧縮伸張回路、105…フラッシュメモリ、106…DRAM、107…XOR回路

Claims (15)

  1.  上位装置に接続される記憶デバイスであって、
     記憶媒体と、
     前記記憶媒体に対するI/O(Input/Output)を制御し前記記憶媒体に基づく論理空間を前記上位装置に提供する媒体コントローラと
    を有し、
     前記論理空間は、複数の論理領域で構成されており、
     各論理領域について基準データ範囲が前記記憶媒体に存在し、
     前記媒体コントローラは、
      ライト先論理アドレスを指定したライトコマンドを前記上位装置から受信し、
      前記ライト先論理アドレスが属するライト先論理領域に対応した基準データ範囲から基準データをリードし、
      前記基準データである第1データと、前記ライトコマンドに従うライトデータに基づくデータと前記ライトデータとのいずれかである第2データとの排他的論理和である差分データを作成し、
      前記差分データを圧縮することにより圧縮差分データを作成し、
      前記圧縮差分データを前記記憶媒体にライトし、
      前記圧縮差分データがライトされた範囲である差分データ範囲を前記ライト先論理領域に関連付ける、
    記憶デバイス。
  2.  前記媒体コントローラは、
      前記第2データ又は前記第2データに基づくデータを圧縮することにより圧縮第2データを生成し、
      前記圧縮第2データよりも前記圧縮差分データを含んだ第3データが小さければ、前記第3データを含む前記圧縮差分データを前記記憶媒体にライトし、
     前記第3データは、前記圧縮差分データ、又は、前記第1データ内の1以上の保証コードであるコード部と前記圧縮差分データとで構成されたデータである、
    請求項1記載の記憶デバイス。
  3.  前記媒体コントローラは、前記第3データよりも前記圧縮第2データが小さければ、前記第3データではなく前記圧縮第2データを前記記憶媒体にライトし、
     前記媒体コントローラは、前記圧縮第2データを前記記憶媒体にライトする場合、前記ライト先論理領域の基準データ範囲を、前記ライト先論理領域に関連付けられている基準データ範囲から、前記圧縮第2データがライトされた範囲である圧縮第2データ範囲に更新する、
    請求項2記載の記憶デバイス。
  4.  前記媒体コントローラは、前記圧縮第2データのサイズが前記第3データのサイズと同じであれば、前記第3データではなく前記圧縮第2データを前記記憶媒体にライトする、
    請求項3記載の記憶デバイス。
  5.  前記媒体コントローラは、前記第3データを前記記憶媒体にライトし、且つ、前記ライト先論理領域に既に差分データ範囲が関連付けられている場合、前記ライト先論理領域の差分データ範囲を、前記ライト先論理領域に関連付けられている差分データ範囲から、前記第3データがライトされた範囲である第3データ範囲に更新する、
    請求項2記載の記憶デバイス。
  6.  前記記憶媒体は、複数の物理領域で構成されており、物理領域単位でデータの入出力が行われるようになっており、
     前記第1データは、物理領域単位の前記基準データであり、
     前記第2データは、物理領域単位の前記ライトデータであり、
     前記差分データは、物理領域単位の前記基準データと物理領域サイズの前記ライトデータとの排他的論理和である、
    請求項1記載の記憶デバイス。
  7.  前記記憶媒体は、複数の物理領域で構成されており、物理領域単位でデータの入出力が行われるようになっており、
     前記第1データは、物理領域単位の前記基準データであり、
     前記第2データは、物理領域単位の更新後データであり、
     物理領域単位の前記更新後データは、
      物理領域単位の前記基準データと物理領域単位未満の前記ライトデータとに基づいて生成されたデータ、又は、
      物理領域単位の前記基準データと前記ライト先論理領域に関連付けられている前記差分データとの排他的論理和により生成された物理領域単位の更新前データと、物理領域単位未満の前記ライトデータとに基づいて生成されたデータ、
    であり、
     前記差分データは、物理領域単位の前記基準データと物理領域単位の前記更新後データとの排他的論理和である、
    請求項1記載の記憶デバイス。
  8.  前記記憶媒体は、複数の物理領域で構成されており、物理領域単位でデータの入出力が行われるようになっており、
     前記ライト先論理領域を含む2以上の論理領域が同一の基準データ範囲に関連付けられており、
     前記第1データは、物理領域単位のデータのうちの1以上の保証コード以外のデータ部である基準実データ部であり、
     前記第2データは、物理領域単位の前記ライトデータのうちの1以上の保証コード以外のデータ部であるライト実データ部であり、
     前記差分データは、前記基準実データ部と前記ライト実データ部との排他的論理和であり、
     前記媒体コントローラは、前記圧縮差分データと、物理領域単位の前記ライトデータのうちの1以上の保証コードであるコード部とで構成された第3データを前記記憶媒体にライトする、
    請求項1記載の記憶デバイス。
  9.  前記媒体コントローラは、
      物理領域単位の前記ライトデータを圧縮することにより圧縮ライトデータを生成し、
      前記圧縮ライトデータよりも前記第3データが小さければ、前記第3データを前記記憶媒体にライトし、
      前記第3データよりも前記圧縮ライトデータが小さければ、前記第3データではなく前記圧縮ライトデータを前記記憶媒体にライトする、
    請求項8記載の記憶デバイス。
  10.  前記記憶媒体は、複数の物理領域で構成されており、物理領域単位でデータの入出力が行われるようになっており、
     前記ライト先論理領域を含む2以上の論理領域が同一の基準データ範囲に関連付けられており、
     前記第1データは、物理領域単位のデータのうちの1以上の保証コード以外のデータ部である基準実データ部であり、
     前記第2データは、物理領域単位の更新後データであり、
     物理領域単位の前記更新後データは、
      前記基準実データ部と、前記ライト先論理領域に関連付けられており前記記憶媒体に格納されている1以上の保証コードである格納コード部とで構成されたデータ、又は、
      物理領域単位の暫定データと、物理領域単位未満の前記ライトデータとに基づいて生成されたデータ、
    であり、
     物理領域単位の前記暫定データは、前記基準実データ部と前記ライト先論理領域に関連付けられている前記差分データとの排他的論理和により生成された更新前データと、前記格納コード部とで構成されたデータであり、
     前記差分データは、物理領域単位の前記更新後データのうちの1以上の保証コード以外のデータ部である更新後実データ部と、前記基準実データ部との排他的論理和であり、
     前記媒体コントローラは、前記圧縮差分データと、物理領域単位の前記更新後データのうちの1以上の保証コードであるコード部とで構成された第3データを前記記憶媒体にライトする、
    請求項1記載の記憶デバイス。
  11.  前記媒体コントローラは、
      物理領域単位の前記更新後データを圧縮することにより圧縮更新後データを生成し、
      前記圧縮更新後データよりも前記第3データが小さければ、前記第3データを前記記憶媒体にライトし、
      前記第3データよりも前記圧縮更新後データが小さければ、前記第3データではなく前記圧縮更新後データを前記記憶媒体にライトする、
    請求項10記載の記憶デバイス。
  12.  前記媒体コントローラは、前記差分データにおいて所定値の数が所定数以上であれば、前記第3データを前記記憶媒体にライトする、
    請求項2記載の記憶デバイス。
  13.  前記媒体コントローラは、前記差分データが全て所定値で構成されたデータであれば、又は、前記ライトデータが所定パタンのデータであれば、前記圧縮第2データを前記記憶媒体にライトする、
    請求項2記載の記憶デバイス。
  14.  記憶デバイスと、
     前記記憶デバイスに対するI/Oを制御するプロセッサと
    を有し、
     前記記憶デバイスは、記憶媒体と、前記記憶媒体に対するI/Oを制御し前記記憶媒体に基づく論理空間を前記プロセッサに提供する媒体コントローラと
    を有し、
     前記論理空間は、複数の論理領域で構成されており、
     各論理領域について基準データ範囲が前記記憶媒体に存在し、
     前記媒体コントローラは、
      ライト先論理アドレスを指定したライトコマンドを前記プロセッサから受信し、
      前記ライト先論理アドレスが属するライト先論理領域に対応した基準データ範囲から基準データをリードし、
      前記基準データである第1データと、前記ライトコマンドに従うライトデータに基づくデータと前記ライトデータとのいずれかである第2データとの排他的論理和である差分データを作成し、
      前記差分データを圧縮することにより圧縮差分データを作成し、
      前記圧縮差分データを前記記憶媒体にライトし、
      前記圧縮差分データがライトされた範囲である差分データ範囲を前記ライト先論理領域に関連付ける、
    装置。
  15.  記憶媒体に基づく空間であり複数の論理領域で構成された論理空間を上位装置に提供し、
     ライト先論理アドレスを指定したライトコマンドを前記上位装置から受信し、
     前記複数の論理領域に対応付けられている複数の基準データ範囲のうちの、前記ライト先論理アドレスが属するライト先論理領域に対応した基準データ範囲から、基準データをリードし、
     前記基準データである第1データと、前記ライトコマンドに従うライトデータに基づくデータと前記ライトデータとのいずれかである第2データとの排他的論理和である差分データを作成し、
     前記差分データを圧縮することにより圧縮差分データを作成し、
     前記圧縮差分データを前記記憶媒体にライトし、
     前記圧縮差分データがライトされた範囲である差分データ範囲を前記ライト先論理領域に関連付ける、
    記憶制御方法。
PCT/JP2014/054643 2014-02-26 2014-02-26 記憶デバイス、記憶デバイスを有する装置、及び記憶制御方法 WO2015128955A1 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
PCT/JP2014/054643 WO2015128955A1 (ja) 2014-02-26 2014-02-26 記憶デバイス、記憶デバイスを有する装置、及び記憶制御方法
US15/110,310 US10444992B2 (en) 2014-02-26 2014-02-26 Storage device, apparatus having storage device, and storage control method
JP2016504903A JP6134857B2 (ja) 2014-02-26 2014-02-26 記憶デバイス、記憶デバイスを有する装置、及び記憶制御方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2014/054643 WO2015128955A1 (ja) 2014-02-26 2014-02-26 記憶デバイス、記憶デバイスを有する装置、及び記憶制御方法

Publications (1)

Publication Number Publication Date
WO2015128955A1 true WO2015128955A1 (ja) 2015-09-03

Family

ID=54008327

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2014/054643 WO2015128955A1 (ja) 2014-02-26 2014-02-26 記憶デバイス、記憶デバイスを有する装置、及び記憶制御方法

Country Status (3)

Country Link
US (1) US10444992B2 (ja)
JP (1) JP6134857B2 (ja)
WO (1) WO2015128955A1 (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018235149A1 (ja) * 2017-06-20 2018-12-27 株式会社日立製作所 ストレージ装置及び記憶領域管理方法
JP2019095913A (ja) * 2017-11-20 2019-06-20 株式会社日立製作所 ストレージシステム
US10564848B2 (en) 2016-04-13 2020-02-18 Fujitsu Limited Information storage device and method for deduplication
JP2021068471A (ja) * 2021-01-14 2021-04-30 株式会社日立製作所 ストレージシステム
US20220236870A1 (en) * 2021-01-26 2022-07-28 EMC IP Holding Company LLC Method and system for compression in block-based storage systems
US11481114B2 (en) 2016-11-08 2022-10-25 Hitachi, Ltd. Storage apparatus and control method of storage apparatus

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170038978A1 (en) * 2015-08-05 2017-02-09 HGST Netherlands B.V. Delta Compression Engine for Similarity Based Data Deduplication
US11294588B1 (en) * 2015-08-24 2022-04-05 Pure Storage, Inc. Placing data within a storage device
US11625181B1 (en) 2015-08-24 2023-04-11 Pure Storage, Inc. Data tiering using snapshots
US9841918B2 (en) * 2015-12-02 2017-12-12 Samsung Electronics Co., Ltd. Flash memory device including deduplication, and related methods
US10282127B2 (en) 2017-04-20 2019-05-07 Western Digital Technologies, Inc. Managing data in a storage system
US10809928B2 (en) 2017-06-02 2020-10-20 Western Digital Technologies, Inc. Efficient data deduplication leveraging sequential chunks or auxiliary databases
US10503608B2 (en) 2017-07-24 2019-12-10 Western Digital Technologies, Inc. Efficient management of reference blocks used in data deduplication
JP2019057074A (ja) 2017-09-20 2019-04-11 東芝メモリ株式会社 メモリシステム
US10990565B2 (en) 2019-05-03 2021-04-27 EMC IP Holding Company, LLC System and method for average entropy calculation
US11138154B2 (en) 2019-05-03 2021-10-05 EMC IP Holding Company, LLC System and method for offset-based deduplication
US10963437B2 (en) * 2019-05-03 2021-03-30 EMC IP Holding Company, LLC System and method for data deduplication
US10733158B1 (en) 2019-05-03 2020-08-04 EMC IP Holding Company LLC System and method for hash-based entropy calculation
US10817475B1 (en) 2019-05-03 2020-10-27 EMC IP Holding Company, LLC System and method for encoding-based deduplication
US11068208B2 (en) * 2019-10-29 2021-07-20 EMC IP Holding Company LLC Capacity reduction in a storage system
US11144208B2 (en) * 2019-12-23 2021-10-12 Advanced Micro Devices, Inc. Data compression system using base values and methods thereof
TWI811674B (zh) * 2021-05-06 2023-08-11 大陸商北京集創北方科技股份有限公司 快閃記憶體的操作方法、系統單晶片及資訊處理裝置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05324485A (ja) * 1992-05-20 1993-12-07 Fujitsu F I P Kk ファイル圧縮暗号処理装置
US6256232B1 (en) * 2000-07-07 2001-07-03 Institute For Information Industry Data access method capable of reducing the number of erasing to flash memory and data patch and access device using the same
JP2006065424A (ja) * 2004-08-25 2006-03-09 Nec Corp データ記憶システム、データ記憶装置及びそれに用いる類似ファイル記録方法並びにそのプログラム
JP2011034370A (ja) * 2009-08-03 2011-02-17 Fujitsu Ltd メモリコントローラ
JP2011505046A (ja) * 2007-11-28 2011-02-17 サンドフォース インコーポレイテッド メモリの寿命を延長するためにメモリ内のスペア領域を増加させること
JP2013532853A (ja) * 2010-10-26 2013-08-19 株式会社日立製作所 ストレージ装置及びデータ制御方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05324485A (ja) * 1992-05-20 1993-12-07 Fujitsu F I P Kk ファイル圧縮暗号処理装置
US6256232B1 (en) * 2000-07-07 2001-07-03 Institute For Information Industry Data access method capable of reducing the number of erasing to flash memory and data patch and access device using the same
JP2006065424A (ja) * 2004-08-25 2006-03-09 Nec Corp データ記憶システム、データ記憶装置及びそれに用いる類似ファイル記録方法並びにそのプログラム
JP2011505046A (ja) * 2007-11-28 2011-02-17 サンドフォース インコーポレイテッド メモリの寿命を延長するためにメモリ内のスペア領域を増加させること
JP2011034370A (ja) * 2009-08-03 2011-02-17 Fujitsu Ltd メモリコントローラ
JP2013532853A (ja) * 2010-10-26 2013-08-19 株式会社日立製作所 ストレージ装置及びデータ制御方法

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10564848B2 (en) 2016-04-13 2020-02-18 Fujitsu Limited Information storage device and method for deduplication
US11481114B2 (en) 2016-11-08 2022-10-25 Hitachi, Ltd. Storage apparatus and control method of storage apparatus
WO2018235149A1 (ja) * 2017-06-20 2018-12-27 株式会社日立製作所 ストレージ装置及び記憶領域管理方法
CN110199265A (zh) * 2017-06-20 2019-09-03 株式会社日立制作所 存储装置和存储区域管理方法
CN110199265B (zh) * 2017-06-20 2022-11-01 株式会社日立制作所 存储装置和存储区域管理方法
JP2019095913A (ja) * 2017-11-20 2019-06-20 株式会社日立製作所 ストレージシステム
JP2021068471A (ja) * 2021-01-14 2021-04-30 株式会社日立製作所 ストレージシステム
JP7017654B2 (ja) 2021-01-14 2022-02-08 株式会社日立製作所 ストレージシステム
US20220236870A1 (en) * 2021-01-26 2022-07-28 EMC IP Holding Company LLC Method and system for compression in block-based storage systems

Also Published As

Publication number Publication date
US20160328154A1 (en) 2016-11-10
JPWO2015128955A1 (ja) 2017-03-30
JP6134857B2 (ja) 2017-05-24
US10444992B2 (en) 2019-10-15

Similar Documents

Publication Publication Date Title
JP6134857B2 (ja) 記憶デバイス、記憶デバイスを有する装置、及び記憶制御方法
US8799562B2 (en) Storage apparatus and data control method for generating and storing format data and guarantee codes
US10664345B2 (en) Physical page, logical page, and codeword correspondence
US10572187B2 (en) Controller, data storage device, and computer program product
US9910748B2 (en) Rebuilding process for storage array
JP5937697B2 (ja) ストレージシステム
JP5026213B2 (ja) ストレージ装置及びデータ重複排除方法
CN110832590A (zh) 在基于相变存储器的存储设备中减轻写入放大的方法和系统
US9304685B2 (en) Storage array system and non-transitory recording medium storing control program
JP6007332B2 (ja) ストレージシステム及びデータライト方法
WO2014170984A1 (ja) ストレージシステム及び記憶制御方法
JP6692448B2 (ja) ストレージ装置及びストレージ装置の制御方法
WO2015029230A1 (ja) 記憶装置及びデータ制御方法
KR101472797B1 (ko) 데이터를 읽거나 쓰기 위한 방법 및 장치
JP2020149195A (ja) メモリシステム
WO2011118114A1 (ja) 不揮発性記憶装置及びメモリコントローラ
US10846234B2 (en) Storage control system and storage control method
JP6050794B2 (ja) フラッシュメモリモジュール、不揮発性半導体メモリモジュール及びストレージ装置
WO2016051599A1 (ja) メモリコントローラ及びデータ制御方法
WO2018061161A1 (ja) ストレージ装置およびその制御方法
US11609844B2 (en) Memory system with hierarchical tables
JP6163588B2 (ja) ストレージシステム
US20190196900A1 (en) Networked storage redundancy scheme
WO2015118680A1 (ja) ストレージ装置
WO2015196416A1 (zh) 数据存储方法、装置和非易失性存储器

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 14884078

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2016504903

Country of ref document: JP

Kind code of ref document: A

WWE Wipo information: entry into national phase

Ref document number: 15110310

Country of ref document: US

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 14884078

Country of ref document: EP

Kind code of ref document: A1