CN105980992A - 一种控制器、闪存装置、识别数据块稳定性的方法以及在闪存装置中存储数据的方法 - Google Patents

一种控制器、闪存装置、识别数据块稳定性的方法以及在闪存装置中存储数据的方法 Download PDF

Info

Publication number
CN105980992A
CN105980992A CN201480075497.1A CN201480075497A CN105980992A CN 105980992 A CN105980992 A CN 105980992A CN 201480075497 A CN201480075497 A CN 201480075497A CN 105980992 A CN105980992 A CN 105980992A
Authority
CN
China
Prior art keywords
data block
flash memory
memory device
reference count
interval
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201480075497.1A
Other languages
English (en)
Other versions
CN105980992B (zh
Inventor
吴黎明
黄斌
赵万
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Publication of CN105980992A publication Critical patent/CN105980992A/zh
Application granted granted Critical
Publication of CN105980992B publication Critical patent/CN105980992B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0638Organizing or formatting or addressing of data
    • G06F3/064Management of blocks
    • G06F3/0641De-duplication techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F12/00Accessing, addressing or allocating within memory systems or architectures
    • G06F12/02Addressing or allocation; Relocation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F12/00Accessing, addressing or allocating within memory systems or architectures
    • G06F12/02Addressing or allocation; Relocation
    • G06F12/0223User address space allocation, e.g. contiguous or non contiguous base addressing
    • G06F12/023Free address space management
    • G06F12/0238Memory management in non-volatile memory, e.g. resistive RAM or ferroelectric memory
    • G06F12/0246Memory management in non-volatile memory, e.g. resistive RAM or ferroelectric memory in block erasable memory, e.g. flash memory
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F12/00Accessing, addressing or allocating within memory systems or architectures
    • G06F12/02Addressing or allocation; Relocation
    • G06F12/0223User address space allocation, e.g. contiguous or non contiguous base addressing
    • G06F12/023Free address space management
    • G06F12/0253Garbage collection, i.e. reclamation of unreferenced memory
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F12/00Accessing, addressing or allocating within memory systems or architectures
    • G06F12/02Addressing or allocation; Relocation
    • G06F12/08Addressing or allocation; Relocation in hierarchically structured memory systems, e.g. virtual memory systems
    • G06F12/0802Addressing of a memory level in which the access to the desired data or data block requires associative addressing means, e.g. caches
    • G06F12/0866Addressing of a memory level in which the access to the desired data or data block requires associative addressing means, e.g. caches for peripheral storage systems, e.g. disk cache
    • G06F12/0868Data transfer between cache memory and other subsystems, e.g. storage devices or host systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F13/00Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
    • G06F13/14Handling requests for interconnection or transfer
    • G06F13/16Handling requests for interconnection or transfer for access to memory bus
    • G06F13/1668Details of memory controller
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/0608Saving storage space on storage systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/0614Improving the reliability of storage systems
    • G06F3/0616Improving the reliability of storage systems in relation to life time, e.g. increasing Mean Time Between Failures [MTBF]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0638Organizing or formatting or addressing of data
    • G06F3/064Management of blocks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/0671In-line storage system
    • G06F3/0673Single storage device
    • G06F3/0679Non-volatile semiconductor memory device, e.g. flash memory, one time programmable memory [OTP]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2212/00Indexing scheme relating to accessing, addressing or allocation within memory systems or architectures
    • G06F2212/10Providing a specific technical effect
    • G06F2212/1032Reliability improvement, data loss prevention, degraded operation etc
    • G06F2212/1036Life time enhancement
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2212/00Indexing scheme relating to accessing, addressing or allocation within memory systems or architectures
    • G06F2212/72Details relating to flash memory management
    • G06F2212/7205Cleaning, compaction, garbage collection, erase control

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Techniques For Improving Reliability Of Storages (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

一种控制器(11),包括处理器(118)、缓存(120)和通信接口(128),所述处理器(118),用于从所述缓存(120)中读取所述第一数据块的信息;根据所述第一数据块的引用计数和所述第一数据块保存在所述闪存装置(22)的时间长度,和数据块的引用计数,数据块保存在闪存装置的时间长度与稳定级别的对应关系,确定所述第一数据块的稳定级别,所述稳定级别用于表示数据块的稳定性;将所述第一数据块的逻辑地址以及所述第一数据块的稳定级别通过所述通信接口(128)发送给所述闪存装置(22),使得闪存装置(22)将相同稳定级别的数据块进行集中存储。

Description

一种控制器、闪存装置、识别数据块稳定性的方法以及在闪存装置中存储数据的方法 技术领域
本发明实施例涉及存储技术领域,特别是一种控制器、闪存装置、识别数据块稳定性的方法以及在闪存装置中存储数据的方法。
背景技术
Flash Memory(闪存)装置是一种非易失性存储器,其存储介质是NAND Flash,具有断电后数据不消失的特点,因此,被广泛的作为外部和内部存储器使用。以NAND Flash为存储介质的闪存装置可能是固态硬盘(全称:Solid State Device,简称:SSD),又名固态驱动器(全称:Solid State Drive,简称:SSD),还可能是其他存储器。
一个SSD通常由多个闪存芯片组成,每个闪存芯片包含若干个块(block)。由于NAND Flash具有擦除特性,保存在block中的数据不会像普通机械硬盘那样直接被修改。当需要对某个逻辑地址指向的数据进行修改时,需要查找一个空闲的block将修改后的数据写入该空闲的block,然后将所述逻辑地址指向新写入的数据,那么,原来的block中的数据则变为无效数据。对于SSD而言,有效数据是指block中保存的有逻辑地址指向的数据,这部分数据可能会被读取;无效数据是指block中保存的没有逻辑地址指向的数据,这部分数据不可能会被读取。
随着SSD中存储的数据越来越多,可利用的空闲的block越来越少,因此有必要对SSD进行垃圾回收以便产生可供利用的空闲的block。垃圾回收是指将block中的有效数据搬移到空闲的block中去,然后将旧的block进行擦除,经过擦除之后的block又可以作为空闲的block再次写入数据。通常情况下,SSD在进行垃圾回收时,会查找包含无效数据较多的block,因为包含无效数据较多的block包含的有效数据较少,那么需要搬移到空闲block 的有效数据会较少。在SSD的寿命跟NAND Flash的擦除次数相关的情况下,垃圾回收时搬移的数据越少,SSD的写放大就越小。然而,由于不同block保存的数据被修改的可能性大致相当,因此每个block包含的无效数据的多少也无明显差别。
发明内容
本发明实施例第一方面提供了一种控制器,所述控制器位于支持重复数据删除的存储系统中,所述存储系统包括闪存装置,所述闪存装置中保存有第一数据块;所述控制器包括处理器、缓存和通信接口;所述通信接口,用于与所述闪存装置通信;所述缓存中保存有所述第一数据块的信息,所述第一数据块的信息包括所述第一数据块的引用计数,或所述第一数据块保存在所述闪存装置的时间长度,或所述第一数据块的引用计数和所述第一数据块保存在所述闪存装置的时间长度,其中所述第一数据块的引用计数等于所述控制器接收所述第一数据块的数量。所述处理器,用于从所述缓存中读取所述第一数据块的信息。然后,根据(1)所述第一数据块的引用计数,和数据块的引用计数与稳定级别的对应关系,或(2)所述第一数据块保存在所述闪存装置的时间长度,和数据块保存在闪存装置的时间长度与稳定级别的对应关系,或(3)所述第一数据块的引用计数和所述第一数据块保存在所述闪存装置的时间长度,和数据块的引用计数,数据块保存在闪存装置的时间长度与稳定级别的对应关系,确定所述第一数据块的稳定级别,所述稳定级别用于表示数据块的稳定性。再将所述第一数据块的逻辑地址以及所述第一数据块的稳定级别通过所述通信接口发送给所述闪存装置。
在第一方面的第一实施方式中,所述数据块的引用计数与稳定级别的对应关系包括:引用计数区间与稳定级别的对应关系。所述处理器,具体用于根据所述第一数据块的引用计数确定第一引用计数区间,所述第一数据块的引用计数位于所述第一引用计数区间中,以及根据所述第一引用计数区间,以及引用计数区间与稳定级别的对应关系确定所述第一数据块的稳定级别。
在第一方面的第二种实施方式中,所述数据块保存在闪存装置的时间长度与稳定级别的对应关系包括:时间区间与稳定级别的对应关系。所述处理器,具体用于根据所述第一数据块保存在所述闪存装置的时间长度确定第一时间区间,所述第一数据块保存在所述闪存装置的时间长度位于所述第一时间区间中,以及根据所述第一时间区间,以及时间区间与稳定级别的对应关系确定所述第一数据块的稳定级别。
在第一方面的第三种实施方式中,所述数据块的引用计数,数据块保存在闪存装置的时间长度与稳定级别的对应关系包括:引用计数区间,时间区间与稳定级别的对应关系。所述处理器,具体用于根据所述第一数据块的引用计数确定第一引用计数区间,所述第一数据块的引用计数位于所述第一引用计数区间中。然后,根据所述第一数据块保存在所述闪存装置的时间长度确定第一时间区间,所述第一数据块保存在所述闪存装置的时间长度位于所述第一时间区间中;再根据所述第一引用计数区间,所述第一时间区间,以及所述引用计数区间,时间区间与稳定级别的对应关系确定所述第一数据块的稳定级别。
本发明实施例第二方面提供了一种闪存装置,包括主控制器和闪存芯片,所述闪存芯片包括块,所述主控制器包括处理器。其中,所述处理器,用于获取目标逻辑地址对应的稳定级别,所述稳定级别用于表示数据块的稳定性;然后,根据所述目标逻辑地址对应的稳定级别,将所述目标逻辑地址对应的数据块写入所述稳定级别对应的块中。
在第二方面的第一种实施方式中,所述处理器,还用于在所述闪存芯片中查找包含无效数据最多的块,所述包含无效数据最多的块包括所述目标逻辑地址对应的数据块。
在第二方面的第二种实施方式中,所述处理器,还用于在所述闪存芯片中查找最长时间内未被擦除的块,所述最长时间内未被擦除的块包括所述目标逻辑地址对应的数据块。
在第二方面的第三种实施方式中,所述主控制器还包括缓存;所述处理器,具体用于确定所述缓存中保存的逻辑地址的个数达到预设阈值时,获取所述目标逻辑地址对应的稳定级别,其中,所述逻辑地址对应的稳定级别与所述目标逻辑地址对应的稳定级别相同。
本发明实施例第三方面提供了一种识别数据块的稳定性的方法,所述方法应用于控制器中,所述控制器位于支持重复数据删除的存储系统中,所述存储系统包括闪存装置,所述闪存装置中保存有第一数据块;所述控制器包括处理器、缓存和通信接口;所述通信接口,用于与所述闪存装置通信;所述缓存中保存有所述第一数据块的信息,所述第一数据块的信息包括所述第一数据块的引用计数,或所述第一数据块保存在所述闪存装置的时间长度,或所述第一数据块的引用计数和所述第一数据块保存在所述闪存装置的时间长度,其中所述第一数据块的引用计数等于所述控制器接收所述第一数据块的数量;所述方法由所述处理器执行。所述方法包括:从所述缓存中读取所述第一数据块的信息,然后,根据(1)所述第一数据块的引用计数,和数据块的引用计数与稳定级别的对应关系,或(2)所述第一数据块保存在所述闪存装置的时间长度,和数据块保存在闪存装置的时间长度与稳定级别的对应关系,或(3)所述第一数据块的引用计数和所述第一数据块保存在所述闪存装置的时间长度,和数据块的引用计数,数据块保存在闪存装置的时间长度与稳定级别的对应关系,确定所述第一数据块的稳定级别,所述稳定级别用于表示数据块的稳定性。再将所述第一数据块的逻辑地址以及所述第一数据块的稳定级别通过所述通信接口发送给所述闪存装置。
在第三方面的第一种实施方式中,所述数据块的引用计数与稳定级别的对应关系包括:引用计数区间与稳定级别的对应关系。所述根据(1)所述第一数据块的引用计数,和数据块的引用计数与稳定级别的对应关系,确定所述第一数据块的稳定级别包括:根据所述第一数据块的引用计数确定第一引用计数区间,所述第一数据块的引用计数位于所述第一引用计数区间中; 以及根据所述第一引用计数区间,以及引用计数区间与稳定级别的对应关系确定所述第一数据块的稳定级别。
在第三方面的第二种实施方式中,所述数据块保存在闪存装置的时间长度与稳定级别的对应关系包括:时间区间与稳定级别的对应关系。所述根据(2)所述第一数据块保存在所述闪存装置的时间长度,和数据块保存在闪存装置的时间长度与稳定级别的对应关系,确定所述第一数据块的稳定级别包括:根据所述第一数据块保存在所述闪存装置的时间长度确定第一时间区间,所述第一数据块保存在所述闪存装置的时间长度位于所述第一时间区间中,以及根据所述第一时间区间,以及时间区间与稳定级别的对应关系确定所述第一数据块的稳定级别。
在第三方面的第三种实施方式中,所述数据块的引用计数,数据块保存在闪存装置的时间长度与稳定级别的对应关系包括:引用计数区间,时间区间与稳定级别的对应关系。所述根据(3)所述第一数据块的引用计数和所述第一数据块保存在所述闪存装置的时间长度,和数据块的引用计数,数据块保存在闪存装置的时间长度与稳定级别的对应关系,确定所述第一数据块的稳定级别包括:根据所述第一数据块的引用计数确定第一引用计数区间,所述第一数据块的引用计数位于所述第一引用计数区间中;然后,根据所述第一数据块保存在所述闪存装置的时间长度确定第一时间区间,所述第一数据块保存在所述闪存装置的时间长度位于所述第一时间区间中;再根据所述第一引用计数区间,所述第一时间区间,以及所述引用计数区间,时间区间与稳定级别的对应关系确定所述第一数据块的稳定级别。
本发明实施例第四方面提供了一种在闪存装置中存储数据的方法,所述闪存装置包括主控制器和闪存芯片,所述闪存芯片包括块,所述主控制器包括处理器;所述方法由所述处理器执行。所述方法包括:获取目标逻辑地址对应的稳定级别,所述稳定级别用于表示数据块的稳定性。然后,根据所述目标逻辑地址对应的稳定级别,将所述目标逻辑地址对应的数据块写入所述 稳定级别对应的块中。
在第四方面的第一种实施方式中,所述方法还包括:在所述闪存芯片中查找包含无效数据最多的块,所述包含无效数据最多的块包括所述目标逻辑地址对应的数据块。
在第四方面的第二种实施方式中,所述方法还包括:在所述闪存芯片中查找最长时间内未被擦除的块,所述最长时间内未被擦除的块包括所述目标逻辑地址对应的数据块。
在第四方面的第三种实施方式中,所述主控制器还包括缓存;所述获取目标逻辑地址对应的稳定级别包括:确定所述缓存中保存的逻辑地址的个数达到预设阈值时,获取所述目标逻辑地址对应的稳定级别,其中,所述逻辑地址对应的稳定级别与所述目标逻辑地址对应的稳定级别相同。
本发明实施例第五方面提供了一种识别数据块的稳定性的装置,所述装置位于控制器中,所述控制器位于支持重复数据删除的存储系统中,所述存储系统包括闪存装置,所述闪存装置中保存有第一数据块。所述装置包括:存储模块,用于保存所述第一数据块的信息,所述第一数据块的信息包括所述第一数据块的引用计数,或所述第一数据块保存在所述闪存装置的时间长度,或所述第一数据块的引用计数和所述第一数据块保存在所述闪存装置的时间长度,其中所述第一数据块的引用计数等于所述控制器接收所述第一数据块的数量。读取模块,用于从所述存储模块中读取所述第一数据块的信息。确定模块,用于根据(1)所述第一数据块的引用计数,和数据块的引用计数与稳定级别的对应关系,或(2)所述第一数据块保存在所述闪存装置的时间长度,和数据块保存在闪存装置的时间长度与稳定级别的对应关系,或(3)所述第一数据块的引用计数和所述第一数据块保存在所述闪存装置的时间长度,和数据块的引用计数,数据块保存在闪存装置的时间长度与稳定级别的对应关系,确定所述第一数据块的稳定级别。发送模块,用于将所述第一数据块的逻辑地址以及所述第一数据块的稳定级别发送给所述闪存装 置。
在第五方面的第一种实施方式中,所述数据块的引用计数与稳定级别的对应关系包括:引用计数区间与稳定级别的对应关系。所述确定模块,具体用于根据所述第一数据块的引用计数确定第一引用计数区间,所述第一数据块的引用计数位于所述第一引用计数区间中;根据所述第一引用计数区间,以及引用计数区间与稳定级别的对应关系确定所述第一数据块的稳定级别。
在第五方面的第二种实施方式中,所述数据块保存在闪存装置的时间长度与稳定级别的对应关系包括:时间区间与稳定级别的对应关系。所述确定模块,具体用于根据所述第一数据块保存在所述闪存装置的时间长度确定第一时间区间,所述第一数据块保存在所述闪存装置的时间长度位于所述第一时间区间中;然后,根据所述第一时间区间,以及时间区间与稳定级别的对应关系确定所述第一数据块的稳定级别。
在第五方面的第三种实施方式中,所述数据块的引用计数,数据块保存在闪存装置的时间长度与稳定级别的对应关系包括:引用计数区间,时间区间与稳定级别的对应关系。所述确定模块,具体用于根据所述第一数据块的引用计数确定第一引用计数区间,所述第一数据块的引用计数位于所述第一引用计数区间中,然后,根据所述第一数据块保存在所述闪存装置的时间长度确定第一时间区间,所述第一数据块保存在所述闪存装置的时间长度位于所述第一时间区间中;再根据所述第一引用计数区间,所述第一时间区间,以及所述引用计数区间,时间区间与稳定级别的对应关系确定所述第一数据块的稳定级别。
本发明实施例第六方面提供了一种在闪存装置中存储数据的装置,所述装置位于所述闪存装置的主控制器中,所述闪存装置中存储有块。所述装置包括:获取模块,用于获取目标逻辑地址对应的稳定级别,所述稳定级别用于表示数据块的稳定性。迁移模块,用于根据所述目标逻辑地址对应的稳定级别,将所述目标逻辑地址对应的数据块写入所述稳定级别对应的块中。在 第六方面的第一种实施方式中,所述获取模块,还用于在所述闪存芯片中查找包含无效数据最多的块,所述包含无效数据最多的块包括所述目标逻辑地址对应的数据块。
在第六方面的第二种实施方式中,所述获取模块,还用于在所述闪存芯片中查找最长时间内未被擦除的块,所述最长时间内未被擦除的块包括所述目标逻辑地址对应的数据块。
在第六方面的第三种实施方式中,所述装置还包括存储模块,所述存储模块中保存有逻辑地址,所述逻辑地址对应的稳定级别与所述目标逻辑地址对应的稳定级别相同。所述获取模块,具体用于确定所述缓存中保存的逻辑地址的个数达到预设阈值时,获取所述目标逻辑地址对应的稳定级别。
本发明实施例第七方面提供了一种计算机程序产品,包括存储了程序代码的计算机可读存储介质,所述程序代码包括的指令用于执行如第三方面至第三方面的第三种实施方式中的任意一种所述的方法。
本发明实施例第八方面提供了一种计算机程序产品,包括存储了程序代码的计算机可读存储介质,所述程序代码包括的指令用于执行如第四方面至第四方面的第三种实施方式中的任意一种所述的方法。
本发明实施例提供的控制器,可以根据(1)所述第一数据块的引用计数,和数据块的引用计数与稳定级别的对应关系,或(2)所述第一数据块保存在所述闪存装置的时间长度,和数据块保存在闪存装置的时间长度与稳定级别的对应关系,或(3)所述第一数据块的引用计数和所述第一数据块保存在所述闪存装置的时间长度,和数据块的引用计数,数据块保存在闪存装置的时间长度与稳定级别的对应关系,确定所述第一数据块的稳定级别,所述稳定级别可以反映数据块的稳定性,并且将所述数据块的稳定级别和逻辑地址发送给闪存装置22,使得闪存装置22将相同稳定级别的数据块进行集中存储。
本发明实施例提供的闪存装置,可以将相同稳定级别的数据块存储在一 个block中。那么,对于存放稳定级别较高的数据块的block,其存储的数据块成为无效数据的可能性较小,整体来看,该block中不含无效数据或仅含少量的无效数据,这样的block属于利用率比较高的block,在对闪存装置22进行垃圾回收时不会回收这样的block;对于存放稳定级别较低的数据块的block,其存储的数据块成为无效数据的可能性较大,假设一个block中的大部分数据或者绝大部分数据都变成了无效数据,那么相应地,这个block中包含的有效数据较少,垃圾回收时需要迁移的数据也较少,减小了写放大。需要说明的是,本实施例的效果主要体现在之后的垃圾回收时搬移的有效数据会减少。由此可见,无论是存放稳定级别较高的数据块的block,还是存放稳定级别较低的数据块的block,都可以减小闪存装置22的写放大,因此在一定程度上延长了闪存装置22的寿命。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对现有技术或实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的存储系统的组成图;
图2是本发明实施例提供的控制器的结构示意图;
图3A是本发明实施例提供的闪存装置的存储介质的结构示意图;
图3B是本发明实施例提供的闪存装置的主控制器的结构示意图;
图4是本发明实施例提供的识别数据块稳定性的方法的流程示意图;
图5是本发明实施例提供的一种在闪存装置中存储数据的方法的流程示意图;
图6是本发明实施例提供的另一种在闪存装置中存储数据的方法的流程示意图;
图7是本发明实施例提供的识别数据块稳定性的装置的结构示意图;
图8是本发明实施例提供的在闪存装置中存储数据的装置的结构示意图。
具体实施方式
本发明实施例提出了一种控制器、闪存装置、识别数据块稳定性的方法以及在闪存装置中存储数据的方法,能够将稳定级别相同的数据块集中存储,使得闪存装置在进行后续的垃圾回收操作时选择到的块所包含的有效数据尽可能得少,从而减小闪存装置的写放大。
在描述本发明实施例之前,首先对下面将要出现的术语进行说明:
数据对象是指包含实际数据的对象,可以是块数据,也可以是文件或者其他形式的数据。
数据块是指由数据对象划分而成的数据单元。为了方便管理,一个数据对象可以被划分为若干个数据块,每个数据块的尺寸相同。
数据块的元数据是指用于描述数据块的信息,例如数据块的逻辑地址、数据块的物理地址、逻辑地址与物理地址之间的对应关系、数据块的写入时间等等。
稳定数据是指被修改的可能性相对较低的数据。
逻辑块地址,又称逻辑地址(英文全称:Logical Block Address,英文简称:LBA),是指数据块的存放地址,该地址并非数据块存储在SSD中的实际地址,而是SSD对外呈现的可访问的地址。
物理块地址,又称物理地址(英文全称:Physical Block Address,英文简称:PBA)是指数据块存储在SSD中的实际地址。
数据块的引用计数(reference count或reference counting),应用于支持重复数据删除功能的存储系统,用来表示数据块在存储系统中的重复数量。对于支持重复数据删除功能的存储系统来说,同一个数据块并不需要在存储 系统中存储多次,所以数据块在存储系统中的重复数量等于控制器接收所述数据块的数量,而实际上只存储了一份。另外,数据块的引用计数也可以表示所述数据块的物理地址被引用的次数。
SSD中的有效数据是指在SSD的block中有逻辑地址指向的数据块,也就是说其物理地址有对应的逻辑地址。
SSD中的无效数据通常是指在SSD的block中保存的没有逻辑地址指向的数据块,也就是说其物理地址没有对应的逻辑地址。
图1描绘了本发明实施例提供的存储系统的组成图,图1所示的存储系统包括控制器11和多个闪存装置22。其中,闪存装置22是以NAND Flash为存储介质的存储装置,可以包括固态硬盘(全称:Solid State Device,简称:SSD),又名固态驱动器(全称:Solid State Drive,简称:SSD),还可能包括其他存储器。本实施例中,闪存装置22以SSD为例说明。
图1仅是示例性说明,并不限定具体的组网方式,如:级联树形组网、环状组网都可以。只要控制器11和闪存装置22之间能够相互通信。
控制器11可以包括当前技术已知的任何计算设备,如服务器、台式计算机等等。控制器11可以接收主机(图1中未示出)发送的数据对象,并且向闪存装置22发送写数据请求,使得闪存装置22将写数据请求中携带的数据对象写入其闪存芯片中。
请参考图2,图2是本发明实施例控制器11的结构示意图。如图2所示,控制器11主要包括处理器(processor)118、缓存(cache)120、存储器(memory)122、通信总线(简称总线)126以及通信接口(Communication Interface)128。处理器118、缓存120、存储器122以及通信接口128通过通信总线126进行相互间的通信。
处理器118可能是一个中央处理器CPU,或者是特定集成电路ASIC(Application Specific Integrated Circuit),或者是被配置成实施本发明实施例 的一个或多个集成电路。在本发明实施例中,处理器118用于接收来自主机的数据对象,将所述数据对象经过一定的处理后再发送给闪存装置22。
通信接口128,用于与主机或闪存装置22通信。
存储器122,用于存放程序124,存储器122可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。可以理解的是,存储器122可以为随机存储器(全称:Random-Access Memory,简称:RAM)、磁碟、硬盘、光盘、固态硬盘(全称:Solid State Disk,简称:SSD)或者非易失性存储器等各种可以存储程序代码的非短暂性的(non-transitory)机器可读介质。
缓存120(Cache)用于暂时存放从主机接收的数据对象或从闪存装置22读取的数据对象。另外,由于Cache读写数据的速度较快,为了方便读取也可以将一些经常使用的信息存放在Cache中,例如数据块的逻辑地址,写入时间等信息。缓存120可以是RAM、储存级内存(全称:Storage-Class Memory,简称:SCM)、非易失存储(全称:Non-Volatile Memory,简称:NVM)、闪存(Flash memory)或固态硬盘(全称:Solid State Disk,简称:SSD)等各种可以存储数据的非短暂性的(non-transitory)机器可读介质,在此不做限定。
缓存120和存储器122可以合设或者分开设置,本发明实施例对此不做限定。
程序124可以包括程序代码,所述程序代码包括计算机操作指令。对于具有重复数据删除功能的存储系统,程序代码可以包括重复数据删除模块和稳定性判断模块。重复数据删除模块用于在将从主机接收的数据对象发送给闪存装置22之前进行重复数据删除。
下面对重复数据删除功能进行简要地介绍:
当控制器11接收主机发送的数据对象之后,可以将所述数据对象划分为尺寸相同的若干个数据块。为了描述方便,以每个数据块的尺寸为4KB 为例来进行说明,可以理解的是,数据块的尺寸并不限于4KB。对于每个数据块,处理器118分别判断各个闪存装置22中是否保存有相同的数据块,如果没有,则将数据块写入闪存装置22,同时将数据块的引用计数设置为初始值(例如,等于1);如果有,则不需要将所述已保存的数据块再次写入闪存装置22,而是将数据块的引用计数加1。由此可见,引用计数在一定程度上反映了数据块的稳定性。引用计数越高的数据块,在相当长的时间内被使用的可能性就越高。数据块被删除的概率越小,数据块就越稳定。
对于如何判断闪存装置22是否保存有相同的数据块,通常的做法是预先保存闪存装置22中存储的各个数据块的指纹信息,其中每个数据块的指纹信息是根据预设的哈希函数对每个数据块进行计算获得的。然后,根据所述哈希函数对待存储的数据块进行计算,获得该待存储的数据块的指纹信息;将所述指纹信息与预先保存的各个数据块的指纹信息进行匹配,如果有相同的指纹信息则说明闪存装置22已经保存有相同的数据块,否则说明没有保存所述待存储的数据块。所述各个数据块的指纹信息可以保存在缓存120中,也可以保存在闪存装置22中。除此之外,还可以采用其他方式判断闪存装置22是否保存有相同的数据块,这里不再一一列举。
另外,对于第一次写入闪存装置22的数据块,控制器11可以保存所述数据块的指纹信息与所述数据块的LBA之间的对应关系。当控制器11需要将所述数据块的LBA发送给闪存装置22时,可以根据所述数据块的指纹信息和所述对应关系查找到所述LBA。具体的,所述数据块的LBA可以是闪存装置22存储所述数据块之后发送给控制器11的,也可以是控制器11为所述数据块分配的LBA,由于闪存装置22中保存有LBA与PBA之间的对应关系,因此闪存装置22可以根据分配的LBA将所述数据块写入PBA对应的存储空间中。
然而,引用计数可以是决定数据块的稳定性的一个参考因素,另外一个可以影响数据块稳定性的参考因素是数据块保存在闪存装置22中的时间长 度。所述数据块保存在闪存装置22中的时间长度可以等于所述系统当前时间减去所述数据块写入所述闪存装置的时间所得的差值。所述数据块写入所述闪存装置的时间可以是所述数据块的元数据的一部分,保存在缓存120或者闪存装置22中。可以理解的是,数据块保存在闪存装置22中的时间长度越长,所述数据块越稳定;反之,越不稳定。可以理解的是,所述时间长度也可以是一个反映数据块保存在闪存装置22中时间长短的数值,并不严格等于所述系统当前时间减去所述数据块写入所述闪存装置的时间所得的差值。
所述稳定性判断模块的主要功能是,基于引用计数,或基于数据块保存在闪存装置22中的时间长度,或基于引用计数和数据块保存在闪存装置22中的时间长度,来判断所述数据块的稳定性,从而得到所述数据块的稳定级别。稳定级别是一个反映数据块稳定性的数值,数值越大稳定性越高,反之越低。或者,也可以将稳定级别定义为数值越小稳定性越高,反之越低。
控制器11在通过所述稳定性判断模块获得数据块的稳定级别之后,可以将所述数据块的LBA与稳定级别发送给闪存装置22,使得闪存装置22将相同级别的数据块集中存储在一个或多个block中。
下面介绍闪存装置22的结构与功能。
请参考图3A,图3A是本发明实施例闪存装置22的结构示意图。本实施例中,闪存装置22以SSD为例说明。
如图3A所示,闪存装置22包括主控制器220和存储介质221。其中,主控制器220用于接收控制器11发送给闪存装置22的I/O请求,或者其他信息,例如数据块的逻辑地址和稳定级别,并且主控制器220还用于执行接收到的I/O请求,例如将I/O请求中携带的数据块写入存储介质221,或者从存储介质221中读取数据块并返回给控制器11。这里的主控制器220是SSD的主控制器。
存储介质221通常由若干个闪存(Flash)芯片组成。每个闪存芯片包括若干个块(block)。每个block包括若干个页(page),主控制器220在将数据块写入block中时是以page为单位写入的。
由于NAND Flash具有擦除特性,保存在block中的数据不会像普通机械硬盘那样直接被修改。当需要对某个block中的数据进行修改时,需要查找一个空闲的block将修改后的数据写入该空闲的block,那么,原来的block中的数据则变为无效数据。随着SSD中存储的数据越来越多,可利用的空闲的block越来越少,因此有必要对SSD进行垃圾回收以便产生可供利用的空闲的block。本实施例中,在进行垃圾回收时通常会依次选择包含无效数据最多的块进行回收。而垃圾回收的触发条件是所述闪存芯片中包含的空闲的块的数量低于第一阈值,所述第一阈值可以是大于10并且小于100的整数。
另外,在闪存装置22内部还需要定期进行巡检。巡检是指为防止闪存芯片中某些block较长时间内未被擦除导致数据丢失,周期性地对闪存芯片中存储的数据进行搬移的操作。对于NAND Flash来说,其保持数据的能力只能维持一定时间,因此需要定期将其中存储的数据搬移到其他block。本实施例中,在进行巡检时通常会依次选择最长时间内未被擦除的块,将所述块中的有效数据搬移到空闲的块中,再擦除原来的块。而巡检的触发条件可以是当预设的巡检周期到达。
由于SSD的寿命与NAND Flash的擦除次数相关,所以尽量减少SSD内部的数据搬移有利于减小写放大,从而延长SSD的寿命。在本实施例中,SSD内部的数据搬移主要是指垃圾回收或者巡检时对block中有效数据的搬移。可以理解的是,对于待回收的block来说,如果其包含的有效数据越少,需要搬移的数据也越少。因此本发明的目的主要在于将SSD中的数据块按照稳定级别来进行集中存储,使得在进行以后的垃圾回收操作时搬移的有效数据尽可能得少。
图3B是本发明实施例描述的闪存装置22中主控制器220的结构示意图。
主控制器220主要包括处理器(processor)218、内存(cache)230、通信总线(简称总线)226以及通信接口(Communication Interface)228。处理器218、缓存230以及通信接口228通过通信总线226进行相互间的通信。
处理器218可能是一个中央处理器CPU,或者是特定集成电路ASIC(Application Specific Integrated Circuit),或者是被配置成实施本发明实施例的一个或多个集成电路。在本发明实施例中,处理器218可以用于接收来自控制器11的I/O请求、数据块的逻辑地址以及数据块的稳定级别等信息,另外,处理器218还用于执行I/O请求。
通信接口228,用于与控制器11及存储介质221通信。
缓存230(Cache)用于缓存从控制器11接收的信息,例如数据块的逻辑地址以及数据块的稳定级别等。缓存230可以是RAM、SCM、NVM等各种可以存储数据的非短暂性的(non-transitory)或者短暂性的(transitory)机器可读介质,在此不做限定。另外,在某些应用场景下,缓存230也可以置于主控制器220的外部。
在本实施例中,可以在缓存230中保存一张映射表,用于保存从控制器11接收的数据块的LBA与数据块的稳定级别之间的对应关系。通常情况下,缓存230中还保存有一张记录LBA与PBA之间映射关系的映射表,在本发明实施例中,可以在这张映射表的基础上,增加LBA与稳定级别之间的对应关系。
或者,在缓存230中保存多个数组,每个数组对应一个稳定级别,所述数组中可以保存对应所述稳定级别的多个数据块的逻辑地址。
或者,缓存230中也可以不保存映射表,而是将稳定级别相同的数据块的逻辑地址集中存储到缓存230的一块缓存空间中。例如,控制器11可以事先发送给闪存装置22缓存区域划分信息,所述缓存区域划分信息包括不 同的稳定级别(例如,分别为1-10的10个稳定级别),闪存装置22接收到所述缓存区域划分信息后,按照10个稳定级别将缓存230划分为10个缓存区域,每个缓存区域对应一个稳定级别,专门用于存储对应所述稳定级别的数据块的逻辑地址。或者,控制器11也可以不事先发送给闪存装置22缓存区域划分信息,而是直接将数据块的逻辑地址与数据块的稳定级别发送给闪存装置22。闪存装置22根据所述数据块的稳定级别在缓存230中划分出一段缓存区域,将所述缓存区域与所述稳定级别对应(保存所述缓存区域与所述稳定级别之间的对应关系),之后,所述划分出的缓存区域可以专门用于保存对应所述稳定级别的数据块的逻辑地址。以上两种方式都可以实现将稳定级别相同的数据块的逻辑地址集中存储到缓存230的一块缓存空间中。
下面介绍本发明实施例一种识别数据块稳定性的方法,所述方法从控制器11的角度描述根据数据块的引用计数,或者时间长度,或者引用计数和时间长度获得该数据块的稳定级别,并发送给闪存装置22的过程。请参考图4,图4是所述识别数据块稳定性的方法的流程示意图,所述方法可以应用在图1所示的存储系统中以及图2所示的控制器11中,其执行主体是控制器11中的处理器118。所述方法包括:
步骤S201:从缓存120中读取第一数据块的信息,所述第一数据块的信息包括所述第一数据块的引用计数,或所述第一数据块保存在所述闪存装置的时间长度,或所述第一数据块的引用计数和所述第一数据块保存在所述闪存装置的时间长度,其中所述第一数据块的引用计数等于所述控制器接收所述第一数据块的数量。
需要说明的是,在本实施例中,所述第一数据块是闪存装置22中保存的多个数据块中的其中一个,这里是以第一数据块为例进行说明。并且,本实施例中的第一数据块是指有效数据包含的数据块,对于无效数据,其包含的数据块的引用计数为0,控制器11会将引用计数为0的数据块的信息从缓 存120中删除。
另外,步骤S201的触发条件可以设置为控制器11接收的所有数据块的大小超过预设的容量阈值,或者预设的时间间隔到达,或者上述两个触发条件的其中一个满足时。其中,所述预设的容量阈值可以等于图1所示的存储系统对用户呈现的可用容量,或者所述可用容量的整数倍。
步骤S202:根据所述第一数据块的信息确定所述第一数据块的稳定级别。
其中,控制器11可以预先设定稳定级别的个数。
可选的,一种实施方式是:由于闪存装置22中保存的每个数据块都有一个引用计数,因此可以将这些引用计数划分为多个引用计数区间,其中,每个引用计数区间对应一个稳定级别。举例来说,假设预先设定10个稳定级别,那么引用计数区间和稳定级别之间的对应关系可以如表1所示:
引用计数 稳定级别
+∞>引用计数≥35 1
35>引用计数≥30 2
30>引用计数≥25 3
25>引用计数≥20 4
20>引用计数≥15 5
20>引用计数≥15 6
15>引用计数≥10 7
10>引用计数≥5 8
5>引用计数≥2 9
引用计数=1 10
表1
那么,相应地,根据所述第一数据块的信息确定所述第一数据块的稳定级别具体可以是:根据所述第一数据块的引用计数确定第一引用计数区 间,所述第一数据块的引用计数位于所述第一引用计数区间中;根据所述第一引用计数区间,以及表1所示的对应关系确定所述第一数据块的稳定级别。例如,第一数据块的引用计数是3,那么其对应的稳定级别为9。
可选的,另一种实施方式是:将多个数据块保存在闪存装置的时间长度划分为多个时间区间,其中,每个时间区间对应一个稳定级别。举例来说,假设预先设定10个稳定级别,那么时间区间和稳定级别之间的对应关系可以如表2所示:
数据块保存在闪存装置中的时间长度(单位:天) 稳定级别
+∞>时间长度≥35 1
35>时间长度≥30 2
30>时间长度≥25 3
25>时间长度≥20 4
20>时间长度≥15 5
20>时间长度≥15 6
15>时间长度≥10 7
10>时间长度≥5 8
5>时间长度≥2 9
时间长度=1 10
表2
那么,相应地,根据所述第一数据块的信息确定所述第一数据块的稳定级别具体可以是:根据所述第一数据块保存在闪存装置中的时间长度确定第一时间区间,所述第一数据块保存在闪存装置中的时间长度位于所述第一时间区间中;根据所述第一时间区间,以及表2所示的对应关系确定所述第一数据块的稳定级别。例如,第一数据块保存在闪存装置中的时间长度是12,那么其对应的稳定级别为7。
可选的,再一种实施方式是:将多个时间长度划分为至少两个时间区间,同时也将多个引用计数划分为至少两个引用计数区间;时间区间、引用计数区间和稳定级别三者之间存在一个对应关系。
举例来说,可以以时间长度是否大于阈值T为判断标准划分为两个时间区间,一个时间区间是(0,T),另一个时间区间是[T,+∞)。时间长度属于[T,+∞)的数据块的稳定级别大于时间长度属于(0,T)的数据块的稳定级别,在每个时间区间内,进一步地将引用计数划分为多个引用计数区间,属于相同引用计数区间的数据块的稳定级别相同。对于属于不同引用计数区间的数据块,引用计数大的数据块的稳定级别大于引用计数小的数据块的稳定级别。假设预先设定10个稳定级别,那么时间区间、引用计数区间和稳定级别之间的对应关系可以如表3所示:
数据块保存在闪存装置中的时间长度 引用计数 稳定级别
≥T ∞>引用计数≥20 1
≥T 20>引用计数≥10 2
≥T 10>引用计数≥5 3
≥T 5>引用计数≥2 4
≥T 引用计数=1 5
<T ∞>引用计数≥20 6
<T 20>引用计数≥10 7
<T 10>引用计数≥5 8
<T 5>引用计数≥2 9
<T 引用计数=1 10
表3
或者,也可以将多个引用计数划分为两个引用计数区间,一个引用计数区间是(0,10),另一个引用计数区间是[10,+∞)。引用计数属于[10,+∞)的数据块的稳定级别大于引用计数属于(0,10)的数据块的稳定级别, 在每个引用计数区间内,进一步地将多个时间长度划分为多个时间区间,属于相同时间区间的数据块的稳定级别相同。对于属于不同时间区间的数据块,时间长度大的数据块的稳定级别大于时间长度小的数据块的稳定级别。假设预先设定10个稳定级别,那么时间区间、引用计数区间和稳定级别之间的对应关系可以如表4所示:
引用计数 数据块保存在闪存装置中的时间长度(单位:天) 稳定级别
≥10 ∞>时间长度≥20 1
≥10 20>时间长度≥10 2
≥10 10>时间长度≥5 3
≥10 5>时间长度≥2 4
≥10 时间长度=1 5
<10 ∞>时间长度≥20 6
<10 20>时间长度≥10 7
<10 10>时间长度≥5 8
<10 5>时间长度≥2 9
<10 时间长度=1 10
表4
相应地,根据所述第一数据块的信息确定所述第一数据块的稳定级别具体可以是:根据所述第一数据块的引用计数确定第一引用计数区间,所述第一数据块的引用计数位于所述第一引用计数区间中;根据所述第一数据块保存在所述闪存装置的时间长度确定第一时间区间,所述第一数据块保存在所述闪存装置的时间长度位于所述第一时间区间中;根据所述第一引用计数区间,所述第一时间区间,以及所述引用计数区间,时间区间与稳定级别的对应关系确定所述第一数据块的稳定级别。可以理解的是,无论是利用表3所示的对应关系还是利用表4所示的对应关系,只要第一数据块保存在所述闪存装置的时间长度和引用计数确定,其稳定级别也可以确定。
可选的,在上述两种实施方式中,当控制器11处理完缓存120中保存的每个数据块后,本次任务完成,可以将各个数据块的保存在闪存装置中的时间长度均减去一个固定值,使得下次任务开始时,时间长度可以以一个较小的基数开始递增。
步骤S203:将所述第一数据块的逻辑地址以及所述第一数据块的稳定级别发送给闪存装置22。
具体地,控制器11可以单独发送第一数据块的逻辑地址和稳定级别给闪存装置22,也可以将第一数据块的逻辑地址和稳定级别,与其他数据块的逻辑地址和稳定级别一起发送给闪存装置22。举例来说,逻辑地址和稳定级别可以携带在自定义的命令中发送给所述闪存装置22。
在本实施例中,控制器11可以根据(1)所述第一数据块的引用计数,和数据块的引用计数与稳定级别的对应关系,或(2)所述第一数据块保存在所述闪存装置的时间长度,和数据块保存在闪存装置的时间长度与稳定级别的对应关系,或(3)所述第一数据块的引用计数和所述第一数据块保存在所述闪存装置的时间长度,和数据块的引用计数,数据块保存在闪存装置的时间长度与稳定级别的对应关系,确定所述第一数据块的稳定级别,所述稳定级别可以反映数据块的稳定性,并且将所述数据块的稳定级别和逻辑地址发送给闪存装置22,使得闪存装置22将相同稳定级别的数据块进行集中存储。
下面介绍本发明实施例一种在闪存装置中存储数据的方法,所述方法从闪存装置22的角度描述将稳定级别相同的数据块集中存储的过程。请参考图5,图5是所述在闪存装置中存储数据的方法的流程示意图,所述方法可以应用在图1所示的存储系统中以及图3A,图3B所示的闪存装置22中,其执行主体是闪存装置22中的处理器218。所述方法包括:
步骤S301:获取目标逻辑地址对应的稳定级别,所述稳定级别用于表示数据块的稳定性。
具体地,闪存装置22在步骤S301之前接收控制器11发送的多个逻辑地址,和与所述逻辑地址对应的稳定级别,并且可以将所述多个逻辑地址及其对应的稳定级别存储在缓存230中。所述目标逻辑地址是缓存230中保存的多个逻辑地址的其中一个,当数据搬移的任务触发时,可以从缓存230中获取所述目标逻辑地址对应的稳定级别。
步骤S302:根据所述目标逻辑地址对应的稳定级别,将所述目标逻辑地址对应的数据块写入所述稳定级别对应的块中。
在本实施例中,为了将相同稳定级别的数据块搬移到同样的block中,可以建立闪存芯片中的block与稳定级别的对应关系。按照这种对应关系,可以将目标逻辑地址对应的数据块从原来的block中读取出来,写入与其稳定级别对应的block中。所述闪存芯片中的block与稳定级别的对应关系可以是预先建立的,也可以是第一次将一个数据块或者多个稳定级别相同的数据块写入一个block后便记录所述稳定级别与block之间的对应关系。
对于将目标逻辑地址对应的数据块从原来的block中读取出来具体可以是:通常情况下,闪存装置22的缓存230或者闪存芯片中保存有一张映射表,所述映射表用于保存各个数据块的逻辑地址和物理地址之间的对应关系,所以可以根据步骤S301中接收到的逻辑地址和所述映射表,从对应的物理地址所在的存储空间中读取出所述数据块。
采用本实施例提供的方式,可以将相同稳定级别的数据块存储在一个block中。那么,对于存放稳定级别较高的数据块的block,其存储的数据块成为无效数据的可能性较小,整体来看,该block中不含无效数据或仅含少量的无效数据,这样的block属于利用率比较高的block,在对闪存装置22进行垃圾回收时不会回收这样的block;对于存放稳定级别较低的数据块的block,其存储的数据块成为无效数据的可能性较大,假设一个block中的大部分数据或者绝大部分数据都变成了无效数据,那么相应地,这个block中包含的有效数据较少,垃圾回收时需要迁移的数据也较少,减小了写放大。 需要说明的是,本实施例的效果主要体现在之后的垃圾回收时搬移的有效数据会减少。由此可见,无论是存放稳定级别较高的数据块的block,还是存放稳定级别较低的数据块的block,都可以减小闪存装置22的写放大,因此在一定程度上延长了闪存装置22的寿命。
另外,一种较优的实施方式是:将上面描述的步骤S301-步骤S302与垃圾回收操作结合在一起,也就是说,当闪存装置22需要进行垃圾回收时,按照步骤S301-步骤S302描述的方式进行垃圾回收,具体的,确定所述闪存芯片中包含的空闲的块的数量低于第一阈值时,依次从闪存芯片中查找出包含无效数据最多的块,从这些块中获取待搬移的数据块的逻辑地址,然后根据所述逻辑地址,在所述逻辑地址与稳定级别的对应关系中查找,获取所述逻辑地址对应的稳定级别(结合图5所示的实施方式,所述逻辑地址即所述目标逻辑地址),再将所述逻辑地址对应的数据块写入对应的块中。
另一种较优的实施方式是:将上面描述的步骤S301-步骤S302与巡检操作结合在一起,也就是说,当闪存装置22需要进行巡检时,按照步骤S301-步骤S302描述的方式进行巡检,具体的,当预设的巡检周期到达时,依次从闪存芯片中查找出最长时间内未被擦除的块,从这些块中获取待搬移的数据块的逻辑地址,然后根据所述逻辑地址,在所述逻辑地址与稳定级别的对应关系中查找,获取所述逻辑地址对应的稳定级别(结合图5所示的实施方式,所述逻辑地址即所述目标逻辑地址),再将所述逻辑地址对应的数据块写入对应的块中。
本领域技术人员可以理解的是,无论是垃圾回收还是巡检,搬移的数据都是有效数据,无效数据由于不可能再被读取所以不用再做搬移,搬移完成之后以block为单位擦除所有的无效数据即可。在本实施例中,由于闪存装置22接收到的控制器11发送的逻辑地址均是有效数据包含的数据块的逻辑地址(可参见图4所示实施例中步骤S201的描述),因此闪存装置22接收到的控制器11发送的逻辑地址对应的数据块都需要进行搬移。
按照上面提供的两种较优的实施方式,可以在闪存装置22进行垃圾回收或者巡检时实现将稳定级别相同的数据块集中存储,由于闪存装置22在进行垃圾回收或者巡检时原本会进行数据搬移,因此本实施例并没有额外的数据搬移操作,可以进一步减小写放大。
下面介绍本发明实施例另一种在闪存装置中存储数据的方法,请参考图6,图6是所述在闪存装置中存储数据的方法的流程示意图,所述方法可以应用在图1所示的存储系统中。
在本实施例中,步骤S101-步骤S104描述的是控制器11将接收到的数据块存储在闪存装置22的过程。步骤S101-步骤S104可以应用在图2所示的控制器11中,其执行主体是控制器11中的处理器118。
在步骤S101中,控制器11接收主机发送的写数据请求,所述写数据请求中包括数据对象以及所述数据对象的地址信息,所述地址信息可以包括逻辑单元号(英文全称:Logical Unit Number,英文简称:LUN)的ID以及LUN的起始地址偏移量;或者文件的ID以及文件的起始地址偏移量等等;或者当存储系统具有多个文件系统时,所述地址信息可以包括文件系统的ID、文件的ID以及文件的起始地址偏移量等等。
所述数据对象是待写入闪存装置22的块数据或者文件。
在步骤S102中,控制器11将所述数据对象划分为尺寸相同的多个数据块。
在步骤S103中,控制器11从所述多个数据块中确定一个目标数据块,判断所述目标数据块是否已经保存在闪存装置22中。
具体地,控制器11在将拆分后的数据块发送给闪存装置22存储之前,需要依次判断每个数据块是否已经保存在闪存装置22,如果是,则不需要再次进行保存。其判断方式可参考前面对重复数据删除模块功能的描述,这里不再赘述。
在步骤S104中,若所述闪存装置22中没有保存与所述目标数据块相同的数据块,控制器11将所述目标数据块发送给闪存装置22进行存储,所述目标数据块的引用计数为初始值,并且将所述目标数据块的引用计数以及所述目标数据块写入闪存装置22的逻辑地址写入缓存120中;若所述闪存装置22中保存有与所述目标数据块相同的数据块,则增加所述与所述目标数据块相同的数据块的引用计数。
具体地,所述目标数据块写入闪存装置22的逻辑地址可以是控制器11为所述目标数据块分配的逻辑地址,控制器11分配之后,将所述逻辑地址发送给闪存装置22,闪存装置22根据所述逻辑地址与物理地址之间的对应关系查找到所述逻辑地址对应的物理地址,将所述目标数据块写入所述物理地址对应的存储空间中;或者,也可以是闪存装置22存储所述数据块之后,反馈给控制器11的逻辑地址。
按照步骤S101-步骤S104描述的方式,控制器11可以将接收到数据对象拆分成若干个数据块存储在闪存装置22中。可以理解的是,由于控制器11具有重复数据删除的功能,保存在闪存装置22中的数据块都是不同的数据块。这些多个不同的数据块的信息可以保存在缓存120中。
步骤S105-步骤S107描述的是控制器11识别闪存装置22中存储的每个数据块的稳定级别,并发送给闪存装置22的过程。步骤S105-步骤S107可以应用在图2所示的控制器11中,其执行主体是控制器11中的处理器118。需要说明的是,所述稳定级别的识别过程与步骤S101-步骤S104描述的将接收到的数据块存储在闪存装置22的过程没有先后顺序之分。
在步骤S105中,任务触发时,控制器11从缓存120中读取所述目标数据块的信息。
这里的任务是指控制器11识别闪存装置22中每个数据块的稳定级别的任务。
具体地,控制器11可以对所述多个数据块的信息进行扫描,依次读取 每个数据块的信息。为了方便描述,在下面的步骤中仍以目标数据块的处理方式为例来进行说明,可以理解的是,其他数据块的处理方式和目标数据块类似。
所述目标数据块的信息包括所述目标数据块的引用计数,或所述目标数据块保存在所述闪存装置的时间长度,或所述目标数据块的引用计数和所述目标数据块保存在所述闪存装置的时间长度。
在步骤S106中,控制器11根据所述目标数据块的信息确定所述目标数据块的稳定级别。
步骤S106与图5所示实施例中的步骤S202类似,请参考步骤S202的描述。
在步骤S107中,控制器11将所述目标数据块的逻辑地址以及所述目标数据块的稳定级别发送给闪存装置22。
按照步骤S105-步骤S107描述的方式,控制器11可以将多个数据块的逻辑地址以及稳定级别发送给闪存装置22。
步骤S108-步骤S110描述的是闪存装置22接收控制器11发送的数据块的稳定级别之后,将稳定级别相同的数据块集中存储的过程。步骤S108-步骤S110可以应用在图3A、图3B所示的闪存装置(例如,SSD)中,其执行主体是闪存装置22中的处理器218。
在步骤S108中,闪存装置22保存所述多个数据块的逻辑地址,以及与所述逻辑地址对应的稳定级别。
可选的,一种保存方式是在闪存装置22的缓存230中建立一张映射表,用于保存从控制器11接收的数据块的逻辑地址与数据块的稳定级别之间的对应关系。
可选的,另一种保存方式是在缓存230中保存多个数组,每个数组对应一个稳定级别。所述多个数据块的逻辑地址分别保存在其对应的数组中。
可选的,再一种保存方式是预先将缓存230划分为若干个缓存区域, 每个缓存区域对应一个稳定级别。将所述多个数据块的逻辑地址分别记录在其对应的缓存区域中。
在步骤S109中,闪存装置22判断是否有相同稳定级别对应的逻辑地址的个数达到预设阈值,如果是,则根据所述相同稳定级别对应的逻辑地址读取数据块。
所述相同稳定级别对应的逻辑地址可以包括步骤S105-步骤S107中的目标数据块的逻辑地址。
需要说明的是,在图6所示的实施方式中,可以不和垃圾回收或者巡检操作结合,也就是说,在这种实施方式中,进行数据块搬移的触发条件和图5所示的实施方式有所不同,其触发条件是缓存中保存的相同稳定级别对应的逻辑地址的个数达到预设阈值。
那么,对于如何判断是否有相同稳定级别对应的逻辑地址的个数达到预设阈值,可以有如下三种实施方式:
第一种实施方式是,根据缓存230中保存的映射表确定是否有相同稳定级别的逻辑地址的个数达到预设阈值。
第二种实施方式是判断缓存230中是否有一个数组中保存的逻辑地址的个数达到预设阈值。
第三种实施方式是判断缓存230中是否有一个缓存区域中保存的逻辑地址的个数达到预设阈值。
其中,可以将所述预设阈值设置成块的容量与数据块的尺寸之间的比值,按照这种实施方式,当逻辑地址的个数达到所述阈值后,所述多个逻辑地址对应的数据块正好将一个空闲的block填满。
在步骤S110中,闪存装置22查找一个空闲的块,将所述读取出的数据块写入一个空闲的块中。
依次类推,按照步骤S109-步骤S110描述的方式,可以依次将稳定级别相同的数据块存储在一个或多个空闲的块中。
另外,所述预设阈值也可以设置成大于2,但小于块的容量与数据块的尺寸之间的比值的一个数值,此时,在步骤S110中,则可以查找一个未被写满的块,将稳定级别相同的数据块存储到所述未被写满的块中。
在图6所示的实施例中,闪存装置22将稳定级别相同的数据块集中在一个或多个空闲的block中,使得在进行之后的垃圾回收操作时搬移的有效数据减少,从而减小写放大,在一定程度上延长闪存装置22的寿命。
本发明实施例还提供了一种识别数据块的稳定性的装置40,所述装置40位于控制器11中,所述控制器位于图1所示的存储系统中,所述存储系统包括闪存装置22,所述闪存装置22中保存有第一数据块;如图7所示,所述装置40包括:
存储模块401,用于保存所述第一数据块的信息,所述第一数据块的信息包括所述第一数据块的引用计数,或所述第一数据块保存在所述闪存装置的时间长度,或所述第一数据块的引用计数和所述第一数据块保存在所述闪存装置的时间长度,其中所述第一数据块的引用计数等于所述控制器接收所述第一数据块的数量;
读取模块402,用于从所述存储模块中读取所述第一数据块的信息;
确定模块403,用于根据(1)所述第一数据块的引用计数,和数据块的引用计数与稳定级别的对应关系,或(2)所述第一数据块保存在所述闪存装置的时间长度,和数据块保存在闪存装置的时间长度与稳定级别的对应关系,或(3)所述第一数据块的引用计数和所述第一数据块保存在所述闪存装置的时间长度,和数据块的引用计数,数据块保存在闪存装置的时间长度与稳定级别的对应关系,确定所述第一数据块的稳定级别;
发送模块404,用于将所述第一数据块的逻辑地址以及所述第一数据块的稳定级别发送给所述闪存装置22。
在本实施例中,识别数据块的稳定性的装置40可以根据(1)所述第 一数据块的引用计数,和数据块的引用计数与稳定级别的对应关系,或(2)所述第一数据块保存在所述闪存装置的时间长度,和数据块保存在闪存装置的时间长度与稳定级别的对应关系,或(3)所述第一数据块的引用计数和所述第一数据块保存在所述闪存装置的时间长度,和数据块的引用计数,数据块保存在闪存装置的时间长度与稳定级别的对应关系,确定所述第一数据块的稳定级别,所述稳定级别可以反映数据块的稳定性,并且将所述数据块的稳定级别和逻辑地址发送给闪存装置22,使得闪存装置22将相同稳定级别的数据块进行集中存储。
可选的,在图7所示的实施方式中,所述数据块的引用计数与稳定级别的对应关系包括:引用计数区间与稳定级别的对应关系;
那么,所述确定模块403,具体用于根据所述第一数据块的引用计数确定第一引用计数区间,所述第一数据块的引用计数位于所述第一引用计数区间中;根据所述第一引用计数区间,以及引用计数区间与稳定级别的对应关系确定所述第一数据块的稳定级别。
可选的,在图7所示的实施方式中,所述数据块保存在闪存装置的时间长度与稳定级别的对应关系包括:时间区间与稳定级别的对应关系;
那么,所述确定模块403,具体用于根据所述第一数据块保存在所述闪存装置的时间长度确定第一时间区间,所述第一数据块保存在所述闪存装置的时间长度位于所述第一时间区间中;根据所述第一时间区间,以及时间区间与稳定级别的对应关系确定所述第一数据块的稳定级别。
可选的,在图7所示的实施方式中,所述数据块的引用计数,数据块保存在闪存装置的时间长度与稳定级别的对应关系包括:引用计数区间,时间区间与稳定级别的对应关系;
那么,所述确定模块403,具体用于根据所述第一数据块的引用计数确定第一引用计数区间,所述第一数据块的引用计数位于所述第一引用计数区间中;根据所述第一数据块保存在所述闪存装置的时间长度确定第一时间区 间,所述第一数据块保存在所述闪存装置的时间长度位于所述第一时间区间中;根据所述第一引用计数区间,所述第一时间区间,以及所述引用计数区间,时间区间与稳定级别的对应关系确定所述第一数据块的稳定级别。
另外,装置40各个模块的具体实现方式可参考图5或图7所示的方法实施例,这里不再赘述。
本发明实施例还提供了一种在闪存装置中存储数据的装置50,装置50位于所述闪存装置22的主控制器中,所述闪存装置22中存储有块,所述装置50包括:
获取模块501,用于获取目标逻辑地址对应的稳定级别,所述稳定级别用于表示数据块的稳定性;
迁移模块502,用于根据所述目标逻辑地址对应的稳定级别,将所述目标逻辑地址对应的数据块写入所述稳定级别对应的块中。
采用本实施例提供的装置50,可以将相同稳定级别的数据块存储在一个block中。
可选的,所述获取模块501,还用于在所述闪存芯片中查找包含无效数据最多的块,所述包含无效数据最多的块包括所述目标逻辑地址对应的数据块。
可选的,所述获取模块501,还用于在所述闪存芯片中查找最长时间内未被擦除的块,所述最长时间内未被擦除的块包括所述目标逻辑地址对应的数据块。
可选的,所述装置50还包括存储模块503,所述存储模块503中保存有逻辑地址,所述逻辑地址对应的稳定级别与所述目标逻辑地址对应的稳定级别相同;
所述获取模块501,具体用于确定所述缓存中保存的逻辑地址的个数达到预设阈值时,获取所述目标逻辑地址对应的稳定级别。
其中,所述预设阈值等于块的容量除以数据块的尺寸所得的商。
另外,装置50各个模块的具体实现方式可参考图6或图7所示的方法实施例,这里不再赘述。
本发明实施例还提供一种数据处理的计算机程序产品,包括存储了程序代码的计算机可读存储介质,所述程序代码包括的指令用于执行前述任意一个方法实施例所述的方法流程。
本领域普通技术人员可以理解,前述的存储介质包括:U盘、移动硬盘、磁碟、光盘、随机存储器(Random-Access Memory,RAM)、固态硬盘(Solid State Disk,SSD)或者非易失性存储器(non-volatile memory)等各种可以存储程序代码的非短暂性的(non-transitory)机器可读介质。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制。

Claims (33)

  1. 一种控制器,其特征在于,所述控制器位于支持重复数据删除的存储系统中,所述存储系统包括闪存装置,所述闪存装置中保存有第一数据块;所述控制器包括处理器、缓存和通信接口;所述通信接口,用于与所述闪存装置通信;所述缓存中保存有所述第一数据块的信息,所述第一数据块的信息包括所述第一数据块的引用计数,或所述第一数据块保存在所述闪存装置的时间长度,或所述第一数据块的引用计数和所述第一数据块保存在所述闪存装置的时间长度,其中所述第一数据块的引用计数等于所述控制器接收所述第一数据块的数量;
    所述处理器,用于从所述缓存中读取所述第一数据块的信息;
    根据(1)所述第一数据块的引用计数,和数据块的引用计数与稳定级别的对应关系,或(2)所述第一数据块保存在所述闪存装置的时间长度,和数据块保存在闪存装置的时间长度与稳定级别的对应关系,或(3)所述第一数据块的引用计数和所述第一数据块保存在所述闪存装置的时间长度,和数据块的引用计数,数据块保存在闪存装置的时间长度与稳定级别的对应关系,确定所述第一数据块的稳定级别,所述稳定级别用于表示数据块的稳定性;
    将所述第一数据块的逻辑地址以及所述第一数据块的稳定级别通过所述通信接口发送给所述闪存装置。
  2. 根据权利要求1所述的控制器,其特征在于,所述数据块的引用计数与稳定级别的对应关系包括:引用计数区间与稳定级别的对应关系;
    所述处理器,具体用于根据所述第一数据块的引用计数确定第一引用计数区间,所述第一数据块的引用计数位于所述第一引用计数区间中;
    根据所述第一引用计数区间,以及引用计数区间与稳定级别的对应关系确定所述第一数据块的稳定级别。
  3. 根据权利要求1所述的控制器,其特征在于,所述数据块保存在闪存装置的时间长度与稳定级别的对应关系包括:时间区间与稳定级别的对应关系;
    所述处理器,具体用于根据所述第一数据块保存在所述闪存装置的时间长度确定第一时间区间,所述第一数据块保存在所述闪存装置的时间长度位于所述第一时间区间中;
    根据所述第一时间区间,以及时间区间与稳定级别的对应关系确定所述第一数据块的稳定级别。
  4. 根据权利要求1所述的控制器,其特征在于,所述数据块的引用计数,数据块保存在闪存装置的时间长度与稳定级别的对应关系包括:引用计数区间,时间区间与稳定级别的对应关系;
    所述处理器,具体用于根据所述第一数据块的引用计数确定第一引用计数区间,所述第一数据块的引用计数位于所述第一引用计数区间中;
    根据所述第一数据块保存在所述闪存装置的时间长度确定第一时间区间,所述第一数据块保存在所述闪存装置的时间长度位于所述第一时间区间中;
    根据所述第一引用计数区间,所述第一时间区间,以及所述引用计数区间,时间区间与稳定级别的对应关系确定所述第一数据块的稳定级别。
  5. 根据权利要求1,2或4任一所述的控制器,其特征在于,所述第一数据块的信息还包括所述第一数据块的指纹信息,所述第一数据块的指纹信息是根据预设的哈希函数对所述第一数据块进行计算获得的;
    所述处理器,还用于接收所述第一数据块;
    根据所述哈希函数和所述第一数据块计算所述第一数据块的指纹信息;
    确定所述闪存装置中没有包含指纹信息与所述第一数据块的指纹信息相同的数据块;
    将所述第一数据块发送给所述闪存装置,所述第一数据块的引用计数等于初始值;
    将所述第一数据块的引用计数写入所述缓存。
  6. 根据权利要求5所述的控制器,其特征在于,
    所述处理器,还用于接收第二数据块;
    根据所述哈希函数和所述第二数据块计算所述第二数据块的指纹信息;
    确定所述第一数据块的指纹信息与所述第二数据块的指纹信息相同;
    增加所述初始值,第一数据块的引用计数等于所述初始值增加后的值。
  7. 一种闪存装置,其特征在于,所述闪存装置包括主控制器和闪存芯片,所述闪存芯片包括块,所述主控制器包括处理器;
    所述处理器,用于获取目标逻辑地址对应的稳定级别,所述稳定级别用于表示数据块的稳定性;
    根据所述目标逻辑地址对应的稳定级别,将所述目标逻辑地址对应的数据块写入所述稳定级别对应的块中。
  8. 根据权利要求7所述的闪存装置,其特征在于,
    所述处理器,还用于在所述闪存芯片中查找包含无效数据最多的块,所述包含无效数据最多的块包括所述目标逻辑地址对应的数据块。
  9. 根据权利要求7所述的闪存装置,其特征在于,
    所述处理器,还用于在所述闪存芯片中查找最长时间内未被擦除的块,所述最长时间内未被擦除的块包括所述目标逻辑地址对应的数据块。
  10. 根据权利要求7所述的闪存装置,其特征在于,所述主控制器还包括缓存;所述处理器,具体用于确定所述缓存中保存的逻辑地址的个数达到预设阈值时,获取所述目标逻辑地址对应的稳定级别,其中,所述逻辑地址对应的稳定级别与所述目标逻辑地址对应的稳定级别相同。
  11. 根据权利要求10所述的闪存装置,其特征在于,所述预设阈值等于块的容量除以数据块的尺寸所得的商。
  12. 一种识别数据块的稳定性的方法,其特征在于,所述方法应用于控制器中,所述控制器位于支持重复数据删除的存储系统中,所述存储系统包括闪存装置,所述闪存装置中保存有第一数据块;所述控制器包括处理器、缓存和通信接口;所述通信接口,用于与所述闪存装置通信;所述缓存中保存有所述第一数据块的信息,所述第一数据块的信息包括所述第一数据块的引用计数,或所述第一数据块保存在所述闪存装置的时间长度,或所述第一数据块的引用计数和所述第一数据块保存在所述闪存装置的时间长度,其中所述第一数据块的引用计数等于所述控制器接收所述第一数据块的数量;所述方法由所述处理器执行,包括:
    从所述缓存中读取所述第一数据块的信息;
    根据(1)所述第一数据块的引用计数,和数据块的引用计数与稳定级别的对应关系,或(2)所述第一数据块保存在所述闪存装置的时间长度,和数据块保存在闪存装置的时间长度与稳定级别的对应关系,或(3)所述第一数据块的引用计数和所述第一数据块保存在所述闪存装置的时间长度,和数据块的引用计数,数据块保存在闪存装置的时间长度与稳定级别的对应关系,确定所述第一数据块的稳定级别,所述稳定级别用于表示数据块的稳定性;
    将所述第一数据块的逻辑地址以及所述第一数据块的稳定级别通过所 述通信接口发送给所述闪存装置。
  13. 根据权利要求12所述的方法,其特征在于,所述数据块的引用计数与稳定级别的对应关系包括:引用计数区间与稳定级别的对应关系;
    所述根据(1)所述第一数据块的引用计数,和数据块的引用计数与稳定级别的对应关系,确定所述第一数据块的稳定级别包括:
    根据所述第一数据块的引用计数确定第一引用计数区间,所述第一数据块的引用计数位于所述第一引用计数区间中;
    根据所述第一引用计数区间,以及引用计数区间与稳定级别的对应关系确定所述第一数据块的稳定级别。
  14. 根据权利要求12所述的方法,其特征在于,所述数据块保存在闪存装置的时间长度与稳定级别的对应关系包括:时间区间与稳定级别的对应关系;
    所述根据(2)所述第一数据块保存在所述闪存装置的时间长度,和数据块保存在闪存装置的时间长度与稳定级别的对应关系,确定所述第一数据块的稳定级别包括:
    根据所述第一数据块保存在所述闪存装置的时间长度确定第一时间区间,所述第一数据块保存在所述闪存装置的时间长度位于所述第一时间区间中;
    根据所述第一时间区间,以及时间区间与稳定级别的对应关系确定所述第一数据块的稳定级别。
  15. 根据权利要求12所述的方法,其特征在于,所述数据块的引用计数,数据块保存在闪存装置的时间长度与稳定级别的对应关系包括:引用计数区间,时间区间与稳定级别的对应关系;
    所述根据(3)所述第一数据块的引用计数和所述第一数据块保存在所 述闪存装置的时间长度,和数据块的引用计数,数据块保存在闪存装置的时间长度与稳定级别的对应关系,确定所述第一数据块的稳定级别包括:
    根据所述第一数据块的引用计数确定第一引用计数区间,所述第一数据块的引用计数位于所述第一引用计数区间中;
    根据所述第一数据块保存在所述闪存装置的时间长度确定第一时间区间,所述第一数据块保存在所述闪存装置的时间长度位于所述第一时间区间中;
    根据所述第一引用计数区间,所述第一时间区间,以及所述引用计数区间,时间区间与稳定级别的对应关系确定所述第一数据块的稳定级别。
  16. 根据权利要求12,13或15任一所述的方法,其特征在于,所述第一数据块的信息还包括所述第一数据块的指纹信息,所述第一数据块的指纹信息是根据预设的哈希函数对所述第一数据块进行计算获得的;
    所述方法还包括:接收所述第一数据块;
    根据所述哈希函数和所述第一数据块计算所述第一数据块的指纹信息;
    确定所述闪存装置中没有包含指纹信息与所述第一数据块的指纹信息相同的数据块;
    将所述第一数据块发送给所述闪存装置,所述第一数据块的引用计数等于初始值;
    将所述第一数据块的引用计数写入所述缓存。
  17. 根据权利要求16所述的方法,其特征在于,所述方法还包括:
    接收第二数据块;
    根据所述哈希函数和所述第二数据块计算所述第二数据块的指纹信息;
    确定所述第一数据块的指纹信息与所述第二数据块的指纹信息相同;
    增加所述初始值,第一数据块的引用计数等于所述初始值增加后的值。
  18. 一种在闪存装置中存储数据的方法,其特征在于,所述闪存装置包括主控制器和闪存芯片,所述闪存芯片包括块,所述主控制器包括处理器;所述方法由所述处理器执行,包括:
    获取目标逻辑地址对应的稳定级别,所述稳定级别用于表示数据块的稳定性;
    根据所述目标逻辑地址对应的稳定级别,将所述目标逻辑地址对应的数据块写入所述稳定级别对应的块中。
  19. 根据权利要求18所述的方法,其特征在于,所述方法还包括:
    在所述闪存芯片中查找包含无效数据最多的块,所述包含无效数据最多的块包括所述目标逻辑地址对应的数据块。
  20. 根据权利要求18所述的方法,其特征在于,所述方法还包括:
    在所述闪存芯片中查找最长时间内未被擦除的块,所述最长时间内未被擦除的块包括所述目标逻辑地址对应的数据块。
  21. 根据权利要求18所述的方法,其特征在于,所述主控制器还包括缓存;
    所述获取目标逻辑地址对应的稳定级别包括:确定所述缓存中保存的逻辑地址的个数达到预设阈值时,获取所述目标逻辑地址对应的稳定级别,其中,所述逻辑地址对应的稳定级别与所述目标逻辑地址对应的稳定级别相同。
  22. 根据权利要求21所述的方法,其特征在于,所述预设阈值等于块 的容量除以数据块的尺寸所得的商。
  23. 一种识别数据块的稳定性的装置,其特征在于,所述装置位于控制器中,所述控制器位于支持重复数据删除的存储系统中,所述存储系统包括闪存装置,所述闪存装置中保存有第一数据块;所述装置包括:
    存储模块,用于保存所述第一数据块的信息,所述第一数据块的信息包括所述第一数据块的引用计数,或所述第一数据块保存在所述闪存装置的时间长度,或所述第一数据块的引用计数和所述第一数据块保存在所述闪存装置的时间长度,其中所述第一数据块的引用计数等于所述控制器接收所述第一数据块的数量;
    读取模块,用于从所述存储模块中读取所述第一数据块的信息;
    确定模块,用于根据(1)所述第一数据块的引用计数,和数据块的引用计数与稳定级别的对应关系,或(2)所述第一数据块保存在所述闪存装置的时间长度,和数据块保存在闪存装置的时间长度与稳定级别的对应关系,或(3)所述第一数据块的引用计数和所述第一数据块保存在所述闪存装置的时间长度,和数据块的引用计数,数据块保存在闪存装置的时间长度与稳定级别的对应关系,确定所述第一数据块的稳定级别;
    发送模块,用于将所述第一数据块的逻辑地址以及所述第一数据块的稳定级别发送给所述闪存装置。
  24. 根据权利要求23所述的装置,其特征在于,所述数据块的引用计数与稳定级别的对应关系包括:引用计数区间与稳定级别的对应关系;
    所述确定模块,具体用于根据所述第一数据块的引用计数确定第一引用计数区间,所述第一数据块的引用计数位于所述第一引用计数区间中;
    根据所述第一引用计数区间,以及引用计数区间与稳定级别的对应关系确定所述第一数据块的稳定级别。
  25. 根据权利要求23所述的装置,其特征在于,所述数据块保存在闪存装置的时间长度与稳定级别的对应关系包括:时间区间与稳定级别的对应关系;
    所述确定模块,具体用于根据所述第一数据块保存在所述闪存装置的时间长度确定第一时间区间,所述第一数据块保存在所述闪存装置的时间长度位于所述第一时间区间中;
    根据所述第一时间区间,以及时间区间与稳定级别的对应关系确定所述第一数据块的稳定级别。
  26. 根据权利要求23所述的装置,其特征在于,所述数据块的引用计数,数据块保存在闪存装置的时间长度与稳定级别的对应关系包括:引用计数区间,时间区间与稳定级别的对应关系;
    所述确定模块,具体用于根据所述第一数据块的引用计数确定第一引用计数区间,所述第一数据块的引用计数位于所述第一引用计数区间中;
    根据所述第一数据块保存在所述闪存装置的时间长度确定第一时间区间,所述第一数据块保存在所述闪存装置的时间长度位于所述第一时间区间中;
    根据所述第一引用计数区间,所述第一时间区间,以及所述引用计数区间,时间区间与稳定级别的对应关系确定所述第一数据块的稳定级别。
  27. 一种在闪存装置中存储数据的装置,其特征在于,所述装置位于所述闪存装置的主控制器中,所述闪存装置中存储有块,所述装置包括:
    获取模块,用于获取目标逻辑地址对应的稳定级别,所述稳定级别用于表示数据块的稳定性;
    迁移模块,用于根据所述目标逻辑地址对应的稳定级别,将所述目标逻辑地址对应的数据块写入所述稳定级别对应的块中。
  28. 根据权利要求27所述的装置,其特征在于,
    所述获取模块,还用于在所述闪存芯片中查找包含无效数据最多的块,所述包含无效数据最多的块包括所述目标逻辑地址对应的数据块。
  29. 根据权利要求27所述的装置,其特征在于,
    所述获取模块,还用于在所述闪存芯片中查找最长时间内未被擦除的块,所述最长时间内未被擦除的块包括所述目标逻辑地址对应的数据块。
  30. 根据权利要求27所述的装置,其特征在于,所述装置还包括存储模块,所述存储模块中保存有逻辑地址,所述逻辑地址对应的稳定级别与所述目标逻辑地址对应的稳定级别相同;
    所述获取模块,具体用于确定所述缓存中保存的逻辑地址的个数达到预设阈值时,获取所述目标逻辑地址对应的稳定级别。
  31. 根据权利要求30所述的装置,其特征在于,所述预设阈值等于块的容量除以数据块的尺寸所得的商。
  32. 一种计算机程序产品,包括存储了程序代码的计算机可读存储介质,所述程序代码包括的指令用于执行如权利要求12-17任意一项所述的方法。
  33. 一种计算机程序产品,包括存储了程序代码的计算机可读存储介质,所述程序代码包括的指令用于执行如权利要求18-22任意一项所述的方法。
CN201480075497.1A 2014-12-05 2014-12-05 一种存储系统、识别数据块稳定性的方法以及装置 Active CN105980992B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/CN2014/093139 WO2016086411A1 (zh) 2014-12-05 2014-12-05 一种控制器、闪存装置、识别数据块稳定性的方法以及在闪存装置中存储数据的方法

Publications (2)

Publication Number Publication Date
CN105980992A true CN105980992A (zh) 2016-09-28
CN105980992B CN105980992B (zh) 2018-02-13

Family

ID=56090853

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201480075497.1A Active CN105980992B (zh) 2014-12-05 2014-12-05 一种存储系统、识别数据块稳定性的方法以及装置

Country Status (8)

Country Link
US (2) US9772790B2 (zh)
EP (1) EP3059679B1 (zh)
JP (1) JP6147933B2 (zh)
KR (1) KR101784893B1 (zh)
CN (1) CN105980992B (zh)
DK (1) DK3059679T3 (zh)
ES (1) ES2691484T3 (zh)
WO (1) WO2016086411A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107193758A (zh) * 2017-05-19 2017-09-22 记忆科技(深圳)有限公司 一种固态硬盘的映射表管理方法及固态硬盘

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9917894B2 (en) * 2014-08-06 2018-03-13 Quest Software Inc. Accelerating transfer protocols
KR102306672B1 (ko) * 2016-11-23 2021-09-29 삼성전자주식회사 데이터 중복 제거를 수행하는 스토리지 시스템, 스토리지 시스템 및 데이터 처리 시스템의 동작방법
US11644992B2 (en) 2016-11-23 2023-05-09 Samsung Electronics Co., Ltd. Storage system performing data deduplication, method of operating storage system, and method of operating data processing system
US10416899B2 (en) * 2018-02-13 2019-09-17 Tesla, Inc. Systems and methods for low latency hardware memory management
US11256628B2 (en) * 2019-08-02 2022-02-22 EMC IP Holding Company LLC Volatile read cache in a content addressable storage system
KR102234886B1 (ko) * 2019-11-07 2021-04-02 숭실대학교산학협력단 플래시 메모리에서 장치 지문을 추출하는 방법 및 장치
KR20220049397A (ko) * 2020-10-14 2022-04-21 삼성전자주식회사 메모리 장치, 이를 포함하는 스토리지 장치 및 스토리지 장치의 동작 방법
KR102545465B1 (ko) * 2021-11-17 2023-06-21 삼성전자주식회사 스토리지 컨트롤러 및 이를 포함하는 스토리지 장치

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110264843A1 (en) * 2010-04-22 2011-10-27 Seagate Technology Llc Data segregation in a storage device
US20120023144A1 (en) * 2010-07-21 2012-01-26 Seagate Technology Llc Managing Wear in Flash Memory
CN103019887A (zh) * 2012-12-12 2013-04-03 华为技术有限公司 数据备份方法及装置
CN103455436A (zh) * 2013-09-23 2013-12-18 北京经纬恒润科技有限公司 一种ram检测方法及系统
US20140013032A1 (en) * 2012-07-03 2014-01-09 Research & Business Foundation Sungkyunkwan University Method and apparatus for controlling writing data in storage unit based on nand flash memory
CN103577336A (zh) * 2013-10-23 2014-02-12 华为技术有限公司 一种存储数据处理方法及装置

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4679581B2 (ja) * 2005-07-29 2011-04-27 パナソニック株式会社 メモリコントローラ、不揮発性記憶装置、不揮発性記憶システム及び不揮発性メモリのアドレス管理方法
JP4439569B2 (ja) * 2008-04-24 2010-03-24 株式会社東芝 メモリシステム
US8447915B2 (en) * 2009-07-23 2013-05-21 Hitachi, Ltd. Flash memory device for allocating physical blocks to logical blocks based on an erase count
US8452932B2 (en) * 2010-01-06 2013-05-28 Storsimple, Inc. System and method for efficiently creating off-site data volume back-ups
US8438361B2 (en) * 2010-03-10 2013-05-07 Seagate Technology Llc Logical block storage in a storage device
JP2011203916A (ja) * 2010-03-25 2011-10-13 Toshiba Corp メモリコントローラ、および半導体記憶装置
JP2012014400A (ja) * 2010-06-30 2012-01-19 Toshiba Corp 半導体メモリ装置および半導体メモリシステム
US20120159098A1 (en) * 2010-12-17 2012-06-21 Microsoft Corporation Garbage collection and hotspots relief for a data deduplication chunk store
EP2681691A4 (en) 2011-03-03 2015-06-03 Cypher Llc SYSTEM FOR AUTONOMOUS DETECTION AND SEPARATION OF COMMON ELEMENTS IN DATA, AND METHODS AND DEVICES RELATED THERETO
US8782370B2 (en) * 2011-05-15 2014-07-15 Apple Inc. Selective data storage in LSB and MSB pages
US9176864B2 (en) * 2011-05-17 2015-11-03 SanDisk Technologies, Inc. Non-volatile memory and method having block management with hot/cold data sorting
US9141528B2 (en) * 2011-05-17 2015-09-22 Sandisk Technologies Inc. Tracking and handling of super-hot data in non-volatile memory systems
US20120317337A1 (en) * 2011-06-09 2012-12-13 Microsoft Corporation Managing data placement on flash-based storage by use
US9021203B2 (en) 2012-05-07 2015-04-28 International Business Machines Corporation Enhancing tiering storage performance
KR101929584B1 (ko) * 2012-06-29 2018-12-17 에스케이하이닉스 주식회사 데이터 저장 장치 및 그 동작 방법
CN102981969A (zh) * 2012-11-21 2013-03-20 记忆科技(深圳)有限公司 重复数据删除的方法及其固态硬盘
US9395924B2 (en) * 2013-01-22 2016-07-19 Seagate Technology Llc Management of and region selection for writes to non-volatile memory
CN103455435A (zh) * 2013-08-29 2013-12-18 华为技术有限公司 数据写入方法及装置
US9390116B1 (en) * 2013-09-26 2016-07-12 Emc Corporation Insertion and eviction schemes for deduplicated cache system of a storage system
US9529546B2 (en) * 2014-01-08 2016-12-27 Netapp, Inc. Global in-line extent-based deduplication

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110264843A1 (en) * 2010-04-22 2011-10-27 Seagate Technology Llc Data segregation in a storage device
US20120023144A1 (en) * 2010-07-21 2012-01-26 Seagate Technology Llc Managing Wear in Flash Memory
US20140013032A1 (en) * 2012-07-03 2014-01-09 Research & Business Foundation Sungkyunkwan University Method and apparatus for controlling writing data in storage unit based on nand flash memory
CN103019887A (zh) * 2012-12-12 2013-04-03 华为技术有限公司 数据备份方法及装置
CN103455436A (zh) * 2013-09-23 2013-12-18 北京经纬恒润科技有限公司 一种ram检测方法及系统
CN103577336A (zh) * 2013-10-23 2014-02-12 华为技术有限公司 一种存储数据处理方法及装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107193758A (zh) * 2017-05-19 2017-09-22 记忆科技(深圳)有限公司 一种固态硬盘的映射表管理方法及固态硬盘

Also Published As

Publication number Publication date
EP3059679A1 (en) 2016-08-24
JP6147933B2 (ja) 2017-06-14
EP3059679B1 (en) 2018-08-22
US20170364300A1 (en) 2017-12-21
WO2016086411A1 (zh) 2016-06-09
ES2691484T3 (es) 2018-11-27
EP3059679A4 (en) 2017-03-01
KR20160084370A (ko) 2016-07-13
US20160216915A1 (en) 2016-07-28
DK3059679T3 (en) 2018-12-17
US9772790B2 (en) 2017-09-26
CN105980992B (zh) 2018-02-13
KR101784893B1 (ko) 2017-10-12
JP2017501489A (ja) 2017-01-12

Similar Documents

Publication Publication Date Title
CN105980992A (zh) 一种控制器、闪存装置、识别数据块稳定性的方法以及在闪存装置中存储数据的方法
US10761731B2 (en) Array controller, solid state disk, and method for controlling solid state disk to write data
CN107346290B (zh) 使用并行化日志列表重放分区逻辑到物理数据地址转换表
CN106448737B (zh) 读取闪存数据的方法、装置以及固态驱动器
CN108804350B (zh) 一种内存访问方法及计算机系统
CN106354615B (zh) 固态硬盘日志生成方法及其装置
US9229876B2 (en) Method and system for dynamic compression of address tables in a memory
KR101300657B1 (ko) 비휘발성 메모리 및 버퍼 메모리를 포함하는 메모리 시스템및 그것의 데이터 읽기 방법
CN105917303A (zh) 一种控制器、识别数据块稳定性的方法和存储系统
CN111033477A (zh) 逻辑到物理映射
US20150098271A1 (en) System and method of storing data in a data storage device
CN101645043B (zh) 写数据的方法、读数据的方法及存储设备
CN110989918B (zh) 写入控制方法以及数据存储装置及其控制器
KR20160024546A (ko) 데이터 저장 장치 및 그것의 동작 방법
US20140223075A1 (en) Physical-to-logical address map to speed up a recycle operation in a solid state drive
US9483181B2 (en) Data storage device and operating method thereof
CN110515552A (zh) 一种存储设备数据快速写入的方法及系统
CN117632043B (zh) Cxl内存模组、控制芯片、数据处理方法、介质和系统
CN202443462U (zh) 辅助上位机检索页映射单元块中空闲块的装置
JP2013196155A (ja) メモリシステム
US20230185469A1 (en) Memory system and controlling method
CN102591793B (zh) 辅助上位机检索页映射单元块中空闲块的装置
CN110032333B (zh) 存储器系统及其操作方法
CN117953942A (zh) 基于闪存的存储器系统及其管理元数据方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant