CN109725848A - 计算机系统及储存装置的控制方法 - Google Patents

计算机系统及储存装置的控制方法 Download PDF

Info

Publication number
CN109725848A
CN109725848A CN201810887535.3A CN201810887535A CN109725848A CN 109725848 A CN109725848 A CN 109725848A CN 201810887535 A CN201810887535 A CN 201810887535A CN 109725848 A CN109725848 A CN 109725848A
Authority
CN
China
Prior art keywords
address
block
data
storage device
physical address
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810887535.3A
Other languages
English (en)
Inventor
菅野伸一
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kioxia Corp
Original Assignee
Toshiba Memory Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Memory Corp filed Critical Toshiba Memory Corp
Publication of CN109725848A publication Critical patent/CN109725848A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/08Error detection or correction by redundancy in data representation, e.g. by using checking codes
    • G06F11/10Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F12/00Accessing, addressing or allocating within memory systems or architectures
    • G06F12/02Addressing or allocation; Relocation
    • G06F12/0223User address space allocation, e.g. contiguous or non contiguous base addressing
    • G06F12/023Free address space management
    • G06F12/0238Memory management in non-volatile memory, e.g. resistive RAM or ferroelectric memory
    • G06F12/0246Memory management in non-volatile memory, e.g. resistive RAM or ferroelectric memory in block erasable memory, e.g. flash memory
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F12/00Accessing, addressing or allocating within memory systems or architectures
    • G06F12/02Addressing or allocation; Relocation
    • G06F12/0223User address space allocation, e.g. contiguous or non contiguous base addressing
    • G06F12/023Free address space management
    • G06F12/0253Garbage collection, i.e. reclamation of unreferenced memory
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F12/00Accessing, addressing or allocating within memory systems or architectures
    • G06F12/02Addressing or allocation; Relocation
    • G06F12/0223User address space allocation, e.g. contiguous or non contiguous base addressing
    • G06F12/0292User address space allocation, e.g. contiguous or non contiguous base addressing using tables or multilevel address translation means
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F12/00Accessing, addressing or allocating within memory systems or architectures
    • G06F12/02Addressing or allocation; Relocation
    • G06F12/08Addressing or allocation; Relocation in hierarchically structured memory systems, e.g. virtual memory systems
    • G06F12/0802Addressing of a memory level in which the access to the desired data or data block requires associative addressing means, e.g. caches
    • G06F12/0891Addressing of a memory level in which the access to the desired data or data block requires associative addressing means, e.g. caches using clearing, invalidating or resetting means
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/061Improving I/O performance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/0614Improving the reliability of storage systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0629Configuration or reconfiguration of storage systems
    • G06F3/0631Configuration or reconfiguration of storage systems by allocating resources to storage systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0638Organizing or formatting or addressing of data
    • G06F3/064Management of blocks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0655Vertical data movement, i.e. input-output transfer; data movement between one or more hosts and one or more storage devices
    • G06F3/0659Command handling arrangements, e.g. command buffers, queues, command scheduling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/0671In-line storage system
    • G06F3/0673Single storage device
    • G06F3/0679Non-volatile semiconductor memory device, e.g. flash memory, one time programmable memory [OTP]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/0671In-line storage system
    • G06F3/0683Plurality of storage devices
    • G06F3/0688Non-volatile semiconductor memory arrays
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2212/00Indexing scheme relating to accessing, addressing or allocation within memory systems or architectures
    • G06F2212/10Providing a specific technical effect
    • G06F2212/1016Performance improvement
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2212/00Indexing scheme relating to accessing, addressing or allocation within memory systems or architectures
    • G06F2212/10Providing a specific technical effect
    • G06F2212/1032Reliability improvement, data loss prevention, degraded operation etc
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2212/00Indexing scheme relating to accessing, addressing or allocation within memory systems or architectures
    • G06F2212/72Details relating to flash memory management
    • G06F2212/7201Logical to physical mapping or translation of blocks or pages
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2212/00Indexing scheme relating to accessing, addressing or allocation within memory systems or architectures
    • G06F2212/72Details relating to flash memory management
    • G06F2212/7203Temporary buffering, e.g. using volatile buffer or dedicated buffer blocks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2212/00Indexing scheme relating to accessing, addressing or allocation within memory systems or architectures
    • G06F2212/72Details relating to flash memory management
    • G06F2212/7205Cleaning, compaction, garbage collection, erase control
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2212/00Indexing scheme relating to accessing, addressing or allocation within memory systems or architectures
    • G06F2212/72Details relating to flash memory management
    • G06F2212/7208Multiple device management, e.g. distributing data over multiple flash devices

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Quality & Reliability (AREA)
  • Techniques For Improving Reliability Of Storages (AREA)
  • Memory System (AREA)
  • Hardware Redundancy (AREA)
  • For Increasing The Reliability Of Semiconductor Memories (AREA)
  • Retry When Errors Occur (AREA)
  • Valve Device For Special Equipments (AREA)
  • Vehicle Body Suspensions (AREA)

Abstract

实施方式实现一种能够改善I/O性能的计算机系统及储存装置的控制方法。实施方式的计算机系统将指定用于识别应写入的第1数据的第1逻辑地址与所述第1数据的长度的写入请求发送到储存装置。计算机系统从所述储存装置接收第1物理地址、及所述第1逻辑地址,所述第1物理地址表示由所述储存装置从除不良块以外的块中选择为用于所述第1数据的写入目标块的第1块、及写入了所述第1数据的所述第1块内的第1物理存储位置这两者。计算机系统在管理各逻辑地址与所述储存装置的各物理地址之间的映射的第1表中将所述第1物理地址映射到所述第1逻辑地址。

Description

计算机系统及储存装置的控制方法
[相关申请]
本申请享有以日本专利申请2017-209344号(申请日:2017年10月30日)为基础申请的优先权。本申请通过参照该基础申请而包含基础申请的全部内容。
技术领域
本发明的实施方式涉及一种计算机系统及储存装置(storage device)的控制方法。
背景技术
近年来,具备非易失性存储器的储存装置正广泛地普及。作为这种储存装置之一,已知有基于NAND(Not And,与非)闪存技术的固态硬盘(SSD)。在数据中心的服务器之类的计算机系统中利用的储存装置中,要求较高的I/O(Input/Output,输入/输出)性能。因此,最近,开始提出主机侧与储存装置侧之间的新接口。
但是,如果非易失性存储器中包含的不良块的数量增加,则存在如下情况:在储存装置侧,引起用于将不良块置换为其它块的置换信息的量增大,因该置换处理而引起读取延迟时间增加。这有时会成为使系统整体的I/O性能降低的因素。
发明内容
本发明的实施方式提供一种能够改善I/O性能的计算机系统及控制方法。
根据实施方式,对包括分别包含多个块的多个非易失性存储器芯片(nonvolatilememory die)和控制器的储存装置进行控制的计算机系统具备:存储器;及处理器,构成为与所述存储器电连接,且执行所述存储器中存储的计算机程序。所述处理器将指定用于识别应写入的第1数据的第1逻辑地址与所述第1数据的长度的写入请求发送到所述储存装置。所述处理器从所述储存装置接收第1物理地址、及所述第1逻辑地址,所述第1物理地址表示由所述储存装置从除不良块以外的块中选择为用于所述第1数据的写入目标块的第1块、及写入了所述第1数据的所述第1块内的第1物理存储位置这两者。所述处理器在管理各逻辑地址与所述储存装置的各物理地址之间的映射的第1表中将所述第1物理地址映射到所述第1逻辑地址。
附图说明
图1是表示主机与存储器系统(闪速储存装置)的关系的框图。
图2是用来说明闪速储存装置与主机之间的功能分担的图。
图3是表示闪速储存装置的构成例的框图。
图4是表示In-Drive-GC API用的指令的图。
图5是表示超级块API用的指令的图。
图6是表示设置在闪速储存装置的闪速I/O控制电路与多个NAND型闪速存储器芯片的关系的框图。
图7是表示由多个块的集合构筑的超级块(并行单位)的构成例的图。
图8是用来说明超级块的块地址与构成该超级块的多个块各自的块地址的关系的图。
图9是用来说明将属于某非易失性存储器芯片的各个不良块分别利用该非易失性存储器芯片的其它块置换的动作的图。
图10是用来说明不置换不良块而从超级块内的非不良块中选择写入目标块的动作的图。
图11是用来说明对闪速储存装置应用的写入指令的图。
图12是用来说明对图11的写入指令的应答的图。
图13是用来说明对闪速储存装置应用的Trim指令的图。
图14是表示对具有不良块的超级块写入数据的动作的图。
图15是表示图12的应答中包含的物理地址的构成例的图。
图16是表示超级块的块地址与该超级块中包含的各块的块地址的关系的图。
图17是用来说明将逻辑地址与数据的对写入到块内的页的动作的图。
图18是用来说明将数据写入到块内的页的用户数据区域并将该数据的逻辑地址写入到该页的冗余区域的动作的图。
图19是用来说明将多个数据部与根据这些数据部算出的消失校正码写入到具有不良块的超级块的动作的图。
图20是表示主机内的闪存转换部与闪速储存装置内的写入动作控制部的关系的框图。
图21是用来说明由主机与闪速储存装置执行的写入动作及读取动作的框图。
图22是表示由主机与闪速储存装置执行的写入动作处理的序列的序列图。
图23是表示写入对于已经写入的数据的更新数据的数据更新动作的图。
图24是用来说明更新由闪速储存装置管理的块管理表的动作的图。
图25是用来说明更新由主机管理的查找表(逻辑物理地址转换表)的动作的图。
图26是用来说明根据表示与应无效化的数据对应的物理地址的来自主机的通知更新块管理表的动作的图。
图27是用来说明对闪速储存装置应用的读取指令的图。
图28是用来说明由闪速储存装置执行的读取动作的图。
图29是表示由主机与闪速储存装置执行的读取处理的序列的序列图。
图30是用来说明对闪速储存装置应用的垃圾回收(GC)控制指令的图。
图31是用来说明对闪速储存装置应用的强制垃圾回收(GC)指令的图。
图32是用来说明从闪速储存装置发送到主机的地址更新通知的图。
图33是表示由闪速储存装置执行的垃圾回收(GC)动作的顺序的序列图。
图34是用来说明为了垃圾回收(GC)所执行的数据复制动作的例子的图。
图35是用来说明基于图34的数据复制动作的结果更新的主机的查找表的内容的图。
图36是用来说明对写入指令的应答与GC用回调处理(地址更新通知)的关系的图。
图37是表示由主机执行的查找表更新处理的顺序的流程图。
图38是表示用于管理查阅计数的块管理表的构成例的图。
图39是用来说明对闪速储存装置应用的重复指令的图。
图40是表示由主机与闪速储存装置执行的查阅计数递增/递减处理的序列图。
图41是表示由闪速储存装置执行的超级块分配处理的顺序的流程图。
图42是用来说明以超级块内的所有非不良块从该超级块的开头连续地逻辑性地配置的方式转换访问对象块的地址的地址转换动作的图。
图43是用来说明用于地址转换动作的不良信息管理表与地址转换的例子的图。
图44是表示主机内的闪存转换部与闪速储存装置内的不良块转换部的关系的框图。
图45是表示主机(计算机系统)的构成例的框图。
图46是表示内置闪速储存装置的主机的构成例的图。
图47是表示由主机执行的写入动作的顺序的流程图。
图48是表示由主机执行的读取动作的顺序的流程图。
图49是表示由主机执行的查阅计数递增/递减处理的顺序的流程图。
具体实施方式
以下,参照附图,对实施方式进行说明。
首先,参照图1,对主机与存储器系统的关系进行说明。
该存储器系统是以对非易失性存储器写入数据并从非易失性存储器读出数据的方式构成的半导体储存装置。该存储器系统是以基于NAND闪存技术的闪速储存装置3的形式实现。
主机(主机装置)2构成为对多个闪速储存装置3进行控制。主机2是通过构成为将由多个闪速储存装置3构成的闪速阵列用作储存器的计算机系统而实现。该计算机系统也可为服务器。
此外,闪速储存装置3也可用作设置在储存阵列内的多个储存装置的一个。储存阵列也可经由缆线或网络而连接于服务器之类的计算机系统,储存阵列包含控制该储存阵列内的多个储存器(例如多个闪速储存装置3)的控制器。在将闪速储存装置3应用于储存阵列的情况下,该储存阵列的控制器也可作为闪速储存装置3的主机发挥功能。
以下,例示服务器之类的计算机系统作为主机2发挥功能的情况进行说明。
主机(服务器)2与多个闪速储存装置3经由接口50而相互连接(内部相互连接)。作为该用于内部相互连接的接口50,并不限定于此,可使用PCI Express(PeripheralComponent Interconnect Express,外围组件互连高速)(PCIe)(注册商标)、NVM Express(Non-Volatile Memory Express,非易失性存储器标准)(NVMe)(注册商标)、以太网(Ethernet,注册商标)、NVMe over Fabrics(NVMeOF,非易失性存储器标准织物)等。
作为以主机2的形式发挥功能的服务器的典型例,可列举数据中心内的服务器。
在主机2以数据中心内的服务器的形式实现的实例中,该主机(服务器)2也可经由网络51而连接于多个最终用户终端(客户端)61。主机2可对这些最终用户终端61提供各种服务。
主机(服务器)2所能提供的服务例如有:(1)向各客户端(各最终用户终端61)提供系统运转平台的平台即服务(PaaS,platform as a service);(2)向各客户端(各最终用户终端61)提供虚拟服务器之类的基础设施的基础设施即服务(IaaS,Infrastructure as aService)等。
多个虚拟机也可在作为该主机(服务器)2发挥功能的物理服务器上执行。在主机(服务器)2上运行的这些虚拟机分别可作为构成为向对应的若干个客户端(最终用户终端61)提供各种服务的虚拟服务器发挥功能。
主机(服务器)2包含管理构成闪速阵列的多个闪速储存装置3的储存管理功能、及对各最终用户终端61提供包含储存访问的各种服务的前端功能。
在现有型SSD中,NAND型闪速存储器的块/页的层级结构被SSD内的闪存转换层(FTL)隐蔽。也就是说,现有型SSD的FTL具有如下等功能:(1)使用作为逻辑物理地址转换表发挥功能的查找表,管理各逻辑地址与NAND型闪速存储器的各物理地址之间的映射;(2)用于将以页为单位的读取/写入及以块为单位的删除动作隐蔽;(3)执行NAND型闪速存储器的垃圾回收(GC)。各逻辑地址与NAND型闪速存储器的物理地址之间的映射无法从主机看到。NAND型闪速存储器的块/页结构也无法从主机看到。
另一方面,在主机中,有时也执行一种地址转换(应用阶层地址转换)。该地址转换是使用应用阶层地址转换表,管理应用阶层用的各逻辑地址与SSD用的各逻辑地址之间的映射。另外,在主机中,也存在如下情况:为了消除SSD用的逻辑地址空间上产生的碎片,而执行用于变更该逻辑地址空间上的数据配置的一种GC(应用阶层GC)。
但是,在主机及SSD分别具有地址转换表的冗余构成(SSD具有作为逻辑物理地址转换表发挥功能的查找表,主机具有应用阶层地址转换表)中,为了保存这些地址转换表而消耗大量的存储器资源。进而,包含主机侧的地址转换与SSD侧的地址转换的双重的地址转换也成为使系统整体的I/O性能降低的因素。
进而,主机侧的应用阶层GC成为使对SSD的数据写入量增加至实际的用户数据量的数倍(例如2倍)左右的因素。这种数据写入量的增加虽不会增加SSD的写入放大,但会使系统整体的储存性能降低,且SSD的寿命也变短。
因此,在本实施方式中,使FTL的功能在主机2与闪速储存装置3之间被分担。主机2管理作为逻辑物理地址转换表发挥功能的查找表,但应使用于写入的块及页可由闪速储存装置3决定而并非由主机2决定。另外,GC也可由闪速储存装置3执行而并非由主机2执行。以下,将转移至主机2的FTL功能称为全局FTL。
另外,闪速储存装置3管理分别包括多个块(多个物理块)的多个并行单位(多个超级块),以提高写入/读出速度。闪速储存装置3可并行地执行对于某并行单位内的多个块的写入动作及读出动作。
但是,由于NAND型闪速存储器芯片中包含若干个不良块,所以存在将并行单位内的各不良块以其它块置换,以确保并行度的情况。但是,如果每一个NAND型闪速存储器芯片中包含的不良块的数量增加,则用于置换管理的信息量有可能增大。
如果以一个并行单位中包含的块的数量为64的情况为例,则在根据数学规则从表示并行单位的块地址产生各块的块地址的实例中,将64个块中的第15个块以块地址2049的块置换的情况下,为了表达第15个需要至少6比特,为了表达2049需要12比特。在应置换的块数较多的情况下,需要与其成比例的信息量。在将应置换的块的数量设为至多16个的情况下,针对每一并行单位而需要18比特×16=294比特的信息。
另外,在数据读取动作中,必须利用置换信息,执行用于将表示不良块的地址转换为表示置换目标块的地址的地址转换。因此,如果不良块的数量增加,则伴随置换信息增大而该地址转换处理所需的时间增加,因此读取潜伏时间(read latency)增大。
因此,在用于写入来自主机2的数据的写入动作中,闪速储存装置3避开写入对象的并行单位内的不良块而从该并行单位内的非不良块中选择写入目标块,并决定该写入目标块内的写入目标位置。来自主机2的数据被写入到该写入目标位置。而且,闪速储存装置3将表示该写入目标块及该写入目标块内的写入位置这两者的物理地址通知给主机2。由此,主机2可辨识实际写入了数据的块与该块内的写入目标位置,因此,在必须读取该数据的情况下,可将指定该物理地址的读取请求发送到闪速储存装置3。闪速储存装置3可基于该读取请求所指定的物理地址,从所述所选择的块内的写入目标位置读取数据。因此,在闪速储存装置3,无须进行地址转换处理,可减少读取潜伏时间。
主机2的全局FTL也可具有执行储存服务的功能、管理查找表(LUT)的功能、软件硬件控制功能、用于实现高可用性的功能、防止具有相同内容的多个重复数据部存储在储存器的重复数据删除(De-duplication)功能等。
另一方面,闪速储存装置3可执行底层抽象(LLA,low-level abstraction)。LLA是用于NAND型闪速存储器的抽象的功能。LLA包含辅助数据配置的功能等。辅助数据配置的功能中包含决定用户数据的写入目标位置(块地址、该块内的位置)的功能、将表示写入了用户数据的该写入目标位置的物理地址通知给上位层级(主机2)的功能、决定用于垃圾回收的复制源块与复制目标块的功能、将有效数据的复制目标位置通知给上位层级(主机2)的功能等。另外,LLA也具有针对每一个域(QoS(Quality of Service,服务质量)域)执行闪速储存装置3的资源管理的QoS控制功能。
QoS控制功能中包含针对每一个QoS域决定访问单位(数据粒度)的功能。访问单位表示主机2可进行写入/读取的最小数据尺寸(数据粒度)。闪速储存装置3支持单个或多个访问单位(数据粒度),主机2是在闪速储存装置3支持多个访问单位的情况下,可针对每一个QoS域对闪速储存装置3指示应使用的访问单位(数据粒度)。
另外,QoS控制功能中包含用于尽可能防止QoS域间的性能干涉的功能。该功能是用于基本上维持稳定的潜伏时间的功能。
为了实现该目的,闪速储存装置3也可将NAND型闪速存储器内逻辑性地分割为多个区域(多个QoS域)。一个区域(一个QoS域)包含一个以上的并行单位(超级块)。各并行单位(超级块)仅属于某一个区域(QoS域)。
图2表示包含闪速储存装置3与主机2的系统整体的层级结构。
在主机(服务器)2中,执行用于对多个最终用户提供多个虚拟机的虚拟机服务401。在虚拟机服务401上的各虚拟机中,执行对应的最终用户所使用的操作系统及用户应用402。
另外,在主机(服务器)2中,执行与多个用户应用402对应的多个I/O服务403。这些I/O服务403中也可包含基于LBA(logical block address,逻辑块地址)的块I/O服务、键值存储服务等。各I/O服务403包含管理各逻辑地址与闪速储存装置3的各物理地址之间的映射的查找表(LUT)。此处,所谓逻辑地址是指可识别访问对象的数据的标识符(标签)。该逻辑地址可为指定逻辑地址空间上的位置的逻辑块地址(LBA),也可为键值存储的键,还可为文件名之类的文件标识符。
在基于LBA的块I/O服务中,也可使用管理各逻辑地址(LBA)与闪速储存装置3的各物理地址之间的映射的LUT。
在键值存储服务中,也可使用对各逻辑地址(键之类的标签)与存储着这些逻辑地址(也就是,键之类的标签)所对应的数据的闪速储存装置3的各物理地址之间的映射进行管理的LUT。在该LUT中,也可管理标签、存储着由该标签识别的数据的物理地址、及该数据的数据长度的对应关系。
各最终用户可选择应使用的寻址方法(LBA、键值存储的键、文件标识符等)。
所述各LUT并非将来自用户应用402的各逻辑地址转换为闪速储存装置3用的各逻辑地址,而是将来自用户应用402的各逻辑地址转换为闪速储存装置3的各物理地址。也就是说,所述各LUT是将闪速储存装置3用的逻辑地址转换为物理地址的表与应用阶层地址转换表整合(合并)所得的表。
在主机(服务器)2中,针对所述QoS域中的每一个而存在I/O服务403。属于某QoS域的I/O服务403管理对应的QoS域内的用户应用402所使用的各逻辑地址与分配给对应的QoS域的区域的各物理地址之间的映射。
从主机(服务器)2向闪速储存装置3的指令的发送及从闪速储存装置3向主机(服务器)2的指令完成的应答等回传是经由主机(服务器)2及闪速储存装置3的各者中所存在的I/O队列500而执行。这些I/O队列500也可分类为与多个QoS域对应的多个队列组。
闪速储存装置3包含与多个QoS域对应的多个写入缓冲器(WB)601、与多个QoS域对应的多个垃圾回收(GC)功能602、NAND型闪速存储器(NAND闪速阵列)603。
图3表示闪速储存装置3的构成例。
闪速储存装置3具备控制器4及非易失性存储器(NAND型闪速存储器)5。闪速储存装置3也可同时具备随机存取存储器、例如DRAM(Dynamic Random Access Memory,动态随机存取存储器)6。
NAND型闪速存储器5包含存储单元阵列,该存储单元阵列包含呈矩阵状配置的多个存储单元。NAND型闪速存储器5可为二维结构的NAND型闪速存储器,也可为三维结构的NAND型闪速存储器。
NAND型闪速存储器5的存储单元阵列包含多个块BLK0~BLKm-1。块BLK0~BLKm-1分别由多个页(此处为页P0~Pn-1)组成。块BLK0~BLKm-1作为删除单位发挥功能。块有时也被称为“删除块”、“物理块”或“物理删除块”。页P0~Pn-1分别包含连接于同一字线的多个存储单元。页P0~Pn-1是数据写入动作及数据读入动作的单位。
控制器4是经由Toggle、开放式NAND闪存接口(ONFI,Open NAND FlashInterface)之类的闪速I/O控制电路13而电连接于作为非易失性存储器的NAND型闪速存储器5。控制器4是构成为控制NAND型闪速存储器5的存储器控制器(控制电路)。
NAND型闪速存储器5包含多个NAND型闪速存储器芯片。控制器4管理所述多个并行单位(并行单元)。各并行单位是以包含分别属于不同的NAND型闪速存储器芯片的多个块(多个物理块)的块组即超级块的形式实现。控制器4可并行地执行对于各并行单位(超级块)中包含的多个块的写入动作、读出动作。多个并行单位(超级块)分别具有固有的超级块地址(第1块地址)。各非易失性存储器芯片内的多个块分别具有固有的块地址(第2块地址)。应包含于各并行单位(超级块)的各块的块地址是从各并行单位的超级块基于数学规则确定。
控制器4包含主机接口11、CPU(Central Processing Unit,中央处理器)12、闪速I/O控制电路13、及DRAM接口14等。这些CPU12、闪速I/O控制电路13、DRAM接口14是经由总线10而相互连接。
该主机接口11是以执行与主机2的通信的方式构成的主机接口电路。该主机接口11例如可为PCIe控制器(NVMe控制器)。主机接口11从主机2接收各种请求(指令)。这些请求(指令)中包含写入请求(写入指令)、读取请求(读取指令)、其它各种请求(指令)。
CPU12是以控制主机接口11、闪速I/O控制电路13、DRAM接口14的方式构成的处理器。CPU12是响应闪速储存装置3的电源接通,从NAND型闪速存储器5或未图示的ROM(ReadOnly Memory,只读存储器)将控制程序(固件)加载到DRAM6,然后执行该固件,由此进行各种处理。此外,固件也可加载到控制器4内的未图示的SRAM(Static Random-AccessMemory,静态随机存取存储器)上。该CPU12可执行用于处理来自主机2的各种指令的指令处理等。CPU12的动作是由CPU12所执行的所述固件控制。此外,指令处理的一部分或全部也可由控制器4内的专用硬件执行。
CPU12可作为写入动作控制部21、读取动作控制部22、及GC动作控制部23发挥功能。在这些写入动作控制部21、读取动作控制部22、及GC动作控制部23中,安装着用于实现图2所示的系统构成的应用程序接口(API)。
写入动作控制部21从主机2接收指定用于识别应写入的数据(用户数据)的逻辑地址(标签)的写入请求(写入指令)。在接收到写入指令的情况下,写入动作控制部21首先查阅不良信息管理表33,从写入对象的并行单位(超级块)中包含的并非不良的块(非不良块)中选择一个块作为写入目标块。不良信息管理表33保存不良信息,所述不良信息保存针对各并行单位(超级块)中包含的每一块表示可使用或不可使用的至少1比特的信息。与各超级块对应的不良信息也可为包含与各超级块中包含的块的数量为相同数量的比特的位图。写入动作控制部21通过查阅与写入对象的并行单位(超级块)对应的不良信息(不良信息管理表33),可辨识写入对象的并行单位内的各块为不良块或非不良块中的哪一个。
此外,不良信息并不限定于所述位图,例如也可代替使用表示各块的删除次数(编程/擦除周期数)的信息作为不良信息。在该情况下,控制器4也可将具有某阈值以上的删除次数的块判定为不良块。
不良块是不可使用的块,也被作为“坏块”加以查阅。由不良信息表示的不良块(坏块)中可包含在NAND型闪速存储器的制造过程中产生的不良块(初级(primary)不良块),也可包含在闪速储存装置3的使用开始后产生的不良块(次级(grown)不良块),还可包含这些初级不良块与次级不良块的两者。
写入动作控制部21决定所选择的写入目标块内的写入目标位置(页、及该页内的位置)。接着,写入动作控制部21将来自主机2的数据(写入数据)写入到该写入目标块的写入目标位置。在该情况下,写入动作控制部21不仅可将来自主机2的数据写入到写入目标块,而且可将该数据与该数据的逻辑地址(标签)这两者写入到写入目标块。
然后,写入动作控制部21将所指定的逻辑地址(标签)与表示写入目标块及写入目标位置这两者的物理地址返回给主机2。
在该情况下,该物理地址也可由芯片标识符、物理块地址(第2块地址)、及偏移表示。芯片标识符是各非易失性存储器芯片所固有的标识符。该物理地址中包含的芯片标识符表示写入目标块所属的非易失性存储器芯片的芯片标识符。物理块地址是用于识别各非易失性存储器芯片内的多个块各自的块地址(块编号)。该物理地址中包含的块地址表示该写入目标块的块地址。偏移是块内偏移。该物理地址中包含的偏移表示从写入目标块的开头至写入目标位置的偏移(偏移值)。该偏移也可由写入目标位置所属的页的页地址、及与写入目标位置对应的页内偏移表示。
或者,该物理地址也可由超级块地址(第1块地址)与偏移表示。超级块地址是各超级块所固有的块地址。该物理地址中包含的超级块地址表示写入对象的超级块的超级块地址。偏移表示从写入对象的超级块的开头至写入目标位置的偏移(偏移值)。该偏移也可由写入目标块所属的非易失性存储器芯片的芯片标识符、写入目标位置所属的页的页地址、及与写入目标位置对应的页内偏移表示。
物理地址也被作为“闪存地址”加以查阅。
此外,写入指令也可不仅指定逻辑地址(标签),而且指定超级块地址。在接收到指定超级块地址的写入指令的情况下,写入动作控制部21从多个超级块中,选择具有写入指令所指定的超级块地址的超级块作为写入对象的并行单位(写入目标超级块)。
读取动作控制部22是在从主机2接收到指定物理地址(表示读取对象的块及该块内的读取对象的位置)的读取请求(读取指令)的情况下,基于该物理地址,从读取对象的块内的读取对象的位置读取数据。
GC动作控制部23是在执行NAND型闪速存储器5的垃圾回收的情况下,从NAND型闪速存储器5内的多个块中选择用于该垃圾回收的复制源块(GC源块)及复制目标块(GC目的地块)。这些GC源块及GC目的地块的各个可为超级块,也可为物理块。
GC动作控制部23通常选择多个复制源块(GC源块)、及一个以上的复制目标块(GC目的地块)。用于选择复制源块(GC源块)的条件(GC策略)也可由主机2指定。例如,可使用优先选择有效数据量最少的块作为复制源块(GC源块)的GC策略,也可使用其它GC策略。像这样,复制源块(GC源块)及复制目标块(GC目的地块)的选择并非由主机2执行,而是由闪速储存装置3的控制器4(GC动作控制部23)执行。控制器4也可使用各块管理表来管理各块的有效数据量。
有效数据/无效数据的管理也可使用块管理表32来执行。该块管理表32例如也可针对每一超级块而存在。在与某超级块对应的块管理表32中,存储着表示该超级块内的各块的各个数据的有效/无效的位图标志。此处,所谓有效数据是指被LUT查阅的数据(也就是,被逻辑地址作为最新的数据关联起来的数据),且之后有可能被主机2读取的数据。所谓无效数据是指已无可能被主机2读取的数据。例如,与某逻辑地址建立关联的数据是有效数据,未与任何逻辑地址建立关联的数据是无效数据。
GC动作控制部23决定应写入复制源块(GC源块)内所存储的有效数据的复制目标块(GC目的地块)内的位置(复制目标位置),将有效数据复制到复制目标块(GC目的地块)的该决定的位置(复制目标位置)。在该情况下,GC动作控制部23也可将有效数据与该有效数据的逻辑地址这两者复制到复制目标块(GC目的地块)。GC动作控制部23也可通过查阅与复制源块(GC源块)对应的块管理表32而特定出GC源块内的有效数据。或者,在其它实施方式中,主机2也可指定GC源块与GC目的地块。这些GC源块与GC目的地块可为超级块,也可为物理块。
而且,GC动作控制部23将所复制的有效数据的逻辑地址(标签)、表示所复制的有效数据的旧物理存储位置的物理地址、及表示所复制的有效数据的新物理存储位置的物理地址通知给主机2。
在本实施方式中,如上所述,写入动作控制部21可将来自主机2的数据(写入数据)与来自主机2的逻辑地址(标签)这两者写入到写入目标块。因此,GC动作控制部23可容易地从复制源块(GC源块)中获取该复制源块(GC源块)内的各数据的逻辑地址,所以可容易地将所复制的有效数据的逻辑地址通知给主机2。
闪速I/O控制电路13是以在CPU12的控制下控制NAND型闪速存储器5的方式构成的存储器控制电路。DRAM接口14是以在CPU12的控制下控制DRAM6的方式构成的DRAM控制电路。DRAM6的存储区域的一部分用于存储读取缓冲器(RB)30、写入缓冲器(WB)31、块管理表32、不良信息管理表33。此外,这些读取缓冲器(RB)30、写入缓冲器(WB)31、块管理表32、不良信息管理表33也可存储在控制器4内的未图示的SRAM。
接下来,对用作闪速储存装置3与主机2之间的软件接口的API进行说明。在本实施方式中,该API大致区分为2种API(内置驱动GC(In-Drive-GC)API、超级块API。
In-Drive-GC-API包含以闪速储存装置3单独执行垃圾回收(GC)为前提的指令群。这些指令群中也可包含写入指令(Write without Physical Address,不包含物理地址的写入)、读取指令(Read with Physical Address,包含物理地址的读取)、禁用删除指令(Trim)、重复指令(Duplicate)、地址更新通知(Address Update Notification(DeviceInitiated,由装置发起))、强制GC指令(Forced Garbage-Collection,强制垃圾回收)、GC控制指令(Garbage Collection Control)等作为基本指令。
写入指令(Write without Physical Address)是指定识别应写入的用户数据的逻辑地址(标签),但不指定写入目标的物理地址的写入指令。
读取指令(Read with Physical Address)是指定表示读取对象的物理存储位置(物理块、物理块内的读取对象位置)的物理地址的读取指令。
禁用删除指令(Trim)是指定应设为无效的数据的物理地址,并对储存装置3指示应使与该物理地址对应的数据无效化的指令。此外,在主机2支持防止具有相同内容的多个重复数据部存储在储存器的重复数据删除(De-duplication)功能的情况下,禁用删除指令(Trim)用作对储存装置3指示应使表示查阅某数据的逻辑地址的数量的查阅计数减小的指令。重复指令(Duplicate)用作对储存装置3指示应使表示查阅某数据的逻辑地址的数量的查阅计数增加的指令。
地址更新通知(Address Update Notification(Device Initiated))用于在闪速储存装置3执行用于GC的数据复制动作之后,闪速储存装置3将所复制的数据(有效数据)的逻辑地址、该有效数据的旧物理存储位置、该有效数据的新物理存储位置通知给主机2。
强制GC指令(Forced Garbage-Collection)是用于使闪速储存装置3强制性地执行GC的指令。
GC控制指令(Garbage Collection Control)是用于对闪速储存装置3指示用于开始GC的条件等的指令。
图4表示In-Drive-GC-API用的各指令的参数与返回值的例子。
在图4中,接续于「主机:」的标记而记载的内容是由对应的指令指定的参数,接续于「装置:」的标记而记载的内容是对该指令的应答中包含的参数(返回值)。
写入指令(Write without Physical Address)也可包含用户地址、长度、数据、QoS域标识符。用户地址是用于识别应写入的数据的逻辑地址(标签)。用户地址例如包含LBA、键值存储的键、文件标识符等。
对写入指令的应答也可包含状态(成功/失败)、用户地址、闪存地址(物理地址)、长度、剩余的可写入数据量(distance-to-block-boundary,至块边界的距离)。剩余的可写入数据量(distance-to-block-boundary)是可选的返回值,表示可写入到写入了数据的超级块的剩余数据量。剩余的可写入数据量(distance-to-block-boundary)也可以所述数据粒度的倍数表示。数据有时跨及不良块的前后的2个非不良块写入。因此,对写入指令的应答也可包含各集包含用户地址、闪存地址(物理地址)、长度的多个集。
读取指令(Read with Physical Address)也可包含闪存地址、长度。读取指令(Read with Physical Address)也可包含各集包含闪存地址、长度的多个集。对读取指令的应答也可包含状态、用户地址、长度、数据。对读取指令的应答也可包含各集包含用户地址、长度的多个集。
禁用删除指令(Trim)/重复指令(Duplicate)也可包含闪存地址、长度、查阅计数的增减量(reference-count-to-add-or-subtract)。禁用删除指令(Trim)/重复指令(Duplicate)也可包含各集包含闪存地址、长度、查阅计数的增减量的多个集。
地址更新通知(Address Update Notification(Device Initiated))也可包含用户地址、旧闪存地址、新闪存地址、查阅计数、长度作为由闪速储存装置3通知给主机2的输出参数。例如,闪速储存装置3从旧物理存储位置将数据复制到新物理存储位置之后,将地址更新通知(Address Update Notification(Device Initiated))发送到主机2。该地址更新通知(Address Update Notification(Device Initiated))中也可包含该数据的用户地址、表示该数据的旧物理存储位置的旧闪存地址、表示该数据的新物理存储位置的新闪存地址、表示查阅该数据的逻辑地址的数量的查阅计数、该数据的长度。地址更新通知(Address Update Notification(Device Initiated))也可包含各集包含用户地址、旧闪存地址、新闪存地址、查阅计数、长度的多个集。
强制GC指令(Forced Garbage-Collection)也可包含QoS域标识符、源超级块地址(可选)。
GC控制指令(Garbage Collection Control)也可包含最大数据数(maximum-number-of-data)、QoS域标识符、GC的方法(策略)。
超级块API包含以主机2指定逻辑地址(标签)与超级块且闪速储存装置决定该超级块内的写入目标块与该写入目标块内的写入目标位置为前提的指令群。这些指令群中包含写入指令(Write without Page Address,不包含页地址的写入)、读取指令(Read withPhysical Address)、超级块释放指令(Release Super Block to Unused Super BlockPool,释放超级块至未用的超级块池)、超级块分配指令(Allocate Super Block and OpenWrite Buffer with Block Healing,分配超级块以及以块修复的方式打开写入缓冲器)、关闭超级块指令(Close Super Block and Write Buffer,关闭超级块与写入缓冲器)、超级块信息指令(Super Block Information)、非复制数据设定指令(Set Data not to beCopied)、数据复制指令(Data Copy without Page Address,不包含页地址的数据复制)等作为基本指令。
写入指令(Write without Page Address)是指定逻辑地址(标签)与超级块地址的写入指令。读取指令与In-Drive-GC-API用的读取指令相同。超级块释放指令(ReleaseSuper Block to Unused Super Block Pool)是用于将已分配的超级块释放的指令。超级块分配指令(Allocate Super Block and Open Write Buffer with Block Healing)是请求超级块的分配的指令。超级块分配指令(Allocate Super Block and Open WriteBuffer with Block Healing)也可包含指定表示可并行访问的块的数量的并行数的参数。超级块信息指令(Super Block Information)是用于获取与特定的超级块相关的信息的指令。非复制数据设定指令(Set Data not to be Copied)是用于指定超级块内的不应复制的数据的指令。数据复制指令(Data Copy without Page Address)是用于为了GC而复制数据的指令。这些指令的参数与返回值的例子表示在图5中。在图5中,接续于「主机:」的标记而记载的内容表示由对应的指令指定的参数,接续于「装置:」的标记而记载的内容表示对该指令的应答中包含的参数(返回值)。
图6表示闪速I/O控制电路13与多个NAND型闪速存储器芯片的关系。
如图6所示,NAND型闪速存储器5包含多个NAND型闪速存储器芯片。各NAND型闪速存储器芯片是包括包含多个块(物理块)BLK的存储单元阵列及控制该存储单元阵列的周边电路的非易失性存储器芯片。各NAND型闪速存储器芯片可独立地动作。因此,NAND型闪速存储器芯片作为最小的并行动作单位发挥功能。NAND型闪速存储器芯片也称为“NAND型闪速存储器芯片”或“非易失性存储器芯片”。在图6中,例示出如下情况:在闪速I/O控制电路13连接着16个通道Ch0、Ch1、…Ch15,且在这些通道Ch0、Ch1、…Ch15各自分别连接着相同数量(例如每个通道为1个芯片)的NAND型闪速存储器芯片。各通道包含用于与对应的NAND型闪速存储器芯片通信的通信线(存储器总线)。
控制器4是经由通道Ch0、Ch1、…Ch15而控制NAND型闪速存储器芯片#0~#15。控制器4可同时驱动通道Ch0、Ch1、…Ch15。
在图6的构成例中,可使最多16个NAND型闪速存储器芯片并行动作。
在本实施方式中,控制器4对分别包括多个块BLK的多个并行单位(超级块)进行管理。超级块并不限定于此,也可包含从连接于不同通道的NAND型闪速存储器芯片#0~#15中逐一选择出的共计16个块BLK。此外,NAND型闪速存储器芯片#0~#15各自也可具有多平面构成。例如,在NAND型闪速存储器芯片#0~#15各自具有包含2个平面的多平面构成的情况下,一个超级块也可包含从与NAND型闪速存储器芯片#0~#15对应的32个平面中逐一选择出的共计32个块BLK。
在图7中例示出一个超级块SB包括从NAND型闪速存储器芯片#0~#14中逐一选择出的共计16个块BLK的情况。在对于超级块SB的写入动作中,数据是按照属于NAND型闪速存储器芯片#0的块BLK的页P0、属于NAND型闪速存储器芯片#1的块BLK的页P0、…属于NAND型闪速存储器芯片#15的块BLK的页P0、属于NAND型闪速存储器芯片#0的块BLK的页P1、属于NAND型闪速存储器芯片#2的块BLK的页P1、…属于NAND型闪速存储器芯片#15的块BLK的页P1、…的顺序写入。
图8表示超级块SB的块地址(超级块地址)与构成该超级块SB的多个块(物理块)各自的块地址的关系。
应包含于超级块SB的各块(物理块)的块地址是从该超级块SB的块地址(超级块地址)基于某数学规则确定。
例如,也可将通过对超级块SB的超级块地址实施特定的四则运算而获得的值决定为应包含于该超级块SB的各块的块地址。或者,也可将通过对表示超级块SB的超级块地址的多个比特实施特定的比特反转或特定的比特移位而获得的值决定为应包含于该超级块SB的各块的块地址。
在图8中,为了简化图示,例示出由具有与超级块SB的超级块地址相同的块地址的各块构成该超级块SB的情况。
也就是说,具有超级块地址0的超级块SB0是由NAND型闪速存储器芯片#0(芯片#0)中包含的块地址0的块BLK0、NAND型闪速存储器芯片#1(芯片#1)中包含的块地址0的块BLK0、NAND型闪速存储器芯片#2(芯片#2)中包含的块地址0的块BLK0、…、NAND型闪速存储器芯片#15(芯片#15)中包含的块地址0的块BLK0所构成。
同样地,具有超级块地址1000的超级块SB1000是由NAND型闪速存储器芯片#0(芯片#0)中包含的块地址1000的块BLK1000、NAND型闪速存储器芯片#1(芯片#1)中包含的块地址1000的块BLK1000、NAND型闪速存储器芯片#2(芯片#2)中包含的块地址1000的块BLK1000、…、NAND型闪速存储器芯片#15(芯片#15)中包含的块地址1000的块BLK1000所构成。
存在各芯片中包含若干个不良块的情况。通常,不良块的数量针对每一芯片而不同。
在图9中,示出将各芯片中包含的各不良块以属于同一芯片的其它块置换的处理。
在图9中,设想如下情况:各芯片包含2048个块BLK,芯片#0包含100个不良块,芯片#1不包含不良块,芯片#2包含20个不良块,而且,芯片#15包含30个不良块。
在芯片#0中,例如,不良块BLK1由芯片#0的非不良块BLK1948置换,不良块BLK5由芯片#0的非不良块BLK1949置换。这样一来,仅从芯片#0的开头起合计1948(=2048-100)个块成为可利用状态,芯片#0的其余的块BLK1948~BLK2047不可利用。
因此,即使在芯片#1不包含不良块的情况下,芯片#1的块BLK1948~BLK2047也无法用于构筑超级块。因此,可构筑的超级块SB的数量被限制为不良块最多的芯片#0内的非不良块的数量。
图10表示不置换各不良块而从某超级块SB内的非不良块中选择写入目标块的动作。
在图10中,为了简化图示,例示出如下情况:某超级块(此处为超级块SB5)是由8个块、也就是芯片#0内的块BLK5、芯片#1内的块BLK5、芯片#2内的块BLK5、芯片#3内的块BLK5、芯片#4内的块BLK5、芯片#5内的块BLK5、芯片#6内的块BLK5、及芯片#7内的块BLK5所构成。
在本实施方式中,设置着与各超级块对应的不良信息管理表33。在超级块SB5用的不良信息管理表33中,保存着包含针对每一个块表示可使用或不可使用的1比特的信息的不良信息(位图)。在不良信息(位图)中,“0”表示非不良块,“1”表示不良块。
在图10中,设想芯片#1内的块BLK5、芯片#4内的块BLK5、芯片#5内的块BLK5为不良块的情况。
控制器4不执行将芯片#1内的块BLK5以芯片#1内的其它块置换的处理、将芯片#4内的块BLK5以芯片#4内的其它块置换的处理、将芯片#5内的块BLK5以芯片#5内的其它块置换的处理。但,控制器4查阅超级块SB5用的不良信息管理表33,从超级块SB5中包含的非不良块(此处为芯片#0内的块BLK5、芯片#2内的块BLK5、芯片#3内的块BLK5、芯片#6内的块BLK5、芯片#7内的块BLK5)中选择一个块作为写入目标块。控制器4决定该写入目标块内的写入目标位置,将来自主机2的写入数据写入到该写入目标块内的写入目标位置。而且,控制器4将表示该写入目标块及该写入目标位置这两者的物理地址通知给主机2。
由此,主机2可辨识实际写入了写入数据的块(写入目标块)与该块内的写入目标位置,因此,在必须读取该数据的情况下,可将指定该通知的物理地址的读取请求(读取指令)发送到闪速储存装置3。也就是说,首先,主机2将包含识别应写入的数据的逻辑地址(标签)的写入请求(写入指令)发送到闪速储存装置3。主机2从闪速储存装置3接收表示从除不良块以外的块中选择为写入目标块的块及该块内的写入目标位置(物理存储位置)这两者的物理地址、及该数据的逻辑地址(标签)。而且,主机2更新管理各逻辑地址(标签)与闪速储存装置3的各物理地址之间的映射的主机2上的查找表(LUT),将所接收到的物理地址映射到识别该数据的逻辑地址(标签)。在必须读取该数据的情况下,主机2查阅主机2上的查找表(LUT),获取映射到该数据的逻辑地址(标签)的物理地址,将指定所获取的物理地址的读取请求(读取指令)发送到闪速储存装置3。
像这样,在本实施方式中,不将写入对象的超级块内的不良块以该不良块所属的芯片内的其它块置换,即可正常地执行对于该超级块的数据写入及读出动作。因此,即使不良块的数量增加,也无须管理大量的置换信息。另外,也不需要用于置换处理的地址转换处理,因此可减少读取潜伏时间。进而,基本上可构筑与属于各芯片的块的数量为相同数量的超级块,因此,即使不良块的数量增加,也可利用几乎所有的非不良块。
图11表示对闪速储存装置3应用的写入指令(Write without PhysicalAddress)。
该写入指令是对闪速储存装置3请求数据的写入的指令。如上所述,该写入指令也可包含指令ID(Identifier,标识符)、QoS域ID、用户地址、长度等。
指令ID是表示该指令为写入指令的ID(指令码),写入指令中包含写入指令用的指令ID。
QoS域ID是可唯一地识别应写入数据的QoS域的标识符。根据来自某最终用户的写入请求从主机2发送的写入指令也可包含指定与该最终用户对应的QoS域的QoS域ID。命名空间ID也可作为QoS域ID进行处理。
用户地址是识别数据的逻辑地址(标签),例如LBA、键、文件标识符相当于用户地址。
长度表示应写入的写入数据的长度。长度可由LBA的数量指定,或者也可以字节指定其尺寸。
图12表示对图11的写入指令的应答。
该应答包含用户地址、闪存地址、长度、剩余的可写入数据量(distance-to-block-boundary)。
用户地址是图11的写入指令中包含的用户地址。
闪存地址表示根据图11的写入指令写入了数据的NAND型闪速存储器5内的物理存储位置的物理地址。
在本实施方式中,该物理地址例如通过芯片标识符、块地址、及偏移(块内偏移)的组合、或超级块地址与偏移(超级块内的偏移)的组合而指定。
长度表示所写入的写入数据的长度。长度可由LBA的数量指定,或者也可以字节指定其尺寸。
剩余的可写入数据量(distance-to-block-boundary)表示可对进行了数据写入的超级块进一步写入的数据量。
图13表示对闪速储存装置3应用的Trim指令。
该Trim指令包含指令ID、闪存地址、长度、查阅计数的减少量(reference-count-to-subtract)。
指令ID是表示该指令为Trim指令的ID(指令码),Trim指令中包含Trim指令用的指令ID。
闪存地址表示存储着应无效化的数据(应使查阅计数减小的数据)的最初的物理存储位置。在本实施方式中,该闪存地址通过芯片标识符、块地址、及偏移(块内偏移)的组合、或超级块地址与偏移(超级块内的偏移)的组合而指定。
长度表示应无效化的数据(应使查阅计数减小的数据)的长度。该长度(数据长度)也可由字节指定。
控制器4是使用块管理表32对表示多个超级块各自所包含的各个数据的有效/无效的标志(位图标志)进行管理。在从主机2接收到包含表示存储着应设为无效的数据的物理存储位置的闪存地址的Trim指令的情况下,控制器4更新块管理表32,将与Trim指令中包含的闪存地址对应的物理存储位置的数据所对应的标志(位图标志)变更为表示无效的值。
在支持重复数据删除(De-duplication)功能的实例中,在块管理表32中,管理多个超级块各自所包含的数据对应的查阅计数。查阅计数的减少量表示应使查阅计数减小的量。
接下来,参照图14,就对具有不良块的超级块写入数据的动作进行说明。
此处,为了简化图示,设想某一个超级块SB0由4个块BLK0(芯片#0)、BLK0(芯片#1)、BLK0(芯片#2)、BLK0(芯片#3)所构成,其中,BLK0(芯片#2)为不良块。
控制器4是以避开不良块的方式,按照块BLK0(芯片#0)的页0、块BLK0(芯片#1)的页0、块BLK0(芯片#3)的页0、块BLK0(芯片#0)的页1、块BLK0(芯片#1)的页1、块BLK0(芯片#3)的页1、…的顺序写入数据。
在页尺寸为16K字节(16KB),且数据粒度为4K字节(4KB)的情况下,最初的16K字节数据(D1~D4)被写入到块BLK0(芯片#0)的页0。随后的16K字节数据(D5~D8)被写入到块BLK0(芯片#1)的页0。对于BLK0(芯片#2)的写入被跳过,随后的16K字节数据(D9~D12)被写入到块BLK0(芯片#3)的页0。
图15表示图12的应答中包含的物理地址的构成例。
物理地址如图15的上部所示,是由选择为写入目标块的块所属的芯片的芯片标识符、与该选择的块对应的块地址、及从该选择的块的开头至写入目标位置的偏移所构成。从所选择的块的开头至写入目标位置的偏移包含页地址与页内偏移。
或者,如图15的下部所示,物理地址是由写入目标块所属的超级块对应的块地址(超级块地址)、及从超级块的开头至写入目标位置的偏移所构成。从超级块的开头至写入目标位置的偏移包含芯片标识符、页地址、页内偏移。
图16表示超级块的超级块地址(第1块地址)与该超级块中包含的各块的块地址(第2块地址)的关系。
为了使说明简单,设想超级块SB0、SB1、SB2分别由4个块构成的情况。
超级块SB0包含块80、块81、块82、及块83。这些块80、块81、块82、及块83分别包含从超级块SB0的超级块地址(第1块地址)基于数学规则确定的块地址(第2块地址)。在块81为不良块的情况下,从主机2将数据写入到从块80、块82、块83选择的写入目标块。因此,不良块81的第2块地址(不良块81所属的芯片的芯片标识符)不发回给主机2。
超级块SB1包含块84、块85、块86及块87。这些块84、块85、块86、及块87分别包含从超级块SB1的超级块地址(第1块地址)基于数学规则确定的块地址(第2块地址)。在块86及块87为不良块的情况下,从主机2将数据写入到从块84、块85选择的写入目标块。因此,不良块86的第2块地址(不良块86所属的芯片的芯片标识符)、及不良块87的第2块地址(不良块87所属的芯片的芯片标识符)不发回给主机2。
超级块SB2包含块88、块89、块90及块91。这些块88、块89、块90、及块91分别包含从超级块SB2的超级块地址(第1块地址)基于数学规则确定的块地址(第2块地址)。在块88为不良块的情况下,从主机2将数据写入到从块89、块90、及块91选择的写入目标块。因此,不良块88的第2块地址(不良块88所属的芯片的芯片标识符)不发回给主机2。
图17、图18表示将逻辑地址与数据的对写入到块内的页的动作。
在各块中,各页也可包含用于存储用户数据的用户数据区域与用于存储管理数据的冗余区域。页尺寸为16KB+α。
控制器4将4KB用户数据及该4KB用户数据对应的逻辑地址(例如LBA)这两者写入到写入目标块BLK。在该情况下,如图17所示,可将分别包含LBA与4KB用户数据的4个数据集写入到同一页中。块内偏移也可表示集边界。
或者,如图18所示,也可将4个4KB用户数据写入到页内的用户数据区域,将所述4个4KB用户数据对应的4个LBA写入到该页内的冗余区域。
利用图19,对将多个数据部与根据这些数据部算出的消失校正码写入到具有不良块的超级块的动作进行说明。
为了使用超级块内的多个块来实现RAID(Redundant Arrays of IndependentDisks,独立磁盘冗余阵列)的机制,控制器4如图19所示,跨及属于一个超级块中包含的多个块且分别具有相同页地址的多个页,将多个数据部与根据这些多个数据部算出的1个以上的消失校正码写入。属于多个块且分别具有相同页地址的多个页被作为超级页加以查阅。
在图19的上部,示出在超级块SB0中对超级页写入数据及消失校正码的情况。超级页包括BLK0(芯片#0)的页0、BLK0(芯片#1)的页0、BLK0(芯片#2)的页0、BLK0(芯片#3)的页0、BLK0(芯片#4)的页0、BLK0(芯片#5)的页0、BLK0(芯片#6)的页0、BLK0(芯片#7)的页0。
数据被写入到作为非不良块的BLK0(芯片#0)、BLK0(芯片#2)、BLK0(芯片#3)、BLK0(芯片#4)的各页0。
消失校正码例如包含里德-所罗门码、奇偶性(parity)等。消失校正码被写入到非不良块内的页。另外,消失校正码是视为在各不良块内的页存储着预先规定的值(例如,全为“0”的比特串、或全为“1”的比特串)而算出。
在图19的上部所示的例子中,例示出将2个消失校正码写入到超级块SB0的超级页的情况。2个消失校正码被写入到最后的2个非不良块内的页。在图19的上部所示的例子中,最后的块即BLK0(芯片#7)为非不良块,从最后数起为第2个的块即BLK0(芯片#6)为不良块,从最后数起为第3个的块即BLK0(芯片#5)为非不良块,因此,2个消失校正码被写入到BLK0(芯片#5)的页0与BLK0(芯片#7)的页0。
在编码处理中,控制器4是基于写入到BLK0(芯片#0)的数据部、假定为写入到作为不良块的BLK0(芯片#0)的预先规定的值、写入到BLK0(芯片#2)的数据部、写入到BLK0(芯片#3)的数据部、写入到BLK0(芯片#4)的数据部、及假定为写入到BLK0(芯片#6)的预先规定的值,算出2个消失校正码。
由此,与超级块内的不良块/非不良块的模式无关,通过用于编码的相同运算便可容易地算出消失校正码。
另外,控制器4是视为在各不良块内的页存储着预先规定的值而进行使用消失校正码的解码处理。
在图19的下部所示的例子中,构成超级块SB1的最后的块即BLK1(芯片#7)为不良块,从最后数起为第2个的块即BLK1(芯片#6)为不良块,从最后数起为第3个的块即BLK1(芯片#5)为非不良块,因此,2个消失校正码被写入到BLK1(芯片#5)的页0与BLK1(芯片#6)的页0。
接下来,利用图20,对主机2内的闪存转换部2A与闪速储存装置3内的写入动作控制部21的关系进行说明。
在主机2侧,闪存转换部2A是在进行数据的写入的情况下,将包含识别该数据的标签(例如LBA)的写入指令发送到闪速储存装置3。此外,在使用超级块用的API的情况下,闪存转换部2A将指定识别数据的标签(例如LBA)与并行单位(Parallel Unit)的块地址的写入指令(Write without Page Address)发送到闪速储存装置3。由于并行单位(ParallelUnit)通过一个超级块而实现,所以并行单位(Parallel Unit)的块地址是该超级块的超级块地址。
闪速储存装置3侧包括写入动作控制部21、闪速I/O控制电路13、不良信息管理表33、NAND型闪速存储器芯片。另外,在闪速储存装置3内,以不良信息管理表33管理保存针对每一超级块表示可使用或不可使用的至少1比特的信息的不良信息。
在从主机2侧接收到包含作为用于识别应写入的数据的信息的标签(例如LBA)的写入请求的情况下,写入动作控制部21是查阅不良信息管理表33的不良信息,从一个超级块中包含的非不良块中选择一个块作为写入目标块,并决定应写入数据的所选择的块内的写入目标位置(写入目标页、该页内的偏移)。
此外,在从主机2接收到指定并行单位的块地址(超级块地址)的写入指令的情况下,写入动作控制部21是从具有该指定的块地址(超级块地址)的超级块中包含的非不良块中选择写入目标块,并决定应写入数据的所选择的块内的写入目标位置(写入目标页、该页内的偏移)。
而且,写入动作控制部21将指定写入目标块所属的芯片的芯片标识符(芯片ID)、写入目标块的块地址(原始块(Raw Block))、写入目标页(原始页(Raw Page))、写入目标页内的偏移(Offset)的写入指示发送到闪速I/O控制电路13。
另外,写入动作控制部21将表示写入目标块及写入目标位置这两者的闪存地址(芯片ID、原始块、原始页、偏移)、及标签(例如LBA)通知给主机2。
接收到写入指示的闪速I/O控制电路13基于写入指示,将数据写入到写入目标位置。
在主机2侧,闪存转换部2A如果从闪速储存装置3接收闪存地址(芯片ID、原始块、原始页、偏移)、及标签(例如LBA),则更新主机2中管理的LUT。此时,将闪存地址(芯片ID、原始块、原始页、偏移)与标签(例如LBA)建立对应。
闪存转换部2A是在进行读取请求的情况下,将指定闪存地址(芯片ID、原始块、原始页、偏移)的读取请求发送到闪速储存装置3。
在闪速储存装置3侧,从主机2接收到指定闪存地址(芯片ID、原始块、原始页、偏移)的读取请求的情况下,闪速I/O控制电路13基于闪存地址,读取数据。读取对象的块根据芯片ID与原始块而特定出。读取对象的页根据原始页而特定出。读取对象的页内的读取对象位置根据偏移而特定出。
接下来,利用图21,对通过主机2与闪速储存装置3执行的写入动作及读取动作进行说明。
<写入动作>
(1)写入指令的接收
在闪速储存装置3中,从主机2接收的包含LBA的写入指令、及数据被暂时存储在闪速储存装置3内的写入缓冲器31。
(2)不良信息的查阅
写入动作控制部21是查阅以不良信息管理表33管理的不良信息,从写入对象的超级块中包含的非不良块中选择一个块作为写入目标块,并决定写入目标块内的写入目标位置。
(3)写入指示
写入动作控制部21当决定写入目标块与写入目标块内的写入目标位置时,将指定表示写入目标块与写入目标块这两者的闪存地址(原始地址)的写入指示经由写入缓冲器31发送到闪速I/O控制电路13。此处,原始地址中包含芯片ID、原始块、原始页、偏移。接收到原始地址的闪速I/O控制电路13是基于原始地址,将写入数据写入到选择为写入目标块的块内的写入目标位置。
(4)向主机的写入目标的通知
写入动作控制部21将原始地址与LBA通知给主机2。由此,主机2可更新LUT并将该原始地址映射到该LBA。
<读取动作>
(11)LBA的通知
读取剖析器2B如果接收包含LBA的读取指令,则将LBA通知给闪存转换部2A。
(12)原始地址的获取
闪存转换部2A如果从读取剖析器2B接收LBA,则查阅LUT,获取与所接收到的LBA对应的原始地址,并将所获取的原始地址返回给读取剖析器2B。由此,读取剖析器2B可获取原始地址,从而可将包含LBA的读取指令转换为包含原始地址的读取指令。
(13)读取指示
读取剖析器2B将包含原始地址的读取指令发送到闪速储存装置3。在闪速储存装置3中,接收到包含原始地址的读取指令的闪速I/O控制电路13基于原始地址,读取数据,并将读取数据发送到读取缓冲器30。在读取缓冲器30,暂时存储读取数据。
(14)读取数据向主机的发送
读取缓冲器30中暂时存储的读取数据被发送到主机2。
图22的序列图表示通过主机2与闪速储存装置3执行的写入动作处理的顺序。
主机2将包含QoS域ID、用户地址(逻辑地址)、写入数据、长度的写入指令(Writewithout Physical Address)发送到闪速储存装置3。当闪速储存装置3的控制器4接收到该写入指令时,控制器4从一个超级块(写入对象的超级块)中包含的非不良块中选择一个块作为写入目标块,并决定所选择的块内的写入目标位置(步骤S11)。在步骤S11中,该写入对象的超级块也可为属于由QoS域ID特定出的QoS域的超级块。在多个超级块属于该QoS域的情况下,这些多个超级块的一个被选择为写入对象的超级块。
控制器4将从主机2接收的写入数据写入到写入目标位置(步骤S12)。在步骤S12中,控制器4将用户地址(例如LBA)与写入数据这两者写入到写入目标块的写入目标位置。
控制器4更新块管理表32,将与所写入的数据对应的位图标志(也就是,写入了该数据的物理存储位置的物理地址对应的位图标志)从0变更为1(步骤S13)。例如,设想如图23所示将起始LBA为LBAx的16K字节更新数据写入到块BLK11的页1的与偏移+0~+3对应的物理存储位置的情况。在该情况下,如图24所示,在块BLK11用的块管理表中,页1的与偏移+0~+3对应的位图标志分别从0变更为1。
控制器4将对该写入指令的应答返回给主机2(步骤S14)。应答中包含用户地址、物理地址(闪存地址)、长度。例如,如果如图23所示,起始LBA为LBAx的16K字节更新数据已被写入到块BLK11的页1的与偏移+0~+3对应的物理存储位置,则将包含LBAx、闪存地址(块BLK11所属的芯片的芯片标识符、块BLK11的块地址、页地址(=1)、页内偏移(=+0))、长度(=4)的应答从控制器4发送到主机2。闪存地址通过块地址、页地址、页内偏移的组合而表达,但在以下的说明中,为了简化闪存地址的说明,而省略闪存地址内的芯片标识符的说明。
当主机2接收到该应答时,主机2更新主机2所管理的LUT,将闪存地址(物理地址)映射到所写入的写入数据对应的各用户地址(步骤S21)。如图25所示,LUT包含与多个用户地址(逻辑地址)分别对应的多个条目。在与某用户地址(例如某LBA)对应的条目,存储表示存储着与该LBA对应的数据的NAND型闪速存储器5内的位置(物理存储位置)的物理地址。如果如图23所示,起始LBA为LBAx的16K字节更新数据已被写入到块BLK11的页1的与偏移+0~+3对应的物理存储位置,则如图25所示,LUT更新,在与LBAx对应的条目存储BLK11、页1、偏移+0,在与LBAx+1对应的条目存储BLK11、页1、偏移+1,在与LBAx+2对应的条目存储BLK11、页1、偏移+2,在与LBAx+3对应的条目存储BLK11、页1、偏移+3。
然后,主机2将用于使因所述更新数据的写入而变得无用的以前的数据无效化的Trim指令发送到闪速储存装置3。如图23所示,以前的数据存储在块BLK0的页0的与偏移+0、偏移+1、偏移+2、偏移+3对应的位置的情况下,如图26所示,将指定闪存地址(块地址(=BLK0)、页地址(=页0)、页内偏移(=+0))、长度(=4)的Trim指令从主机2发送到闪速储存装置3。闪速储存装置3的控制器4根据该Trim指令,更新块管理表32(步骤S15)。在步骤S15中,如图26所示,在块BLK0用的块管理表中,页0的与偏移+0~+3对应的位图标志分别从1变更为0。
图27表示对闪速储存装置3应用的读取指令(Read with Physical Address)。
读取指令是对闪速储存装置3请求数据的读出的指令。该读取指令包含指令ID、闪存地址、长度、传送目的地指针。
指令ID是表示该指令为读取指令的ID(指令码),读取指令中包含读取指令用的指令ID。
闪存地址表示应读出数据的最初的物理存储位置的闪存地址(物理地址)。长度表示应读取的数据的长度。
传送目的地指针表示应被传送所读出的数据的主机2内的存储器上的位置。
一个读取指令可指定多个闪存地址(物理地址)与长度的组。
此处,读取指令中也可包含2组以上的闪存地址及长度的组。作为包含2组以上的闪存地址及长度的组的情况,设想如下情况:由于进行了数据写入的超级块中存在不良块,所以写入数据被写入到隔着不良块的2个块。
图28表示读取动作。
此处,设想从主机2接收到指定块地址(=BLK2)、页地址(=页1)、页内偏移(=+1)、长度(=3)的读取指令的情况。闪速储存装置3的控制器4基于块地址(=BLK2)、页地址(=页1)、页内偏移(=+1)、长度(=3),从BLK2读取数据d1~d3。在该情况下,控制器4从BLK2的页1读取相当于1页尺寸的数据,从该读取数据抽取数据d1~数据d3。接着,控制器4将数据d1~数据d3传送到传送目的地指针所指定的主机存储器上。
图29的序列图表示通过主机2与闪速储存装置3执行的读取处理的顺序。
主机2查阅主机2所管理的LUT,将来自用户应用的读取请求中包含的用户地址(逻辑地址)转换为闪存地址。然后,主机2将指定该闪存地址、长度的读取指令发送到闪速储存装置3。
当闪速储存装置3的控制器4从主机2接收到读取指令时,控制器4基于由该读取指令指定的闪存地址,决定读取对象的块、读取对象的页、读取对象的页内位置(步骤S31)。控制器4从NAND型闪速存储器5读取由闪存地址、长度规定的数据(步骤S32),并将该读取数据发送到主机2。
图30表示对闪速储存装置3应用的垃圾回收(GC)控制指令。
GC控制指令也可包含指令ID、策略(GC的方法)、QoS域ID、最大数据数(maximum-number-of-data)等。
指令ID是表示该指令为GC控制指令的ID(指令码),GC控制指令中包含GC控制指令用的指令ID。
策略(GC的方法)是指定用于选择GC候补块(GC源块)的条件(GC策略)的参数。闪速储存装置3的控制器4支持多个GC策略。
控制器4所支持的GC策略中也可包含优先选择有效数据量较少的块作为GC候补块(GC源块)的策略(贪心)。
另外,控制器4所支持的GC策略中也可包含如下策略:将集中有具有较低更新频率的数据(冷数据)的块优先在集中有具有较高更新频率的数据(热数据)的块选择为GC候补块(GC源块)。
进而,GC策略也可指定GC开始条件。GC开始条件例如也可表示剩余空闲块的个数。
控制器4也可利用活动块列表管理包含有效数据的超级块群,在执行GC的情况下,基于由GC控制指令指定的GC策略,从活动块列表所管理的超级块群中选择一个以上的GC候补超级块(GC源块)。
QoS域ID是指定应实施GC的QoS域的参数。控制器4是从属于由QoS域ID指定的QoS域的超级块群、也就是该QoS域对应的活动块列表中,选择一个以上的GC候补超级块(GC源块)。
最大数据数表示执行GC时复制的数据量的上限值。也就是说,GC动作不可超过最大数据数而执行。
控制器4也可在与QoS域对应的剩余空闲块的数量成为策略所指定的阈值以下的情况下,开始GC。
图31表示对闪速储存装置3应用的强制GC指令(Forced Garbage-Collection)。
强制GC指令也可包含指令ID、QoS域ID、超级块地址等。当接收到该强制GC指令时,控制器立即执行GC。
图32表示从闪速储存装置3发送到主机2的地址更新通知(Address UpdateNotification(Device Initiated))。
地址更新通知用于将闪速储存装置3中通过执行GC动作而发生变更的数据的存储位置通知给主机2。也可包含用户地址、旧闪存地址、新闪存地址、查阅计数、长度等。
用户地址是识别所复制的数据的地址。
旧闪存地址表示存储着所复制的数据的旧物理存储位置的物理地址(旧物理地址)。
新闪存地址表示存储着所复制的数据的新物理存储位置的物理地址(新物理地址)。
查阅计数表示查阅所复制的数据的用户地址的数量。
长度表示所复制的数据的长度。
图33的序列图表示通过闪速储存装置3执行的GC动作的顺序。
闪速储存装置3的控制器4从属于主机2所指定的QoS域的超级块群中,选择有效数据与无效数据混合存在的一个以上的GC源块(GC源超级块)(步骤S41)。接着,控制器4从属于该QoS域的空闲块群(空闲超级块群)中选择一个以上的空闲块(空闲超级块),并将所选择的空闲块分配为GC目的地块(GC目的地超级块)(步骤S42)。
控制器4将GC源块(GC源超级块)内的所有有效数据复制到GC目的地块(GC目的地超级块)(步骤S43)。在步骤S43中,控制器4不仅将GC源块(GC源超级块)内的有效数据,而且将该有效数据及该有效数据对应的用户地址(逻辑地址)这两者从GC源块(GC源超级块)复制到GC目的地块(GC目的地超级块)。由此,可在GC目的地块(GC目的地超级块)内保存数据与用户地址(逻辑地址)的对。
然后,控制器4针对所复制的每一有效数据,使用地址更新通知将用户地址(逻辑地址)、旧闪存地址、新闪存地址、长度通知给主机2(步骤S44)。
当主机2接收到该地址更新通知时,主机2更新主机2所管理的LUT,将新闪存地址映射到所复制的各有效数据对应的用户地址(逻辑地址)(步骤S51)。
图34表示为了GC而执行的数据复制动作的例子。
在图34中,设想如下情况:将GC源块(此处为块BLK50)的页1的与偏移+0对应的位置上存储的有效数据(LBA=10)复制到GC目的地块(此处为块BLK100)的页0的与偏移+0对应的位置,将GC源块(此处为块BLK50)的页2的与偏移+2对应的位置上存储的有效数据(LBA=20)复制到GC目的地块(此处为块BLK100)的页0的与偏移+1对应的位置。在该情况下,控制器4将{LBA10、旧闪存地址(BLK50、页1、偏移(=+0))、新闪存地址(LBA100、页0、偏移(=+0))、长度(=1)}、{LBA20、旧闪存地址(BLK50、页2、偏移(=+2))、新闪存地址(LBA100、页0、偏移(=+1))、长度(=1)}通知给主机2(地址更新通知)。
图35表示基于图34的数据复制动作的结果更新的主机2的LUT的内容。
在该LUT中,与LBA10对应的闪存地址(块地址、页地址、及偏移(页内偏移))从BLK50、页1、偏移(=+0)更新为BLK100、页0、偏移(=+0)。同样地,与LBA20对应的闪存地址(块地址、页地址、及偏移(页内偏移))从BLK50、页2、偏移(=+2)更新为BLK100、页0、偏移(=+1)。
LUT更新后,主机2也可将指定BLK50、页1、偏移(=+0)的Trim指令发送到闪速储存装置3,使BLK50的页1的与偏移(=+0)对应的位置上存储的数据无效化。进而,主机2也可将指定BLK50、页2、偏移(=+2)的Trim指令发送到闪速储存装置3,使BLK50的页2的与偏移(=+2)对应的位置上存储的数据无效化。
图36表示对写入指令的应答与GC用回调处理(地址更新通知)的关系。
存在发生如下实例的情况:控制器4在复制与某用户地址(逻辑地址)对应的有效数据的期间,从主机2接收指定该用户地址的写入指令。
在图36中,设想如下情况:在图34的数据复制动作(与LBA10对应的数据复制动作)的执行中,从主机2接收到指定LBA10的写入指令。
控制器4将从主机2接收的写入数据写入到写入目标块(此处,写入到BLK3的页0的与偏移+0对应的位置)。然后,控制器4将{LBA10、BLK3、页0、偏移(=+0)}作为对写入指令的应答返回给主机2。
主机2更新LUT,将与LBA10对应的块地址、页地址、偏移(页内偏移)从BLK50、页1、偏移(+0)变更为BLK3、页0、偏移(+0)。
如果之后将LBA10的新闪存地址从控制器4通知给主机2,则表示存储着与LBA10对应的最新数据的位置的块地址、页地址及偏移(BLK3、页0、偏移(+0))有可能被错误地变更为与LBA10对应的新闪存地址(此处为BLK100、页0、偏移(=+0))。
在本实施方式中,控制器4不仅可将LBA10、新闪存地址(BLK100、页0、偏移(=+0))、长度=1,也可将旧闪存地址(BLK50、页1、偏移(=+0))通知给主机2(地址更新通知)。主机2是在旧闪存地址(BLK50、页1、偏移(=+0))与通过LUT当前映射到LBA10的块地址、页地址、偏移不一致的情况下,不更新LUT。由此,可防止表示存储着与LBA10对应的最新数据的位置的块地址、页地址及偏移(BLK3、页0、偏移(+0))被错误地变更为与LBA10对应的新闪存地址(此处为BLK100、页0、偏移(=+0))。
图37的流程图表示主机2所执行的LUT更新处理的顺序。
主机2如果接收到地址更新通知(步骤S101的是(YES)),则将旧闪存地址与LUT上的当前的物理地址加以比较(步骤S102)。比较的结果,如果旧闪存地址与当前的物理地址一致(步骤S103的是),则主机2将与用户地址对应的当前的物理地址更新为新闪存地址(步骤S104)。接着,主机2将Trim指令发送到闪速储存装置,使与旧闪存地址对应的位置上存储的数据无效化(步骤S105)。
另一方面,如果旧闪存地址与当前的物理地址不一致(步骤S106的否(NO)),则主机2维持与用户地址对应的当前的物理地址(步骤S106)。由此,可防止地址更新通知所通知的表示存储着最新数据的位置的块地址、页地址及偏移被错误地变更为新闪存地址。
在图38中,例示出块BLK1用的块管理表。
块BLK1用的块管理表包含与块BLK1的页地址及页内偏移的组分别对应的多个条目。
例如,在页0、偏移+0对应的条目,存储块BLK1的页0、偏移+0对应的位置上存储的4KB数据所对应的查阅计数。同样地,在页0、偏移+1对应的条目,存储块BLK1的页0、偏移+1对应的位置上存储的4KB数据所对应的查阅计数。
查阅计数为1以上的数据是有效数据,查阅计数为0的数据是无效数据。
闪速储存装置3基于从主机2接收的重复指令/Ttim指令,使查阅计数递增/递减。
图39表示为了查阅计数的管理而对闪速储存装置3应用的重复指令。
重复指令是请求闪速储存装置3使存储在某物理地址(块地址、页地址、页内偏移)的数据的查阅计数增加的指令。
该重复指令也可包含指令ID、闪存地址、长度等。
指令ID是表示该指令为重复指令的ID(指令码),重复指令中包含重复指令用的指令ID。
闪存地址表示存储着应使查阅计数增加的数据的最初的物理存储位置。
长度表示应使查阅计数增加的数据的长度。
控制器4是在从主机2接收到包含表示存储着应使查阅计数增加的数据的物理存储位置的块地址、页地址、页内偏移的重复指令的情况下,更新块管理表32,使重复指令中包含的块编号、页编号、页内偏移对应的物理存储位置的数据所对应的查阅计数增加。
图40的序列图表示查阅计数递增/递减处理。
当闪速储存装置3的控制器4从主机2接收到重复指令时,控制器4使由重复指令指定的闪存地址(块地址、页地址、偏移(页内偏移))对应的查阅计数、也就是由该块地址、页地址、偏移指定的NAND型闪速存储器5内的物理存储位置上存储的数据对应的查阅计数例如增加1(步骤S61)。在该情况下,控制器4更新具有由重复指令指定的块地址的块所对应的块管理表32。通过该块管理表32的更新,由重复指令指定的物理存储位置对应的块管理表32内的条目中存储的查阅计数例如增加1。在由重复指令指定的长度为2以上的情况下,不仅由重复指令指定的页地址及偏移对应的查阅计数,而且接续于该页地址及偏移的若干个页地址及偏移对应的查阅计数例如也增加1。
当闪速储存装置3的控制器4从主机2接收到Trim指令时,控制器4使由Trim指令指定的闪存地址(块地址、页地址、偏移(页内偏移))对应的查阅计数、也就是由该块地址、页地址、偏移指定的NAND型闪速存储器5内的物理存储位置上存储的数据对应的查阅计数例如减小1(步骤S62)。在该情况下,控制器4更新具有由Trim指令指定的块地址的块对应的块管理表32。通过该块管理表32的更新,由Trim指令指定的页地址及偏移对应的块管理表32内的条目中存储的查阅计数例如减小1。在由Trim指令指定的长度为2以上的情况下,不仅由Trim指令指定的页地址及偏移对应的查阅计数,而且接续于该偏移的若干个页地址及偏移对应的查阅计数例如也减小1。
在GC中,控制器4查阅与GC源块对应的块管理表,以尺寸为4KB的数据为单位,判定GC源块内的数据为有效数据还是无效数据。控制器4将查阅计数为0的数据判定为无效数据,将查阅计数为1以上的数据判定为有效数据。而且,控制器4将有效数据(查阅计数为1以上的数据)及该有效数据对应的逻辑地址从GC源块(GC源超级块)复制到GC目的地块(GC目的地超级块)。
更详细来说,控制器4是在执行NAND型闪速存储器5的垃圾回收的情况下,选择用于垃圾回收的GC源块(GC源超级块)及GC目的地块(GC目的地超级块)。控制器4将存储在GC源块(GC源超级块)内的查阅计数为1以上的第1数据(有效数据)与第1数据的逻辑地址这两者复制到GC目的地块(GC目的地超级块)。而且,控制器4将第1数据的用户地址(逻辑地址)、第1数据的复制目标物理存储位置(新物理存储位置)的物理地址、及第1数据的复制源物理存储位置(旧物理存储位置)的物理地址通知给主机2。
图41的流程图表示闪速储存装置3所执行的超级块分配处理的顺序。
如果接收来自主机2的超级块分配请求(并行单位分配请求)(步骤S71的是),则控制器4选择包含由该分配请求指定的并行数以上的非不良块的超级块(步骤S72)。
接着,控制器4对主机2分配所选择的超级块(步骤S73)。
接着,如果接收来自主机2的写入请求(步骤S74的是),则控制器4将写入数据写入到该分配的超级块内的非不良块(步骤S75)。然后,控制器4向主机返回应答(步骤S76)。
接下来,利用图42,对以超级块内的所有非不良块从该超级块的开头连续地逻辑性地配置的方式转换访问对象块的地址的地址转换动作进行说明。
在图42中,示出如下情况:超级块SB5是由BLK5(芯片#0)、BLK5(芯片#1)、BLK5(芯片#2)、BLK5(芯片#3)、BLK5(芯片#4)、BLK5(芯片#5)、BLK5(芯片#6)、BLK5(芯片#7)所构成,其中,BLK5(芯片#2)、BLK5(芯片#5)为不良块。另外,BLK5(芯片#0)、BLK5(芯片#1)、BLK5(芯片#2)、BLK5(芯片#3)、BLK5(芯片#4)、BLK5(芯片#5)、BLK5(芯片#6)、BLK5(芯片#7)分别以块编号(块地址)0、1、2、3、4、5、6、7从外部指定。
地址转换是以超级块SB5内的6个非不良块(BLK5(芯片#0)、BLK5(芯片#1)、BLK5(芯片#3)、BLK5(芯片#4)、BLK5(芯片#6)、BLK5(芯片#7))作为块编号0~6的块进行处理的方式执行。
当执行地址转换动作时,BLK5(芯片#0)、BLK5(芯片#1)、BLK5(芯片#2)、BLK5(芯片#3)、BLK5(芯片#4)各自的块编号分别以1→1、2→3、3→4、4→6、5→7的方式转换。通过该地址转换动作,可使得在从超级块SB5的开头开始的连续的偏移地址内不包含不良块的块编号。由此,通过该地址转换动作,而超级块SB5内的所有非不良块从该超级块SB5的开头连续地逻辑性地配置,因此,可将超级块SB5视为好像不包含不良块的小尺寸的超级块(仅由6个非不良块构成的超级块)。结果,即使为较长的数据,也可通过表示该数据的起始物理存储位置的一个物理地址与一个长度的组合而表达该数据的物理存储位置。
接下来,利用图43,对用于地址转换动作的不良信息管理表33与地址转换的例子进行说明。此外,在图43中,块编号以16进制表示。
不良信息管理表33表示从开头起(块编号由小至大)发现的不良块数的累计。在图43中,示出不良信息管理表33的块编号为4、9的块是不良块。在该情况下,在不良信息管理表33中,在与块编号0对应的位置、与块编号1对应的位置、与块编号2对应的位置、与块编号3对应的位置存储“0”,在与块编号4对应的位置、与块编号5对应的位置、与块编号6对应的位置、与块编号7对应的位置、与块编号8对应的位置存储“1”,在与块编号9对应的位置、与块编号A对应的位置、与块编号B对应的位置、与块编号C对应的位置、与块编号D对应的位置存储“1”。也就是说,表示存储的数值发生变化的部分对应的块编号的块为不良块。
此外,在不良信息管理表33的块编号E、及F对应的位置存储不可能有的数值。如果每个块的不良信息的比特数为2比特,则在块编号E、及F对应的位置存储“3”。
另外,当执行地址转换动作时,访问对象的块的块编号被转换为该块的块编号与不良块数的累计的和。例如,关于块编号0~3,由于不良块的累计为“0”,所以块编号不变。
另一方面,例如,在访问对象的块的块编号为4的情况下,将该块编号+1而转换为块编号“5”。因此,在写入对象的块的块编号为4的情况下,数据实际上被写入到块编号“5”的块。控制器4将块编号4作为数据写入目标块的物理地址通知给主机2。在接收到将块编号4指定为读取对象块的物理地址的读取请求的情况下,由于该块编号4被转换为块编号“5”,所以控制器4从块编号“5”的块读取数据。
同样地,在访问对象的块的块编号为5的情况下,将该块编号+1而转换为块编号“6”。因此,在写入对象的块的块编号为5的情况下,数据实际上被写入到块编号“6”的块。控制器4将块编号5作为数据写入目标块的物理地址通知给主机2。在接收到将块编号5指定为读取对象块的物理地址的读取请求的情况下,由于该块编号5被转换为块编号“6”,所以控制器4从块编号“6”的块读取数据。
图44表示主机2内的闪存转换部2A与闪速储存装置3内的不良块转换部24的关系。
在主机2侧,闪存转换部2A是在进行数据的写入的情况下,将包含识别该数据的标签(例如LBA)的写入指令发送到闪速储存装置3。此外,在使用超级块用的API的情况下,闪存转换部2A将指定识别数据的标签(例如LBA)与并行单位(Parallel Unit)的块地址的写入指令(Write without Page Address)发送到闪速储存装置3。由于并行单位(ParallelUnit)通过一个超级块而实现,所以并行单位(Parallel Unit)的块地址是该超级块的超级块地址。
闪速储存装置3侧包括不良块转换部24、闪速I/O控制电路13、不良信息管理表33、NAND型闪速存储器芯片。另外,在闪速储存装置3内,以不良信息管理表33管理保存针对每一超级块表示可使用或不可使用的至少2比特的信息的不良信息。
在从主机2侧接收到包含作为用于识别应写入数据的信息的标签(例如LBA)的写入请求的情况下,不良块转换部24是查阅不良信息,执行以写入对象的超级块中包含的所有非不良块从写入对象的超级块的开头连续地逻辑性地配置的方式转换访问对象块的地址的地址转换,由此,选择写入对象的超级块内的非不良块作为写入目标块,并决定所选择的块内的写入目标位置(写入目标页、该页内的偏移)。
此外,在从主机2接收到指定并行单位的块地址(超级块地址)的写入指令的情况下,不良块转换部24查阅不良信息,选择具有该指定的块地址(超级块地址)的超级块作为写入对象的超级块。
而且,不良块转换部24将指定写入目标块所属的芯片的芯片标识符(芯片ID)、写入目标块的块地址(原始块)、写入目标页(原始页)、写入目标页内的偏移(Offset)的写入指示发送到闪速I/O控制电路13。
另外,不良块转换部24将表示地址转换前的访问对象块及写入目标位置这两者的物理地址、及标签(例如LBA)通知给主机2。该物理地址也可由表示写入目标的超级块的并行单位(Parallel Unit)、及该超级块内的偏移(Offset)表示。表示写入目标的超级块的并行单位(Parallel Unit)是写入目标的超级块的超级块地址。
接收到写入指示的闪速I/O控制电路13基于写入指示,将数据写入到写入目标位置。
在主机2侧,闪存转换部2A如果接收物理地址(并行单位、偏移)、及标签(例如LBA),则更新主机2中管理的LUT,将所接收到的物理地址映射到所接收到的标签(例如LBA)。
闪存转换部2A是在进行读取请求的情况下,将指定物理地址(并行单位、偏移)的读取请求发送到闪速储存装置3。
在闪速储存装置3侧,从主机2接收到指定物理地址(并行单位、偏移)的读取请求的情况下,不良块转换部24执行所述地址转换,将物理地址(并行单位、偏移)转换为芯片标识符(芯片ID)、块地址(原始块)、页地址(原始页)、页内的偏移(Offset)。而且,不良块转换部24将指定芯片标识符(芯片ID)、块地址(原始块)、页地址(原始页)、页内的偏移(Offset)的写入指示发送到闪速I/O控制电路13。闪速I/O控制电路13基于芯片标识符(芯片ID)、块地址(原始块)、页地址(原始页)、页内的偏移(Offset),读取数据。
图45表示主机2(计算机系统)的构成例。
该主机2(计算机系统)包含处理器(CPU)101、主存储器102、BIOS(Basic Input/Output System,基本输入输出系统)-ROM103、网络控制器105、周边接口控制器106、控制器107、及嵌入式控制器(EC)108等。
处理器101是以控制该计算机系统的各组件的动作的方式构成的CPU。该处理器101执行从多个闪速储存装置3的任一个加载到主存储器102的各种程序。主存储器102包含DRAM之类的随机存取存储器。由处理器101执行的程序包含应用软件层41、操作系统(OS)42、文件系统43、驱动器44等。此处,文件系统43中包含闪速储存管理器(flash storagemanager)45。此外,该闪速储存管理器45也可包含于驱动器44,而并非包含于文件系统43。
另外,处理器101也执行作为非易失性存储器的BIOS-ROM103中存储的基本入输出系统(BIOS)。BIOS是用于硬件控制的系统程序。
网络控制器105是有线LAN(Local Area Network,局域网)控制器、无线LAN控制器之类的通信装置。周边接口控制器106是以执行与USB(Universal Serial Bus,通用串行总线)装置之类的周边装置的通信的方式构成。
控制器107是以执行与分别连接于多个连接器107A的装置的通信的方式构成。多个闪速储存装置3也可分别连接于多个连接器107A。控制器107为SAS(Serial AttachedSCSI(Small Computer System Interface,小型计算机系统接口),串行连接SCSI)扩展器、PCIe交换器、PCIe扩展器、或RAID控制器等。
EC108作为构成为执行计算机系统的电力管理的系统控制器发挥功能。EC108根据用户对电源开关的操作而将计算机系统接通电源及断开电源。EC108是以单芯片微控制器之类的处理电路的形式实现。
闪速储存管理器45是作为所述闪存转换部2A发挥功能的程序模块。闪速储存管理器45具有管理各用户地址(逻辑地址)与闪速储存装置3的各物理地址之间的映射的所述LUT。在使用LBA作为用户地址(逻辑地址)的情况下,闪速储存管理器45也可设置在驱动器44内。
闪速储存管理器45将指定用于识别应写入的数据(写入数据)的用户地址(逻辑地址)与该写入数据的长度的写入指令发送到闪速储存装置3。闪速储存管理器45是从闪速储存装置3接收表示由闪速储存装置3从除不良块以外的块中选择的写入目标块及写入目标块内的写入目标位置这两者的物理地址、及所述用户地址(逻辑地址),更新LUT而将该物理地址映射到该用户地址(逻辑地址)。详细来说,接收的物理地址表示由闪速储存装置3从写入对象的一个并行单位中包含的不良块以外的块中选择为用于写入数据的写入目标块的写入目标块、及写入了该写入数据的写入目标块内的物理存储位置这两者。
另外,闪速储存管理器45查阅LUT,获取映射到读取对象的数据对应的用户地址(逻辑地址)的物理地址,并将指定该物理地址的读取指令发送到闪速储存装置3。
图46表示内置闪速储存装置3的主机(计算机系统)2的构成例。
该计算机系统具备能够收容于机架的薄箱形的壳体201。也可在壳体201内配置多个闪速储存装置3。在该情况下,各闪速储存装置3也可能够卸除地插入设置在壳体201的前表面201A的插槽中。
系统板(母板)202配置在壳体201内。在系统板(母板)202上,安装着包括CPU101、存储器102、网络控制器105、控制器107的各种电子零件。这些电子零件作为主机2发挥功能。
图47的流程图表示主机(计算机系统)2执行的写入动作的顺序。
主机2的处理器101是通过执行主存储器102中存储的计算机程序(此处为闪速储存管理器45等)而执行以下顺序。
也就是说,处理器101判定是否需要发送写入指令(步骤S201),如果需要发送写入指令(步骤S201的是),则将指定用户地址、闪存地址、长度的写入指令发送到闪速储存装置3(步骤S202)。
然后,处理器101如果接收到来自闪速储存装置3的写入动作完成的应答(包含用户地址、闪存地址、长度)(步骤S203的是),则更新LUT(步骤S204)。然后,处理器101将指定与旧数据对应的物理地址的Trim指令发送到闪速储存装置3,对闪速储存装置3指示应使所述旧数据无效化(或应使表示查阅旧数据的逻辑地址的数量的查阅计数减小)(步骤S205)。
图48的流程图表示主机2执行的读取动作的顺序。
处理器101判定是否需要发送读取指令(步骤S301),如果需要发送读取指令(步骤S301的是),则将指定闪存地址、长度的读取指令发送到闪速储存装置3(步骤S302)。
然后,处理器101判定是否已接收到读取数据(步骤S303),如果已接收到读取数据(步骤S303的是),则动作完成。
图49的流程图表示主机2执行的查阅计数递增/递减处理的顺序。
处理器101判定是否需要发送用于使旧数据的查阅数增加的重复指令(步骤S401),如果需要发送重复指令(步骤S401的是),则将重复指令发送到闪速储存装置3(步骤S402)。
另外,处理器101判定是否需要发送用于使旧数据的查阅数减小的Trim指令(步骤S403),如果需要发送Trim指令(步骤S403的是),则将Trim指令发送到闪速储存装置3(步骤S404)。
像以上所说明的那样,根据本实施方式,主机(计算机系统)2将指定用于识别写入数据的逻辑地址的写入请求发送到储存装置3,并从储存装置3接收物理地址、及该逻辑地址,所述物理地址表示由储存装置3从除不良块以外的块中选择为用于写入数据的写入目标块的写入目标块、及写入了写入数据的写入目标块内的物理存储位置这两者。而且,主机(计算机系统)2更新LUT,将所接收到的物理地址映射到所接收到的逻辑地址。因此,可利用主机(计算机系统)2的LUT管理直接表示不良块以外的物理存储位置的物理地址,所以主机(计算机系统)2可视需要将指定直接表示该物理存储位置的物理地址的读取请求发送到储存装置3。结果,在储存装置3侧,不将不良块以该不良块所属的芯片内的其它块置换,便可正常地执行对于不良块以外的块的数据写入及读出动作。因此,即使不良块的数量增加,也无须管理大量的置换信息。另外,也不需要用于置换处理的地址转换处理,因此可减少读取潜伏时间。因此,可提升系统整体的I/O性能。
此外,在本实施方式中,例示出NAND型闪速存储器作为非易失性存储器。但是,本实施方式的功能例如也可应用于MRAM(Magnetoresistive Random Access Memory,磁阻式随机存取存储器)、PRAM(Phase change Random Access Memory,相变随机存取存储器)、ReRAM(Resistive Random Access Memory,阻变式随机存取存储器)、或FeRAM(Ferroelectric Random Access Memory,铁电随机存取存储器)之类的其它各种非易失性存储器。
已对本发明的若干实施方式进行了说明,但这些实施方式是作为例子而提出的,并不意图限定发明的范围。这些新颖的实施方式能以其它多种方式实施,能够在不脱离发明主旨的范围内进行各种省略、置换、变更。这些实施方式或其变化包含在发明的范围或主旨中,并且包含在权利要求书所记载的发明及其均等的范围内。
[符号的说明]
2 主机
3 闪速储存装置
4 控制器
5 NAND型闪速存储器
21 写入动作控制部
22 读取动作控制部
23 GC动作控制部

Claims (16)

1.一种计算机系统,其特征在于:对包括分别包含多个块的多个非易失性存储器芯片和控制器的储存装置进行控制,且包含:
存储器;以及
处理器,构成为与所述存储器电连接,且执行所述存储器中存储的计算机程序;
所述处理器是构成为:
将指定用于识别应写入的第1数据的第1逻辑地址与所述第1数据的长度的写入请求发送到所述储存装置,
从所述储存装置接收第1物理地址、及所述第1逻辑地址,所述第1物理地址表示由所述储存装置从除不良块以外的块中选择为用于所述第1数据的写入目标块的第1块、及写入了所述第1数据的所述第1块内的第1物理存储位置这两者,
在管理各逻辑地址与所述储存装置的各物理地址之间的映射的第1表中将所述第1物理地址映射到所述第1逻辑地址。
2.根据权利要求1所述的计算机系统,其特征在于所述处理器是构成为:
查阅所述第1表,获取映射到所述第1逻辑地址的所述第1物理地址,
将指定所述第1物理地址的读取请求发送到所述储存装置。
3.根据权利要求1所述的计算机系统,其特征在于所述处理器是构成为:
在通过所述储存装置将所述第1数据从旧物理存储位置复制到新物理存储位置之后,从所述储存装置接收所述第1逻辑地址、表示所述旧物理存储位置的第2物理地址、及表示所述新物理存储位置的第3物理地址,
查阅所述第1表,获取映射到所述第1逻辑地址的当前的物理地址,
在所述第2物理地址与所述获取的当前的物理地址一致的情况下,在所述第1表中,将所述第3物理地址映射到所述第1逻辑地址,
在所述第2物理地址与所述获取的当前的物理地址不一致的情况下,在所述第1表中维持所述当前的物理地址。
4.根据权利要求3所述的计算机系统,其特征在于所述处理器是构成为:在所述第1表中将所述第3物理地址映射到所述第1逻辑地址之后,将指定所述第2物理地址的第1指令发送到所述储存装置,由此,对所述储存装置指示应使与所述第2物理地址对应的数据无效化。
5.根据权利要求1所述的计算机系统,其特征在于:所述处理器是构成为:在所述第1数据为已经写入到所述储存装置的旧数据的更新数据的情况下,在所述第1表中将所述第1物理地址映射到所述第1逻辑地址之后,将指定与所述旧数据对应的物理地址的第1指令发送到所述储存装置,由此,对所述储存装置指示应使所述旧数据无效化。
6.根据权利要求1所述的计算机系统,其特征在于所述处理器是构成为:在所述第1数据为已经写入到所述储存装置的旧数据的更新数据,且所述旧数据为被多个逻辑地址查阅的重复数据的情况下,在所述第1表中将所述第1物理地址映射到所述第1逻辑地址之后,将指定与所述旧数据对应的物理地址的第1指令发送到所述储存装置,由此,对所述储存装置指示应使表示查阅所述旧数据的逻辑地址的数量的查阅计数减小。
7.根据权利要求6所述的计算机系统,其特征在于所述计算机系统不保存所述查阅计数。
8.一种计算机系统,其特征在于:对储存装置进行控制,所述储存装置包括多个非易失性存储器芯片和控制器且构成为对分别包含属于不同非易失性存储器芯片的各个块的多个并行单位进行管理,所述计算机系统包括:
存储器;以及
处理器,构成为与所述存储器电连接,且执行所述存储器中存储的计算机程序;
所述处理器是构成为:
将指定用于识别应写入的第1数据的第1逻辑地址与所述第1数据的长度的写入请求发送到所述储存装置,
从所述储存装置接收第1物理地址、及所述第1逻辑地址,所述第1物理地址表示由所述储存装置从写入对象的一个并行单位中包含的不良块以外的块中选择为用于所述第1数据的写入目标块的第1块、及写入了所述第1数据的所述第1块内的第1物理存储位置这两者,
在管理各逻辑地址与所述储存装置的各物理地址之间的映射的第1表中将所述第1物理地址映射到所述第1逻辑地址。
9.根据权利要求8所述的计算机系统,其特征在于所述写入请求指定所述第1逻辑地址、及表示所述多个并行单位内的一个并行单位的第1块地址,且
所述写入对象的所述一个并行单位是具有所述指定的第1块地址的并行单位。
10.根据权利要求8所述的计算机系统,其特征在于所述处理器是构成为:
查阅所述第1表,获取映射到所述第1逻辑地址的所述第1物理地址,
将指定所述第1物理地址的读取请求发送到所述储存装置。
11.根据权利要求8所述的计算机系统,其特征在于所述处理器是构成为:
在通过所述储存装置将所述第1数据从旧物理存储位置复制到新物理存储位置之后,从所述储存装置接收所述第1逻辑地址、表示所述旧物理存储位置的第2物理地址、及表示所述新物理存储位置的第3物理地址,
查阅所述第1表,获取映射到所述第1逻辑地址的当前的物理地址,
在所述第2物理地址与所述获取的当前的物理地址一致的情况下,在所述第1表中将所述第3物理地址映射到所述第1逻辑地址,
在所述第2物理地址与所述获取的当前的物理地址不一致的情况下,在所述第1表中维持所述当前的物理地址。
12.根据权利要求11所述的计算机系统,其特征在于所述处理器是构成为:在所述第1表中将所述第3物理地址映射到所述第1逻辑地址之后,将指定所述第2物理地址的第1指令发送到所述储存装置,由此,对所述储存装置指示应使与所述第2物理地址对应的数据无效化。
13.一种储存装置的控制方法,其特征在于由对包括分别包含多个块的多个非易失性存储器芯片和控制器的储存装置进行控制的计算机系统执行,且包括以下步骤:
将指定用于识别应写入的第1数据的第1逻辑地址与所述第1数据的长度的写入请求发送到所述储存装置;
从所述储存装置接收第1物理地址、及所述第1逻辑地址,所述第1物理地址表示由所述储存装置从除不良块以外的块中选择为用于所述第1数据的写入目标块的第1块、及写入了所述第1数据的所述第1块内的第1物理存储位置这两者;以及
在管理各逻辑地址与所述储存装置的各物理地址之间的映射的第1表中将所述第1物理地址映射到所述第1逻辑地址。
14.根据权利要求13所述的储存装置的控制方法,其特征在于还包括以下步骤:
查阅所述第1表,获取映射到所述第1逻辑地址的所述第1物理地址;以及
将指定所述第1物理地址的读取请求发送到所述储存装置。
15.根据权利要求13所述的储存装置的控制方法,其特征在于还包括以下步骤:
在通过所述储存装置将所述第1数据从旧物理存储位置复制到新物理存储位置之后,从所述储存装置接收所述第1逻辑地址、表示所述旧物理存储位置的第2物理地址、及表示所述新物理存储位置的第3物理地址;
查阅所述第1表,获取映射到所述第1逻辑地址的当前的物理地址;
在所述第2物理地址与所述获取的当前的物理地址一致的情况下,在所述第1表中将所述第3物理地址映射到所述第1逻辑地址;及
在所述第2物理地址与所述获取的当前的物理地址不一致的情况下,在所述第1表中维持所述当前的物理地址。
16.根据权利要求15所述的储存装置的控制方法,其特征在于还包括以下步骤:在所述第1表中将所述第3物理地址映射到所述第1逻辑地址之后,将指定所述第2物理地址的第1指令发送到所述储存装置,由此,对所述储存装置指示应使与所述第2物理地址对应的数据无效化。
CN201810887535.3A 2017-10-30 2018-08-06 计算机系统及储存装置的控制方法 Pending CN109725848A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2017-209344 2017-10-30
JP2017209344A JP7074454B2 (ja) 2017-10-30 2017-10-30 計算機システムおよび制御方法

Publications (1)

Publication Number Publication Date
CN109725848A true CN109725848A (zh) 2019-05-07

Family

ID=66243968

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810887535.3A Pending CN109725848A (zh) 2017-10-30 2018-08-06 计算机系统及储存装置的控制方法

Country Status (4)

Country Link
US (4) US10558563B2 (zh)
JP (1) JP7074454B2 (zh)
CN (1) CN109725848A (zh)
TW (3) TWI700586B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110609660A (zh) * 2019-09-10 2019-12-24 深圳忆联信息系统有限公司 Ssd阵列的主机端映射方法、装置、计算机设备及存储介质
CN111177091A (zh) * 2020-04-10 2020-05-19 深圳市思拓通信系统有限公司 基于xfs文件系统录像预分配存储方法、系统及存储介质
CN112650442A (zh) * 2019-10-11 2021-04-13 爱思开海力士有限公司 存储器系统、存储器控制器及操作方法
CN112711501A (zh) * 2020-12-30 2021-04-27 杭州国芯科技股份有限公司 采用NAND Flash作为存储器时坏块管理的方法
CN114942893A (zh) * 2021-02-17 2022-08-26 美光科技公司 物理存储器位置的反转刷新

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20190082513A (ko) * 2018-01-02 2019-07-10 에스케이하이닉스 주식회사 컨트롤러 및 그것의 동작방법
KR102524432B1 (ko) * 2018-04-09 2023-04-24 에스케이하이닉스 주식회사 메모리 시스템 및 메모리 시스템의 동작방법
KR102530369B1 (ko) * 2018-04-23 2023-05-10 에스케이하이닉스 주식회사 저장 장치 및 그 동작 방법
CN110658980B (zh) * 2018-06-29 2021-03-23 华为技术有限公司 数据处理方法及装置、存储系统
KR20210018570A (ko) * 2019-08-05 2021-02-18 에스케이하이닉스 주식회사 컨트롤러, 컨트롤러의 동작 방법 및 이를 포함하는 저장 장치
US11734175B2 (en) 2019-08-22 2023-08-22 SK Hynix Inc. Storage device and method of operating the same
KR20210076497A (ko) 2019-12-16 2021-06-24 에스케이하이닉스 주식회사 스토리지 장치 및 그 동작 방법
US20210064278A1 (en) * 2019-08-27 2021-03-04 Micron Technology, Inc. Managing attributes of memory components
US11762769B2 (en) 2019-09-20 2023-09-19 SK Hynix Inc. Memory controller based on flush operation and method of operating the same
EP4060720A4 (en) 2019-11-15 2023-08-16 Kioxia Corporation STORAGE DEVICE AND STORAGE SYSTEM
US11561870B2 (en) * 2020-03-30 2023-01-24 Kioxia Corporation SSD with compressed superblock mapping table
WO2021231234A1 (en) * 2020-05-12 2021-11-18 Google Llc Zero copy optimization for select * queries
US11561713B2 (en) * 2021-03-11 2023-01-24 Western Digital Technologies, Inc. Simplified high capacity die and block management
TWI805231B (zh) 2022-02-18 2023-06-11 慧榮科技股份有限公司 資料儲存裝置以及非揮發式記憶體控制方法
TWI802279B (zh) * 2022-02-18 2023-05-11 慧榮科技股份有限公司 資料儲存裝置以及非揮發式記憶體控制方法
TW202334821A (zh) 2022-02-18 2023-09-01 慧榮科技股份有限公司 資料儲存裝置以及非揮發式記憶體控制方法
TWI814590B (zh) * 2022-09-26 2023-09-01 慧榮科技股份有限公司 資料處理方法及對應之資料儲存裝置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102279712A (zh) * 2011-08-10 2011-12-14 北京百度网讯科技有限公司 一种适用于互联网存储系统的存储控制方法、系统和装置
CN102598019A (zh) * 2009-09-09 2012-07-18 弗森-艾奥公司 用于分配存储的设备、系统和方法
US20170168951A1 (en) * 2015-12-14 2017-06-15 Kabushiki Kaisha Toshiba Memory system and method for controlling nonvolatile memory
CN107168884A (zh) * 2016-03-08 2017-09-15 东芝存储器株式会社 存储系统、信息处理系统及非易失性存储器的控制方法

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6728851B1 (en) 1995-07-31 2004-04-27 Lexar Media, Inc. Increasing the memory performance of flash memory devices by writing sectors simultaneously to multiple flash memory devices
US6427186B1 (en) * 1999-03-30 2002-07-30 Frank (Fong-Long) Lin Memory, interface system and method for mapping logical block numbers to physical sector numbers in a flash memory, using a master index table and a table of physical sector numbers
JP5019567B2 (ja) * 2006-08-04 2012-09-05 ソニーモバイルコミュニケーションズ株式会社 メモリ管理方法および携帯端末装置
JP2008226040A (ja) 2007-03-14 2008-09-25 Hitachi Ltd 情報処理装置及びコマンド多重度制御方法
US20090013148A1 (en) * 2007-07-03 2009-01-08 Micron Technology, Inc. Block addressing for parallel memory arrays
JP4702387B2 (ja) * 2008-03-31 2011-06-15 Tdk株式会社 メモリコントローラ、メモリコントローラを備えるフラッシュメモリシステム、並びにフラッシュメモリの制御方法
JP5066209B2 (ja) * 2010-03-18 2012-11-07 株式会社東芝 コントローラ、データ記憶装置、及びプログラム
US9582431B2 (en) 2010-03-22 2017-02-28 Seagate Technology Llc Storage address space to NVM address, span, and length mapping/converting
JP5581256B2 (ja) 2011-03-28 2014-08-27 株式会社東芝 メモリシステム、コントローラ、およびメモリシステムの制御方法
JP5802804B2 (ja) * 2012-06-19 2015-11-04 株式会社東芝 制御プログラム、ホスト装置の制御方法、情報処理装置およびホスト装置
US20140181455A1 (en) * 2012-12-20 2014-06-26 Apple Inc. Category based space allocation for multiple storage devices
JP5918906B2 (ja) * 2012-12-28 2016-05-18 株式会社日立製作所 ストレージ装置及びストレージ制御方法
WO2014155668A1 (ja) * 2013-03-29 2014-10-02 株式会社 東芝 データの重複をハッシュテーブルに基づいて排除するためのストレージシステム、ストレージコントローラ及び方法
JP2014222528A (ja) * 2014-07-08 2014-11-27 株式会社東芝 メモリシステムおよび不揮発性メモリの制御方法
US10824553B2 (en) * 2015-04-24 2020-11-03 Toshiba Memory Corporation Memory device that controls timing of receiving write data from a host
JP2017045288A (ja) * 2015-08-27 2017-03-02 株式会社東芝 メモリシステム
US20170139616A1 (en) * 2015-11-17 2017-05-18 HGST Netherlands B.V. Method of decreasing write amplification factor and over-provisioning of nand flash by means of diff-on-write approach
JP6523193B2 (ja) 2016-03-08 2019-05-29 東芝メモリ株式会社 ストレージシステム、情報処理システムおよび制御方法
TWI645289B (zh) * 2017-10-31 2018-12-21 慧榮科技股份有限公司 資料儲存裝置以及非揮發式記憶體操作方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102598019A (zh) * 2009-09-09 2012-07-18 弗森-艾奥公司 用于分配存储的设备、系统和方法
CN102279712A (zh) * 2011-08-10 2011-12-14 北京百度网讯科技有限公司 一种适用于互联网存储系统的存储控制方法、系统和装置
US20170168951A1 (en) * 2015-12-14 2017-06-15 Kabushiki Kaisha Toshiba Memory system and method for controlling nonvolatile memory
CN107168884A (zh) * 2016-03-08 2017-09-15 东芝存储器株式会社 存储系统、信息处理系统及非易失性存储器的控制方法

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110609660A (zh) * 2019-09-10 2019-12-24 深圳忆联信息系统有限公司 Ssd阵列的主机端映射方法、装置、计算机设备及存储介质
CN112650442A (zh) * 2019-10-11 2021-04-13 爱思开海力士有限公司 存储器系统、存储器控制器及操作方法
CN112650442B (zh) * 2019-10-11 2024-01-26 爱思开海力士有限公司 存储器系统、存储器控制器及操作方法
CN111177091A (zh) * 2020-04-10 2020-05-19 深圳市思拓通信系统有限公司 基于xfs文件系统录像预分配存储方法、系统及存储介质
CN111177091B (zh) * 2020-04-10 2020-07-31 深圳市思拓通信系统有限公司 基于xfs文件系统录像预分配存储方法、系统及存储介质
CN112711501A (zh) * 2020-12-30 2021-04-27 杭州国芯科技股份有限公司 采用NAND Flash作为存储器时坏块管理的方法
CN112711501B (zh) * 2020-12-30 2023-04-25 杭州国芯科技股份有限公司 采用NAND Flash作为存储器时坏块管理的方法
CN114942893A (zh) * 2021-02-17 2022-08-26 美光科技公司 物理存储器位置的反转刷新
US11768633B2 (en) 2021-02-17 2023-09-26 Micron Technology, Inc. Inversion refresh of physical memory location

Also Published As

Publication number Publication date
TW202230136A (zh) 2022-08-01
JP7074454B2 (ja) 2022-05-24
US11151029B2 (en) 2021-10-19
TW202046116A (zh) 2020-12-16
TWI805323B (zh) 2023-06-11
US20230259452A1 (en) 2023-08-17
US20210406173A1 (en) 2021-12-30
US20200151091A1 (en) 2020-05-14
TWI765289B (zh) 2022-05-21
US11669444B2 (en) 2023-06-06
TW201917580A (zh) 2019-05-01
JP2019082817A (ja) 2019-05-30
US10558563B2 (en) 2020-02-11
US20190129841A1 (en) 2019-05-02
TWI700586B (zh) 2020-08-01

Similar Documents

Publication Publication Date Title
CN109725848A (zh) 计算机系统及储存装置的控制方法
US11467955B2 (en) Memory system and method for controlling nonvolatile memory
CN109725846A (zh) 存储器系统及控制方法
CN110515862A (zh) 存储器系统及非易失性存储器的控制方法
CN109726139A (zh) 存储器系统及控制方法
JP7353934B2 (ja) メモリシステムおよび制御方法
CN114372007A (zh) 存储器系统及控制非易失性存储器的控制方法
US11662952B2 (en) Memory system and method of controlling nonvolatile memory and for reducing a buffer size
JP2021033849A (ja) メモリシステムおよび制御方法
JP7381678B2 (ja) メモリシステム
JP7392080B2 (ja) メモリシステム
JP7204020B2 (ja) 制御方法
JP7167295B2 (ja) メモリシステムおよび制御方法
JP2022179798A (ja) メモリシステムおよび制御方法
JP2023021450A (ja) メモリシステム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information
CB02 Change of applicant information

Address after: Tokyo

Applicant after: TOSHIBA MEMORY Corp.

Address before: Tokyo

Applicant before: Pangea Co.,Ltd.

Address after: Tokyo

Applicant after: Kaixia Co.,Ltd.

Address before: Tokyo

Applicant before: TOSHIBA MEMORY Corp.

TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20220221

Address after: Tokyo

Applicant after: Pangea Co.,Ltd.

Address before: Tokyo

Applicant before: TOSHIBA MEMORY Corp.