JP2019174941A - ストレージ装置、コンピュータシステムおよびストレージ装置の動作方法 - Google Patents

ストレージ装置、コンピュータシステムおよびストレージ装置の動作方法 Download PDF

Info

Publication number
JP2019174941A
JP2019174941A JP2018059835A JP2018059835A JP2019174941A JP 2019174941 A JP2019174941 A JP 2019174941A JP 2018059835 A JP2018059835 A JP 2018059835A JP 2018059835 A JP2018059835 A JP 2018059835A JP 2019174941 A JP2019174941 A JP 2019174941A
Authority
JP
Japan
Prior art keywords
host device
garbage collection
storage
data
host
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2018059835A
Other languages
English (en)
Other versions
JP6901427B2 (ja
Inventor
謙一郎 吉井
Kenichiro Yoshii
謙一郎 吉井
徹也 砂田
Tetsuya Sunada
徹也 砂田
大典 岩井
Onori Iwai
大典 岩井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kioxia Corp
Original Assignee
Toshiba Memory Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Memory Corp filed Critical Toshiba Memory Corp
Priority to JP2018059835A priority Critical patent/JP6901427B2/ja
Priority to TW107123274A priority patent/TWI694330B/zh
Priority to CN201810839667.9A priority patent/CN110308863B/zh
Priority to US16/126,021 priority patent/US10747663B2/en
Publication of JP2019174941A publication Critical patent/JP2019174941A/ja
Priority to US16/921,296 priority patent/US11397675B2/en
Application granted granted Critical
Publication of JP6901427B2 publication Critical patent/JP6901427B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F12/00Accessing, addressing or allocating within memory systems or architectures
    • G06F12/02Addressing or allocation; Relocation
    • G06F12/0223User address space allocation, e.g. contiguous or non contiguous base addressing
    • G06F12/023Free address space management
    • G06F12/0253Garbage collection, i.e. reclamation of unreferenced memory
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F12/00Accessing, addressing or allocating within memory systems or architectures
    • G06F12/02Addressing or allocation; Relocation
    • G06F12/0223User address space allocation, e.g. contiguous or non contiguous base addressing
    • G06F12/023Free address space management
    • G06F12/0238Memory management in non-volatile memory, e.g. resistive RAM or ferroelectric memory
    • G06F12/0246Memory management in non-volatile memory, e.g. resistive RAM or ferroelectric memory in block erasable memory, e.g. flash memory
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/061Improving I/O performance
    • G06F3/0611Improving I/O performance in relation to response time
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/0614Improving the reliability of storage systems
    • G06F3/0616Improving the reliability of storage systems in relation to life time, e.g. increasing Mean Time Between Failures [MTBF]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0638Organizing or formatting or addressing of data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0646Horizontal data movement in storage systems, i.e. moving data in between storage devices or systems
    • G06F3/0652Erasing, e.g. deleting, data cleaning, moving of data to a wastebasket
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/0671In-line storage system
    • G06F3/0673Single storage device
    • G06F3/0679Non-volatile semiconductor memory device, e.g. flash memory, one time programmable memory [OTP]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2212/00Indexing scheme relating to accessing, addressing or allocation within memory systems or architectures
    • G06F2212/10Providing a specific technical effect
    • G06F2212/1041Resource optimization
    • G06F2212/1044Space efficiency improvement
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2212/00Indexing scheme relating to accessing, addressing or allocation within memory systems or architectures
    • G06F2212/72Details relating to flash memory management
    • G06F2212/7205Cleaning, compaction, garbage collection, erase control

Abstract

【課題】適切でない状況下で実行中のガベッジコレクションを適応的に停止することができるストレージ装置を提供する。【解決手段】実施形態によれば、ストレージ装置は、インタフェースを介してホスト装置と接続可能であり、データの上書きを行えない不揮発性記憶媒体と、コントローラとを具備する。コントローラは、ホスト装置と接続された場合に要求され得る不揮発性記憶媒体に対するデータの書き込みまたは読み出しを制御する。コントローラは、ガベッジコレクション処理部と、ガベッジコレクション制御部とを具備する。ガベッジコレクション処理部は、不揮発性記憶媒体上の不要となったデータが残存する記憶領域を再利用するためのガベッジコレクションを実行する。ガベッジコレクション制御部は、ストレージ装置が閾値以下の負荷状態の場合、ガベッジコレクション処理部が実行中のガベッジコレクションを停止する。【選択図】図2

Description

本発明の実施形態は、ストレージ装置、コンピュータシステムおよびストレージ装置の動作方法に関する。
NANDフラッシュメモリを主たる不揮発性記憶媒体とするSSD(Solid State Drive)と呼ばれるストレージ装置では、NANDフラッシュメモリ上の不要となったデータが残存する記憶領域を再利用するためのガベッジコレクション(GC:Garbage Collection)と呼ばれる処理が必要となる。
米国特許出願公開第2017/0177469号明細書
GCは、ストレージ装置と当該ストレージ装置を用いるホスト装置とによって構成されるコンピュータシステムにおいて適切な状況下で実行されることが好ましい。
本発明が解決しようとする課題は、適切でない状況下で実行中のGCを適応的に停止することができるストレージ装置、コンピュータシステムおよびストレージ装置の動作方法を提供することである。
実施形態によれば、ストレージ装置は、インタフェースを介してホスト装置と接続可能であり、不揮発性記憶媒体と、コントローラとを具備する。不揮発性記憶媒体は、データを書き込み済みの記憶領域へのデータの上書きを行うことができない。コントローラは、ホスト装置と接続された場合にホスト装置から受信し得るホスト装置からの要求に応じて不揮発性記憶媒体へのデータの書き込みまたは不揮発性記憶媒体からのデータの読み出しを制御する。コントローラは、ガベッジコレクション処理部と、ガベッジコレクション制御部とを具備する。ガベッジコレクション処理部は、不揮発性記憶媒体上の不要となったデータが残存する記憶領域を再利用するためのガベッジコレクションを実行する。ガベッジコレクション制御部は、ストレージ装置が閾値以下の負荷状態の場合、ガベッジコレクション処理部が実行中のガベッジコレクションを停止する。
第1実施形態のコンピュータシステムの一例を示す図。 第1実施形態のストレージ装置の詳細な構成の一例を示す図。 NANDフラッシュメモリのブロックの構成および状態を例示する図。 ガベッジコレクションの概要を説明するための図。 第1実施形態のストレージ装置のGCに関わる処理手順を示すフローチャート。 第2実施形態のコンピュータシステムにおけるGCに関わるホスト装置とストレージ装置との連携を示すシーケンスチャート。 、NVMe(登録商標)で規定されるAdmin Commandのフォーマットを示す図。 第2実施形態のホスト装置のGCに関わる処理手順を示すフローチャート。 第2実施形態のストレージ装置のGCに関わる処理手順を示すフローチャート。 第3実施形態のストレージ装置のGCに関わる処理手順を示すフローチャート。 第4実施形態のコンピュータシステムにおけるストレージ装置のGCに関わる処理手順を示すフローチャート。
以下、実施の形態について図面を参照して説明する。
(第1実施形態)
まず、第1実施形態について説明する。
図1は、本実施形態のコンピュータシステムの一例を示す図である。図1に示されるように、このコンピュータシステムは、ストレージ装置1と、このストレージ装置1をたとえばメインストレージとして用いるホスト装置2とから構成される。ストレージ装置1とホスト装置2とは、信号線3によって接続される。ストレージ装置1は、ホスト装置2の筐体内に収納されるものであってもよいし、ホスト装置2に外部接続されるものであってもよい。ここでは、ストレージ装置1が、SSDとして実現されるものと想定する。
ストレージ装置1は、コントローラ11と、揮発性メモリ12と、不揮発性メモリ13とを有する。なお、揮発性メモリ12は、コントローラ11内に設けられてもよい。つまり、揮発性メモリ12を有しない構成も考えられ得る。
コントローラ11は、ホスト装置2からのコマンドを受け付け、揮発性メモリ12をバッファとして使用しながら、不揮発性メモリ13へのデータの書き込み、不揮発性メモリ13からのデータの読み出しを行う処理回路である。コントローラ11は、たとえばCPU(Central Processing Unit)を内蔵するSoC(System on Chip)である。不揮発性メモリ13の所定の領域には、ストレージ装置1に目的の動作を行わせるためのプログラムが格納されている。このプログラムは、たとえばストレージ装置1の起動時やリセット時などに、その一部または全部が揮発性メモリ12にロードされ、コントローラ11内のCPUによって実行される。
揮発性メモリ12は、たとえばDRAM(Dynamic RAM[Random Access Memory])である。また、SSDとして実現されることが想定されるストレージ装置1における不揮発性メモリ13は、NANDフラッシュメモリである。なお、ここでは、ストレージ装置1がSSDとして実現されるものと想定するが、これに限らず、データを書き込み済みの記憶領域へのデータの上書きを行うことができない(NANDフラッシュメモリ以外の)メモリを不揮発性メモリ13として有し、GCを必要とするものであればよい。
一方、ホスト装置2は、PC(Personal Computer)やサーバなどの情報処理装置である。ホスト装置2は、プロセッサ21と、主メモリ22と、入力装置23と、表示装置24と、ストレージインタフェースコントローラ25とを有する。
プロセッサ21は、ホスト装置2内のコンポーネントの制御を司る処理回路である。プロセッサ21は、ストレージ装置1から各種プログラムを主メモリ22へロードして実行する。各種プログラムの中には、第2実施形態において説明する、ステータス通知部201を有するストレージ管理プログラム200が含まれる。主メモリ22には、各種プログラムによって用いられるユーザデータ210も一時的に格納される。ユーザデータ210の中には、ストレージ装置1へ書き込むデータや、ストレージ装置1から読み出したデータが含まれる。
入力装置23は、たとえば、キーボードやマウスなどである。表示装置24は、ディスプレイである。入力装置23および表示装置24の一方または両方は、ホスト装置2に外部接続されるものであってもよい。また、入力装置23は、(キーボードやマウスなどを含む)外部機器との間で有線または無線の通信を実行する通信装置であってもよい。
ストレージインタフェースコントローラ25は、ストレージ装置1との間で信号線3を介した通信を実行するデバイスである。ここで、ストレージ装置1とホスト装置2との間の接続や通信プロトコルについて説明する。
ホスト装置2は、ストレージ装置1に対して、信号線3を介して、データの読み書きを含むデータ処理の要求、状態変化の要求、統計情報の要求などを送る。一方、ストレージ装置1は、ホスト装置2に対して、信号線3を介して、データ処理の結果、状態変化の結果、自装置の統計情報などのホスト装置2からの要求に対する返答を送る。様々なホスト装置2とストレージ装置1とを相互接続できるように、このような要求や返答を信号線3上で送る方法には、様々な標準規格が存在する。
たとえば、ホスト装置2とストレージ装置1との間で、信号線3上で情報を送受信するための標準規格には、PCI Express(PCIe)(登録商標)が存在する。また、たとえば、ホスト装置2とストレージ装置1との間で送受信される、前述の要求や返答の手続きやデータフォーマット等の標準規格には、Non-Volatile Memory Express(NVMe)(登録商標)が存在する。なお、本実施形態のコンピュータシステムにおいては、信号線3上で情報を送受信するための仕組みや、前述の要求や返答を送受信するための手続きやデータフォーマット等については、特定の規格を仮定しない。ここで説明されるGCに関する手法は、PCIe(登録商標)やNVMe(登録商標)をはじめ、様々な標準規格および標準規格以外の方法を用いた場合でも適用可能である。
さらに、ホスト装置2とストレージ装置1とは、物理的な信号線で接続されている必要はない。ホスト装置2とストレージ装置1とは、無線LAN(Local Area Network)等の物理的な信号線を伴わない方法で接続されていても構わない。つまり、ここで説明されるGCに関する手法は、ホスト装置2とストレージ装置1とが物理的な信号線を伴わない方法で接続されていても適用可能である。
図2は、ストレージ装置1の詳細な構成の一例を示す図である。
前述したように、ストレージ装置1は、コントローラ11と、揮発性メモリ12と、不揮発性メモリ13とを有する。コントローラ11は、ホストインターフェースコントローラ111、ホスト要求処理部112、データ制御部113、NANDインターフェースコントローラ114、Direct Memory Access Controller(DMAC)115、誤り訂正処理部116などを有している。また、ストレージ装置1は、揮発性メモリ12としてバッファメモリ12Aを有し、不揮発性メモリ13としてNANDフラッシュメモリ13Aを有している。前述したように、バッファメモリ12Aは、コントローラ11内に設けられてもよい。NANDフラッシュメモリ13Aは、並列的に動作可能な複数のNANDフラッシュメモリチップ131を備えている。つまり、ストレージ装置1は、理論的には、NANDフラッシュメモリ13Aへのデータの書き込みまたはNANDフラッシュメモリ13Aからのデータの読み出しを、最大で、NANDフラッシュメモリチップ131の数だけ並列的に実行することができる。
ホストインターフェースコントローラ111は、信号線3を介してホスト装置2から送信されたストレージ装置1に対する処理要求を受信し、ホスト要求処理部112に要求の内容を伝える。また、ホストインターフェースコントローラ111は、ホスト要求処理部112からの要求にしたがい、ホスト装置2からの処理要求に対する処理結果の返答を、信号線3を介してホスト装置2に送信する。さらに、ホストインターフェースコントローラ111は、DMAC115からの指示にしたがい、ホスト装置2からの書き込み要求対象のデータをホスト装置2側の主メモリ22から読み出してバッファメモリ12Aに書き込んだり、ホスト装置2からの読み出し要求対象のデータをバッファメモリ12Aから読み出してホスト装置2側の主メモリ22に書き込んだりする。
ホスト要求処理部112は、ホスト装置2から送信された処理要求をホストインターフェースコントローラ111から受信し、処理要求の内容を解釈し、処理要求の内容にしたがって、ストレージ装置1内部を制御する。ホスト要求処理部112は、たとえば、ホスト装置2からデータ読み出し要求を受信すると、データ制御部113に対してNANDフラッシュメモリ13Aから当該要求データをバッファメモリ12Aに読み出すように指示し、バッファメモリ12Aに読み出されたデータを、DMAC115を操作してホスト装置2側の主メモリ22に転送する。また、ホスト要求処理部112は、たとえば、ホスト装置2からデータ書き込み要求を受信すると、DMAC115を操作してホスト装置2側の主メモリ22から書き込みデータをバッファメモリ12Aに転送し、データ制御部113に対して、バッファメモリ12A内のデータをNANDフラッシュメモリ13Aに書き込むよう指示を出す。ホスト要求処理部112は、ホスト装置2から受信した要求の処理が完了したら、ホスト装置2に対して処理結果を送信する。このホスト装置2からの読み書き要求は、読み書き等の要求する処理の種類と、処理を要求するデータのサイズとを伴う。
さらに、ホスト要求処理部112は、GC制御部1121を有する。GC制御部1121は、ストレージ装置1があらかじめ定められた状況下でGCを実行中であった場合、当該実行中のGCを停止する。このGC制御部1121による、実行中のGCの停止については後述する。
ところで、ホスト要求処理部112およびホストインターフェースコントローラ111は、ホスト装置2から通知される処理要求(コマンド)を溜めておくことがある。たとえばNVMe(登録商標)では、複数のコマンドキューが存在すること、および各コマンドキューの最大の深さが規定されている。ストレージ装置1は、ホスト装置2から送信されたコマンドをすぐに処理できない場合に、このキューにコマンドを溜めておく。逆に、ホスト装置2は、ストレージ装置1へのコマンドを、その時点でストレージ装置1が実行可能かどうかに関わらず、このキューに空きがある限り、ストレージ装置1に送ることができる。なお、このコマンドキューは、ホスト要求処理部112およびホストインターフェースコントローラ111のどちらかに存在していてもよいし、これらの両方に存在していてもよい。
また、ストレージ装置1がホスト装置2から受信する要求は、データの読み書きだけではない。前述したように、たとえば、低消費電力状態への状態変化の要求、総書き込みデータ量や総読み出しデータ量といった統計情報の要求などを受信することもある。統計情報の要求などは、NVMe(登録商標)が定義しているものもある。これらの要求を受信したホスト要求処理部112は、データ制御部113に具体的な処理を要求して、所望の処理を実現する。
データ制御部113は、ストレージ装置1内に格納されているデータの管理およびNANDフラッシュメモリ13Aに対するアクセスの制御を行う。具体的には、データ制御部113は、ホスト装置2からの読み書き要求時に指定されるLBA(Logical Block Address)と、そのLBAに対応する最新データが格納されているNANDフラッシュメモリ13A内の位置情報との組を保持している。このNANDフラッシュメモリ13A内の位置情報のことを、NAND物理アドレス(NAND Physical Address:NPA)と呼ぶことにする。また、データ制御部113が管理する、LBAとNPAとの対応関係の表のことを、論物変換テーブルと呼ぶことにする。
次に、論物変換テーブルの更新が発生する、ストレージ装置1のデータ書き込み時の処理について説明する。
ホスト装置2からストレージ装置1に対してデータの書き込み要求が送られた場合、ストレージ装置1は、次のように処理を行う。
ホスト装置2からデータの書き込み要求を送られたストレージ装置1は、まず、ホスト要求処理部112が、ホストインターフェースコントローラ111経由でこの書き込み要求を受信する。この書き込み要求には、書き込み先LBA領域の先頭LBAと、書き込みサイズと、書き込むデータが格納されているホスト装置2側の主メモリ22の先頭アドレスが含まれている。
そこで、ホスト要求処理部112は、DMAC115を操作して、指定されるホスト装置2側の主メモリ22の先頭アドレスから、指定される書き込みサイズのデータをバッファメモリ12Aに転送する。そして、ホスト要求処理部112は、データ制御部113に対して、バッファメモリ12A内のデータをNANDフラッシュメモリ13Aに書き込むよう指示を出す。
なお、ホスト要求処理部112は、ホスト装置2から受信した書き込み要求に対する返答を、書き込みを要求されたデータをすべてバッファメモリ12Aに転送し終わった時点でホスト装置2に送信してもよいし、書き込みを要求されたデータをすべてNANDフラッシュメモリ13Aに書き終えた時点でホスト装置2に送信してもよい。
ホスト要求処理部112からデータのNANDフラッシュメモリ13Aへの書き込み要求を受領したデータ制御部113は、当該データをNANDフラッシュメモリ13AのどのNPAに書き込むかを決定し、必要に応じて誤り訂正処理部116を操作して、当該データから符号化したデータを作成し、NANDインターフェースコントローラ114を操作して、符号化したデータをNANDフラッシュメモリ13Aに書き込む。
データ制御部113は、この符号化したデータをNANDフラッシュメモリ13Aに書き込んだ後に、そのデータのLBAと、そのデータから作成した符号化したデータを書き込んだNPAとを対応付けて、論物変換テーブルに記録する。
もし、この論物変換テーブルに、そのLBAと、そのLBAに対応する古いデータが記録されているNPAとの組が記録されていた場合、データ制御部113は、そのエントリを新しいNPAで更新する。このようにして、論物変換テーブルの内容は、LBAとNPAとの対応関係が常に最新になるように管理される。
また、データ制御部113は、NANDフラッシュメモリ13Aの状態に応じてGCを実行するGC処理部1131を有する。次に、GCの処理内容について説明する。
前述の通り、ストレージ装置1は、ホスト装置2から受信した書き込み要求のデータをNANDフラッシュメモリ13Aに書き込んでいく。また、NANDフラッシュメモリ13Aは、一旦データを書きこんだ記憶領域を再利用するためには、ブロックと呼ばれる単位でデータの消去処理が必要である。
つまり、ストレージ装置1は、ホスト装置2からのデータ書き込み要求を処理し続けていくと、NANDフラッシュメモリ13A内に無効になったデータが残されたまま再利用できない記憶領域を多数保持することになる。そのままホストからのデータ書き込み要求を処理し続けていくと、最終的には、新たにデータを書き込む場所がなくなってしまい、データ書き込み要求を処理できなくなる。この状態を回避するために行う処理がGCである。
図3および図4を参照して、GCの概要を説明する。
図3は、NANDフラッシュメモリ13Aのブロックの構成および状態を例示する図である。ここでは、説明の簡略化のため、NANDフラッシュメモリ13Aのブロックが9つのページ(a〜i)から構成されている例を示している。また、たとえばページgのように、符号a1で示されるハッチングが施されていないページ(g,h,i)は、空きページであることを示している。一方、たとえばページaのように、符号a2で示される形状のハッチングが施されているページ(a,e,f)は、有効データを記録したページであることを示し、たとえばページdのように、符号a3で示される形状のハッチングが施されているページ(b,c,d)は、無効データを記録したページであることを示している。
一方、図4は、(NANDフラッシュメモリ13Aのブロックが図3に示すように構成されており、かつ、ブロック内の各ページの状態が図3と同様に示されていることを前提として)GCの概要を説明するための図である。
NANDフラッシュメモリ13Aのブロックが図4(A)に示す状態にある場合、ストレージ装置1は、次にホスト装置2から受信したデータ書き込み要求について、ブロック3のページgにデータを書き込む。また、ブロック1とブロック2とは、既に全てのページがデータで埋まっていて、これら2つのブロックには、そのままではデータを書きこむことはできない。したがって、このままでは、ホスト装置2からのデータ書き込み要求を処理できなくなる。
そこで、ストレージ装置1は、図4(B)に示すように、ブロック1とブロック2とに記録されているデータのうち、有効なデータを一旦NANDフラッシュメモリ13Aから読み出して、ブロック1とブロック2との全データを消去し、一旦読み出した有効データをブロック2に書き戻す。なお、図4(B)中、たとえば「1−a」は、「ブロック1のページa」を示している。
すると、NANDフラッシュメモリ13Aのブロックの状態は、図4(C)に示すようになり、ブロック1が空きブロックとして再利用可能な状態となる。このようにして空きブロックを作り出すのがGCである。
このように、GCは、有効なデータをNANDフラッシュメモリ13Aから読み出す処理と、再度NANDフラッシュメモリ13Aに書きこむ処理とで構成される。より詳しくは、NANDフラッシュメモリ13Aから読み出すデータを決める処理と、前述の2つの処理とで構成される。すなわち、GCを行っている最中は、NANDフラッシュメモリ13Aは、ホスト装置2からの書き込みまたは読み出し要求に基づく処理を行うことができない。
より具体的に言えば、図2のNANDインターフェースコントローラ114とNANDフラッシュメモリ13Aをつなぐ信号線や、バッファメモリ12AがGCのために使用される。また、データ制御部113は、NANDフラッシュメモリ13A内のどのデータをGCにおけるコピー対象とするかの判断処理等を行う。さらに、GCを行うことで、論物変換テーブルの内容が変化する。なぜなら、GCによるデータコピーによって、あるLBAに対応する最新データが記録されているNPAが変わるからである。
以上の通り、GCは、NANDフラッシュメモリ13Aを占有し、バッファメモリ12Aやデータ制御部113などのストレージ装置1内のリソースを消費し、さらに論物変換テーブルの内容が変化する。
従来は、このような理由から、GCを、ストレージ装置1がホスト装置2からデータ読み出しや書き込み要求を受信していない「暇な時」に行うことで、ホスト装置2からのデータ読み出しや書き込み要求を邪魔しないようにしていた。しかし、この「暇な時」にGCを行うことは、前述の通り、ストレージ装置1内部の状態を変化させてしまう。このことは、結局、ホスト装置2からのデータ読み出しや書き込み要求を邪魔してしまうことがある。
たとえば、GCのためにNANDフラッシュメモリ13Aからのデータ読み出しやNANDフラッシュメモリ13Aへのデータの書き込みの最中にホスト装置2からコマンドを受信した場合、このデータの読み出しや書き込みが完了するまで、当該コマンドの処理を開始することができない。これは、ホスト装置2から見たコマンド処理時間が長くなる原因となる。
また、GCによって論物変換テーブルの内容が変化することは、当該変化した論物変換テーブルの内容を不揮発化しなければならないことを意味する。これは、ストレージ装置1としては不安定な状態にあることを示す。
さらに、本来、GCは、ホスト装置2からの書き込み要求の存在に合わせて行われるべき処理であり、「暇な時」にあらかじめ行ったGCは、実は無駄なGCである可能性もある。これは、ストレージ装置1の寿命を縮める可能性がある。
以上の通り、ストレージ装置1が「暇な時」にGCを行うことはデメリットが多い。
一方、GCを行ってよいかどうかをホスト装置2からストレージ装置1に指定する仕組みが存在する。
しかし、前述の通り、GCはストレージ装置1が自身の内部状態を参照して行う処理である。また、ホスト装置2がGCの実行を指示した時がストレージ装置1にとって「暇な時」とは限らない。たとえば、「暇な時」にGCを行うことをポリシーとするストレージ装置1の場合、ホスト装置2がストレージ装置1にGCの実行を指示しても、ストレージ装置1がホスト装置2からのコマンドを処理している最中の場合、GCを行うことができない。
したがって、ホスト装置2からストレージ装置1でのGCの実行を指示する仕組みよりも、ストレージ装置1自身がGCを行う時を選択したほうが効率は良い。
以上の状況を鑑み、本実施形態では、ストレージ装置1自身が暇かどうかを判断し、暇な時にはGCを行わないようにする。
ストレージ装置1が暇かどうかは、たとえば、ストレージ装置1のホストインターフェースコントローラ111またはホスト要求処理部112が備えるコマンドキューに溜まっているコマンドの数がある閾値(第1閾値[第1値])以下であるかどうかで判断することが考えられる(第1条件)。この第1閾値としては、ストレージ装置1が備えるNANDフラッシュメモリ13AのNANDフラッシュメモリチップ131の数とすることが考えられる。なぜなら、1つのホストコマンドを処理するためには最低1つのNANDフラッシュメモリチップ131を動作させる必要があるため、キューに溜まっているコマンド数がNANDフラッシュメモリチップ131の数より少ない場合には、当該コマンド群の処理は、ストレージ装置1に負荷をかけずに実行できる可能性が高いからである。
また、たとえば、ストレージ装置1が処理中のコマンドの数がある閾値(第2閾値[第2値])以下であるかどうかで判断することも考えられる(第2条件)。この第2閾値としても、第1閾値と同様に、ストレージ装置1が備えるNANDフラッシュメモリ13AのNANDフラッシュメモリチップ131の数を用いることが考えられる。
さらに、たとえば、ストレージ装置1内のキューに溜まっているコマンドの総読み書きデータサイズがある閾値(第3閾値[第3値])以下であるかどうかで判断することも考えられる(第3条件)。この第3閾値としては、ストレージ装置1が備えるバッファメモリ12Aのサイズとすることが考えられる。なぜなら、ストレージ装置1がホスト装置2との間で読み書き対象のデータをやり取りするためにはバッファメモリ12Aが必要であり、キューに溜まっているコマンドに関するデータの総サイズがバッファメモリ12Aのサイズ以下であれば、当該コマンド群の処理はストレージ装置1に負荷をかけずに実行できる可能性が高いからである。前述したように、ホスト装置2からの読み書き要求は、読み書き等の要求する処理の種類と、処理を要求するデータのサイズとを伴うので、キューに溜まっているコマンドの総読み書きデータサイズを得ることは可能である。
すなわち、本実施形態のストレージ装置1は、要求される性能を発揮し得る閾値以下の負荷状態の場合、GCを行わないようにする。より詳しくは、そのような状況下でGCが実行されていたならば、その処理を停止(中断または終了)する。つまり、ここでのストレージ装置1が「暇な時」とは、従来のような、ストレージ装置1がホスト装置2からデータ読み出しや書き込み要求を受信していない時ではなく、ストレージ装置1が(要求される性能を発揮し得る)閾値以下の負荷状態の時である。前述したように、GCは、データ制御部113のGC処理部1131によって実行される。そして、ホスト要求処理部112のGC制御部1121は、前述の判断を行い、データ制御部113のGC処理部1131が実行中のGCを適応的に停止する。また、ホスト要求処理部112のGC制御部1121は、データ制御部113のGC処理部1131が実行していたGCを停止したことを記憶しておき、さらに、当該停止中のGCを適応的に再開することができる。より詳しくは、ホスト要求処理部112のGC制御部1121は、ストレージ装置1が暇ではなくなった時、GCが停止中ならば、当該停止中のGCを再開する。
なお、ストレージ装置1が暇かどうかの判断には、例示した複数の閾値(第1閾値、第2閾値、第3閾値)、換言すれば、複数の条件(第1条件、第2条件、第3条件)の任意の組み合わせで定義しても構わない。
ストレージ装置1は、このようにして定義した判断基準に従ってチェックを行い、ストレージ装置1が暇であると判断した場合、以降、GCを行わない。もし、GCを実行中に「ストレージ装置1が暇である」と判断した場合、速やかに処理を停止する。以下、速やかに処理を停止する例をいくつか説明する。
図3および図4を用いて説明したように、GCは、(A)NANDフラッシュメモリ13Aから読み出すデータを決める処理[第1工程]、(B)NANDフラッシュメモリ13Aからデータを読み出す処理[第2工程]、(C)読み出したデータをNANDフラッシュメモリ13Aに書き込む処理[第3工程]の3つの工程に分割することができる。
図4に示したように、ブロック丸ごとを処理単位とすると、1つの例では、(A)の処理の所要時間は数ミリ秒程度、(B)の処理の所要時間は20ミリ秒程度、(C)の処理の所要時間は100ミリ秒程度である。一方、ホスト装置2から要求されたデータのNANDフラッシュメモリ13Aからの読み出しの所要時間は数10マイクロ秒程度である。つまり、(A)+(B)+(C)の総所要時間はとても長く、1ブロック分の処理を完了させてからGCを停止するのは速やかではないといえる。
そこで、本実施形態のストレージ装置1は、実行中の工程の処理を完了させた時点でGCを停止する。つまり、(A)を処理中であれば(B)には進まず、(B)を処理中であれば(C)には進まないようにする。
また、(A)〜(C)をブロック単位ではなく、ページ単位(第1使用単位)で巡回的に行っていくことも考えられ得る。つまり、1ブロック分まとめて(B)の処理でデータを読み出すのではなく、1ページ分のデータを(B)の処理で読み出したら(C)の処理で書き込むということを繰り返すことも考えられ得る。なお、この場合、図4に示したように、たとえばブロック1およびブロック2から読み出した有効なデータを(データ消去後の)当該ブロック1およびブロック2の一方に書き戻すのではなく、当該ブロック1およびブロック2以外の空きブロックに書き戻すことになる。(A)〜(C)をページ単位にすると、1つの例では、(A)の処理の所要時間は1ミリ秒程度、(B)の処理の所要時間は数ミリ秒程度、(C)の処理の所要時間も数ミリ秒程度となる。
そして、この場合、本実施形態のストレージ装置1は、仕掛かり中のページについては(C)の処理までやり切って、そのページについての処理を完了させた時点でGCを停止する。これにより、より迅速にGCを停止させることができる。
もちろん、「ストレージ装置1が暇である」と判断したことに起因してGCを停止させるタイミングとして、仕掛かり中のブロックについての処理を完了させた時点を採用してもよく、本実施形態のストレージ装置1は、これを排除するものではない。
図5は、本実施形態のストレージ装置1のGCに関わる処理手順を示すフローチャートである。なお、ストレージ装置1は、図5に示される動作を、ホスト装置2からコマンドを受信する度に行っても構わないし、ホスト装置から受信したコマンドの処理が完了する度に行っても構わない。つまり、ストレージ装置1が図5に示される動作を行うタイミングは、特に限定されない。
まず、ストレージ装置1は、前述したような判断基準によって、ストレージ装置1が暇かどうかをチェックする(ステップA1)。チェックの結果、ストレージ装置1が暇であると判断された場合(ステップA2:YES)、ストレージ装置1は、次に、GCを実行中かどうかチェックする(ステップA3)。そして、GC実行中だった場合(ステップA3:YES)、ストレージ装置1は、速やかにGCを停止(中断または終了)する(ステップA4)。速やかにGCを停止することについては、前述したいくつかの例の中のいずれを採用しても構わない。
GC実行中ではなかった場合(ステップA3:NO)またはGC実行中でGC停止が完了したら、ストレージ装置1は、内部状態が変化しているかどうかをチェックする(ステップA5)。換言すれば、ストレージ装置1は、内部状態の不揮発化が必要かどうかをチェックする。この内部状態とは、たとえば前述の論物変換テーブルの内容などである。
内部状態が変化していなかった場合(ステップA5:NO)、ストレージ装置1は、この図5の処理を終了する。内部状態が変化していた場合(ステップA5:YES)、ストレージ装置1は、変化した内部状態を不揮発化し(ステップA6)、図5の処理を終了する。なお、不揮発化とは、NANDフラッシュメモリ13Aへの書き込みを意味する。
また、ストレージ装置1は暇ではないと判断された場合(ステップA2:NO)、ストレージ装置1は、次に、GCを停止中かどうかチェックする(ステップA7)。GC停止中だった場合(ステップA7:YES)、ストレージ装置1は、GCを再開する(ステップA8)。GC停止中でない場合には(ステップA7:NO)、ストレージ装置1は、そのまま図5の処理を終了する。
以上のような処理手順により、ストレージ装置1は、「暇な時」にGCを行わないことを実現できる。「暇な時」にGCを行わないことによって、ホスト装置2から見たコマンド処理時間を短くすることや、ストレージ装置1が長期にわたって不安定な状態にあることを避けることや、不必要にストレージ装置1の寿命を縮めることなどをなくすことができる。
(第2実施形態)
次に、第2実施形態について説明する。なお、前述した第1実施形態と同一の構成要素については同一の符号を使用し、重複した説明を省略する。
第1実施形態では、ストレージ装置1が、ストレージ装置1自身が暇であるかどうかを判断して、ストレージ装置1が暇な時にGCを実行しないことで、様々な効果を奏することを示した。一方、前述の通り、ホスト装置2からストレージ装置1に対しては、読み書き要求だけでなく、様々な要求や通知を行うことができる。
そこで、本実施形態のコンピュータシステムにおいては、ホスト装置2が暇(低負荷状態[第1状態])かどうかの状態に応じて、ストレージ装置1が、第1実施形態において説明した前述の図5で示される処理を行うようにする。そのために、ホスト装置2は、ステータス通知部201を有するストレージ管理プログラム200を具備する。ストレージ管理プログラム200は、ストレージ装置1と連携してGCの実行可否を含むストレージ装置1の管理を行うための常駐プログラムであり、ステータス通知部201は、ホスト装置2の状態を取得する処理と、ホスト装置2の状態を示す通知をストレージ装置1に送信する処理とを実行する。ホスト装置2が暇な時にストレージ装置1が図5で示される処理を行って、GCを停止すれば、システム全体として処理量が減り、システムの消費電力をより下げることができる。なお、ここでは、ホスト装置2がどのような状況下にある場合に暇であるとするかについては問わない。
図6は、本実施形態のコンピュータシステムにおけるGCに関わるホスト装置2とストレージ装置1との連携を示すシーケンスチャートである。
まず、ホスト装置2は、ホスト装置2の状態を示す通知、より詳しくは、ホスト装置2が暇かどうかを示す通知をストレージ装置1に対して送信する(図6:(1))。この通知には、たとえば、NVMe(登録商標)で規定されるAdmin Commandを用いることができる。図7を参照して、ホスト装置2の状態を示す通知への当該Admin Commandの一使用例を説明する。
図7は、Admin Commandのフォーマットを示している。
NVMe(登録商標)では、1コマンドが64バイトに定められている。また、符号b1で示される位置に格納されるOpecodeについて、”C0h”から”FFh”までがvendor specificであると定められている。さらに、(64バイトのコマンド以外の)データ転送を含まない場合はOpecodeのビット[1:0]を”00b”にすることが定められている。そこで、ホスト装置2の状態を示す通知に用いるコマンドのOpecodeとして、たとえば”C0h(11000000b)”を割り当てる(図7:b1)。そして、Opecodeが”C0h”の場合、たとえば符号b2で示されるCDW(Command DWord)2が、”0h”ならば「ホスト装置2は暇である」、”1h”ならば「ホスト装置2は暇ではない」という取り決めをする。これにより、ホスト装置2からストレージ装置1へホスト装置2の状態を示す通知を送信することができる。
図6に戻って説明を続ける。
ストレージ装置1は、ホスト装置2から送信される、ホスト装置2の状態を示す通知を受信すると、その通知の内容に基づき、実行中のGCを停止したり、停止中のGCを再開したりなどのGCの制御を行う(図6:(2))。
図8は、本実施形態のコンピュータシステムにおけるホスト装置2のGCに関わる処理手順を示すフローチャートである。なお、ここでは、ホスト装置2が、ホスト装置2の状態に変化が生じた場合にストレージ装置1への通知を行うことを想定しているが、これに限らず、たとえば一定間隔ごとにストレージ装置1への通知を行ってもよい。
ホスト装置2は、まず、ホスト装置2の負荷状態をチェックする(ステップB1)。次に、ホスト装置2は、低負荷状態から高負荷状態または高負荷状態から低負荷状態の変化が生じているかどうかを調べる(ステップB2)。
ホスト装置2の状態に変化が生じていた場合(ステップB2:YES)、ホスト装置2は、ホスト装置2の状態を示す通知をストレージ装置1へ送信し(ステップB3)、図8の処理を終了する。ホスト装置2の状態に変化が生じていない場合は(ステップB2:NO)、ホスト装置2は、そのまま図8の処理を終了する。
図9は、本実施形態のコンピュータシステムにおけるホスト装置2のGCに関わる処理手順を示すフローチャートである。
まず、ストレージ装置1は、ホスト装置2から送信される、ホスト装置2の状態を示す通知を受信する(ステップC1)。ストレージ装置1は、受領した通知の内容をチェックする(ステップC2)。
受領した通知の内容が、ホスト装置が暇であることを示すものであった場合(ステップC3:YES)、ストレージ装置1は、第1実施形態において説明した図5で示される処理を行う(ステップC4)。受領した通知の内容が、ホスト装置2が暇ではないことを示すものであった場合(ステップC3:NO)、ストレージ装置1は、図5で示される処理は行わない。
これにより、本実施形態のコンピュータシステムにおいては、ストレージ装置1だけでなく、ホスト装置2の状態も考慮した、システム全体の状態の最適化が可能となる。
(第3実施形態)
次に、第3実施形態について説明する。なお、前述した第1および第2実施形態と同一の構成要素については同一の符号を使用し、重複した説明を省略する。
第2実施形態では、ホスト装置2が暇な時に、ストレージ装置1が第1実施形態において説明した図5で示される処理を行うことを示した。しかし、ホスト装置2が暇ではない時でも、ストレージ装置1が暇になることはあり得る。たとえば、ホスト装置2が大量の計算処理をしている場合、ストレージ装置1へのアクセスは少なくても、ホスト装置2は暇ではない。
そこで、本実施形態のコンピュータシステムにおいては、ストレージ装置1は、ホスト装置2が暇ではないことを示す通知を受領した場合に、図5で示される処理を行うようにする。
図10は、本実施形態のコンピュータシステムにおけるストレージ装置のGCに関わる処理手順を示すフローチャートである。
まず、ストレージ装置1は、ホスト装置2から送信される、ホスト装置2の状態を示す通知を受信する(ステップD1)。ストレージ装置1は、受領した通知の内容をチェックする(ステップD2)。
受領した通知の内容が、ホスト装置が暇ではないことを示すものであった場合(ステップD3:YES)、ストレージ装置1は、第1実施形態において説明した図5で示される処理を行う(ステップD4)。受領した通知の内容が、ホスト装置2が暇であることを示すものであった場合(ステップD3:NO)、ストレージ装置1は、図5で示される処理は行わない。
これにより、本実施形態のコンピュータシステムにおいては、ストレージ装置1は、ホスト装置2の状態を把握した上で、自身の内部状態にしたがってGCの実行判断を行うことができ、より柔軟なシステムが実現できる。
(第4実施形態)
次に、第3実施形態について説明する。なお、前述した第1乃至第3実施形態と同一の構成要素については同一の符号を使用し、重複した説明を省略する。
第2実施形態と第3実施形態とでは、ホスト装置2が暇かどうかによって、ストレージ装置1内部でのGCを停止する処理(図5)を実行するかどうかを判断する方法をそれぞれ示した。ところで、ホスト装置2が暇な時間が多いかどうかは、システムの性質によって異なる。たとえば、PCは、おおよそ一人の人間が使うものであり、システムは暇な状態になることが多い。一方、サーバや科学技術計算向けシステムは、多数のユーザに同時に使用され、常に忙しく稼働していることが多い。また、ホスト装置2が暇な時間が多いかどうかは、ホスト装置2から送信される、前述のホスト装置2が暇かどうかを示す通知の履歴を取れば判断することができる。より詳しくは、一定期間においてホスト装置2が暇な時間の占める割合を算出し、当該算出した値があらかじめ定められる基準値を超えるかどうかで判断することができる。
そこで、本実施形態のコンピュータシステムにおいては、ストレージ装置1は、ホスト装置2が暇な時間が多い場合に図9の処理を、ホスト装置2が暇な時間が少ない場合に図10の処理を行うように、動的に切り替えるようにする。
図11は、本実施形態のコンピュータシステムにおけるストレージ装置1のGCに関わる処理手順を示すフローチャートである。
ストレージ装置1は、ホスト装置2から受信した、ホスト装置2の状態を示す通知の履歴に基づき、ホスト装置2が暇な時間が多いかどうかを判断する(ステップE1)。ホスト装置2が暇な時間が多いと判断された場合(ステップE2:YES)、ストレージ装置1は、ホスト装置2が暇な時に図5の処理を行うように、つまり、図9の処理が適用されるように設定する(ステップE3)。一方、ホスト装置2が暇な時間が少ないと判断された場合(ステップE2:NO)、ストレージ装置1は、ホスト装置2が暇ではない時に図5の処理を行うように、つまり、図10の処理が適用されるように設定する(ステップE4)。
なお、図11に示す手順とは逆に、ホスト装置2が暇な時間が多い場合に図10の処理が適用され、ホスト装置2が暇な時間が少ない場合に図9の処理が適用されるように設定することもできる。
どちらにするかは、空きブロックが十分に存在するかや、ストレージ装置1が寿命に近いかなどのストレージ装置1の状態に関する判断基準で選択することが考えられる。
以上のように、第1乃至第4実施形態のコンピュータシステムによれば、ストレージ装置1が暇な時にGCを行わないことで、ホスト装置2から見たコマンド処理時間を短くすることや、ストレージ装置1が長期にわたって不安定な状態にあることを避けることや、不必要にストレージ装置1の寿命を縮めることなどをなくすことができる。すなわち、適切でない状況下で実行されるGCを適応的に停止することができる。
本発明のいくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。
1…ストレージ装置、2…ホスト装置、3…信号線、11…コントローラ、12…揮発性メモリ、12A…バッファメモリ、13…不揮発性メモリ、13A…NANDフラッシュメモリ、21…プロセッサ、22…主メモリ、23…入力装置、24…表示装置、25…ストレージインタフェースコントローラ、111…ホストインターフェースコントローラ、112…ホスト要求処理部、113…データ制御部、114…NANDインターフェースコントローラ、115…DMAC、116…誤り訂正処理部、131…NANDフラッシュメモリチップ、200…ストレージ管理プログラム、201…ステータス通知部、1121…GC制御部、1131…GC処理部。

Claims (20)

  1. インタフェースを介してホスト装置と接続可能なストレージ装置であって、
    データを書き込み済みの記憶領域へのデータの上書きを行うことができない不揮発性記憶媒体と、
    前記ホスト装置と接続された場合に前記ホスト装置から受信し得る前記ホスト装置からの要求に応じて前記不揮発性記憶媒体へのデータの書き込みまたは前記不揮発性記憶媒体からのデータの読み出しを制御するコントローラと、
    を具備し、
    前記コントローラは、
    前記不揮発性記憶媒体上の不要となったデータが残存する記憶領域を再利用するためのガベッジコレクションを実行するガベッジコレクション処理部と、
    前記ストレージ装置が閾値以下の負荷状態の場合、前記ガベッジコレクション処理部が実行中の前記ガベッジコレクションを停止するガベッジコレクション制御部と、
    を具備するストレージ装置。
  2. 前記ガベッジコレクション制御部は、前記ストレージ装置内においてキューイングされている前記ホスト装置と接続された場合に前記ホスト装置から受信し得る前記ホスト装置によって発行されたコマンドの数が第1値以下の場合、前記ストレージ装置は前記閾値以下の負荷状態と判定する請求項1に記載のストレージ装置。
  3. 前記第1値は、前記不揮発性記憶媒体が備える並列的に動作可能な複数のメモリチップの数である請求項2に記載のストレージ装置。
  4. 前記ガベッジコレクション制御部は、前記ストレージ装置が処理中の前記ホスト装置と接続された場合に前記ホスト装置から受信し得る前記ホスト装置によって発行されたコマンドの数が第2値以下の場合、前記ストレージ装置は前記閾値以下の負荷状態と判定する請求項1に記載のストレージ装置。
  5. 前記第2値は、前記不揮発性記憶媒体が備える並列的に動作可能な複数のメモリチップの数である請求項4に記載のストレージ装置。
  6. 前記ガベッジコレクション制御部は、前記ストレージ装置内においてキューイングされている前記ホスト装置と接続された場合に前記ホスト装置から受信し得る前記ホスト装置によって発行されたコマンドによるデータの書き込みまたは読み出しの総データサイズが第3値以下の場合、前記ストレージ装置は前記閾値以下の負荷状態と判定する請求項1に記載のストレージ装置。
  7. 前記第3値は、前記不揮発性記憶媒体へ書き込むデータまたは前記不揮発性記憶媒体から読み出したデータが一時的に格納されるバッファメモリのサイズである請求項6に記載のストレージ装置。
  8. 前記ガベッジコレクション制御部は、前記ストレージ装置内においてキューイングされている前記ホスト装置と接続された場合に前記ホスト装置から受信し得る前記ホスト装置によって発行されたコマンドの数が第1値以下である第1条件、前記ストレージ装置が処理中の前記ホスト装置と接続された場合に前記ホスト装置から受信し得る前記ホスト装置によって発行されたコマンドの数が第2値以下である第2条件、および前記ストレージ装置内においてキューイングされている前記ホスト装置と接続された場合に前記ホスト装置から受信し得る前記ホスト装置によって発行されたコマンドによるデータの書き込みまたは読み出しの総データサイズが第3値以下である第3条件の中のあらかじめ定められた2以上の条件の一部または全部が満たされる場合、前記ストレージ装置は前記閾値以下の負荷状態と判定する請求項1に記載のストレージ装置。
  9. 前記ガベッジコレクションは、対象となっている記憶領域内から読み出すべきデータを決定する第1工程と、前記決定したデータを読み出す第2工程と、前記読み出したデータを書き戻す第3工程とを含み、
    前記ガベッジコレクション制御部は、前記ガベッジコレクション処理部が実行中の工程を完了させた時点で前記ガベッジコレクションの処理を停止する、
    請求項1に記載のストレージ装置。
  10. 前記ガベッジコレクションは、対象となっている記憶領域内から読み出すべきデータを決定する第1工程と、前記決定したデータを読み出す第2工程と、前記読み出したデータを書き戻す第3工程とを含み、
    前記ガベッジコレクション処理部は、前記第1工程乃至前記第3工程を、前記不揮発性記憶媒体の第1使用単位ごとに巡回的に実行し、
    前記ガベッジコレクション制御部は、前記ガベッジコレクション処理部が前記第1工程乃至前記第3工程を前記第1使用単位分完了させた時点で前記ガベッジコレクションの処理を停止する、
    請求項1に記載のストレージ装置。
  11. 前記ガベッジコレクション制御部は、前記ホスト装置と接続された場合に前記ホスト装置から受信し得る前記ホスト装置の状態を示す通知が、前記ホスト装置が第1状態であることを示す場合、前記ガベッジコレクション処理部が実行中の前記ガベッジコレクションを停止すべきか否かを決定するための前記ストレージ装置が前記閾値以下の負荷状態か否かの判定を行う請求項1に記載のストレージ装置。
  12. 前記ガベッジコレクション制御部は、前記ホスト装置と接続された場合に前記ホスト装置から受信し得る前記ホスト装置の状態を示す通知が、前記ホスト装置が第1状態でないことを示す場合、前記ガベッジコレクション処理部が実行中の前記ガベッジコレクションを停止すべきか否かを決定するための前記ストレージ装置が前記閾値以下の負荷状態か否かの判定を行う請求項1に記載のストレージ装置。
  13. 前記ガベッジコレクション制御部は、
    前記ホスト装置と接続された場合に前記ホスト装置から受信し得る前記ホスト装置の状態を示す通知の履歴に基づき、前記ホスト装置が第1状態にある期間的な割合を算出し、
    前記算出した割合が基準値を超える場合、前記ガベッジコレクション処理部が実行中の前記ガベッジコレクションを停止すべきか否かを決定するための前記ストレージ装置が前記閾値以下の負荷状態か否かの判定を、前記ホスト装置が前記第1状態であることを示す前記通知を前記ホスト装置から受信した場合に行い、
    前記算出した割合が前記基準値以下の場合、前記ガベッジコレクション処理部が実行中の前記ガベッジコレクションを停止すべきか否かを決定するための前記ストレージ装置が前記閾値以下の負荷状態か否かの判定を、前記ホスト装置が前記第1状態でないことを示す前記通知を前記ホスト装置から受信した場合に行う、
    請求項1に記載のストレージ装置。
  14. ホスト装置と、データを書き込み済みの記憶領域へのデータの上書きを行うことができない不揮発性記憶媒体を有し、前記ホスト装置からの要求に応じて前記不揮発性記憶媒体へのデータの書き込みまたは前記不揮発性記憶媒体からのデータの読み出しを実行するストレージ装置とによって構成されるコンピュータシステムであって、
    前記ホスト装置は、前記ホスト装置の状態を示す通知を前記ストレージ装置へ送信するステータス通知部を具備し、
    前記ストレージ装置は、
    前記不揮発性記憶媒体上の不要となったデータが残存する記憶領域を再利用するためのガベッジコレクションを実行するガベッジコレクション処理部と、
    前記通知を前記ホスト装置から受信した場合、前記ストレージ装置が閾値以下の負荷状態か否かを判定し、前記ストレージ装置が前記閾値以下の負荷状態の場合、前記ガベッジコレクション処理部が実行中の前記ガベッジコレクションを停止するガベッジコレクション制御部と、
    を具備するコンピュータシステム。
  15. 前記ストレージ装置の前記ガベッジコレクション制御部は、前記ホスト装置が第1状態であることを前記通知が示す場合、前記ガベッジコレクション処理部が実行中の前記ガベッジコレクションを停止すべきか否かを決定するための前記ストレージ装置が前記閾値以下の負荷状態か否かの判定を行う請求項14に記載のコンピュータシステム。
  16. 前記ストレージ装置の前記ガベッジコレクション制御部は、前記ホスト装置が第1状態でないことを前記通知が示す場合、前記ガベッジコレクション処理部が実行中の前記ガベッジコレクションを停止すべきか否かを決定するための前記ストレージ装置が前記閾値以下の負荷状態か否かの判定を行う請求項14に記載のコンピュータシステム。
  17. 前記ストレージ装置の前記ガベッジコレクション制御部は、
    前記ホスト装置から受信した前記ホスト装置の状態を示す通知の履歴に基づき、前記ホスト装置が第1状態にある期間的な割合を算出し、
    前記算出した割合が基準値を超える場合、前記ガベッジコレクション処理部が実行中の前記ガベッジコレクションを停止すべきか否かを決定するための前記ストレージ装置が前記閾値以下の負荷状態か否かの判定を、前記ホスト装置が前記第1状態であることを示す前記通知を前記ホスト装置から受信した場合に行い、
    前記算出した割合が前記基準値以下の場合、前記ガベッジコレクション処理部が実行中の前記ガベッジコレクションを停止すべきか否かを決定するための前記ストレージ装置が前記閾値以下の負荷状態か否かの判定を、前記ホスト装置が前記第1状態でないことを示す前記通知を前記ホスト装置から受信した場合に行う、
    請求項14に記載のコンピュータシステム。
  18. データを書き込み済みの記憶領域へのデータの上書きを行うことができない不揮発性記憶媒体を有するストレージ装置の動作方法であって、
    前記不揮発性記憶媒体上の不要となったデータが残存する記憶領域を再利用するためのガベッジコレクションを実行することと、
    前記ストレージ装置が閾値以下の負荷状態か否かを判定することと、
    前記ストレージ装置が前記閾値以下の負荷状態の場合、実行中の前記ガベッジコレクションを停止することと、
    を具備するストレージ装置の動作方法。
  19. 前記ストレージ装置内においてキューイングされているホスト装置によって発行されたコマンドの数が第1値以下である第1条件、前記ストレージ装置が処理中の前記ホスト装置によって発行されたコマンドの数が第2値以下である第2条件、および前記ストレージ装置内においてキューイングされている前記ホスト装置によって発行されたコマンドによるデータの書き込みまたは読み出しの総データサイズが第3値以下である第3条件の中のあらかじめ定められた2以上の条件の一部または全部が満たされる場合、前記ストレージ装置は前記閾値以下の負荷状態と判定することを具備する請求項18に記載のストレージ装置の動作方法。
  20. ホスト装置の状態を示す通知を前記ホスト装置から受信した場合、実行中の前記ガベッジコレクションを停止すべきか否かを決定するための前記ストレージ装置が前記閾値以下の負荷状態か否かの判定を行うことを具備する請求項18に記載のストレージ装置の動作方法。
JP2018059835A 2018-03-27 2018-03-27 ストレージ装置、コンピュータシステムおよびストレージ装置の動作方法 Active JP6901427B2 (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP2018059835A JP6901427B2 (ja) 2018-03-27 2018-03-27 ストレージ装置、コンピュータシステムおよびストレージ装置の動作方法
TW107123274A TWI694330B (zh) 2018-03-27 2018-07-05 儲存裝置、電腦系統及儲存裝置之動作方法
CN201810839667.9A CN110308863B (zh) 2018-03-27 2018-07-27 存储装置、计算机系统及存储装置的动作方法
US16/126,021 US10747663B2 (en) 2018-03-27 2018-09-10 Storage device, computer system, and operation method of storage device configured to arbitrarily stop garbage collection
US16/921,296 US11397675B2 (en) 2018-03-27 2020-07-06 Storage device, computer system, and operation method of storage device configured to arbitrarily stop garbage collection

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018059835A JP6901427B2 (ja) 2018-03-27 2018-03-27 ストレージ装置、コンピュータシステムおよびストレージ装置の動作方法

Publications (2)

Publication Number Publication Date
JP2019174941A true JP2019174941A (ja) 2019-10-10
JP6901427B2 JP6901427B2 (ja) 2021-07-14

Family

ID=68056223

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018059835A Active JP6901427B2 (ja) 2018-03-27 2018-03-27 ストレージ装置、コンピュータシステムおよびストレージ装置の動作方法

Country Status (4)

Country Link
US (2) US10747663B2 (ja)
JP (1) JP6901427B2 (ja)
CN (1) CN110308863B (ja)
TW (1) TWI694330B (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20210055408A (ko) * 2019-11-07 2021-05-17 주식회사 파두 메모리 컨트롤러 및 이를 포함하는 스토리지 디바이스
US11416168B2 (en) 2019-11-07 2022-08-16 FADU Inc. Memory controller and storage device including the same

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2572404B (en) * 2018-03-29 2020-04-15 Imagination Tech Ltd Method and system for controlling processing
CN111542803B (zh) 2018-06-30 2021-10-01 华为技术有限公司 一种基于NVMe的数据写入方法、装置及系统
EP3792776B1 (en) * 2018-06-30 2022-10-26 Huawei Technologies Co., Ltd. Nvme-based data reading method, apparatus and system
US11580016B2 (en) * 2019-08-30 2023-02-14 Micron Technology, Inc. Adjustable garbage collection suspension interval
CN112559392B (zh) * 2020-12-23 2023-08-15 深圳大普微电子科技有限公司 一种加速读存储介质的方法、读加速硬件模块及存储器
US20240069729A1 (en) * 2022-08-31 2024-02-29 Pure Storage, Inc. Optimizing Data Deletion in a Storage System

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03141442A (ja) * 1989-10-27 1991-06-17 Hitachi Ltd タスク制御方式
JPH09330185A (ja) * 1996-06-13 1997-12-22 Oki Electric Ind Co Ltd ディスクアレイ装置
JP2008530708A (ja) * 2005-02-16 2008-08-07 サンディスク コーポレイション フラッシュメモリにおける直接データファイル記憶実施技術
US8364918B1 (en) * 2007-04-06 2013-01-29 Marvell International Ltd. Sensed opportunistic garbage collection in memory components
JP2017168088A (ja) * 2016-03-17 2017-09-21 三星電子株式会社Samsung Electronics Co.,Ltd. ソリッドステートドライブ、ガーベッジコレクションを遂行する方法、及びストレージ媒体を含む物品

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007193883A (ja) * 2006-01-18 2007-08-02 Sony Corp データ記録装置及び方法、及びデータ再生装置及び方法、並びにデータ記録再生装置及び方法
WO2013027642A1 (en) * 2011-08-19 2013-02-28 Kabushiki Kaisha Toshiba Information processing apparatus, method for controlling information processing apparatus, non-transitory recording medium storing control tool, host device, non-transitory recording medium storing performance evaluation tool, and performance evaluation method for external memory device
JP5586718B2 (ja) * 2012-06-19 2014-09-10 株式会社東芝 制御プログラム、ホスト装置の制御方法、情報処理装置およびホスト装置
JP6005566B2 (ja) * 2013-03-18 2016-10-12 株式会社東芝 情報処理システム、制御プログラムおよび情報処理装置
TW201606778A (zh) * 2014-08-08 2016-02-16 Toshiba Kk 記憶體系統、主機裝置、資訊處理系統
JP6266479B2 (ja) * 2014-09-12 2018-01-24 東芝メモリ株式会社 メモリシステム
TWI537816B (zh) * 2014-10-13 2016-06-11 慧榮科技股份有限公司 非揮發性儲存裝置與控制器進行的控制方法
TWI585770B (zh) * 2015-08-11 2017-06-01 群聯電子股份有限公司 記憶體管理方法、記憶體控制電路單元及記憶體儲存裝置
US10229049B2 (en) 2015-12-17 2019-03-12 Toshiba Memory Corporation Storage system that performs host-initiated garbage collection
JP6517684B2 (ja) * 2015-12-22 2019-05-22 東芝メモリ株式会社 メモリシステムおよび制御方法
KR102596400B1 (ko) * 2016-03-07 2023-11-01 에스케이하이닉스 주식회사 데이터 저장 장치 및 데이터 저장 장치의 동작 방법
JP2018181281A (ja) * 2017-04-21 2018-11-15 富士通株式会社 ストレージシステム、制御装置及びストレージ装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03141442A (ja) * 1989-10-27 1991-06-17 Hitachi Ltd タスク制御方式
JPH09330185A (ja) * 1996-06-13 1997-12-22 Oki Electric Ind Co Ltd ディスクアレイ装置
JP2008530708A (ja) * 2005-02-16 2008-08-07 サンディスク コーポレイション フラッシュメモリにおける直接データファイル記憶実施技術
US8364918B1 (en) * 2007-04-06 2013-01-29 Marvell International Ltd. Sensed opportunistic garbage collection in memory components
JP2017168088A (ja) * 2016-03-17 2017-09-21 三星電子株式会社Samsung Electronics Co.,Ltd. ソリッドステートドライブ、ガーベッジコレクションを遂行する方法、及びストレージ媒体を含む物品

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20210055408A (ko) * 2019-11-07 2021-05-17 주식회사 파두 메모리 컨트롤러 및 이를 포함하는 스토리지 디바이스
KR102266166B1 (ko) 2019-11-07 2021-06-17 주식회사 파두 메모리 컨트롤러 및 이를 포함하는 스토리지 디바이스
US11416168B2 (en) 2019-11-07 2022-08-16 FADU Inc. Memory controller and storage device including the same

Also Published As

Publication number Publication date
CN110308863B (zh) 2023-07-18
US20190303289A1 (en) 2019-10-03
US11397675B2 (en) 2022-07-26
CN110308863A (zh) 2019-10-08
US10747663B2 (en) 2020-08-18
JP6901427B2 (ja) 2021-07-14
TWI694330B (zh) 2020-05-21
US20200334145A1 (en) 2020-10-22
TW201942747A (zh) 2019-11-01

Similar Documents

Publication Publication Date Title
JP6901427B2 (ja) ストレージ装置、コンピュータシステムおよびストレージ装置の動作方法
KR102403489B1 (ko) 비휘발성 메모리 익스프레스 컨트롤러에 의한 입출력 큐 관리 방법
JP6517684B2 (ja) メモリシステムおよび制御方法
KR102446733B1 (ko) 스토리지 장치 및 스토리지 장치를 포함하는 전자 장치
JP5523561B2 (ja) ストレージ装置に接続された記憶制御装置
EP2849076B1 (en) Dma transmission method and system
KR102094236B1 (ko) 스토리지 디바이스 및 컴퓨터 시스템
US10331584B2 (en) Internal system namespace exposed through use of two local processors and controller memory buffer with two reserved areas
KR20200078382A (ko) 개시자 모드를 갖는 솔리드-스테이트 드라이브
US20170123686A1 (en) Mitigating gc effect in a raid configuration
US10579300B2 (en) Information handling system firmware persistent memory runtime reclaim
US10901624B1 (en) Dummy host command generation for supporting higher maximum data transfer sizes (MDTS)
JP2009169650A (ja) 計算機システム、管理計算機及びデータ管理方法
US20220222016A1 (en) Method for accessing solid state disk and storage device
CN110300960B (zh) 信息系统、管理程序和信息系统的程序更换方法
JP2014032582A (ja) 画像処理装置、画像処理装置のストレージデバイス制御方法、及びプログラム
US11966585B2 (en) Storage device and storage system
CN112231238B (zh) 使用存储器压缩来减少存储器提交开销
KR20190030790A (ko) 데이터 저장 장치 및 그것의 동작 방법
WO2021174698A1 (zh) 虚拟机快照创建方法、装置、存储介质及计算机设备
JP5158576B2 (ja) 入出力制御システム、入出力制御方法、及び、入出力制御プログラム
US10831684B1 (en) Kernal driver extension system and method
JP2003288317A (ja) 端数ブロックデータ転送を検出し補償するシステムおよび方法
US20170123657A1 (en) Systems and methods for back up in scale-out storage area network
US11586569B2 (en) System and method for polling-based storage command processing

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20180830

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200915

TRDD Decision of grant or rejection written
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210428

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210518

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210617

R150 Certificate of patent or registration of utility model

Ref document number: 6901427

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150