JPWO2015128955A1 - 記憶デバイス、記憶デバイスを有する装置、及び記憶制御方法 - Google Patents

記憶デバイス、記憶デバイスを有する装置、及び記憶制御方法 Download PDF

Info

Publication number
JPWO2015128955A1
JPWO2015128955A1 JP2016504903A JP2016504903A JPWO2015128955A1 JP WO2015128955 A1 JPWO2015128955 A1 JP WO2015128955A1 JP 2016504903 A JP2016504903 A JP 2016504903A JP 2016504903 A JP2016504903 A JP 2016504903A JP WO2015128955 A1 JPWO2015128955 A1 JP WO2015128955A1
Authority
JP
Japan
Prior art keywords
data
write
compressed
storage medium
logical
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2016504903A
Other languages
English (en)
Other versions
JP6134857B2 (ja
Inventor
水島 永雅
永雅 水島
純司 小川
純司 小川
篤志 河村
篤志 河村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Publication of JPWO2015128955A1 publication Critical patent/JPWO2015128955A1/ja
Application granted granted Critical
Publication of JP6134857B2 publication Critical patent/JP6134857B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11CSTATIC STORES
    • G11C7/00Arrangements for writing information into, or reading information out from, a digital store
    • G11C7/10Input/output [I/O] data interface arrangements, e.g. I/O data control circuits, I/O data buffers
    • G11C7/1006Data managing, e.g. manipulating data before writing or reading out, data bus switches or control circuits therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/0604Improving or facilitating administration, e.g. storage management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F12/00Accessing, addressing or allocating within memory systems or architectures
    • G06F12/02Addressing or allocation; Relocation
    • G06F12/0223User address space allocation, e.g. contiguous or non contiguous base addressing
    • G06F12/023Free address space management
    • G06F12/0238Memory management in non-volatile memory, e.g. resistive RAM or ferroelectric memory
    • G06F12/0246Memory management in non-volatile memory, e.g. resistive RAM or ferroelectric memory in block erasable memory, e.g. flash memory
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/0614Improving the reliability of storage systems
    • G06F3/0616Improving the reliability of storage systems in relation to life time, e.g. increasing Mean Time Between Failures [MTBF]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0638Organizing or formatting or addressing of data
    • G06F3/0644Management of space entities, e.g. partitions, extents, pools
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0662Virtualisation aspects
    • G06F3/0665Virtualisation aspects at area level, e.g. provisioning of virtual or logical volumes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/067Distributed or networked storage systems, e.g. storage area networks [SAN], network attached storage [NAS]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/0671In-line storage system
    • G06F3/0673Single storage device
    • G06F3/0679Non-volatile semiconductor memory device, e.g. flash memory, one time programmable memory [OTP]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2212/00Indexing scheme relating to accessing, addressing or allocation within memory systems or architectures
    • G06F2212/40Specific encoding of data in memory or cache
    • G06F2212/401Compressed data

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Techniques For Improving Reliability Of Storages (AREA)

Abstract

記憶デバイスは、複数の論理領域で構成された記憶媒体に基づく論理空間を上位装置に提供し、各論理領域について、基準データ範囲が記憶媒体に存在する。記憶デバイスは、ライト先論理アドレスが属するライト先論理領域に対応した基準データ範囲から基準データをリードし、基準データである第1データと、ライトデータに基づくデータとライトデータとのいずれかである第2データとの排他的論理和である差分データを作成する。記憶デバイスは、差分データを圧縮することにより圧縮差分データを作成し、圧縮差分データを記憶媒体にライトし、圧縮差分データがライトされた範囲である差分データ範囲をライト先論理領域に関連付ける。

Description

本発明は、概して、記憶制御に関し、例えば、記憶デバイス内の記憶媒体に書き込まれるデータの量を削減するための制御に関する。
記憶デバイスは、一般に、記憶媒体と、記憶媒体に対するデータのI/O(Input/Output)を制御する媒体コントローラとを有する。記憶デバイスを有する装置として、例えば、ストレージ装置、又は、ストレージ装置にデータのI/Oを行うホスト装置がある。
記憶媒体として、例えば、一括消去可能な不揮発性半導体メモリが開発されている。このような不揮発性半導体メモリとしては、例えば、フラッシュメモリがある。フラッシュメモリ(典型的にはNAND型フラッシュメモリ)は、複数のブロックを有し、各ブロックは、複数のページを有する。ページ単位でデータのI/Oが行われ、ブロック単位でデータが消去される。消去時間は書込み時間に比べて短い。そこで、フラッシュメモリの記録データ(書込み済のデータ)の更新は、一般に、次のように行われる。すなわち、媒体コントローラが、記録データ(更新前のデータ)をページから読み出し、記録データの少なくとも一部にライト対象データを反映することにより更新データを作成し、更新データを空ページに書き込み、記録データを記憶しているページを無効化(記憶デバイスの上位装置からの参照を不可とする処理)する。そして、媒体コントローラは、空ページが枯渇した場合には、全てが無効ページ(無効化されたページ)となったブロックからデータを消去することにより、無効ページを空ページとする。
各ページは、複数(例えば16個)のセクタを含む。ページ単位で書込みが行われるので、1セクタだけを書き換えるためであってもそのセクタを含む1ページを書き換える必要がある。
フラッシュメモリは、一般に、データの消去回数に制限がある。データの書き換えが集中して消去回数が増大したブロックは、データの消去ができなくなり使用不能となってしまう。このため、特定のブロックにデータ消去処理が集中しないようにする必要がある。また、フラッシュメモリでは、ページ内のデータが、時間とともにデータ誤りが増加してしまうため、媒体コントローラは、書き込まれてから一定時間経過したデータを別ページに移動するリフレッシュと呼ばれる動作を行う。
このような特性を持つフラッシュメモリにおいては、データの消去時間を短縮させたり、消去回数を低減させたりするために、特許文献1のような重複排除技術を用いることが考えられる。重複排除技術は、上位装置に提供する論理アドレスと実際の記憶領域の物理アドレスとが対応付けて管理されている場合に、重複するデータが格納された複数の論理アドレス空間(例えば論理ページ)を、当該データが格納された1つの物理アドレス空間(例えば物理ページ)に対応付ける技術である。重複排除技術を利用することにより、記憶媒体に書き込まれるデータの量を削減することができ、フラッシュメモリを記憶媒体とする記憶デバイスにおいて、フラッシュメモリの長寿命化を図ることができる。
特表2013−532853号公報
特許文献1の重複排除技術は、重複するデータを持つ複数の論理ページに対して1つの物理ページを割り当てることで、書込み量(フラッシュメモリに書き込まれるデータの量)を低減化する。しかし、それらの論理ページの各々に対してわずかなデータ更新が行われるだけで、各更新先論理ページ内のデータは、重複排除の対象から外れてしまい、各更新先論理ページには、更新データが書き込まれた新たな物理ページが割り当てられることになる。これにより、書込み量が増加する。
この種の問題は、重複排除されている論理ページに限られない。例えば、重複排除されていない論理ページについて、その論理ページに対してわずかなデータ更新があっただけで、更新データが新たな物理ページに書き込まれる(つまり、物理ページが新たに消費される)。
また、この種の問題は、フラッシュメモリに限らず、消去回数(書き換え回数)に制限のある他種の記憶媒体についても有り得る。
本発明の目的は、記憶デバイスの記憶媒体への書込み量を削減することにある。
記憶デバイスは、記憶媒体と、記憶媒体に対するI/Oを制御し記憶媒体に基づく論理空間を上位装置に提供する媒体コントローラとを有する。論理空間は、複数の論理領域で構成されている。各論理領域について、基準データ範囲が記憶媒体に存在する。媒体コントローラは、ライト先論理アドレスを指定したライトコマンドを上位装置から受信し、ライト先論理アドレスが属するライト先論理領域に対応した基準データ範囲から基準データをリードする。媒体コントローラは、基準データである第1データと、ライトコマンドに従うライトデータに基づくデータとライトデータとのいずれかである第2データとの排他的論理和である差分データを作成する。媒体コントローラは、差分データを圧縮することにより圧縮差分データを作成し、圧縮差分データを記憶媒体にライトし、圧縮差分データがライトされた範囲である差分データ範囲をライト先論理領域に関連付ける。媒体コントローラは、ライト先論理領域と同じ論理領域をリード元としたリードコマンドを上位装置から受信した場合、リード元論理領域に関連付けられている基準データと、リード元論理領域に関連付けられている差分データとを基に、リードコマンドに従うリードデータを復元することができる。
記憶デバイス内の記憶媒体の書込み量を削減することができ、以って、記憶媒体の長寿命化を図ることができる。
図1は、実施例に係るFMモジュールの構成を示す。 図2Aは、単独割当ページのためのデータフォーマット(平文状態)を示す。 図2Bは、重複割当ページのためのセクタ部フォーマット(平文状態)を示す。 図2Cは、重複割当ページのためのコード部フォーマットを示す。 図3は、フラッシュメモリへのデータライト方法とデータ格納状態の例を示す。 図4Aは、アドレス変換テーブルを示す。 図4Bは、重複カウントテーブルを示す。 図5は、ライトコマンド処理のフローチャートである。 図6は、単独割当ページに対する全体ライト処理のフローチャートである。 図7は、単独割当ページに対する部分ライト処理のフローチャートである。 図8は、重複割当ページに対する全体ライト処理のフローチャートである。 図9は、重複割当ページに対する部分ライト処理のフローチャートである。 図10は、単独割当ページに対する全体ライト処理の概念図である。 図11は、単独割当ページに対する部分ライト処理の概念図である。 図12は、重複割当ページに対する全体ライト処理の概念図である。 図13は、重複割当ページに対する部分ライト処理の概念図である。 図14は、実施例に係るストレージ装置を有する計算機システムの構成を示す。 図15Aは、単独割当ページのユーザデータの2通りの形成方法を示す。 図15Bは、重複割当ページのユーザデータの2通りの形成方法を示す。 図16は、ホストの構成を示す。
以下、一実施例を説明する。
以下の説明では、「kkkテーブル」の表現にて情報を説明することがあるが、情報は、テーブル以外のデータ構造で表現されていてもよい。データ構造に依存しないことを示すために「kkkテーブル」を「kkk情報」と呼ぶことができる。
また、以下の説明では、通信インターフェイスデバイスを「I/F」と略記することがあり、フラッシュメモリを「FM」と略記することがある。
以下、実施例に係る記憶デバイスが適用されたFMモジュールと、そのFMモジュールを有するストレージ装置を説明する。
図14は、実施例に係るストレージ装置を有する計算機システムの構成を示す。
計算機システムは、ストレージ装置1400と、ホスト(ホスト計算機)1421と、管理計算機1420とを有する。ホスト1421は、SAN(Storage Area Network)1410のような通信ネットワークを介してストレージ装置1400に接続されてよい。管理計算機1420は、LAN(Local Area Network)のような通信ネットワーク(図示せず)を介してストレージ装置1400に接続されてよい。ホスト1421及び管理計算機1420は同じ通信ネットワークに接続されてよい。
ストレージ装置1400は、複数のFMモジュール100と、複数のFMモジュール100に対するI/Oを制御するストレージコントローラ1401とを有する。ストレージコントローラ1401は、ホスト1421から送信されたコマンドを受信し、そのコマンドを解釈して、ストレージ装置1400の記憶領域内のデータのリード/ライトを実行する。ストレージ装置1400は、H−I/F(ホスト1421と通信するI/F)1431、S−I/F(FMモジュール100と通信するI/F)1451、M−I/F(管理計算機1420と通信するI/F)1430、メモリ1442、及び、それらに接続されたCPU1441を有する。
H−I/F1431は、ホスト1421からのI/Oリクエストや制御コマンドなどを受け付けるI/Fである。S−I/F1451は、FMモジュール100にデータや制御コマンドを送信するI/Fである。また、M−I/F1430は、管理計算機1420からの管理や保守に関する制御コマンド等を受け付けるI/Fである。
CPU1441は、演算処理装置として機能し、メモリ1442に記憶されている各種プログラムや演算パラメータ等にしたがって、ストレージ装置1400全体の動作を制御する機能を有する。具体的には、例えば、CPU1441は、ホスト1421からのI/Oリクエスト等に従い、ストレージ装置1400とホストとの間のユーザデータの入出力(データI/O)を処理し、FMモジュール100にユーザデータをライトするためのライトコマンドをFMモジュール100に発行したり、FMモジュール100からユーザデータをリードしたりするためのリードコマンドをFMモジュール100に発行したりする。また、CPU1441は、ホスト1421から受け付けたユーザデータに対して保証コード(後述。)を作成して、ユーザデータに付与する。メモリ1442は、各種プログラムや演算パラメータ等の他、管理情報を記憶する。また、メモリ1442は、キャッシュメモリ領域を有する。キャッシュメモリ領域は、FMモジュール100にライトするユーザデータや、FMモジュール100からリードしたユーザデータを一時的に格納する。なお、本実施例の説明において、「ユーザデータ」とは、ストレージコントローラ1401にとっては、主に、ホスト1421からのリード/ライトリクエスト(I/Oリクエスト)に従うリード/ライト対象のデータでよく、FMモジュール100内のFMコントローラ103(図1参照)にとっては、ストレージコントローラ1401からのリード/ライトコマンドに従うリード/ライト対象のデータでよい。
図14では、FMモジュール100は6つ備えられている構成としているが、FMモジュール100の数はかかる例に限定されない。FMモジュール100の内部構成については、図1を用いて後で詳細に説明する。なお、本実施例では、FMモジュール100は、ストレージ装置1400内に存在するが、かかる例に限定されず、FMモジュール100を、ストレージ装置1400の外に存在してもよい。
ホスト1421は、SAN1410を介してストレージ装置1400と接続され、ストレージ装置1400にデータのリード/ライトリクエスト(I/Oリクエスト)を送信する。また、ホスト1421は、例えば、パーソナルコンピュータ、ワークステーション又はメインフレームでよい。ホストとストレージ装置1400との通信は、例えば、SCSI(Small Computer System Interface)などのブロックプロトコルが用いられてよい。
管理計算機1420は、例えば、パーソナルコンピュータや、ワークステーション又はメインフレームでよい。管理計算機1420は、ストレージ装置1400等を管理してよい。
図14の構成によれば、FMモジュール100の上位装置は、ストレージコントローラ1401である。FMモジュールは、後に図1を参照して説明するように、複数のFMチップで構成されたフラッシュメモリ105と、フラッシュメモリ105に対するI/Oを制御するFMコントローラ103とを有する。以下、フラッシュメモリ105の特徴と扱い方の一例を説明する。
フラッシュメモリ105は、最小消去単位が最小書き込み単位に比べて大きいという特徴を有する。具体的には、例えば、フラッシュメモリ105(各FMチップ)は、複数のブロック(物理ブロック)を有し、各ブロックが、複数(例えば256個)のページ(物理ページ)を有する。ブロック単位でデータが消去され、ページ単位でデータの読み書きが実行される。ページのサイズは例えば8640バイトである。フラッシュメモリ105は、その特性上、データを直接上書きすることができない。すなわち、データを書き換える場合、FMコントローラ103は、そのデータを含むブロック内に記憶している有効な他のデータを別のブロックに退避させて、元のブロックからデータを消去する。そして、FMコントローラ103は、消去したブロックに新しいデータをページ単位で書き込むことにより、データの書き換えを行う。
このように、フラッシュメモリ105におけるデータの書き換え処理では、ブロック単位(物理ブロック単位)のデータの消去が伴う。しかしながら、フラッシュメモリ105の1ブロック分のデータ消去にかかる時間は、1ページ分のデータを書き込むのに要する時間と比べて長い時間(例えば約1桁分長い時間)がかかる。したがって、1ページ分のデータを書き換えるために毎回1ブロック分のデータ消去を実行すると、フラッシュメモリ105のデータ書き換え性能が低下してしまう。フラッシュメモリ105からデータを消去する時間を隠ぺいできるアルゴリズムでデータを書き込むことが必要となる。
通常、フラッシュメモリ105に対してデータの書き換えを行う場合には、データを書き換えるごとにデータを消去することは行わず、データが記録されていない未使用ページ(空の物理ページ)にデータを追記する方式によってデータの書き換えが行われる。しかし、データの書き換え処理が度重なって実行されると、フラッシュメモリ105内の未使用ページが枯渇してしまうため、フラッシュメモリ105に書き込まれている無効データ(書き換えた後の旧データなど)を消去して、ページを再利用可能な状態にする必要が生じる。そこで、FMコントローラ103は、旧データを含むブロック内の有効なデータのみを別のブロック内の未使用ページにコピーし、コピー元のブロックからデータを消去して未使用ブロックとして再生するブロック再生処理を実行する。この処理は、フラッシュメモリ105のデータを高速に書き換えるには必須の処理であり、特に無効データが多くなったブロックが優先的にコピー元のブロックとされる。
一方、フラッシュメモリ105の各ブロックは、消去回数に制限がある。例えば、1ブロック当たり1万回までの消去回数が保証される。この場合、データの書き換えが1つのブロックに集中して、当該ブロックの消去回数が保証回数(上限)を超えると、データ消去ができなくなることがあり、そのブロックは以降使用不能となってしまい、使用可能なブロック数が減少するという問題がある。そこで、特定ブロックに対する消去処理が集中しないように、消去回数の多いブロックと少ないブロックの間で格納データを交換するなどして消去回数の平準化処理を行う必要がある。
また、フラッシュメモリ105は、一度書き込みしたページについては、データを保持しておくだけでも時間経過とともにデータ誤りが増加していくという特徴を有する。データ誤りによるデータ損失を回避するために、FMコントローラ103は、ページに書き込むデータに誤り訂正符号(ECC:Error Correction Code)に基づくパリティがあらかじめ付加する。FMコントローラ103は、書き込み後一定時間を経過したデータを読み出し、データ誤りが少ないうちに当該パリティを用いてそれを訂正して、訂正後のデータを別ページに移動するリフレッシュ処理を行う。なお、この処理を実行する場合にも、FMコントローラ103は、消去回数を平準化したり、性能に対する影響を考慮したりする必要がある。
このように、FMコントローラ103は、消去時間を隠ぺいしたり消去回数を平準化したりするために、上位装置に提供する論理アドレスと実際の記憶領域の物理アドレスとを動的に対応づけ、データの書き込みの際に論理アドレスから物理アドレスへの変換処理を行う。すなわち、上位装置に提供する論理アドレスとフラッシュメモリ105の物理アドレスとの対応を動的にFMコントローラ103により変更することにより、上位装置は、論理アドレス空間にデータを書き込めばよい。データ書き込み時における未使用ページへの追記に伴う物理アドレスの変更を上位装置が意識しなくてもよいように、FMコントローラ103はアドレスを管理する。
さて、フラッシュメモリ105を有するFMモジュール100において、論理アドレスと物理アドレスとを対応付けて管理している場合、重複排除技術を適用することが有効である。重複排除技術とは、重複するデータが格納された複数の論理アドレス空間を、当該データが格納された1つの物理アドレス空間に対応付ける技術である。重複排除技術により、フラッシュメモリ105の書込み量を削減できる。特に、重複排除技術の適用が有効と考えられるケースとして、フォーマット処理が考えられる。
ストレージコントローラ1401は、FMモジュール100の使用を開始する際に、その異常個所の検知や格納データの初期化を目的として、フォーマット処理を実行する。具体的には、例えば、ストレージコントローラ1401は、FMモジュール100に基づく全記憶領域に、特定の値が連続する単純パタンのデータ(例えば全ビットが「0」のデータであるオールゼロデータ)を書き込む。しかし、フォーマット処理は、フラッシュメモリ105のように書き換え回数が制限されている記憶媒体において、不必要に書き換え回数を増加させる。また、フラッシュメモリ105は、データの書き換えに対して未使用ページへの追記方式を採用しているため、未使用ページの消費が増えると、処理時間のかかるデータ消去処理を頻繁に実行しなければならない。すなわち、フォーマット処理は、未使用ページが減少させ且つ性能を損なう処理である。そこで、本実施例では、FMモジュール100に重複排除技術が適用され、それにより、データの書込み量が低減し、以って、フラッシュメモリ105の長寿命化が図られる。なお、FMコントローラ103は、書込み対象のデータのパタンをチェックすることにより、或いは、ストレージコントローラ1401からの通知により(例えば、ストレージコントローラ1401からのライトコマンドにフォーマットであることを意味する値が設定されていることにより)、書込み対象のデータがフォーマット処理により書き込まれるデータであることを検出できる。
さらに、ストレージ装置1400は、ハードウェア障害などによりユーザデータに発生するビット化けや、内部制御エラーなどによって発生する不正アドレスへのユーザデータ書き込みや不正アドレスからのユーザデータ読み込みを検出することができる。そのため、ストレージコントローラ1401は、書き込むユーザデータをセクタ単位(例えば1セクタは512バイト)に分けて複数のセクタデータで構成し、それぞれに対して所定長さ(例えば16バイト)の保証コードを付与する。一般に、保証コードは、CPU1441がユーザデータのビット化けを検出することを目的に各セクタデータから算出されるCRC(Cyclic Redundancy Check)を含む。また、保証コードは、ストレージ装置ベンダが自由に設定できるユーザデータの関連情報(以下、メタデータ)を含んでよい。メタデータは、例えば、計算機システムにおけるユーザデータの論理的な格納位置のような情報(具体的には、例えば、論理ボリューム番号や論理セクタアドレスなど)、ユーザデータの更新日時のような情報、及び、ユーザデータの世代番号のような情報のうちの少なくとも1つでよい。なお、論理ボリュームは、ストレージ装置1400によりホスト1421に提供される論理的な記憶デバイスである。ホスト1421からのI/Oリクエストでは、論理ボリュームの論理アドレスが指定される。その論理アドレスに従う領域(論理ボリュームにおける領域)に、1以上のFMモジュール100の各々が提供する1以上の論理ページが対応する。I/Oリクエストで指定されている論理アドレスを基に、FMモジュール100に送信されるI/Oコマンドで指定される論理アドレスがストレージコントローラ1401により決められる。
保証コードが付与されたセクタデータから構成されるユーザデータに対して重複排除を行う場合、保証コード値がセクタデータ毎に異なるため、セクタデータが同じ値であっても保証コードに差異があるため重複排除を行うことができないという問題が発生することがある。
そこで、FMコントローラ103は、重複排除処理を行う際には、まず、保証コードを含むユーザデータから、セクタデータと保証コードとを分離し、セクタデータのみを集めたもの(以下、セクタ部)を重複排除時のデータ共有の対象とし、保証コードのみを集めたもの(以下、コード部)を、セクタ部とは別に管理する。セクタ部及びコード部は、それぞれ独立したものとしてフラッシュメモリ105に格納される。なお、重複排除処理を行わないユーザデータについては、セクタ部とコード部への分離は行われずにフラッシュメモリ105に格納される。
以下の説明においては、重複排除処理を行うことによって、或る論理ページのためのデータを格納している物理ページのデータが、他の論理ページのためのデータとして共有されている場合、その論理ページを、「重複割当ページ」と呼ぶこととする。また、ある論理ページのためのデータを格納している物理ページのデータが、他のどの論理ページのためのデータとしても共有されていない場合、その論理ページを、「単独割当ページ」と呼ぶこととする。
FMコントローラ103は、さらに、フラッシュメモリ105に格納するデータを可逆圧縮アルゴリズムによって圧縮することにより、フラッシュメモリ105の書込み量を削減する。可逆圧縮アルゴリズムとしては、例えばLZ77アルゴリズムを適用する。このアルゴリズムによれば、例えば、同じ値(例えばゼロ)が長く連続するパタンを多く含むデータについては圧縮によるデータ削減効果が高い。
次に、図1を参照しながら、FMモジュール100の構成を説明する。
FMモジュール100は、複数のFMチップで構成されたフラッシュメモリ105と、フラッシュメモリ105に対するリード/ライトを制御するFMコントローラ103とを有する。FMコントローラ103は、上位装置(ストレージコントローラ1401)に接続される上位I/F102、メモリ(例えば揮発性メモリ)の一例であるDRAM(Dynamic Random Access Memory)106、及び、それらに接続されたコントローラ本体101を有する。コントローラ本体101は、圧縮伸張回路104及びXOR回路107を含む。コントローラ本体101は、上位I/F102、フラッシュメモリ105及びDRAM106を制御するプロセッサ(マイクロプロセッサ)を含んでよい。プロセッサは、上位I/F102を通じて受信したリード/ライトコマンドを解釈したり、リード/ライトデータを送受信したり、圧縮伸張回路104にデータの圧縮/伸張を実行させたり、XOR回路107に排他的論理和計算を実行させたり、フラッシュメモリ105とDRAM106との間のデータ転送を実行したりできる。
上位I/F102は、上位装置から発行されたライトコマンドに従うユーザデータを上位装置から受信したり、上位装置から発行されたリードコマンドに従うユーザデータを上位装置に送信したりする。
圧縮伸張回路104は、FMコントローラ103内にハードウェア(論理回路)として実装された演算器でよく、所定の可逆変換圧縮アルゴリズム(例えばLZ77アルゴリズム)によって、平文(平文状態のデータ)を可逆的に圧縮することにより圧縮データ(圧縮状態のデータ)を作成すしたり、圧縮データを伸張することにより元の平文データを作成したりできる。
XOR回路107は、FMコントローラ103内にハードウェア(論理回路)として実装された演算器でよく、同じサイズの2つのデータの排他的論理和を計算し、それらと同じサイズのデータを作成できる。排他的論理和とは、2つのデータの同じ位置に等しい値があると0を作成し、異なる値があると1を作成する演算である。よって、XOR回路107に入力される2つのデータがよく似たデータであるほど、作成されるデータはゼロ値が長く連続するパタンが多く含まれるデータとなる。なお、このようなデータは、上記の圧縮アルゴリズムで圧縮することでデータ量を大きく削減することができる。
DRAM106は、上位装置から受信したライトデータ(フラッシュメモリ105に書き込まれるデータ)、及び、上位装置へ送信するリードデータ(フラッシュメモリ105から読み出されたデータ)を一時的に格納する。また、DRAM106は、フラッシュメモリ105にライトされるデータを一時的に格納するライトバッファとして機能する。また、DRAM106は、フラッシュメモリ105からリードしたデータを一時的に格納するリードバッファとして機能する。また、DRAM106は、圧縮伸張回路104により圧縮/伸張するデータの転送元、および、圧縮/伸張の結果データ(圧縮データ/平文データ)の転送先として機能する。また、DRAM106は、XOR回路107により排他的論理和を計算する2つのデータの転送元、および、XOR回路107による作成結果データの転送先として機能する。
次に、図2A、図2B、図2Cを参照しながら、フラッシュメモリ105に書き込まれるデータに適用されるデータフォーマットについて説明する。
図2Aは、単独割当ページに書き込まれる平文ユーザデータ(平文状態のユーザデータ)のデータフォーマットを示す。
保証コードを含むユーザデータ(Di,Gi)200は、平文状態で8448バイトの長さを持ち、16個の512バイトのセクタデータ(201、202、203、…、204)を含み、それぞれに16バイトの保証コード(211、212、213、…、214)が付加されている。
FMコントローラ103は、単独割当ページの平文ユーザデータを圧縮し圧縮ユーザデータ(圧縮状態のユーザデータ)をフラッシュメモリ105に書き込む。本実施例では、単独割当ページのユーザデータについて2通りの形成方法がある。第1の形成方法によれば、単独割当ページのユーザデータは、ユーザデータそのものであり、第2の形成方法によれば、単独割当ページのユーザデータは、基準データ(8448バイト)と差分データ(8448バイト)の排他的論理和である。第1の形成方法によれば、FMコントローラ103は、ユーザデータそのものを圧縮してフラッシュメモリ105に書き込む。第2の形成方法によれば、FMコントローラ103は、基準データおよび差分データをそれぞれ圧縮して別々にフラッシュメモリ105に書き込む。そのため、FMコントローラ103は、第2の形成方法に従うユーザデータを復元するには、フラッシュメモリ105から読み出した基準データおよび差分データをそれぞれ圧縮伸張回路104により伸張して平文状態に戻し、さらに、平文状態の基準データ及び差分データの排他的論理和データをXOR回路107より作成する必要がある。
図15Aは、2通りの形成方法の概念図である。ここでは、第1の形成方法におけるユーザデータそのものも「基準データ」と呼ぶことがある。
本実施例によれば、単独割当ページのユーザデータに第2の形成方法を適用することで、フラッシュメモリ105の書込み量を削減できる。その理由を以下に示す。
例えば、更新前のユーザデータと更新後のユーザデータの違いは100ビット目だけ(1ビットだけ)であるとする。従来技術によれば、違いがわずか1ビットでも、更新前のユーザデータを無効化し、更新後のユーザデータを圧縮してフラッシュメモリ105へ格納しなければならない。しかし、本実施例の第2の形成方法によれば、基準データが、更新前のユーザデータであり、差分データが、100ビット目が1で残り全部のビットが0のデータである。これにより、フラッシュメモリ105に更新前のユーザデータが有効データのまま残り、圧縮された差分データが更に有効データとして書き込まれる。このとき、差分データは、ゼロ値が長く連続するパタンを含むデータであるため、圧縮状態の差分データの量は非常に小さくなる。結果として、圧縮された更新後ユーザデータのサイズよりも、圧縮された更新前ユーザデータと圧縮された差分データの合計サイズの方が小さい。
このように、本実施例によれば、更新前後のユーザデータに一致する部分が多い場合に、フラッシュメモリ105の書込み量を削減でき、フラッシュメモリ105の長寿命化を図ることができる。
一方、図2Bは、重複割当ページの平文ユーザデータから分離されたセクタ部である平文セクタ部のデータフォーマットを示す。セクタ部Dj220は、平文状態で8192バイトの長さを持ち、16個の512バイトのセクタデータ(221、222、223、…、224)で構成される。
図2Cは、重複割当ページの平文ユーザデータから分離された平文コード部のデータフォーマットを示す。コード部Gj230は、256バイトの長さを持ち、16個の16バイトの保証コード(231、232、233、…、234)で構成される。
重複割当ページのユーザデータとして、フラッシュメモリ105には、図2Bのフォーマットに従う平文セクタ部が圧縮されたセクタ部と、図2Cのフォーマットに従う平文コード部とが書き込まれる。FMモジュール100では、重複割当ページのセクタ部について2通りの形成方法がある。第1の形成方法によれば、重複割当ページのセクタ部は、ユーザデータから分離されたセクタ部そのものである。第2の形成方法によれば、基準データ(8192バイト)と差分データ(8192バイト)の排他的論理和である。第1の形成方法の場合、セクタ部そのものが圧縮されてフラッシュメモリ105に書き込まれる。第2の形成方法の場合、基準データおよび差分データがそれぞれ圧縮され別々にフラッシュメモリ105に書き込まれる。そのため、セクタ部を復元するには、FMコントローラ103は、フラッシュメモリ105から読み出した基準データおよび差分データをそれぞれ圧縮伸張回路104により伸張し、平文状態の基準データ及び差分データの排他的論理和データをXOR回路107により作成する。FMモジュール100では、重複割当ページのセクタ部が第1の形成方法に従うセクタ部の場合、セクタ部そのものが複数の論理ページで共有される。すなわち、重複割当ページに割り当てられた物理ページ内のセクタ部が、複数の論理ページ(重複割当ページ)で共有される。一方、重複割当ページのセクタ部が第2の形成方法に従うセクタ部の場合、基準データが、複数の論理ページ(重複割当ページ)で共有され、差分データが、重複割当ページ毎に個別に管理される。なお、重複割当ページのコード部は、どちらの形成方法の場合も、重複割当ページ毎に個別に管理される。図15Bは、例えば、第1の形成方法を適用したユーザデータAとD、第2の形成方法を適用したユーザデータBとCが、基準データを共有している様子を示した概念図である。ここでは、第1の形成方法におけるセクタ部そのものも基準データと呼ぶことにする。
本実施例によれば、重複割当ページのセクタ部において、第1の形成方法に加えて第2の形成方法も適用するため、フラッシュメモリ105の書込み量を削減することができる。その理由を以下に示す。
例えば、図15Bにおいて、ユーザデータAのセクタ部とユーザデータBのセクタ部の違いが100ビット目だけ(1ビットだけ)であるとする。従来技術(特許文献1も含む)が適用された場合、両者は異なるデータと判断され、重複割当ページとして管理されず、それぞれ別々に圧縮してフラッシュメモリ105へ格納される。本実施例では、ユーザデータBのセクタ部に第2の形成方法が適用されることで、ユーザデータAのセクタ部が基準データとなり、100ビット目が1で残り全部のビットが0のデータが差分データBとなる。これにより、フラッシュメモリ105には、圧縮された基準データ(セクタ部)と、圧縮された差分データBが書き込まれる。このとき、差分データBはゼロ値が長く連続するパタンを含むデータであるため、サイズは非常に小さくなる。結果として、ユーザデータAのセクタ部とユーザデータBのセクタ部を別々に圧縮してフラッシュメモリ105へ書き込まれるよりも、書込み量が少なくなる。
このように、本実施例によれば、複数の論理ページのセクタ部が完全に一致する場合のみならず、複数の論理ページのセクタ部に一致する部分が多い場合にも、重複排除を適用することで、フラッシュメモリ105の書込み量を削減でき、フラッシュメモリ105の長寿命化を図ることができる。
次に、図3を参照しながら、フラッシュメモリ105へのデータライト方法を示す。なお、図3において、塗りつぶし(模様)は、データ(ユーザデータ、セクタ部又はコード部)であることを意味し、白塗りは、ダミーデータ(ヌルデータ)であることを意味する。
これまで説明してきたように、FMコントローラ103は、図2Aまたは図2Bのデータフォーマットに従う基準データや差分データを、フラッシュメモリ105の書込み量を削減するために、圧縮伸張回路104により圧縮してからフラッシュメモリ105に書き込む。圧縮データのサイズは元の平文データ(平文データの構成)によって様々である。同じ値が連続するパタンを多く含むデータのサイズは圧縮により小さくなるが、ランダムパタンを多く含むデータのサイズは圧縮により大きくなることがある。それらの圧縮データ、および図2Cのデータフォーマットに従うコード部は、図3の左側に示すように、フラッシュメモリ105へライトされるまでDRAM106上のライトバッファで一時的に格納される。フラッシュメモリ105は、ページ単位でしかライトできないという特徴を持つため、FMコントローラ103は、ライトバッファの中の圧縮データを連結して、ページサイズ311を超えない最大サイズのデータを作り(連結されたデータの合計がページサイズ311に満たない場合は、連結されたデータにダミーデータを連結することでページサイズ311のデータを作り)、その作られたデータを、フラッシュメモリ105の未使用ページ305(例えば、物理ページP4)にライトする。ページ単位にデータをライトすることを「ページライト」と呼ぶことがある。ページライトのデータには誤り訂正符号に基づくパリティ(図示せず)が付加される。パリティの書込み先領域を提供するために、フラッシュメモリ105の物理ページのサイズ(8640バイト)は1つの論理ページのサイズ(8448バイト)よりも大きくなっている。
図3の右側には、フラッシュメモリ105の物理ページP0〜P3(301、302、303、304)に、圧縮データやコード部が格納されている状態の一例を示す。物理ページP0には、単独割当ページL0及びL6のそれぞれの基準データと、重複割当ページL4の差分データが格納されている。物理ページP1には、重複割当ページL1、L3、L4及びL7が共有する基準データが格納されている。物理ページP2には、単独割当ページL0の差分データ、及び、単独割当ページL5の基準データが格納されている。物理ページP3には、重複割当ページL1、L3、L4及びL7のそれぞれのコード部と、単独割当ページL2の基準データが格納されている。
次に、図4A、図4Bを参照しながら、フラッシュメモリ105にユーザデータがどのように格納されているかをFMコントローラ103が管理するために、DRAM106上に作成するアドレス変換テーブルと重複カウントテーブルについて説明する。
図4Aのアドレス変換テーブル400は、論理ページ毎に、論理ページアドレス410、基準データ格納先420、差分フラグ430、差分データ格納先440、重複フラグ450及びコード部アドレス460を含んだ情報を保持する。
論理ページアドレス410は、論理ページの先頭の論理アドレスである。
基準データ格納先420は、基準データを格納する物理アドレスPi[Ni](ページアドレスPi、セクタ番号Ni)と格納セクタサイズを含んだ情報である。
差分フラグ430は、差分の有無を表す。論理ページが第1の形成方法を適用した単独割当ページまたは重複割当ページである場合、差分フラグ430は「OFF」であり(差分無しを意味し)、論理ページが第2の形成方法を適用した単独割当ページまたは重複割当ページである場合、差分フラグ430は「ON」である(差分有りを意味する)。
差分データ格納先440は、差分フラグ430がONである場合に有効な情報であり、差分データを格納する物理アドレスPi[Ni](ページアドレスPi、セクタ番号Ni)と格納セクタサイズを含む情報である。
重複フラグ450は、重複排除技術が適用された論理ページか否かを表す。論理ページが単独割当ページである場合、重複フラグ450は「OFF」であり(重複排除技術が適用されていないことを意味し)、論理ページが重複割当ページである場合、重複フラグ450は「ON」である(重複排除技術が適用されていることを意味する)。
コード部アドレス460は、重複フラグ450が「ON」である場合に有効な情報であり、ユーザデータのコード部を格納する物理アドレスPi[Ni](ページアドレスPi、セクタ番号Ni)を含んだ情報である。なお、コード部のサイズは256バイトであり、格納セクタサイズは1で固定となるため、コード部アドレス460は、格納セクタサイズは含まないでよい。
なお、図4Aのアドレス変換テーブル400は、一例として、図3の右側に示した格納状態に従う情報(例えば論理ページL0〜L7の情報)を保持している。論理ページL0は、第2の形成方法を適用している単独割当ページであり、論理ページL1、L3及びL7は、それぞれ、第1の形成方法を適用している重複割当ページであり、論理ページL2、L5及びL6は、それぞれ、第1の形成方法を適用している単独割当ページであり、論理ページL4は、第2の形成方法を適用している重複割当ページである。
図4Bの重複カウントテーブル470は、複数の重複割当ページによって共有されている基準データ毎に、基準データアドレス480及び共有カウント490を含んだ情報を保持する。
基準データアドレス480は、基準データを格納する物理アドレスPi[Ni](ページアドレスPi、セクタ番号Ni)を含んだ情報である。
共有カウント490は、基準データを共有する論理ページ(重複割当ページ)の数を表す。
なお、図4Bの重複カウントテーブル470は、具体例として、図3の右側に示した格納状態、すなわち、物理ページP1のセクタ番号0から格納されている基準データを4個の論理ページL1、L3、L4及びL7が共有していることを表している。
次に、図5を参照しながら、FMモジュール100が上位装置(ストレージコントローラ1401)からのライトコマンドに従いユーザデータを更新する時の処理について説明する。FMモジュール100のFMコントローラ103は、フラッシュメモリ105の書込み量を小さくするために、この処理によって更新対象ユーザデータの形成方法として最適なものを選択する。
まず、FMコントローラ103は、ライトコマンドで指定された論理アドレスWaが属する論理ページアドレスLkを算出する(ステップ501)。FMコントローラ103は、算出した論理ページアドレスLkに対応した重複フラグ450が「OFF」か「ON」かを判断する(ステップ502)。「OFF」(単独割当ページ)ならば、ステップ503に遷移し、「ON」(重複割当ページ)ならば、ステップ504に遷移する。
ステップ503では、FMコントローラ103は、ライトコマンドに従うライトデータのセクタ数がページサイズ(16セクタ)であるか、それよりも小さいサイズであるかを判断する。ページサイズであるならば、FMコントローラ103は、ステップ600の単独割当ページの全体ライト処理を実行する。さもなくば、FMコントローラ103は、ステップ700の単独割当ページの部分ライト処理を実行する。
ステップ504では、FMコントローラ103は、ライトコマンドによってライトされるライトデータのセクタ数がページサイズ(16セクタ)であるか、それよりも小さいサイズであるかを判断する。ページサイズであるならば、FMコントローラ103は、ステップ800の重複割当ページの全体ライト処理を実行する。さもなくば、FMコントローラ103は、ステップ900の重複割当ページの部分ライト処理を実行する。
ここで、図10〜図13を用いて、ステップ600の単独割当ページの全体ライト処理、ステップ700の単独割当ページの部分ライト処理、ステップ800の重複割当ページの全体ライト処理、ステップ900の重複割当ページの部分ライト処理のそれぞれを詳細に説明する。
図10は、単独割当ページの全体ライト処理を示す。
この処理は、論理ページLkのユーザデータをライトデータWdに更新する際に、そのユーザデータの新しい形成方法を選択する処理である。すなわち、第1の形成方法を選択して、ライトデータWdを新しい基準データとして書き込むか、もしくは第2の形成方法を選択して、現在の基準データを変更せずにライトデータWdとの差分データを書き込むかが分かれる。
データ1010は、現在の基準データの圧縮データであり、フラッシュメモリ105に格納されている。第2の形成方法の差分データを作成するためには、その圧縮データをリードして伸張し、ライトデータWdと排他的論理和を計算(1040)する必要がある。
データ1020は、第1の形成方法のための新しい基準データの圧縮データであり、データ1030は、第2の形成方法のための差分データの圧縮データである。FMコントローラ103は、フラッシュメモリ105へのライトサイズが小さいほうを選ぶ。データ1020の方が小さい場合は、FMコントローラ103は、データ1020をライトして第1の形成方法を選ぶ。データ1030の方が小さい場合は、FMコントローラ103は、データ1030をライトして第2の形成方法を選ぶ。なお、サイズが同じなら、FMコントローラ103は、データ1020をライトして第1の形成方法を選ぶ。なぜなら、第2の形成方法では、ユーザデータのリード時に基準データと差分データの2つを読み出さなければならず、リード性能が劣るからである。
この処理では、ライトデータWdが現在の基準データとよく似たデータパタンであるほど、差分データはゼロ値の連続が多く含まれて小さく圧縮できるため、第2の形成方法の選択が有利になる。
なお、FMコントローラ103は、図10を参照して説明した方法でライトされたライトデータWdをリード対象としたリードコマンドを上位装置(ストレージコントローラ1401)から受信した場合、アドレス変換テーブル400を基に、ライトデータWdを復元し、ライトデータWdをリードデータとして上位装置に送信することができる。復元されたライトデータWdは、(1)データ1020を伸張することにより生成されたデータであるか、又は、(2)データ1030を伸張することにより得られた差分データ(新)とデータ1010を伸張することにより得られた基準データとの排他的論理和である。
図11は、単独割当ページの部分ライト処理を示す。
この処理は、論理ページLkのユーザデータの一部をライトデータWdで書き換える際に、書き換え後のユーザデータの新しい形成方法を選択する処理である。すなわち、第1の形成方法を選択して、書き換え後のユーザデータを新しい基準データとして書き込むか、もしくは第2の形成方法を選択して、現在の基準データを変更せずに書き換え後のユーザデータとの差分データを書き込むかが分かれる。
データ1110は、現在の基準データの圧縮データであり、データ1120は、現在の差分データの圧縮データであり、ともにフラッシュメモリ105に格納されている。第2の形成方法の差分データを作成するためには以下の処理を行う必要がある。すなわち、FMコントローラ103は、データ1110及び1120をそれぞれリードして伸張し、両者の排他的論理和を計算(1150)して現在のユーザデータを作成する。次に、FMコントローラ103は、ライトデータWdで現在のユーザデータの一部を書き換えて新しいユーザデータを作成し(1160)、新しいユーザデータと現在の基準データとの排他的論理和を計算(1170)して新しい差分データを作成する。
データ1130は、第1の形成方法のための新しい基準データの圧縮データであり、データ1140は、第2の形成方法のための差分データの圧縮データある。FMコントローラ103は、フラッシュメモリ105へのライトサイズが小さいほうを選ぶ。データ1130の方が小さい場合は、FMコントローラ103は、データ1130をライトして第1の形成方法を選ぶ。データ1140の方が小さい場合は、FMコントローラ103は、データ1140をライトして第2の形成方法を選ぶ。なお、サイズが同じなら、FMコントローラ103は、データ1130をライトして第1の形成方法を選ぶ。なぜなら、第2の形成方法では、ユーザデータのリード時に基準データと差分データの2つを読み出さなければならず、リード性能が劣るからである。
この処理では、ライトデータWdのサイズが小さい程(書き換え量が小さい程)、新しい差分データはゼロ値の連続が多く含まれて小さく圧縮できるため、第2の形成方法の選択が有利になる。
なお、FMコントローラ103は、図11を参照して説明した方法でライトされたライトデータWdをリード対象としたリードコマンドを上位装置から受信した場合、アドレス変換テーブル400を基に、ライトデータWdを復元し、ライトデータWdをリードデータとして上位装置に送信することができる。復元されたライトデータWdは、(1)データ1130を伸張することにより生成されたデータから抽出された部分データであるか、又は、(2)データ1140を伸張することにより得られた差分データ(新)とデータ1110を伸張することにより得られた基準データとの排他的論理和から抽出された部分データである。
図12は、重複割当ページの全体ライト処理を示す。
この処理は、論理ページLkのユーザデータをライトデータWdに更新する際に、論理ページLkの新しいページ種別と、そのユーザデータの新しい形成方法を選択する処理である。すなわち、単独割当ページの第1の形成方法を選択して、ライトデータWdを新しい基準データとして書き込むか、もしくは重複割当ページの第2の形成方法を選択して、現在の基準データを変更せずに差分データ(ライトデータWdとの差分データ)とコード部とを書き込むかが分かれる。
データ1210は、現在の基準データの圧縮データであり、フラッシュメモリ105に格納されている。重複割当ページの第2の形成方法の差分データを作成するためには、データ1210をリードして伸張し、ライトデータWdから分離(1240)したセクタ部と排他的論理和を計算(1250)する必要がある。
データ1220は、単独割当ページの第1の形成方法のための新しい基準データの圧縮データであり、データ1230は、重複割当ページの第2の形成方法のための差分データの圧縮データと、ライトデータWdから分離(1250)したコード部とが連結されたデータである。FMコントローラ103は、フラッシュメモリ105へのライトサイズが小さいほうを選ぶ。データ1220の方が小さい場合は、FMコントローラ103は、データ1220をライトして単独割当ページの第1の形成方法を選ぶ。データ1230の方が小さい場合は、FMコントローラ103は、データ1230をライトして重複割当ページの第2の形成方法を選ぶ。なお、サイズが同じなら、FMコントローラ103は、データ1220をライトして単独割当ページの第1の形成方法を選ぶ。なぜなら、重複割当ページの第2の形成方法では、ユーザデータのリード時に基準データと差分データとコード部の3つを読み出さなければならず、リード性能が劣るからである。
この処理では、ライトデータWdのセクタ部が現在の基準データとよく似たデータパタンであるほど、差分データはゼロ値の連続が多く含まれて小さく圧縮できるため、重複割当ページの第2の形成方法の選択が有利になる。
なお、FMコントローラ103は、図12を参照して説明した方法でライトされたライトデータWdをリード対象としたリードコマンドを上位装置から受信した場合、アドレス変換テーブル400を基に、ライトデータWdを復元し、ライトデータWdをリードデータとして上位装置に送信することができる。復元されたライトデータWdは、(1)データ1220を伸張することにより生成されたデータであるか、又は、(2)データ1230における圧縮差分データを伸張することにより得られた差分データ(新)とデータ1210を伸張することにより得られた基準データとの排他的論理和と、データ1230のうちのコード部(新)とで構成されたデータである。
図13は、重複割当ページの部分ライト処理を示す。
この処理は、論理ページLkのユーザデータの一部をライトデータWdで書き換える際に、論理ページLkの新しいページ種別と、書き換え後のユーザデータの新しい形成方法を選択する処理である。すなわち、単独割当ページの第1の形成方法を選択して、書き換え後のユーザデータを新しい基準データとして書き込むか、もしくは重複割当ページの第2の形成方法を選択して、現在の基準データを変更せずに差分データ(書き換え後のユーザデータとの差分データ)とコード部とを書き込むかが分かれる。
データ1310は、現在の基準データの圧縮データであり、データ1320は、現在の差分データの圧縮データであり、データ1330は、現在のコード部であり、それらはフラッシュメモリ105に格納されている。重複割当ページの第2の形成方法の差分データを作成するためには以下の処理を行う必要がある。すなわち、FMコントローラ103は、リードしてさらに伸張した、基準データと差分データとの排他的論理和を計算(1360)し、その計算(1360)により作成された排他的論理和データに、リードしたコード部を合成(1370)して現在のユーザデータを作成する。次に、FMコントローラ103は、ライトデータWdで現在のユーザデータの一部を書き換えて新しいユーザデータを作成し(1380)、新しいユーザデータから分離(1390)したセクタ部と、現在の基準データとの排他的論理和を計算(1300)して新しい差分データを作成する。
データ1340は、単独割当ページの第1の形成方法のための新しい基準データの圧縮データであり、データ1350は、重複割当ページの第2の形成方法のための差分データの圧縮データと、新しいユーザデータから分離(1390)したコード部とが連結されたデータである。FMコントローラ103は、フラッシュメモリ105へのライトサイズが小さいほうを選ぶ。データ1340の方が小さい場合は、FMコントローラ103は、データ1340をライトして単独割当ページの第1の形成方法を選ぶ。データ1350の方が小さい場合は、FMコントローラ103は、データ1350をライトして重複割当ページの第2の形成方法を選ぶ。なお、サイズが同じなら、FMコントローラ103は、データ1340をライトして単独割当ページの第1の形成方法を選ぶ。なぜなら、重複割当ページの第2の形成方法では、ユーザデータのリード時に基準データと差分データとコード部の3つを読み出さなければならず、リード性能が劣るからである。
この処理では、ライトデータWdが小さい程(書き換え量が小さい程)、新しい差分データはゼロ値の連続が多く含まれて小さく圧縮できるため、重複割当ページの第2の形成方法の選択が有利になる。
なお、FMコントローラ103は、図13を参照して説明した方法でライトされたライトデータWdをリード対象としたリードコマンドを上位装置から受信した場合、アドレス変換テーブル400を基に、ライトデータWdを復元し、ライトデータWdをリードデータとして上位装置に送信することができる。復元されたライトデータWdは、(1)データ1340を伸張することにより生成されたデータから抽出された部分データであるか、又は、(2)データ1350における圧縮差分データを伸張することにより得られた差分データ(新)とデータ1310を伸張することにより得られた基準データとの排他的論理和と、データ1350のうちのコード部(新)とで構成されたデータから抽出された部分データである。
ステップ600の単独割当ページの全体ライト処理の流れについて、図6を参照しながら説明する。なお、以下、説明の冗長を避けるため、FMコントローラ103の圧縮伸張回路104による圧縮/伸張を、FMコントローラ103による圧縮/伸張と説明し、FMコントローラ103のXOR回路107による排他的論理和の計算を、FMコントローラ103による排他的論理和の計算と説明する。また、ステップ501で算出した論理ページアドレスLkが属する論理ページを「論理ページLk」と言う。
まず、FMコントローラ103は、ステップ501で算出した論理ページアドレスLkに対応した基準データ格納先420(物理アドレスPx[Nx]と格納セクタサイズSx)を取得する(ステップ601)。FMコントローラ103は、その基準データ格納先420が表す物理領域から、論理ページLkの圧縮基準データ(圧縮されている基準データ)をリードし、その圧縮基準データを伸張することで基準データ(平文状態)を復元する(ステップ602)。
次に、FMコントローラ103は、論理ページLkの基準データ(ステップ602で復元された基準データ)とライトデータWdとの排他的論理和を計算することで論理ページLkの差分データを作成し、その差分データを圧縮することで圧縮差分データを作成する(ステップ603)。
一方で、FMコントローラ103は、ライトデータWdを圧縮することで圧縮ライトデータを作成する(ステップ604)。
FMコントローラ103は、ステップ603の結果データ(圧縮差分データ)のサイズとステップ604の結果データ(圧縮ライトデータ)のサイズとを比較し、小さい方を選択してフラッシュメモリ105へライトする(ステップ605)。なお、サイズが同じならステップ604の結果データが選択される。
ステップ603の結果データを選択した場合は、論理ページLkのユーザデータは第2の形成方法の適用になるので、FMコントローラ103は、論理ページLkに対応した差分フラグ430を「ON」に設定し、ステップ604の結果データを選択した場合は、論理ページLkのユーザデータは第1の形成方法の適用になるので、論理ページLkに対応した差分フラグ430を「OFF」に設定する(ステップ606)。
以上で単独割当ページの全体ライト処理が終わり、図5のステップ505に遷移する。
ステップ700の単独割当ページの部分ライト処理の流れについて、図7を参照しながら説明する。
まず、FMコントローラ103は、ステップ501で算出した論理ページアドレスLkに対応した基準データ格納先420(物理アドレスPx[Nx]と格納セクタサイズSx)を取得する(ステップ701)。FMコントローラ103は、その基準データ格納先420が表す物理領域から、論理ページLkの圧縮基準データをリードし、その圧縮基準データを伸張することで基準データ(平文状態)を復元する(ステップ702)。
次に、ステップ703として、FMコントローラ103は、論理ページLkに対応した差分フラグ430を調べ、「OFF」ならばステップ704に、「ON」ならばステップ705に遷移する。
ステップ704では、FMコントローラ103は、差分データが存在しないので、ステップ702の結果データ(復元された基準データ)を論理ページLkの現在のユーザデータとし、ステップ708に遷移する。
一方、ステップ705では、FMコントローラ103は、現在の差分データを得るため、論理ページアドレスLkに対応した差分データ格納先440(物理アドレスPy[Ny]と格納セクタサイズSy)を取得する。FMコントローラ103は、その差分データ格納先440が表す物理領域から、論理ページLkの圧縮差分データ(圧縮された差分データ)をリードし、その圧縮差分データを伸張することにより差分データ(平文状態)を復元する(ステップ706)。そして、FMコントローラ103は、論理ページLkの基準データと差分データとの排他的論理和を計算することで論理ページLkの現在のユーザデータを作成する(ステップ707)。その後、ステップ708に遷移する。
ステップ708では、FMコントローラ103は、論理ページLkの現在のユーザデータにおいて、ライトコマンドで指定されたアドレスWaの部分をライトデータWdで書き換え、論理ページLkの新しいユーザデータを作成する。
次に、FMコントローラ103は、論理ページLkの現在の基準データと新しいユーザデータとの排他的論理和を計算することで論理ページLkの新しい差分データを作成し、その新しい差分データを圧縮することにより圧縮差分データを作成する(ステップ709)。
一方で、FMコントローラ103は、論理ページLkの新しいユーザデータを圧縮することにより圧縮ユーザデータを作成する(ステップ710)。
FMコントローラ103は、ステップ709の結果データ(圧縮差分データ)のサイズとステップ710の結果データ(圧縮ユーザデータ)のサイズとを比較し、小さい方を選択してフラッシュメモリ105へライトする(ステップ711)。なお、サイズが同じならステップ710の結果データが選択される。
ステップ709の結果データを選択した場合は、論理ページLkのユーザデータは第2の形成方法の適用になるので、FMコントローラ103は、論理ページアドレスLkに対応した差分フラグ430を「ON」に設定し、ステップ710の結果データを選択した場合は、論理ページLkのユーザデータは第1の形成方法の適用になるので、論理ページアドレスLkに対応した差分フラグ430を「OFF」に設定する(712)。
以上で単独割当ページの部分ライト処理が終わり、図5のステップ505に遷移する。
ステップ800の重複割当ページの全体ライト処理の流れについて、図8を参照しながら説明する。
まず、FMコントローラ103は、ステップ501で算出した論理ページアドレスLkに対応した基準データ格納先420(物理アドレスPx[Nx]と格納セクタサイズSx)を取得する(ステップ801)。FMコントローラ103は、その基準データ格納先420が表す物理領域から、論理ページLkの圧縮基準データをリードし、その圧縮基準データを伸張することで基準データ(平文状態)を復元する(ステップ802)。
次に、FMコントローラ103は、論理ページLkの基準データとライトデータWdから分離したセクタ部との排他的論理和を計算することにより論理ページLkの差分データを作成し、その差分データを圧縮することにより圧縮差分データを作成する(ステップ803)。さらに、FMコントローラ103は、ライトデータWdから分離したコード部を論理ページLkの新しいコード部とし(ステップ804)、それをステップ803の結果データ(圧縮差分データ)に結合する(ステップ805)。
一方で、FMコントローラ103は、ライトデータWdを圧縮することにより圧縮ライトデータを作成する(ステップ806)。
FMコントローラ103は、ステップ805の結果データ(圧縮差分データ+新しいコード部)のサイズとステップ806の結果データ(圧縮ライトデータ)のサイズとを比較し、小さい方を選択してフラッシュメモリ105へライトする(ステップ807)。なお、サイズが同じならステップ806の結果データが選択される。
ステップ805の結果データを選択した場合は、論理ページLkのユーザデータは第2の形成方法の適用になるので、FMコントローラ103は、論理ページアドレスLkに対応した差分フラグ430を「ON」に設定し、ステップ806の結果データを選択した場合は、論理ページLkのユーザデータは第1の形成方法の適用になるので、論理ページアドレスLkに対応した差分フラグ430を「OFF」に設定する(ステップ808)。
以上で重複割当ページの全体ライト処理が終わり、図5のステップ509に遷移する。
ステップ900の重複割当ページの部分ライト処理の流れについて、図9を参照しながら説明する。
まず、FMコントローラ103は、ステップ501で算出した論理ページアドレスLkに対応した基準データ格納先420(物理アドレスPx[Nx]と格納セクタサイズSx)を取得する(ステップ901)。FMコントローラ103は、その基準データ格納先420が表す物理領域から、論理ページLkの圧縮基準データ(圧縮されている基準データ)をリードし、その圧縮基準データを伸張することで基準データ(平文状態)を復元する(ステップ902)。
次に、ステップ903として、FMコントローラ103は、論理ページLkに対応した差分フラグ430を調べ、「OFF」ならばステップ904に、「ON」ならばステップ906に遷移する。
ステップ904では、FMコントローラ103は、論理ページLkに対応したコード部アドレス460(物理アドレスPz[Nz])を取得する。FMコントローラ103は、そのコード部アドレス460が表す物理領域から、論理ページLkの現在のコード部をリードし、そのコード部を、ステップ902で得られた基準データと合成して、論理ページLkの現在のユーザデータを作成する(ステップ905)。その後、ステップ909に遷移する。
一方、ステップ906では、FMコントローラ103は、現在の差分データとコード部を得るため、論理ページLkに対応した差分データ格納先440(物理アドレスPy[Ny]と格納セクタサイズSy)及びコード部アドレス460(物理アドレスPz[Nz])を取得する。FMコントローラ103は、そのた差分データ格納先440が表す物理領域から、論理ページLkの圧縮差分データをリードし、その圧縮差分データを伸張することにより差分データ(平文状態)を復元する(ステップ907)。そして、FMコントローラ103は、ステップ906で取得されたコード部アドレス460(Pz[Nz])が表す物理領域から論理ページLkのコード部をリードし、論理ページLkの基準データと差分データとの排他的論理和を計算し、その計算結果に、上記リードした論理ページLkのコード部を合成することで、論理ページLkの現在のユーザデータを作成する(ステップ908)。その後、ステップ909に遷移する。
ステップ909では、FMコントローラ103は、論理ページLkの現在のユーザデータにおいて、ライトコマンドで指定されたアドレスWaの部分をライトデータWdで書き換え、論理ページLkの新しいユーザデータを作成する。
次に、FMコントローラ103は、論理ページLkの現在の基準データと新しいユーザデータのセクタ部との排他的論理和を計算することで論理ページLkの新しい差分データを作成し、その差分データを圧縮することにより圧縮差分データを作成する(ステップ910)。そして、FMコントローラ103は、その結果データ(圧縮差分データ)に、新しいユーザデータから分離したコード部を結合する(ステップ911)。
一方で、FMコントローラ103は、論理ページLkの新しいユーザデータを圧縮することにより圧縮ユーザデータを作成する(ステップ912)。
FMコントローラ103は、ステップ911の結果データ(圧縮差分データ+コード部)のサイズとステップ912の結果データ(圧縮ユーザデータ)のサイズとを比較し、小さい方を選択してフラッシュメモリ105へライトする(ステップ913)。なお、サイズが同じならステップ912の結果データが選択される。
ステップ911の結果データを選択した場合は、論理ページLkのユーザデータは第2の形成方法の適用になるので、FMコントローラ103は、論理ページアドレスLkに対応した差分フラグ430を「ON」に設定し、ステップ912の結果データを選択した場合は、論理ページLkのユーザデータは第1の形成方法の適用になるので、論理ページアドレスLkに対応した差分フラグ430を「OFF」に設定する(ステップ914)。
以上で重複割当ページの部分ライト処理が終わり、図5のステップ509に遷移する。
次に、図5のステップ505以降を参照しながら、図6、図7の2つのライト処理の後の処理について説明する。
ステップ505では、FMコントローラ103は、単独割当ページの全体ライト処理、部分ライト処理のそれぞれ最後のステップにおいて、論理ページアドレスLkの差分フラグ430が「OFF」に設定されたか「ON」に設定されたかを調べる。「OFF」の場合は、第1の形成方法になったことを意味し、ステップ506に遷移する。「ON」の場合は、第2の形成方法になったことを意味し、ステップ508に遷移する。
ステップ506では、FMコントローラ103は、論理ページアドレスLkに対応した基準データ格納先420を、フラッシュメモリ105にライトした新しい基準データ(圧縮状態)の物理アドレスと格納セクタサイズに更新する。そして、FMコントローラ103は、物理アドレスPx[Nx]に残された更新前の基準データを無効化する(ステップ507)。以上で、ライトコマンド処理が終わる。
ステップ508では、FMコントローラ103は、論理ページアドレスLkに対応した差分データ格納先440を、フラッシュメモリ105にライトした新しい差分データ(圧縮状態)の物理アドレスと格納セクタサイズに更新する。FMコントローラ103は、物理アドレスPy[Ny]に更新前の差分データが残されていれば(つまり、ライト処理の前、差分フラグ430がONであった場合は)、それを無効化する。以上でライトコマンド処理が終わる。
次に、図5のステップ509以降を参照しながら、図8、図9の2つのライト処理の後の処理について説明する。
ステップ509では、FMコントローラ103は、重複割当ページの全体ライト処理、部分ライト処理のそれぞれ最後のステップにおいて、論理ページLkの差分フラグ430が「OFF」に設定されたか「ON」に設定されたかを調べる。「OFF」の場合は、単独割当ページの第1の形成方法になったことを意味し、ステップ510に遷移する。「ON」の場合は、重複割当ページの第2の形成方法になったことを意味し、ステップ514に遷移する。
ステップ510では、FMコントローラ103は、論理ページアドレスLkに対応した基準データ格納先を、フラッシュメモリ105にライトした新しい基準データ(圧縮状態)の物理アドレスと格納セクタサイズに更新する。これによって、物理アドレスPx[Nx]に残された更新前の基準データを共有している論理ページの数は1つ減ることになるので、FMコントローラ103は、重複カウントテーブル470において、更新前の基準データに対応する共有カウントの値を1つ減算する(ステップ511)。さらに、この減算によって共有カウントの値が0になったならば、もう更新前の基準データを利用している論理ページは存在しないことになるので、FMコントローラ103は、更新前の基準データを無効化する(ステップ512)。そして、FMコントローラ103は、論理ページアドレスLkに対応した重複フラグ450を「OFF」に設定することで論理ページLkを単独割当ページに変更する(ステップ513)。以上でライトコマンド処理が終わる。
ステップ514では、FMコントローラ103は、論理ページアドレスLkに対応した差分データ格納先440を、フラッシュメモリ105にライトした新しい差分データ(圧縮状態)の物理アドレスと格納セクタサイズに更新し、論理ページアドレスLkに対応したコード部アドレス460を、フラッシュメモリ105にライトした新しいコード部の物理アドレスに更新し、物理アドレスPz[Nz]にある更新前のコード部を無効化する。物理アドレスPy[Ny]に更新前の差分データが残されていれば(つまり、ライト処理の前、差分フラグ430が「ON」であった場合は)、FMコントローラ103は、その更新前の差分データも無効化する。以上でライトコマンド処理が終わる。
上述した実施例によれば、更新前後のユーザデータの差分が少ない場合には、更新前のユーザデータが無効化されて更新後のユーザデータそれ自体が書き込まれるのではなく、更新前後のユーザデータの排他的論理和である差分データが圧縮されたものが書き込まれる傾向にある。これにより、フラッシュメモリ105の書込み量を削減でき、フラッシュメモリ105の長寿命化を図ることができる。
また、本実施例では、差分データを排他的論理和で作成する方法が採用されている。この方法は、更新された部分が1つの物理ページ内に数多く散在していても、各々の更新部分の位置を1つ1つ管理する必要がないという特徴がある。これにより、差分に関する管理情報のサイズを小さくできるので、メモリ容量を節約できる効果がある。
なお、単独割当ページの全体ライト処理600、単独割当ページの部分ライト処理700、重複割当ページの全体ライト処理800、及び、重複割当ページの部分ライト処理900のうちの少なくとも1つにおいては、幾つかの変形例も可能である。
第1の変形例では、データ(基準データ及び差分データの少なくとも一方)の圧縮効果がない場合には、データは、平文状態のままフラッシュメモリ105にライトされてよい。データが平文状態でライトされれば、そのデータをリードする際に伸張処理の時間が削減できるため、FMモジュール100のリード応答性能が向上する。
第2の変形例では、XOR回路107によって作成された差分データが全てゼロ値(所定ビット値又は所定バイト値)からなるデータの場合、FMコントローラ103は、以降の圧縮処理をせず、フラッシュメモリ105に差分データをライトせず、論理ページLkに対応した差分フラグ430を「OFF」に設定(差分データを利用しない第1の形成方法を選択)して、すぐにライトコマンド処理を終えてもよい。これにより、フラッシュメモリ105の書込み量を削減できる。また、差分データの圧縮処理時間、フラッシュメモリ105へのライトの時間も削減でき、FMモジュール100のライトコマンド処理性能も向上する。
第3の変形例では、XOR回路107によって作成された差分データにおける非ゼロ値の数が所定個数以下ならば(つまり更新部分が少なければ)、FMコントローラ103は、論理ページLkに対応した差分フラグ430を「ON」に設定(差分データを利用する第2の形成方法を選択)して、ユーザデータ(更新データ)の圧縮処理を行うことなくライトコマンド処理を終えてもよい。つまり、圧縮ユーザデータを作成して上述したような比較を行うことなく、ライトコマンド処理が終了してよい。
第4の変形例では、ユーザデータのセクタ部のサイズが所定サイズ以下ならば(つまり更新部分が少なければ)、FMコントローラ103は、論理ページLkに対応した差分フラグ430を「ON」に設定(差分データを利用する第2の形成方法を選択)して、ユーザデータ(セクタ部)の圧縮処理を行うことなくライトコマンド処理を終えてもよい。つまり、圧縮ユーザデータを作成して上述したような比較を行うことなく、ライトコマンド処理が終了してよい。
第5の変形例では、ライトコマンドに従うライトデータがオールゼロなどの固定パタン(例えばフォーマットのためのデータ)ならば、FMコントローラ103は、論理ページLkに対応した差分フラグ430を「OFF」に設定(差分データを利用しない第1の形成方法を選択)して、差分データの生成及び圧縮処理を行うことなくライトコマンド処理を終えてもよい。
以上、幾つかの実施例及び変形例を説明したが、これらは本発明の説明のための例示であって、本発明の範囲をこれらの実施例及び変形例にのみ限定する趣旨ではない。本発明は、他の種々の形態でも実施することが可能である。
例えば、単独割当ページと重複割当ページの少なくとも一方において、必ずしもデータサイズの比較は行われなくてもよい。例えば、一定回数第2の形成方法が選択された後に第1の形成方法が選択されその後再び一定回数第2の形成方法が選択されるといったことが行われてもよい。
また、例えば、FMモジュール100を有する装置は、ストレージ装置1400に限らず、図16に示すように、ホスト1421であってもよい。例えば、ホスト1421(例えばサーバ装置)は、I/F1604、FMモジュール100及びそれらに接続されたCPU1602を有してよい(ホスト1421は、更に、FMモジュール100とは別の種類の記憶デバイス(例えばDRAM)を有してもよい)。FMモジュール100の全部又は一部は、ホスト1421により入出力されるデータのキャッシュメモリとして利用されてよい。図16では、FMモジュール100の上位装置はCPU1602でよい。ホスト1421では、キャッシュメモリのデータを頻繁に書き換えるようなアプリケーションを実行することがあるため、フラッシュメモリ105の書込み量を削減できる本実施例に従うFMモジュール100は、ホスト1421にも有効である。
100…FMモジュール、103…FMコントローラ、104…圧縮伸張回路、105…フラッシュメモリ、106…DRAM、107…XOR回路

Claims (15)

  1. 上位装置に接続される記憶デバイスであって、
    記憶媒体と、
    前記記憶媒体に対するI/O(Input/Output)を制御し前記記憶媒体に基づく論理空間を前記上位装置に提供する媒体コントローラと
    を有し、
    前記論理空間は、複数の論理領域で構成されており、
    各論理領域について基準データ範囲が前記記憶媒体に存在し、
    前記媒体コントローラは、
    ライト先論理アドレスを指定したライトコマンドを前記上位装置から受信し、
    前記ライト先論理アドレスが属するライト先論理領域に対応した基準データ範囲から基準データをリードし、
    前記基準データである第1データと、前記ライトコマンドに従うライトデータに基づくデータと前記ライトデータとのいずれかである第2データとの排他的論理和である差分データを作成し、
    前記差分データを圧縮することにより圧縮差分データを作成し、
    前記圧縮差分データを前記記憶媒体にライトし、
    前記圧縮差分データがライトされた範囲である差分データ範囲を前記ライト先論理領域に関連付ける、
    記憶デバイス。
  2. 前記媒体コントローラは、
    前記第2データ又は前記第2データに基づくデータを圧縮することにより圧縮第2データを生成し、
    前記圧縮第2データよりも前記圧縮差分データを含んだ第3データが小さければ、前記第3データを含む前記圧縮差分データを前記記憶媒体にライトし、
    前記第3データは、前記圧縮差分データ、又は、前記第1データ内の1以上の保証コードであるコード部と前記圧縮差分データとで構成されたデータである、
    請求項1記載の記憶デバイス。
  3. 前記媒体コントローラは、前記第3データよりも前記圧縮第2データが小さければ、前記第3データではなく前記圧縮第2データを前記記憶媒体にライトし、
    前記媒体コントローラは、前記圧縮第2データを前記記憶媒体にライトする場合、前記ライト先論理領域の基準データ範囲を、前記ライト先論理領域に関連付けられている基準データ範囲から、前記圧縮第2データがライトされた範囲である圧縮第2データ範囲に更新する、
    請求項2記載の記憶デバイス。
  4. 前記媒体コントローラは、前記圧縮第2データのサイズが前記第3データのサイズと同じであれば、前記第3データではなく前記圧縮第2データを前記記憶媒体にライトする、
    請求項3記載の記憶デバイス。
  5. 前記媒体コントローラは、前記第3データを前記記憶媒体にライトし、且つ、前記ライト先論理領域に既に差分データ範囲が関連付けられている場合、前記ライト先論理領域の差分データ範囲を、前記ライト先論理領域に関連付けられている差分データ範囲から、前記第3データがライトされた範囲である第3データ範囲に更新する、
    請求項2記載の記憶デバイス。
  6. 前記記憶媒体は、複数の物理領域で構成されており、物理領域単位でデータの入出力が行われるようになっており、
    前記第1データは、物理領域単位の前記基準データであり、
    前記第2データは、物理領域単位の前記ライトデータであり、
    前記差分データは、物理領域単位の前記基準データと物理領域サイズの前記ライトデータとの排他的論理和である、
    請求項1記載の記憶デバイス。
  7. 前記記憶媒体は、複数の物理領域で構成されており、物理領域単位でデータの入出力が行われるようになっており、
    前記第1データは、物理領域単位の前記基準データであり、
    前記第2データは、物理領域単位の更新後データであり、
    物理領域単位の前記更新後データは、
    物理領域単位の前記基準データと物理領域単位未満の前記ライトデータとに基づいて生成されたデータ、又は、
    物理領域単位の前記基準データと前記ライト先論理領域に関連付けられている前記差分データとの排他的論理和により生成された物理領域単位の更新前データと、物理領域単位未満の前記ライトデータとに基づいて生成されたデータ、
    であり、
    前記差分データは、物理領域単位の前記基準データと物理領域単位の前記更新後データとの排他的論理和である、
    請求項1記載の記憶デバイス。
  8. 前記記憶媒体は、複数の物理領域で構成されており、物理領域単位でデータの入出力が行われるようになっており、
    前記ライト先論理領域を含む2以上の論理領域が同一の基準データ範囲に関連付けられており、
    前記第1データは、物理領域単位のデータのうちの1以上の保証コード以外のデータ部である基準実データ部であり、
    前記第2データは、物理領域単位の前記ライトデータのうちの1以上の保証コード以外のデータ部であるライト実データ部であり、
    前記差分データは、前記基準実データ部と前記ライト実データ部との排他的論理和であり、
    前記媒体コントローラは、前記圧縮差分データと、物理領域単位の前記ライトデータのうちの1以上の保証コードであるコード部とで構成された第3データを前記記憶媒体にライトする、
    請求項1記載の記憶デバイス。
  9. 前記媒体コントローラは、
    物理領域単位の前記ライトデータを圧縮することにより圧縮ライトデータを生成し、
    前記圧縮ライトデータよりも前記第3データが小さければ、前記第3データを前記記憶媒体にライトし、
    前記第3データよりも前記圧縮ライトデータが小さければ、前記第3データではなく前記圧縮ライトデータを前記記憶媒体にライトする、
    請求項8記載の記憶デバイス。
  10. 前記記憶媒体は、複数の物理領域で構成されており、物理領域単位でデータの入出力が行われるようになっており、
    前記ライト先論理領域を含む2以上の論理領域が同一の基準データ範囲に関連付けられており、
    前記第1データは、物理領域単位のデータのうちの1以上の保証コード以外のデータ部である基準実データ部であり、
    前記第2データは、物理領域単位の更新後データであり、
    物理領域単位の前記更新後データは、
    前記基準実データ部と、前記ライト先論理領域に関連付けられており前記記憶媒体に格納されている1以上の保証コードである格納コード部とで構成されたデータ、又は、
    物理領域単位の暫定データと、物理領域単位未満の前記ライトデータとに基づいて生成されたデータ、
    であり、
    物理領域単位の前記暫定データは、前記基準実データ部と前記ライト先論理領域に関連付けられている前記差分データとの排他的論理和により生成された更新前データと、前記格納コード部とで構成されたデータであり、
    前記差分データは、物理領域単位の前記更新後データのうちの1以上の保証コード以外のデータ部である更新後実データ部と、前記基準実データ部との排他的論理和であり、
    前記媒体コントローラは、前記圧縮差分データと、物理領域単位の前記更新後データのうちの1以上の保証コードであるコード部とで構成された第3データを前記記憶媒体にライトする、
    請求項1記載の記憶デバイス。
  11. 前記媒体コントローラは、
    物理領域単位の前記更新後データを圧縮することにより圧縮更新後データを生成し、
    前記圧縮更新後データよりも前記第3データが小さければ、前記第3データを前記記憶媒体にライトし、
    前記第3データよりも前記圧縮更新後データが小さければ、前記第3データではなく前記圧縮更新後データを前記記憶媒体にライトする、
    請求項10記載の記憶デバイス。
  12. 前記媒体コントローラは、前記差分データにおいて所定値の数が所定数以上であれば、前記第3データを前記記憶媒体にライトする、
    請求項2記載の記憶デバイス。
  13. 前記媒体コントローラは、前記差分データが全て所定値で構成されたデータであれば、又は、前記ライトデータが所定パタンのデータであれば、前記圧縮第2データを前記記憶媒体にライトする、
    請求項2記載の記憶デバイス。
  14. 記憶デバイスと、
    前記記憶デバイスに対するI/Oを制御するプロセッサと
    を有し、
    前記記憶デバイスは、記憶媒体と、前記記憶媒体に対するI/Oを制御し前記記憶媒体に基づく論理空間を前記プロセッサに提供する媒体コントローラと
    を有し、
    前記論理空間は、複数の論理領域で構成されており、
    各論理領域について基準データ範囲が前記記憶媒体に存在し、
    前記媒体コントローラは、
    ライト先論理アドレスを指定したライトコマンドを前記プロセッサから受信し、
    前記ライト先論理アドレスが属するライト先論理領域に対応した基準データ範囲から基準データをリードし、
    前記基準データである第1データと、前記ライトコマンドに従うライトデータに基づくデータと前記ライトデータとのいずれかである第2データとの排他的論理和である差分データを作成し、
    前記差分データを圧縮することにより圧縮差分データを作成し、
    前記圧縮差分データを前記記憶媒体にライトし、
    前記圧縮差分データがライトされた範囲である差分データ範囲を前記ライト先論理領域に関連付ける、
    装置。
  15. 記憶媒体に基づく空間であり複数の論理領域で構成された論理空間を上位装置に提供し、
    ライト先論理アドレスを指定したライトコマンドを前記上位装置から受信し、
    前記複数の論理領域に対応付けられている複数の基準データ範囲のうちの、前記ライト先論理アドレスが属するライト先論理領域に対応した基準データ範囲から、基準データをリードし、
    前記基準データである第1データと、前記ライトコマンドに従うライトデータに基づくデータと前記ライトデータとのいずれかである第2データとの排他的論理和である差分データを作成し、
    前記差分データを圧縮することにより圧縮差分データを作成し、
    前記圧縮差分データを前記記憶媒体にライトし、
    前記圧縮差分データがライトされた範囲である差分データ範囲を前記ライト先論理領域に関連付ける、
    記憶制御方法。
JP2016504903A 2014-02-26 2014-02-26 記憶デバイス、記憶デバイスを有する装置、及び記憶制御方法 Expired - Fee Related JP6134857B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2014/054643 WO2015128955A1 (ja) 2014-02-26 2014-02-26 記憶デバイス、記憶デバイスを有する装置、及び記憶制御方法

Publications (2)

Publication Number Publication Date
JPWO2015128955A1 true JPWO2015128955A1 (ja) 2017-03-30
JP6134857B2 JP6134857B2 (ja) 2017-05-24

Family

ID=54008327

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016504903A Expired - Fee Related JP6134857B2 (ja) 2014-02-26 2014-02-26 記憶デバイス、記憶デバイスを有する装置、及び記憶制御方法

Country Status (3)

Country Link
US (1) US10444992B2 (ja)
JP (1) JP6134857B2 (ja)
WO (1) WO2015128955A1 (ja)

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170038978A1 (en) * 2015-08-05 2017-02-09 HGST Netherlands B.V. Delta Compression Engine for Similarity Based Data Deduplication
US11625181B1 (en) 2015-08-24 2023-04-11 Pure Storage, Inc. Data tiering using snapshots
US11294588B1 (en) * 2015-08-24 2022-04-05 Pure Storage, Inc. Placing data within a storage device
US9841918B2 (en) * 2015-12-02 2017-12-12 Samsung Electronics Co., Ltd. Flash memory device including deduplication, and related methods
JP6680057B2 (ja) 2016-04-13 2020-04-15 富士通株式会社 情報記憶装置、重複除去方法、および重複除去プログラム
US11481114B2 (en) 2016-11-08 2022-10-25 Hitachi, Ltd. Storage apparatus and control method of storage apparatus
US10282127B2 (en) 2017-04-20 2019-05-07 Western Digital Technologies, Inc. Managing data in a storage system
US10809928B2 (en) 2017-06-02 2020-10-20 Western Digital Technologies, Inc. Efficient data deduplication leveraging sequential chunks or auxiliary databases
US10846023B2 (en) * 2017-06-20 2020-11-24 Hitachi, Ltd. Storage device and storage area management method for reducing garbage collection processing
US10503608B2 (en) 2017-07-24 2019-12-10 Western Digital Technologies, Inc. Efficient management of reference blocks used in data deduplication
JP2019057074A (ja) 2017-09-20 2019-04-11 東芝メモリ株式会社 メモリシステム
JP6826021B2 (ja) * 2017-11-20 2021-02-03 株式会社日立製作所 ストレージシステム
US11138154B2 (en) 2019-05-03 2021-10-05 EMC IP Holding Company, LLC System and method for offset-based deduplication
US10817475B1 (en) 2019-05-03 2020-10-27 EMC IP Holding Company, LLC System and method for encoding-based deduplication
US10990565B2 (en) 2019-05-03 2021-04-27 EMC IP Holding Company, LLC System and method for average entropy calculation
US10963437B2 (en) * 2019-05-03 2021-03-30 EMC IP Holding Company, LLC System and method for data deduplication
US10733158B1 (en) 2019-05-03 2020-08-04 EMC IP Holding Company LLC System and method for hash-based entropy calculation
US11068208B2 (en) * 2019-10-29 2021-07-20 EMC IP Holding Company LLC Capacity reduction in a storage system
US11144208B2 (en) * 2019-12-23 2021-10-12 Advanced Micro Devices, Inc. Data compression system using base values and methods thereof
JP7017654B2 (ja) * 2021-01-14 2022-02-08 株式会社日立製作所 ストレージシステム
US20220236870A1 (en) * 2021-01-26 2022-07-28 EMC IP Holding Company LLC Method and system for compression in block-based storage systems
TWI811674B (zh) * 2021-05-06 2023-08-11 大陸商北京集創北方科技股份有限公司 快閃記憶體的操作方法、系統單晶片及資訊處理裝置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05324485A (ja) * 1992-05-20 1993-12-07 Fujitsu F I P Kk ファイル圧縮暗号処理装置
US6256232B1 (en) * 2000-07-07 2001-07-03 Institute For Information Industry Data access method capable of reducing the number of erasing to flash memory and data patch and access device using the same
JP2006065424A (ja) * 2004-08-25 2006-03-09 Nec Corp データ記憶システム、データ記憶装置及びそれに用いる類似ファイル記録方法並びにそのプログラム
JP2011034370A (ja) * 2009-08-03 2011-02-17 Fujitsu Ltd メモリコントローラ
JP2011505046A (ja) * 2007-11-28 2011-02-17 サンドフォース インコーポレイテッド メモリの寿命を延長するためにメモリ内のスペア領域を増加させること
JP2013532853A (ja) * 2010-10-26 2013-08-19 株式会社日立製作所 ストレージ装置及びデータ制御方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05324485A (ja) * 1992-05-20 1993-12-07 Fujitsu F I P Kk ファイル圧縮暗号処理装置
US6256232B1 (en) * 2000-07-07 2001-07-03 Institute For Information Industry Data access method capable of reducing the number of erasing to flash memory and data patch and access device using the same
JP2006065424A (ja) * 2004-08-25 2006-03-09 Nec Corp データ記憶システム、データ記憶装置及びそれに用いる類似ファイル記録方法並びにそのプログラム
JP2011505046A (ja) * 2007-11-28 2011-02-17 サンドフォース インコーポレイテッド メモリの寿命を延長するためにメモリ内のスペア領域を増加させること
JP2011034370A (ja) * 2009-08-03 2011-02-17 Fujitsu Ltd メモリコントローラ
JP2013532853A (ja) * 2010-10-26 2013-08-19 株式会社日立製作所 ストレージ装置及びデータ制御方法

Also Published As

Publication number Publication date
WO2015128955A1 (ja) 2015-09-03
JP6134857B2 (ja) 2017-05-24
US20160328154A1 (en) 2016-11-10
US10444992B2 (en) 2019-10-15

Similar Documents

Publication Publication Date Title
JP6134857B2 (ja) 記憶デバイス、記憶デバイスを有する装置、及び記憶制御方法
US8799562B2 (en) Storage apparatus and data control method for generating and storing format data and guarantee codes
US10572187B2 (en) Controller, data storage device, and computer program product
US9910748B2 (en) Rebuilding process for storage array
JP5026213B2 (ja) ストレージ装置及びデータ重複排除方法
JP5937697B2 (ja) ストレージシステム
CN110832590A (zh) 在基于相变存储器的存储设备中减轻写入放大的方法和系统
US9304685B2 (en) Storage array system and non-transitory recording medium storing control program
JP6007332B2 (ja) ストレージシステム及びデータライト方法
WO2014170984A1 (ja) ストレージシステム及び記憶制御方法
WO2016135954A1 (ja) ストレージ装置および不揮発メモリデバイス
JP6692448B2 (ja) ストレージ装置及びストレージ装置の制御方法
KR101472797B1 (ko) 데이터를 읽거나 쓰기 위한 방법 및 장치
WO2015029230A1 (ja) 記憶装置及びデータ制御方法
JP2020149195A (ja) メモリシステム
US10846234B2 (en) Storage control system and storage control method
JP6050794B2 (ja) フラッシュメモリモジュール、不揮発性半導体メモリモジュール及びストレージ装置
WO2016051599A1 (ja) メモリコントローラ及びデータ制御方法
WO2018061161A1 (ja) ストレージ装置およびその制御方法
US11609844B2 (en) Memory system with hierarchical tables
JP6163588B2 (ja) ストレージシステム
WO2015118680A1 (ja) ストレージ装置
TW202226232A (zh) 記憶體系統
JP2009282568A (ja) 半導体記録装置
WO2015196416A1 (zh) 数据存储方法、装置和非易失性存储器

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170214

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170314

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170418

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170424

R150 Certificate of patent or registration of utility model

Ref document number: 6134857

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees