WO2017061022A1

WO2017061022A1 - データを重複排除するシステム

Info

Publication number: WO2017061022A1
Application number: PCT/JP2015/078707
Authority: WO
Inventors: 水島　永雅; 彬史鈴木; 光雄早坂
Original assignee: 株式会社日立製作所
Priority date: 2015-10-09
Filing date: 2015-10-09
Publication date: 2017-04-13

Abstract

ライト要求されたファイルを構成する複数のブロックデータの重複排除を行うシステムであって、それぞれが重複判定処理をする複数のアクセラレータと、ブロックデータを各アクセラレータに分配するための複数のデータバッファを備える第一メモリと、を備える。複数のアクセラレータのそれぞれは、ブロックデータの重複判定を行うために用いるハッシュテーブルを分担して格納する第二メモリを備え、ブロックデータからハッシュ値を生成する手段と、前記ハッシュテーブルから前記ハッシュ値を探索する手段と、を備える。

Description

データを重複排除するシステム

　本発明は、データを重複排除するシステムに関する。

　データ記録は、コンピュータシステムの基本的な機能である。多くのコンピュータシステムでは、データをコンピュータシステム内の何らかの記憶媒体に格納し、その格納先を管理する処理を行っている。こうしたデータの保持コストは、簡単な定義（ランニングコスト等を考慮しない）において、記憶媒体のビットコスト（記憶媒体の価格÷記憶媒体の容量）と記録データ量の積として算出される。

　近年、データの保持コスト削減を目的として、記憶媒体に記録するデータ量を削減する技術が広く用いられている。こうしたデータ量削減技術の一つに重複排除がある。

　重複排除とは、物理領域より大きな仮想領域を作成し、ある仮想領域にデータを記録する際、物理記録媒体に同一のデータが既に格納されているか探索し、同一のデータが既に可能されていた場合には、データを物理領域に新たに記憶せず、同一データが既に格納されている物理領域を、仮想領域に対応付けて管理する技術である。このように、重複排除によって、一つの物理領域に記録されたデータを複数の仮想領域に対応付けて管理するため、仮想領域に同一データを複数記録するシステムにおいては、物理領域以上のデータを保持し管理する事が可能となる。

　この重複排除技術は、物理領域に既に同一データが格納されているかを探索する処理（以降、重複判定処理と呼ぶ）を含む。重複排除を行う多くのシステムは、重複判定管理情報（記録データ毎のハッシュ値とそれに対応する物理領域とを管理する情報）を管理しており、記録データから算出したハッシュ値はそこに登録される。新たにデータを記録する際に、そのデータから算出したハッシュ値と同一のハッシュ値がこの重複判定管理情報に既に登録されているかを探索することで重複判定処理を行う。この処理には時間を要する為、一般的に重複排除を行うシステムはデータ記録時の性能が低下する。

　特許文献１では、既に保持しているデータについて、そのデータ内容から一意に算出されるハッシュ値を保持する。そして、新たにデータを記録する際にデータからハッシュ値を算出し、このハッシュ値と同一のハッシュ値がシステム内に記録されているかを探索することで、データを直接比較する頻度を低減する。さらに、特許文献１では、システムを制御する主プロセサとは別に、データからハッシュ値を算出するアクセラレータを搭載し、ハッシュ値を算出する時間を削減する技術について開示されている。

US 2013/0018853

特許文献１では、重複判定処理を高速化するため、ハッシュ値演算を高速に行うアクセラレータを搭載した例について開示されているが、重複判定管理情報において同一のハッシュ値を探索する処理をアクセラレータが実施する技術は開示されていない。さらに、重複判定処理を一台のアクセラレータの能力を超えて高速化したい場合に、複数台のアクセラレータを用いる技術も開示されていない。

重複排除を行うシステムが、重複排除のための重複判定処理を複数台のアクセラレータに分担して行わせることができるため、重複判定処理の高速化を実現できる。

システムの内部構成を示す。重複排除アクセラレータの内部構成を示す。重複排除の概要を示す。データバッファ、ハッシュバッファ、ハッシュテーブルの配置を示す。データバッファ、ハッシュバッファ、ハッシュテーブルの使用例を示す。ハッシュの生成(Generate)と転送(Route)のフローチャートを示す。ハッシュの探索(Search)のフローチャートを示す。実施形態の概要を示す。

　まず、図８を用いて、本実施形態の概要を説明する。本実施形態のシステム10は、例えばストレージ装置や、サーバである。システム10は、ライト要求されたファイルを構成するブロックデータの重複排除のための重複判定処理をする重複排除アクセラレータ123を複数台備える。システム10のDRAM125内に、ブロックデータを各重複排除アクセラレータ123に分配するためのライトデータバッファ400及びライトデータバッファ401を備える。ライトデータバッファは重複排除アクセラレータ123の数だけ存在し、1つのライトデータバッファが1つの重複排除アクセラレータに対応付けられている。

　各重複排除アクセラレータ123は、ブロックデータからハッシュ値を生成する手段を備える。

　各重複排除アクセラレータ123のメモリ内に、ブロックデータの重複判定を行うために用いるハッシュテーブルが分担して格納される。ハッシュテーブルは、ハッシュ値に基づいて分担されている。例えば、ハッシュテーブルは、ハッシュ値が偶数か奇数かで分担される。本実施形態では、重複排除アクセラレータ123aは偶数のハッシュ値を格納する偶数ハッシュテーブルを備え、重複排除アクセラレータ123bは奇数のハッシュ値を格納する奇数ハッシュテーブルを備える。

　各重複排除アクセラレータ123は、各重複排除アクセラレータ内のハッシュテーブルからハッシュ値が存在するかを探索する手段を備える。

　これにより、重複排除を行うシステム10が、重複排除のための重複判定処理を複数台のアクセラレータに分担して行わせることができるため、システムに要求された書き込み性能に合わせた重複判定処理の高速化を実現できる。

　さらに、本実施形態のシステム10は、以下の構成を備える。

　システム10のDRAM125内に、複数台の重複排除アクセラレータ123間でハッシュを転送するためのハッシュ共有バッファを備える。

　各重複排除アクセラレータ123は、ブロックデータのハッシュの値に基づいて、自身が格納するハッシュテーブルが探索先であるか、その他のアクセラレータが格納するハッシュテーブルが探索先であるかを判断する。

　自身が格納するハッシュテーブルが探索先である場合は、自身が備えるハッシュテーブルを用いてハッシュ探索を行う。重複排除アクセラレータ123は、そのハッシュ探索で得られた重複判定結果をシステム10のDRAM125内の自身に対応するデータバッファに書く。

　その他の重複排除アクセラレータ123が格納するハッシュテーブルが探索先である場合は、ハッシュ共有バッファにそのハッシュ値を転送する。

　各重複排除アクセラレータ123は、自身が格納するハッシュテーブルで探索可能なハッシュ値を、ハッシュ共有バッファから取得し、自身が備えるハッシュテーブルを用いてハッシュ探索を行う。各重複排除アクセラレータ123は、そのハッシュ探索で得られた重複判定結果をハッシュ共有バッファに書く。

　ハッシュ共有バッファにハッシュ値を転送したアクセラレータは、そのハッシュ探索で得られた重複判定結果を取得し、それをシステム10のDRAM125内のデータバッファに書く。

　最後に、システムのCPUは、データバッファから重複判定結果を取得し、それに基づいて、ライト要求されたファイルを構成するブロックデータの格納を行う。

　以上のように、複数台の重複排除アクセラレータはCPUを介さずに120ハッシュ値を転送し、重複排除アクセラレータ間で重複判定処理を実行することができる。これにより、重複排除を制御する負荷がシステム10のCPU120にかからないようにすることができる。

　（１）システム構成
　図１を用いて、本発明が適用されるシステム構成について説明する。図１は、本発明が適用されるシステムの例の概要について示しており、本発明は、図１を例とするシステムに適用可能なものである。

　図１は、複数台のサーバ102が、ネットワーク101を経由してストレージ装置100と接続する構成を示している。サーバ102は、データを管理するために、ストレージ装置100に対して、ネットワーク101を介してリード及びライト等の各種要求を行う。なお、サーバ102とストレージ装置100は直接接続されていてもよい。

　ストレージ装置100は、同一の機能を有するストレージコントローラ110を装置の高信頼化のために２台搭載し、データを保持する記憶媒体としてHDD(Hard Disk Drive)やSSD(Solid State Drive)(以降HDD/SSDと記す)130を複数台搭載している。尚、本実施例では、ストレージコントローラ110が2台の例について記すが、本発明はこのコントローラ数に限定されるものではない。例えば、ストレージ装置には、ストレージコントローラ110が1台のみ搭載されてもよいし、3台以上搭載されてもよい。

　ストレージコントローラ110は、内部にストレージ装置の各種制御を行うプロセサ（CPU）120、DRAM125、、フロントエンドインターフェース121（以降FE I/Fと記す。）、バックエンドインターフェース124(以降BE I/Fと記す)、、重複排除アクセラレータ123a及び123b、スイッチ122の各コンポーネントを搭載する。また各コンポーネントは、スイッチ122にて相互に接続されている。この相互接続インターフェースは例えばPCI-Expressである。尚、本発明は、ストレージコントローラ内の接続インターフェースとして、PCI-Expressに限定されるものではない。

　また、本発明はストレージコントローラ110内のコンポーネントとして図１に示すコンポーネントに限定されるものではない。例えば、ストレージコントローラ110にはデータを暗号化したり、可逆圧縮したりするアクセラレータ等を搭載しても良い。

　DRAM125は、ストレージ装置100内においてキャッシュやバッファとして機能する一時記憶領域である。DRAM125は、ストレージコントローラ110が重複排除を行う際に必要な、データバッファやハッシュバッファ（詳細は後述）としても機能する。

　FE I/F121は、ストレージに各種要求を行う複数のサーバと接続するためのインターフェースであり、FC(Fibre Channel)やEthernet(登録商標)等である。尚、本発明は、FE I/F121について、FC及びEthernet(登録商標)に限定するものではない。

　BE I/F124は、ストレージ装置100に搭載される複数のHDD/SSD130と接続する為のインターフェースであり、SAS(Serial Attached SCSI)やSATA（Serial ATA）、NVMe(NVM Express)等がある。尚、本発明は、BE I/F124について、SAS、SATA、NVMeに限定されるものではない。

　重複排除アクセラレータ123a及び123bは、本発明の特徴的なコンポーネントであり、ストレージコントローラ110にて重複排除を行う際に必要な、重複判定処理の各種処理を高速に行うモジュールである。本実施例では重複排除アクセラレータを2台搭載する例について記すが、本発明はこの台数に限定されるものではない。例えば、重複排除アクセラレータを4台搭載するとしてもよい。このモジュールの詳細については、図2を用いて後述する。

　ストレージ装置は、複数のHDD/SSD130を纏めて一つの記憶領域111として管理し、サーバ102にデータを記憶するための領域を提供する。このとき、HDD/SSD130の故障によってデータを消失しないように記憶領域111の中でRAID(Redundant Arrays of Inexpensive Disks)を構成し、複数台のHDD/SSD130の故障に対応する。そして、このRAIDにより保護された記憶領域を仮想ブロック領域や、ファイルシステムとしてサーバ102に提供する。本実施例では、こうした仮想ブロック領域、またはファイルシステムに対して、サーバ102より記録するデータを重複排除し、重複排除における重複判定処理を、従来実施してきたストレージコントローラ110内のプロセサ120から、重複排除アクセラレータ123a及び123bにオフロードするものである。

　（２）重複排除アクセラレータの構成
　次に、図2を用いて本発明が適用される重複排除アクセラレータ123（図1の123aまたは123b）の内部構成について説明する。尚、本実施例の重複排除アクセラレータ123は、一般的なSSDのSSDコントローラに後述のハッシュ生成ユニット219、ハッシュ転送ユニット216、ハッシュ探索ユニット218を搭載したものである。なお、本実施例における、重複排除アクセラレータ123は、重複判定処理の各種処理を実施する装置として記述するが、こうした動作以外に一般的なSSDとしてのデータ書き込み・読み出し動作を平行して実施するとしても構わない。本実施例の重複排除アクセラレータ123は、搭載する不揮発性のNAND型フラッシュメモリ（FM）220に重複判定処理のための各種データを格納するが、その格納領域以外の領域を一般的なSSDのようにユーザデータ記憶領域として用いても良い。

　図2は、重複排除アクセラレータ123の内部構成を示す図である。

　重複排除アクセラレータ123は内部に、重複排除アクセラレータコントローラ210と複数のフラッシュメモリチップ221(FM221)のFM220を備える。例えば、FM220は32個のFM221を含む。

　重複排除アクセラレータコントローラ210は、その内部に組み込みプロセサ215、DRAM 213、ハッシュ生成ユニット219、ハッシュ転送ユニット216、ハッシュ探索ユニット218、I/Oインターフェース211、FMインターフェース 217、及びデータ転送を相互に行うスイッチ214を備えている。

　スイッチ214は、アクセラレータコントローラ210内の組み込みプロセサ215、DRAM 213、ハッシュ生成ユニット219、ハッシュ転送ユニット216、ハッシュ探索ユニット218、I/Oインターフェース211、FMインターフェース217を接続し、各部位間のデータをアドレスまたは識別子（ID）によって転送する。尚、本実施例では、図2に示すように、単一のスイッチ214に各ハードウェア及びハードウェア実装論理がスター状に接続された例について記すが、本発明は、この例に限定されるものではない。例えば内部に複数のスイッチを有し、接続が必要な各ハードウェア及びハードウェア実装論理が通信可能なように接続されていればそれで良い。

　I/Oインターフェース211は、上位装置と接続するハードウェア実装論理である。スイッチ214を介してアクセラレータコントローラ210の各部位と接続する。I/Oインターフェース211は、上位装置との間で各種データを送受信する。重複判定処理時には重複判定対象となる判定対象データを上位装置から受信する。上位装置は、例えばコントローラ110である。

　組み込みプロセサ215は、スイッチ214を介してアクセラレータコントローラ210の各部位と接続し、アクセラレータコントローラ210全体を制御する。また、組み込みプロセサ215は、定期的な情報取得、及び割り込み受信機能によって、アクセラレータコントローラ210全体を監視する。さらに、組み込みプロセサ215は、I/Oインターフェース211を通じて、上位装置が重複判定処理を必要としているかをポーリングする。必要と検知した場合には、I/Oインターフェース211に上位装置からの判定対象データの受信を行わせ、重複判定処理を開始する。

　DRAM213は、揮発性メモリであり、アクセラレータコントローラ210内での転送中のデータを一時的に格納する。また、重複判定処理のためのハッシュバッファ（詳細は後述）としても機能する。

　FMインターフェース217は、複数バス（例えば8）によってFM220と接続する。各バスには複数（例えば4）のFM220を接続し、同じくFM220に接続されるCE(Chip Enable)信号を用い、同一バスに接続された複数FM220を独立して制御する。

　FMインターフェース217は、組み込みプロセサ215より指示されるリード/ライト要求に応じて動作する。もし、リード要求であればFM220内の少なくとも1つのFM221から格納データをリードし、ライト要求であれば格納すべきデータをFM220内の少なくとも1つのFM221に転送する。

　また、FMインターフェース217はECC生成回路、ECC訂正回路を有する。データ書き込み時にデータに対してECCを付加して書き込む。また、データ読み出し時にECCによってデータ訂正を行う。

　FM220は、重複判定処理のためのハッシュテーブル（詳細は後述）を格納する。

　ハッシュ生成ユニット219は、ハッシュ生成アルゴリズムを処理する機能を有する。ハッシュ生成アルゴリズムは、例えばMD5、、SHA1、、SHA256等である。尚本発明は、ハッシュ生成アルゴリズムとしてMD5、、SHA1、、SHA256に限定されるものではない。記録するデータから一意に算出され、その値を代表とする値ならばいかなる値でもよい。本実施例では、同一ハッシュ値となるような相違なデータに遭遇する確率（ハッシュ衝突率）が極めて小さいSHA256を用いる。ハッシュ生成ユニット219は、上位装置から受信した判定対象データからハッシュ値を生成する。

　ハッシュ転送ユニット216は、ハッシュ生成ユニット219で生成されたハッシュの値に基づいて、ハッシュ探索を行うべきアクセラレータを判定し、そのための各種データの転送を制御する。

　ハッシュ探索ユニット218は、FM220からハッシュテーブルの一部をリードし、ハッシュ生成ユニット219で生成されたハッシュ値と一致するハッシュ値がハッシュテーブルに含まれているか探索する。その後、この探索結果に基づいて、FM220のハッシュテーブルを更新する。

　以上説明した、スイッチ214、I/Oインターフェース211、組み込みプロセサ215、FMインターフェース217、ハッシュ生成ユニット219、ハッシュ転送ユニット216、ハッシュ探索ユニット218は、ASIC（Application Specific Integrated Circuit）やFPGA(Field Programmable Gate Array)の回路として実装することができる。それらを一つの半導体素子で構成してもよいし、相互に接続した複数の半導体素子で構成してもよい。

　（３）重複排除処理の概要
　続いて、図３を用いて重複排除の概要について説明する。本実施例の図１に示すストレージ装置100は、記録データに対して重複排除を実施し、物理的な記憶領域以上のデータ量を管理する。より具体的には、一つの物理領域を複数の仮想領域に対応付けて管理する。本実施例では、こうした物理領域と仮想領域の対応付けをファイルシステムによって管理する。つまり、仮想領域となるのは、「ファイル」という概念となり、物理的な記憶領域となるのはHDD/SSDのLBA(Logical Block Address)となる。図３では、「FIle A」と「File B」のファイルデータが存在し、これらのデータを重複排除して物理領域に記録する例を示している。本実施例のシステムではFile A及びFile Bは、それぞれ4KBの複数のブロックに分割し「Blk A-1～3」、「Blk B-1～5」として管理する。本実施例では、こうしたファイルのブロックへの分割は、4KBの固定長にて実施する場合について述べるが、本発明はこの分割方法に限定されるものではない。分割サイズを4KBより小さくしても大きくしても良いし、ファイルデータを異なるサイズに分割しても良いし、分割さえしなくても良い。

　本実施例のファイルシステムは、ファイルを4KBの固定長で分割したブロック毎に、物理的な記憶領域であるHDD/SSDのLBAとの対応付けを行う。図3では、「File A」の部分領域である「Blk A-2」と「File B」の部分領域である「Blk B-3」のデータ内容が同一である場合に、重複排除される前と後の「Blk B-3」の対応LBAの変化を示している。ファイルシステムは、重複排除後は310に示すように「Blk A-2」と「Blk B-3」を共に「LBA36」に対応付けて管理する。この場合、File Ａを読み出す場合には「LBA36」からファイルデータの一部を読み出し、File Bを読みだす場合にも「LBA36」からファイルデータの一部を読み出すこととなる。ファイルシステムは、重複排除によりHDD/SSDがデータ記憶可能なLBA空間以上のデータ量のファイル群を利用する事が出来る。これにより、ストレージ装置100のビットコストは低下する。

　仮想領域上に同一データを記録する際、複数の仮想領域を一つの物理領域に対応付ける重複排除処理は、データをサーバ102から受信後、記憶領域111に記録する前に行うことが望ましい。なぜなら、重複排除によって物理領域に記録すべきデータ量がR倍（R<１）になる場合、記憶領域111に記録前に重複排除した時のデータ書き込み量はR倍に減るからである。記憶装置111がSSDで構成されている場合、SSDを構成するFMの書き換え回数（寿命）には限りがある。記憶領域111に記録後に重複排除するよりも記録前に重複排除したほうが、FMの書き換え回数が減少してシステム寿命が長くなるという良い効果がある。

　本実施例は、データを記録する前に重複排除する場合について記すが、本発明は、データを記録する前に重複排除する場合に限定されるものではない。例えば、同一データであっても一旦物理領域に記録し、後に同一データを見つけ、重複排除する場合でも適用することができる。

　重複排除では、ファイルを分割して得られたブロックの各データ（判定対象データ）と同一のデータが既に記録されているかを探索する必要がある。これは、厳密には、判定対象データと記録済みの全データとを比較することで可能である。しかし、大量のファイルデータを扱う場合、判定対象データと記録済みの全データとの比較には、膨大な時間を要し、現実的に不可能である。

　このため、記録済みデータからある代表値を作成してそのテーブルを準備しておき、重複判定時に判定対象データから算出した代表値を、テーブルに記載された各代表値と比較することで、同一データの可能性のあるデータ（候補データ）を探索する。こうした代表値を使った重複判定処理は、重複排除では一般に行われている。ただし、代表値が一致するかどうかで重複判定を行うことは完全ではなく、一致であれば「重複の可能性が有る」、不一致であれば「重複は完全に無い」ことが示されるに過ぎない。そのため、「重複の可能性が有る」と判断された後に、重複の可能性のある候補データを読み出し、判定対象データと候補データとを比較するまで、候補データが判定対象データと完全に同一かはわからない。しかし、「重複の可能性が有る」と判断され、データ比較後に「重複ではなかった」と判断される確率（重複判定ミス率）は、SHA256アルゴリズムのハッシュ衝突率に相当し、は極めて小さい。この確率がシステムの許容するデータ消失確率以下である場合、このデータ比較を省略しても問題はない。本実施例のシステムは、重複判定ミス率がシステムの許容するデータ消失確率以下のシステムであるとし、重複排除アクセラレータの重複判定結果のみで重複を判定する。

　（４）重複判定処理に用いるバッファ及びテーブル
　続いて、図４及び図５を用いて重複排除アクセラレータ123が、重複判定処理を行う際に用いる各種バッファ及びテーブルについて説明する。

　図４は、ストレージコントローラ110において、各種バッファ及びテーブルの種類と設置場所を示している。

　2つのライトデータバッファ400、401は、ストレージコントローラ110内のDRAM125の中に位置し、それぞれ重複排除アクセラレータ123a、123b内のハッシュ生成ユニット219a、219bがハッシュ生成を行う対象となる4KBブロックデータを複数個、一時的に格納するためのバッファである。重複排除アクセラレータ123a、123bはそれぞれライトデータバッファ400、401からブロックデータを取得する。ライトデータバッファ400、401は、各ブロックデータに関する付加情報も格納する。具体的には、ブロックデータの重複判定結果と格納先LBAである。格納先LBAの情報は、重複判定の結果次第で変化する。

　ストレージコントローラ110内のCPU120はマルチコアプロセッサであり、2つのコア440、441を含む。ストレージ装置100がサーバ102からファイルのライト要求を受けると、これらのコアはそのファイルを4KB単位のブロックデータに分割し、2つのライトデータバッファ400、401に分配する。重複排除アクセラレータ123a、123bはそれぞれライトデータバッファ400、401からブロックデータを取得して重複判定処理を行う。ブロックデータは基本的にはライトデータバッファ400、401にラウンドロビンで均等に分配されるが、重複排除アクセラレータ123a、123bが重複判定を行う際の処理時間に差がある場合は、コア440、441は処理時間の短いほうに多くのブロックデータを配り、両者の処理時間を平準化してもよい。

　偶数ハッシュテーブル430は、重複排除アクセラレータ123a内のFM220aの中に格納され、ストレージ装置100が格納するファイルを構成する4KBブロックデータのハッシュ値のうち、偶数であるもの(偶数ハッシュ)が登録されている。偶数ハッシュテーブル430は、各偶数ハッシュの生成元であるブロックデータの重複カウントと格納先LBAとの対応を管理している。重複排除アクセラレータ123a内のハッシュ探索ユニット218aは、偶数ハッシュ探索を行う際に、偶数ハッシュテーブル430の一部をDRAM213aに読み出して利用する。ハッシュ探索ユニット218aは、偶数ハッシュテーブル430に対してハッシュ探索をかけた結果、一致するハッシュが見つかった場合には対応する重複カウントを1加算し、格納先LBAを取得するが、一致するハッシュが見つからなかった場合には、探索した偶数ハッシュを新たに偶数ハッシュテーブル430に追加登録する。

　奇数ハッシュテーブル431は、重複排除アクセラレータ123b内のFM220bの中に格納され、ストレージ装置100が格納するファイルを構成する4KBブロックデータのハッシュ値のうち、奇数であるもの(奇数ハッシュ)が登録されている。奇数ハッシュテーブル431は、各奇数ハッシュの生成元であるブロックデータの重複カウントと格納先LBAとの対応を管理している。重複排除アクセラレータ123b内のハッシュ探索ユニット218bは、奇数ハッシュ探索を行う際に、奇数ハッシュテーブル431の一部をDRAM213bに読み出して利用する。ハッシュ探索ユニット218bは、奇数ハッシュテーブル431に対してハッシュ探索をかけた結果、一致するハッシュが見つかった場合には対応する重複カウントを1加算し、格納先LBAを取得するが、一致するハッシュが見つからなかった場合には、探索した奇数ハッシュを新たに奇数ハッシュテーブル431に追加登録する。

　上記の偶数ハッシュテーブル430、奇数ハッシュテーブル431で管理されている重複カウントとは、各ハッシュの生成元であるブロックデータがファイルシステムにおいて重複参照されている数である。ブロックデータが重複参照されていない場合、そのハッシュ値に対応する重複カウントは1である。

　なお、本実施形態では、偶数ハッシュテーブル430及び奇数ハッシュテーブル431はテーブルの形式で説明するが、ハッシュ値を管理する情報であればテーブルの形式でなくてもよい。

　偶数ハッシュ局所バッファ420は、重複排除アクセラレータ123a内のDRAM213aの中に位置し、重複排除アクセラレータ123aが偶数ハッシュテーブル430に探索をかける偶数ハッシュを複数個、一時的に格納するためのバッファである。偶数ハッシュ局所バッファ420は、各偶数ハッシュに関する付加情報も格納する。具体的には、偶数ハッシュの生成元であるブロックデータの重複判定結果と格納先LBAである。

　奇数ハッシュ局所バッファ421は、重複排除アクセラレータ123b内のDRAM213bの中に位置し、重複排除アクセラレータ123bが奇数ハッシュテーブル431に探索をかける奇数ハッシュを複数個、一時的に格納するためのバッファである。奇数ハッシュ局所バッファ421は、各奇数ハッシュに関する付加情報も格納する。具体的には、奇数ハッシュの生成元であるブロックデータの重複判定結果と格納先LBAである。

　偶数ハッシュ共有バッファ410は、ストレージコントローラ110内のDRAM125の中に位置し、重複排除アクセラレータ123bが、重複排除アクセラレータ123aに偶数ハッシュの探索を依頼する際に、対象の偶数ハッシュを複数個、一時的に格納するためのバッファである。偶数ハッシュ共有バッファ410は、各偶数ハッシュに関する付加情報も格納する。具体的には、偶数ハッシュの生成元であるブロックデータの重複判定結果と格納先LBAである。

　奇数ハッシュ共有バッファ411は、ストレージコントローラ110内のDRAM125の中に位置し、重複排除アクセラレータ123aが、重複排除アクセラレータ123bに奇数ハッシュの探索を依頼する際に、対象の奇数ハッシュを複数個、一時的に格納するためのバッファである。奇数ハッシュ共有バッファ411は、各奇数ハッシュに関する付加情報も格納する。具体的には、奇数ハッシュの生成元であるブロックデータの重複判定結果と格納先LBAである。

　DRAM125の中に位置する2つのライトデータバッファ400、401、偶数ハッシュ共有バッファ410、奇数ハッシュ共有バッファ411は、CPU120だけでなく、2つの重複排除アクセラレータ123a及び123bもアクセス可能なメモリ空間にマップされている。CPU120内のシステムエージェント450は、近年のCPUが低レイテンシ通信の実現のために内包している高速スイッチで、従来のCPU外付けチップセットの機能を取り込んでいる。重複排除アクセラレータ123a及び123bは、コア440、441の介在なしに、システムエージェント450経由で2つのライトデータバッファ400、401、偶数ハッシュ共有バッファ410、奇数ハッシュ共有バッファ411に自由にアクセスできる。

　図５は、図４を用いて説明した各種バッファ及びテーブルに記録される情報の一例を示している。具体的には、ストレージ装置100に図３のFile Aがライトされた後、図３のFile Bのライト要求を受けたストレージ装置100が、記憶領域111に記録する前に重複排除を行っている途中の状態を示している。詳細には、File Bを構成する5つのブロックデータのうち、Blk B-1からB-4までは重複判定処理が終わっていて、Blk B-5はハッシュ生成が終わっているが、まだ重複判定されていない状態である。

　File Aを構成する3つのブロックデータのうち、Blk A-3から生成されたハッシュ値が偶数、Blk A-1、A-2から生成されたハッシュ値が奇数になったとすると、File Aがライトされた後、File Bがライトされる前は、偶数ハッシュテーブル430にはBlk A-3のハッシュ、奇数ハッシュテーブル431にはBlk A-1、A-2から生成されたハッシュが登録されている。この時点では、各ハッシュに対応する重複カウントは1である。

　File Bのライト要求を受けて、CPU120は、File Bを構成する5つのブロックデータをライトデータバッファ400、401へ分配する。ここでは、Blk B-1、B-3、B-5がライトデータバッファ400、Blk B-2、B-4がライトデータバッファ401に分配されたとする。

　重複排除アクセラレータ123a、123bは自らそれぞれライトデータバッファ400、401からブロックデータを取得してハッシュ生成を行う。

　File Bのブロックデータのうち、Blk B-1、B-2、B-5から生成されたハッシュ値が偶数、Blk B-3、B-4から生成されたハッシュ値が奇数になったとする。ただし、Blk B-3はBlk A-2と同一データのため、両者のハッシュ値は一致する。

　重複排除アクセラレータ123aは、自身が生成したBlk B-1とB-5の偶数ハッシュを偶数ハッシュ局所バッファ420に格納し、自身が管理する偶数ハッシュテーブル430に探索をかけるが、自身が生成したBlk B-3の奇数ハッシュは奇数ハッシュ共有バッファ411に格納し、重複排除アクセラレータ123bへ奇数ハッシュテーブル431に探索をかけるよう依頼する。

　重複排除アクセラレータ123bは、自身が生成したBlk B-4の奇数ハッシュを奇数ハッシュ局所バッファ421に格納し、自身が管理する奇数ハッシュテーブル431に探索をかけるが、自身が生成したBlk B-2の偶数ハッシュは偶数ハッシュ共有バッファ410に格納し、重複排除アクセラレータ123aへ偶数ハッシュテーブル430に探索をかけるよう依頼する。

　重複排除アクセラレータ123aは、偶数ハッシュ局所バッファ420や偶数ハッシュ共有バッファ410から偶数ハッシュを取得し、それらと一致するものが偶数ハッシュテーブル430内にあるか探索を行い、その結果(Hit：一致あり、Miss：一致なし)をそれぞれのハッシュに対応する重複判定結果の欄に書く。Blk B-1とB-2は重複しないので結果はMissである。Blk B-5はまだ判定前であるため、結果が書かれていない。図５の状況では、Blk B-5に重複しているものがあるか分からないため、Blk B-5の格納先LBAの欄は仮のアドレスとしてLBA 42が書かれている。仮のアドレスはCPU120が重複排除する前に決めておくものである。この欄は、重複していると判定された場合は重複する相手の格納LBAに更新されるが、この後、重複していないと判定された場合は更新されず、仮のアドレスLBA 42が実際の格納LBAとして確定する。

　重複排除アクセラレータ123bは、奇数ハッシュ局所バッファ421や奇数ハッシュ共有バッファ411から奇数ハッシュを取得し、それらと一致するものが奇数ハッシュテーブル431内にあるか探索を行い、その結果(Hit：一致あり、Miss：一致なし)をそれぞれのハッシュに対応する重複判定結果の欄に書く。Blk B-3はBlk A-2と重複するので結果はHitである。Blk B-4は重複しないので結果はMissである。

　Blk B-1からB-4のハッシュ探索後の時点では、偶数ハッシュテーブル430では、Blk B-1、B-2のハッシュが追加登録されている。一方、奇数ハッシュテーブル431では、Blk A-2のハッシュに対応する重複カウントが1から2に増え、Blk B-4のハッシュが追加登録されている。

　重複排除アクセラレータ123aは、自身の偶数ハッシュ探索による重複判定結果(Blk B-1のMiss)をライトデータバッファ400の重複判定結果に転写する。また、重複排除アクセラレータ123bに依頼していた奇数ハッシュ探索が終わって、奇数ハッシュ共有バッファ411に重複判定結果(Blk B-3のHit)が書かれたことを検知すると、それを取得し、ライトデータバッファ400の重複判定結果に転写する。

　一方、重複排除アクセラレータ123bは、自身の奇数ハッシュ探索による重複判定結果(Blk B-4のMiss)をライトデータバッファ401の重複判定結果に転写する。また、重複排除アクセラレータ123aに依頼していた偶数ハッシュ探索が終わって、偶数ハッシュ共有バッファ410に重複判定結果(Blk B-2のMiss)が書かれたことを検知すると、それを取得し、ライトデータバッファ401の重複判定結果に転写する。

　CPU120は、Blk B-1からB-4までの重複判定結果がライトデータバッファ400、401に書かれていることを確認し、Blk B-1からB-4までの重複判定が終わっていることを知ることができる。

　図3において、300で示されるのが、File Bのライト要求を受けた直後の重複判定前の時点で、File Bの各ブロックデータに対応する格納LBAに仮のアドレスを設定している状態である。Blk B-1からB-4までの重複判定後は、320で示されるように、Blk B-3に対応する格納LBAは仮のアドレスLBA 40からLBA36に更新されるが、Blk B-1、B-2、B-4に対応する格納LBAは仮のアドレスがそのまま実際の格納LBAとして確定する。

　（５）重複判定処理の流れ
　続いて、図６及び図７のラダーチャートを参照しながら、本実施例における重複判定処理の流れを説明する。

　図６において、ストレージコントローラ110のCPU120は、サーバ102からライト要求されたデータを4KB単位のブロックデータに分割し、DRAM125にあるライトデータバッファ400、401に分配する(S620)。

　重複排除アクセラレータ123aのハッシュ生成ユニット219aはDRAM125にあるライトデータバッファ400に重複判定前のブロックデータがあることを検知すると、そこからブロックデータを取得する(S600)。重複排除アクセラレータ123bのハッシュ生成ユニット219bはDRAM125にあるライトデータバッファ401に重複判定前のブロックデータがあることを検知すると、そこからブロックデータを取得する(S610)。

　重複排除アクセラレータ123aのハッシュ生成ユニット219aは取得したブロックデータのハッシュ生成を行い、ハッシュ転送ユニット216aに渡す(S601)。重複排除アクセラレータ123bのハッシュ生成ユニット219bは取得したブロックデータのハッシュ生成を行い、ハッシュ転送ユニット216bに渡す(S611)。

　重複排除アクセラレータ123aのハッシュ転送ユニット216aはハッシュ値が偶数であるか調べる(S602)。偽(奇数)ならばDRAM125にある奇数ハッシュ共有バッファ411にハッシュを転送する(S603)。真(偶数)ならばDRAM213aにある偶数ハッシュ局所バッファ420にハッシュを転送する(S604)。重複排除アクセラレータ123bのハッシュ転送ユニット216bはハッシュ値が奇数であるか調べる(S612)。偽(偶数)ならばDRAM125にある偶数ハッシュ共有バッファ410にハッシュを転送する(S613)。真(奇数)ならばDRAM213aにある奇数ハッシュ局所バッファ421にハッシュを転送する(S614)。

　この後、図７のハッシュ探索処理に遷移する。

　図７において、重複排除アクセラレータ123aのハッシュ探索ユニット218aは、DRAM213aにある偶数ハッシュ局所バッファ420、またはDRAM125にある偶数ハッシュ共有バッファ410に重複判定前の偶数ハッシュがあることを検知すると、その偶数ハッシュを取得する(それぞれS700、S701)。取得する順序は基本的に交互とするが、両者の重複判定前の偶数ハッシュ数の差が所定基準よりも多くなった場合は。多いほうを優先して取得してもよい。そして、ハッシュ探索ユニット218aは、FM220aから偶数ハッシュテーブルの430一部を読み出し、偶数ハッシュの探索を行う(S702)。例えば、ハッシュ探索ユニット218aは、重複判定の対象となっているハッシュの上位ｘビットが一致する範囲のテーブルを読み出す。ハッシュ探索ユニット218aは、重複判定の対象となっているハッシュに一致するものが見つかった(Hit)か見つからなかった(Miss)かを判断する(S703)。ハッシュ探索ユニット218aは、Hitの場合は偶数ハッシュテーブル430から重複相手のブロックの格納先LBAを取得し(S704)、重複相手の重複カウントを1加算したものをFM220aに書き戻す(S705)。Missの場合は偶数ハッシュテーブル430に探索したハッシュの新規エントリを作成し(S706)、FM220aに追記する(S707)。

　S700において偶数ハッシュを偶数ハッシュ局所バッファ420から取得していた場合は、ハッシュ探索ユニット218aは、偶数ハッシュ局所バッファ420に、偶数ハッシュに対応する重複判定結果(HitまたはMiss)を書く。さらに、ハッシュ探索ユニット218aは、偶数ハッシュ局所バッファ420に、Hitの場合は格納先LBAを重複相手の格納先LBAで更新し、Missの場合は仮の格納先LBAを実際の格納先LBAとして決定する(S708)。

　また、S701において偶数ハッシュを偶数ハッシュ共有バッファ410から取得していた場合は、ハッシュ探索ユニット218aは、偶数ハッシュ共有バッファ410に、偶数ハッシュに対応する重複判定結果(HitまたはMiss)を書く。この際、ハッシュ探索ユニット218aは、偶数ハッシュ共有バッファ410に、Hitの場合は格納先LBAを重複相手の格納先LBAで更新し、Missの場合は仮の格納先LBAを実際の格納先LBAとして決定する(S709)。

　一方、重複排除アクセラレータ123bのハッシュ探索ユニット218bは、DRAM213bにある奇数ハッシュ局所バッファ421、またはDRAM125にある奇数ハッシュ共有バッファ411に重複判定前の奇数ハッシュがあることを検知すると、その奇数ハッシュを取得する(それぞれS710、S711)。取得する順序は基本的に交互とするが、両者の重複判定前の奇数ハッシュ数の差が所定基準よりも多くなった場合は。多いほうを優先して取得してもよい。そして、ハッシュ探索ユニット218bは、FM220bから奇数ハッシュテーブルの一部を読み出し、奇数ハッシュの探索を行う(S712)。そのハッシュに一致するものが見つかった(Hit)か見つからなかった(Miss)かを判断する(S713)。Hitの場合は重複相手の格納先LBAを取得し(S714)、重複相手の重複カウントを1加算したものをFM220bに書き戻す(S715)。Missの場合は探索したハッシュの新規エントリを作成し(S716)、FM220bに追記する(S717)。

　S710において奇数ハッシュを奇数ハッシュ局所バッファ421から取得していた場合は、ハッシュ探索ユニット218bは、奇数ハッシュ局所バッファ421に、奇数ハッシュに対応する重複判定結果(HitまたはMiss)を書く。さらに、ハッシュ探索ユニット218bは、奇数ハッシュ局所バッファ421に、Hitの場合は格納先LBAを重複相手の格納先LBAで更新し、Missの場合は仮の格納先LBAを実際の格納先LBAとして決定する(S718)。

　また、S711において奇数ハッシュを奇数ハッシュ共有バッファ411から取得していた場合は、ハッシュ探索ユニット218bは、奇数ハッシュ共有バッファ411に、奇数ハッシュに対応する重複判定結果(HitまたはMiss)を書く。この際、ハッシュ探索ユニット218bは、奇数ハッシュ共有バッファ410に、Hitの場合は格納先LBAを重複相手の格納先LBAで更新し、Missの場合は仮の格納先LBAを実際の格納先LBAとして決定する(S719)。

　この後、図６における、ハッシュ探索処理以降の処理に戻る。

　重複排除アクセラレータ123aのハッシュ転送ユニット216aは、DRAM213aにある偶数ハッシュ局所バッファ420、またはDRAM125にある奇数ハッシュ共有バッファ411に重複判定結果の出たハッシュがあることを検知すると、その重複判定結果と格納先LBAを取得する(それぞれS606、S605)。そして、DRAM125のライトデータバッファ400の重複判定結果と格納先LBAの欄にこれを転写する(S607)。

　一方、重複排除アクセラレータ123bのハッシュ転送ユニット216bは、DRAM213bにある奇数ハッシュ局所バッファ421、またはDRAM125にある偶数ハッシュ共有バッファ410に重複判定結果の出たハッシュがあることを検知すると、その重複判定結果と格納先LBAを取得する(それぞれS616、S615)。そして、DRAM125のライトデータバッファ401の重複判定結果と格納先LBAの欄にこれを転写する(S617)。

　最後に、ストレージコントローラ110のCPU120は、DRAM125のライトデータバッファ400、401において、重複判定結果の出たブロックデータがあることを検知すると、その重複判定結果と格納先LBAを取得する(S621)。CPU120は、サーバ102からライト要求されたファイルについて、ファイルを構成するブロックデータを記憶領域111のどこに格納するかを、この結果に基づいて決定する。具体的には、次の処理を行う。重複判定結果がMissの場合、CPU120は、ライトデータバッファ400、401に格納されているブロックデータを、格納先LBAに従って記憶領域111を構成するHDD/SSD130に格納する。その後、CPU120は、ライトデータバッファから当該ブロックデータを削除する。また、重複判定結果がHitの場合、CPU120は、図３に示されるようにブロックデータの格納先LBAを変更し、ライトデータバッファから当該ブロックデータを削除する。

　すなわち、これでファイルの重複排除が行われたことになる。図６及び図７に示されるように、重複判定処理の流れにおいて、CPU120は、ブロックデータから生成されたハッシュ値が偶数か奇数かによって変わる、このような重複判定処理の手順に関与せず、ブロックデータの分配と重複判定結果の取得のみを行うだけである。つまり、本発明によれば、2台の重複排除アクセラレータでハッシュの生成と探索を分担して行うことで、1台の重複排除アクセラレータを用いた構成の時の2倍の重複判定処理性能を実現することができ、さらにその際に、2台の重複排除アクセラレータを制御する負荷がCPU120にかからないようにすることができる。

　（６）重複排除解除の流れ
　本実施例のこれまでの説明においては、サーバ102からファイルのライト要求がきた時に重複排除を実施する流れを述べたが、サーバ102からファイルの削除要求がきた時には重複排除の状態が解除されることがある。ここでは、その流れについて簡単に説明する。

　ストレージコントローラ110や2台の重複排除アクセラレータ123a、123bは、重複排除の解除を行うために、図４に示すようなデータバッファ、ハッシュ共有バッファ、ハッシュ局所バッファを、ファイル削除用に別途備える。ハッシュ生成ユニット、ハッシュ転送ユニットは、ファイルライト時と同様に、ハッシュ生成処理、ハッシュ値の偶数／奇数に応じた探索対象ハッシュの振り分け制御を行う。ただし、ハッシュ探索ユニットは、ファイル削除時には、ハッシュ探索がHitした場合にファイルライト時とは異なる動作を行う。すなわち、重複カウントを1減算し、その結果、重複カウントが0になったら、ハッシュテーブルからそのハッシュのエントリを削除する。なお、ここでハッシュ探索がMissすることは、ファイルシステムが正常に動作している限りありえない。

　（７）ハッシュテーブルの振り分け方
　本実施例のこれまでの説明においては、ハッシュ値が偶数か奇数かに応じてハッシュテーブルの管理担当を2台の重複排除アクセラレータ123a、123bに振り分けたが、本発明はこの振り分け方に限定されるものではない。ハッシュがとりうる値の範囲を2つに分けることができれば、何でも良い。例えば、ハッシュ値の最上位ビットが1か0かで振り分けても良い。

　さらに、振り分け方は不均等であっても良い。例えば、重複排除アクセラレータ123aの処理能力が123bの3倍優れている場合は、ハッシュがとりうる値の範囲のうち75%を123a内のハッシュテーブルで管理し、残りの25%を123b内のハッシュテーブルで管理する。そうすれば、両者の重複判定処理は、ほぼ同じ時間で終わるようにすることができ、システム性能が最適化される。

　（８）３台以上の重複排除アクセラレータの搭載
　本実施例のこれまでの説明においては、2台の重複排除アクセラレータを用いて重複判定処理を実施していたが、Nを3以上の整数として、N台の重複排除アクセラレータを用いて重複判定処理を実施し、さらに重複排除の高速化を図ることも可能である。ここでは、その場合の実施方法を説明する。

　まず、DRAM125にライトデータバッファをN個設置し、アクセラレータ毎に１つを割り当てる。CPU120はサーバ102からライト要求されたファイルを4KB単位に分割したブロックデータを、それらのバッファに均等に分配する（アクセラレータの処理性能に差がある場合は、不均等でもよい）。各アクセラレータのハッシュ生成ユニットは、割り当てられたライトデータバッファからブロックデータを取得してハッシュを生成する。

　ハッシュテーブルは、ハッシュ値をNで割った余りに従ってN個に分けて構成する。N台のアクセラレータはそれらを分担してFMに格納して管理する。例えば、Mを0～N-1の整数として、第M番のアクセラレータは、Nで割った余りがMのハッシュ値のハッシュテーブルを管理し、そのハッシュ探索ユニットは、Nで割った余りがMのハッシュの探索を行う。

　各アクセラレータにおいて、ハッシュ転送ユニットは、ハッシュ生成ユニットが生成したハッシュの値をNで割った余りを求め、その数値に従って、ハッシュ探索するアクセラレータを判断する。例えば、第M番のアクセラレータのハッシュ転送ユニットは、求めた余りK（Kは0～N-1の整数）がMと等しければ自身のハッシュ局所バッファにハッシュを転送し、自身のハッシュ探索ユニットでハッシュ探索を行うが、余りKがMと等しくなければ第K番のアクセラレータにハッシュ探索を依頼する。

　ハッシュ探索をアクセラレータ同士が依頼しあう際に用いるハッシュ共有バッファは、DRAM125にN個設置する。ハッシュ値をNで割った余りに従って、用いるバッファを分ける。例えば、第M番のアクセラレータのハッシュ転送ユニットは、Nで割った余りがKのハッシュの探索を第K番のアクセラレータに依頼する際、第K番のハッシュ共有バッファにハッシュを転送する。第K番のアクセラレータのハッシュ探索ユニットは、第K番のハッシュ共有バッファ、または自身のハッシュ局所バッファからハッシュを取得して、ハッシュ探索を行う。

　重複判定結果は、2台の重複排除アクセラレータによる構成時と同様に、ハッシュを取得したバッファに返され、最終的にDRAM125内のN個のライトデータバッファに重複判定結果が書かれる。

　CPU120は、サーバ102からライト要求されたファイルについて、ファイルを構成するブロックデータを記憶領域111のどこに格納するかを、この結果に基づいて決定する。すなわち、これでファイルの重複排除が行われたことになる。重複判定処理の流れにおいて、CPU120は、ブロックデータから生成されたハッシュ値をNで割った余りによって変わる、このような重複判定処理の手順に関与せず、ブロックデータの分配と重複判定結果の取得のみを行うだけである。

　本発明によれば、N台の重複排除アクセラレータでハッシュの生成と探索を分担して行うことで、1台の重複排除アクセラレータを用いた構成の時のN倍の重複判定処理性能を実現することができる。すなわち、ストレージ装置100に要求されるファイルの書き込み性能要件がどれだけ高くても、それに必要な台数の重複排除アクセラレータ123をストレージ装置100に搭載し、本発明による重複判定処理を行うことで、その性能要件を達成することができる。さらに、その際に、重複排除アクセラレータの台数がどれだけ多くても、それらを制御する負荷がCPU120にかからないようにすることができる。

　なお、以上の説明では、Nで割った余りが何であるかに従って、ハッシュテーブルをN個に振り分けたが、2台の重複排除アクセラレータによる構成時の説明と同様に、振り分け方はこれに限定されるものではない。ハッシュがとりうる値の範囲をN個に分けることができれば、何でも良い。

　さらに、振り分け方は不均等であっても良い。例えば、N台の重複排除アクセラレータの処理能力の比に従って、ハッシュがとりうる値の範囲を比例配分によってN個の区間に分け、区間毎のハッシュテーブルを構成して、N台の重複排除アクセラレータが分担して管理する。そうすれば、全体の重複判定処理は、ほぼ同じ時間で終わるようにすることができ、システム性能が最適化される。

　（９）ハッシュ共有バッファの位置
　これまでの説明においては、ハッシュ共有バッファ(図4の410、411)をストレージコントローラ110内のDRAM125に設置していたが、本発明はハッシュ共有バッファの位置をこの場所に限定するものではない。例えば、各重複排除アクセラレータ123内のDRAM213に設置しても良い。この場合の重複判定処理の流れは、ハッシュ共有バッファにアクセスする際に読み書きするDRAMが変わるだけである。本発明によってもたらされる高性能化の効果もこれまでの説明の構成による効果と変わらない。

　ただし、ハッシュ共有バッファはストレージコントローラ110内のDRAM125に設置するほうが、ストレージ装置100の障害をCPU120が検知する観点では優れている。なぜなら、CPU120は、すぐ近くに位置するDRAM125上のハッシュ共有バッファの内容を監視することで、どのアクセラレータがどのアクセラレータにハッシュ探索を依頼しており、どれだけの判定結果が返っているかを簡単に把握することができるからである。例えば、あるアクセラレータからの探索依頼が長時間来ていない状態が続いていることを検知した場合は、そのアクセラレータのハッシュ転送ユニットが障害を起こしていることが分かる。例えば、あるアクセラレータが判定結果を長時間返していない状態が続いていることを検知した場合は、そのアクセラレータのハッシュ探索ユニットが障害を起こしていることが分かる。

　（１０）ハッシュテーブルの格納媒体
　これまでの説明においては、ハッシュテーブル(図4の430、431)を重複排除アクセラレータ123内のFM200に格納していたが、本発明はハッシュテーブルの格納先をこの場所に限定するものではない。FM220と同様の不揮発性メモリとして、例えばPRAM(相変化メモリ)やReRAM(抵抗変化型メモリ)を用いるとしても良い。また、DRAM213などの揮発性メモリを用いるとしても良い。ただし、その場合には、電源を切断する前にFM200などの不揮発性メモリへハッシュテーブルをバックアップする機構を重複排除アクセラレータ123に備える。

　（１１）重複排除アクセラレータが接続されたときの処理
　CPU120は、重複排除アクセラレータ123が接続されたことを検出すると、以下の処理を行う。

　CPU120は、接続されている重複排除アクセラレータ123の台数を認識する。そして、前述の”（７）ハッシュテーブルの振り分け”及び”（８）３台以上の重複排除アクセラレータの搭載”に基づいて、各重複排除アクセラレータに担当させるハッシュの振り分けを決定する。そして、CPU120は、振り分ける重複排除アクセラレータ123の数と同数のハッシュ共有バッファ及びライトデータバッファをDRAM125内に設定するため、それぞれのアドレスを決定する。　CPU120は、各重複排除アクセラレータ123に、担当させるハッシュを通知する。また、各重複排除アクセラレータ123に、すべてのハッシュ共有バッファのアドレスを通知する。また、各重複排除アクセラレータ123に、担当毎のライトデータバッファのアドレスを通知する。ここで、CPU120が重複排除アクセラレータ123に情報を通知する順番は入れ替わってもよい。CPU120は各情報を別々の通知コマンドで重複排除アクセラレータ123に通知してもよいし、1つの通知コマンドですべての情報を通知してもよい。CPU120は、各重複排除アクセラレータ123から通知コマンドに対する完了応答を受信すると、重複判定の処理を開始することができる。これにより、CPU120は各重複排除アクセラレータ123に適切に重複判定処理を分担させることができる。

100…ストレージ装置、110…ストレージコントローラ、120…CPU、123、123a、123b…重複排除アクセラレータ、125…DRAM、210…重複排除アクセラレータコントローラ、213…DRAM、219、219a、219b…ハッシュ生成ユニット、216、216a、216b…ハッシュ転送ユニット、218、218a、218b…ハッシュ探索ユニット、220…NAND型フラッシュメモリ。

Claims

　ライト要求されたファイルを構成する複数のブロックデータの重複排除を行うシステムであって、
　それぞれが重複判定処理をする複数のアクセラレータと、
　前記ブロックデータを各前記アクセラレータに分配するための複数のデータバッファを備える第一メモリと、を備え、
　前記複数のアクセラレータのそれぞれは、
　前記ブロックデータの重複判定を行うために用いるハッシュテーブルを分担して格納する第二メモリを備え、
　前記ブロックデータからハッシュ値を生成する手段と、
　前記ハッシュテーブルから前記ハッシュ値を探索する手段と、を備える
　ことを特徴とするシステム。
　前記システムは、ライト要求された前記ファイルを前記複数のブロックデータに分割し、前記複数のデータバッファのそれぞれに分配するCPUを備え、
　前記複数のアクセラレータのそれぞれは、
　自身に対応する前記複数のデータバッファの１つから前記複数のブロックデータのうちの第一ブロックデータを取得し、前記第一ブロックデータの前記ハッシュ値を生成し、
　当該ハッシュ値に基づいて、自身が格納する前記ハッシュテーブルが探索先であるか、その他の前記アクセラレータが格納する前記ハッシュテーブルが探索先であるかを判断する
　ことを特徴とする請求項１に記載のシステム。
　前記複数のアクセラレータのそれぞれは、前記判断結果が、自身が格納する前記ハッシュテーブルが探索先である場合は、自身の前記第二メモリから読み出した前記ハッシュテーブルを用いてハッシュ探索を行い、当該ハッシュ探索で得られた重複判定結果を前記システムの前記第一メモリ内の前記複数のデータバッファの１つに書く
　ことを特徴とする請求項２に記載のシステム。
　前記第一メモリ内に、前記複数のアクセラレータ間で前記ハッシュ値を転送するためのハッシュ共有バッファを備え、
　前記複数のアクセラレータのそれぞれは、前記判断結果が、その他の前記アクセラレータが格納する前記ハッシュテーブルが探索先である場合は、前記ハッシュ共有バッファに前記ハッシュ値を転送し、
　前記複数のアクセラレータのそれぞれは、自身が格納する前記ハッシュテーブルで探索可能な前記ハッシュを、前記ハッシュ共有バッファから取得し、自身の前記第二メモリから読み出した前記ハッシュテーブルを用いてハッシュ探索を行い、当該ハッシュ探索で得られた重複判定結果を前記ハッシュ共有バッファに書き、
　前記ハッシュ共有バッファに前記ハッシュ値を転送した前記アクセラレータは、当該ハッシュ値の前記ハッシュ探索で得られた前記重複判定結果を、前記ハッシュ共有バッファから取得し、当該重複判定結果を前記第一メモリ内の前記複数のデータバッファの１つに書く
　ことを特徴とする請求項２に記載のシステム。
　前記CPUは、前記複数のデータバッファから前記重複判定結果を取得し、当該重複判定結果に基づいて、ライト要求された前記ファイルを構成する前記ブロックデータの格納を行う
　ことを特徴とする請求項３乃至４に記載のシステム。
　請求項２に記載の前記システムであって、
　前記複数のアクセラレータは、前記探索先の判断を、当該ハッシュ値を前記複数のアクセラレータの数で割った余りの値に基づいて行う
　ことを特徴とする請求項２に記載のシステム。
　それぞれがブロックデータの重複判定処理をする複数のアクセラレータと、
　複数のブロックデータを前記複数のアクセラレータに分配するCPUと、
　を備え、
　前記複数のアクセラレータのそれぞれは、
　ハッシュ値に基づいて分担されている、前記分配されたブロックデータの重複判定を行うためのハッシュ管理情報を有し、
　前記分配されたブロックデータからハッシュ値を生成し、
　前記ハッシュ管理情報から、前記ハッシュ値を探索する
　ことを特徴とするシステム。