JP7215804B2 - ストレージ装置、情報処理システム、情報処理方法、およびプログラム - Google Patents
ストレージ装置、情報処理システム、情報処理方法、およびプログラム Download PDFInfo
- Publication number
- JP7215804B2 JP7215804B2 JP2021082355A JP2021082355A JP7215804B2 JP 7215804 B2 JP7215804 B2 JP 7215804B2 JP 2021082355 A JP2021082355 A JP 2021082355A JP 2021082355 A JP2021082355 A JP 2021082355A JP 7215804 B2 JP7215804 B2 JP 7215804B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- feature data
- feature
- write
- hash value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
図1は、本実施形態による情報処理システムを示す概略構成図である。情報処理システムSは、例えば、ディスクアレイ装置1と、ホスト2とを含む。ディスクアレイ装置1は、「ストレージ装置」の一例である。
次に、ディスクアレイ装置1について説明する。
図1に示すように、ディスクアレイ装置1は、例えば、I/O処理部(入出力処理部)11と、メモリ12と、重複排除ボリューム13と、プールボリューム14と、管理ボリューム15とを備える。本実施形態では、重複排除ボリューム13と、プールボリューム14と、管理ボリューム15とにより、記憶部Mが構成されている。記憶部Mは、「記憶手段」の一例である。
<3.1 ライト処理の流れ>
図7および図8を参照し、重複排除ボリューム13のライト処理について説明する。
図7は、重複排除ボリューム13のライト処理の流れを示すフローチャートである。まず、ディスクアレイ装置1のI/O処理部11は、ホスト2からライト命令および当該ライト命令に対応するライトデータを受信する(S500)。ライト命令処理部111は、I/O処理部11がホスト2からライト命令を受信すると、当該ライト命令によりライト処理が要求されたライトデータをチャンク単位に分割する(S501)。そして、ハッシュ値算出部1111は、分割したチャンクごとにハッシュ値を算出し、算出したハッシュ値をメモリ12に保存する(S502)。
重複排除処理部114は、ハッシュ値判定処理(S503)が完了したら、ライト範囲の先頭チャンクから順にハッシュ値の登録の有無に従い処理を行う。具体的には、重複排除処理部114は、重複排除処理部114による処理対象のチャンクのハッシュ値の登録の必要性の有無を判定する(S504)。
図9を参照し、重複排除ボリューム13のリード処理について説明する。
図9は、重複排除ボリューム13のリード処理の流れを示すフローチャートである。まず、ディスクアレイ装置1のI/O処理部11は、ホスト2から重複排除ボリューム13に対するリード命令を受信する(S701)。リード命令処理部112は、ディスクアレイ装置1のI/O処理部11がホスト2から重複排除ボリューム13に対するリード命令を受信すると、メモリ12にリードデータを作成するワークメモリ(ワークバッファ)を確保する(S702)。
重複排除を行うストレージ装置では、ライトデータが既にストレージ装置に記憶されているデータと重複しているか否かを調べる際に、ライトデータを一定長のチャンク分割し、チャンクから算出するハッシュ値などの特徴データ(ここでは便宜上「ハッシュ値」と記載)を既にストレージ記憶しているハッシュ値と比較することで判定することが行われる。ストレージ内でハッシュ値を記憶するハッシュテーブルは、全てのライトデータのチャンクに対するハッシュ値を記憶する必要があり膨大となる。一方、できるだけテーブルサイズを抑ながら高速に所望のハッシュ値を検索できるように、ハッシュテーブルは階層管理を用いたアルゴリズムが採用される。
上述した実施形態では、チャンクサイズよりも大きいサイズのライトデータに関するものであったが、上述した実施形態は、例えば小さいサイズのデータのライト命令が連続するシーケンシャルライトにも適用可能である。シーケンシャルライトで受信するライトデータは、「一連のライトデータ」の一例であるとともに、「第1ライトデータ」および「第2ライトデータ」のそれぞれ別の一例である。ディスクアレイ装置1がホスト2からのシーケンシャルライトを検出した場合には、ハッシュエントリ1521に後続ハッシュ値と後続ハッシュエントリ位置とを記憶することで、続くアドレスへのライト処理におけるハッシュ値判定にて、後続ハッシュ値によるハッシュ判定(図6のS611~S612)を実施することが可能となる。これにより、ライト性能の向上を図ることができる。
図11は、最小構成のストレージ装置における処理の流れを示すフローを示す図である。ストレージ装置800は、ライト命令処理部810と、特徴データ登録部820と、判定処理部830とを備える。
ライト命令処理部810は、ひと纏まりまたは一連のライトデータに含まれる所定の管理単位のデータごとに、当該データに応じた特徴データを対応付ける(S902)。
特徴データ登録部820は、第1ライトデータに含まれる管理単位の第1データに対応する特徴データを記憶部に記憶させる場合、第1ライトデータに含まれて第1データの後続となる管理単位の第2データに対応する特徴データを、第1データに対応する特徴データと関連付けて記憶部に記憶させる(S901)。
判定処理部830は、第2ライトデータに対して重複判定を行う場合に、第1データに対応する特徴データを用いて重複判定を行い、第1データに対応する特徴データとの関連付けに基づき第2データに対応する特徴データを読み出し、第2データに対応する特徴データを用いて重複判定を行う(S903)。
1…ディスクアレイ装置
2…ホスト
11…I/O処理部
12…メモリ
13…重複排除ボリューム
14…プールボリューム
15…管理モジュール
111…ライト命令処理部
1111…ハッシュ値算出部
112…リード命令処理部
113…ハッシュ値判定処理部
1131…ハッシュ値判定方法決定部
1132…ハッシュ値検索部
1133…後続ハッシュ値比較部
114…重複排除処理部
1141…ハッシュ値登録部
1142…チャンクデータライト部
800…ストレージ装置
810…ライト命令処理部
820…特徴データ登録部
830…判定処理部
Claims (9)
- ひと纏まりまたは一連のライトデータに含まれる所定の管理単位のデータごとに、当該データに応じた特徴データを対応付けるライト命令処理手段と、
第1ライトデータに含まれる前記管理単位の第1データに対応する前記特徴データである第1特徴データを記憶手段に記憶させる場合、前記第1ライトデータに含まれて前記第1データの後続となる前記管理単位の第2データに対応する前記特徴データである第2特徴データを、前記第1特徴データと関連付けて前記記憶手段に記憶させる特徴データ登録手段と、
第2ライトデータに対して重複判定を行う場合に、前記第1特徴データと、前記第2ライトデータに含まれる前記管理単位の第4データに対応する前記特徴データである第4特徴データとを比較する第1重複判定を行い、前記第1重複判定において前記第1特徴データと前記第4特徴データとが一致し、前記第1特徴データとの関連付けに基づき前記第2特徴データが読み出し可能である場合、前記第1特徴データとの関連付けに基づき前記第2特徴データを読み出し、前記第2特徴データと、前記第2ライトデータに含まれて前記第4データの後続となる前記管理単位の第5データに対応する前記特徴データである第5特徴データとを比較する第2重複判定を行う判定処理手段と、
前記第1重複判定の結果に基づき、前記第4データが重複データであるか否か判定し、前記第2重複判定の結果に基づき、前記第5データが重複データであるか否か判定する重複排除処理手段と、
を備えたストレージ装置。 - 前記特徴データは、前記管理単位のデータから算出されるハッシュ値である、
請求項1に記載のストレージ装置。 - 前記特徴データ登録手段は、前記第2特徴データを、前記第1特徴データと同じエントリに登録する、
請求項1または請求項2に記載のストレージ装置。 - 前記特徴データ登録手段は、前記第2特徴データと、前記第2特徴データの格納位置を示す情報とを、前記第1特徴データと同じエントリに登録する、
請求項1から請求項3のうちいずれか1項に記載のストレージ装置。 - 前記記憶手段は、複数階層を含むテーブル情報を記憶し、前記複数階層のうち最下層以外のテーブル情報には、前記特徴データを検索する際に次にリードすべきツリー検索情報の位置情報が格納され、前記複数階層の最下層のテーブル情報に前記エントリの位置情報が格納されている、
請求項3または請求項4に記載のストレージ装置。 - 前記特徴データ登録手段は、前記第2特徴データを前記記憶手段に記憶させる場合、前記第1ライトデータに含まれて前記第2データの後続となる前記管理単位の第3データに対応する前記特徴データである第3特徴データを、前記第2特徴データと関連付けて前記記憶手段に記憶させ、
前記判定処理手段は、前記第2ライトデータに対して重複判定を行う場合に、前記第2重複判定において前記第2特徴データと前記第5特徴データとが一致し、前記第2特徴データとの関連付けに基づき前記第3特徴データが読み出し可能である場合、前記第2特徴データとの関連付けに基づき前記第3特徴データを読み出し、前記第3特徴データと、前記第2ライトデータに含まれて前記第5データの後続となる前記管理単位の第6データに対応する前記特徴データである第6特徴データとを比較する第3重複判定を行い、
前記重複排除処理手段は、前記第3重複判定の結果に基づき、前記第6データが重複データであるか否か判定する、
請求項1から請求項5のうちいずれか1項に記載のストレージ装置。 - ホストと、
前記ホストと通信可能に接続されたストレージ装置と、
を備え、
前記ストレージ装置は、
ひと纏まりまたは一連のライトデータに含まれる所定の管理単位のデータごとに、当該データに応じた特徴データを対応付けるライト命令処理手段と、
第1ライトデータに含まれる前記管理単位の第1データに対応する前記特徴データである第1特徴データを記憶手段に記憶させる場合、前記第1ライトデータに含まれて前記第1データの後続となる前記管理単位の第2データに対応する前記特徴データである第2特徴データを、前記第1特徴データと関連付けて前記記憶手段に記憶させる特徴データ登録手段と、
第2ライトデータに対して重複判定を行う場合に、前記第1特徴データと、前記第2ライトデータに含まれる前記管理単位の第4データに対応する前記特徴データである第4特徴データとを比較する第1重複判定を行い、前記第1重複判定において前記第1特徴データと前記第4特徴データとが一致し、前記第1特徴データとの関連付けに基づき前記第2特徴データが読み出し可能である場合、前記第1特徴データとの関連付けに基づき前記第2特徴データを読み出し、前記第2特徴データと、前記第2ライトデータに含まれて前記第4データの後続となる前記管理単位の第5データに対応する前記特徴データである第5特徴データとを比較する第2重複判定を行う判定処理手段と、
前記第1重複判定の結果に基づき、前記第4データが重複データであるか否か判定し、前記第2重複判定の結果に基づき、前記第5データが重複データであるか否か判定する重複排除処理手段と、
を含む、情報処理システム。 - ひと纏まりまたは一連のライトデータに含まれる所定の管理単位のデータごとに、当該データに応じた特徴データを対応付け、
第1ライトデータに含まれる前記管理単位の第1データに対応する前記特徴データである第1特徴データを記憶させる場合、前記第1ライトデータに含まれて前記第1データの後続となる前記管理単位の第2データに対応する前記特徴データである第2特徴データを、前記第1特徴データと関連付けて記憶させ、
第2ライトデータに対して重複判定を行う場合に、前記第1特徴データと、前記第2ライトデータに含まれる前記管理単位の第4データに対応する前記特徴データである第4特徴データとを比較する第1重複判定を行い、前記第1重複判定において前記第1特徴データと前記第4特徴データとが一致し、前記第1特徴データとの関連付けに基づき前記第2特徴データが読み出し可能である場合、前記第1特徴データとの関連付けに基づき前記第2特徴データを読み出し、前記第2特徴データと、前記第2ライトデータに含まれて前記第4データの後続となる前記管理単位の第5データに対応する前記特徴データである第5特徴データとを比較する第2重複判定を行なわせ、
前記第1重複判定の結果に基づき、前記第4データが重複データであるか否か判定させ、前記第2重複判定の結果に基づき、前記第5データが重複データであるか否か判定させる、
情報処理方法。 - コンピュータに、
ひと纏まりまたは一連のライトデータに含まれる所定の管理単位のデータごとに、当該データに応じた特徴データを対応付けることと、
第1ライトデータに含まれる前記管理単位の第1データに対応する前記特徴データである第1特徴データを記憶させる場合、前記第1ライトデータに含まれて前記第1データの後続となる前記管理単位の第2データに対応する前記特徴データである第2特徴データを、前記第1特徴データと関連付けて記憶させることと、
第2ライトデータに対して重複判定を行う場合に、前記第1特徴データと、前記第2ライトデータに含まれる前記管理単位の第4データに対応する前記特徴データである第4特徴データとを比較する第1重複判定を行い、前記第1重複判定において前記第1特徴データと前記第4特徴データとが一致し、前記第1特徴データとの関連付けに基づき前記第2特徴データが読み出し可能である場合、前記第1特徴データとの関連付けに基づき前記第2特徴データを読み出し、前記第2特徴データと、前記第2ライトデータに含まれて前記第4データの後続となる前記管理単位の第5データに対応する前記特徴データである第5特徴データとを比較する第2重複判定を行うことと、
前記第1重複判定の結果に基づき、前記第4データが重複データであるか否か判定し、前記第2重複判定の結果に基づき、前記第5データが重複データであるか否か判定することと、
を実行させるプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021082355A JP7215804B2 (ja) | 2021-05-14 | 2021-05-14 | ストレージ装置、情報処理システム、情報処理方法、およびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021082355A JP7215804B2 (ja) | 2021-05-14 | 2021-05-14 | ストレージ装置、情報処理システム、情報処理方法、およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022175713A JP2022175713A (ja) | 2022-11-25 |
JP7215804B2 true JP7215804B2 (ja) | 2023-01-31 |
Family
ID=84145073
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021082355A Active JP7215804B2 (ja) | 2021-05-14 | 2021-05-14 | ストレージ装置、情報処理システム、情報処理方法、およびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7215804B2 (ja) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018514045A (ja) | 2015-12-29 | 2018-05-31 | 華為技術有限公司Huawei Technologies Co.,Ltd. | 重複排除方法および記憶デバイス |
US10565183B1 (en) | 2016-05-02 | 2020-02-18 | Pure Storage, Inc. | Efficient deduplication signature utilization |
US20210034578A1 (en) | 2019-08-02 | 2021-02-04 | EMC IP Holding Company LLC | Inline deduplication using neighboring segment loading |
-
2021
- 2021-05-14 JP JP2021082355A patent/JP7215804B2/ja active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018514045A (ja) | 2015-12-29 | 2018-05-31 | 華為技術有限公司Huawei Technologies Co.,Ltd. | 重複排除方法および記憶デバイス |
US10565183B1 (en) | 2016-05-02 | 2020-02-18 | Pure Storage, Inc. | Efficient deduplication signature utilization |
US20210034578A1 (en) | 2019-08-02 | 2021-02-04 | EMC IP Holding Company LLC | Inline deduplication using neighboring segment loading |
Also Published As
Publication number | Publication date |
---|---|
JP2022175713A (ja) | 2022-11-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10620862B2 (en) | Efficient recovery of deduplication data for high capacity systems | |
US9830274B2 (en) | Caching and deduplication of data blocks in cache memory | |
US10402091B1 (en) | Managing data in log-structured storage systems | |
CN108459826B (zh) | 一种处理io请求的方法及装置 | |
US10248623B1 (en) | Data deduplication techniques | |
US8732403B1 (en) | Deduplication of data blocks on storage devices | |
US20140297603A1 (en) | Method and apparatus for deduplication of replicated file | |
CN108604165B (zh) | 存储装置 | |
US11580162B2 (en) | Key value append | |
US9842057B2 (en) | Storage apparatus, storage system, and data read method | |
US10592150B2 (en) | Storage apparatus | |
CN113535670B (zh) | 一种虚拟化资源镜像存储系统及其实现方法 | |
US10366011B1 (en) | Content-based deduplicated storage having multilevel data cache | |
JP5330432B2 (ja) | データ記憶装置及びテーブル管理方法 | |
WO2017113059A1 (zh) | 一种差异数据备份方法、存储系统和差异数据备份装置 | |
JP2019028954A (ja) | ストレージ制御装置、プログラム、及び重複排除方法 | |
JP6089890B2 (ja) | ストレージ制御装置、ストレージ制御装置の制御方法およびストレージ制御装置の制御プログラム | |
US11042316B1 (en) | Reordered data deduplication in storage devices | |
US11016884B2 (en) | Virtual block redirection clean-up | |
CN110187834B (zh) | 重删副本的数据处理方法、装置、电子设备 | |
US20170147598A1 (en) | File system, data deduplication method and storage medium | |
KR102071072B1 (ko) | 데이터 저장장치의 주소 맵핑 테이블 운용 방법 | |
WO2024119797A1 (zh) | 一种数据处理方法、系统、设备以及存储介质 | |
JP7215804B2 (ja) | ストレージ装置、情報処理システム、情報処理方法、およびプログラム | |
JP6419662B2 (ja) | ストレージシステム及びデータ重複検出方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210514 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220628 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220829 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20221220 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230113 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 7215804 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |