JP2021076969A - 情報処理装置および情報処理プログラム - Google Patents
情報処理装置および情報処理プログラム Download PDFInfo
- Publication number
- JP2021076969A JP2021076969A JP2019201537A JP2019201537A JP2021076969A JP 2021076969 A JP2021076969 A JP 2021076969A JP 2019201537 A JP2019201537 A JP 2019201537A JP 2019201537 A JP2019201537 A JP 2019201537A JP 2021076969 A JP2021076969 A JP 2021076969A
- Authority
- JP
- Japan
- Prior art keywords
- defragmentation
- chunk
- chunks
- objects
- executed
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000010365 information processing Effects 0.000 title claims description 46
- 238000012545 processing Methods 0.000 claims abstract description 151
- 238000000034 method Methods 0.000 claims description 125
- 230000008569 process Effects 0.000 claims description 94
- 238000004891 communication Methods 0.000 abstract description 56
- 230000007423 decrease Effects 0.000 abstract description 18
- 238000007726 management method Methods 0.000 description 79
- 238000010586 diagram Methods 0.000 description 19
- 230000000052 comparative effect Effects 0.000 description 12
- 238000012217 deletion Methods 0.000 description 10
- 230000037430 deletion Effects 0.000 description 10
- 230000006870 function Effects 0.000 description 8
- 230000004044 response Effects 0.000 description 8
- 230000007704 transition Effects 0.000 description 5
- 230000003287 optical effect Effects 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- 238000013500 data storage Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 241000699670 Mus sp. Species 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000013144 data compression Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005401 electroluminescence Methods 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000015654 memory Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F12/00—Accessing, addressing or allocating within memory systems or architectures
- G06F12/02—Addressing or allocation; Relocation
- G06F12/0223—User address space allocation, e.g. contiguous or non contiguous base addressing
- G06F12/023—Free address space management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0602—Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
- G06F3/0614—Improving the reliability of storage systems
- G06F3/0619—Improving the reliability of storage systems in relation to data integrity, e.g. data losses, bit errors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F12/00—Accessing, addressing or allocating within memory systems or architectures
- G06F12/02—Addressing or allocation; Relocation
- G06F12/0223—User address space allocation, e.g. contiguous or non contiguous base addressing
- G06F12/023—Free address space management
- G06F12/0253—Garbage collection, i.e. reclamation of unreferenced memory
- G06F12/0261—Garbage collection, i.e. reclamation of unreferenced memory using reference counting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0602—Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
- G06F3/0608—Saving storage space on storage systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0602—Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
- G06F3/061—Improving I/O performance
- G06F3/0613—Improving I/O performance in relation to throughput
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0628—Interfaces specially adapted for storage systems making use of a particular technique
- G06F3/0638—Organizing or formatting or addressing of data
- G06F3/064—Management of blocks
- G06F3/0641—De-duplication techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0628—Interfaces specially adapted for storage systems making use of a particular technique
- G06F3/0646—Horizontal data movement in storage systems, i.e. moving data in between storage devices or systems
- G06F3/0652—Erasing, e.g. deleting, data cleaning, moving of data to a wastebasket
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0628—Interfaces specially adapted for storage systems making use of a particular technique
- G06F3/0655—Vertical data movement, i.e. input-output transfer; data movement between one or more hosts and one or more storage devices
- G06F3/0659—Command handling arrangements, e.g. command buffers, queues, command scheduling
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0668—Interfaces specially adapted for storage systems adopting a particular infrastructure
- G06F3/067—Distributed or networked storage systems, e.g. storage area networks [SAN], network attached storage [NAS]
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Computer Security & Cryptography (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
〔第1の実施の形態〕
図1は、第1の実施の形態に係るストレージシステムの構成例および処理例を示す図である。図1に示すストレージシステムは、情報処理装置10と、この情報処理装置10の外部に接続された外部ストレージ20とを有する。情報処理装置10は、外部ストレージ20に対するデータの読み書きを制御する制御装置である。外部ストレージ20は、情報処理装置10に対して図示しないネットワークを介して接続され、情報処理装置10に対してネットワークを介してデータの記憶領域を提供する。また、外部ストレージ20は、オブジェクト単位でデータが読み書きされるオブジェクトストレージである。
次に、図1の外部ストレージ20としてクラウドストレージが用いられ、図1の情報処理装置10としてクラウドストレージゲートウェイが用いられた場合の例について説明する。
以上のようなハードウェア構成によって、クラウドストレージゲートウェイ100の処理機能を実現することができる。なお、NASクライアント210や制御サーバ221aも、図3と同様のハードウェア構成を有するコンピュータとして実現可能である。
チャンク管理部132は、重複判定部131によってデータキャッシュ117に格納されたチャンクを、適切なサイズになるように複数まとめてオブジェクトを生成し、クラウド通信部140を介してクラウドストレージ240に格納する。本実施の形態では例として、所定個数のチャンクによってオブジェクトが生成される。
図5は、チャンクマップテーブルの構成例を示す図である。チャンクマップテーブル112は、ファイルと重複排除されたチャンクとの対応関係を管理するための管理情報である。図5に示すように、チャンクマップテーブル112には、ファイル番号、オフセット、サイズおよびチャンク番号の各項目を有するレコードが登録される。各レコードは、ファイルの実データを分割して生成された1つのチャンクに対応付けられている。
チャンク管理テーブル113は、重複排除されたチャンクとオブジェクトとの対応関係や、チャンクの参照数を管理するための管理情報である。図6に示すように、チャンク管理テーブル113には、チャンク番号、オブジェクト番号、オフセット、サイズおよび参照数の各項目を有するレコードが登録される。各レコードは、重複排除された1つのチャンクに対応付けられている。
なお、図7に示すテーブル113aは、チャンク管理テーブル113から、オブジェクト番号「ob11」のオブジェクトに属するチャンクに対応するレコードのチャンク番号およびオブジェクト番号の各項目を抽出したものである。同様に、図7に示すテーブル113bは、チャンク管理テーブル113から、オブジェクト番号「ob12」のオブジェクトに属するチャンクに対応するレコードのチャンク番号およびオブジェクト番号の各項目を抽出したものである。また、図7に示すテーブル113cは、チャンク管理テーブル113から、オブジェクト番号「ob13」のオブジェクトに属するチャンクに対応するレコードのチャンク番号およびオブジェクト番号の各項目を抽出したものである。
図8は、オブジェクト管理テーブルの構成例を示す図である。オブジェクト管理テーブル115には、オブジェクト番号に対して有効チャンク数および無効チャンク数が対応付けて登録される。有効チャンク数は、オブジェクトに含まれるチャンクデータのうち、有効なチャンクデータ(参照数が1以上のチャンクデータ)の数を示す。無効チャンク数は、オブジェクトに含まれるチャンクデータのうち、無効なチャンクデータ(参照数が0のチャンクデータ)の数を示す。
まず、図10は、デフラグ処理手順の比較例を示す第1の図である。図10の例では、NASクライアント210からクラウドストレージゲートウェイ100に対して、ファイルf21〜f24の書き込みが順に要求されたとする。
本実施の形態のクラウドストレージゲートウェイ100は、オブジェクトについての1回目のデフラグの実行要否をオブジェクト単位で判定するのではなく、複数のオブジェクトを含むオブジェクトグループ単位で判定する。図9に示したデフラグ判定テーブル116は、オブジェクトグループ単位でデフラグの実行要否を判定するために利用される。クラウドストレージゲートウェイ100は、デフラグ判定テーブル116を用いて、オブジェクトグループに含まれる各オブジェクトでの無効チャンクの発生状況を監視する。そして、クラウドストレージゲートウェイ100は、オブジェクトグループ内の無効チャンク数の割合が一定割合を超えた場合に、そのオブジェクトグループ内の各オブジェクトについてデフラグの実行が必要と判定する。
上記のようにオブジェクト内の各チャンクの参照数が均等に減少していく可能性が高い場合には、オブジェクトのサイズが小さいほど、そのオブジェクトについてデフラグが必要と判定されたときに、オブジェクト内の全チャンクが無効になる可能性が高くなる。そこで、クラウドストレージゲートウェイ100は、オブジェクトグループgp1の1回目のデフラグの際、オブジェクトに含める参照数が小さいほど、オブジェクトのサイズを小さくする(オブジェクトに含めるチャンク数を少なくする)。これにより、オブジェクトについてデフラグが必要と判定されたときに、オブジェクト内の全チャンクが無効になっている場合には、そのオブジェクトの削除(DELETE)のみ実行されればよくなり、オブジェクトの取得(GET)と再アップロード(PUT)は不要になる。したがって、クラウドストレージゲートウェイ100とクラウドストレージ240との間の通信回数をさらに低減できる可能性が高くなる。また、通信回数の減少により、クラウドストレージゲートウェイ100とクラウドストレージ240との間の通信量のさらなる削減も期待できる。
クラウドストレージゲートウェイ100は、オブジェクトについての1回目のデフラグの際に生成するオブジェクトのサイズを、初回アップロード時に生成するオブジェクトのサイズより小さくしてもよい。これは、クラウドストレージ240についての次のような特性に基づいて行われる。
図18、図19は、ファイル書き込み処理の手順を示すフローチャートの例である。
[ステップS21]重複判定部131は、ステップS12で選択されたチャンクについての新たなチャンク番号を算出する。このチャンク番号は、チャンク管理テーブル113に登録されているチャンク番号の最大値に「1」を加算した値とされる。重複判定部131は、チャンク管理テーブル113に新たなレコードを追加し、このレコードに対し、算出された新たなチャンク番号と、チャンクのサイズと、参照数「1」とを登録する。
ステップS26が実行された場合、チャンク管理部132は、ステップS26でオブジェクト管理テーブル115に追加したレコードに、有効チャンク数としてMを登録する。また、チャンク管理部132は、このレコードに対応するオブジェクトが含まれるオブジェクトグループに対応するレコードをデフラグ判定テーブル116から特定し、特定したレコードに登録された有効チャンク数にMを加算する。ただし、該当するオブジェクトグループがデフラグ判定テーブル116に存在しない場合、チャンク管理部132は、デフラグ判定テーブル116に新たにレコードを追加し、そのレコードに有効チャンク数としてMを登録し、デフラグ済みフラグとして「0」を登録する。
図20は、ファイル削除処理の手順を示すフローチャートの例である。
[ステップS51]重複排除処理部130のデフラグ処理部133は、図20のステップS39の処理によってあるオブジェクトグループがデフラグ対象に設定されてから、一定時間経過するのを待つ。そして、デフラグ処理部133は、一定時間が経過すると、当該オブジェクトグループを処理対象として処理をステップS52に進める。
[ステップS61]デフラグ処理部133は、処理対象のオブジェクトグループに属するすべてのオブジェクトを取得するように、クラウド通信部140に依頼する。クラウド通信部140は、GETコマンドにより該当する全オブジェクトをクラウドストレージ240からダウンロードする。
[ステップS70]デフラグ処理部133は、デフラグ判定テーブル116から、処理対象のオブジェクトグループに対応するレコードを特定する。デフラグ処理部133は、特定したレコードに登録された無効チャンク数から、ステップS61でダウンロードしたオブジェクトに含まれていた無効チャンクの数を減算する。また、デフラグ処理部133は、特定したレコードのチャンク番号の項目から、これらの無効チャンクのチャンク番号を削除する。さらに、デフラグ処理部133は、ステップS61でダウンロードした各オブジェクトの削除をクラウド通信部140に依頼し、オブジェクト管理テーブル115から、これらのオブジェクトに対応するレコードを削除する。以上の処理が完了すると、デフラグ処理が終了される。
[ステップS53]デフラグ処理部133は、処理対象のオブジェクトグループに属するオブジェクトを1つ選択する。なお、処理対象のオブジェクトグループに属するオブジェクトは、このオブジェクトグループに対応するデフラグ判定テーブル116のレコードに登録されたチャンク番号と、チャンク管理テーブル113においてこのチャンク番号に対応付けられたオブジェクト番号とから特定される。
[ステップS57]デフラグ処理部133は、オブジェクト管理テーブル115のレコードのうち、ステップS55で取得したオブジェクトに対応するレコードに登録された無効チャンク数を「0」にリセットする。また、デフラグ処理部133は、デフラグ判定テーブル116から、当該オブジェクトが属するオブジェクトグループに対応するレコード(当該オブジェクトに含まれるチャンクのチャンク番号が登録されたレコード)を特定する。デフラグ処理部133は、特定したレコードのチャンク番号の項目から、オブジェクト再構築によって除外した無効チャンクのチャンク番号を削除し、特定したレコードに登録された無効チャンク数から、除外した無効チャンクの数を減算する。
[ステップS67a]デフラグ処理部133は、現在の参照数Rが所定の閾値以上かを判定する。この閾値としては、2以上の整数が設定される。デフラグ処理部133は、参照数Rが閾値以上の場合、処理をステップS67bに進め、参照数Rが閾値より小さい場合、処理をステップS67cに進める。
(付記1) 書き込みが要求された複数の書き込みデータセットの重複を排除することで得られた複数のデータセットを、外部ストレージに格納する格納処理であって、前記複数のデータセットから出現順に選択された2以上のデータセットをオブジェクトにまとめて前記外部ストレージに格納する前記格納処理を実行し、
前記外部ストレージに格納された前記オブジェクトのうち2以上の前記オブジェクトを生成順にまとめたオブジェクトグループを単位としてデフラグの実行要否を判定し、
前記オブジェクトグループのうち一のオブジェクトグループのデフラグを実行すると判定すると、前記一のオブジェクトグループに含まれるすべての前記オブジェクトをそれぞれ第1のオブジェクトとして前記外部ストレージから取得し、前記第1のオブジェクトに含まれるデータセットのうち参照数が1以上である有効データセットを、前記有効データセットの生成順と参照数とに基づいて組み合わせて1以上の第2のオブジェクトを生成し直し、前記第2のオブジェクトを前記第1のオブジェクトの代わりに前記外部ストレージに格納する第1のデフラグ処理を実行する、処理部、
を有する情報処理装置。
付記1記載の情報処理装置。
付記2記載の情報処理装置。
付記2記載の情報処理装置。
前記外部ストレージに格納された前記第2のオブジェクトについてのデフラグの実行要否を、前記第2のオブジェクトごとに個別に判定し、
前記第2のオブジェクトのうち一のオブジェクトのデフラグを実行すると判定すると、前記一のオブジェクトを前記外部ストレージから取得し、前記一のオブジェクトに含まれるデータセットのうち前記参照数が1以上のデータセットだけをまとめて第3のオブジェクトを生成し直し、前記第3のオブジェクトを前記一のオブジェクトの代わりに前記外部ストレージに格納する第2のデフラグ処理を実行する、
付記1乃至4のいずれか1つに記載の情報処理装置。
前記処理部は、前記一のオブジェクトグループのデフラグを実行すると判定してから所定時間が経過した後に、前記第1のデフラグ処理の実行を開始する、
付記1乃至5のいずれか1つに記載の情報処理装置。
書き込みが要求された複数の書き込みデータセットの重複を排除することで得られた複数のデータセットを、外部ストレージに格納する格納処理であって、前記複数のデータセットから出現順に選択された2以上のデータセットをオブジェクトにまとめて前記外部ストレージに格納する前記格納処理を実行し、
前記外部ストレージに格納された前記オブジェクトのうち2以上の前記オブジェクトを生成順にまとめたオブジェクトグループを単位としてデフラグの実行要否を判定し、
前記オブジェクトグループのうち一のオブジェクトグループのデフラグを実行すると判定すると、前記一のオブジェクトグループに含まれるすべての前記オブジェクトをそれぞれ第1のオブジェクトとして前記外部ストレージから取得し、前記第1のオブジェクトに含まれるデータセットのうち参照数が1以上である有効データセットを、前記有効データセットの生成順と参照数とに基づいて組み合わせて1以上の第2のオブジェクトを生成し直し、前記第2のオブジェクトを前記第1のオブジェクトの代わりに前記外部ストレージに格納する第1のデフラグ処理を実行する、
処理を実行させる情報処理プログラム。
付記7記載の情報処理プログラム。
付記8記載の情報処理プログラム。
付記8記載の情報処理プログラム。
前記外部ストレージに格納された前記第2のオブジェクトについてのデフラグの実行要否を、前記第2のオブジェクトごとに個別に判定し、
前記第2のオブジェクトのうち一のオブジェクトのデフラグを実行すると判定すると、前記一のオブジェクトを前記外部ストレージから取得し、前記一のオブジェクトに含まれるデータセットのうち前記参照数が1以上のデータセットだけをまとめて第3のオブジェクトを生成し直し、前記第3のオブジェクトを前記一のオブジェクトの代わりに前記外部ストレージに格納する第2のデフラグ処理を実行する、
付記7乃至10のいずれか1つに記載の情報処理プログラム。
前記第1のデフラグ処理の実行は、前記一のオブジェクトグループのデフラグを実行すると判定してから所定時間が経過した後に開始される、
付記7乃至11のいずれか1つに記載の情報処理プログラム。
11 処理部
20 外部ストレージ
GP1,GP2 オブジェクトグループ
OB1〜OB6,OB11,OB12 オブジェクト
Claims (7)
- 書き込みが要求された複数の書き込みデータセットの重複を排除することで得られた複数のデータセットを、外部ストレージに格納する格納処理であって、前記複数のデータセットから出現順に選択された2以上のデータセットをオブジェクトにまとめて前記外部ストレージに格納する前記格納処理を実行し、
前記外部ストレージに格納された前記オブジェクトのうち2以上の前記オブジェクトを生成順にまとめたオブジェクトグループを単位としてデフラグの実行要否を判定し、
前記オブジェクトグループのうち一のオブジェクトグループのデフラグを実行すると判定すると、前記一のオブジェクトグループに含まれるすべての前記オブジェクトをそれぞれ第1のオブジェクトとして前記外部ストレージから取得し、前記第1のオブジェクトに含まれるデータセットのうち参照数が1以上である有効データセットを、前記有効データセットの生成順と参照数とに基づいて組み合わせて1以上の第2のオブジェクトを生成し直し、前記第2のオブジェクトを前記第1のオブジェクトの代わりに前記外部ストレージに格納する第1のデフラグ処理を実行する、処理部、
を有する情報処理装置。 - 前記第1のデフラグ処理では、前記有効データセットの中から前記生成順が近く、かつ前記参照数が近いと判定されるデータセットを、同一の前記第2のオブジェクトに組み込む、
請求項1記載の情報処理装置。 - 前記第1のデフラグ処理では、組み込まれた前記有効データセットの前記参照数と所定の基準値との比較結果に基づいて、前記第2のオブジェクトのサイズを可変する、
請求項2記載の情報処理装置。 - 前記第1のデフラグ処理では、組み込まれた前記有効データセットの前記参照数が所定の基準値に基づいて小さいと判定される前記第2のオブジェクトのサイズを、組み込まれた前記有効データセットの前記参照数が前記基準値に基づいて大きいと判定される前記第2のオブジェクトのサイズより小さくする、
請求項2記載の情報処理装置。 - 前記処理部は、
前記外部ストレージに格納された前記第2のオブジェクトについてのデフラグの実行要否を、前記第2のオブジェクトごとに個別に判定し、
前記第2のオブジェクトのうち一のオブジェクトのデフラグを実行すると判定すると、前記一のオブジェクトを前記外部ストレージから取得し、前記一のオブジェクトに含まれるデータセットのうち前記参照数が1以上のデータセットだけをまとめて第3のオブジェクトを生成し直し、前記第3のオブジェクトを前記一のオブジェクトの代わりに前記外部ストレージに格納する第2のデフラグ処理を実行する、
請求項1乃至4のいずれか1項に記載の情報処理装置。 - 前記オブジェクトグループを単位とした実行要否の判定では、それぞれの前記オブジェクトグループに含まれるデータセットのうち前記参照数が0のデータセットの数に基づいて実行要否を判定し、
前記処理部は、前記一のオブジェクトグループのデフラグを実行すると判定してから所定時間が経過した後に、前記第1のデフラグ処理の実行を開始する、
請求項1乃至5のいずれか1項に記載の情報処理装置。 - コンピュータに、
書き込みが要求された複数の書き込みデータセットの重複を排除することで得られた複数のデータセットを、外部ストレージに格納する格納処理であって、前記複数のデータセットから出現順に選択された2以上のデータセットをオブジェクトにまとめて前記外部ストレージに格納する前記格納処理を実行し、
前記外部ストレージに格納された前記オブジェクトのうち2以上の前記オブジェクトを生成順にまとめたオブジェクトグループを単位としてデフラグの実行要否を判定し、
前記オブジェクトグループのうち一のオブジェクトグループのデフラグを実行すると判定すると、前記一のオブジェクトグループに含まれるすべての前記オブジェクトをそれぞれ第1のオブジェクトとして前記外部ストレージから取得し、前記第1のオブジェクトに含まれるデータセットのうち参照数が1以上である有効データセットを、前記有効データセットの生成順と参照数とに基づいて組み合わせて1以上の第2のオブジェクトを生成し直し、前記第2のオブジェクトを前記第1のオブジェクトの代わりに前記外部ストレージに格納する第1のデフラグ処理を実行する、
処理を実行させる情報処理プログラム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019201537A JP7323801B2 (ja) | 2019-11-06 | 2019-11-06 | 情報処理装置および情報処理プログラム |
US17/067,816 US11429286B2 (en) | 2019-11-06 | 2020-10-12 | Information processing apparatus and recording medium storing information processing program |
EP20201994.9A EP3819754B1 (en) | 2019-11-06 | 2020-10-15 | Information processing apparatus and recording medium storing information processing program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019201537A JP7323801B2 (ja) | 2019-11-06 | 2019-11-06 | 情報処理装置および情報処理プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021076969A true JP2021076969A (ja) | 2021-05-20 |
JP7323801B2 JP7323801B2 (ja) | 2023-08-09 |
Family
ID=73005289
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019201537A Active JP7323801B2 (ja) | 2019-11-06 | 2019-11-06 | 情報処理装置および情報処理プログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US11429286B2 (ja) |
EP (1) | EP3819754B1 (ja) |
JP (1) | JP7323801B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113625959B (zh) * | 2021-06-30 | 2023-12-29 | 济南浪潮数据技术有限公司 | 一种数据处理方法和装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2011084854A1 (en) * | 2010-01-05 | 2011-07-14 | Symantec Corporation | Systems and methods for removing unreferenced data segments from deduplicated data systems |
WO2018175144A1 (en) * | 2017-03-23 | 2018-09-27 | Netapp, Inc. | Composite aggregate architecture |
JP2018180845A (ja) * | 2017-04-11 | 2018-11-15 | 日本電気株式会社 | 情報処理装置、情報処理方法、及びプログラム |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5221157B2 (ja) * | 2008-02-04 | 2013-06-26 | 株式会社日立製作所 | コンピュータシステム及び物理ディスク回収方法 |
US20110055471A1 (en) * | 2009-08-28 | 2011-03-03 | Jonathan Thatcher | Apparatus, system, and method for improved data deduplication |
US9026503B2 (en) | 2012-02-29 | 2015-05-05 | Netapp, Inc. | Fragmentation control for performing deduplication operations |
US10496626B2 (en) * | 2015-06-11 | 2019-12-03 | EB Storage Systems Ltd. | Deduplication in a highly-distributed shared topology with direct-memory-access capable interconnect |
JP6916442B2 (ja) | 2017-11-21 | 2021-08-11 | 富士通株式会社 | データ処理装置およびデータ処理プログラム |
-
2019
- 2019-11-06 JP JP2019201537A patent/JP7323801B2/ja active Active
-
2020
- 2020-10-12 US US17/067,816 patent/US11429286B2/en active Active
- 2020-10-15 EP EP20201994.9A patent/EP3819754B1/en active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2011084854A1 (en) * | 2010-01-05 | 2011-07-14 | Symantec Corporation | Systems and methods for removing unreferenced data segments from deduplicated data systems |
WO2018175144A1 (en) * | 2017-03-23 | 2018-09-27 | Netapp, Inc. | Composite aggregate architecture |
JP2018180845A (ja) * | 2017-04-11 | 2018-11-15 | 日本電気株式会社 | 情報処理装置、情報処理方法、及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
US11429286B2 (en) | 2022-08-30 |
EP3819754B1 (en) | 2022-11-23 |
JP7323801B2 (ja) | 2023-08-09 |
US20210132824A1 (en) | 2021-05-06 |
EP3819754A1 (en) | 2021-05-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106662981B (zh) | 存储设备、程序和信息处理方法 | |
US10761758B2 (en) | Data aware deduplication object storage (DADOS) | |
US9880746B1 (en) | Method to increase random I/O performance with low memory overheads | |
JP6033241B2 (ja) | データー重複排除のためのバックアップおよび復元方策 | |
JP5445682B2 (ja) | ストレージシステム | |
US11372576B2 (en) | Data processing apparatus, non-transitory computer-readable storage medium, and data processing method | |
US10339017B2 (en) | Methods and systems for using a write cache in a storage system | |
JP6916442B2 (ja) | データ処理装置およびデータ処理プログラム | |
WO2021073635A1 (zh) | 一种数据存储方法及装置 | |
WO2012090549A1 (ja) | 情報管理方法、及び情報提供用計算機 | |
JP2014503886A (ja) | 重複排除ストレージ・システム、その内部の合成バックアップを容易にする方法、及び、プログラム | |
CN103917962A (zh) | 读取存储在存储系统上的文件 | |
US10229127B1 (en) | Method and system for locality based cache flushing for file system namespace in a deduplicating storage system | |
JP6807395B2 (ja) | プロセッサ・グリッド内の分散データ重複排除 | |
CN113535670B (zh) | 一种虚拟化资源镜像存储系统及其实现方法 | |
US20210072899A1 (en) | Information processing apparatus and computer-readable recording medium recording information processing program | |
JP2013222230A (ja) | 情報処理システム | |
WO2024187818A1 (zh) | 一种数据迁移方法、系统、设备及非易失性可读存储介质 | |
Kaczmarczyk et al. | Reducing fragmentation impact with forward knowledge in backup systems with deduplication | |
JP7323801B2 (ja) | 情報処理装置および情報処理プログラム | |
JP2022074654A (ja) | 情報処理装置、情報処理方法および情報処理プログラム | |
JP2023150248A (ja) | ストレージ制御プログラム、ストレージ制御方法およびストレージ制御装置 | |
JP2024001607A (ja) | 情報処理装置および情報処理方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220708 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230614 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230627 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230710 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7323801 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |