JP2019021284A - IoT装置がデータセンタでバックアップするための分散型重複データ削除記憶システム及びその分散型重複データ削除を実現する方法 - Google Patents

IoT装置がデータセンタでバックアップするための分散型重複データ削除記憶システム及びその分散型重複データ削除を実現する方法 Download PDF

Info

Publication number
JP2019021284A
JP2019021284A JP2017192587A JP2017192587A JP2019021284A JP 2019021284 A JP2019021284 A JP 2019021284A JP 2017192587 A JP2017192587 A JP 2017192587A JP 2017192587 A JP2017192587 A JP 2017192587A JP 2019021284 A JP2019021284 A JP 2019021284A
Authority
JP
Japan
Prior art keywords
stored
storage
data
control unit
edge component
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2017192587A
Other languages
English (en)
Inventor
陳文賢
Wen Shyen Chen
謝文傑
Wen Chieh Hsieh
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
PROPHETSTOR DATA SERVICES Inc
Original Assignee
PROPHETSTOR DATA SERVICES Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by PROPHETSTOR DATA SERVICES Inc filed Critical PROPHETSTOR DATA SERVICES Inc
Publication of JP2019021284A publication Critical patent/JP2019021284A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/0608Saving storage space on storage systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1448Management of the data involved in backup or backup restore
    • G06F11/1453Management of the data involved in backup or backup restore using de-duplication of the data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0638Organizing or formatting or addressing of data
    • G06F3/064Management of blocks
    • G06F3/0641De-duplication techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/067Distributed or networked storage systems, e.g. storage area networks [SAN], network attached storage [NAS]
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/3084Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction using adaptive string matching, e.g. the Lempel-Ziv method
    • H03M7/3091Data deduplication
    • H03M7/3093Data deduplication using fixed length segments

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Quality & Reliability (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Retry When Errors Occur (AREA)

Abstract

【課題】分散型重複データ削除技術を用いて記憶システムの重複データ削除プログラムを、接続されているエッジコンポーネントにダウンロードするとともに、分散集中型記憶システム中の大きな重複データ削除テーブルデータを、全ての記憶ユニット中にダウンロードするIoT装置がデータセンタでバックアップするための記憶システムを提供する。【解決手段】本発明は、IoT装置がデータセンタでバックアップするための分散型重複データ削除記憶システム及びその分散型重複データ削除を実現する方法を開示する。該システムは複数の記憶ユニットを備えており、各記憶ユニットは、複数の被記憶位置と、記憶ユニットの動作を制御するための制御ユニットと、前記決定的関数を前記制御ユニット及びエッジコンポーネントに提供し、そして制御ユニット及び/又はエッジコンポーネント中にて前記方法の各一ステップを実行するための分散型重複データ削除モジュールと、を備える。【選択図】図2

Description

本発明は、IoT装置がデータセンタでバックアップするための記憶システム及び関連する方法に関し、特に分散型重複データ削除技術を用いて記憶システムの重複データ削除プログラムを、接続されているエッジコンポーネントにダウンロードするとともに、分散集中型記憶システム中の大きな重複データ削除テーブルデータを、全ての記憶ユニット中にダウンロードするIoT装置がデータセンタでバックアップするための記憶システムに関する。
データセンサはアクセスに供する大量のデジタルデータを記憶している。時代の変遷に伴って、同一のデータが異なるフォーマットでパッケージされている、例えば、統計チャートがそれぞれEXCEL(登録商標)ファイル又はWORDファイル内に埋込まれていると、これが同一のデータの記憶空間を占めてしまい、記憶空間の無駄になってしまう。
一方で、単一の出所から入力された連続したデータについては、重複データもまたデータセンサの運用性能を低下させてしまう。これはストリーミング更新監視動画中にて頻繁に現れるものであり、この動画は、そのうちの一つ又は複数のコーナが変わらない複数の連続したフレームが含まれる。これは記憶空間の別の種類の無駄となるばかりか、限りある帯域幅のネットワーク環境中でデータ伝送における障害となっている。
上記問題を解決するために、従来技術では重複データを削除する数多くの方法が提案されている。常用される方法は、データセンサの記憶システムにて重複データ削除テーブルを使用している。
従来の重複データ削除テーブルの運用方法は以下の通りである。ファイルを複数のブロック又はサイズ可変のユニットに切り分ける。各ブロック又はサイズ可変のユニットを、暗号化が安全であるハッシュ署名(hash signature)、例えば、SHA−1として特徴付ける。識別及び重複解消のために、ハッシュ署名と記憶位置とを紐付けるインデックスを付す。重複データ削除テーブルは通常、記憶システムのRAMモジュール中に保存されている。経験則から言えば、Zファイルシステム(Z File System,ZFS)、重複データ削除テーブルのサイズ計算は、1TBデータ毎に約5GBのRAMモジュールの記憶空間を要するものであって、その他ファイルシステムでもほとんど同じである。ZBレベルのデータセンタにとって、重複データ削除テーブルの大きさは5EBにまで拡大してしまい、これは負担できないコストとなってしまう。
上記状況に鑑みると、データセンタ内の重複データ削除テーブルの負担を効果的に軽減する方法が必要となってきている。当該方法を用いたシステムは非常に期待されるものであって、特にIoT装置の需要が増加したとき、当該システムは重複データを削除することで記憶空間を低減し、同時に限りある帯域幅ネットワーク環境中の余分なデータ伝送を最小化することができる。
本部分では、本発明の一部特徴を抽出して編集する。その他特徴は後述の段落中に開示する。その目的は、添付の特許請求の範囲を包括する技術思想及び範囲における各方式の修正及び類似の配列にある。
上記課題を解決するために、本発明では、IoT装置がデータセンタでバックアップするための記憶システムの分散型重複データ削除を実現する方法を提案する。前記方法は、a)各制御ユニットが記憶システム中の記憶ユニットに用いられる複数の制御ユニット及び前記記憶システムに接続されるエッジコンポーネントに、決定的関数を提供するステップと、b) 前記エッジコンポーネントにより、前記エッジコンポーネント中の被バックアップデータ(To−Be−Backup Data)を所定サイズを有する複数の被記憶データチャンク(To−Be−Stored Chunks)に分割するステップと、c)前記エッジコンポーネントにより、決定的関数を用いて、各被記憶データチャンクのためにハッシュ値(hash value)を計算するステップと、d)前記エッジコンポーネントにより、決定的関数を用いて、各被記憶データチャンクのために被記憶位置(To−Be−Stored Destination)を計算するステップと、e)前記決定的関数により選択した記憶ユニット中の制御ユニットが、対応する被記憶位置に被記憶データチャンクがすでに存在するか否をチェックするステップと、f)被記憶データチャンクを、被記憶データチャンクに対応しつつ存在していない被記憶位置に送信し、そして関連するハッシュ値を制御ユニット中に送信するステップと、g)被記憶データチャンクを対応する被記憶位置に記憶し、そしてハッシュ値を前記決定的関数により選択された記憶ユニット中に記憶するステップと、h)前記記憶する被記憶データチャンクと対応するハッシュ値、及び被記憶位置を、前記エッジコンポーネント及び前記記憶ユニット中の制御ユニットに紐付けるインデックスを付すステップと、を含む。
好ましくは、前記決定的関数は、ハッシュ値変数、レジリエンススキーム、記憶ユニットの割当てルール、サービス品質(Quality of Service,QoS)ポリシー又はサービスレベル協定(Service Level Agreement,SLA)ポリシーにより駆動される。前記方法は、ステップhの後、更に、i)対応する記憶ユニット中の制御ユニットにより、全ての記憶する被記憶データチャンクが対応する被記憶位置に保存されているか否かを定期的にチェックするステップと、j)もしステップiの結果がNOであれば、遺失した記憶していた被記憶データチャンクを再度記憶するステップと、を含むことができる。前記方法は、ステップbとステップcとの間に、更に、b1)前記被記憶データチャンクを符号化することで複数の被記憶パリティ群(To−Be−Stored Parity)を生成するステップを含むことをできる。前記方法は、ステップbとステップeとの間に、更に、c1)前記エッジコンポーネントにより、決定的関数を用いて、各被記憶パリティ群のためにハッシュ値を計算するステップと、d1)前記エッジコンポーネントにより、決定的関数を用いて、各被記憶パリティ群のために被記憶位置を計算するステップと、を含むことができる。
本発明はまた、IoT装置がデータセンタでバックアップする記憶システムの分散型重複データ削除を実現するための他の方法を提案する。前記方法は、a)各制御ユニットが記憶システム中の記憶ユニットに用いられる複数の制御ユニット及び前記記憶システムに接続されるエッジコンポーネントに、決定的関数を提供するステップと、b) 前記エッジコンポーネントにより、前記エッジコンポーネント中の被バックアップデータを所定サイズを有する複数の被記憶データチャンクに分割するステップと、c)前記エッジコンポーネントにより、決定的関数を用いて、各被記憶データチャンクのためにハッシュ値を計算するステップと、d)前記エッジコンポーネントにより、決定的関数を用いて、前記被バックアップデータのN個のレプリカの各被記憶データチャンクのために被記憶位置を計算するステップと、e)第1のレプリカの被記憶データチャンクがすでに対応する被記憶位置に存在するか否かを、制御ユニットによりチェックするステップと、f)被記憶データチャンクがその被記憶位置に存在していない被記憶データチャンク及びその他レプリカ中の同一の被記憶データチャンクに関連する被記憶位置を対応する被記憶位置に送信し、そして関連するハッシュ値を制御ユニットに送信するステップと、g)被記憶データチャンクを対応する被記憶位置に記憶し、そしてハッシュ値を前記決定的関数により選択された記憶ユニット中に記憶するステップと、h)送信する被記憶データチャンクを、その他レプリカ中の同一の被記憶データチャンクの被記憶位置に複製するステップと、i)前記記憶する被記憶データチャンクと対応するハッシュ値、及び被記憶位置を、前記エッジコンポーネント及び前記記憶ユニット中の制御ユニットに紐付けるインデックスを付すステップと、を含む。
好ましくは、前記決定的関数は、ハッシュ値変数、レジリエンススキーム、記憶ユニットの割当てルール、サービス品質ポリシー又はサービスレベル協定ポリシーにより駆動される。前記方法は、ステップhの後、更に、j)対応する記憶ユニット中の制御ユニットにより、全ての記憶する被記憶データチャンクが対応する被記憶位置に保存されているか否かを定期的にチェックするステップと、k)もしステップiの結果がNOであれば、遺失した記憶していた被記憶データチャンクのために新たな一つのレプリカを作成するステップと、を含むことができる。前記方法は、ステップbとステップcとの間に、更に、b1)前記被記憶データチャンクを符号化することで複数の被記憶パリティ群を生成するステップを含むことができる。前記方法は、ステップbとステップeとの間に、更に、c1)前記エッジコンポーネントにより、決定的関数を用いて、各被記憶パリティ群のためにハッシュ値を計算するステップと、d1)前記エッジコンポーネントにより、決定的関数を用いて、各被記憶パリティ群のために被記憶位置を計算するステップと、を含むことができる。
本発明は更に、上記方法により実現する、IoT装置がデータセンタでバックアップするための分散型重複データ削除記憶システムを開示する。記憶システムは、各記憶ユニットが複数の被記憶位置を有する複数の記憶ユニットと、記憶ユニットの動作を制御するための制御ユニットと、前記決定的関数を前記制御ユニット及びエッジコンポーネントに提供し、そして制御ユニット及び/又はエッジコンポーネント中にて前記方法の各一ステップを実行するための分散型重複データ削除モジュールと、を備えることができる。好ましくは、前記分散型重複データ削除モジュールが前記制御ユニット中に実装されるハードウェア又はソフトウェアとすることができる。
本発明に係るIoT装置がデータセンタでバックアップするための分散型重複データ削除記憶システムの応用場面、及び該記憶システムの構成を示す。 IoT装置がデータセンタでバックアップするための分散型重複データ削除記憶システムの一つの方法を実現するフローチャートである。 実施例にてフローチャートに用いる全てのデータの表である。 他の実施例にて用いる全てのデータの表である。 IoT装置がデータセンタでバックアップするための分散型重複データ削除記憶システムの他の一つの方法を実現するフローチャートである。 他の実施例にてフローチャートに用いる全てのデータの表である。 更に他の実施例にて用いる全てのデータの表である。
本発明は下記する実施形態によって具体的に説明する。
本発明に係るIoT装置がデータセンタでバックアップするための分散型重複データ削除記憶システム10の応用場面、及び該記憶システム10の構成を示す図1を参照されたい。
記憶システム10は概ね複数の記憶ユニットを備えており、記憶システム10にて出入する全てのデータはホスト装置50を通過する。記憶ユニットは、HDD、SSD、磁気テープ又はRAID(Redundant Array of Independent Disk)とすることができるが、これに限定されない。記憶ユニットの台数は際限のない多数とすることができ、データセンタの必要性に応じて決定する。
本発明が良好に理解されるように、8個の記憶ユニットで説明する(第1の記憶ユニット201、第2の記憶ユニット202、第3の記憶ユニット203、第4の記憶ユニット204、第5の記憶ユニット205、第6の記憶ユニット206、第7の記憶ユニット207及び第8の記憶ユニット208)。各記憶ユニットは、例えばブロック又はボリュームといった複数の被記憶位置を有しているが、これらは下記にて記述する。各記憶ユニットは、記憶ユニットの動作を制御するための制御ユニットも備えている(該第1の記憶ユニット201に用いる第1の制御ユニット101、該第2の記憶ユニット202に用いる第2の制御ユニット102、該第3の記憶ユニット203に用いる第1の制御ユニット103、該第4の記憶ユニット204に用いる第4の制御ユニット104、該第5の記憶ユニット205に用いる第5の制御ユニット105、該第6の記憶ユニット206に用いる第6の制御ユニット106、該第7の記憶ユニット207に用いる第7の制御ユニット107及び該第8の記憶ユニット208に用いる第1の制御ユニット108)。
従来技術との相違点は、本発明における各記憶ユニットは、分散型重複データ削除モジュール110を更に備えるところである。該分散型重複データ削除モジュール110は、決定的関数を記憶システム10に提供するとともに、各記憶ユニット中に組み込まれている。同時に、分散型重複データ削除モジュール110は、記憶システム10(図1中には図示せず)に接続されているエッジコンポーネントにも組み込まれる、又は実装されている。もし該決定的関数がその要素変更により変化すると、該変化は、各記憶ユニットの分散型重複データ削除モジュール110及び全てのエッジコンポーネントの分散型重複データ削除モジュール110中にて更新されるべきである。該決定的関数は更に、下記にて記憶システム10で分散型重複データ削除を実現するための方法で説明する。
記憶システム10は制御ユニット及び/又はエッジコンポーネント側でこれら方法中の各ステップを実行することもできるものであって、これは本発明の鍵となる部分である。実際の運用にて、分散型重複データ削除モジュール110は、記憶システム10を補助的に操作するための図1に示すハードウェアとすることができ、このハードウェアは制御ユニット中のソフトウェアとしてインストールされてもよいが、本発明はこれに限定されない。
エッジコンポーネントはいずれもネットワーク300を通じて記憶システム10に接続されている装置又は機器であり、電子装置、ソフトウェア、センサ、アクチュエータに組み込まれ、ネットワークに接続して、エッジコンポーネントのデータ収集及び交換を起動する。収集したデータは、データセンタ(記憶システム10)にて更に使用又は分析するためにバックアップする必要がある。エッジコンポーネントは、自家製動画をアップロードして他者に配信するためのパーソナルコンピュータ410、記憶システム10を介してソーシャルコミュニケーションアプリをサポートし使用するスマートフォン420、スマート衣服にて体温を持続的に記録するとともにデータを記憶システム10に記憶することで分析する埋込型センサ430、商店入口で人を観察するとともに、監視影像を記憶システム10中にバックアップする監視カメラ440、レンタカー中に取付けられて当該車を追跡するリモート追跡装置450とすることができる。各エッジコンポーネントは本発明における応用場面の一つを表す。
明らかに、どの応用が生じたとしても、記憶システム10が余分なデータで瞬く間に占拠されないようにするために、記憶システム10に送信されたデータに対して重複データ削除は必ず実行しなければならない。本発明では新たな方式、つまり分散型重複データ削除を提供している。これは、重複データ削除は記憶システム10(制御ユニット)のみで実行されることはないことを意味している。反対に、全ての過程は、記憶システム10及びこれに接続されているエッジコンポーネントにより実現される。記憶システム10の負荷はこれによって減少することができる。IoT装置がデータセンタでバックアップするための記憶システムの分散型重複データ削除を実現する方法は、下記にて実施例を合わせて詳細に説明する。
使用者がパーソナルコンピュータ410を用いて他の動画を記憶システム10にアップロードして、記憶システム10中の動画一つを共有する作業負荷は該動画に興味がある人が分担することができると仮定する。該動画はムービークリップに由来するシーンを含み、そして該ムービークリップは記憶システム10の記憶ユニット中ですでにバックアップされている可能性がある。これらシーンに対して重複データ削除を行うとともに記憶空間を節約するために、本発明で提供する方法を応用することができる。
図2及び図3を参照するとともに以下の説明を参照されたい。図2はこの方法のフローチャートであり、図3は実施例にてフローチャートに用いる全てのデータの表である。記憶システム10の構成及び図1におけるエッジコンポーネントによれば、本方法の第1のステップは、各記憶ユニット(201から208)の制御ユニット(101から108)及び記憶システム10に接続されているパーソナルコンピュータ410中に決定的関数を提供する(S01)、というものである。ハッシュ値変数、レジリエンススキーム、記憶ユニットの割当てルール、サービス品質(Quality of Service,QoS)ポリシー又はサービスレベル協定(Service Level Agreement,SLA)ポリシーにより駆動されることで、各被記憶データチャンクのために被記憶位置(下記にて説明する)を決定することができる。つまり、ある「変数」が入力されると、対応する一つの被記憶位置が得られる(算出される)。
例えば、ハッシュ値は一つの被記憶データチャンクに由来し、レジリエンススキームは再記憶時間が200msが超えないように要求し、記憶ユニットの割当てルールは一つのバックアップデータからの全ての被記憶データチャンクが同一の記憶ユニット中にあってはならない(分配する)ことを要求し、そしてQoS及びSLAの両者はいずれも動画ダウンロードの遅延が3秒間以内であることを要求する。よって、被記憶位置が決定され得る。注意すべきは、上記にて言及した変数は単に説明の目的のためであって、唯一の変数として見るべきではなく、一つの被記憶位置に正確に割当てるのに用いられるその他要素もこれを応用できるということである。
決定的関数は分散型重複データ削除モジュール110により提供される。決定的関数は、制御ユニット又はパーソナルコンピュータ410中にインストールされているプログラムとしてのコードなどを付帯する可能性もある。パーソナルコンピュータ410が記憶システム10に接続されると、該プログラムが起動して、決定的関数は分散型重複データ削除に用いることができる。
本方法の第2のステップは、パーソナルコンピュータ41により、パーソナルコンピュータ410中の被バックアップデータを所定サイズを有する複数の被記憶データチャンクに分割する(S02)、というものである。被バックアップデータが本例において意味するものは動画ファイルのことである。該所定サイズが512kbitsであれば、記憶ユニットの一つのブロックのサイズに等しい。該動画ファイルのサイズが4000Kbitsであり、8個の被記憶データチャンクを有すると仮定する(図3における表の1列目に示すC1からC8の通り)。8個目の被記憶データチャンクの有効ビット値は512Kbits未満であるため、最後の96Kbitsは「0」で埋めることができる。ある重複データ削除の作業がエッジコンポーネントに分散された後、これら制御ユニットに決定的関数がインストールされていたとしても、ステップS02が強調したいことはパーソナルコンピュータ410で実行されるということである。
続いて、パーソナルコンピュータ410により、決定的関数を用いて、各被記憶データチャンクのためにハッシュ値を計算する(S03)。再度、パーソナルコンピュータ410が局所的な計算作業を実行する。データチャンクが対応するハッシュ値は図3における表の2列目にh1からh8として示している。数多くの従来の方法、例えばSHA−1は、データ画像用のハッシュ値を取得するのに用いることができるものであるが、本発明はこれに限定しない。一般的には、一つの特定の被記憶データチャンクは一つの特定のハッシュ値に対応する。
続いてのステップは、パーソナルコンピュータ410により、決定的関数を用いて、各被記憶データチャンクのために被記憶位置を計算する(S04)、というものである。
図3を参照されたい。本実施例において、データチャンクで使用する被記憶位置は、記憶ユニット201のブロック200(S1_B200)をC1に用いる、記憶ユニット202のブロック200(S2_B200)をC2に用いる、記憶ユニット203のブロック200(S3_B200)をC3に用いる、記憶ユニット204のブロック200(S4_B200)をC4に用いる、記憶ユニット205のブロック200(S5_B200)をC5に用いる、記憶ユニット206のブロック200(S6_B200)をC6に用いる、記憶ユニット207のブロック200(S7_B200)をC7に用いる、記憶ユニット207のブロック200(S8_B200)をC8に用いる。このとき、該決定的関数により選択した記憶ユニット中の制御ユニットが、対応する被記憶位置に被記憶データチャンクがすでに存在するか否をチェックする(S05)が、この作業は記憶ユニットにおける各制御ユニットにより実行され、該制御ユニットはエッジコンポーネントからの要求を受取る。
図3の表にて、C1、C3、C4、C6及びC8の被記憶位置は記憶システム10中にすでに存在しており、これは記憶システム10に余分な5個のシーンの動画が存在している可能性があることを意味している。C2、C5及びC7の被記憶位置は対応する被記憶データチャンクに用いることができる。チェック結果によって、もし「YES」であれば、対応する被記憶位置中の被記憶データチャンクを維持し(S06)、そして、もし「NO」であれば、被記憶データチャンクを、被記憶データチャンクに対応しつつ存在していない被記憶位置に送信し、関連するハッシュ値を制御ユニット中に送信する(S07)。
制御ユニットは、対応する記憶ユニット中の全ての被記憶データチャンクのハッシュ値を有するはずである。しかしながら、このような状況では、新たな被記憶データチャンク及びそのハッシュ値のみが、記憶システム10の制御ユニットにより保留される必要がある
続いて、被記憶データチャンクを対応する被記憶位置に記憶し、そしてハッシュ値を該決定的関数により選択された記憶ユニット中に記憶する(S08)。ステップS08において、ハッシュ値の位置は、決定的関数に基づく操作により適正な位置を探し出すのであって、如何なる具体的なルールにも割当てられることはない。上記したように、記憶ユニットは複数の被記憶位置を有しており、該被記憶位置は被記憶データチャンクのために保留した最小記憶単位であって、どの被記憶位置がどの作業に割当てられるかにかかわらず、記憶ユニットはハッシュ値の記憶に用いられるのみである。
次のステップは、該記憶する被記憶データチャンクと対応するハッシュ値、及び被記憶位置を、パーソナルコンピュータ410及び記憶ユニット中の制御ユニットに紐付けるインデックスを付す(S09)。本ステップでは、新たな一つの被記憶データチャンクが対応する被記憶位置に記憶されたことから、対応するハッシュ値及び被記憶位置が個々にて承認されるべきであることを意味している。
インデックス値は、制御ユニット又は記憶システム10の記憶ユニットにおけるある被記憶位置、及びパーソナルコンピュータ410のメモリ又は記憶装置中のサンドボックスにより保留することができる。図3から分かるように、C2+h2+S2_B200、C5+h5+S5_B200及びC7+h7+S7_B200はすでにインデックスが付されていることは明らかである。
最終ステップは、対応する記憶ユニット中の制御ユニットにより、全ての記憶する被記憶データチャンクが対応する被記憶位置に保存されているか否かを定期的にチェックする(S10)、というものである。ある種の原因により、例えば記憶していた一つの被記憶位置が不注意で削除されてしまうと、記憶していた被記憶データチャンクは失われてしまう。遺失した被記憶データチャンクは、システムの同期及び一致性を保持するために、リカバリする必要がある。よって、もしいずれかの記憶していた被記憶データチャンクの遺失を発見したのであれば、遺失した記憶していた被記憶データチャンクをリカバリする(S11)。これはインデックスのハッシュ値により可逆的に派生させることができる。
もし記憶していた被記憶データチャンクの遺失を発見しないのであれば、全ての被記憶データチャンクを対応する被記憶位置に維持する(S12)。ステップS10を一回、また一回と実行することで、記憶システム10中にバックアップした記憶している被記憶データチャンクが遺失しないように確保する。
前記した実施例においては、一般的な被バックアップデータに用いる方法を示している。本発明の技術思想によれば、エラーチェック機能を有するパリティビットの一般的な被バックアップデータに用いることができる他の方法が更にある。以下にて、この方法の他の実施例を紹介する。
図2及び図4を参照されたい。図4は他の実施例にて用いるデータの表である。新たな方法と以前の方法とは一部共通するが、二つの点で異なっている。まず、一つのステップ、S02’が、ステップS02とS03との間に存在する。S02’は該被記憶データチャンクを符号化することで複数の被記憶パリティ群を生成する、というものである。被記憶パリティ群のサイズは、被記憶データチャンクのサイズと同サイズであるべきで、0は埋めるのに用いることができる。図4に示すように、3つの被記憶パリティ群P1、P2、P3を有する。
第2の相違点は、二つ以上のステップをステップS02とステップS05との間に挿入するというものである。これらはパーソナルコンピュータ410により、決定的関数を用いて、各被記憶パリティ群のためにハッシュ値を計算し(S03’)、及びパーソナルコンピュータ410により、決定的関数を用いて、各被記憶パリティ群のために被記憶位置を計算する(S04’)、というものである。ステップS03’及びS04’の順序はステップS03及びステップS04の順序に限定されないが、これは該方法では全ての被記憶パリティ群の前に全ての被記憶データチャンクを処理することができるためであり、該方法では全てのハッシュ値を先に処理して、次に全ての被記憶位置を処理してもよい。
被記憶データチャンクと被記憶パリティ群はいずれもステップS02’の後に得られるため、全ての被記憶パリティ群は先に処理して、その後被記憶データチャンクを処理することができる。残りのステップは同一である。
図4にて、P1、P2及びP3に対応するハッシュ値は各々h9、h10及びh11である。P1、P2及びP3に対応する被記憶位置は、記憶ユニット1のブロック210(S1_B210)がP1に対応し、記憶ユニット1のブロック220(S1_B220)がP2に対応し、記憶ユニット1のブロック230(S1_B230)がP3に対応する。
ステップS05の後、全ての三つの被記憶位置が空になる。よって、P1+h9、P2+h10及びP3+h11は制御ユニットにより送信及び記憶される。最後に、P1+h9+S1_B210、P2+h10+S1_B220及びP3+h11+S1_B230はインデックスが付される。ステップS10を繰り返すことで、被記憶データチャンク又は被記憶パリティ群の遺失がないかを監視する。
レプリカが必要ないときには、上記二つの実施例を適用することができる。安全性の考慮によるレプリカは、ある種のデータではレプリカを作成する必要がある。送信データ量及び記憶空間は記憶装置にとってはかなり大きいことから、本発明ではその他方法で処理することを提供している。以下の二つの実施例は関連する方法を紹介するためのものである。
埋込型センサ430が、後続の分析のために、体温及び関連情報を記憶システム10に持続的に送信すると仮定する。健康な体であっては、情報は随時一定に保持されるはずである。よって、一定時間内にて多くのデータは変わらない可能性がある。これは本発明の方法を応用する良い例である。
図5及び図6を参照するとともに以下の説明を参照されたい。図5はこの方法のフローチャートであり、図6は本実施例にて該フローチャートに用いる全てのデータの表である。記憶システム10の構成及び図1におけるエッジコンポーネントによれば、この方法の第1のステップは、決定的関数を制御ユニット及び該記憶システム10に接続されている埋込型センサ430に提供するというものであり、このうち各制御ユニットは記憶システム10中の記憶ユニットに用いられる(S21)。第2のステップは、埋込型センサ430により、埋込型センサ430中の被バックアップデータを所定サイズを有する複数の被記憶データチャンクに分割する(S22)、というものである。第3のステップは、埋込型センサ430により、決定的関数を用いて、各被記憶データチャンクのためにハッシュ値を計算する(S23)、というものである。
ステップS01からS03及びS21からS23までの間には明確な相違点はないが、唯一の差異は被記憶データチャンクのサイズにある。体温及び時間に伴って変化する関連データはデジタル化データであり且つ大きくないため、重複データ削除の効果をより好適にするために、被記憶データチャンクのサイズは16Kbits以下とすることができる。つまりこれは一つのブロックのサイズではなく、しかも複数の被記憶データチャンクを組合わせて一つのブロックに埋込んだものであることを意味している。
続いてのステップは、該埋込型センサ430により、決定的関数を用いて、該被バックアップデータのN個のレプリカの各被記憶データチャンクのために被記憶位置を計算する(S24)、というものである。Nは一つの整数であって、これは該方法はいずれの数量の安全性の考慮によるレプリカに適用することができることを意味している。本実施例において、Nは3である。
図6を参照されたい。三つのレプリカはいずれも、各々がC1、C2及びC3である三つの被記憶データチャンクを有する。全ての被記憶データチャンクのハッシュ値はいずれも同一で、h1、h2及びh3である。しかしながら、レプリカの被記憶データチャンクの対応する被記憶位置は異なる。これは決定的関数の特別な設計であって、同一のデータであっても同一のハッシュ値を有しており、これらは異なる位置に複製される。
本実施例において、第1のレプリカ(R1)のC1は記憶ユニット201のブロック100(S1_B100)に割当てられ、第1のレプリカのC2は記憶ユニット201のブロック110(S1_B110)に割当てられ、第1のレプリカのC3は記憶ユニット201のブロック120(S1_B120)に割当てられ、第2のレプリカ(R2)のC1は記憶ユニット202のブロック100(S2_B100)に割当てられ、第2のレプリカのC2は記憶ユニット202のブロック110(S2_B110)に割当てられ、第2のレプリカのC3は記憶ユニット202のブロック120(S2_B120)に割当てられ、第3のレプリカ(R3)のC1は記憶ユニット203のブロック100(S3_B100)に割当てられ、第3のレプリカのC2は記憶ユニット203のブロック110(S3_B110)に割当てられ、第3のレプリカのC3は記憶ユニット203のブロック120(S3_B120)に割当てられる。
続いてのステップは、第1のレプリカの被記憶データチャンクがすでに対応する被記憶位置に存在するか否かを、制御ユニットによりチェックする(S25)、というものである。もし回答がYESであれば、被記憶データチャンクを対応する被記憶位置に維持する(S26)。もし回答がNOであれば、被記憶データチャンクがその被記憶位置に存在していない被記憶データチャンク及びその他レプリカ中の同一の被記憶データチャンクに関連する被記憶位置を対応する被記憶位置に送信し、そして関連するハッシュ値を制御ユニットに送信する(S27)。
より良好に理解するために、図6に戻られたい。ステップS25の後、S1_B110中にはC2がすでに存在していることを発見した。よって、C2は元の状態を維持する(ステップS26)。R1のC1及びC2は各々S1_B100及びS1_B120に送信される。C1及びh1は共に送信され、C3及びh3は共に送信される。同時に、R2及びR3中のC1及びC3の被記憶位置も制御ユニットに送信される(ステップS27)。続いてのステップは、被記憶データチャンクを対応する被記憶位置に記憶し、そしてハッシュ値を該決定的関数により選択された記憶ユニット中に記憶する(S28)、というものである。この段階にて、第1のレプリカの全ての被記憶データチャンクがすでに対応する被記憶位置にバックアップされているが、残りのレプリカはまだバックアップされていない。一つ前の実施例と同じく、ハッシュ値、h1、h2及びh3は制御ユニットより保存される。
次のステップは、送信する被記憶データチャンクを、その他レプリカ中の同一の被記憶データチャンクの被記憶位置に複製する。直覚的には、このステップは余分な二つのレプリカを作成するように見える。しかしながら、これは通常応用される複製とは異なる。これら位置、つまり被記憶位置は、すでに決定的関数により決定されている。
続いて、該記憶する被記憶データチャンクと対応するハッシュ値、及び被記憶位置を、該エッジコンポーネント及び該記憶ユニット中の制御ユニットに紐付けるインデックスを付す(S30)。ここで強調することは、本実施例にて、インデックスは全ての三つの被記憶データチャンクに用いられるものであって、第1のレプリカのみに用いるものではない。データインデックスは図6中に示されているので、ここでは再度説明しない。
最終ステップは、対応する記憶ユニット中の制御ユニットにより、全ての記憶する被記憶データチャンクが対応する被記憶位置に保存されているか否かを定期的にチェックする(S31)、というものである。ステップS31の目的は前記実施例におけるステップS10の目的と同じである。遺失した被記憶データチャンクはリカバリする必要がある。よって、もしいずれかの記憶していた被記憶データチャンクが遺失したのであれば、遺失した記憶していた被記憶データチャンクのために新たな一つのレプリカを作成する(S32)。もし記憶していた被記憶データチャンクが遺失していないのであれば、全ての被記憶データチャンクを対応する被記憶位置に維持する(S33)。ステップS31を一回、また一回と実行することで、記憶システム10中の三つのレプリカの記憶データチャンクが消失しないように確保する。
類似するように、前記実施例においては、複数のレプリカにおける一般的な被バックアップデータに用いる方法を示している。本発明の技術思想によれば、エラーチェック機能を有するパリティビット及び安全性の考慮によるレプリカの一般的な被バックアップデータに用いることができる他の方法が更にある。以下はこの方法の他の実施例である。
図5及び図7を参照されたい。図7は他の実施例にて用いる全てのデータを表にて列記している。新たな方法と以前の方法とは一部共通するが、二つの点で異なっている。まず、一つのステップ、S22’が、ステップS22とS23との間に存在する。S22’は該被記憶データチャンクを符号化することで複数の被記憶パリティ群を生成する。被記憶パリティ群のサイズは、被記憶データチャンクのサイズと同サイズであるべきで、0は埋めるのに用いることができる。本実施例においては、一つの被記憶パリティ群があるのみである。該被記憶パリティ群、Pは、ハッシュ値h4を有している。
第2の相違点は、ステップS22とステップS25との間に更に二つのステップがあるところである。これらはそれぞれ、埋込型センサ430により、決定的関数を用いて、各被記憶パリティ群のためにハッシュ値を計算し(S23’)、及び埋込型センサ430により、決定的関数を用いて、各被記憶パリティ群のために被記憶位置を計算する(S24’)、というものである。ステップS23’及びS24’の順序はステップS23及びステップS24の順序に限定されないが、これは該方法では全ての被記憶パリティ群と一つのレプリカの前に全ての被記憶データチャンクを処理することができるからである。該方法では全てのハッシュ値を先に処理して、次に全ての被記憶位置及び一つのレプリカを処理してもよい。被記憶データチャンクと被記憶パリティ群はいずれもステップS22’の後に得られるため、全ての被記憶パリティ群及び一つのレプリカは先に処理して、その後全ての被記憶データチャンクを処理することになる。残りのステップは同じである。
本発明はすでに上記のとおり実施形態を開示したが、これは本発明を限定するためのものではなく、当業者であれば、本発明の技術思想及び範囲内で、いくらかの変更及び付加を行うことは可能であるのが当然であるため、本発明の保護範囲は別紙の特許請求の範囲で限定されるものを基準とする。
10 記憶システム
50 ホスト装置
101 第1の制御ユニット
102 第2の制御ユニット
103 第3の制御ユニット
104 第4の制御ユニット
105 第5の制御ユニット
106 第6の制御ユニット
107 第7の制御ユニット
108 第8の制御ユニット
110 分散型重複データ削除モジュール
201 第1の記憶ユニット
202 第2の記憶ユニット
203 第3の記憶ユニット
204 第4の記憶ユニット
205 第5の制御ユニット
206 第6の記憶ユニット
207 第7の記憶ユニット
208 第8の制御ユニット
300 ネットワーク
410 パーソナルコンピュータ
420 スマートフォン
430 埋込型センサ
440 監視カメラ
450 リモート追跡装置

Claims (12)

  1. IoT装置がデータセンタでバックアップする記憶システムの分散型重複データ削除を実現するための方法であって、
    a)各制御ユニットが記憶システム中の記憶ユニットに用いられる複数の制御ユニット及び前記記憶システムに接続されるエッジコンポーネントに、決定的関数を提供するステップと、
    b) 前記エッジコンポーネントにより、前記エッジコンポーネント中の被バックアップデータ(To−Be−Backup Data)を所定サイズを有する複数の被記憶データチャンク(To−Be−Stored Chunks)に分割するステップと、
    c)前記エッジコンポーネントにより、決定的関数を用いて、各被記憶データチャンクのためにハッシュ値を計算するステップと、
    d)前記エッジコンポーネントにより、決定的関数を用いて、各被記憶データチャンクのために被記憶位置(To−Be−Stored Destination)を計算するステップと、
    e)前記決定的関数により選択した記憶ユニット中の制御ユニットが、対応する被記憶位置に被記憶データチャンクがすでに存在するか否をチェックするステップと、
    f)被記憶データチャンクを、被記憶データチャンクに対応しつつ存在していない被記憶位置に送信し、そして関連するハッシュ値を制御ユニット中に送信するステップと、
    g)被記憶データチャンクを対応する被記憶位置に記憶し、そしてハッシュ値を前記決定的関数により選択された記憶ユニット中に記憶するステップと、
    h)前記記憶する被記憶データチャンクと対応するハッシュ値、及び被記憶位置を、前記エッジコンポーネント及び前記記憶ユニット中の制御ユニットに紐付けるインデックスを付すステップと、を含む、
    IoT装置がデータセンタでバックアップする記憶システムの分散型重複データ削除を実現するための方法。
  2. 前記決定的関数は、ハッシュ値変数、レジリエンススキーム、記憶ユニットの割当てルール、サービス品質(Quality of Service,QoS)ポリシー又はサービスレベル協定(Service Level Agreement,SLA)ポリシーにより駆動される、請求項1に記載の方法。
  3. ステップhの後、更に、i)対応する記憶ユニット中の制御ユニットにより、全ての記憶する被記憶データチャンクが対応する被記憶位置に保存されているか否かを定期的にチェックするステップと、j)もしステップiの結果がNOであれば、遺失した記憶していた被記憶データチャンクを再度記憶するステップと、を含む、請求項1に記載の方法。
  4. ステップbとステップcとの間に、更に、b1)前記被記憶データチャンクを符号化することで複数の被記憶パリティ群を生成するステップを、含む、請求項1に記載の方法。
  5. ステップbとステップeとの間に、更に、c1)前記エッジコンポーネントにより、決定的関数を用いて、各被記憶パリティ群のためにハッシュ値を計算するステップと、d1)前記エッジコンポーネントにより、決定的関数を用いて、各被記憶パリティ群のために被記憶位置を計算するステップと、を、含む、請求項4に記載の方法。
  6. IoT装置がデータセンタでバックアップする記憶システムの分散型重複データ削除を実現するための方法であって、
    a)各制御ユニットが記憶システム中の記憶ユニットに用いられる複数の制御ユニット及び前記記憶システムに接続されるエッジコンポーネントに、決定的関数を提供するステップと、
    b) 前記エッジコンポーネントにより、前記エッジコンポーネント中の被バックアップデータを所定サイズを有する複数の被記憶データチャンクに分割するステップと、
    c)前記エッジコンポーネントにより、決定的関数を用いて、各被記憶データチャンクのためにハッシュ値を計算するステップと、
    d)前記エッジコンポーネントにより、決定的関数を用いて、前記被バックアップデータのN個のレプリカの各被記憶データチャンクのために被記憶位置を計算するステップと、
    e)第1のレプリカの被記憶データチャンクがすでに対応する被記憶位置に存在するか否かを、制御ユニットによりチェックするステップと、
    f)被記憶データチャンクがその被記憶位置に存在していない被記憶データチャンク及びその他レプリカ中の同一の被記憶データチャンクに関連する被記憶位置を対応する被記憶位置に送信し、そして関連するハッシュ値を制御ユニットに送信するステップと、
    g)被記憶データチャンクを対応する被記憶位置に記憶し、そしてハッシュ値を前記決定的関数により選択された記憶ユニット中に記憶するステップと、
    h)送信する被記憶データチャンクを、その他レプリカ中の同一の被記憶データチャンクの被記憶位置に複製するステップと、
    i)前記記憶する被記憶データチャンクと対応するハッシュ値、及び被記憶位置を、前記エッジコンポーネント及び前記記憶ユニット中の制御ユニットに紐付けるインデックスを付すステップと、を含む、
    IoT装置がデータセンタでバックアップする記憶システムの分散型重複データ削除を実現するための方法。
  7. 前記決定的関数は、ハッシュ値変数、レジリエンススキーム、記憶ユニットの割当てルール、サービス品質(Quality of Service,QoS)ポリシー又はサービスレベル協定(Service Level Agreement,SLA)ポリシーにより駆動される、請求項6に記載の方法。
  8. ステップhの後、更に、j)対応する記憶ユニット中の制御ユニットにより、全ての記憶する被記憶データチャンクが対応する被記憶位置に保存されているか否かを定期的にチェックするステップと、k)もしステップiの結果がNOであれば、遺失した記憶していた被記憶データチャンクのために新たな一つのレプリカを作成するステップと、を含む、請求項6記載の方法。
  9. ステップbとステップcとの間に、更に、b1)前記被記憶データチャンクを符号化することで複数の被記憶パリティ群を生成するステップを含む、請求項6に記載の方法。
  10. ステップbとステップeとの間に、更に、c1)前記エッジコンポーネントにより、決定的関数を用いて、各被記憶パリティ群のためにハッシュ値を計算するステップと、d1)前記エッジコンポーネントにより、決定的関数を用いて、各被記憶パリティ群のために被記憶位置を計算するステップと、を含む、請求項9に記載の方法。
  11. 請求項1から10のいずれか一項に記載の前記方法により実現する、IoT装置がデータセンタでバックアップするための分散型重複データ削除記憶システムであって、複数の記憶ユニットを備えており、各記憶ユニットが、
    複数の被記憶位置と、
    記憶ユニットの動作を制御するための制御ユニットと、
    前記決定的関数を前記制御ユニット及びエッジコンポーネントに提供し、そして制御ユニット及び/又はエッジコンポーネント中にて前記方法の各一ステップを実行するための分散型重複データ削除モジュールと、を備える、
    IoT装置がデータセンタでバックアップするための分散型重複データ削除記憶システム。
  12. 前記分散型重複データ削除モジュールが前記制御ユニット中に実装されるハードウェア又はソフトウェアである、請求項11に記載の記憶システム。
JP2017192587A 2017-07-18 2017-10-02 IoT装置がデータセンタでバックアップするための分散型重複データ削除記憶システム及びその分散型重複データ削除を実現する方法 Pending JP2019021284A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
TW106123947A TWI663515B (zh) 2017-07-18 2017-07-18 用於物聯網設備於資料中心備份的分散式重複資料刪除儲存系統及其達成分散式重複資料刪除方法
TW106123947 2017-07-18

Publications (1)

Publication Number Publication Date
JP2019021284A true JP2019021284A (ja) 2019-02-07

Family

ID=59914308

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017192587A Pending JP2019021284A (ja) 2017-07-18 2017-10-02 IoT装置がデータセンタでバックアップするための分散型重複データ削除記憶システム及びその分散型重複データ削除を実現する方法

Country Status (3)

Country Link
EP (1) EP3432131A1 (ja)
JP (1) JP2019021284A (ja)
TW (1) TWI663515B (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020162608A1 (ja) 2019-02-08 2020-08-13 日本製鉄株式会社 方向性電磁鋼板、方向性電磁鋼板の絶縁被膜形成方法、及び方向性電磁鋼板の製造方法

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11709609B2 (en) 2020-03-27 2023-07-25 Via Technologies, Inc. Data storage system and global deduplication method thereof
TWI815086B (zh) * 2020-03-27 2023-09-11 威盛電子股份有限公司 資料儲存系統及其全域去重複方法
TWI773343B (zh) * 2021-05-26 2022-08-01 中華電信股份有限公司 分散式物件資料儲存系統、方法及電腦可讀媒介
US20230236764A1 (en) * 2022-01-26 2023-07-27 Pure Storage, Inc. Edge accelerator card

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050120265A1 (en) * 2003-12-02 2005-06-02 Pline Steven L. Data storage system with error correction code and replaceable defective memory
CN102880626B (zh) * 2007-09-05 2016-02-10 伊姆西公司 在虚拟化服务器和虚拟化存储环境中的去重复
US9430156B1 (en) * 2014-06-12 2016-08-30 Emc Corporation Method to increase random I/O performance with low memory overheads
US9690501B1 (en) * 2014-12-02 2017-06-27 EMC IP Holding Company LLC Method and system for determining data profiles using block-based methodology

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020162608A1 (ja) 2019-02-08 2020-08-13 日本製鉄株式会社 方向性電磁鋼板、方向性電磁鋼板の絶縁被膜形成方法、及び方向性電磁鋼板の製造方法

Also Published As

Publication number Publication date
TW201908987A (zh) 2019-03-01
TWI663515B (zh) 2019-06-21
EP3432131A1 (en) 2019-01-23

Similar Documents

Publication Publication Date Title
US10956601B2 (en) Fully managed account level blob data encryption in a distributed storage environment
JP2019021284A (ja) IoT装置がデータセンタでバックアップするための分散型重複データ削除記憶システム及びその分散型重複データ削除を実現する方法
US7958372B1 (en) Method and apparatus to convert a logical unit from a first encryption state to a second encryption state using a journal in a continuous data protection environment
US9208166B2 (en) Seeding replication
US9563517B1 (en) Cloud snapshots
US11354065B2 (en) Cloud edition and retrieve
US20150149819A1 (en) Parity chunk operating method and data server apparatus for supporting the same in distributed raid system
US9031906B2 (en) Method of managing data in asymmetric cluster file system
CN106407040A (zh) 一种远程数据复制方法及系统
US10671487B2 (en) Fast and optimized restore using delta information
US20140317056A1 (en) Method of distributing and storing file-based data
CN104580439B (zh) 一种云存储系统中使数据均匀分布的方法
US10628298B1 (en) Resumable garbage collection
US9824131B2 (en) Regulating a replication operation
US11853581B2 (en) Restoring a storage system using file relocation metadata
CN107957920A (zh) 数据库备份系统
CN104081370A (zh) 访问和复制备份数据对象
US20190026043A1 (en) Storage system of distributed deduplication for internet of things backup in data center and method for achieving the same
WO2024148856A1 (zh) 数据写入方法、系统、存储硬盘、电子设备及存储介质
US20220155962A1 (en) Efficient backup after a restore operation
KR101441059B1 (ko) 분산 파일 시스템에서 효율적인 자료 저장 방법
US9767111B1 (en) Method and apparatus for managing a dynamic journal using the punch command
US10223545B1 (en) System and method for creating security slices with storage system resources and related operations relevant in software defined/as-a-service models, on a purpose built backup appliance (PBBA)/protection storage appliance natively
JP6269120B2 (ja) ストレージシステム
US20180246666A1 (en) Methods for performing data deduplication on data blocks at granularity level and devices thereof