JP2012164343A - データの削除を管理するための方法 - Google Patents
データの削除を管理するための方法 Download PDFInfo
- Publication number
- JP2012164343A JP2012164343A JP2012097071A JP2012097071A JP2012164343A JP 2012164343 A JP2012164343 A JP 2012164343A JP 2012097071 A JP2012097071 A JP 2012097071A JP 2012097071 A JP2012097071 A JP 2012097071A JP 2012164343 A JP2012164343 A JP 2012164343A
- Authority
- JP
- Japan
- Prior art keywords
- content
- content unit
- storage system
- reflection
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/13—File access structures, e.g. distributed indices
- G06F16/137—Hash-based
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/16—File or folder operations, e.g. details of user interfaces specifically adapted to file systems
- G06F16/162—Delete operations
Abstract
【課題】記憶システムは、その上に記憶しているデータを削除し、削除を追跡したり、意図せずに削除されたデータを回復する。
【解決手段】コンテンツ単位が削除されると、反映を生成し、記憶システム上に記憶することができる。反映は、削除したコンテンツ単位を識別し、コンテンツ単位のコンテンツの一部、およびコンテンツ単位の削除に関する監査情報のような追加情報を含むことができる。
【選択図】図6
【解決手段】コンテンツ単位が削除されると、反映を生成し、記憶システム上に記憶することができる。反映は、削除したコンテンツ単位を識別し、コンテンツ単位のコンテンツの一部、およびコンテンツ単位の削除に関する監査情報のような追加情報を含むことができる。
【選択図】図6
Description
本発明は、データ記憶装置に関し、特に、記憶システム上に記憶しているデータの削除を管理するための方法および装置に関する。
記憶システムは多くの場合、限られたデータ記憶容量を有する。それ故、記憶システム上に記憶されているデータは、時々、記憶空間を新しいデータのために使用することができるようにするために意図的に削除される。例えば、ユーザがあるデータをもはや必要ないと考えて、まだ使用されるデータを削除した場合には、データが意図せずに削除される場合もある。さらに、記憶システム上のデータは、組織のデータを大々的に破壊しようとしているか、またはデータ内に記録されている不謹慎な活動を隠蔽しようとしている悪意のあるユーザにより不正に削除される場合がある。
従来技術の記憶システムは、その上に記憶しているデータを削除することはできるが、削除を追跡したり、意図せずに削除されたデータを回復する能力が限定されているか、このような能力を全然持たない。それ故、システム・アドミニストレータにとって、いつデータが削除されたのか、何故データが削除されたのか、また誰がデータを削除したのかを知るのが困難な場合もあるし、できない場合もある。
本発明の1つの例示としての実施形態は、記憶システムからあるコンテンツ単位を削除するための方法に関する。この方法は、コンテンツ単位の削除要求を受信するステップと、この要求に応じて、コンテンツ単位を識別する反映(reflection)を生成するステップと、記憶システム上に反映を記憶するステップと、記憶システムからコンテンツ単位を除去するステップと、を含む。他の例示としての実施形態は、コンピュータ・システム上で実行した場合に、上記方法を実行する命令により符号化された少なくとも1つのコンピュータ可読媒体に関する。
もう1つの例示としての実施形態は、コンテンツ単位を記憶する記憶システムに関する。この記憶システムは、入力と、コンテンツ単位の削除要求を受信し、この要求に応じて、コンテンツ単位を識別する反映を生成し、記憶システム上に反映を記憶し、記憶システムからコンテンツ単位を除去する、上記入力に結合している少なくとも1つのコントローラとを備える。
もう1つの例示としての実施形態は、記憶システムで、コンテンツ単位に対するアクセス要求を処理するための方法に関する。この方法は、アクセス要求に応じて、コンテンツ単位に対する反映が記憶システム上に記憶されているかどうかを判定するステップを含む。反映は、コンテンツ単位が記憶システム上に以前に記憶されたが、削除済みであることを示す。もう1つの例示としての実施形態は、コンピュータ・システム上で実行した場合に、上記方法を実行する命令で符号化されている少なくとも1つのコンピュータ可読媒体
に関する。
に関する。
もう1つの例示としての実施形態は、コンテンツ単位に対するアクセス要求を処理するように構成されている記憶システムに関する。記憶システムは、入力と、アクセス要求に応じて、コンテンツ単位に対する反映が記憶システム上に記憶されているかどうかを判定する、上記入力に結合している少なくとも1つのコントローラとを備える。反映は、コンテンツ単位が記憶システム上に以前に記憶されたが、削除済みであることを示す。
もう1つの例示としての実施形態は、複数のコンテンツ単位を記憶している記憶システム上でコンテンツ単位を管理するための方法に関する。この方法は、記憶システム上に新しいコンテンツ単位を記憶するようにとの要求に応じて、記憶システム上に、新しいコンテンツ単位を記憶した時間を識別する情報を記憶するステップと、記憶システムから以前に記憶したコンテンツ単位を削除するようにとの要求に応じて、記憶システム上に、以前に記憶したコンテンツ単位を識別し、記憶システムから、以前に記憶したコンテンツ単位を削除した時間を識別する情報を含む反映を記憶するステップを含む。もう1つの例示としての実施形態は、コンピュータ・システム上で実行した場合に、上記方法を実行する命令で符号化されている少なくとも1つのコンピュータ可読媒体に関する。
もう1つの例示としての実施形態は、複数のコンテンツ単位を記憶するように構成されている記憶システムに関する。この記憶システムは、少なくとも1つの格納装置と、記憶システムの少なくとも1つの格納装置上に新しいコンテンツ単位を記憶するようにとの要求に応じて、記憶システム上に新しいコンテンツ単位を記憶した時間を識別する情報を記憶システム上に記憶し、記憶システムから以前に記憶したコンテンツ単位を削除するようにとの要求に応じて、記憶システムの少なくとも1つの格納装置上に、以前に記憶したコンテンツ単位を識別し、記憶システムから以前に記憶したコンテンツ単位を削除した時間を識別する情報を含む反映を記憶する少なくとも1つのコントローラと、を備える。
もう1つの例示としての実施形態は、コンテンツ単位を記憶している記憶システム上でコンテンツ単位を管理するための方法に関する。この方法は、指定の時間に記憶システム上に記憶したコンテンツ単位を識別するようにとの要求に応じて、記憶システム上に記憶しているコンテンツ単位のうちのどれが、要求を受信した場合に指定の時間に記憶システム上に記憶されたのかを判定するステップと、削除したコンテンツ単位の反映をチェックすることにより、記憶システムから削除されたコンテンツ単位のうちのどれが、指定の時間に記憶システム上に記憶されたのかを判定するステップとを含む。各反映は、少なくとも1つの対応する削除したコンテンツ単位を識別し、少なくとも1つの対応する削除済みコンテンツ単位が記憶システムから削除された時間を識別する情報を含む。もう1つの例示としての実施形態は、コンピュータ・システム上で実行した場合に、上記方法を実行する命令で符号化されている少なくとも1つのコンピュータ可読媒体に関する。
もう1つの例示としての実施形態は、コンテンツ単位を管理するように構成されている記憶システムに関する。この記憶システムは、入力と、指定の時間に記憶システム上に記憶したコンテンツ単位を識別するようにとの要求に応じて、上記要求を受信した場合に、記憶システム上に記憶したコンテンツ単位のうちのどれが指定の時間に記憶システム上に記憶されたのかを判定し、削除したコンテンツ単位の反映をチェックすることにより、記憶システムから削除したコンテンツ単位のうちのどれが、指定の時間に記憶システム上に記憶されたのかを判定する少なくとも1つのコントローラとを備える。各反映は、少なくとも1つの対応する削除したコンテンツ単位を識別し、少なくとも1つの対応する削除したコンテンツ単位が記憶システムから削除された時間を識別する情報を含む。
もう1つの例示としての実施形態は、少なくとも1つの記憶システムから、コンテンツ
を有する第1のコンテンツ単位および第1のコンテンツ単位を保持する期間を指定する第1の保持期間を削除するようにとの、第1の保持期間の期限切れの前に受信した要求に応じて、第1のコンテンツ単位を削除するステップと、第1のコンテンツ単位を置換するための第2のコンテンツ単位を生成するステップであって、第2のコンテンツ単位が、第1のコンテンツ単位のうちの少なくともいくつかのコンテンツを有し、第1の保持期間とは異なる第2の保持期間を有するステップと、第1のコンテンツ単位に対する反映を生成するステップとを含む方法に関する。この場合、反映は、第2のコンテンツ単位を第1のコンテンツ単位の置換物として識別する。もう1つの例示としての実施形態は、コンピュータ・システム上で実行した場合に、上記方法を実行する命令で符号化されている少なくとも1つのコンピュータ可読媒体に関する。
を有する第1のコンテンツ単位および第1のコンテンツ単位を保持する期間を指定する第1の保持期間を削除するようにとの、第1の保持期間の期限切れの前に受信した要求に応じて、第1のコンテンツ単位を削除するステップと、第1のコンテンツ単位を置換するための第2のコンテンツ単位を生成するステップであって、第2のコンテンツ単位が、第1のコンテンツ単位のうちの少なくともいくつかのコンテンツを有し、第1の保持期間とは異なる第2の保持期間を有するステップと、第1のコンテンツ単位に対する反映を生成するステップとを含む方法に関する。この場合、反映は、第2のコンテンツ単位を第1のコンテンツ単位の置換物として識別する。もう1つの例示としての実施形態は、コンピュータ・システム上で実行した場合に、上記方法を実行する命令で符号化されている少なくとも1つのコンピュータ可読媒体に関する。
もう1つの例示としての実施形態は、入力と、少なくとも1つの記憶システムから、コンテンツを有する第1のコンテンツ単位および第1のコンテンツ単位を保持する期間を指定する第1の保持期間を削除するようにとの、第1のコンテンツ単位を削除する第1の保持期間の期限切れの前に上記入力を通して受信した要求に応じて、第1のコンテンツ単位を削除し、第1のコンテンツ単位を削除し、第1のコンテンツ単位を置換するための第2のコンテンツ単位を生成し、上記第2のコンテンツ単位は、第1のコンテンツ単位のうちの少なくともいくつかのコンテンツを含み、第1の保持期間とは異なる第2の保持期間を有し、第1のコンテンツ単位に対する反映を生成する、上記入力と結合している少なくとも1つのコントローラとを備える記憶システムに関する。この場合、反映は、第2のコンテンツ単位を第1のコンテンツ単位の置換物として識別する。
特定のタイプの記憶システムの一例としては、コンテンツ・アドレスにより識別したコンテンツ単位の削除要求を受信し、処理する連想記憶(CAS)システムがある。CASは、コンテンツ単位のコンテンツから得られるアドレスを使用して、記憶システム上に記憶しているコンテンツ単位にアクセスする技術である。一例を挙げて説明すると、コンテンツ単位は、コンテンツ単位に対するコンテンツ・アドレスとして使用することができるハッシュ値を生成するハッシュ関数への入力として提供することができる。コンテンツ・アドレスを生成するのに適しているハッシュ関数の一例としては、メッセージ・ダイジェスト5(MD5)ハッシング・アルゴリズムがある。ホスト・コンピュータがCASシステムにデータ単位を検索するようにとの要求を送信すると、ホストはコンテンツ単位のコンテンツ・アドレス(例えば、ハッシュ値)を提供する。次に、記憶システムは、コンテンツ・アドレスに基づいて、記憶システム内のコンテンツ単位の物理的位置を判定し、この位置からコンテンツ単位を検索し、コンテンツ単位をホスト・コンピュータに返送する
。下記の表1に列挙する特許出願に、例示としてのCASシステムについて詳細に記載されている。これらの特許出願の全文は参照により本明細書に組み込むものとする。
。下記の表1に列挙する特許出願に、例示としてのCASシステムについて詳細に記載されている。これらの特許出願の全文は参照により本明細書に組み込むものとする。
CASシステムは、種々の方法でコンテンツ単位を記憶し、管理することができる。表1の出願に記載されている例示としてのシステムの場合には、コンテンツ単位を、ファイル・システム内にファイルとして記憶することができ、種々のデータベースを、コンテンツ単位を管理し、CASシステム上のコンテンツ単位の記憶位置を追跡するために使用することができる。CASシステムが特定のコンテンツ単位の削除要求を受信すると、CASシステムは、ファイル・システムからそのコンテンツ単位に関連するファイルを除去し、CASシステム・データベース内のコンテンツ単位への参照を削除することができる。それ故、CASシステムがコンテンツ単位の以降の読出し要求を受信した場合には、CASシステムは、(CASシステムがディスク記憶装置を使用している場合には、実際のコンテンツ・データが、例えば、ディスクのような記憶システム上に記憶されていても)コンテンツ単位の位置を発見し、検索することができない。従来のCASシステムは、削除の以降の追跡ができるように、削除を記録しないし、監査コースを生成しない。
さらに、出願人は、コンテンツ単位がCASシステム上でミラーリングされる従来のCASシステムの場合には、削除したコンテンツ単位をCASシステムによりうまく再生できないことを知っている。このような状況は、例えば、CASシステムが分散型記憶システムである場合に発生する場合がある。分散型記憶システムは、それぞれが、(例えば、通信ネットワークにより)相互に結合していて、記憶システム機能を提供するために一緒に動作する、それ自身の処理リソースを含む複数の独立ノードを含む記憶システムである。表1の出願に記載されている例示としてのCASシステムのうちのいくつかの場合には、独立ノードは、アクセス要求を処理するアクセス・ノードおよびデータを記憶する記憶ノードを含むことができる。コンテンツ単位を記憶ノードのうちの1つ上に記憶する場合には、一次記憶ノードが故障した場合、コンテンツ単位のミラーリングしたコピーが存在するように、コンテンツ単位を他の記憶ノードにミラーリングすることができる。しかし、コンテンツ単位を記憶している記憶ノードのうちの1つが(例えば、一時的故障により)オフライン状態になった場合には、CASシステムがコンテンツ単位の削除要求を受信しても、コンテンツ単位を記憶ノードから削除することができない。CASシステムは、複製プロセスを制御し、コンテンツ単位を確実に複製する背景プロセスを有することができる。それ故、記憶ノードが再度オンライン状態になった場合には、コンテンツ単位が確実にミラーリングされるようにするためにチェックを行う背景プロセスは、コンテンツ単位がミラーリングされていないと判定することができ、異なる記憶ノード上でコンテンツ単位のミラー・コピーを生成することができ、CASシステム・データベースにコンテンツ単位に関する情報を再度含めることができる。それ故、CASシステムは、コンテンツ単位に対する削除要求を受信し、処理した場合でも、将来の読出し要求に応じて、コンテンツ単位を返送することができる。
さらに、CASシステムは、遠隔CASシステムにデータを複製するように(すなわち、遠隔CASシステムへコンテンツ単位をミラーリングするように)構成することができる。それ故、ローカルCASシステムが受信したすべての書込要求を(例えば、破局故障(catastrophic failure)の場合に、CASシステムの鏡像が存在するように)遠隔CASシステムに複製することができる。しかし、出願人は、削除要求は複製することができないことを知っている。すなわち、コンテンツ単位に対する削除要求がローカルCASシステムにより処理された場合には、コンテンツ単位は、そのCASシステムから削除されるだけで、遠隔CASシステムにより処理されない。それ故、コンテンツ単位をローカルおよび遠隔CASシステムの両方上に記憶した場合には、コンテンツ単位に対する削除要求により、結果としてコンテンツ単位の1つのコピーだけが削除されることになり、そのため単位の1つまたは複数のコピーが依然として存在する。
さらに、出願人は、いくつかの従来技術のCASシステムは、削除前のコンテンツ単位の複製を保証することができないことを知っている。すなわち、例えば、ユーザは、それに記憶する各コンテンツ単位が遠隔CASシステムにアーカイブされるように、構成されているローカルCASシステムを有することができる。ユーザは、コンテンツ単位がローカルCASシステムから削除された場合に、コンテンツ単位が遠隔CASシステムから削除されないように、そのため、コンテンツ単位がローカルCASシステムにより依然として記憶されていてもいなくても、遠隔CASシステムが、ローカルCASシステムに書き込んだ各コンテンツ単位を記憶するように所望することができる。しかし、複製が非同期的に行われる場合もある。すなわち、ローカルCASシステムに記憶するコンテンツ単位を遠隔CASシステムに直ちに複製することはできない。それ故、コンテンツ単位が遠隔CASシステムに複製される前に、ローカルCASシステムは、コンテンツ単位に対する削除要求を受信し、それを削除することができる。その結果、コンテンツ単位をローカルCASシステムから削除することができるが、そうしたい場合、遠隔CASシステムに決して複製することはできない。
さらに、出願人は、従来技術のCASシステムの場合には、削除により解放される記憶空間の大きさが記録されないことを知っている。それ故、CASシステム上でどれだけの記憶空間を使用することができるのかを判定するのは難しい。例えば、使用することができる記憶容量の大きさは、記憶システムに書き込まれたすべてのコンテンツ単位の全体の量の現行記録を保持し、この数字を使用可能な総容量から差し引くことにより決定することができる。しかし、出願人は、コンテンツ単位を削除した場合、このコンテンツ単位のサイズは、削除により使用できるようになった記憶空間の量を示す使用可能な総容量に加算されないことを知っている。
本発明の種々の実施形態は、従来技術の記憶システムのこれらの制限のうちのいくつかを解決する。しかし、本発明の各実施形態は、必ずしもこれらの制限のすべてを克服するものではないことを理解されたい。実際には、本発明のいくつかの実施形態は、上記従来技術の制限のいくつか、または全部を解決することができるし、あるいは何も解決することができない。
本発明の一実施形態は、削除に関連する記録が存在するように、記憶システム上のコンテンツ単位の削除の追跡に関する。このような記録は、任意の適当な方法で記憶することができる。何故なら、本発明はこの点で制限を受けないからである。一実施形態の場合には、記憶システムがコンテンツ単位の削除要求を受信すると、記憶システムは、コンテンツ単位を置換し、コンテンツ単位の削除を追跡するために使用することができる情報を含むように、本明細書においては反映と呼ぶもう1つのコンテンツ単位を生成することができる。反映は、記憶システム(または他の場所)に記憶することができ、削除要求されたコンテンツ単位を削除することができ、削除のために指定することができ、または除去することができる。
図4は、本発明のいくつかの実施形態を実行することができる記憶システムの一例を示す。図4の場合には、記憶システム401は、プロセッサ405と、記憶システム401がネットワークを通して通信を送受信することができるように、ネットワークに結合することができるネットワーク・インタフェース403と、メモリ409(例えば、ランダム・アクセス・メモリ)、およびコンテンツ単位のようなデータを記憶することができる格納装置407(例えば、ディスク・ドライバ)とを含む。
図4の記憶システムは、本発明の実施形態を実行することができる記憶システムの一例にしか過ぎないこと、および本発明はこの点で制限を受けないことを理解されたい。何故
なら、本発明の実施形態を実行することができる記憶システムは、材料の点で図4の記憶システムと異なっていてもよいからである。例えば、図4の場合には、記憶システム401は、1つの格納装置407および1つのプロセッサ405しか含んでいない。本発明はこの点で制限を受けない。何故なら、本発明が実行される記憶システムは、任意の適当な数の格納装置および/または任意の適当な数のプロセッサを含むことができるからである。さらに、記憶システムは、それぞれが別々の格納装置および処理リソースを含んでいる多数の独立ノードを含む(すでに詳細に説明した)分散型記憶システムであってもよい。
なら、本発明の実施形態を実行することができる記憶システムは、材料の点で図4の記憶システムと異なっていてもよいからである。例えば、図4の場合には、記憶システム401は、1つの格納装置407および1つのプロセッサ405しか含んでいない。本発明はこの点で制限を受けない。何故なら、本発明が実行される記憶システムは、任意の適当な数の格納装置および/または任意の適当な数のプロセッサを含むことができるからである。さらに、記憶システムは、それぞれが別々の格納装置および処理リソースを含んでいる多数の独立ノードを含む(すでに詳細に説明した)分散型記憶システムであってもよい。
図2は、削除要求の処理の一例を示す。図2の場合には、コンピュータ・システム200は、ホスト・コンピュータ201と、コンテンツ単位207を記憶する記憶システム203とを含む。記憶システムは、任意のタイプの記憶システムであってもよい。一実施形態の場合には、記憶システム203は、表1に列挙する出願に記載する任意の形をとるCASシステムであってもよい。しかし、本発明は、この点で制限を受けず、他のタイプの記憶システムと一緒に使用することができる。コンテンツ単位207の削除要求205に応じて、コンテンツ単位207を識別し、コンテンツ単位207およびその削除についての追加情報を含むことができる反映209を(例えば、記憶システム203により)生成することができる。
反映は任意の適当な情報を含むことができる。例えば、反映は、削除するコンテンツ単位のコンテンツの一部(または全部)、削除するコンテンツ単位を識別する情報および/または監査情報を含むことができる。監査情報は、例えば、コンテンツ単位の削除時間、コンテンツ単位の削除要求を生成したユーザまたはアプリケーション・プログラム、コンテンツ単位の削除要求を生成したコンピュータのネットワーク・アドレス、削除するコンテンツ単位の大きさ、および/または任意の他の適当な情報を含むことができる。
一実施形態の場合には、反映は、また、反映が反映であることおよび/または実際のコンテンツ単位でないことを示すフラグを含むことができる。フラグは、任意の適当な方法で反映に含むことができる。何故なら、本発明はこの点で制限を受けないからである。例えば、フラグは、反映のコンテンツの一部であってもよい。反映がファイル・システム内のファイルとして記憶システム上に記憶される本発明の実施形態の場合には、フラグは反映のファイル名の一部であってもよいが、反映を記憶するための実施形態は、この点で制限を受けない。CASシステム上で実施した本発明の実施形態の場合には、反映に少なくとも一部は反映のコンテンツから計算したコンテンツ・アドレスを割り当てることができる。コンテンツ単位が反映であることを示すフラグは、反映のコンテンツ・アドレスの一部を形成することができる。CASシステムは、コンテンツ単位をファイル・システム内のファイルとして記憶することができ、コンテンツ単位のコンテンツ・アドレスを、コンテンツ単位に対するファイルのファイル名(またはファイル名の一部)として使用することができる。この点について、コンテンツ単位が反映であることを示すフラグを、反映のコンテンツ・アドレスおよび反映に対するファイルのファイル名に含めることができる。CASシステム上で使用するための実施形態は、コンテンツ単位および/または反映を記憶するために、ファイル・システムを使用するCASシステム上での使用に限定されないことを理解されたい。実際には、CASシステムは、任意の適当な方法でコンテンツ単位を記憶することができる。何故なら、本発明はこの点で制限を受けないからである。この点において、本発明は、ファイルのファイル名内のコンテンツ単位のコンテンツ・アドレスの設置に制限されない。何故なら、コンテンツ・アドレスを(例えば、データベース表を使用して)任意の適当な方法でコンテンツと関連付けることができるからである。
どのコンテンツ単位に反映内に記憶している情報が属するのかを判定する目的で、また反映内に記憶している情報を発見することができるように、反映は、それが対応するコンテンツ単位を識別することができる。特定のコンテンツ単位の反映は、任意の適当な方法
でコンテンツ単位を識別することができる。例えば、反映のコンテンツは、コンテンツ単位(例えば、ファイル・システムに記憶された場合のコンテンツ単位のファイル名)を識別する情報を含むことができる。CASシステムと一緒に使用するための本発明の実施形態の場合には、コンテンツ単位のコンテンツ・アドレスを反映に含めることができる。例えば、削除したコンテンツ単位のコンテンツ・アドレスを反映のコンテンツに含めることもできるし、または反映のコンテンツ・アドレスに含めることもできる。
でコンテンツ単位を識別することができる。例えば、反映のコンテンツは、コンテンツ単位(例えば、ファイル・システムに記憶された場合のコンテンツ単位のファイル名)を識別する情報を含むことができる。CASシステムと一緒に使用するための本発明の実施形態の場合には、コンテンツ単位のコンテンツ・アドレスを反映に含めることができる。例えば、削除したコンテンツ単位のコンテンツ・アドレスを反映のコンテンツに含めることもできるし、または反映のコンテンツ・アドレスに含めることもできる。
例えば、反映のコンテンツ・アドレスは、少なくとも一部は反映のコンテンツから生成したハッシュ値、および反映が対応するコンテンツ単位のコンテンツ・アドレスを含むことができる。また、反映のコンテンツ・アドレスは、反映が生成された時間(またはおおよその時間)を示すタイムスタンプ、2つのコンテンツ単位が、同じコンテンツ・アドレスを有していないことを保証するコンテンツ・アドレスに含めることができる一意の値である保証済みの一意の識別子(GUID)のような追加情報、および/または任意の他の適当な情報を含むことができる。それ故、例えば、図3に示すように、反映303を、その結果、DEF456のハッシュ値309が得られるハッシュ関数307によりハッシングすることができる。反映は、ABC123のコンテンツ・アドレス305を有するコンテンツ単位301を置換することができる。反映303に対するABC123.DEF456のコンテンツ・アドレス311となるように、コンテンツ・アドレス305をハッシュ値309と結合することができる。上記例のコンテンツ・アドレスは、コンテンツ・アドレスのための適当なフォーマットの一例に過ぎず、本発明はこの点で制限を受けないことを理解されたい。すなわち、上記例の場合には、コンテンツ・アドレスは、2進数のASCII文字表示である。コンテンツ・アドレスはASCII文字により表示する必要はない。何故なら、本発明はこの点で制限を受けないからである。さらに、上記例の場合には、コンテンツ単位に対するコンテンツ・アドレスは、6つの文字を含み、反映に対するコンテンツ・アドレスは12の文字を含む。本発明はこの点で制限を受けない。何故なら、このようなコンテンツ・アドレスは、任意の適当な数の文字(または2進数字)を含むことができるからである。
反映のコンテンツのハッシュが計算され記憶される実施形態の場合には、反映の統合性を後で確認することができる。例えば、反映にアクセスした場合、反映のコンテンツをハッシングし、コンテンツ・アドレスの以前に計算したハッシュ値と比較することができる。2つの値が一致しない場合には、反映のコンテンツは破損しているか、変化している。
すでに説明したように、コンテンツ単位に対する削除要求に応じて、コンテンツ単位を削除することもできるし、削除のために指定することもできるし、異なる位置に移動することもできる。このことは任意の適当な方法で行うことができる。何故なら、本発明はこの点で制限を受けないからである。例えば、コンテンツ単位がファイル・システム内にファイルとして記憶される場合には、コンテンツ単位に対応するファイルをファイル・システムから除去することができる。
すでに説明したように、一実施形態を、表1の出願に記載されている種々のタイプのCASシステムと一緒に使用することができる。これらのCASシステムのうちのいくつかは、ブロブ(blob)と呼ばれる単位でコンテンツを記憶することができる。ブロブは、例えば、患者のX線写真、会社の財務記録、または任意の他のタイプのデータのような2進データであってもよい。各ブロブは、それに関連する少なくとも1つのコンテンツ記述子ファイル(CDF)を有する。ブロブに関連するCDFは、ブロブに対するメタ・データおよびブロブ(例えば、ブロブのコンテンツ・アドレス)への参照を含むことができる。CDFは複数のブロブまたはCDFを参照することができる。そのためCDFは参照したブロブに対する複数の参照およびメタ・データを含む。CASシステムは、ブロブを直接削除することはできない。すなわち、CDFは直接削除することができるが、ブロブ
の削除要求はCASシステムにより拒否される場合がある。ブロブは、ブロブが任意のCDFにより参照されたかどうかを判定するCASシステムの背景ガーベッジ・コレクション・プロセスにより削除することができる。ブロブが任意のCDFから参照されなかった場合には、ガーベッジ・コレクション・プロセスによりブロブを削除することができる。
の削除要求はCASシステムにより拒否される場合がある。ブロブは、ブロブが任意のCDFにより参照されたかどうかを判定するCASシステムの背景ガーベッジ・コレクション・プロセスにより削除することができる。ブロブが任意のCDFから参照されなかった場合には、ガーベッジ・コレクション・プロセスによりブロブを削除することができる。
コンテンツをブロブおよびCDFとして記憶する今説明したタイプのCASシステムと一緒に使用するための一実施形態によれば、削除要求を図1に示すような方法で処理することができる。ステップ101において、CDFの削除要求が、CASシステムにより受信される。処理はステップ103に進み、そこでCASシステムがCDFを置換するために反映を生成する。反映は任意の適当な方法で生成することができる。すでに説明したように、CASシステムは、CASシステム上でコンテンツ単位を管理し、コンテンツ単位の位置を追跡するために使用する1つまたは複数のデータベースを含むことができる。本発明の一実施形態によれば、反映が生成された場合、例えば、以降の読出し要求に応じて反映を発見することができるようにするために、反映を含むようにこれらのデータベースを更新することができる。
次に、処理はステップ105に進み、そこでCASシステムのデータベース内のCDFへの任意の参照を除去することができる。次に、プロセスは、ステップ107に進み、そこでCDFがファイル・システム内の一時ディレクトリ(temporary directory)に移動する。CASシステムのデータベースからCDFへの参照が除去され、CDFがそのファイル・システム位置から移動すると、CDFへの以降のアクセス要求は失敗する。CDFは、ガーベッジ・コレクションのために一時ディレクトリ内に保持することができる。すなわち、CASシステムは、ブロブを参照するCDFの数を示すCASシステム上に記憶している各ブロブに対する参照カウント(reference count)を維持することができる。背景ガーベッジ・コレクション・プロセスは、周期的に一時ディレクトリをチェックし、一時ディレクトリ内で発見したCDFに対応するブロブに対する参照カウントを更新することができる。すなわち、ガーベッジ・コレクション・プロセスは、削除したCDFが位置する一時ディレクトリに行き、CDFが参照するブロブを決定し、これらブロブの参照カウントを低減することができる。次に、ガーベッジ・コレクション・プロセスは、CDFが参照したブロブの参照カウントのうちのどれかがゼロであるかどうかを判定し、その参照カウントがゼロである任意のブロブを削除することができる。一時ディレクトリ内でのCDFに対する処理が終了すると、ガーベッジ・コレクション・プロセスは、ファイル・システムからCDFを除去することができる。
すでに説明したように、一実施形態の場合には、削除要求に応じて、それが常駐する記憶システムからコンテンツ単位を削除することができるが、コンテンツ単位を検索することができる可能性を生かしておくために他の記憶位置に移動させることができる。このことは任意の適当な方法で行うことができる。例えば、他の記憶システム上のコンテンツ単位の位置を示す情報を含むように、反映を生成することができる。一実施形態の場合には、他の記憶システムはテープ記憶システムである。しかし、本発明はこの点で制限を受けないことを理解されたい。何故なら、削除したコンテンツ単位を移動する記憶位置は、例えば、磁気または光ディスク・格納装置を使用する記憶システム上のある位置のような任意の適当な記憶位置であってもよいからである。
すでに説明したように、ローカルCASシステムに書き込まれたコンテンツ単位が、他の遠隔CASシステムに複製されるある従来技術のシステムの場合には、ローカルCASシステムへのコンテンツ単位に対する削除要求は、コンテンツ単位を同様に記憶する遠隔CASシステムに複製することはできない。そのためコンテンツ単位は遠隔CASシステムから削除されない。コンテンツ単位がCASシステム上で削除される場合に、コンテンツ単位を1つまたは複数の遠隔CASシステムに複製するようにCASシステムが構成さ
れている本発明の一実施形態の場合には、コンテンツ単位が以前に複製された任意の遠隔CASシステム上でコンテンツ単位を削除することができる。このことは、任意の適当な方法で行うことができる。例えば、削除したコンテンツ単位の反映を遠隔CASシステムに複製することができる。すなわち、CASシステムがコンテンツ単位に対する削除要求を受信した場合には、CASシステム上でコンテンツ単位を削除し、反映を生成することができる。次に、反映をコンテンツ単位のコピーを記憶する任意の他のCASシステムに複製することができる。他のCASシステムが複製した反映を受信した場合には、他のCASシステムを、任意の適当な技術(例えば、図1のところですでに説明した)によりそれを置換し、それを削除するコンテンツ単位を発見するように構成することができる。
れている本発明の一実施形態の場合には、コンテンツ単位が以前に複製された任意の遠隔CASシステム上でコンテンツ単位を削除することができる。このことは、任意の適当な方法で行うことができる。例えば、削除したコンテンツ単位の反映を遠隔CASシステムに複製することができる。すなわち、CASシステムがコンテンツ単位に対する削除要求を受信した場合には、CASシステム上でコンテンツ単位を削除し、反映を生成することができる。次に、反映をコンテンツ単位のコピーを記憶する任意の他のCASシステムに複製することができる。他のCASシステムが複製した反映を受信した場合には、他のCASシステムを、任意の適当な技術(例えば、図1のところですでに説明した)によりそれを置換し、それを削除するコンテンツ単位を発見するように構成することができる。
ある状況の場合には、ローカルCASシステムから削除したデータを、それを以前に複製した遠隔CASシステム上で削除しないことが望ましい場合があり、そのため遠隔CASシステムは、ローカルCASシステムに対してアーカイブとしての働きをすることができる(例えば、そのためローカルCASシステムから削除したコンテンツ単位を回復することができる)。このような状況の場合には、反映がローカルCASシステムから遠隔CASシステムに複製された場合、遠隔CASシステムは、反映を記憶することができるが、反映に関連するコンテンツ単位を削除することはできない。別の方法としては、このような状況の場合には、反映をローカルCASシステムから遠隔CASシステムに複製することはできない。
すでに説明したように、ローカルCASシステムが、遠隔CASシステムにコンテンツ単位を複製するように構成されている状況の場合には、ローカルCASシステムから削除される前に、ローカルCASシステムに記憶しているコンテンツ単位を確実に遠隔CASシステムに複製することが望ましい場合がある。遠隔地からコンテンツ単位を複製するように構成されているシステムで使用するための本発明の一実施形態の場合には、遠隔CASシステムに複製するまで、コンテンツ単位をローカルCASシステムから削除することはできない。このことは、任意の適当な方法で行うことができる。例えば、コンテンツ単位に対する反映が複製された後でだけコンテンツ単位を削除するようにローカルCASシステムを構成することができる。ローカルCASシステムがコンテンツ単位に対する削除要求を受信した場合、コンテンツ単位に対する反映を生成することができるが、コンテンツ単位の削除を延期することができる。ローカルCASシステム上で実行する複製プロセスは、時間順にコンテンツ単位を複製するように構成することができるので、最初に生成されたコンテンツ単位が最初に複製され、最終的には、コンテンツ単位に対する反映が複製される。コンテンツ単位に対する反映が複製されると、コンテンツ単位をローカルCASシステムから削除することができる。さらに、コンテンツ単位が反映の前に生成されたので、コンテンツ単位はすでに遠隔CASシステムに複製済みである。遠隔システムが反映を受信すると、遠隔システムは、すでに説明したように、コンテンツ単位を削除または維持することができる。
上記例の場合には、CASシステムを、ローカルCASシステムおよび遠隔CASシステムと呼んだ。上記例のローカルおよび遠隔という用語は、要求を受信するCASシステム(すなわち、ローカルCASシステム)と、要求が複製されるCASシステム(すなわち、遠隔CASシステム)とを単に区別するために使用した。すでに使用したように、ローカルおよび遠隔という用語は、CASシステム間の物理的距離を意味するものではない。実際には、ローカルCASシステムおよび遠隔CASシステムは、長い物理的距離を置いて設置することもできるし、複製したコンテンツ単位と一緒に使用するための技術に関連する本発明の態様は、この点に限定されない。何故なら、ローカルCASシステムおよび遠隔CASシステムは、また、同じ室内または同じコンピュータ・キャビネットまたはラック内に位置することができるからである。
コンテンツ単位が記憶システムから削除されると、コンテンツ単位に対する以降の要求は、コンテンツ単位の位置を探さないで、コンテンツ単位に対するアクセス要求は失敗する。アクセス要求は、例えば、読出し要求、存在要求、または削除要求を含むことができる。存在要求は、記憶システム上に特定のコンテンツ単位が存在するかどうか(すなわち、記憶しているかどうか)を判定するようにとの記憶システムへの要求である。例えば、記憶システムは、そのコンテンツ・アドレスによりコンテンツ単位を識別する、以前に削除したコンテンツ単位の読出し要求を受信することができる。記憶システムは、そのコンテンツ・アドレスに基づいてコンテンツ単位の位置を発見しようと試みることができる。記憶システム上でコンテンツ単位の位置を発見するために使用することができる技術のいくつかの例については、表1に列挙した特許出願に記載されている。しかし、本発明はこれらの例のどれにも限定されない。何故なら、記憶システム上でのコンテンツ単位の位置の発見は、任意の適当な方法で行うことができるからである。削除後記憶システムのファイル・システムまたはデータベース内にコンテンツ単位が列挙されている上記例の場合には、コンテンツ単位が記憶システムのファイル・システムまたはデータベース内に列挙されていないので、コンテンツ単位は記憶システムにより発見されない。しかし、削除したコンテンツ単位のコンテンツ・アドレスに基づいて探索する場合、記憶システムは、コンテンツ単位を削除した場合に生成されたコンテンツ単位の反映を発見することができる。このことは任意の適当な方法で行うことができる。例えば、削除したコンテンツ単位の反映が、削除したコンテンツ単位のコンテンツ・アドレスを含んでいる場合には、コンテンツ単位のコンテンツ・アドレスに対する探索により反映の位置が発見される。記憶システムがコンテンツ単位の反映を発見し、コンテンツ単位自身を発見しなかった場合には、記憶システムは、任意の適当な方法でアクセス要求に応答することができる。何故なら、本発明はこの点で制限を受けないからである。例えば、記憶システムは、要求しているエンティティにコンテンツ単位が存在しないことを表示することができる。別の方法としては、記憶システムは、反映が存在することを表示し、および/または反映を返送することができる。
ある状況においては、記憶システムは、コンテンツ単位に対する反映およびコンテンツ単位自身の両方を発見することができる。このことは、例えば、CASシステムが2つの異なる記憶ノード上にコンテンツ単位の2つのコピーを記憶している分散型CASシステム上で実施した本発明の実施形態で行うことができる。例えば、図5に示すように、コンテンツ単位に対する削除要求を受信した場合に、2つの記憶ノードのうちの第1の記憶ノード(すなわち、ノード501)がオフライン状態になっている場合には、コンテンツ単位を第2の記憶ノード(すなわち、ノード503)から削除することができる。しかし、ノード501はオフライン状態になっているので、コンテンツ単位をノード501から削除することはできない。さらに、コンテンツ単位に対する反映505をノード503上で生成することができるが、ノード501上で生成することはできない。ノード501が後でオンライン状態になった場合には、コンテンツ単位への以降のアクセス要求に応じて、記憶システムは、削除要求に応じて生成した反映505およびコンテンツ単位自身(すなわち、コンテンツ単位507)の両方を発見することができる。
アクセス要求に応じてコンテンツ単位に対する反映およびコンテンツ単位の両方を発見した場合には、記憶システムは、任意の適当な方法で応答することができる。例えば、図5に示すように、記憶システムは、最初に記憶システム上にどちらを記憶したのかを判定することができる。反映の前にコンテンツ単位を記憶した場合には、記憶システムは、(例えば、記憶ノードの一時的故障により)行おうとしたコンテンツ単位の削除が失敗したと判定することができ、例えば、コンテンツ単位を削除することができ、またはコンテンツ単位が存在しないかのように処理することができる。コンテンツ単位の前に反映を記憶した場合には、記憶システムは、削除要求を処理した後で記憶システムにコンテンツ単位が書き換えられたと判定することができ、それ故、記憶システム上に存在していなければ
ならないと判定することができる。
ならないと判定することができる。
記憶システムは、2つのコンテンツ単位のうちのどちらを、最初に記憶したのかを任意の適当な方法で判定することができる。何故なら、本発明はこの点で制限を受けないからである。例えば、本発明の一実施形態の場合には、コンテンツ単位のコンテンツ・アドレスは、コンテンツ単位を最初に記憶した時間を示すタイムスタンプを含むことができる。記憶システムは、それぞれをいつ記憶したのかを判定するために、コンテンツ単位(すなわち、元のコンテンツ単位および反映)のタイムスタンプをチェックすることができる。これは、記憶システムが、コンテンツ単位を記憶システムに記憶した時間を判定することができる方法の一例にすぎないこと、および本発明はこの点で制限を受けないことを理解されたい。
一実施形態の場合には、記憶システムは、反映に対する問い合わせ要求を処理することができる。問い合わせ要求は、要求内に指定されている1つまたは複数の基準に適合するコンテンツ単位(および/またはコンテンツ単位自身)に関連する情報(例えば、コンテンツ・アドレス)の返送を求める要求である。例えば、問い合わせは、ある時間内に削除したすべてのコンテンツ単位に関連する情報を要求することができる。これに応じて、記憶システムは、(例えば、反映のコンテンツ・アドレス内のタイムスタンプを使用して)ある時間内に生成したすべての反映を識別することができ、削除したコンテンツ単位(例えば、反映のコンテンツ・アドレスおよび/または反映自身)に関連する情報を返送することができる。
出願人は、記憶システムが長時間稼働した場合には、記憶システムは、記憶システム内の記憶容量を占拠する多数の反映を記憶することができることを知っている。それ故、本発明の一実施形態の場合には、反映自身を削除することができる(すなわち、他の反映と置換しないで削除することができる)。このことは、任意の適当な方法で行うことができる。例えば、記憶システムは、ある期間記憶した後で反映を削除する背景ガーベッジ・コレクション・プロセスを含むことができる。別の方法としては、記憶システムは、(例えば、そのコンテンツ・アドレスにより反映を識別する削除要求を使用して)記憶システムのユーザにより反映を直接削除することができる。
一実施形態の場合には、反映の削除を保持期間を使用することにより管理することができる。表1に列挙した「記憶システムでデータを保持するための方法および装置」(Method And Apparatus For Data Retention In
A Storage System)という名称の出願10/731,790号のところで詳細に説明したように、保持期間は、その間コンテンツ単位を削除することができない期間に関連する期間である。反映を生成した場合には、保持期間を反映と関連付けることができ、記憶システムを保持期間の終了後に、記憶システムが反映を削除するように構成することができる。別の方法としては、反映の削除を助けるために保持クラスを使用することができる。表1に列挙した「記憶システムでデータに対する保持期間を修正するための方法および装置」(Methods And Apparatus For Modifying A Retention Period For Data In A Storage System)という名称の出願10/762,044号のところで詳細に説明したように、保持クラスは、保持クラスに入れられるためにすべてが同じ保持期間を有するコンテンツ単位のグループに適用される。保持クラスは反映に対して生成することができ、それに関連するある保持期間を有することができる。反映が生成された場合、それを保持クラス内に入れることができ、それによりそれを保持期間に割り当てる。その保持期間が期間切れになった場合、記憶システムにより反映を自動的に削除することができる。
A Storage System)という名称の出願10/731,790号のところで詳細に説明したように、保持期間は、その間コンテンツ単位を削除することができない期間に関連する期間である。反映を生成した場合には、保持期間を反映と関連付けることができ、記憶システムを保持期間の終了後に、記憶システムが反映を削除するように構成することができる。別の方法としては、反映の削除を助けるために保持クラスを使用することができる。表1に列挙した「記憶システムでデータに対する保持期間を修正するための方法および装置」(Methods And Apparatus For Modifying A Retention Period For Data In A Storage System)という名称の出願10/762,044号のところで詳細に説明したように、保持クラスは、保持クラスに入れられるためにすべてが同じ保持期間を有するコンテンツ単位のグループに適用される。保持クラスは反映に対して生成することができ、それに関連するある保持期間を有することができる。反映が生成された場合、それを保持クラス内に入れることができ、それによりそれを保持期間に割り当てる。その保持期間が期間切れになった場合、記憶システムにより反映を自動的に削除することができる。
保持期間の使用は、反映の削除を管理することができる1つの方法にしかすぎないこと、および本発明はこの点で制限を受けないことを理解されたい。何故なら、反映の削除は任意の適当な方法で管理することができるからである。さらに、本発明の場合には、反映を削除しなくてもよい。何故なら、反映は、削除されないで、記憶システム上に留まることができるからである。
本発明の一実施形態の場合には、任意の目的のために(例えば、コンテンツ単位を意図せずに削除されたことに気がつき、コンテンツ単位を回復したい場合)コンテンツ単位を復元することができる。このことは、任意の適当な方法で行うことができる。例えば、コンテンツ単位が削除され、コンテンツ単位を置換するために反映が生成された場合には、コンテンツ単位の全コンテンツを反映内に記憶することができる。それ故、削除した後でコンテンツ単位を回復したい場合には、反映からコンテンツを回復することができ、コンテンツ単位を記憶システムに書き換えることができる。コンテンツ単位をブロブおよびCDFとして記憶する本発明のある実施形態の場合には、ブロブおよびCDF両方に対する反映を、これらコンテンツ単位を復元するために使用することができる。何故なら、本発明はこの点で制限を受けないからである。
本発明の一実施形態によれば、任意の所与の時点で、記憶システム上に何を記憶したのかを判定することができる技術を使用する。このことは任意の適当な方法で行うことができる。何故なら、本発明のこの態様は、特定の実施技術に限定されないからである。例えば、特定の時点で記憶システム上にどんなコンテンツ単位を記憶したのかを判定するために、削除した全コンテンツ単位を反映内に記憶することができる上記反映技術と一緒に使用する場合には、記憶システム上に現在記憶している反映を除くすべてのコンテンツ単位のリストを生成することができる。次に、(例えば、すべてのコンテンツ単位のコンテンツ・アドレス内のタイムスタンプをチェックすることにより)特定の時点の後でどのコンテンツ単位を記憶システムに書き込んだのかを判定することができる。これらコンテンツ単位はリストから除去することができる。次に、指定の時間の前に書き込んだどのコンテンツ単位が、指定の時間の後で削除されたのかを判定することができる。このことは、例えば、指定の日付の後のタイムスタンプを含むすべての反映を発見し、これらの各反映により置換されたコンテンツ単位が指定の日付の前に記憶システムに書き込まれたのかどうかを判定することにより行うことができる。削除したコンテンツ単位が記憶システムに書き込まれた時間は、(例えば、その反映のコンテンツ・アドレスをチェックすることにより)任意の適当な方法で判定することができる。反映のコンテンツ・アドレスは、削除したコンテンツ単位のコンテンツ・アドレスを含んでいるので、コンテンツ単位のコンテンツ・アドレスからのタイムスタンプは、反映のコンテンツ・アドレスに含まれる。それ故、削除したコンテンツ単位が記憶システムに書き込まれた時間を、反映のコンテンツ・アドレス内のタイムスタンプをチェックすることにより判定することができる。特定の時点の前に書き込まれ、特定の時点の後で削除されたコンテンツ単位の任意の反映をリストに追加することができる。それ故、リストは、特定の時点に記憶システム上に記憶したすべてのコンテンツ単位を含むことができる。
他の実施形態の場合には、固定コンテンツを変更する(mutable)ことができるようにするために反映を使用することができる。例えば、コンテンツ単位を不定の保持期間で生成することができる。コンテンツ単位の生成の後で、(例えば、3年のように)その保持期間を変更することが望ましい場合もある。しかし、保持期間は、コンテンツ単位自身内に記憶することができ、保持期間を変更すると、コンテンツ単位のコンテンツも変化する場合がある。それ故、コンテンツ単位は、コンテンツ単位内に記憶した保持期間を修正した後で、異なるコンテンツ・アドレスを有することができる。例えば、不定の保持期間を有する元のコンテンツ単位は、XYZABCというコンテンツ・アドレスを有することができる。保持期間を3年に修正した後で、コンテンツ単位はKLMNOPというコ
ンテンツ・アドレスを有することができる。それ故、コンテンツ・アドレスXYZABCに対するアクセス要求を受信した場合には、コンテンツ単位を発見することはできない。何故なら、コンテンツ単位のコンテンツ・アドレスが変化しているからである。
ンテンツ・アドレスを有することができる。それ故、コンテンツ・アドレスXYZABCに対するアクセス要求を受信した場合には、コンテンツ単位を発見することはできない。何故なら、コンテンツ単位のコンテンツ・アドレスが変化しているからである。
本発明の一実施形態の場合には、コンテンツ単位を修正し、その結果、コンテンツ・アドレスが変化した場合には、反映を生成し、修正したコンテンツ単位に対する新しいコンテンツ・アドレスへのポインタとして使用することができる。反映のコンテンツ・アドレスは、任意の形をとることができる。ある例の場合には、反映に対するコンテンツ・アドレスは、反映のハッシュ値と結合しているコンテンツ単位の元のコンテンツ・アドレスであってもよい。それ故、例えば、図6に示すように、不定の保持期間を有するコンテンツ単位601は、XYZABCというコンテンツ・アドレスを有することができる。コンテンツ単位601を削除し、QWERTYのハッシュ値(およびXYZABC.QWERTYのコンテンツ・アドレス)およびコンテンツ単位601と同じコンテンツを有するが、3年の保持期間を有する置換コンテンツ単位605を有する反映603で置換することができる。コンテンツ単位605のコンテンツ・アドレスはKLMNOPであってもよい。反映603のコンテンツは、(例えば、そのコンテンツ内にコンテンツ単位605のコンテンツ・アドレスを含むことにより)コンテンツ単位605へのポインタを含むことができる。それ故、例えば、反映のコンテンツはKLMNOPを含むことができる。コンテンツ・アドレスXYZABCに対する読出し要求を受信した場合には、記憶システムは、反映603を発見することができ、コンテンツ単位に対する新しいコンテンツ・アドレスがKLMNOPであると判定することができる。次に、記憶システムは、アドレスKLMNOPを有するコンテンツ単位を発見し、このコンテンツ単位を要求しているエンティティに返送することができる。
本発明の上記実施形態は、任意の適当なシステム上で実施することができる。適当なシステムの例については、表1(集合的に「CASアプリケーション」と呼ぶ)に列挙する特許出願に記載されている。各特許出願は参照により本明細書に組み込むものとする。本明細書に記載するシステムは、本発明の実施形態を実行することができるシステムの数例に過ぎないことを理解されたい。何故なら、本発明は、CASシステム上の実施態様に限定されず、任意の適当なタイプの記憶システム上で実施することもできるからである。
その内部で、反映を保持期間の修正の際に使用するために生成することができる上記実施形態は、例えば、コンテンツ単位に対する保持期間が期間切れになりかかっている状況において役に立つ場合がある。すなわち、コンテンツ単位に対する保持期間が期間切れになりかかると、コンテンツ単位を削除することができ、コンテンツ単位を発見することができなくなる。しかし、コンテンツ単位に対する保持期間を延長する置換コンテンツ単位を生成することにより、また置換コンテンツ単位をポイントする反映を生成することにより、コンテンツ単位を意図せずに削除(または他の方法で削除)し、永久に喪失する恐れがなくなる。
機能を実行する任意のコンポーネントまたはコンポーネントの集合体を、一般的に上記機能を制御する1つまたは複数のコントローラと見なすことができることを理解されたい。上記機能を実行するためにマイクロコードまたはソフトウェアによりプログラムされる専用ハードウェアまたは汎用ハードウェア(例えば、1つまたは複数のプロセッサ)などと
ともに多くの方法で実施することができる。
この点において、本発明の実施形態の一実施態様は、プロセッサ上で実行した場合、本発明の実施形態の上記機能を実行する、コンピュータ・プログラム(すなわち、複数の命令)で符号化された、少なくとも1つのコンピュータ可読媒体(例えば、コンピュータ・メモリ、フロッピー・ディスク、コンパクト・ディスク、テープ等)を備えることを理解されたい。コンピュータ可読媒体は、その上に記憶しているプログラムを本明細書に記載する本発明の態様を実施するために、任意のコンピュータ環境リソース上にロードすることができるように転送することができる。さらに、実行した場合、上記機能を実行するコンピュータ・プログラムへの参照は、ホスト・コンピュータ上で稼働しているアプリケーション・プログラムに限定されないことを理解されたい。それどころか、コンピュータ・プログラムという用語は、本明細書においては、本発明の上記態様を実施するために、プロセッサをプログラムするために使用することができる、任意のタイプのコンピュータ・コード(例えば、ソフトウェアまたはマイクロコード)を示す一般的な意味で使用している。
プロセスがコンピュータ可読媒体内で実施される本発明のいくつかの実施形態によれば、コンピュータ実施プロセスは、その実行中に(例えば、ユーザから)手動で入力を受信することができる。
上記種々の例の場合、コンテンツ・アドレスは、アルファベット文字「A」〜「Z」を含んでいると説明した。これらのコンテンツ・アドレスは単に例示としてのものであること、コンテンツ・アドレスは、コンテンツ・アドレスは、任意の英数字、一連のビット、または任意の他の適当な文字を含むことができることを理解されたい。何故なら、本発明はこの点で制限を受けないからである。
本明細書で使用する専門語および用語は、説明のためのものであって、本発明を制限するものと見なすべきではない。「含む」、「備える」、「有する」、「包含する」、「関連する」、およびこれらの派生語を使用した場合には、以降に示すアイテムおよび追加アイテムを含むことを意味する。
今まで本発明のいくつかの例を詳細に説明してきたが、当業者であれば種々の修正および改良を容易に思い付くことができるだろう。そのような修正および改良は本発明の精神および範囲内に含まれる。それ故、上記説明は単に例示としてのものであって、本発明を制限するものではない。本発明は、添付の特許請求の範囲およびその等価物が定義するものによってだけ制限される。
Claims (1)
- 記憶システム(401)とホストコンピュータ(201)とを備えるコンピュータシステム(200)において、前記記憶システム(401)が有するプロセッサ(405)が、前記ホストコンピュータ(201)からの前記記憶システム(401)の第1コンテンツ単位(601)を読出す要求である読出し要求を、処理する処理方法であって、
前記第1コンテンツ単位(601)のコンテンツアドレスを、第1コンテンツアドレス(305)とし、
前記第1コンテンツ単位(601)が有するコンテンツを、第1コンテンツとすると、
前記読出し要求は、少なくとも部分的に、前記第1コンテンツに基づき生成された識別子を有し、
前記記憶システム(401)はさらに、前記記憶システム(401)がネットワークを通して通信を送受信することができるように、前記ネットワークに結合することができるネットワークインタフェース(403)と、メモリ(409)と、データを記憶することができる格納装置(407)とを備え、
前記処理方法は、
前記プロセッサ(405)が、前記第1コンテンツ単位(601)を修正することによって、前記第1コンテンツアドレスが変化した場合には、反映コンテンツ単位(603)を、前記格納装置(407)に生成するコンテンツ生成工程と;
前記プロセッサ(405)が、前記コンテンツ生成工程の後に、前記第1コンテンツ単位(601)を、前記記憶システム(401)が備える前記格納装置(407)から削除し、且つ第2コンテンツ単位(605)と前記反映コンテンツ単位(603)とで置換する削除工程であって、前記第2コンテンツ単位(605)は、第2コンテンツアドレス(311)と第2コンテンツとを有し、前記反映コンテンツ単位(603)は、第3コンテンツアドレス(309)と第3コンテンツとを有し、前記第3コンテンツは、前記第2コンテンツアドレス(311)へのポインタを含むことと
を有する、処理方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US11/034,732 US7698516B2 (en) | 2005-01-12 | 2005-01-12 | Methods and apparatus for managing deletion of data |
US11/034,732 | 2005-01-12 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007551371A Division JP5081631B2 (ja) | 2005-01-12 | 2006-01-12 | データの削除を管理するための方法および装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2012164343A true JP2012164343A (ja) | 2012-08-30 |
Family
ID=36084807
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007551370A Withdrawn JP2008527570A (ja) | 2005-01-12 | 2006-01-12 | データの削除を管理するための方法および装置 |
JP2007551371A Active JP5081631B2 (ja) | 2005-01-12 | 2006-01-12 | データの削除を管理するための方法および装置 |
JP2012097071A Pending JP2012164343A (ja) | 2005-01-12 | 2012-04-20 | データの削除を管理するための方法 |
Family Applications Before (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007551370A Withdrawn JP2008527570A (ja) | 2005-01-12 | 2006-01-12 | データの削除を管理するための方法および装置 |
JP2007551371A Active JP5081631B2 (ja) | 2005-01-12 | 2006-01-12 | データの削除を管理するための方法および装置 |
Country Status (5)
Country | Link |
---|---|
US (2) | US7698516B2 (ja) |
EP (2) | EP1836622B1 (ja) |
JP (3) | JP2008527570A (ja) |
CN (2) | CN100583096C (ja) |
WO (2) | WO2006076481A1 (ja) |
Families Citing this family (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007272844A (ja) * | 2006-03-31 | 2007-10-18 | Brother Ind Ltd | 周辺装置およびデータ消去権限管理方法 |
US7921268B2 (en) | 2007-07-12 | 2011-04-05 | Jakob Holger | Method and system for function-specific time-configurable replication of data |
US20090063587A1 (en) * | 2007-07-12 | 2009-03-05 | Jakob Holger | Method and system for function-specific time-configurable replication of data manipulating functions |
US7882159B2 (en) * | 2007-07-25 | 2011-02-01 | Apple Inc. | Associative references in a garbage collected programming environment |
US8504596B2 (en) * | 2007-07-25 | 2013-08-06 | Apple Inc. | Extended garbage collection |
US8005996B2 (en) * | 2008-02-01 | 2011-08-23 | Prostor Systems, Inc. | Digitally shredding on removable disk drives |
US8924362B2 (en) * | 2008-06-30 | 2014-12-30 | Microsoft Corporation | B-file abstraction for efficiently archiving self-expiring data |
JP2010039966A (ja) * | 2008-08-08 | 2010-02-18 | Hitachi Ltd | データ管理方式 |
JP4706758B2 (ja) | 2009-01-21 | 2011-06-22 | ブラザー工業株式会社 | 読取装置及び通信システム |
JP5382227B2 (ja) | 2010-08-31 | 2014-01-08 | 日本電気株式会社 | ストレージシステム |
US20120101731A1 (en) * | 2010-10-21 | 2012-04-26 | Baker Hughes Incorporated | Extending Data Retention of a Data Storage Device Downhole |
US9251257B2 (en) | 2010-10-22 | 2016-02-02 | International Business Machines Corporation | Deleting a file on reading of the file |
CN102158540A (zh) * | 2011-02-18 | 2011-08-17 | 广州从兴电子开发有限公司 | 分布式数据库实现系统及方法 |
CN102625158A (zh) * | 2011-08-10 | 2012-08-01 | 苏州闻道网络科技有限公司 | 视频管理系统 |
WO2013031101A1 (ja) * | 2011-08-26 | 2013-03-07 | パナソニック株式会社 | コンテンツ管理装置及びコンテンツ管理方法 |
US9047300B2 (en) * | 2012-05-24 | 2015-06-02 | Microsoft Technology Licensing, Llc | Techniques to manage universal file descriptor models for content files |
US9552363B2 (en) * | 2013-04-30 | 2017-01-24 | Microsoft Technology Licensing, Llc | File management with placeholders |
US9405767B2 (en) | 2013-05-01 | 2016-08-02 | Microsoft Technology Licensing, Llc | Streaming content and placeholders |
US9442944B2 (en) | 2013-11-12 | 2016-09-13 | Dropbox, Inc. | Content item purging |
US9864791B2 (en) | 2014-12-19 | 2018-01-09 | Microsoft Technology Licensing, Llc | Flow for multi-master replication in distributed storage |
US10021186B2 (en) | 2014-12-19 | 2018-07-10 | Microsoft Technology Licensing, Llc | Guaranteed delivery of replication message |
US11288140B2 (en) * | 2019-08-29 | 2022-03-29 | Microsoft Technology Licensing, Llc | Point in time blob restore |
US20220207386A1 (en) * | 2020-12-28 | 2022-06-30 | EMC IP Holding Company LLC | Best outcome aiops modeling with data confidence fabrics |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0713817A (ja) * | 1993-06-28 | 1995-01-17 | Kyushu Nippon Denki Software Kk | ファイル管理方式 |
WO2004053733A2 (en) * | 2002-12-10 | 2004-06-24 | Caringo, Inc. | Navigation of the content space of a document set |
WO2004074968A2 (en) * | 2003-02-21 | 2004-09-02 | Caringo, Inc. | Additional hash functions in content-based addressing |
Family Cites Families (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05274206A (ja) * | 1992-03-26 | 1993-10-22 | Toppan Printing Co Ltd | データ管理装置 |
JP3388655B2 (ja) * | 1995-07-28 | 2003-03-24 | シャープ株式会社 | データ処理装置 |
JP3044005B2 (ja) | 1997-05-29 | 2000-05-22 | 公一 柴山 | データ格納制御方式 |
US6807632B1 (en) * | 1999-01-21 | 2004-10-19 | Emc Corporation | Content addressable information encapsulation, representation, and transfer |
WO2000004483A2 (en) | 1998-07-15 | 2000-01-27 | Imation Corp. | Hierarchical data storage management |
US6615224B1 (en) * | 1999-02-23 | 2003-09-02 | Lewis B. Davis | High-performance UNIX file undelete |
US7774315B1 (en) * | 1999-03-12 | 2010-08-10 | Eldad Galker | Backup system |
JP3636977B2 (ja) * | 2000-09-11 | 2005-04-06 | ダットジャパン株式会社 | 可変長データベース装置及びアクセス方法 |
US20030167287A1 (en) * | 2001-04-11 | 2003-09-04 | Karl Forster | Information protection system |
JP4261081B2 (ja) * | 2001-04-13 | 2009-04-30 | 富士フイルム株式会社 | 画像ファイリング方法および装置並びにプログラム |
GB2376323B (en) | 2001-06-09 | 2006-03-15 | Hewlett Packard Co | Trusted and verifiable data storage system |
US7562089B2 (en) * | 2002-06-26 | 2009-07-14 | Seagate Technology Llc | Systems and methods for storing information to allow users to manage files |
JP2004086385A (ja) * | 2002-08-23 | 2004-03-18 | Konica Minolta Holdings Inc | データ管理方法、データ管理プログラム及びデータ管理装置 |
US7096342B2 (en) * | 2003-10-28 | 2006-08-22 | International Business Machines Corporation | Flexible LUN/LBA interface for content addressable reference storage |
US7272606B2 (en) * | 2003-11-26 | 2007-09-18 | Veritas Operating Corporation | System and method for detecting and storing file content access information within a file system |
US7249251B2 (en) * | 2004-01-21 | 2007-07-24 | Emc Corporation | Methods and apparatus for secure modification of a retention period for data in a storage system |
US20050204186A1 (en) * | 2004-03-09 | 2005-09-15 | Rothman Michael A. | System and method to implement a rollback mechanism for a data storage unit |
JP4491269B2 (ja) * | 2004-04-22 | 2010-06-30 | 株式会社日立製作所 | ストレージシステム及びファイル管理装置 |
US7246209B2 (en) * | 2004-11-30 | 2007-07-17 | Kabushiki Kaisha Toshiba | System for secure erasing of files |
-
2005
- 2005-01-12 US US11/034,732 patent/US7698516B2/en active Active
-
2006
- 2006-01-12 JP JP2007551370A patent/JP2008527570A/ja not_active Withdrawn
- 2006-01-12 CN CN200680002192A patent/CN100583096C/zh active Active
- 2006-01-12 JP JP2007551371A patent/JP5081631B2/ja active Active
- 2006-01-12 EP EP06718172.7A patent/EP1836622B1/en active Active
- 2006-01-12 EP EP06718171.9A patent/EP1836621B1/en active Active
- 2006-01-12 CN CN2006800021919A patent/CN101103355B/zh active Active
- 2006-01-12 WO PCT/US2006/001064 patent/WO2006076481A1/en active Application Filing
- 2006-01-12 WO PCT/US2006/001065 patent/WO2006076482A1/en active Application Filing
-
2010
- 2010-02-26 US US12/713,553 patent/US8055861B2/en active Active
-
2012
- 2012-04-20 JP JP2012097071A patent/JP2012164343A/ja active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0713817A (ja) * | 1993-06-28 | 1995-01-17 | Kyushu Nippon Denki Software Kk | ファイル管理方式 |
WO2004053733A2 (en) * | 2002-12-10 | 2004-06-24 | Caringo, Inc. | Navigation of the content space of a document set |
WO2004074968A2 (en) * | 2003-02-21 | 2004-09-02 | Caringo, Inc. | Additional hash functions in content-based addressing |
Also Published As
Publication number | Publication date |
---|---|
CN101103355A (zh) | 2008-01-09 |
CN101176093A (zh) | 2008-05-07 |
US7698516B2 (en) | 2010-04-13 |
EP1836621A1 (en) | 2007-09-26 |
US20060155943A1 (en) | 2006-07-13 |
US8055861B2 (en) | 2011-11-08 |
EP1836622A1 (en) | 2007-09-26 |
JP5081631B2 (ja) | 2012-11-28 |
JP2008527570A (ja) | 2008-07-24 |
CN101103355B (zh) | 2010-10-20 |
JP2008527571A (ja) | 2008-07-24 |
WO2006076481A1 (en) | 2006-07-20 |
US20100153665A1 (en) | 2010-06-17 |
EP1836622B1 (en) | 2013-07-03 |
WO2006076482A1 (en) | 2006-07-20 |
EP1836621B1 (en) | 2013-07-03 |
CN100583096C (zh) | 2010-01-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5081631B2 (ja) | データの削除を管理するための方法および装置 | |
US7281084B1 (en) | Method and apparatus for modifying a retention period | |
JP2008527571A5 (ja) | ||
US10956364B2 (en) | Efficient data synchronization for storage containers | |
US7640406B1 (en) | Detecting and managing orphan files between primary and secondary data stores for content addressed storage | |
US7685177B1 (en) | Detecting and managing orphan files between primary and secondary data stores | |
US10936547B2 (en) | Filesystem replication using a minimal filesystem metadata changelog | |
US8843454B2 (en) | Elimination of duplicate objects in storage clusters | |
US8423733B1 (en) | Single-copy implicit sharing among clones | |
JP5007350B2 (ja) | ハードウェアベースのファイルシステムのための装置および方法 | |
US7603397B1 (en) | Detecting and managing missing parents between primary and secondary data stores | |
US8214377B2 (en) | Method, system, and program for managing groups of objects when there are different group types | |
US20190129621A1 (en) | Intelligent snapshot tiering | |
US11093387B1 (en) | Garbage collection based on transmission object models | |
KR20040053142A (ko) | 대형 파일들의 효율적 관리 | |
JP2005018757A (ja) | 超大規模ファイル・システムでのファイル・システム使用のすばやい復元 | |
US10628298B1 (en) | Resumable garbage collection | |
US7599971B1 (en) | Detecting and managing missing parents between primary and secondary data stores for content addressed storage | |
US7428621B1 (en) | Methods and apparatus for storing a reflection on a storage system | |
US11113235B1 (en) | Methods and apparatus for managing objects in a storage environment | |
US9135016B1 (en) | Methods and apparatus for managing replication of objects in a storage environment | |
US11645333B1 (en) | Garbage collection integrated with physical file verification | |
EP3384407A1 (en) | Incremental synchronous hierarchical system restoration | |
JP2008544397A (ja) | ファイルシステム内へのコンテンツの格納を管理する方法および装置 | |
JP2008537233A (ja) | コンテンツの記憶装置を管理する方法および装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20131031 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20140520 |