JP6344675B2 - ファイル管理方法、分散記憶システムおよび管理ノード - Google Patents
ファイル管理方法、分散記憶システムおよび管理ノード Download PDFInfo
- Publication number
- JP6344675B2 JP6344675B2 JP2017507763A JP2017507763A JP6344675B2 JP 6344675 B2 JP6344675 B2 JP 6344675B2 JP 2017507763 A JP2017507763 A JP 2017507763A JP 2017507763 A JP2017507763 A JP 2017507763A JP 6344675 B2 JP6344675 B2 JP 6344675B2
- Authority
- JP
- Japan
- Prior art keywords
- space
- file
- virtual address
- address space
- node
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000007726 management method Methods 0.000 title claims description 146
- 238000000034 method Methods 0.000 claims description 49
- 230000004044 response Effects 0.000 claims description 39
- 238000011084 recovery Methods 0.000 claims description 8
- 230000005540 biological transmission Effects 0.000 claims description 3
- 235000019580 granularity Nutrition 0.000 description 52
- 230000015654 memory Effects 0.000 description 23
- 230000008569 process Effects 0.000 description 12
- 238000010586 diagram Methods 0.000 description 10
- 230000006870 function Effects 0.000 description 9
- 238000004891 communication Methods 0.000 description 7
- 230000008859 change Effects 0.000 description 4
- 238000004590 computer program Methods 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000013507 mapping Methods 0.000 description 2
- 238000013500 data storage Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/13—File access structures, e.g. distributed indices
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F12/00—Accessing, addressing or allocating within memory systems or architectures
- G06F12/02—Addressing or allocation; Relocation
- G06F12/08—Addressing or allocation; Relocation in hierarchically structured memory systems, e.g. virtual memory systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0602—Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
- G06F3/0604—Improving or facilitating administration, e.g. storage management
- G06F3/0607—Improving or facilitating administration, e.g. storage management by facilitating the process of upgrading existing storage systems, e.g. for improving compatibility between host and storage device
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0628—Interfaces specially adapted for storage systems making use of a particular technique
- G06F3/0629—Configuration or reconfiguration of storage systems
- G06F3/0631—Configuration or reconfiguration of storage systems by allocating resources to storage systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0628—Interfaces specially adapted for storage systems making use of a particular technique
- G06F3/0638—Organizing or formatting or addressing of data
- G06F3/0643—Management of files
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0628—Interfaces specially adapted for storage systems making use of a particular technique
- G06F3/0646—Horizontal data movement in storage systems, i.e. moving data in between storage devices or systems
- G06F3/0652—Erasing, e.g. deleting, data cleaning, moving of data to a wastebasket
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0668—Interfaces specially adapted for storage systems adopting a particular infrastructure
- G06F3/067—Distributed or networked storage systems, e.g. storage area networks [SAN], network attached storage [NAS]
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
管理ノードによって、ホストによって送信されるファイル作成要求を受信するステップであって、ここで、ファイル作成要求は、分散記憶システム内にファイルを作成するように要求するために使用される、ステップと、
管理ノードによって、ファイル作成要求に従って、分散記憶システムのグローバル仮想アドレス空間から第1の仮想空間をファイルに割り当てるステップであって、ここで、分散記憶システム内の各記憶ノードのローカル仮想アドレス空間は、グローバル仮想アドレス空間の一部に対応している、ステップと、
管理ノードによって、ファイルのメタデータを記録するステップであって、ここで、ファイルのメタデータは、ファイルに割り当てられた第1の仮想空間に関する情報を含み、第1の仮想空間に関する情報は、ファイルを記憶するために使用される記憶ノードのローカル仮想アドレス空間を指し示すために使用される、ステップと、
管理ノードによって、ファイル作成成功応答をホストに送信するステップであって、ここで、ファイル作成成功応答は、第1の仮想空間に関する情報を搬送する、ステップとを含む。
管理ノードによって、ファイル作成要求に従って、分散記憶システムのグローバル仮想アドレス空間から第1の仮想空間をファイルに割り当てるステップは、
管理ノードによって、ファイル作成要求および第1の領域の空間割り当て粒度に従って、分散記憶システムのグローバル仮想アドレス空間内の第1の領域から第1の仮想空間をファイルに割り当てるステップであって、ここで、第1の領域は、その空間割り当て粒度が、現在割り当てられることができる領域における最小のものである領域である、ステップを含む。
管理ノードによって、ホストによって送信されるファイル空間拡張要求を受信するステップであって、ここで、ファイル空間拡張要求は、ファイルの空間を拡張するように要求するために使用される、ステップと、
ファイル空間拡張要求および第2の領域の空間割り当て粒度に従って、グローバル仮想アドレス空間内の第2の領域から第2の仮想空間をファイルに割り当てるステップであって、ここで、第2の領域の空間割り当て粒度は、第1の領域の空間割り当て粒度よりも大きい、ステップと、
ファイルのメタデータを更新するステップであって、ここで、ファイルの更新されたメタデータは、ファイルに割り当てられた第2の仮想空間に関する情報を含む、ステップと、
ファイル空間拡張応答をホストに送信するステップであって、ここで、ファイル空間拡張応答は、第2の仮想空間に関する情報を搬送する、ステップとをさらに含む。
管理ノードによって、ファイルのメタデータを削除して、グローバル仮想アドレス空間からファイルに割り当てられた空間を回収するステップと、
グローバル仮想アドレス空間とローカル仮想アドレス空間との間の事前に設定された対応関係に従って、ファイルを記憶するために使用される記憶ノードを決定するステップと、
ファイルを記憶するために使用される記憶ノードに、空間回収メッセージを送信するステップであって、ここで、空間回収メッセージは、ファイルを記憶するために使用される記憶ノードに、ファイルに対応しているローカル仮想アドレス空間およびローカル物理記憶空間を回収するように命令するために使用される、ステップとをさらに含む。
複数の記憶ノードの各々のローカル仮想アドレス空間は、分散記憶システムのグローバル仮想アドレス空間の一部に対応しており、且つ、
管理ノードは、ホストによって送信されるファイル作成要求を受信し、ファイル作成要求に従って、グローバル仮想アドレス空間から第1の仮想空間をファイルに割り当て、ファイルのメタデータを記録し、ファイル作成成功応答をホストに送信するように構成され、ここで、ファイル作成要求は、分散記憶システム内にファイルを作成するように要求するために使用され、ファイルのメタデータは、ファイルに割り当てられた第1の仮想空間に関する情報を含み、第1の仮想空間に関する情報は、ファイルを記憶するために使用される記憶ノードのローカル仮想アドレス空間を指し示すために使用され、ファイル作成成功応答は、第1の仮想空間に関する情報を搬送する。
管理ノードは、具体的には、ファイル作成要求および第1の領域の空間割り当て粒度に従って、分散記憶システムのグローバル仮想アドレス空間内の第1の領域から第1の仮想空間をファイルに割り当てるように構成され、ここで、第1の領域は、その空間割り当て粒度が、現在割り当てられることができる領域における最小のものである領域である。
ファイルを記憶するために使用される記憶ノードは、空間回収メッセージに従って、ファイルに対応しているローカル仮想アドレス空間およびローカル物理記憶空間を回収するように構成される。
ホストによって送信されるファイル作成要求を受信するように構成される受信ユニットであって、ここで、ファイル作成要求は、分散記憶システム内にファイルを作成するように要求するために使用される、受信ユニットと、
ファイル作成要求に従って、分散記憶システムのグローバル仮想アドレス空間から第1の仮想空間をファイルに割り当て、ファイルのメタデータを記録するように構成される管理ユニットであって、ここで、分散記憶システム内の各記憶ノードのローカル仮想アドレス空間は、グローバル仮想アドレス空間の一部に対応しており、ファイルのメタデータは、ファイルに割り当てられた第1の仮想空間に関する情報を含み、第1の仮想空間に関する情報は、ファイルを記憶するために使用される記憶ノードのローカル仮想アドレス空間を指し示すために使用される、管理ユニットと、
ファイル作成成功応答をホストに送信するように構成される送信ユニットであって、ここで、ファイル作成成功応答は、第1の仮想空間に関する情報を搬送する、送信ユニットとを含む。
管理ユニットは、具体的には、ファイル作成要求および第1の領域の空間割り当て粒度に従って、分散記憶システムのグローバル仮想アドレス空間内の第1の領域から第1の仮想空間をファイルに割り当てるように構成され、ここで、第1の領域は、その空間割り当て粒度が、現在割り当てられることができる領域における最小のものである領域である。
管理ユニットは、ファイル空間拡張要求および第2の領域の空間割り当て粒度に従って、グローバル仮想アドレス空間内の第2の領域から第2の仮想空間をファイルに割り当て、ファイルのメタデータを更新するようにさらに構成され、ここで、第2の領域の空間割り当て粒度は、第1の領域の空間割り当て粒度よりも大きく、ファイルの更新されたメタデータは、ファイルに割り当てられた第2の仮想空間に関する情報を含み、
送信ユニットは、ファイル空間拡張応答をホストに送信するようにさらに構成され、ここで、ファイル空間拡張応答は、第2の仮想空間に関する情報を搬送する。
送信ユニットは、ファイルを記憶するために使用される記憶ノードに、空間回収メッセージを送信するようにさらに構成され、ここで、空間回収メッセージは、ファイルを記憶するために使用される記憶ノードに、ファイルに対応しているローカル仮想アドレス空間およびローカル物理記憶空間を回収するように命令するために使用される。
ホストによって送信されるファイル作成要求を受信するように構成される受信ユニット910であって、ここで、ファイル作成要求は、分散記憶システム内にファイルを作成するように要求するために使用される、受信ユニット910と、
ファイル作成要求に従って、分散記憶システムのグローバル仮想アドレス空間から第1の仮想空間をファイルに割り当て、ファイルのメタデータを記録するように構成される管理ユニット920であって、ここで、分散記憶システム内の各記憶ノードのローカル仮想アドレス空間は、グローバル仮想アドレス空間の一部に対応しており、ファイルのメタデータは、ファイルに割り当てられた第1の仮想空間に関する情報を含み、第1の仮想空間に関する情報は、ファイルを記憶するために使用される記憶ノードのローカル仮想アドレス空間を指し示すために使用される、管理ユニット920と、
ファイル作成成功応答をホストに送信するように構成される送信ユニット930であって、ここで、ファイル作成成功応答は、第1の仮想空間に関する情報を搬送する、送信ユニット930とを含む。
120 記憶ノード
130 ホスト
800 分散記憶システム
810 管理ノード
820 記憶ノード
900 管理ノード
910 受信ユニット
920 管理ユニット
930 送信ユニット
1002 プロセッサ
1005 ネットワークインタフェース
1006 メモリ
10061 プログラム
Claims (21)
- ファイル管理方法であって、前記方法は分散記憶システムに適用され、前記分散記憶システムは管理ノードおよび複数の記憶ノードを含み、前記方法は、
前記管理ノードによって、ホストによって送信されるファイル作成要求を受信するステップであって、前記ファイル作成要求は、前記分散記憶システム内にファイルを作成するように要求するために使用される、ステップと、
前記管理ノードによって、前記ファイル作成要求に従って、前記分散記憶システムのグローバル仮想アドレス空間から第1の仮想空間を前記ファイルに割り当てるステップであって、前記グローバル仮想アドレス空間は各記憶ノードのローカル仮想アドレス空間にマッピングされ、記憶ノードの前記ローカル仮想アドレス空間は前記記憶ノードのローカル物理記憶空間にマッピングされ、前記記憶ノードの前記ローカル仮想アドレス空間はオペレーティングシステムの仮想アドレス空間における使用されていない空間のセグメントである、ステップと、
前記管理ノードによって、前記ファイルのメタデータを記録するステップであって、前記ファイルの前記メタデータは、前記ファイルに割り当てられた前記第1の仮想空間に関する情報を含み、前記第1の仮想空間に関する前記情報は、前記ファイルを記憶するために使用される記憶ノードのローカル仮想アドレス空間を指し示すために使用される、ステップと、
前記管理ノードによって、ファイル作成成功応答を前記ホストに送信するステップであって、前記ファイル作成成功応答は、前記第1の仮想空間に関する前記情報を搬送する、ステップとを含む方法。 - 前記グローバル仮想アドレス空間のアドレスビット量は、前記分散記憶システム内の記憶ノードのローカル仮想アドレス空間のアドレスビット量よりも大きい、請求項1に記載の方法。
- 前記グローバル仮想アドレス空間の前記アドレスビット量は、前記分散記憶システム内の前記記憶ノードの前記ローカル仮想アドレス空間の前記アドレスビット量の2倍であり、前記グローバル仮想アドレス空間のアドレスのN個の最上位ビットは、前記記憶ノードを指し示すために使用され、前記グローバル仮想アドレス空間の前記アドレスのN個の最下位ビットは、前記記憶ノードの前記ローカル仮想アドレス空間を指し示すために使用され、Nは、前記記憶ノードの前記ローカル仮想アドレス空間の前記アドレスビット量である、請求項2に記載の方法。
- 前記第1の仮想空間に関する前記情報は、前記ファイルの、前記グローバル仮想アドレス空間における開始アドレスおよびサイズを含む、請求項1乃至3のいずれか1項に記載の方法。
- 前記グローバル仮想アドレス空間は複数の領域を含み、且つ、前記複数の領域における異なる領域は、異なる空間割り当て粒度を有し、
前記管理ノードによって、前記ファイル作成要求に従って、前記分散記憶システムのグローバル仮想アドレス空間から第1の仮想空間を前記ファイルに割り当てる前記ステップは、
前記管理ノードによって、前記ファイル作成要求および第1の領域の空間割り当て粒度に従って、前記分散記憶システムの前記グローバル仮想アドレス空間内の前記第1の領域から前記第1の仮想空間を前記ファイルに割り当てるステップであって、前記第1の領域は、その空間割り当て粒度が、現在割り当てられることができる領域における最小のものである領域である、ステップを含む、請求項1乃至4のいずれか1項に記載の方法。 - 前記方法は、
前記管理ノードによって、前記ホストによって送信されるファイル空間拡張要求を受信するステップであって、前記ファイル空間拡張要求は、前記ファイルの空間を拡張するように要求するために使用される、ステップと、
前記ファイル空間拡張要求および第2の領域の空間割り当て粒度に従って、前記グローバル仮想アドレス空間内の前記第2の領域から第2の仮想空間を、前記管理ノードによって、且つ、前記ファイルに割り当てるステップであって、前記第2の領域の前記空間割り当て粒度は、前記第1の領域の前記空間割り当て粒度よりも大きい、ステップと、
前記管理ノードによって、前記ファイルの前記メタデータを更新するステップであって、前記ファイルの更新されたメタデータは、前記ファイルに割り当てられた前記第2の仮想空間に関する情報を含む、ステップと、
前記管理ノードによって、ファイル空間拡張応答を前記ホストに送信するステップであって、前記ファイル空間拡張応答は、前記第2の仮想空間に関する前記情報を搬送する、ステップとをさらに含む、請求項5に記載の方法。 - 前記方法は、
前記管理ノードによって、前記ファイルの前記メタデータを削除して、前記グローバル仮想アドレス空間から前記ファイルに割り当てられた前記第1の仮想空間を回収するステップと、
前記管理ノードによって、且つ、前記グローバル仮想アドレス空間と前記ローカル仮想アドレス空間との間の事前に設定された対応関係に従って、前記ファイルを記憶するために使用される前記記憶ノードを決定するステップと、
前記管理ノードによって、前記ファイルを記憶するために使用される前記記憶ノードに、空間回収メッセージを送信するステップであって、前記空間回収メッセージは、前記ファイルを記憶するために使用される前記記憶ノードに、前記ファイルに対応している前記ローカル仮想アドレス空間およびローカル物理記憶空間を回収するように命令するために使用される、ステップとをさらに含む、請求項1乃至6のいずれか1項に記載の方法。 - 管理ノードおよび複数の記憶ノードを含む分散記憶システムであって、
前記管理ノードは、
ホストによって送信されるファイル作成要求を受信し、
前記ファイル作成要求に従って、グローバル仮想アドレス空間から第1の仮想空間を前記ファイルに割り当て、
前記ファイルのメタデータを記録し、
ファイル作成成功応答を前記ホストに送信するように構成され、
前記ファイル作成要求は、前記分散記憶システム内にファイルを作成するように要求するために使用され、
前記グローバル仮想アドレス空間は各記憶ノードのローカル仮想アドレス空間にマッピングされ、記憶ノードの前記ローカル仮想アドレス空間は前記記憶ノードのローカル物理記憶空間にマッピングされ、前記記憶ノードの前記ローカル仮想アドレス空間はオペレーティングシステムの仮想アドレス空間における使用されていない空間のセグメントであり、
前記ファイルの前記メタデータは、前記ファイルに割り当てられた前記第1の仮想空間に関する情報を含み、前記第1の仮想空間に関する前記情報は、前記ファイルを記憶するために使用される記憶ノードのローカル仮想アドレス空間を指し示すために使用され、
前記ファイル作成成功応答は、前記第1の仮想空間に関する前記情報を搬送する、分散記憶システム。 - 前記グローバル仮想アドレス空間のアドレスビット量は、前記分散記憶システム内の記憶ノードのローカル仮想アドレス空間のアドレスビット量よりも大きい、請求項8に記載の分散記憶システム。
- 前記グローバル仮想アドレス空間の前記アドレスビット量は、前記分散記憶システム内の前記記憶ノードの前記ローカル仮想アドレス空間の前記アドレスビット量の2倍であり、前記グローバル仮想アドレス空間のアドレスのN個の最上位ビットは、前記記憶ノードを指し示すために使用され、前記グローバル仮想アドレス空間の前記アドレスのN個の最下位ビットは、前記記憶ノードの前記ローカル仮想アドレス空間を指し示すために使用され、Nは、前記記憶ノードの前記ローカル仮想アドレス空間の前記アドレスビット量である、請求項9に記載の分散記憶システム。
- 前記第1の仮想空間に関する前記情報は、前記ファイルの、前記グローバル仮想アドレス空間における開始アドレスおよびサイズを含む、請求項8乃至10のいずれか1項に記載の分散記憶システム。
- 前記グローバル仮想アドレス空間は複数の領域を含み、且つ、前記複数の領域における異なる領域は、異なる空間割り当て粒度を有し、
前記管理ノードは、具体的には、前記ファイル作成要求および第1の領域の空間割り当て粒度に従って、前記分散記憶システムの前記グローバル仮想アドレス空間内の前記第1の領域から前記第1の仮想空間を前記ファイルに割り当てるように構成され、前記第1の領域は、その空間割り当て粒度が、現在割り当てられることができる領域における最小のものである領域である、請求項8乃至11のいずれか1項に記載の分散記憶システム。 - 前記管理ノードは、
前記ホストによって送信されるファイル空間拡張要求を受信し、
前記ファイル空間拡張要求および第2の領域の空間割り当て粒度に従って、前記グローバル仮想アドレス空間内の前記第2の領域から第2の仮想空間を前記ファイルに割り当て、
前記ファイルの前記メタデータを更新し、
ファイル空間拡張応答を前記ホストに送信するようにさらに構成され、
前記ファイル空間拡張要求は、前記ファイルの空間を拡張するように要求するために使用され、
前記第2の領域の前記空間割り当て粒度は、前記第1の領域の前記空間割り当て粒度よりも大きく、
前記ファイルの更新されたメタデータは、前記ファイルに割り当てられた前記第2の仮想空間に関する情報を含み、
前記ファイル空間拡張応答は、前記第2の仮想空間に関する前記情報を搬送する、請求項12に記載の分散記憶システム。 - 前記管理ノードは、
前記ファイルの前記メタデータを削除して、前記グローバル仮想アドレス空間から前記ファイルに割り当てられた前記第1の仮想空間を回収し、
前記グローバル仮想アドレス空間と前記ローカル仮想アドレス空間との間の事前に設定された対応関係に従って、前記ファイルを記憶するために使用される前記記憶ノードを決定し、
前記ファイルを記憶するために使用される前記記憶ノードに、空間回収メッセージを送信するようにさらに構成され、前記空間回収メッセージは、前記ファイルを記憶するために使用される前記記憶ノードに、前記ファイルに対応している前記ローカル仮想アドレス空間およびローカル物理記憶空間を回収するように命令するために使用され、
前記ファイルを記憶するために使用される前記記憶ノードは、前記空間回収メッセージに従って、前記ファイルに対応している前記ローカル仮想アドレス空間および前記ローカル物理記憶空間を回収するように構成される、請求項8乃至13のいずれか1項に記載の分散記憶システム。 - 管理ノードであって、
ホストによって送信されるファイル作成要求を受信するように構成される受信ユニットであって、前記ファイル作成要求は、分散記憶システム内にファイルを作成するように要求するために使用される、受信ユニットと、
前記ファイル作成要求に従って、前記分散記憶システムのグローバル仮想アドレス空間から第1の仮想空間を前記ファイルに割り当て、前記ファイルのメタデータを記録するように構成される管理ユニットであって、前記グローバル仮想アドレス空間は各記憶ノードのローカル仮想アドレス空間にマッピングされ、記憶ノードの前記ローカル仮想アドレス空間は前記記憶ノードのローカル物理記憶空間にマッピングされ、前記記憶ノードの前記ローカル仮想アドレス空間はオペレーティングシステムの仮想アドレス空間における使用されていない空間のセグメントであり、前記ファイルの前記メタデータは、前記ファイルに割り当てられた前記第1の仮想空間に関する情報を含み、前記第1の仮想空間に関する前記情報は、前記ファイルを記憶するために使用される記憶ノードのローカル仮想アドレス空間を指し示すために使用される、管理ユニットと、
ファイル作成成功応答を前記ホストに送信するように構成される送信ユニットであって、前記ファイル作成成功応答は、前記第1の仮想空間に関する前記情報を搬送する、送信ユニットとを含む管理ノード。 - 前記グローバル仮想アドレス空間のアドレスビット量は、前記分散記憶システム内の記憶ノードのローカル仮想アドレス空間のアドレスビット量よりも大きい、請求項15に記載の管理ノード。
- 前記グローバル仮想アドレス空間の前記アドレスビット量は、前記分散記憶システム内の前記記憶ノードの前記ローカル仮想アドレス空間の前記アドレスビット量の2倍であり、前記グローバル仮想アドレス空間のアドレスのN個の最上位ビットは、前記記憶ノードを指し示すために使用され、前記グローバル仮想アドレス空間の前記アドレスのN個の最下位ビットは、前記記憶ノードの前記ローカル仮想アドレス空間を指し示すために使用され、Nは、前記記憶ノードの前記ローカル仮想アドレス空間の前記アドレスビット量である、請求項16に記載の管理ノード。
- 前記第1の仮想空間に関する前記情報は、前記ファイルの、前記グローバル仮想アドレス空間における開始アドレスおよびサイズを含む、請求項15乃至17のいずれか1項に記載の管理ノード。
- 前記グローバル仮想アドレス空間は複数の領域を含み、且つ、前記複数の領域における異なる領域は、異なる空間割り当て粒度を有し、
前記管理ユニットは、具体的には、前記ファイル作成要求および第1の領域の空間割り当て粒度に従って、前記分散記憶システムの前記グローバル仮想アドレス空間内の前記第1の領域から前記第1の仮想空間を前記ファイルに割り当てるように構成され、前記第1の領域は、その空間割り当て粒度が、現在割り当てられることができる領域における最小のものである領域である、請求項15乃至18のいずれか1項に記載の管理ノード。 - 前記受信ユニットは、前記ホストによって送信されるファイル空間拡張要求を受信するようにさらに構成され、前記ファイル空間拡張要求は、前記ファイルの空間を拡張するように要求するために使用され、
前記管理ユニットは、前記ファイル空間拡張要求および第2の領域の空間割り当て粒度に従って、前記グローバル仮想アドレス空間内の前記第2の領域から第2の仮想空間を前記ファイルに割り当て、前記ファイルの前記メタデータを更新するようにさらに構成され、前記第2の領域の前記空間割り当て粒度は、前記第1の領域の前記空間割り当て粒度よりも大きく、前記ファイルの更新されたメタデータは、前記ファイルに割り当てられた前記第2の仮想空間に関する情報を含み、
前記送信ユニットは、ファイル空間拡張応答を前記ホストに送信するようにさらに構成され、前記ファイル空間拡張応答は、前記第2の仮想空間に関する前記情報を搬送する、請求項19に記載の管理ノード。 - 前記管理ユニットは、前記ファイルの前記メタデータを削除するとともに、前記グローバル仮想アドレス空間から前記ファイルに割り当てられた前記第1の仮想空間を回収して、前記グローバル仮想アドレス空間と前記ローカル仮想アドレス空間との間の事前に設定された対応関係に従って、前記ファイルを記憶するために使用される前記記憶ノードを決定するようにさらに構成され、
前記送信ユニットは、前記ファイルを記憶するために使用される前記記憶ノードに、空間回収メッセージを送信するようにさらに構成され、前記空間回収メッセージは、前記ファイルを記憶するために使用される前記記憶ノードに、前記ファイルに対応している前記ローカル仮想アドレス空間およびローカル物理記憶空間を回収するように命令するために使用される、請求項15乃至20のいずれか1項に記載の管理ノード。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/CN2014/084196 WO2016023166A1 (zh) | 2014-08-12 | 2014-08-12 | 管理文件的方法、分布式存储系统和管理节点 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017525054A JP2017525054A (ja) | 2017-08-31 |
JP6344675B2 true JP6344675B2 (ja) | 2018-06-20 |
Family
ID=55303771
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017507763A Active JP6344675B2 (ja) | 2014-08-12 | 2014-08-12 | ファイル管理方法、分散記憶システムおよび管理ノード |
Country Status (7)
Country | Link |
---|---|
US (3) | US10152233B2 (ja) |
EP (2) | EP3905054B1 (ja) |
JP (1) | JP6344675B2 (ja) |
CN (2) | CN109376123B (ja) |
RU (1) | RU2658886C1 (ja) |
SG (1) | SG11201700413RA (ja) |
WO (1) | WO2016023166A1 (ja) |
Families Citing this family (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9442944B2 (en) * | 2013-11-12 | 2016-09-13 | Dropbox, Inc. | Content item purging |
US10542049B2 (en) | 2014-05-09 | 2020-01-21 | Nutanix, Inc. | Mechanism for providing external access to a secured networked virtualization environment |
US8868825B1 (en) * | 2014-07-02 | 2014-10-21 | Pure Storage, Inc. | Nonrepeating identifiers in an address space of a non-volatile solid-state storage |
JP6460497B2 (ja) * | 2014-11-28 | 2019-01-30 | 華為技術有限公司Huawei Technologies Co.,Ltd. | ファイルアクセス方法およびファイルアクセス装置、ならびに記憶装置 |
US10809998B2 (en) | 2016-02-12 | 2020-10-20 | Nutanix, Inc. | Virtualized file server splitting and merging |
US11218418B2 (en) | 2016-05-20 | 2022-01-04 | Nutanix, Inc. | Scalable leadership election in a multi-processing computing environment |
US11562034B2 (en) | 2016-12-02 | 2023-01-24 | Nutanix, Inc. | Transparent referrals for distributed file servers |
US10728090B2 (en) | 2016-12-02 | 2020-07-28 | Nutanix, Inc. | Configuring network segmentation for a virtualization environment |
US10824455B2 (en) | 2016-12-02 | 2020-11-03 | Nutanix, Inc. | Virtualized server systems and methods including load balancing for virtualized file servers |
US11568073B2 (en) | 2016-12-02 | 2023-01-31 | Nutanix, Inc. | Handling permissions for virtualized file servers |
US11294777B2 (en) | 2016-12-05 | 2022-04-05 | Nutanix, Inc. | Disaster recovery for distributed file servers, including metadata fixers |
US11288239B2 (en) | 2016-12-06 | 2022-03-29 | Nutanix, Inc. | Cloning virtualized file servers |
US11281484B2 (en) | 2016-12-06 | 2022-03-22 | Nutanix, Inc. | Virtualized server systems and methods including scaling of file system virtual machines |
US11086826B2 (en) | 2018-04-30 | 2021-08-10 | Nutanix, Inc. | Virtualized server systems and methods including domain joining techniques |
US11194680B2 (en) | 2018-07-20 | 2021-12-07 | Nutanix, Inc. | Two node clusters recovery on a failure |
US11023333B2 (en) * | 2018-10-30 | 2021-06-01 | EMC IP Holding Company LLC | Online recovery approach to space accounting |
US11770447B2 (en) | 2018-10-31 | 2023-09-26 | Nutanix, Inc. | Managing high-availability file servers |
US10769076B2 (en) * | 2018-11-21 | 2020-09-08 | Nvidia Corporation | Distributed address translation in a multi-node interconnect fabric |
US11768809B2 (en) | 2020-05-08 | 2023-09-26 | Nutanix, Inc. | Managing incremental snapshots for fast leader node bring-up |
CN111638995B (zh) * | 2020-05-08 | 2024-09-20 | 杭州海康威视系统技术有限公司 | 元数据备份方法、装置及设备、存储介质 |
CN112558870B (zh) * | 2020-12-08 | 2023-08-01 | 机械工业仪器仪表综合技术经济研究所 | 一种针对地址空间的数据处理方法及装置 |
US12072770B2 (en) | 2021-08-19 | 2024-08-27 | Nutanix, Inc. | Share-based file server replication for disaster recovery |
US12117972B2 (en) | 2021-08-19 | 2024-10-15 | Nutanix, Inc. | File server managers and systems for managing virtualized file servers |
US20240028466A1 (en) * | 2022-07-20 | 2024-01-25 | Dell Products L.P. | Storing Namespace Metadata in a Key Value Store to Facilitate Space Efficient Point In Time Snapshots |
Family Cites Families (46)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3004278B2 (ja) * | 1988-11-24 | 2000-01-31 | 富士通株式会社 | マルチプロセッサシステム |
US5430850A (en) * | 1991-07-22 | 1995-07-04 | Massachusetts Institute Of Technology | Data processing system with synchronization coprocessor for multiple threads |
JP2974526B2 (ja) * | 1992-12-18 | 1999-11-10 | 富士通株式会社 | データ転送処理方法及びデータ転送処理装置 |
JP3098344B2 (ja) * | 1992-12-18 | 2000-10-16 | 富士通株式会社 | データ転送処理方法及びデータ転送処理装置 |
CN1149736A (zh) * | 1995-06-05 | 1997-05-14 | 北京航空航天大学 | 一种分布式存储器共享管理方法 |
US7301541B2 (en) * | 1995-08-16 | 2007-11-27 | Microunity Systems Engineering, Inc. | Programmable processor and method with wide operations |
US6101590A (en) * | 1995-10-10 | 2000-08-08 | Micro Unity Systems Engineering, Inc. | Virtual memory system with local and global virtual address translation |
US5848254A (en) * | 1996-07-01 | 1998-12-08 | Sun Microsystems, Inc. | Multiprocessing system using an access to a second memory space to initiate software controlled data prefetch into a first address space |
US6205528B1 (en) * | 1997-08-29 | 2001-03-20 | International Business Machines Corporation | User specifiable allocation of memory for processes in a multiprocessor computer having a non-uniform memory architecture |
ATE254778T1 (de) * | 1997-09-05 | 2003-12-15 | Sun Microsystems Inc | Nachschlagtabelle und verfahren zur datenspeicherung darin |
US6591355B2 (en) * | 1998-09-28 | 2003-07-08 | Technion Research And Development Foundation Ltd. | Distributed shared memory system with variable granularity |
JP2000267979A (ja) * | 1999-03-12 | 2000-09-29 | Nec Corp | 記憶システム |
DE10127198A1 (de) * | 2001-06-05 | 2002-12-19 | Infineon Technologies Ag | Vorrichtung und Verfahren zum Ermitteln einer physikalischen Adresse aus einer virtuellen Adresse unter Verwendung einer hierarchischen Abbildungsvorschrift mit komprimierten Knoten |
US6912612B2 (en) * | 2002-02-25 | 2005-06-28 | Intel Corporation | Shared bypass bus structure |
JP2004013276A (ja) * | 2002-06-04 | 2004-01-15 | Victor Co Of Japan Ltd | ファイルシステム及び記録媒体 |
JP3869769B2 (ja) * | 2002-07-24 | 2007-01-17 | 株式会社日立製作所 | ストレージ・ネットワーク用のスイッチングノード装置および遠隔ストレージ装置のアクセス方法 |
US6948044B1 (en) * | 2002-07-30 | 2005-09-20 | Cisco Systems, Inc. | Methods and apparatus for storage virtualization |
US7577816B2 (en) * | 2003-08-18 | 2009-08-18 | Cray Inc. | Remote translation mechanism for a multinode system |
US6922766B2 (en) * | 2002-09-04 | 2005-07-26 | Cray Inc. | Remote translation mechanism for a multi-node system |
US6920521B2 (en) | 2002-10-10 | 2005-07-19 | International Business Machines Corporation | Method and system of managing virtualized physical memory in a data processing system |
CN1206600C (zh) * | 2002-11-14 | 2005-06-15 | 华中科技大学 | 一种全分布式的集群网络服务器系统 |
US20040117587A1 (en) | 2002-12-12 | 2004-06-17 | International Business Machines Corp. | Hardware managed virtual-to-physical address translation mechanism |
JP2004192483A (ja) * | 2002-12-13 | 2004-07-08 | Hitachi Ltd | 分散ストレージシステムの管理方法 |
US7765381B2 (en) * | 2003-04-04 | 2010-07-27 | Oracle America, Inc. | Multi-node system in which home memory subsystem stores global to local address translation information for replicating nodes |
US7334108B1 (en) * | 2004-01-30 | 2008-02-19 | Nvidia Corporation | Multi-client virtual address translation system with translation units of variable-range size |
JP4258768B2 (ja) * | 2004-04-20 | 2009-04-30 | 日本電気株式会社 | ファイル配置システム |
EP1958439B1 (en) * | 2005-11-29 | 2012-08-15 | Koninklijke Philips Electronics N.V. | Method of managing a distributed storage system |
US7877540B2 (en) | 2005-12-13 | 2011-01-25 | Sandisk Corporation | Logically-addressed file storage methods |
US20090089537A1 (en) * | 2007-09-28 | 2009-04-02 | Sun Microsystems, Inc. | Apparatus and method for memory address translation across multiple nodes |
CN101187930B (zh) * | 2007-12-04 | 2010-06-09 | 浙江大学 | 分布式文件系统虚拟目录及命名空间的实现方法 |
US8195912B2 (en) * | 2007-12-06 | 2012-06-05 | Fusion-io, Inc | Apparatus, system, and method for efficient mapping of virtual and physical addresses |
JP5221157B2 (ja) * | 2008-02-04 | 2013-06-26 | 株式会社日立製作所 | コンピュータシステム及び物理ディスク回収方法 |
CN101477495B (zh) * | 2008-10-28 | 2011-03-16 | 北京航空航天大学 | 分布式内存虚拟化技术的实现方法 |
CN101398768B (zh) * | 2008-10-28 | 2011-06-15 | 北京航空航天大学 | 一种分布式虚拟机监视器系统的构建方法 |
CN101477496B (zh) * | 2008-12-29 | 2011-08-31 | 北京航空航天大学 | 基于分布式内存虚拟化的numa结构的实现方法 |
US8918619B2 (en) * | 2009-10-04 | 2014-12-23 | Infinidat Ltd. | Virtualized storage system and method of operating thereof |
US8549231B2 (en) * | 2010-01-08 | 2013-10-01 | Oracle America, Inc. | Performing high granularity prefetch from remote memory into a cache on a device without change in address |
KR20120132820A (ko) * | 2011-05-30 | 2012-12-10 | 삼성전자주식회사 | 스토리지 디바이스, 스토리지 시스템 및 스토리지 디바이스의 가상화 방법 |
US8868882B2 (en) | 2011-06-08 | 2014-10-21 | Microsoft Corporation | Storage architecture for backup application |
CN102255962B (zh) * | 2011-07-01 | 2013-11-06 | 华为数字技术(成都)有限公司 | 一种分布式存储方法、装置和系统 |
CN103049334B (zh) * | 2012-12-14 | 2015-09-30 | 华为技术有限公司 | 一种任务处理的方法和虚拟机 |
CN103797770B (zh) * | 2012-12-31 | 2015-12-02 | 华为技术有限公司 | 一种共享存储资源的方法和系统 |
CN103414761B (zh) * | 2013-07-23 | 2017-02-08 | 北京工业大学 | 一种基于Hadoop架构的移动终端云资源调度方法 |
CN103617175A (zh) | 2013-11-04 | 2014-03-05 | 广东电子工业研究院有限公司 | 一种用于大规模分布异构数据的虚拟化方法 |
US10769076B2 (en) * | 2018-11-21 | 2020-09-08 | Nvidia Corporation | Distributed address translation in a multi-node interconnect fabric |
US11327665B2 (en) * | 2019-09-20 | 2022-05-10 | International Business Machines Corporation | Managing data on volumes |
-
2014
- 2014-08-12 JP JP2017507763A patent/JP6344675B2/ja active Active
- 2014-08-12 CN CN201811337940.4A patent/CN109376123B/zh active Active
- 2014-08-12 EP EP21154483.8A patent/EP3905054B1/en active Active
- 2014-08-12 CN CN201480037252.XA patent/CN105593828B/zh active Active
- 2014-08-12 WO PCT/CN2014/084196 patent/WO2016023166A1/zh active Application Filing
- 2014-08-12 RU RU2017107348A patent/RU2658886C1/ru active
- 2014-08-12 SG SG11201700413RA patent/SG11201700413RA/en unknown
- 2014-08-12 EP EP14899558.2A patent/EP3171277B1/en active Active
-
2017
- 2017-02-09 US US15/428,527 patent/US10152233B2/en active Active
-
2018
- 2018-11-01 US US16/178,220 patent/US11029848B2/en active Active
-
2021
- 2021-05-03 US US17/306,494 patent/US11656763B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
CN105593828B (zh) | 2018-12-07 |
EP3905054B1 (en) | 2023-12-20 |
RU2658886C1 (ru) | 2018-06-25 |
CN109376123B (zh) | 2022-08-19 |
US20170153822A1 (en) | 2017-06-01 |
US11029848B2 (en) | 2021-06-08 |
SG11201700413RA (en) | 2017-03-30 |
US20190073130A1 (en) | 2019-03-07 |
CN109376123A (zh) | 2019-02-22 |
EP3171277B1 (en) | 2021-03-03 |
CN105593828A (zh) | 2016-05-18 |
JP2017525054A (ja) | 2017-08-31 |
WO2016023166A1 (zh) | 2016-02-18 |
US10152233B2 (en) | 2018-12-11 |
EP3905054A1 (en) | 2021-11-03 |
US11656763B2 (en) | 2023-05-23 |
US20210255775A1 (en) | 2021-08-19 |
EP3171277A4 (en) | 2017-08-02 |
EP3171277A1 (en) | 2017-05-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6344675B2 (ja) | ファイル管理方法、分散記憶システムおよび管理ノード | |
TWI791647B (zh) | 非揮發性記憶體設備中的命名空間分配 | |
JP6734807B2 (ja) | テナントアウェアストレージシェアリングプラットフォームのための処理装置及びその方法 | |
US20160371186A1 (en) | Access-based eviction of blocks from solid state drive cache memory | |
EP3617867B1 (en) | Fragment management method and fragment management apparatus | |
US20200294548A1 (en) | Method for accessing shingled magnetic recording smr disk, and server | |
WO2016147281A1 (ja) | 分散型ストレージシステム及び分散型ストレージシステムの制御方法 | |
CN107329704B (zh) | 一种缓存镜像方法及控制器 | |
JP6526235B2 (ja) | データチェック方法および記憶システム | |
CN110199512B (zh) | 存储系统中存储设备的管理方法及装置 | |
JP6734768B2 (ja) | 二重書込みを遂行するストレージ装置を含むシステム、装置、及びその方法 | |
CN110199270B (zh) | 存储系统中存储设备的管理方法及装置 | |
JP6653370B2 (ja) | ストレージシステム | |
WO2016106757A1 (zh) | 一种存储数据的管理方法、存储管理器及存储系统 | |
CN109814805B (zh) | 存储系统中分条重组的方法及分条服务器 | |
CN104426965B (zh) | 自管理存储方法和系统 | |
CN108614671B (zh) | 基于命名空间的键-数据访问方法与固态存储设备 | |
CN105765542B (zh) | 访问文件的方法、分布式存储系统和存储节点 | |
KR102623061B1 (ko) | 데이터베이스에서 이터레이터 연산을 수행하기 위한 장치 | |
CN108614669B (zh) | 解决哈希冲突的键-数据访问方法与固态存储设备 | |
CN110659216A (zh) | Nid分配方法及其存储设备 | |
WO2023165448A1 (zh) | 一种地址管理方法及存储装置 | |
CN111367825B (zh) | 存储设备的虚拟校验数据缓存 | |
JP6657990B2 (ja) | ストレージ装置、仮想ボリューム制御システム、仮想ボリューム制御方法および仮想ボリューム制御プログラム | |
JP5638022B2 (ja) | ディスクアレイ装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170302 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20170302 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20180130 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20180131 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180410 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20180424 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180510 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6344675 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |