JP6259868B2 - データ分配方法、データ記憶方法、関係する装置及びシステム - Google Patents
データ分配方法、データ記憶方法、関係する装置及びシステム Download PDFInfo
- Publication number
- JP6259868B2 JP6259868B2 JP2016111406A JP2016111406A JP6259868B2 JP 6259868 B2 JP6259868 B2 JP 6259868B2 JP 2016111406 A JP2016111406 A JP 2016111406A JP 2016111406 A JP2016111406 A JP 2016111406A JP 6259868 B2 JP6259868 B2 JP 6259868B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- storage
- data segment
- stripe
- segment
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 66
- 238000013500 data storage Methods 0.000 title claims description 50
- 238000003860 storage Methods 0.000 claims description 531
- 238000005192 partition Methods 0.000 claims description 180
- 230000004044 response Effects 0.000 claims description 23
- 239000013589 supplement Substances 0.000 claims description 14
- 238000000638 solvent extraction Methods 0.000 claims description 5
- 230000003213 activating effect Effects 0.000 claims description 3
- 230000011218 segmentation Effects 0.000 claims description 3
- 238000007726 management method Methods 0.000 description 9
- 238000010586 diagram Methods 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 5
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000001960 triggered effect Effects 0.000 description 2
- 230000001934 delay Effects 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000000047 product Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/08—Error detection or correction by redundancy in data representation, e.g. by using checking codes
- G06F11/10—Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's
- G06F11/1004—Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's to protect a block of data words, e.g. CRC or checksum
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0602—Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
- G06F3/0604—Improving or facilitating administration, e.g. storage management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0602—Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
- G06F3/061—Improving I/O performance
- G06F3/0611—Improving I/O performance in relation to response time
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0602—Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
- G06F3/0614—Improving the reliability of storage systems
- G06F3/0619—Improving the reliability of storage systems in relation to data integrity, e.g. data losses, bit errors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0628—Interfaces specially adapted for storage systems making use of a particular technique
- G06F3/0629—Configuration or reconfiguration of storage systems
- G06F3/0631—Configuration or reconfiguration of storage systems by allocating resources to storage systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0628—Interfaces specially adapted for storage systems making use of a particular technique
- G06F3/0638—Organizing or formatting or addressing of data
- G06F3/064—Management of blocks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0628—Interfaces specially adapted for storage systems making use of a particular technique
- G06F3/0638—Organizing or formatting or addressing of data
- G06F3/0644—Management of space entities, e.g. partitions, extents, pools
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0668—Interfaces specially adapted for storage systems adopting a particular infrastructure
- G06F3/067—Distributed or networked storage systems, e.g. storage area networks [SAN], network attached storage [NAS]
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Computer Security & Cryptography (AREA)
- Quality & Reliability (AREA)
- Error Detection And Correction (AREA)
- Techniques For Improving Reliability Of Storages (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Detection And Correction Of Errors (AREA)
Description
Claims (19)
- 分散型記憶システムに適用されるデータ分配方法であり、前記分散型記憶システムは、イレージャーコーディング(EC)ストライプを使用することによりデータを記憶し、各ECストライプは、データ部及びパリティ部を有し、各ECストライプの前記データ部は、m個のデータブロックを有し、各ECストライプの前記パリティ部は、前記m個のデータブロックにおいて実行されるパリティコーディングの後に取得されたk個のパリティブロックを有し、前記分散型記憶システムは、複数の記憶ノードを有し、前記複数の記憶ノードは、複数の記憶ノードグループを構成し、各記憶ノードグループに含まれる記憶ノードの量は、m+k未満ではなく、1つのプライマリ記憶ノードが各記憶ノードグループ内で指定され、前記m及びkは共に正の整数であり、前記分散型記憶システムの論理ボリュームは、複数の論理パーティションを有し、前記論理パーティションはそれぞれZのサイズを有し、互いに重複しないデータ分配方法であって、
記憶命令を受信するステップであり、前記記憶命令は、記憶されるべきデータを搬送するステップと、
前記記憶されるべきデータの論理アドレスに従って、前記記憶されるべきデータをP個のデータセグメントに分割するステップであり、各データセグメントは、前記論理パーティションの1つに入り、各データセグメントは、1つのECストライプに対応し、各データセグメントのサイズはZより大きくなく、前記Zはm個のデータブロックのサイズであり、前記Pは正の整数であり、前記P個のデータセグメント内の第1のデータセグメントの開始アドレスは、前記記憶されるべきデータの開始アドレスであり、前記P個のデータセグメント内の第pのデータセグメントの開始アドレスは、前記第pのデータセグメントが入る論理パーティションの開始アドレスであり、2≦p≦Pであるステップと、
各データセグメントに対応する記憶ノードグループを決定するステップと、
前記データセグメントに対応する前記決定された記憶ノードグループ内のプライマリ記憶ノードに前記データセグメントを分配するステップと
を有するデータ分配方法。 - 各論理パーティションと各記憶ノードグループとの間の対応関係を設定するステップを更に有し、
各データセグメントに対応する記憶ノードグループを決定するステップは、
各論理パーティションと各記憶ノードグループとの間の前記対応関係に従って、前記データセグメントが入る論理パーティションに対応する前記記憶ノードグループを決定するステップを有する、請求項1に記載のデータ分配方法。 - 各論理パーティションは、1つのkey値に一意に対応し、各論理パーティションと各記憶ノードグループとの間の対応関係を設定するステップは、
各記憶ノードグループに対応するkey値を設定するステップを有し、
各論理パーティションと各記憶ノードグループとの間の前記対応関係に従って、前記データセグメントが入る論理パーティションに対応する前記記憶ノードグループを決定するステップは、
前記データセグメントが入る前記論理パーティションに従って、前記データセグメントのkey値を決定するステップと、
前記データセグメントの前記key値に従って、前記データセグメントに対応する前記記憶ノードグループを決定するステップと
を有する、請求項2に記載のデータ分配方法。 - 分散型記憶システムに適用されるデータ記憶方法であり、前記分散型記憶システムは、イレージャーコーディング(EC)ストライプを使用することによりデータを記憶し、各ECストライプは、データ部及びパリティ部を有し、各ECストライプの前記データ部は、m個のデータブロックを有し、各ECストライプの前記パリティ部は、前記m個のデータブロックにおいて実行されるパリティコーディングの後に取得されたk個のパリティブロックを有し、前記分散型記憶システムは、複数の記憶ノードを有し、前記複数の記憶ノードは、複数の記憶ノードグループを構成し、各記憶ノードグループに含まれる記憶ノードの量は、m+k未満ではなく、1つのプライマリ記憶ノードが各記憶ノードグループ内で指定され、前記m及びkは共に正の整数であり、前記複数の記憶ノードグループ内のいずれかの記憶ノードグループ内のプライマリ記憶ノードが前記データ記憶方法を実行するデータ記憶方法であって、
第1のデータセグメントを受信するステップであり、前記第1のデータセグメントのサイズはZより大きくなく、Zはm個のデータブロックのサイズであるステップと、
第1のECストライプを取得するために、前記第1のデータセグメントに従ってイレージャーコーディングを実行するステップであり、前記第1のECストライプは、m個の第1のデータブロック及びk個の第1のパリティブロックを有するステップと、
記憶を実行するために、m+k個の記憶ノードに前記第1のECストライプを分配するステップであり、前記m+k個の記憶ノード内の各記憶ノードは、前記第1のECストライプの前記m個の第1のデータブロック又は前記k個の第1のパリティブロックのいずれか1つを記憶することを担うステップと
を有し、
第1のECストライプを取得するために、前記第1のデータセグメントに従ってイレージャーコーディングを実行するステップであり、前記第1のECストライプは、m個の第1のデータブロック及びk個の第1のパリティブロックを有するステップは、
前記第1のデータセグメントのサイズがZに等しい場合、前記第1のデータセグメントをm個の第1のデータブロックに分割し、k個の第1のパリティブロックを取得するために、前記m個の第1のデータブロックにおいてパリティコーディングを実行するステップ、又は、
前記第1のデータセグメントの前記サイズがZ未満である場合、前記サイズがZに等しくなるように前記第1のデータセグメントを補うために記憶されたデータを使用し、次に、前記補われた第1のデータセグメントをm個の第1のデータブロックに分割し、k個の第1のパリティブロックを取得するために、前記m個の第1のデータブロックにおいてパリティコーディングを実行するステップ
を有するデータ記憶方法。 - 前記分散型記憶システムの論理ボリュームは、複数の論理パーティションを有し、前記論理パーティションはそれぞれZのサイズを有し、互いに重複せず、前記第1のデータセグメントは、前記論理パーティションの1つに入る、請求項4に記載のデータ記憶方法。
- 記憶を実行するために、m+k個の記憶ノードに前記第1のECストライプを分配する前に、
第2のデータセグメントを受信するステップであり、前記第2のデータセグメント及び前記第1のデータセグメントは、同じ論理パーティションに入り、前記第2のデータセグメントの論理アドレスは、前記第1のデータセグメントの論理アドレスと重複するステップと、
第2のECストライプを取得するために、前記第2のデータセグメントに従ってイレージャーコーディングを実行するステップであり、前記第2のECストライプは、m個の第2のデータブロック及びk個の第2のパリティブロックを有するステップと
を更に有し、
記憶を実行するために、m+k個の記憶ノードに前記第1のECストライプを分配するステップは、
前記第1のECストライプ及び前記第2のECストライプの連続分配順序を決定し、前記連続分配順序に従って、前記m+k個の記憶ノードに前記第1のECストライプ及び前記第2のECストライプを連続して分配するステップを有する、請求項5に記載のデータ記憶方法。 - 前記第1のECストライプ及び前記第2のECストライプの連続分配順序を決定し、記憶を実行するために、前記連続分配順序に従って、前記m+k個の記憶ノードに前記第1のECストライプ及び前記第2のECストライプを連続して分配するステップは、
前記第1のデータセグメントの受信時間が前記第2のデータセグメントの受信時間より早い場合、記憶を実行するために、まず前記m+k個の記憶ノードに前記第1のECストライプを分配し、前記m+k個の記憶ノードが第1のECストライプを成功して記憶したことを示す応答メッセージを受信した後に、記憶を実行するために、前記m+k個の記憶ノードに前記第2のECストライプを分配するステップ、又は、
前記第1のデータセグメントの受信時間が前記第2のデータセグメントの受信時間より遅い場合、記憶を実行するために、まず前記m+k個の記憶ノードに前記第2のECストライプを分配し、前記m+k個の記憶ノードが前記第2のECストライプを成功して記憶したことを示す応答メッセージを受信した後に、記憶を実行するために、前記m+k個の記憶ノードに前記第1のECストライプを分配するステップ
を有する、請求項6に記載のデータ記憶方法。 - 第1のECストライプを取得するために、前記第1のデータセグメントに従ってイレージャーコーディングを実行する前に、
第3のデータセグメントを受信するステップであり、前記第3のデータセグメント及び前記第1のデータセグメントは、同じ論理パーティションに入り、前記第3のデータセグメントの論理アドレスは、前記第1のデータセグメントの論理アドレスと重複しないステップと、
前記第3のデータセグメントを前記第1のデータセグメントに結合し、第1のECストライプを取得するために、前記第1のデータセグメントに従ってイレージャーコーディングを実行するステップを起動するステップと
を更に有する、請求項5ないし7のうちいずれか1項に記載のデータ記憶方法。 - 分散型記憶システムに適用されるデータ分配装置であり、前記分散型記憶システムは、イレージャーコーディング(EC)ストライプを使用することによりデータを記憶し、各ECストライプは、データ部及びパリティ部を有し、各ECストライプの前記データ部は、m個のデータブロックを有し、各ECストライプの前記パリティ部は、前記m個のデータブロックにおいて実行されるパリティコーディングの後に取得されたk個のパリティブロックを有し、前記分散型記憶システムは、複数の記憶ノードを有し、前記複数の記憶ノードは、複数の記憶ノードグループを構成し、各記憶ノードグループに含まれる記憶ノードの量は、m+k未満ではなく、1つのプライマリ記憶ノードが各記憶ノードグループ内で指定され、前記m及びkは共に正の整数であり、前記分散型記憶システムの論理ボリュームは、複数の論理パーティションを有し、前記論理パーティションはそれぞれZのサイズを有し、互いに重複しないデータ分配装置であって、
記憶命令を受信するように構成された命令受信モジュールであり、前記記憶命令は、記憶されるべきデータを搬送する命令受信モジュールと、
前記記憶されるべきデータの論理アドレスに従って、前記記憶されるべきデータをP個のデータセグメントに分割するように構成されたデータセグメント分割モジュールであり、各データセグメントは、前記論理パーティションの1つに入り、各データセグメントは、1つのECストライプに対応し、各データセグメントのサイズはZより大きくなく、前記Zはm個のデータブロックのサイズであり、前記Pは正の整数であり、前記P個のデータセグメント内の第1のデータセグメントの開始アドレスは、前記記憶されるべきデータの開始アドレスであり、前記P個のデータセグメント内の第pのデータセグメントの開始アドレスは、前記第pのデータセグメントが入る論理パーティションの開始アドレスであり、2≦p≦Pであるデータセグメント分割モジュールと、
各データセグメントに対応する記憶ノードグループを決定するように構成されたノードグループ決定モジュールと、
前記データセグメントに対応する前記決定された記憶ノードグループ内のプライマリ記憶ノードに前記データセグメントを分配するように構成されたデータセグメント分配モジュールと
を有するデータ分配装置。 - 前記データ分配装置は、各論理パーティションと各記憶ノードグループとの間の対応関係を設定するように構成された対応関係モジュールを更に有し、
前記ノードグループ決定モジュールは、各論理パーティションと各記憶ノードグループとの間の前記対応関係に従って、前記データセグメントが入る論理パーティションに対応する前記記憶ノードグループを決定するように構成される、請求項9に記載のデータ分配装置。 - 各論理パーティションは、1つのkey値に一意に対応し、
前記対応関係モジュールは、各記憶ノードグループに対応するkey値を設定するように構成され、
前記ノードグループ決定モジュールは、前記データセグメントが入る前記論理パーティションに従って、前記データセグメントのkey値を決定し、前記データセグメントの前記key値に従って、前記データセグメントに対応する前記記憶ノードグループを決定するように構成される、請求項10に記載のデータ分配装置。 - 分散型記憶システムに適用されるデータ記憶装置であり、前記分散型記憶システムは、イレージャーコーディング(EC)ストライプを使用することによりデータを記憶し、各ECストライプは、データ部及びパリティ部を有し、各ECストライプの前記データ部は、m個のデータブロックを有し、各ECストライプの前記パリティ部は、前記m個のデータブロックにおいて実行されるパリティコーディングの後に取得されたk個のパリティブロックを有し、前記分散型記憶システムは、複数の記憶ノードを有し、前記複数の記憶ノードは、複数の記憶ノードグループを構成し、各記憶ノードグループに含まれる記憶ノードの量は、m+k未満ではなく、1つのプライマリ記憶ノードが各記憶ノードグループ内で指定され、前記m及びkは共に正の整数であり、前記データ記憶装置は、前記複数の記憶ノードグループ内のいずれかの記憶ノードグループ内のプライマリ記憶ノードに配置されるデータ記憶装置であって、
第1のデータセグメントを受信するように構成されたデータ受信モジュールであり、前記第1のデータセグメントのサイズはZより大きくなく、Zはm個のデータブロックのサイズであるデータ受信モジュールと、
第1のECストライプを取得するために、前記第1のデータセグメントに従ってイレージャーコーディングを実行するように構成されたデータコーディングモジュールであり、前記第1のECストライプは、m個の第1のデータブロック及びk個の第1のパリティブロックを有するデータコーディングモジュールと、
記憶を実行するために、m+k個の記憶ノードに前記第1のECストライプを分配するように構成されたデータ分配モジュールであり、前記m+k個の記憶ノード内の各記憶ノードは、前記第1のECストライプの前記m個の第1のデータブロック又は前記k個の第1のパリティブロックのいずれか1つを記憶することを担うデータ分配モジュールと
を有し、
前記データコーディングモジュールは、前記第1のデータセグメントのサイズがZに等しい場合、前記第1のデータセグメントをm個の第1のデータブロックに分割し、k個の第1のパリティブロックを取得するために、前記m個の第1のデータブロックにおいてパリティコーディングを実行するように更に構成される、或いは、
前記第1のデータセグメントの前記サイズがZ未満である場合、前記サイズがZに等しくなるように前記第1のデータセグメントを補うために記憶されたデータを使用し、次に、前記補われた第1のデータセグメントをm個の第1のデータブロックに分割し、k個の第1のパリティブロックを取得するために、前記m個の第1のデータブロックにおいてパリティコーディングを実行するように更に構成されるデータ記憶装置。 - 前記分散型記憶システムの論理ボリュームは、複数の論理パーティションを有し、前記論理パーティションはそれぞれZのサイズを有し、互いに重複せず、前記第1のデータセグメントは、前記論理パーティションの1つに入る、請求項12に記載のデータ記憶装置。
- 前記データ受信モジュールは、第2のデータセグメントを受信するように更に構成され、前記第2のデータセグメント及び前記第1のデータセグメントは、同じ論理パーティションに入り、前記第2のデータセグメントの論理アドレスは、前記第1のデータセグメントの論理アドレスと重複し、
前記データコーディングモジュールは、第2のECストライプを取得するために、前記第2のデータセグメントに従ってイレージャーコーディングを実行するように更に構成され、前記第2のECストライプは、m個の第2のデータブロック及びk個の第2のパリティブロックを有し、
前記データ分配モジュールは、前記第1のECストライプ及び前記第2のECストライプの連続分配順序を決定し、前記連続分配順序に従って、前記m+k個の記憶ノードに前記第1のECストライプ及び前記第2のECストライプを連続して分配するように構成される、請求項13に記載のデータ記憶装置。 - 前記データ分配モジュールは、
前記第1のデータセグメントの受信時間が前記第2のデータセグメントの受信時間より早い場合、記憶を実行するために、まず前記m+k個の記憶ノードに前記第1のECストライプを分配し、前記m+k個の記憶ノードが前記第1のECストライプを成功して記憶したことを示す応答メッセージを受信した後に、記憶を実行するために、前記m+k個の記憶ノードに前記第2のECストライプを分配するように構成される、或いは、
前記第1のデータセグメントの受信時間が前記第2のデータセグメントの受信時間より遅い場合、記憶を実行するために、まず前記m+k個の記憶ノードに前記第2のECストライプを分配し、前記m+k個の記憶ノードが前記第2のECストライプを成功して記憶したことを示す応答メッセージを受信した後に、記憶を実行するために、前記m+k個の記憶ノードに前記第1のECストライプを分配するように構成される、請求項14に記載のデータ記憶装置。 - 前記データ受信モジュールは、第3のデータセグメントを受信するように更に構成され、前記第3のデータセグメント及び前記第1のデータセグメントは、同じ論理パーティションに入り、前記第3のデータセグメントの論理アドレスは、前記第1のデータセグメントの論理アドレスと重複せず、
前記データコーディングモジュールは、前記第3のデータセグメントが受信されたと前記データ受信モジュールが決定した後に、前記第3のデータセグメントを前記第1のデータセグメントに結合し、第1のECストライプを取得するために、前記第1のデータセグメントに従ってイレージャーコーディングを実行するステップを起動するように更に構成される、請求項13ないし15のうちいずれか1項に記載のデータ記憶装置。 - コンピュータ実行可能命令を有するコンピュータ読み取り可能記憶媒体であって、
コンピュータのプロセッサが前記コンピュータ実行可能命令を実行した場合、前記コンピュータは、請求項1ないし3のうちいずれか1項に記載の方法を実行するコンピュータ読み取り可能記憶媒体。 - コンピュータ実行可能命令を有するコンピュータ読み取り可能記憶媒体であって、
コンピュータのプロセッサが前記コンピュータ実行可能命令を実行した場合、前記コンピュータは、請求項4ないし8のうちいずれか1項に記載の方法を実行するコンピュータ読み取り可能記憶媒体。 - 複数の記憶ノードを有する分散型記憶システムであり、前記分散型記憶システムは、イレージャーコーディング(EC)ストライプを使用することによりデータを記憶し、各ECストライプは、データ部及びパリティ部を有し、各ECストライプの前記データ部は、m個のデータブロックを有し、各ECストライプの前記パリティ部は、前記m個のデータブロックにおいて実行されるパリティコーディングの後に取得されたk個のパリティブロックを有し、前記複数の記憶ノードは、複数の記憶ノードグループを構成し、各記憶ノードグループに含まれる記憶ノードの量は、m+k未満ではなく、1つのプライマリ記憶ノードが各記憶ノードグループ内で指定され、前記m及びkは共に正の整数である分散型記憶システムであって、
請求項12ないし16のうちいずれか1項に記載のデータ記憶装置を更に有する分散型記憶システム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510304621.3 | 2015-06-04 | ||
CN201510304621.3A CN104932953B (zh) | 2015-06-04 | 2015-06-04 | 一种数据分发方法、数据存储方法、相关装置以及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017004513A JP2017004513A (ja) | 2017-01-05 |
JP6259868B2 true JP6259868B2 (ja) | 2018-01-10 |
Family
ID=54120126
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016111406A Active JP6259868B2 (ja) | 2015-06-04 | 2016-06-03 | データ分配方法、データ記憶方法、関係する装置及びシステム |
Country Status (5)
Country | Link |
---|---|
US (1) | US20160357440A1 (ja) |
EP (1) | EP3101530B1 (ja) |
JP (1) | JP6259868B2 (ja) |
CN (2) | CN104932953B (ja) |
BR (1) | BR102016012739B1 (ja) |
Families Citing this family (38)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108141228A (zh) * | 2015-10-09 | 2018-06-08 | 华为技术有限公司 | 分布式存储系统的编码 |
CN105426483B (zh) * | 2015-11-19 | 2019-01-11 | 华为技术有限公司 | 一种基于分布式系统的文件读取方法及装置 |
CN105404561B (zh) * | 2015-11-19 | 2019-04-12 | 浙江宇视科技有限公司 | 一种分布式存储的纠删码实现方法及装置 |
CN107203559B (zh) * | 2016-03-17 | 2021-01-01 | 华为技术有限公司 | 一种划分数据条带的方法和装置 |
CN106202271A (zh) * | 2016-06-30 | 2016-12-07 | 携程计算机技术(上海)有限公司 | Ota的产品数据库的读取方法 |
CN107590019B (zh) * | 2016-07-07 | 2021-03-16 | 北京金山云网络技术有限公司 | 一种数据存储的方法和装置 |
CN106201354A (zh) * | 2016-07-12 | 2016-12-07 | 乐视控股(北京)有限公司 | 数据存储方法及系统 |
EP3352071B1 (en) * | 2016-11-25 | 2019-08-28 | Huawei Technologies Co., Ltd. | Data check method and storage system |
CN108614670B (zh) * | 2016-12-13 | 2020-07-03 | 杭州海康威视数字技术股份有限公司 | 一种信息处理方法及装置 |
US11461273B1 (en) * | 2016-12-20 | 2022-10-04 | Pure Storage, Inc. | Modifying storage distribution in a storage system that includes one or more storage devices |
CN106776146A (zh) * | 2016-12-29 | 2017-05-31 | 华为技术有限公司 | 一种数据校验方法、装置及系统 |
WO2018229944A1 (ja) * | 2017-06-15 | 2018-12-20 | 株式会社日立製作所 | ストレージシステム及びストレージシステムの制御方法 |
US11188258B2 (en) * | 2017-06-19 | 2021-11-30 | Hitachi, Ltd. | Distributed storage system |
CN109213420A (zh) * | 2017-06-29 | 2019-01-15 | 杭州海康威视数字技术股份有限公司 | 数据存储方法、装置及系统 |
CN112214166B (zh) * | 2017-09-05 | 2022-05-24 | 华为技术有限公司 | 用于传输数据处理请求的方法和装置 |
CN107609161A (zh) * | 2017-09-26 | 2018-01-19 | 北京思特奇信息技术股份有限公司 | 一种数据写入、读取方法和系统 |
CN107707395B (zh) * | 2017-09-28 | 2021-02-02 | 浙江大华技术股份有限公司 | 一种数据传输方法、装置和系统 |
WO2019080015A1 (zh) * | 2017-10-25 | 2019-05-02 | 华为技术有限公司 | 一种数据读写方法、装置和存储服务器 |
CN108780386B (zh) | 2017-12-20 | 2020-09-04 | 华为技术有限公司 | 一种数据存储的方法、装置和系统 |
CN108897497B (zh) * | 2018-06-29 | 2021-10-08 | 吴俊杰 | 一种无中心的数据管理方法及装置 |
CN109194566B (zh) * | 2018-08-27 | 2022-01-04 | 惠州Tcl移动通信有限公司 | 一种重发信息的方法、存储介质及终端设备 |
CN109032536B (zh) * | 2018-08-31 | 2021-08-10 | 郑州云海信息技术有限公司 | 基于分布式集群系统的数据存储方法、装置、系统及设备 |
CN109491968B (zh) * | 2018-11-13 | 2021-01-22 | 恒生电子股份有限公司 | 一种文件处理方法、装置、设备及计算机可读存储介质 |
EP3889778B1 (en) * | 2018-12-22 | 2023-05-10 | Huawei Cloud Computing Technologies Co., Ltd. | Distributed storage system and computer program product |
CN111936960B (zh) * | 2018-12-25 | 2022-08-19 | 华为云计算技术有限公司 | 分布式存储系统中数据存储方法、装置及计算机程序产品 |
CN110046160B (zh) * | 2019-03-15 | 2021-07-20 | 中国科学院计算技术研究所 | 一种基于条带的一致性哈希存储系统构建方法 |
CN109977077B (zh) * | 2019-03-25 | 2021-09-24 | 腾讯科技(深圳)有限公司 | 模型文件存储方法、装置、可读存储介质和计算机设备 |
CN110162525B (zh) * | 2019-04-17 | 2023-09-26 | 平安科技(深圳)有限公司 | 基于b+树的读写冲突解决方法、装置及存储介质 |
CN111142799A (zh) * | 2019-12-26 | 2020-05-12 | 深圳市网心科技有限公司 | 分布式存储方法及装置、网络节点及存储介质 |
US11604697B2 (en) * | 2020-03-26 | 2023-03-14 | Quantum Corporation | Distributed erasure encoding in shared file system |
CN111611317B (zh) * | 2020-06-08 | 2023-05-30 | 杭州复杂美科技有限公司 | 区块链分布式存储分组方法、设备和存储介质 |
CN112083892B (zh) * | 2020-09-25 | 2021-05-18 | 上海依图网络科技有限公司 | 一种数据存储方法、装置、设备和介质 |
WO2022198429A1 (zh) * | 2021-03-23 | 2022-09-29 | 深圳市欢太科技有限公司 | 一种数据冗余备份方法、装置、存储介质及电子设备 |
CN113010119B (zh) * | 2021-04-27 | 2022-09-30 | 宏图智能物流股份有限公司 | 一种通过主备方式实现语音数据分布式存储的方法 |
CN113010120B (zh) * | 2021-04-27 | 2022-07-29 | 宏图智能物流股份有限公司 | 一种通过轮循方式实现语音数据分布式存储的方法 |
CN113326006B (zh) * | 2021-06-17 | 2023-09-29 | 上海天玑科技股份有限公司 | 一种基于纠删码的分布式块存储系统 |
CN113419684B (zh) * | 2021-07-09 | 2023-02-24 | 深圳大普微电子科技有限公司 | 一种数据处理方法、装置、设备及可读存储介质 |
CN115599315B (zh) * | 2022-12-14 | 2023-04-07 | 阿里巴巴(中国)有限公司 | 数据处理方法、装置、系统、设备及介质 |
Family Cites Families (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3367510B2 (ja) * | 1993-04-28 | 2003-01-14 | 株式会社日立製作所 | データベース管理方法およびシステム |
US8103789B1 (en) * | 2001-03-01 | 2012-01-24 | Juniper Networks, Inc. | Method and apparatus for computing a backup path using fate sharing information |
US7644136B2 (en) * | 2001-11-28 | 2010-01-05 | Interactive Content Engines, Llc. | Virtual file system |
US7266716B2 (en) * | 2003-10-23 | 2007-09-04 | Hewlett-Packard Development Company, L.P. | Method and recovery of data using erasure coded data from stripe blocks |
JP4244319B2 (ja) * | 2003-12-17 | 2009-03-25 | 株式会社日立製作所 | 計算機システム管理プログラム,記録媒体,ならびに計算機システム管理システムおよびそのための管理装置および記憶装置 |
US7546342B2 (en) * | 2004-05-14 | 2009-06-09 | Microsoft Corporation | Distributed hosting of web content using partial replication |
US7783600B1 (en) * | 2006-02-27 | 2010-08-24 | Symantec Operating Corporation | Redundancy management service for peer-to-peer networks |
CN101188569B (zh) * | 2006-11-16 | 2011-05-04 | 饶大平 | 在网络上构建数据量子空间的方法及分布式文件存储系统 |
US8255739B1 (en) * | 2008-06-30 | 2012-08-28 | American Megatrends, Inc. | Achieving data consistency in a node failover with a degraded RAID array |
US7992037B2 (en) * | 2008-09-11 | 2011-08-02 | Nec Laboratories America, Inc. | Scalable secondary storage systems and methods |
US8051205B2 (en) * | 2008-10-13 | 2011-11-01 | Applied Micro Circuits Corporation | Peer-to-peer distributed storage |
US8458287B2 (en) * | 2009-07-31 | 2013-06-04 | Microsoft Corporation | Erasure coded storage aggregation in data centers |
US8918534B2 (en) * | 2009-09-29 | 2014-12-23 | Cleversafe, Inc. | Writing data slices to ready and non-ready distributed storage units in a distributed storage network |
US20110229104A1 (en) * | 2009-10-22 | 2011-09-22 | Hundemer Hank J | System And Method For Recording and Playback Of Multimedia Content |
WO2014101108A1 (zh) * | 2012-12-28 | 2014-07-03 | 华为技术有限公司 | 分布式存储系统的缓存方法、节点和计算机可读介质 |
CN103152395B (zh) * | 2013-02-05 | 2015-12-09 | 北京奇虎科技有限公司 | 一种分布式文件系统的存储方法及装置 |
CN103984607A (zh) * | 2013-02-08 | 2014-08-13 | 华为技术有限公司 | 分布式存储的方法、装置和系统 |
CN103699494B (zh) * | 2013-12-06 | 2017-03-15 | 北京奇虎科技有限公司 | 一种数据存储方法、数据存储设备和分布式存储系统 |
CN103944981B (zh) * | 2014-04-14 | 2017-03-22 | 中国科学院计算技术研究所 | 一种基于纠删码技术改进的云存储系统及实现方法 |
CN104639661A (zh) * | 2015-03-13 | 2015-05-20 | 华存数据信息技术有限公司 | 分布式存储系统及文件存储和读取方法 |
-
2015
- 2015-06-04 CN CN201510304621.3A patent/CN104932953B/zh active Active
- 2015-06-04 CN CN201710943780.7A patent/CN107844268B/zh active Active
-
2016
- 2016-05-31 EP EP16172076.8A patent/EP3101530B1/en active Active
- 2016-06-02 US US15/171,794 patent/US20160357440A1/en not_active Abandoned
- 2016-06-03 JP JP2016111406A patent/JP6259868B2/ja active Active
- 2016-06-03 BR BR102016012739-4A patent/BR102016012739B1/pt active IP Right Grant
Also Published As
Publication number | Publication date |
---|---|
CN107844268A (zh) | 2018-03-27 |
EP3101530B1 (en) | 2019-05-08 |
BR102016012739B1 (pt) | 2019-04-24 |
US20160357440A1 (en) | 2016-12-08 |
EP3101530A1 (en) | 2016-12-07 |
CN104932953B (zh) | 2017-11-21 |
JP2017004513A (ja) | 2017-01-05 |
BR102016012739A2 (pt) | 2017-09-19 |
CN104932953A (zh) | 2015-09-23 |
CN107844268B (zh) | 2021-09-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6259868B2 (ja) | データ分配方法、データ記憶方法、関係する装置及びシステム | |
JP6347802B2 (ja) | データ記憶方法、データ回復方法、関係する装置及びシステム | |
CN102405460B (zh) | 虚拟存储系统及其运行方法 | |
US8639898B2 (en) | Storage apparatus and data copy method | |
CN109828868B (zh) | 数据存储方法、装置、管理设备和双活数据存储系统 | |
US20210004171A1 (en) | I/o request processing method and device | |
US10817376B2 (en) | RAID with heterogeneous combinations of segments | |
US20140189128A1 (en) | Cluster system with calculation and storage converged | |
CN107729536B (zh) | 一种数据存储方法和装置 | |
CN110096220B (zh) | 一种分布式存储系统、数据处理方法和存储节点 | |
CN109582213B (zh) | 数据重构方法及装置、数据存储系统 | |
US20180278685A1 (en) | Read Performance Enhancement by Enabling Read from Secondary in Highly Available Cluster Setup | |
CN105988727B (zh) | 一种基于raid的存储方法和存储装置 | |
CN111949210A (zh) | 分布式存储系统中元数据存储方法、系统及存储介质 | |
US11899533B2 (en) | Stripe reassembling method in storage system and stripe server | |
CN113448502B (zh) | 分布式存储系统和存储控制方法 | |
US10860224B2 (en) | Method and system for delivering message in storage system | |
CN110325958B (zh) | 分布式块存储系统中数据存储方法、装置及计算机可读存储介质 | |
US11775194B2 (en) | Data storage method and apparatus in distributed storage system, and computer program product | |
WO2020034695A1 (zh) | 数据存储方法、数据恢复方法、装置、设备及存储介质 | |
CN112783698A (zh) | 一种存储系统中的元数据的管理方法及装置 | |
US20210243082A1 (en) | Distributed computing system and resource allocation method | |
US11853163B2 (en) | Selective rebuild of interrupted devices in data storage device arrays | |
US20210311654A1 (en) | Distributed Storage System and Computer Program Product | |
EP4184306A1 (en) | Redundant array of independent disks card, command processing method, and storage device and system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20170726 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170801 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20171031 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20171114 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20171211 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6259868 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |