JP6275816B2 - 分散型データベースシステム用高速クラッシュ回復 - Google Patents
分散型データベースシステム用高速クラッシュ回復 Download PDFInfo
- Publication number
- JP6275816B2 JP6275816B2 JP2016501614A JP2016501614A JP6275816B2 JP 6275816 B2 JP6275816 B2 JP 6275816B2 JP 2016501614 A JP2016501614 A JP 2016501614A JP 2016501614 A JP2016501614 A JP 2016501614A JP 6275816 B2 JP6275816 B2 JP 6275816B2
- Authority
- JP
- Japan
- Prior art keywords
- database
- data
- storage
- page
- log records
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000011084 recovery Methods 0.000 title claims description 36
- 238000003860 storage Methods 0.000 claims description 457
- 238000000034 method Methods 0.000 claims description 118
- 230000008569 process Effects 0.000 claims description 40
- 230000004044 response Effects 0.000 claims description 34
- 230000015654 memory Effects 0.000 claims description 28
- 230000008859 change Effects 0.000 claims description 18
- 238000013500 data storage Methods 0.000 claims description 13
- 238000004587 chromatography analysis Methods 0.000 claims 1
- 238000007726 management method Methods 0.000 description 27
- 238000010586 diagram Methods 0.000 description 23
- 238000004581 coalescence Methods 0.000 description 22
- 238000004891 communication Methods 0.000 description 18
- 230000006870 function Effects 0.000 description 17
- 230000002085 persistent effect Effects 0.000 description 15
- 238000012545 processing Methods 0.000 description 13
- 238000005457 optimization Methods 0.000 description 11
- 238000001514 detection method Methods 0.000 description 9
- 238000013403 standard screening design Methods 0.000 description 9
- 238000012546 transfer Methods 0.000 description 7
- 230000004048 modification Effects 0.000 description 6
- 238000012986 modification Methods 0.000 description 6
- 238000013459 approach Methods 0.000 description 5
- 230000002093 peripheral effect Effects 0.000 description 5
- 239000007787 solid Substances 0.000 description 5
- 230000009471 action Effects 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 239000003292 glue Substances 0.000 description 4
- 230000001360 synchronised effect Effects 0.000 description 4
- 239000002253 acid Substances 0.000 description 3
- 238000009826 distribution Methods 0.000 description 3
- 238000013467 fragmentation Methods 0.000 description 3
- 238000006062 fragmentation reaction Methods 0.000 description 3
- 230000006855 networking Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000008520 organization Effects 0.000 description 3
- 230000000737 periodic effect Effects 0.000 description 3
- 230000010076 replication Effects 0.000 description 3
- 230000003362 replicative effect Effects 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 230000003111 delayed effect Effects 0.000 description 2
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 239000000835 fiber Substances 0.000 description 2
- 230000014759 maintenance of location Effects 0.000 description 2
- 239000003550 marker Substances 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 238000005192 partition Methods 0.000 description 2
- 235000008694 Humulus lupulus Nutrition 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 230000001174 ascending effect Effects 0.000 description 1
- 238000013475 authorization Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000013501 data transformation Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 238000012856 packing Methods 0.000 description 1
- 230000002688 persistence Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000009987 spinning Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/14—Error detection or correction of the data by redundancy in operation
- G06F11/1402—Saving, restoring, recovering or retrying
- G06F11/1471—Saving, restoring, recovering or retrying involving logging of persistent data for recovery
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/14—Error detection or correction of the data by redundancy in operation
- G06F11/1402—Saving, restoring, recovering or retrying
- G06F11/1446—Point-in-time backing up or restoration of persistent data
- G06F11/1458—Management of the backup or restore process
- G06F11/1464—Management of the backup or restore process for networked environments
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/14—Error detection or correction of the data by redundancy in operation
- G06F11/1402—Saving, restoring, recovering or retrying
- G06F11/1415—Saving, restoring, recovering or retrying at system level
- G06F11/1438—Restarting or rejuvenating
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/202—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
- G06F11/2023—Failover techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/2053—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
- G06F11/2094—Redundant storage or storage space
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2201/00—Indexing scheme relating to error detection, to error correction, and to monitoring
- G06F2201/80—Database-specific techniques
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Quality & Reliability (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
1.分散型ストレージシステムを実装する複数のストレージノードであって、分散型ストレージシステムがデータベースのためにログ構造化データストレージを実装するように構成され、複数のリドゥログレコードが複数のストレージノードでデータベースシステムから以前に受信されたことがあり、リドゥログレコードのそれぞれが複数のストレージノードの中でデータベースのために記憶されるデータに対する変更を記述する、複数のストレージノードと、
データベースシステムを実装するデータベースヘッドノードであって、
複数のストレージノードとの接続を確立する、及び
複数のストレージノードとの接続の確立時に、1つまたは複数のアクセス要求のためのデータベースへのアクセスを提供する
ための故障回復動作を実行するように構成される、データベースヘッドノードと、
を備えるシステム。
2.複数のリドゥログレコードをリプレイすることなく、アクセスがデータベースに提供される、節1に記載のシステム。
3.データベースシステムヘッドノードが、
データベースに対するアクセス要求を受信する、
受信されたアクセス要求に基づいて、ストレージノードに記憶されるデータページの現在状態に対する要求を複数のストレージノードの内の1つに送信する、及び
複数のリドゥログレコードの1つまたは複数が、ストレージノードでデータページをその現在の状態で生成するためにデータページの以前に保存された状態に適用された、要求されたデータページをその現在の状態でストレージノードから受信する、
ようにさらに構成される、節2に記載のシステム。
4.複数のストレージノードに送信される複数のリドゥログレコードの少なくともいくつかがシステムトランザクションを含み、複数のストレージノードの内の1つのストレージノードが、
システムトランザクションが不完全であると決定する、及び
少なくともいくつかのリドゥログレコードによって変更されるデータページの現在の状態を生成するときに適用されないとして複数のリドゥログレコードの少なくともいくつかを識別する
ように構成される、節1に記載のシステム。
5.複数のストレージノードに送信される複数のリドゥログレコードの少なくともいくつかがシステムトランザクションを含み、データベースシステムヘッドノードが、
システムトランザクションが不完全であると決定する、
少なくともいくつかのリドゥログレコードによって変更されるデータページの現在の状態を生成するときに適用されないとして複数のリドゥログレコードの少なくともいくつかを識別する、及び
複数のストレージノードの1つまたは複数に、適用されない、複数のリドゥログレコードの識別された少なくともいくつかを示す通知を送信する
ようにさらに構成される、節1に記載のシステム。
6.データベースヘッドノードを実装する1台または複数のコンピューティング装置によって、
データベースヘッドノード故障からの回復時に、
データベースのためのデータを記憶する分散型ストレージシステムを実装する複数のストレージノードの1つまたは複数のストレージノードと接続を確立することであって、分散型ストレージシステムが、データベースのためにログ構造化データストレージを実装するように構成され、複数のリドゥログレコードが複数のストレージノードで以前に受信されたことがあり、リドゥログレコードのそれぞれが、データベースのために記憶されたデータに対する変更を、それが受信されたそれぞれのストレージノードで記述する、接続を確立することと、
複数のストレージノードの1つまたは複数のストレージノードとの接続の確立時に、アクセスのためにデータベースを利用可能にすることと、
を実行することを、
含む方法。
7.データベースに対するアクセス要求を受信することと、
アクセス要求を受信することに応えて、1つまたは複数のストレージノードからデータベースのためのデータの部分を記憶する1つまたは複数のデータページの現在の状態を要求することと、
アクセス要求にサービスを提供するためにデータベースのためのデータの部分を記憶する1つまたは複数のストレージノードから1つまたは複数のデータページの現在の状態を受信することと、
をさらに含む、節6に記載の方法。
8.受信されたデータベースのためのデータの部分を記憶する1つまたは複数のデータページの少なくとも1つの現在の状態が、1つまたは複数のストレージノードの1つが、少なくとも1つのデータページの以前に記憶されたバージョンまで複数のリドゥログレコードの1つまたは複数をリプレイすることによって生成される、節7に記載の方法。
9.受信されたデータベースのためのデータの部分を記憶する1つまたは複数のデータページの少なくとも1つからの異なるデータページの現在の状態が、データページの以前に記憶されたバージョンまで複数のリドゥログレコードの1つまたは複数をリプレイすることなく、1つまたは複数のストレージノードの内の1つによって送信される、節8に記載の方法。
10.データベースヘッドノードが、複数のストレージノードにリドゥログレコードとして送信される変更をアンドゥするために複数のアンドゥログレコードを維持し、方法が、
1つまたは複数のストレージノードから受信される1つまたは複数のデータページの1つが不完全なユーザートランザクションによって影響を及ぼされると決定することであって、ユーザートランザクションが、1つのデータページを含んだ1つまたは複数のストレージノードに記憶されるデータに対して変更を向ける、決定することと、
ユーザートランザクションによってデータページに向けられた変更をアンドゥするためにデータページに1つまたは複数のアンドゥログレコードを適用することと、
をさらに含む、節7に記載の方法。
11.データベースヘッドノードが、ユーザートランザクションを含んだ複数の不完全なユーザートランザクションを示すトランザクションテーブルを維持し、方法が、
トランザクションテーブルに少なくとも部分的に基づいて、複数の不完全なユーザートランザクションの少なくとも1つによって影響を及ぼされる1つまたは複数の追加のデータページを決定することと、
1つまたは複数のストレージノードから1つまたは複数の追加のデータページの現在の状態を要求することと、
1つまたは複数の追加のデータページを受信することに応えて、少なくとも1つの不完全なユーザートランザクションによって1つまたは複数の追加のデータページに向かって向けられる変更をアンドゥするために、1つまたは複数の追加のデータページに追加の1つまたは複数のアンドゥログレコードを適用することと、
をさらに含む、節10に記載の方法。
12.1つまたは複数の追加のデータページを該決定すること、1つまたは複数の追加のデータページを該要求すること、及び1つまたは複数の追加のデータページに追加の1つまたは複数のアンドゥログレコードを該適用することが、データベースヘッドノードでバックグラウンドプロセスの一部として実行され、アクセス要求を該受信すること、1つまたは複数のデータページの現在の状態を該要求すること、及び1つまたは複数のデータページの現在の状態を該受信することがフォアグラウンドプロセスの一部として実行される、節11に記載の方法。
13.データベースヘッドノード故障からの回復時に、
アクセスのためにデータベースを利用可能にする前に、データベースのために複数のストレージノードに記憶されたデータの、以前に記録されたスナップショットに対応する状態への復元に対する要求を複数のストレージノードに送信することであって、該復元が複数のリドゥログの1つまたは複数をデータの以前のバージョンに適用することを含む、送信することと、
をさらに含む、節6に記載の方法。
14.データベースが複数のリドゥログレコードをリプレイすることなくアクセスのために利用可能にされる、節6に記載の方法。
15.1台または複数のコンピューティング装置による実行時に、
データベースヘッドノード故障からの回復時に、
データベースのためのデータを記憶する分散型ストレージシステムを実装する複数のストレージノードの1つまたは複数のストレージノードとの接続を確立することであって、分散型ストレージシステムがデータベースのためにログ構造化データストレージを実装するように構成され、複数のリドゥログレコードが複数のストレージノードで以前に受信されたことがあり、リドゥログレコードのそれぞれが、データベースのために記憶されたデータに対する変更を、それが受信されたそれぞれのストレージノードで記述する、接続を確立すること、及び
複数のストレージノードの1つまたは複数のストレージノードとの接続の確立時に、1つまたは複数のアクセス要求のためにデータベースへのアクセスを提供すること、
を実装するデータベースシステムのデータベースヘッドノードを実装するプログラム命令を記憶する非一過性のコンピュータ可読記憶媒体。
16.複数のストレージノードで以前に受信された複数のリドゥログレコードが、該データベースヘッドノードとは異なるデータベースヘッドノードから受信された、節15に記載の非一過性のコンピュータ可読記憶媒体。
17.複数のリドゥログレコードをリプレイすることなく、アクセスがデータベースに提供される、節15に記載の非一過性のコンピュータ可読記憶媒体。
18.データベースシステムヘッドノードが、
データベースに対するアクセス要求を受信することと、
アクセス要求を受信することに応えて、1つまたは複数のストレージノードからデータベースのためのデータの部分を記憶する1つまたは複数のデータページの現在の状態を要求することと、
アクセス要求にサービスを提供するためにデータベースのためのデータの部分を記憶する1つまたは複数のデータページの現在の状態を受信することであって、1つまたは複数の受信されたデータページの少なくとも1つの現在の状態が、1つまたは複数のストレージノードの1つが、少なくとも1つのデータページの以前に記憶されたバージョンまで複数のリドゥログレコードの1つまたは複数をリプレイすることによって生成される、受信することと、
をさらに実装する、節15に記載の非一過性のコンピュータ可読記憶媒体。
19.受信されたアクセス要求が読取り要求または書込み要求である、節18に記載の非一過性のコンピュータ可読記憶媒体。
20.データベースヘッドノードが、リドゥログレコードとして複数のストレージノードに送信された変更をアンドゥするために、複数のアンドゥログレコードを維持し、データベースヘッドノードが、
1つまたは複数のストレージノードから受信される1つまたは複数のデータページの1つが不完全なユーザートランザクションによって影響を及ぼされると決定することであって、ユーザートランザクションが1つのデータページを含んだ1つまたは複数のストレージノードに記憶されるデータに対して変更を向ける、決定することと、
ユーザートランザクションによってデータページに向けられた変更をアンドゥするためにデータページに1つまたは複数のアンドゥログレコードを適用することと、
をさらに実装する、節18に記載の非一過性のコンピュータ可読記憶媒体。
21.データベースヘッドノードが、ユーザートランザクションを含んだ複数の不完全なユーザートランザクションを示すトランザクションテーブルを維持し、データベースシステムヘッドノードが、
トランザクションテーブルに少なくとも部分的に基づいて、複数の不完全なユーザートランザクションの少なくとも1つによって影響を及ぼされる1つまたは複数の追加のデータページを決定することと、
1つまたは複数のストレージノードから1つまたは複数の追加のデータページの現在の状態を要求することと、
1つまたは複数の追加のデータページを受信することに応えて、少なくとも1つの不完全なユーザートランザクションによって1つまたは複数の追加のデータページに向かって向けられる変更をアンドゥするために、1つまたは複数の追加のデータページに追加の1つまたは複数のアンドゥログレコードを適用することと、
をバックグラウンドプロセスとして実行すること
をさらに実装する、節20に記載の非一過性のコンピュータ可読記憶媒体。
Claims (15)
- 分散型ストレージシステムを実装する複数のストレージノードであって、前記分散型ストレージシステムがデータベースのためにログ構造化データストレージを実装するように構成され、複数のリドゥログレコードが前記複数のストレージノードでデータベースシステムから以前に受信されたことがあり、前記リドゥログレコードのそれぞれが前記複数のストレージノードの中で前記データベースのために記憶されるデータに対する変更を記述する、複数のストレージノードと、
前記データベースシステムを実装するデータベースヘッドノードであって、
前記複数のストレージノードとの接続を確立する、及び
前記複数のストレージノードとの前記接続の確立時に、1つまたは複数のアクセス要求のための前記データベースへのアクセスを、前記1つまたは複数のアクセス要求を処理するために前記データベースの少なくとも一部分の現在の状態が前記ストレージノードにおいて生成されるべきかどうかを決定する前に、前記データベースシステムのクライアントに提供する
ための故障回復動作を実行するように構成される、前記データベースヘッドノードと、
を備えるシステム。 - 前記複数のリドゥログレコードをリプレイすることなく、アクセスが前記データベースに提供される、請求項1に記載の前記システム。
- 前記データベースヘッドノードが、
前記データベースに対するアクセス要求を受信する、
前記受信されたアクセス要求に基づいて、前記ストレージノードに記憶されるデータページの現在状態に対する要求を前記複数のストレージノードの内の1つに送信する、及び
前記複数のリドゥログレコードの1つまたは複数が、前記ストレージノードで前記データページをその現在の状態で生成するために前記データページの以前に保存された状態に適用された、前記要求されたデータページをその現在の状態で前記ストレージノードから受信する、
ようにさらに構成される、請求項2に記載の前記システム。 - 前記複数のストレージノードに送信される前記複数のリドゥログレコードの少なくともいくつかがシステムトランザクションを備え、前記複数のストレージノードの内の1つのストレージノードが、
前記システムトランザクションが不完全であると決定する、及び
前記少なくともいくつかのリドゥログレコードによって変更されるデータページの現在の状態を生成するときに適用されないとして前記複数のリドゥログレコードの前記少なくともいくつかを識別する
ように構成される、請求項1に記載の前記システム。 - 前記複数のストレージノードに送信される前記複数のリドゥログレコードの少なくともいくつかがシステムトランザクションを含み、前記データベースヘッドノードが、
前記システムトランザクションが不完全であると決定する、
前記少なくともいくつかのリドゥログレコードによって変更されるデータページの現在の状態を生成するときに適用されないとして前記複数のリドゥログレコードの少なくともいくつかを識別する、及び
前記複数のストレージノードの1つまたは複数に、適用されない、前記複数のリドゥログレコードの前記識別された少なくともいくつかを示す通知を送信する
ようにさらに構成される、請求項1に記載の前記システム。 - データベースヘッドノードを実装する1台または複数のコンピューティング装置によって、
データベースヘッドノード故障からの回復時に、
データベースのためのデータを記憶する分散型ストレージシステムを実装する複数のストレージノードの1つまたは複数のストレージノードと接続を確立することであって、前記分散型ストレージシステムが、前記データベースのためにログ構造化データストレージを実装するように構成され、複数のリドゥログレコードが前記複数のストレージノードで以前に受信されたことがあり、前記リドゥログレコードのそれぞれが、前記データベースのために記憶されたデータに対する変更を、それが受信された前記それぞれのストレージノードで記述する、接続を確立することと、
前記複数のストレージノードの前記1つまたは複数のストレージノードとの前記接続の確立時に、1つまたは複数のアクセス要求を処理するために前記データベースの少なくとも一部分の現在の状態が前記ストレージノードにおいて生成されるべきかどうかを決定する前に、前記データベースのクライアントが前記1つまたは複数のアクセス要求を処理するために前記データベースを利用可能にすることと、
を実行することを、
含む方法。 - 前記データベースに対するアクセス要求を受信することと、
前記アクセス要求を受信することに応えて、前記1つまたは複数のストレージノードから前記データベースのための前記データの部分を記憶する1つまたは複数のデータページの現在の状態を要求することと、
前記アクセス要求にサービスを提供するために前記データベースのための前記データの前記部分を記憶する前記1つまたは複数のストレージノードから前記1つまたは複数のデータページの現在の状態を受信することと、
をさらに含む、請求項6に記載の前記方法。 - 受信された前記データベースのための前記データの前記部分を記憶する前記1つまたは複数のデータページの少なくとも1つの前記現在の状態が、前記1つまたは複数のストレージノードの1つが、前記少なくとも1つのデータページの以前に記憶されたバージョンまで前記複数のリドゥログレコードの1つまたは複数をリプレイすることによって生成される、請求項7に記載の前記方法。
- 受信された前記データベースのための前記データの前記部分を記憶する前記1つまたは複数のデータページの前記少なくとも1つからの異なるデータページの前記現在の状態が、前記データページの以前に記憶されたバージョンまで前記複数のリドゥログレコードの1つまたは複数をリプレイすることなく、前記1つまたは複数のストレージノードの内の1つによって送信される、請求項8に記載の前記方法。
- 前記データベースヘッドノードが、前記複数のストレージノードにリドゥログレコードとして送信される変更をアンドゥするために複数のアンドゥログレコードを維持し、方法が、
前記1つまたは複数のストレージノードから受信される前記1つまたは複数のデータページの1つが不完全なユーザートランザクションによって影響を及ぼされると決定することであって、前記ユーザートランザクションが、前記1つのデータページを含んだ前記1つまたは複数のストレージノードに記憶される前記データに対して変更を向ける、決定することと、
前記ユーザートランザクションによって前記データページに向けられた変更をアンドゥするために前記データページに1つまたは複数のアンドゥログレコードを適用することと、
をさらに含む、請求項7に記載の前記方法。 - 前記データベースヘッドノードが、前記ユーザートランザクションを含んだ複数の不完全なユーザートランザクションを示すトランザクションテーブルを維持し、前記方法が、
前記トランザクションテーブルに少なくとも部分的に基づいて、前記複数の不完全なユーザートランザクションの少なくとも1つによって影響を及ぼされる1つまたは複数の追加のデータページを決定することと、
前記1つまたは複数のストレージノードから1つまたは複数の追加のデータページの現在の状態を要求することと、
前記1つまたは複数の追加のデータページを受信することに応えて、前記少なくとも1つの不完全なユーザートランザクションによって前記1つまたは複数の追加のデータページに向かって向けられる変更をアンドゥするために、前記1つまたは複数の追加のデータページに追加の1つまたは複数のアンドゥログレコードを適用することと、
をさらに含む、請求項10に記載の前記方法。 - 前記1つまたは複数の追加のデータページを前記決定すること、前記1つまたは複数の追加のデータページを前記要求すること、及び前記1つまたは複数の追加のデータページに前記追加の1つまたは複数のアンドゥログレコードを前記適用することが、前記データベースヘッドノードでバックグラウンドプロセスの一部として実行され、前記アクセス要求を前記受信すること、前記1つまたは複数のデータページの前記現在の状態を前記要求すること、及び前記1つまたは複数のデータページの前記現在の状態を前記受信することがフォアグラウンドプロセスの一部として実行される、請求項11に記載の前記方法。
- 前記データベースヘッドノード故障からの回復時に、
アクセスのために前記データベースを利用可能にする前に、前記データベースのための前記複数のストレージノードに記憶された前記データの、以前に記録されたスナップショットに対応する状態への復元に対する要求を前記複数のストレージノードに送信することであって、前記復元が前記複数のリドゥログレコードの1つまたは複数を前記データの以前のバージョンに適用することを含む、送信することと、
をさらに含む、請求項6に記載の前記方法。 - 前記データベースが前記複数のリドゥログレコードをリプレイすることなくアクセスのために利用可能にされる、請求項6に記載の前記方法。
- 1台または複数のプロセッサと、
1つまたは複数のメモリであって、前記1台または複数のプロセッサによる実行時に、
データベースヘッドノード故障からの回復時に、
データベースのためのデータを記憶する分散型ストレージシステムを実装する複数のストレージノードの1つまたは複数のストレージノードとの接続を確立することであって、前記分散型ストレージシステムが前記データベースのためにログ構造化データストレージを実装するように構成され、複数のリドゥログレコードが前記複数のストレージノードで以前に受信されたことがあり、前記リドゥログレコードのそれぞれが、前記データベースのために記憶されたデータに対する変更を、それが受信された前記それぞれのストレージノードで記述する、接続を確立すること、及び
前記複数のストレージノードの前記1つまたは複数のストレージノードとの前記接続の確立時に、1つまたは複数のアクセス要求のために前記データベースへのアクセスを、前記1つまたは複数のアクセス要求を処理するために前記データベースの少なくとも一部分の現在の状態が前記ストレージノードにおいて生成されるべきかどうかを決定する前に、データベースシステムのクライアントに提供すること、
を実装する前記データベースシステムのデータベースヘッドノードを実装するプログラム命令を記憶するメモリと、
を備えるシステム。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201361799609P | 2013-03-15 | 2013-03-15 | |
US61/799,609 | 2013-03-15 | ||
US14/201,505 | 2014-03-07 | ||
US14/201,505 US11030055B2 (en) | 2013-03-15 | 2014-03-07 | Fast crash recovery for distributed database systems |
PCT/US2014/024708 WO2014150986A1 (en) | 2013-03-15 | 2014-03-12 | Fast crash recovery for distributed database systems |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018001662A Division JP6522812B2 (ja) | 2013-03-15 | 2018-01-10 | 分散型データベースシステム用高速クラッシュ回復 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016515271A JP2016515271A (ja) | 2016-05-26 |
JP6275816B2 true JP6275816B2 (ja) | 2018-02-07 |
Family
ID=51532996
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016501614A Active JP6275816B2 (ja) | 2013-03-15 | 2014-03-12 | 分散型データベースシステム用高速クラッシュ回復 |
JP2018001662A Active JP6522812B2 (ja) | 2013-03-15 | 2018-01-10 | 分散型データベースシステム用高速クラッシュ回復 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018001662A Active JP6522812B2 (ja) | 2013-03-15 | 2018-01-10 | 分散型データベースシステム用高速クラッシュ回復 |
Country Status (8)
Country | Link |
---|---|
US (1) | US11030055B2 (ja) |
EP (2) | EP2973060B1 (ja) |
JP (2) | JP6275816B2 (ja) |
KR (2) | KR101914019B1 (ja) |
CN (2) | CN105190622B (ja) |
AU (2) | AU2014235433C1 (ja) |
CA (1) | CA2906511C (ja) |
WO (1) | WO2014150986A1 (ja) |
Families Citing this family (91)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9514007B2 (en) | 2013-03-15 | 2016-12-06 | Amazon Technologies, Inc. | Database system with database engine and separate distributed storage service |
US9507843B1 (en) * | 2013-09-20 | 2016-11-29 | Amazon Technologies, Inc. | Efficient replication of distributed storage changes for read-only nodes of a distributed database |
US9280591B1 (en) * | 2013-09-20 | 2016-03-08 | Amazon Technologies, Inc. | Efficient replication of system transactions for read-only nodes of a distributed database |
US9459970B2 (en) | 2014-05-19 | 2016-10-04 | Netapp, Inc. | Performance during playback of logged data storage operations |
US10082980B1 (en) * | 2014-06-20 | 2018-09-25 | EMC IP Holding Company LLC | Migration of snapshot in replication system using a log |
US9558078B2 (en) | 2014-10-28 | 2017-01-31 | Microsoft Technology Licensing, Llc | Point in time database restore from storage snapshots |
US9779104B2 (en) | 2014-11-25 | 2017-10-03 | Sap Se | Efficient database undo / redo logging |
US9785516B2 (en) * | 2014-11-25 | 2017-10-10 | Sap Se | Method and system to remove a service from a distributed database system |
US10474648B2 (en) | 2014-11-25 | 2019-11-12 | Sap Se | Migration of unified table metadata graph nodes |
US10558495B2 (en) | 2014-11-25 | 2020-02-11 | Sap Se | Variable sized database dictionary block encoding |
US10552402B2 (en) | 2014-11-25 | 2020-02-04 | Amarnadh Sai Eluri | Database lockless index for accessing multi-version concurrency control data |
US10255309B2 (en) | 2014-11-25 | 2019-04-09 | Sap Se | Versioned insert only hash table for in-memory columnar stores |
US9965504B2 (en) | 2014-11-25 | 2018-05-08 | Sap Se | Transient and persistent representation of a unified table metadata graph |
US9513811B2 (en) | 2014-11-25 | 2016-12-06 | Sap Se | Materializing data from an in-memory array to an on-disk page structure |
US10042552B2 (en) | 2014-11-25 | 2018-08-07 | Sap Se | N-bit compressed versioned column data array for in-memory columnar stores |
US9824134B2 (en) | 2014-11-25 | 2017-11-21 | Sap Se | Database system with transaction control block index |
US10127260B2 (en) | 2014-11-25 | 2018-11-13 | Sap Se | In-memory database system providing lockless read and write operations for OLAP and OLTP transactions |
US9875024B2 (en) * | 2014-11-25 | 2018-01-23 | Sap Se | Efficient block-level space allocation for multi-version concurrency control data |
US10725987B2 (en) | 2014-11-25 | 2020-07-28 | Sap Se | Forced ordering of a dictionary storing row identifier values |
US9792318B2 (en) | 2014-11-25 | 2017-10-17 | Sap Se | Supporting cursor snapshot semantics |
US9798759B2 (en) | 2014-11-25 | 2017-10-24 | Sap Se | Delegation of database post-commit processing |
US9891831B2 (en) | 2014-11-25 | 2018-02-13 | Sap Se | Dual data storage using an in-memory array and an on-disk page structure |
US10296611B2 (en) | 2014-11-25 | 2019-05-21 | David Wein | Optimized rollover processes to accommodate a change in value identifier bit size and related system reload processes |
US9898551B2 (en) | 2014-11-25 | 2018-02-20 | Sap Se | Fast row to page lookup of data table using capacity index |
US9292332B1 (en) | 2014-12-11 | 2016-03-22 | Amazon Technologies, Inc. | Live updates for virtual machine monitor |
US9535798B1 (en) * | 2014-12-19 | 2017-01-03 | Amazon Technologies, Inc. | Systems and methods for maintaining virtual component checkpoints on an offload device |
US9804935B1 (en) * | 2015-01-26 | 2017-10-31 | Intel Corporation | Methods for repairing a corrupted database to a new, correct state by selectively using redo and undo operations |
US10592494B2 (en) | 2015-04-14 | 2020-03-17 | Microsoft Technology Licensing, Llc | Collection record for overlapping data stream collections |
US9959137B2 (en) | 2015-04-14 | 2018-05-01 | Microsoft Technology Licensing, Llc | Transaction redo using skip element for object |
US9766929B2 (en) * | 2015-04-14 | 2017-09-19 | Microsoft Technology Licensing, Llc | Processing of data stream collection record sequence |
US10031814B2 (en) * | 2015-04-14 | 2018-07-24 | Microsoft Technology Licensing, Llc | Collection record location as log tail beginning |
US10102251B2 (en) | 2015-04-14 | 2018-10-16 | Microsoft Technology Licensing, Llc | Lockless open collection data structure |
US10133768B2 (en) | 2015-04-14 | 2018-11-20 | Microsoft Technology Licensing, Llc | Latest external dependee entity in transaction record |
CN106708830B (zh) * | 2015-08-03 | 2020-08-14 | 四川效率源信息安全技术股份有限公司 | 一种基于大型数据库的数据恢复方法 |
US10083089B2 (en) | 2015-09-07 | 2018-09-25 | International Business Machines Corporation | Efficient index recovery in log-structured object stores |
US10083082B2 (en) | 2015-09-07 | 2018-09-25 | International Business Machines Corporation | Efficient index checkpointing in log-structured object stores |
US9892004B2 (en) * | 2015-09-18 | 2018-02-13 | Vmware, Inc. | Space efficient persistence of an in-memory table |
US11320587B2 (en) * | 2015-10-23 | 2022-05-03 | Lionix International Bv | Planar lightwave circuits (PLCs) exhibiting controllable transmissivity / reflectivity |
US10007586B2 (en) * | 2016-01-08 | 2018-06-26 | Microsoft Technology Licensing, Llc | Deferred server recovery in computing systems |
US9952931B2 (en) | 2016-01-19 | 2018-04-24 | Microsoft Technology Licensing, Llc | Versioned records management using restart era |
US10296418B2 (en) | 2016-01-19 | 2019-05-21 | Microsoft Technology Licensing, Llc | Versioned records management using restart era |
KR101758558B1 (ko) * | 2016-03-29 | 2017-07-26 | 엘에스산전 주식회사 | 에너지 관리 서버 및 그를 갖는 에너지 관리 시스템 |
CN105868398B (zh) * | 2016-04-20 | 2019-04-26 | 国网福建省电力有限公司 | 一种基于Fat-B树的分布式文件系统低开销数据传输方法 |
US10944823B2 (en) * | 2016-06-28 | 2021-03-09 | At&T Intellectual Property I, L.P. | Highly redundant and scalable storage area network architecture |
US11567972B1 (en) * | 2016-06-30 | 2023-01-31 | Amazon Technologies, Inc. | Tree-based format for data storage |
CN106682070B (zh) * | 2016-11-14 | 2019-10-29 | 浙江浙大中控信息技术有限公司 | 一种历史平均值管理系统及管理方法 |
CN108228678B (zh) * | 2016-12-22 | 2020-10-16 | 华为技术有限公司 | 一种多副本数据恢复方法及装置 |
US10613935B2 (en) * | 2017-01-31 | 2020-04-07 | Acronis International Gmbh | System and method for supporting integrity of data storage with erasure coding |
US10909143B1 (en) * | 2017-04-14 | 2021-02-02 | Amazon Technologies, Inc. | Shared pages for database copies |
US11138076B2 (en) * | 2017-06-30 | 2021-10-05 | Redis Ltd. | Methods, systems, and media for controlling append-only file rewrites |
US11347774B2 (en) * | 2017-08-01 | 2022-05-31 | Salesforce.Com, Inc. | High availability database through distributed store |
CN107844542A (zh) * | 2017-10-26 | 2018-03-27 | 山东浪潮通软信息科技有限公司 | 一种分布式文件存储方法及装置 |
CN110018986B (zh) * | 2017-11-08 | 2022-10-28 | 阿里巴巴集团控股有限公司 | 异常快照识别方法及装置 |
US10042879B1 (en) * | 2017-11-13 | 2018-08-07 | Lendingclub Corporation | Techniques for dynamically enriching and propagating a correlation context |
US11354301B2 (en) | 2017-11-13 | 2022-06-07 | LendingClub Bank, National Association | Multi-system operation audit log |
US10725983B2 (en) * | 2017-12-29 | 2020-07-28 | Huawei Technologies Co., Ltd. | Systems and methods for database management using append-only storage devices |
CN110058960B (zh) * | 2018-01-18 | 2023-05-16 | 伊姆西Ip控股有限责任公司 | 用于管理存储系统的方法、设备和计算机程序产品 |
KR102049417B1 (ko) * | 2018-03-28 | 2019-11-27 | 주식회사 리얼타임테크 | Nvdimm을 이용한 인-메모리 데이터베이스 기반의 데이터 저장 및 복원 방법 |
US10223723B1 (en) * | 2018-05-04 | 2019-03-05 | Capital One Services, Llc | Managing transaction state data |
CN108920375A (zh) * | 2018-07-11 | 2018-11-30 | 郑州云海信息技术有限公司 | 一种软件压力测试方法、装置、设备及存储介质 |
US20200034472A1 (en) * | 2018-07-27 | 2020-01-30 | Futurewei Technologies, Inc. | Asynchronous cache coherency for mvcc based database systems |
US10728255B2 (en) * | 2018-09-24 | 2020-07-28 | Nutanix, Inc. | System and method for protection of entities across availability zones |
CN110955556B (zh) * | 2018-09-27 | 2023-05-02 | 阿里云计算有限公司 | 数据库恢复方法及装置、存储介质、数据库系统 |
US10949548B2 (en) * | 2018-10-18 | 2021-03-16 | Verizon Patent And Licensing Inc. | Systems and methods for providing multi-node resiliency for blockchain peers |
KR102085608B1 (ko) * | 2018-12-21 | 2020-03-06 | 주식회사 티맥스데이터 | 복구 서버 및 컴퓨터 프로그램 |
US10628242B1 (en) | 2018-12-24 | 2020-04-21 | Lendingclub Corporation | Message stream processor microbatching |
CN109739689B (zh) * | 2018-12-25 | 2023-03-14 | 四川效率源信息安全技术股份有限公司 | 一种雕复SQL Server数据库文件的方法 |
KR102165860B1 (ko) * | 2018-12-31 | 2020-10-14 | 성균관대학교산학협력단 | 슬로티드 페이지의 더블 헤더 로깅 방법 및 데이터베이스 장치 |
WO2020179942A1 (ko) * | 2019-03-05 | 2020-09-10 | 주식회사 헤븐트리 | 공유 데이터베이스를 기반으로 하는 분산 처리 방법 |
EP3944101B1 (en) * | 2019-03-22 | 2024-01-10 | Fujitsu Limited | Information processing program, information processing method, and information processing device |
US11194676B2 (en) * | 2019-03-26 | 2021-12-07 | International Business Machines Corporation | Data synchronization in high availability storage environments |
US11170029B2 (en) | 2019-05-31 | 2021-11-09 | Lendingclub Corporation | Multi-user cross-device tracking |
CN111367804B (zh) * | 2020-03-04 | 2020-09-29 | 广州锦行网络科技有限公司 | 基于云计算及网络编程实现前端协作调试的方法 |
US11561864B1 (en) | 2020-03-26 | 2023-01-24 | Amazon Technologies, Inc. | Creating database clones at a specified point-in-time |
US11556545B2 (en) * | 2020-07-24 | 2023-01-17 | Sap Se | Disk based hybrid transactional analytical processing system |
US12038919B2 (en) * | 2020-08-20 | 2024-07-16 | Sap Se | System models that support the traceability of activities |
CN111813607B (zh) * | 2020-09-08 | 2021-03-23 | 北京优炫软件股份有限公司 | 一种基于内存融合的数据库集群恢复日志处理系统 |
US11593229B2 (en) * | 2020-09-23 | 2023-02-28 | Netapp, Inc. | Data protection methods and systems for a networked storage environment |
CN112214171B (zh) * | 2020-10-12 | 2022-08-05 | 华东师范大学 | 一种面向SQLite数据库的非易失性内存缓冲区设计方法 |
CN112433875B (zh) * | 2020-11-23 | 2024-07-16 | 京东科技控股股份有限公司 | 基于中间件的数据库运行方法、装置及终端设备 |
CN112527767B (zh) * | 2020-12-03 | 2024-05-10 | 许继集团有限公司 | 一种分布式数据库重启后多region表完整修复的方法及系统 |
CN112910981B (zh) * | 2021-01-27 | 2022-07-26 | 联想(北京)有限公司 | 一种控制方法及装置 |
US11226878B1 (en) | 2021-03-02 | 2022-01-18 | International Business Machines Corporation | Accelerator-based database recovery |
US11182260B1 (en) | 2021-03-02 | 2021-11-23 | International Business Machines Corporation | Avoiding recovery log archive access in database accelerator environments |
US11797570B2 (en) | 2021-03-19 | 2023-10-24 | International Business Machines Corporation | Asynchronous persistency of replicated data changes in a database accelerator |
DE112022000767T5 (de) * | 2021-03-19 | 2023-11-09 | International Business Machines Corporation | Asynchrone persistenz von replizierten datenänderungen in einemdatenbankbeschleuniger |
US11500733B2 (en) | 2021-03-19 | 2022-11-15 | International Business Machines Corporation | Volatile database caching in a database accelerator |
CN113448962B (zh) * | 2021-06-02 | 2022-10-28 | 中科驭数(北京)科技有限公司 | 数据库数据管理方法和装置 |
KR20230034005A (ko) | 2021-09-02 | 2023-03-09 | 주식회사 나눔기술 | 엣지 클라우드 컴퓨팅 환경에서 멀티 클러스터 스냅샷 생성 및 복구 장치 |
EP4394607A1 (en) | 2021-11-10 | 2024-07-03 | Samsung Electronics Co., Ltd. | Method for preserving data in initialization situation of electronic device and electronic device thereof |
US12007842B2 (en) * | 2022-10-06 | 2024-06-11 | Salesforce, Inc. | Database node soft restart |
Family Cites Families (117)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH03130842A (ja) | 1989-10-17 | 1991-06-04 | Toshiba Corp | データベースシステムの同時実行制御装置 |
DE69126066T2 (de) | 1990-06-29 | 1997-09-25 | Oracle Corp | Verfahren und Gerät zur Optimierung des Logbuchaufhebungsgebrauchs |
US5280612A (en) | 1991-11-26 | 1994-01-18 | International Business Machines Corporation | Multiple version database concurrency control system |
US5452445A (en) | 1992-04-30 | 1995-09-19 | Oracle Corporation | Two-pass multi-version read consistency |
US5530855A (en) * | 1992-10-13 | 1996-06-25 | International Business Machines Corporation | Replicating a database by the sequential application of hierarchically sorted log records |
US5530850A (en) | 1993-10-25 | 1996-06-25 | International Business Machines Corporation | Data storage library array with log-structured file system which allows simultaneous write and garbage collection |
EP0675451A3 (en) | 1994-03-30 | 1996-12-04 | Siemens Stromberg Carlson | Distributed database architecture and system for managing a distributed database for development in an open network. |
US5870758A (en) | 1996-03-11 | 1999-02-09 | Oracle Corporation | Method and apparatus for providing isolation levels in a database system |
US6041423A (en) | 1996-11-08 | 2000-03-21 | Oracle Corporation | Method and apparatus for using undo/redo logging to perform asynchronous updates of parity and data pages in a redundant array data storage environment |
JPH10254748A (ja) | 1997-03-11 | 1998-09-25 | Fujitsu Ltd | 分散共有メモリ一貫性最適制御方法 |
US5907848A (en) | 1997-03-14 | 1999-05-25 | Lakeview Technology, Inc. | Method and system for defining transactions from a database log |
US7031987B2 (en) | 1997-05-30 | 2006-04-18 | Oracle International Corporation | Integrating tablespaces with different block sizes |
US5951695A (en) * | 1997-07-25 | 1999-09-14 | Hewlett-Packard Company | Fast database failover |
US6240413B1 (en) | 1997-12-22 | 2001-05-29 | Sun Microsystems, Inc. | Fine-grained consistency mechanism for optimistic concurrency control using lock groups |
US7930278B2 (en) * | 1998-02-13 | 2011-04-19 | Oracle International Corporation | Methods to perform disk writes in a distributed shared disk system needing consistency across failures |
US6233585B1 (en) | 1998-03-12 | 2001-05-15 | Crossworlds Software, Inc. | Isolation levels and compensating transactions in an information system |
US6205449B1 (en) * | 1998-03-20 | 2001-03-20 | Lucent Technologies, Inc. | System and method for providing hot spare redundancy and recovery for a very large database management system |
US6317754B1 (en) | 1998-07-03 | 2001-11-13 | Mitsubishi Electric Research Laboratories, Inc | System for user control of version /Synchronization in mobile computing |
JP3450786B2 (ja) | 1999-03-05 | 2003-09-29 | ミツビシ・エレクトリック・リサーチ・ラボラトリーズ・インコーポレイテッド | 異なるデータファイルを調停する方法 |
JP3763992B2 (ja) | 1999-03-30 | 2006-04-05 | 富士通株式会社 | データ処理装置及び記録媒体 |
US6658589B1 (en) | 1999-12-20 | 2003-12-02 | Emc Corporation | System and method for backup a parallel server data storage system |
US6615219B1 (en) | 1999-12-29 | 2003-09-02 | Unisys Corporation | Database management system and method for databases having large objects |
US6631374B1 (en) | 2000-09-29 | 2003-10-07 | Oracle Corp. | System and method for providing fine-grained temporal database access |
CA2436517C (en) | 2000-10-09 | 2011-09-20 | Maximum Availability Limited | Method and apparatus for data processing |
US20020107835A1 (en) | 2001-02-08 | 2002-08-08 | Coram Michael T. | System and method for adaptive result set caching |
CN100487675C (zh) | 2001-03-07 | 2009-05-13 | 甲骨文国际公司 | 分布式共享磁盘系统中的磁盘写操作 |
US6832229B2 (en) | 2001-03-09 | 2004-12-14 | Oracle International Corporation | System and method for maintaining large-grained database concurrency with a log monitor incorporating dynamically redefinable business logic |
WO2003001382A1 (en) | 2001-06-25 | 2003-01-03 | Nokia Corporation | Method and system for restarting a replica of a database |
US6980988B1 (en) * | 2001-10-01 | 2005-12-27 | Oracle International Corporation | Method of applying changes to a standby database system |
US6732171B2 (en) | 2002-05-31 | 2004-05-04 | Lefthand Networks, Inc. | Distributed network storage system with virtualization |
US6792518B2 (en) | 2002-08-06 | 2004-09-14 | Emc Corporation | Data storage system having mata bit maps for indicating whether data blocks are invalid in snapshot copies |
US7305386B2 (en) | 2002-09-13 | 2007-12-04 | Netezza Corporation | Controlling visibility in multi-version database systems |
US7089253B2 (en) | 2002-09-13 | 2006-08-08 | Netezza Corporation | Computer method and system for concurrency control using dynamic serialization ordering |
US6976022B2 (en) | 2002-09-16 | 2005-12-13 | Oracle International Corporation | Method and mechanism for batch processing transaction logging records |
US8489742B2 (en) | 2002-10-10 | 2013-07-16 | Convergys Information Management Group, Inc. | System and method for work management |
US7308456B2 (en) | 2002-12-19 | 2007-12-11 | International Business Machines Corporation | Method and apparatus for building one or more indexes on data concurrent with manipulation of data |
US7010645B2 (en) | 2002-12-27 | 2006-03-07 | International Business Machines Corporation | System and method for sequentially staging received data to a write cache in advance of storing the received data |
JP4158534B2 (ja) | 2003-01-21 | 2008-10-01 | 修平 西山 | 分散型データベースシステム |
US7937551B2 (en) | 2003-01-21 | 2011-05-03 | Dell Products L.P. | Storage systems having differentiated storage pools |
JP4289056B2 (ja) | 2003-03-27 | 2009-07-01 | 株式会社日立製作所 | 計算機システム間のデータ二重化制御方法 |
US7287034B2 (en) | 2003-05-08 | 2007-10-23 | Oracle International Corporation | On-demand multi-version data dictionary to support distributed applications |
US20050015416A1 (en) | 2003-07-16 | 2005-01-20 | Hitachi, Ltd. | Method and apparatus for data recovery using storage based journaling |
US7328226B1 (en) | 2003-06-30 | 2008-02-05 | Symantec Operating Corporation | Coordinated distributed log-based snapshots in a multi-host environment |
JP2005050024A (ja) | 2003-07-31 | 2005-02-24 | Toshiba Corp | 計算機システムおよびプログラム |
JP2005276094A (ja) | 2004-03-26 | 2005-10-06 | Hitachi Ltd | 分散ストレージ装置のファイル管理方法及び分散ストレージシステム並びにプログラム |
US7146386B2 (en) | 2004-03-29 | 2006-12-05 | Microsoft Corporation | System and method for a snapshot query during database recovery |
US20060020634A1 (en) | 2004-07-20 | 2006-01-26 | International Business Machines Corporation | Method, system and program for recording changes made to a database |
US7650356B2 (en) | 2004-08-24 | 2010-01-19 | Microsoft Corporation | Generating an optimized restore plan |
US7257690B1 (en) * | 2004-10-15 | 2007-08-14 | Veritas Operating Corporation | Log-structured temporal shadow store |
US7499954B2 (en) * | 2004-11-01 | 2009-03-03 | International Business Machines Corporation | Consistent reintegration of a failed primary instance |
US7403945B2 (en) | 2004-11-01 | 2008-07-22 | Sybase, Inc. | Distributed database system providing data and space management methodology |
US20060218200A1 (en) * | 2005-03-24 | 2006-09-28 | International Business Machines Corporation | Application of log records by storage servers |
JP2006263581A (ja) | 2005-03-24 | 2006-10-05 | Mazda Motor Corp | 排気ガス浄化用触媒 |
US20060218204A1 (en) * | 2005-03-25 | 2006-09-28 | International Business Machines Corporation | Log stream validation in log shipping data replication systems |
US7814057B2 (en) | 2005-04-05 | 2010-10-12 | Microsoft Corporation | Page recovery using volume snapshots and logs |
US7716645B2 (en) | 2005-06-10 | 2010-05-11 | International Business Machines Corporation | Using atomic sets of memory locations |
US7873683B2 (en) | 2005-07-01 | 2011-01-18 | Qnx Software Systems Gmbh & Co. Kg | File system having transaction record coalescing |
US20070083570A1 (en) | 2005-10-11 | 2007-04-12 | Fineberg Samuel A | File system versioning using a log |
US7885922B2 (en) | 2005-10-28 | 2011-02-08 | Oracle International Corporation | Apparatus and method for creating a real time database replica |
EP1974296B8 (en) | 2005-12-19 | 2016-09-21 | Commvault Systems, Inc. | Systems and methods for performing data replication |
JP2007200182A (ja) | 2006-01-30 | 2007-08-09 | Hitachi Ltd | ストレージ装置、及びストレージシステム |
JP4800046B2 (ja) | 2006-01-31 | 2011-10-26 | 株式会社日立製作所 | ストレージシステム |
US7613749B2 (en) * | 2006-04-12 | 2009-11-03 | International Business Machines Corporation | System and method for application fault tolerance and recovery using topologically remotely located computing devices |
JP5124989B2 (ja) | 2006-05-26 | 2013-01-23 | 日本電気株式会社 | ストレージシステム及びデータ保護方法とプログラム |
JP2008003932A (ja) | 2006-06-23 | 2008-01-10 | Sony Corp | データ記憶装置、データ記憶方法およびコンピュータプログラム |
US7882064B2 (en) | 2006-07-06 | 2011-02-01 | Emc Corporation | File system replication |
US8069191B2 (en) | 2006-07-13 | 2011-11-29 | International Business Machines Corporation | Method, an apparatus and a system for managing a snapshot storage pool |
US7917469B2 (en) * | 2006-11-08 | 2011-03-29 | Hitachi Data Systems Corporation | Fast primary cluster recovery |
US8935206B2 (en) | 2007-01-31 | 2015-01-13 | Hewlett-Packard Development Company, L.P. | Snapshots in distributed storage systems |
US8069141B2 (en) * | 2007-03-12 | 2011-11-29 | Microsoft Corporation | Interfaces for high availability systems and log shipping |
US8370715B2 (en) | 2007-04-12 | 2013-02-05 | International Business Machines Corporation | Error checking addressable blocks in storage |
US8086650B1 (en) | 2007-06-15 | 2011-12-27 | Ipswitch, Inc. | Method for transforming and consolidating fields in log records from logs generated on different operating systems |
US8326897B2 (en) | 2007-12-19 | 2012-12-04 | International Business Machines Corporation | Apparatus and method for managing data storage |
US7979670B2 (en) | 2008-01-24 | 2011-07-12 | Quantum Corporation | Methods and systems for vectored data de-duplication |
US9134917B2 (en) | 2008-02-12 | 2015-09-15 | Netapp, Inc. | Hybrid media storage system architecture |
US8401994B2 (en) | 2009-09-18 | 2013-03-19 | Oracle International Corporation | Distributed consistent grid of in-memory database caches |
US7747663B2 (en) | 2008-03-05 | 2010-06-29 | Nec Laboratories America, Inc. | System and method for content addressable storage |
US8229945B2 (en) | 2008-03-20 | 2012-07-24 | Schooner Information Technology, Inc. | Scalable database management software on a cluster of nodes using a shared-distributed flash memory |
US8074014B2 (en) | 2008-03-31 | 2011-12-06 | Microsoft Corporation | Storage systems using write off-loading |
US8266114B2 (en) | 2008-09-22 | 2012-09-11 | Riverbed Technology, Inc. | Log structured content addressable deduplicating storage |
US8341128B1 (en) | 2008-05-09 | 2012-12-25 | Workday, Inc. | Concurrency control using an effective change stack and tenant-based isolation |
US9104662B2 (en) | 2008-08-08 | 2015-08-11 | Oracle International Corporation | Method and system for implementing parallel transformations of records |
US9842004B2 (en) | 2008-08-22 | 2017-12-12 | Red Hat, Inc. | Adjusting resource usage for cloud-based networks |
JP5557840B2 (ja) * | 2008-10-03 | 2014-07-23 | テレフオンアクチーボラゲット エル エム エリクソン(パブル) | 分散データベースの監視メカニズム |
US8255373B2 (en) | 2008-10-24 | 2012-08-28 | Microsoft Corporation | Atomic multiple modification of data in a distributed storage system |
US9996572B2 (en) | 2008-10-24 | 2018-06-12 | Microsoft Technology Licensing, Llc | Partition management in a partitioned, scalable, and available structured storage |
US8229890B2 (en) | 2008-12-15 | 2012-07-24 | International Business Machines Corporation | Opening document stored at multiple database replicas |
US8429134B2 (en) * | 2009-09-08 | 2013-04-23 | Oracle International Corporation | Distributed database recovery |
EP2476039B1 (en) | 2009-09-09 | 2016-10-26 | SanDisk Technologies LLC | Apparatus, system, and method for power reduction management in a storage device |
US8392479B1 (en) | 2009-09-14 | 2013-03-05 | Symantec Corporation | Method and apparatus for optimizing storage space allocation for computer data |
US8255627B2 (en) | 2009-10-10 | 2012-08-28 | International Business Machines Corporation | Secondary cache for write accumulation and coalescing |
US8620903B2 (en) | 2009-11-04 | 2013-12-31 | Nec Laboratories America, Inc. | Database distribution system and methods for scale-out applications |
US8250213B2 (en) | 2009-11-16 | 2012-08-21 | At&T Intellectual Property I, L.P. | Methods and apparatus to allocate resources associated with a distributive computing network |
US8396831B2 (en) | 2009-12-18 | 2013-03-12 | Microsoft Corporation | Optimistic serializable snapshot isolation |
US20110161496A1 (en) | 2009-12-28 | 2011-06-30 | Nicklin Jonathan C | Implementation and management of internet accessible services using dynamically provisioned resources |
CA2783370C (en) | 2009-12-31 | 2016-03-15 | Commvault Systems, Inc. | Systems and methods for performing data management operations using snapshots |
US20110178984A1 (en) | 2010-01-18 | 2011-07-21 | Microsoft Corporation | Replication protocol for database systems |
US8671074B2 (en) | 2010-04-12 | 2014-03-11 | Microsoft Corporation | Logical replication in clustered database system with adaptive cloning |
US8463825B1 (en) | 2010-04-27 | 2013-06-11 | Tintri Inc. | Hybrid file system for virtual machine storage |
JP5536568B2 (ja) | 2010-07-01 | 2014-07-02 | インターナショナル・ビジネス・マシーンズ・コーポレーション | トランザクションを集約して処理する方法、システム、およびプログラム |
US8412689B2 (en) | 2010-07-07 | 2013-04-02 | Microsoft Corporation | Shared log-structured multi-version transactional datastore with metadata to enable melding trees |
US20120041899A1 (en) | 2010-08-10 | 2012-02-16 | Palo Alto Research Center Incorporated | Data center customer cost determination mechanisms |
US10430298B2 (en) * | 2010-10-28 | 2019-10-01 | Microsoft Technology Licensing, Llc | Versatile in-memory database recovery using logical log records |
US8572031B2 (en) * | 2010-12-23 | 2013-10-29 | Mongodb, Inc. | Method and apparatus for maintaining replica sets |
US8910172B2 (en) | 2010-12-29 | 2014-12-09 | Symantec Corporation | Application resource switchover systems and methods |
US20120197856A1 (en) * | 2011-01-28 | 2012-08-02 | Cisco Technology, Inc. | Hierarchical Network for Collecting, Aggregating, Indexing, and Searching Sensor Data |
US8918362B2 (en) | 2011-05-23 | 2014-12-23 | Microsoft Corporation | Replication processes in a distributed storage environment |
US8543538B2 (en) | 2011-06-01 | 2013-09-24 | Clustrix, Inc. | Systems and methods for redistributing data in a relational database |
US9348883B2 (en) | 2011-06-01 | 2016-05-24 | Clustrix, Inc. | Systems and methods for replication replay in a relational database |
US8554726B2 (en) | 2011-06-01 | 2013-10-08 | Clustrix, Inc. | Systems and methods for reslicing data in a relational database |
US8868492B2 (en) | 2011-06-15 | 2014-10-21 | Oracle International Corporation | Method for maximizing throughput and minimizing transactions response times on the primary system in the presence of a zero data loss standby replica |
WO2013025540A1 (en) | 2011-08-12 | 2013-02-21 | Sandisk Enterprise Ip Llc | Cache management including solid state device virtualization |
US8909996B2 (en) | 2011-08-12 | 2014-12-09 | Oracle International Corporation | Utilizing multiple storage devices to reduce write latency for database logging |
US8712961B2 (en) | 2011-09-23 | 2014-04-29 | International Business Machines Corporation | Database caching utilizing asynchronous log-based replication |
US10042674B2 (en) | 2011-09-30 | 2018-08-07 | Teradata Us, Inc. | Regulating capacity and managing services of computing environments and systems that include a database |
CN102662793A (zh) * | 2012-03-07 | 2012-09-12 | 江苏引跑网络科技有限公司 | 一种可保证数据一致性的分布式数据库热备份与恢复方法 |
US8965921B2 (en) * | 2012-06-06 | 2015-02-24 | Rackspace Us, Inc. | Data management and indexing across a distributed database |
-
2014
- 2014-03-07 US US14/201,505 patent/US11030055B2/en active Active
- 2014-03-12 KR KR1020187005012A patent/KR101914019B1/ko active IP Right Grant
- 2014-03-12 CN CN201480025921.1A patent/CN105190622B/zh active Active
- 2014-03-12 JP JP2016501614A patent/JP6275816B2/ja active Active
- 2014-03-12 EP EP14769678.5A patent/EP2973060B1/en active Active
- 2014-03-12 WO PCT/US2014/024708 patent/WO2014150986A1/en active Application Filing
- 2014-03-12 CA CA2906511A patent/CA2906511C/en active Active
- 2014-03-12 EP EP18183259.3A patent/EP3416060B1/en active Active
- 2014-03-12 CN CN201910522584.1A patent/CN110209535B/zh active Active
- 2014-03-12 AU AU2014235433A patent/AU2014235433C1/en active Active
- 2014-03-12 KR KR1020157028932A patent/KR101833114B1/ko active IP Right Grant
-
2017
- 2017-09-07 AU AU2017225086A patent/AU2017225086B2/en active Active
-
2018
- 2018-01-10 JP JP2018001662A patent/JP6522812B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
US20140279930A1 (en) | 2014-09-18 |
EP3416060B1 (en) | 2020-07-15 |
KR101914019B1 (ko) | 2018-10-31 |
AU2014235433B9 (en) | 2017-07-27 |
CN105190622A (zh) | 2015-12-23 |
EP2973060B1 (en) | 2018-08-22 |
KR20180021923A (ko) | 2018-03-05 |
JP2018077895A (ja) | 2018-05-17 |
KR101833114B1 (ko) | 2018-04-13 |
EP2973060A4 (en) | 2016-11-30 |
EP2973060A1 (en) | 2016-01-20 |
AU2017225086A1 (en) | 2017-10-05 |
AU2014235433C1 (en) | 2017-10-19 |
CN110209535A (zh) | 2019-09-06 |
WO2014150986A1 (en) | 2014-09-25 |
CA2906511C (en) | 2021-02-23 |
KR20150130496A (ko) | 2015-11-23 |
JP6522812B2 (ja) | 2019-05-29 |
CN105190622B (zh) | 2019-07-16 |
JP2016515271A (ja) | 2016-05-26 |
US11030055B2 (en) | 2021-06-08 |
AU2017225086B2 (en) | 2019-02-28 |
EP3416060A1 (en) | 2018-12-19 |
CN110209535B (zh) | 2024-03-29 |
AU2014235433B2 (en) | 2017-06-08 |
CA2906511A1 (en) | 2014-09-25 |
AU2014235433A1 (en) | 2015-10-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6522812B2 (ja) | 分散型データベースシステム用高速クラッシュ回復 | |
JP6538780B2 (ja) | 分散型データベースシステムのシステム全体のチェックポイント回避 | |
US20240330270A1 (en) | Database system with database engine and separate distributed storage service | |
JP6619406B2 (ja) | ログレコード管理 | |
US11755415B2 (en) | Variable data replication for storage implementing data backup | |
JP2018129078A (ja) | インプレーススナップショット |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20161125 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20161213 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20170313 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20170515 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170613 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20171031 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20171120 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20171212 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180110 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6275816 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |