JP6457633B2 - データベース・クラスタのデータ管理方法、ノード、及びシステム - Google Patents

データベース・クラスタのデータ管理方法、ノード、及びシステム Download PDF

Info

Publication number
JP6457633B2
JP6457633B2 JP2017514759A JP2017514759A JP6457633B2 JP 6457633 B2 JP6457633 B2 JP 6457633B2 JP 2017514759 A JP2017514759 A JP 2017514759A JP 2017514759 A JP2017514759 A JP 2017514759A JP 6457633 B2 JP6457633 B2 JP 6457633B2
Authority
JP
Japan
Prior art keywords
node
ssd
transaction log
dual port
dual
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017514759A
Other languages
English (en)
Other versions
JP2017517087A (ja
Inventor
巍 于
巍 于
▲輝▼▲軍▼ ▲劉▼
▲輝▼▲軍▼ ▲劉▼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Publication of JP2017517087A publication Critical patent/JP2017517087A/ja
Application granted granted Critical
Publication of JP6457633B2 publication Critical patent/JP6457633B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2053Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
    • G06F11/2094Redundant storage or storage space
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/27Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor
    • G06F16/275Synchronous replication
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2023Failover techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2046Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant where the redundant components share persistent storage
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2053Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
    • G06F11/2089Redundant storage control functionality
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2053Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
    • G06F11/2089Redundant storage control functionality
    • G06F11/2092Techniques of failing over between control units
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/11File system administration, e.g. details of archiving or snapshots
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/11File system administration, e.g. details of archiving or snapshots
    • G06F16/113Details of archiving
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/13File access structures, e.g. distributed indices
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/17Details of further file system functions
    • G06F16/1734Details of monitoring file system events, e.g. by the use of hooks, filter drivers, logs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/18File system types
    • G06F16/182Distributed file systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/18File system types
    • G06F16/182Distributed file systems
    • G06F16/1824Distributed file systems implemented using Network-attached Storage [NAS] architecture
    • G06F16/1827Management specifically adapted to NAS
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/0614Improving the reliability of storage systems
    • G06F3/0619Improving the reliability of storage systems in relation to data integrity, e.g. data losses, bit errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0638Organizing or formatting or addressing of data
    • G06F3/064Management of blocks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0646Horizontal data movement in storage systems, i.e. moving data in between storage devices or systems
    • G06F3/065Replication mechanisms
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/067Distributed or networked storage systems, e.g. storage area networks [SAN], network attached storage [NAS]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/0671In-line storage system
    • G06F3/0683Plurality of storage devices
    • G06F3/0688Non-volatile semiconductor memory arrays
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1471Saving, restoring, recovering or retrying involving logging of persistent data for recovery
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2201/00Indexing scheme relating to error detection, to error correction, and to monitoring
    • G06F2201/80Database-specific techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2201/00Indexing scheme relating to error detection, to error correction, and to monitoring
    • G06F2201/805Real-time
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2201/00Indexing scheme relating to error detection, to error correction, and to monitoring
    • G06F2201/82Solving problems relating to consistency
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2213/00Indexing scheme relating to interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
    • G06F2213/0026PCI express

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Quality & Reliability (AREA)
  • Human Computer Interaction (AREA)
  • Computer Security & Cryptography (AREA)
  • Computing Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

開示は、データベースの分野に関連し、具体的には、データベース・クラスタのデータ管理方法、ノード、及びシステムに関する。
データベース・クラスタのすべてのノードは、シェアード・ディスクアレイに接続され、前記シェアード・ディスクアレイは、全てのノードのデータを格納する。前記データベース・クラスタ内のノードがクラッシュした場合、ノードにおいて更新されたデータは、一定期間使用できず、一部のサービスに影響を与えることになる。一般的な解決策は、ノードのログをシェアード・ディスクアレイに更新することであり、ノードがクラッシュしたとき、リカバリを実行するために、別のノードがノードのログを読み取る。別のノードがノードのログを読み取ることができない場合、ノードが再起動されるまで、ノード内のデータは復元することはできず、その後、サービスが外部から提供されるが、そのような処理は、非常に時間がかかり、サービスに影響する。加えて、前記シェアード・ディスクアレイにログ情報を更新する場合、同期ログの量が多いため、クラスタシステムのパフォーマンスにも大きな影響を与え得る。
開示の実施形態は、ノードクラッシュ後のノードのリカバリ処理に時間がかかるために、サービスに影響を与えるという問題を解決するような、データベース・クラスタのデータ管理方法、ノード、及びシステムを提供する。
第1の態様によると、データベース・クラスタのデータ管理方法が提供され、前記データベース・クラスタは、第1デュアルポート・ソリッド・ステート・ディスク(SSD)、第2デュアルポート・ソリッド・ステート・ディスク(SSD)、第1ノード、第2ノード、及び第3ノードを含み、前記第1デュアルポートSSDは、前記第1ノード及び前記第2ノードに接続されており、前記第2デュアルポートSSDは、前記第2ノード及び前記第3ノードに接続されており、前記方法は、
前記第1ノードがクラッシュした場合に、前記第2ノードが、前記第1デュアルポートSSDから、トランザクションログを取得し、前記第2ノードが前記トランザクションログに従って、前記第1ノードがクラッシュする前に前記第1ノードに格納されたデータを操作できるように、前記第1ノードが、前記トランザクションログを、前記第1デュアルポートSSDに書き込むステップ、又は、
前記第1ノードがクラッシュした場合に、前記第2ノードが、前記第1デュアルポートSSDから、トランザクションログを取得した後、前記第2ノードが、前記トランザクションログを、前記第3ノードに送信し、前記第3ノードが、前記第1ノードがクラッシュする前に前記第1ノードに格納されたデータを操作できるように、前記第1ノードが、前記トランザクションログを、前記第1デュアルポートSSDに書き込むステップ
を含み、
前記第3ノード、前記第1ノード、及び前記第2ノードは、互いにデータ送信可能である。
1の態様の第1の可能な実施様式において、前記方法は、
所定の期間に前記第1ノードが、前記第1デュアルポートSSDのチェックポイントの後であるトランザクションログを取得し、前記チェックポイントの後である前記トランザクションログを、シェアード・ディスクアレイにアーカイブするステップ
をさらに含む。
第1の態様、又は第1の態様の第1の可能な実施様式に関連し、第1の態様の第2の可能な実施様式において、前記方法は、
前記第1ノード及び前記第2ノードの双方がデータベース・インスタンスである場合には、前記第1デュアルポートSSDを使用して、前記第1ノードにより、前記第2ノードとデータ送信を直接実行するステップ
をさらに含む。
第1の態様の第2の可能な実施様式に関連し、第1の態様の第3の可能な実施様式において、前記第1デュアルポートSSDの少なくとも1つのポートは、PCIEポートであり、前記第2デュアルポートSSDの少なくとも1つのポートは、PCIEポートである。
第1の態様、又は第1の態様の第1から第3の何れか一つの可能な実施様式に関連し、第1の態様の第4の可能な実施様式において、前記方法は、
前記第1ノードがクラッシュする前に前記第1ノードに格納されたデータを操作するために、前記第2ノードにより、他のデータベース処理を開始するステップをさらに含み、前記他のデータベース処理は、前記第2ノードの元のデータベース処理とは独立している。
第1の態様、又は第1の態様の第1から第3の何れか一つの可能な実施様式に関連し、第1の態様の第5の可能な実施様式において、前記方法は、
前記第1ノードがクラッシュする前に前記第1ノードに格納されたデータを操作するために、前記第3ノードにより、他のデータベース処理を開始するステップをさらに含み、前記他のデータベース処理は、前記第3ノードの元のデータベース処理とは独立している。
第2の態様によると、第1ノードが提供され、データベース・クラスタは、第1デュアルポート・ソリッド・ステート・ディスク(SSD)、第2デュアルポート・ソリッド・ステート・ディスク(SSD)、前記第1ノード、第2ノード、及び第3ノードを含み、前記第1デュアルポートSSDは、前記第1ノード及び前記第2ノードに接続されており、前記第2デュアルポートSSDは、前記第2ノード及び前記第3ノードに接続されており、前記第1ノードは、
前記第1ノードがクラッシュした場合に、前記第2ノードが、前記第1デュアルポートSSDから、前記トランザクションログを取得し、前記第2ノードが、前記トランザクションログに従って、前記第1ノードがクラッシュする前に前記第1ノードに格納されたデータを操作できるように、トランザクションログを、前記第1デュアルポートSSDに書き込むか、又は、
前記第1ノードがクラッシュした場合に、前記第2ノードが、前記第1デュアルポートSSDから、前記トランザクションログを取得した後、前記第2ノードが、前記トランザクションログを、前記第3ノードに送信し、前記第3ノードが、前記第1ノードがクラッシュする前に前記第1ノードに格納されたデータを操作できるように、トランザクションログを、前記第1デュアルポートSSDに書き込む
ように構成されている書き込みユニットを含み、
前記第3ノード、前記第1ノード、及び前記第2ノードは、互いにデータ送信可能である。
2の態様の第1の可能な実施様式において、前記第1ノードは、
前記第1デュアルポートSSDのチェックポイントの後であるトランザクションログを、所定の期間に取得するように構成されている取得ユニットと、
前記チェックポイントの後である前記トランザクションログを、シェアード・ディスクアレイにアーカイブするように構成されているアーカイブユニットと、
をさらに含む。
第2の態様、又は第2の態様の第1の可能な実施様式に関連し、第2の態様の第2の可能な実施様式において、前記第1ノードは、
前記第1ノード及び前記第2ノードの双方がデータベース・インスタンスである場合には、前記第1デュアルポートSSDを使用して、前記第2ノードとのデータ送信を直接実行するように構成されている送信ユニット、
をさらに含む。
第2の態様の第2の可能な実施様式に関連し、第2の態様の第3の可能な実施様式において、前記第1デュアルポートSSDの少なくとも1つのポートは、PCIEポートであり、前記第2デュアルポートSSDの少なくとも1つのポートは、PCIEポートである。
第2の態様、又は第2の態様の第1から第3の何れか一つの可能な実施様式に関連し、第2の態様の第4の可能な実施様式において、前記第1ノードは、
前記第1ノードがクラッシュする前に前記第1ノードに格納されたデータを操作するための他のデータベース処理を開始するように構成されている開始ユニットをさらに含み、前記他のデータベース処理は、前記第2ノードの元のデータベース処理とは独立している。
第2の態様、又は第2の態様の第1から第3の何れか一つの可能な実施様式に関連し、第2の態様の第5の可能な実施様式において、前記第1ノードは、
記第1ノードがクラッシュする前に前記第1ノードに格納されたデータを操作するための他のデータベース処理を開始するように構成されている開始ユニットをさらに含み、前記他のデータベース処理は、前記第3ノードの元のデータベース処理とは独立している。
第3の態様によると、データベース・クラスタのデータ管理システムが提供され、前記データベース・クラスタは、第1デュアルポート・ソリッド・ステート・ディスク(SSD)、第2デュアルポート・ソリッド・ステート・ディスク(SSD)、第1ノード、第2ノード、第3ノードを含み、前記第1デュアルポートSSDは、前記第1ノード及び前記第2ノードに接続されており、前記第2デュアルポートSSDは、前記第2ノード及び前記第3ノードに接続されており、
前記第1ノードは、トランザクションログを、前記第1デュアルポートSSDに書き込むように構成されており、
前記第2ノードは、
前記第1ノードがクラッシュした場合に、前記第1デュアルポートSSDから、前記トランザクションログを取得し、前記トランザクションログに従って、前記第1ノードがクラッシュする前に前記第1ノードに格納されたデータを操作するか、又は、
前記第1ノードがクラッシュした場合に、前記第1デュアルポートSSDから、前記トランザクションログを取得し、前記トランザクションログを、前記第3ノードに送信し、前記第3ノードが、前記トランザクションログに従って、前記第1ノードがクラッシュする前に前記第1ノードに格納されたデータを操作する
ように構成されており、
前記第3ノード、前記第1ノード、及び前記第2ノードは、互いにデータ送信可能である。
3の態様の第1の可能な実施様式において、前記第1ノードは、
前記第1デュアルポートSSDのチェックポイント後であるトランザクションログを所定の期間に取得するように構成されている取得ユニットと、
前記チェックポイントの後である前記トランザクションログを、シェアード・ディスクアレイに、アーカイブするように構成されているアーカイブユニットと、
をさらに含む。
第3の態様、又は第3の態様の第1の可能な実施様式に関連し、第3の態様の第2の可能な実施様式において、前記第1ノードは、
前記第1ノード及び前記第2ノードの双方がデータベース・インスタンスである場合には、前記第1デュアルポートSSDを使用して、前記第2ノードとのデータ送信を直接実行するように構成されている送信ユニット
をさらに含む。
の態様の第2の可能な実施様式に関連し、第の態様の第3の可能な実施様式において、前記第1デュアルポートSSDの少なくとも1つのポートは、PCIEポートであり、前記第2デュアルポートSSDの少なくとも1つのポートは、PCIEポートである。
の態様、又は第の態様の第1から第3の何れか一つの可能な実施様式に関連し、第の態様の第4の可能な実施様式において、
前記第1ノードは、
前記第1ノードがクラッシュする前に前記第1ノードに格納されたデータを操作するための他のデータベース処理を開始するように構成されている開始ユニットをさらに含み、
前記他のデータベース処理は、前記第2ノードの元のデータベース処理とは独立している。
の態様、又は第の態様の第1から第3の何れか一つの可能な実施様式に関連し、第の態様の第5の可能な実施様式において、
開始ユニットは、前記第1ノードがクラッシュする前に前記第1ノードに格納されたデータを操作するための他のデータベース処理を開始するように構成されており、
前記他のデータベース処理は、前記第3ノードの元のデータベース処理とは独立している。
開示の実施形態は、データベース・クラスタのデータ管理方法を提供し、前記データベース・クラスタは、第1デュアルポート・ソリッド・ステート・ディスク(SSD)、第2デュアルポート・ソリッド・ステート・ディスク(SSD)、第1ノード、第2ノード、及び第3ノードを含み、前記第1デュアルポートSSDは、前記第1ノード及び前記第2ノードに接続されており、前記第2デュアルポートSSDは、前記第2ノード及び前記第3ノードに接続されており、前記第1ノードがクラッシュした場合に、前記第2ノードが、前記第1デュアルポートSSDから、前記トランザクションログを取得し、前記第2ノードが、前記トランザクションログに従って、前記第1ノードがクラッシュする前に前記第1ノードに格納されたデータを操作できるように、前記第1ノードは、トランザクションログを、前記第1デュアルポートSSDに書き込むか、又は、前記第1ノードがクラッシュした場合に、前記第2ノードが、前記第1デュアルポートSSDから、前記トランザクションログを取得した後、前記第2ノードが、前記トランザクションログを、前記第3ノードに送信し、前記第3ノードが、前記第1ノードがクラッシュする前に前記第1ノードに格納されたデータを操作できるように、前記第1ノードは、トランザクションログを、前記第1デュアルポートSSDに書き込み、前記第1ノードがクラッシュした場合に、前記第2ノード又は前記第3ノードが、デュアルポートSSDを使用してクラッシュノードのログ情報を読み取ることができるように、前記第3ノード、前記第1ノード、及び前記第2ノードとの間でデータ送信が実行可能であり、リカバリを実行した後、サービスを外部から提供するために第1ノードを置き換え、これにより、クラスタの復旧速度を向上させ、システムの可用性を向上させる。
開示の実施形態における技術的ソリューションをより明瞭に説明するために、以下に、それらの実施形態を説明するのに必要な添付の図面を簡単に概説する。明らかに、以下の説明における添付の図面は、本開示のいくつかの実施形態を示すに過ぎず、当業者は、創造的な取り組みなしに、添付の図面に従って他の図面をさらに得ることができる。
図1は、本開示の一実施形態によるデータベース・クラスタのためのデータ管理システムの構成図である。 図2は、本開示の一実施形態によるデータベース・クラスタのためのデータ管理の構造の概略図である。 図3は、本開示の一実施形態によるデータベース・クラスタのためのデータ管理の構造の概略図である。 図4は、本開示の一実施形態によるデータベース・クラスタのためのデータ管理の構造の概略図である。 図5は、本開示の一実施形態によるデータベース・クラスタのためのデータ管理方法の概略図である。 図6は、本開示の一実施形態によるデータベース・クラスタのためのデータ管理方法のフローチャートである。 図7は、本開示の一実施形態による第1ノードの装置の構成図である。 図8は、本開示の一実施形態による第1ノードの装置の構成図である。
開示の実施形態における添付の図面を参照しながら、本開示の実施形態における技術的解決策について以下で明確に説明する。説明する実施形態は、本開示の実施形態のすべてではなく、一部にすぎないことは明らかである
図1を参照すると、図1は、本開示の一実施形態によるデータベース・クラスタのためのデータ管理システムの構成図である。図1に示されているように、システムは、
第1デュアルポートソリッド・ステート・ディスク(SSD)101、第2デュアルポートSSD102、第1ノード103、第2ノード104、及び第3ノード105を含み、第1デュアルポートSSD101は、第1ノード103及び第2ノード104に接続され、第2デュアルポートSSD102は、第2ノード104及び第3ノード105に接続され、第2ノード104は、第1デュアルポートSSD101及び第2デュアルポートSSD102に個別に接続されており、
第1ノード103は、トランザクションログ(transaction log)を第1デュアルポートSSD101に書き込むように構成されており、
第2ノード104は、
第1ノード103がクラッシュする場合には、第1デュアルポートSSD101から、トランザクションログを取得し、トランザクションログに従って、第1ノード103がクラッシュする前に第1ノードに格納されているデータを操作するか、又は、
第1ノード103がクラッシュする場合には、第1デュアルポートSSD101から、トランザクションログを取得し、トランザクションログを、第3ノード105に送信し、第3ノード105は、トランザクションログに従って、第1ノード103がクラッシュする前に第1ノードに格納されているデータを操作する
ように構成され、
データ送信が、第3ノード105、第1ノード103、及び第2ノード104との間で実行可能である。
第1ノード103は、
第1デュアルポートSSDのチェックポイントの後であるトランザクションログを、所定の期間に取得するように構成された取得ユニットと、
チェックポイントの後であるトランザクションログを、シェアード・ディスクアレイにアーカイブするように構成されたアーカイブユニットと、
をさらに含む。
具体的には、図2から図4を参照すると、図2から図4は、本開示の一実施形態によるデータベース・クラスタのためのデータ管理の構造の概略図である。図2に示されているように、第1ノードは、バックグラウンドのログ書き込み処理によりSSDに書き込まれるトランザクションログを生成し、第1ノードは、チェックポイント後のログ、定期的にSSDから読み出、第1ノードのログアーカイブ処理が、チェックポイント後のログをシェアード・ディスクアレイにアーカイブし、第1デュアルポートSSDを使用して第1ノードのログを読み出すことによりリカバリした後に、第2ノードが、第1ノードに置き換えて動作する。
図3に示されているように、第1ノードがクラッシュした後、第2ノードは、第1デュアルポートSSDから、第1ノードのログを読み出し、第2ノードは、リカバリを実行するための新たなデータベース処理を開始し、リカバリを実行した後、第2ノードは、サービスを外部から提供し、第2ノードは、第1デュアルポートSSDを使用して、第1ノードのログを読み出し、リカバリを実行するために他のノードにログを送信する。
図4に示されているように、第1ノードがクラッシュした後、第2ノードは、SSDから第1ノードのログを読み出し、第2ノードは、ログを第3ノードに送信し、第1ノードのデータを取得した後であって、リカバリ動作が実行された後、第3ノードは、外部からサービスを提供する。
第1ノードは、
第1ノード及び第2ノードの双方がデータベース・インスタンスである場合に、第1デュアルポートSSDを使用して、第2ノードとのデータ送信を直接実行するように構成された送信ユニット
をさらに含む。
具体的には、図5に示されているように、図5は、本開示の一実施形態によるデータベース・クラスタのためのデータ管理方法の概略図である。
図5に示されているように、第1ノードと第2ノードの両方ともがデータベース・インスタンスである場合には、デュアルポートを使用してデータ送信が直接実行され得、ネットワーク輻輳のような場合にデータ伝送速度が遅くなるという問題を回避することができる。
オプションとして、第1デュアルポートSSDの少なくとも1つのポートは、PCIEポートであり、第2デュアルポートSSDの少なくとも1つのポートは、PCIEポートである。
オプションとして、第1ノードは、
第1ノードがクラッシュする前に第1ノードに格納されたデータを操作するために、他のデータベース処理を開始するように構成された開始ユニットをさらに含み、他のデータベース処理は、第2ノードの元のデータベース処理とは独立している。
オプションとして、第1ノードは、
第1ノードがクラッシュする前に第1ノードに格納されたデータを操作するために、他のデータベース処理を開始するように構成されている開始ユニットをさらに含み、他のデータベース処理は、第3ノードの元のデータベース処理とは独立している。
開示のこの実施形態は、データベース・クラスタのデータ管理システムを提供し、データベース・クラスタは、第1デュアルポートSSD、第2デュアルポートSSD、第1ノード、第2ノード、及び第3ノードを含み、第1デュアルポートSSDは、第1ノード及び第2ノードに接続されており、第2デュアルポートSSDは、第2ノード及び第3ノードに接続されており、第1ノードが、トランザクションログを、第1デュアルポートSSDに書き込むので、第1ノードがクラッシュした場合に、第2ノードが、第1デュアルポートSSDから、トランザクションログを取得でき、第2ノードが、トランザクションログに従って、第1ノードがクラッシュする前に第1ノードに格納されたデータを操作するか、又は、第1ノードが、トランザクションログを、第1デュアルポートSSDに書き込みので、第1ノードがクラッシュした場合に、第2ノードが、第1デュアルポートSSDから、トランザクションログを取得した後、第2ノードが、トランザクションログを、第3ノードに送信でき、第3ノードが、第1ノードがクラッシュする前に第1ノードに格納されたデータを操作でき、第3ノード、第1ノード、及び第2ノードは、互いにデータ送信可能であるため、第1ノードがクラッシュする場合には、第2ノード又は第3ノードがクラッシュノードのログ情報を読み出すためにデュアルポートSSDを使用でき、リカバリの実行後、外部のサービスを提供するために第1ノードを置き換え、これにより、クラスタの復旧速度を向上させ、システムの可用性を向上させる。
図6を参照すると、図6は、本開示の一実施形態によるデータベース・クラスタのためのデータ管理方法のフローチャートである。第1デュアルポートSSDは、第1ノード及び第2ノードに接続され、第2デュアルポートSSDは、第2ノード及び第3ノードに接続され、第2ノードは、第1デュアルポートSSDと第2デュアルポートSSDに別々に接続されている。方法は、以下を含む。
ステップ601:第1ノードが、トランザクションログを、第1デュアルポートSSDに書き込むため、第1ノードがクラッシュした場合に、第2ノードが、第1デュアルポートSSDから、トランザクションログを取得し、第2ノードが、トランザクションログに従って、第1ノードがクラッシュする前に第1ノードに格納されたデータを操作するか、又は、
第1ノードが、トランザクションログを、第1デュアルポートSSDに書き込むため、第1ノードがクラッシュした場合に、第2ノードが、第1デュアルポートSSDから、トランザクションログを取得した後、第2ノードは、トランザクションログを、第3ノードに送信でき、第3ノードが、第1ノードがクラッシュする前に第1ノードに格納されたデータを操作し、第3ノード、第1ノード、及び第2ノードは、互いにデータ送信可能である。
方法は、
所定の期間に第1ノードが、第1デュアルポートSSDのチェックポイントの後であるトランザクションログを取得するステップと、チェックポイントの後であるトランザクションログをシェアード・ディスクアレイにアーカイブするステップと、
をさらに含む。
方法は、
第1ノード及び第2ノードの双方がデータベース・インスタンスである場合には、第1デュアルポートSSDを使用して、第1ノードにより、第2ノードとのデータ送信を直接実行するステップ
をさらに含む。
第1デュアルポートSSDの少なくとも1つのポートは、PCIEポートであり、第2デュアルポートSSDの少なくとも1つのポートは、PCIEポートである。
詳細は、図2から図4の説明を参照のこと。
方法は、
第1ノードがクラッシュする前に第1ノードに格納されたデータを操作するために、第2ノードにより、他のデータベース処理を開始するステップをさらに含み、他のデータベース処理は、第2ノードの元のデータベース処理とは独立している。
方法は、
第1ノードがクラッシュする前に第1ノードに格納されたデータを操作するために、第3ノードにより、他のデータベース処理を開始するステップをさらに含み、他のデータベース処理は、第3ノードの元のデータベース処理とは独立している。
詳細は、図5の説明を参照のこと。
開示のこの実施形態は、データベース・クラスタのデータ管理方法を提供し、データベース・クラスタは、第1デュアルポート・ソリッド・ステート・ディスク(SSD)、第2デュアルポートSSD、第1ノード、第2ノード、及び第3ノードを含み、第1デュアルポートSSDは、第1ノード及び第2ノードに接続されており、第2デュアルポートSSDは、第2ノード及び第3ノードに接続されており、第1ノードが、トランザクションログを、第1デュアルポートSSDに書き込むので、第1ノードがクラッシュした場合に、第2ノードが、第1デュアルポートSSDから、トランザクションログを取得でき、第2ノードが、トランザクションログに従って、第1ノードがクラッシュする前に第1ノードに格納されたデータを操作するか、又は、第1ノードが、トランザクションログを、第1デュアルポートSSDに書き込むので、第1ノードがクラッシュした場合に、第2ノードが、第1デュアルポートSSDから、トランザクションログを取得した後、第2ノードは、トランザクションログを、第3ノードに送信でき、第3ノードが、第1ノードがクラッシュする前に第1ノードに格納されたデータを操作し、第3ノード、第1ノード、及び第2ノードは、互いにデータ送信可能であるので、第1ノードがクラッシュする場合には、第2ノード又は第3ノードは、デュアルポートSSDを使用してクラッシュノードのログ情報を読み取ることができ、リカバリを実行した後、サービスを外部から提供するために第1ノードを置き換え、これにより、クラスタの復旧速度を向上させ、システムの可用性を向上させる。
図7を参照すると、図7は、本開示の一実施形態による第1ノードの装置の構成図である。図7に示されているように、
データベース・クラスタは、第1デュアルポート・ソリッド・ステート・ディスク(SSD)、第2デュアルポートSSD、第1ノード、第2ノード、及び第3ノードを含み、第1デュアルポートSSDは、第1ノード及び第2ノードに接続されており、第2デュアルポートSSDは、第2ノード及び第3ノードに接続されており、第1ノードは、
トランザクションログを、第1デュアルポートSSDに書き込むので、第1ノードがクラッシュした場合に、第2ノードが、第1デュアルポートSSDから、トランザクションログを取得でき、第2ノードが、トランザクションログに従って、第1ノードがクラッシュする前に第1ノードに格納されたデータを操作するか、又は、
トランザクションログを、第1デュアルポートSSDに書き込むので、第1ノードがクラッシュした場合に、第2ノードが、第1デュアルポートSSDから、トランザクションログを取得した後、第2ノードが、トランザクションログを、第3ノードに送信でき、第3ノードが、第1ノードがクラッシュする前に第1ノードに格納されたデータを操作する
ように構成された書き込みユニット701を含み、
第3ノード、第1ノード、及び第2ノードは、互いにデータ送信可能である。
オプションとして、第1ノードは、
所定の期間に、第1デュアルポートSSDのチェックポイントの後であるトランザクションログを取得するように構成された取得ユニットと、
チェックポイントの後であるトランザクションログを、シェアード・ディスクアレイにアーカイブするように構成されたアーカイブユニットと、
をさらに含む。
オプションとして、第1ノードは、
第1ノード及び第2ノードの双方がデータベース・インスタンスである場合には、第1デュアルポートSSDを使用して、第2ノードとのデータ送信を直接実行するように構成された送信ユニット
をさらに含む。
第1デュアルポートSSDの少なくとも1つのポートは、PCIEポートであり、第2デュアルポートSSDの少なくとも1つのポートは、PCIEポートである。
オプションとして、第1ノードは、
第1ノードがクラッシュする前に第1ノードに格納されたデータを操作するための他のデータベース処理を開始するように構成された開始ユニットをさらに含み、他のデータベース処理は、第2ノードの元のデータベース処理とは独立している。
オプションとして、第1ノードは、
第1ノードがクラッシュする前に第1ノードに格納されたデータを操作するための他のデータベース処理を開始するように構成された開始ユニットをさらに含み、他のデータベース処理は、第3ノードの元のデータベース処理とは独立している。
詳細は、図2から図5の説明を参照のこと。
開示のこの実施形態は、第1ノードを提供し、第1ノードが、トランザクションログを第1デュアルポートSSDに書き込むので、第1ノードがクラッシュした場合に、第2ノードが、第1デュアルポートSSDから、トランザクションログを取得でき、第2ノードが、トランザクションログに従って、第1ノードがクラッシュする前に第1ノードに格納されたデータを操作するか、又は、第1ノードが、トランザクションログを第1デュアルポートSSDに書き込むため、第1ノードがクラッシュした場合に、第2ノードが、第1デュアルポートSSDから、トランザクションログを取得した後、第2ノードは、トランザクションログを第3ノードに送信でき、第3ノードが、第1ノードがクラッシュする前に第1ノードに格納されたデータを操作し、第3ノード、第1ノード、及び第2ノードは、互いにデータ送信可能であるため、第1ノードがクラッシュする場合には、第2ノード又は第3ノードは、デュアルポートSSDを使用して、クラッシュノードのログ情報を読み出すことができ、リカバリを実行した後、サービスを外部から提供するために第1ノードを置き換え、これにより、クラスタの復旧速度を向上させ、システムの可用性を向上させる。
図8は、本開示の一実施形態による第1ノードの装置の構成図である。図8を参照すると、図8は、本開示の実施形態による第1ノード800を示しており、本開示の特定の実施形態は、第1ノードの特定の実装を限定しない。第1ノード800は、
プロセッサ(processor)801、通信インターフェース(Communications Interface)802、メモリ(memory)803、及びバス804
を含む。
プロセッサ801、通信インターフェース802、及びメモリ803は、バス804を使用して、相互通信を遂行する。
通信インターフェース802は、他のデバイスと通信するように構成されており、
プロセッサ801は、プログラムを実行するように構成されている。
具体的には、プログラムは、プログラムコードを含み得、プログラムコードは、コンピュータ動作命令を含んでいる。
プロセッサ801は、中央演算処理装置(CPU)又は特定用途向け集積回路(ASIC)であってもよいし、又は本開示の実施形態を実施するための1つ又は複数の集積回路として構成されてもよい。
メモリ803は、プログラムを格納するように構成されている。メモリ803は、ランダム・アクセス・メモリ(RAM)などの揮発性メモリ(volatile memory)であっても、読み出し専用メモリ(read-only memory, ROM)、フラッシュメモリ(flash memory)、ハードディスクドライブ(hard disk drive, HDD)、又はソリッド・ステート・ディスク(SSD)などの不揮発性メモリ(non-volatile memory)であってもよい。プロセッサ801は、メモリ803に格納されているプログラム命令に従って以下の方法を実行する:
第1ノードにより、トランザクションログを、第1デュアルポートSSDに書き込むので、第1ノードがクラッシュした場合に、第2ノードが、第1デュアルポートSSDから、トランザクションログを取得でき、第2ノードが、トランザクションログに従って、第1ノードがクラッシュする前に第1ノードに格納されたデータを操作するか、又は、
第1ノードにより、トランザクションログを、第1デュアルポートSSDに書き込むので、第1ノードがクラッシュした場合に、第2ノードが、第1デュアルポートSSDから、トランザクションログを取得した後、第2ノードは、トランザクションログを第3ノードに送信でき、第3ノードが、第1ノードがクラッシュする前に第1ノードに格納されたデータを操作し、
第3ノード、第1ノード、及び第2ノードは、互いにデータ送信可能である。
方法は、
所定の期間に第1ノードにより、第1デュアルポートSSDのチェックポイントの後であるトランザクションログを取得するステップと、チェックポイントの後であるトランザクションログを、シェアード・ディスクアレイに、アーカイブするステップと、をさらに含む。
方法は、
第1ノード及び第2ノードの双方がデータベース・インスタンスである場合には、第1ノードにより、第2ノードとのデータ送信を直接実行するステップをさらに含む。
第1デュアルポートSSDの少なくとも1つのポートは、PCIEポートであり、第2デュアルポートSSDの少なくとも1つのポートは、PCIEポートである。
方法は、
第1ノードがクラッシュする前に第1ノードに格納されたデータを操作するために、第2ノードにより、他のデータベース処理を開始するステップをさらに含み、他のデータベース処理は、第2ノードの元のデータベース処理とは独立している。
方法は、
第1ノードがクラッシュする前に第1ノードに格納されたデータを操作するために、第3ノードにより、他のデータベース処理を開始するステップをさらに含み、他のデータベース処理は、第3ノードの元のデータベース処理とは独立している。
開示のこの実施形態は、第1ノードを提供し、第1ノードが、トランザクションログを第1デュアルポートSSDに書き込むので、第1ノードがクラッシュした場合に、第2ノードが、第1デュアルポートSSDから、トランザクションログを取得でき、第2ノードが、トランザクションログに従って、第1ノードがクラッシュする前に第1ノードに格納されたデータを操作するか、又は、第1ノードが、トランザクションログを第1デュアルポートSSDに書き込むので、第1ノードがクラッシュした場合に、第2ノードが、第1デュアルポートSSDから、トランザクションログを取得した後、第2ノードは、トランザクションログを第3ノードに送信でき、第3ノードが、第1ノードがクラッシュする前に第1ノードに格納されたデータを操作し、第3ノード、第1ノード、及び第2ノードは、互いにデータ送信可能であるので、第1ノードがクラッシュする場合には、第2ノード又は第3ノードは、デュアルポートSSDを使用して、クラッシュノードのログ情報を読み出すことができ、リカバリを実行した後、サービスを外部から提供するために第1ノードを置き換え、これにより、クラスタの復旧速度を向上させ、システムの可用性を向上させる。
上記の説明は本開示の例示的な特定の実施様式にすぎないが、本開示の保護範囲を限定するものではない。本開示を逸脱することなく当業者によって行われるいかなる変形または置換も、本開示の保護範囲内に入るものとする。したがって、本開示の保護範囲は、特許請求の範囲の保護範囲に従うものとする。
101 デュアルポート
102 デュアルポート
103 ノード
104 ノード
105 ノード
800 ノード
801 プロセッサ
802 通信インターフェース
803 メモリ
804 バス

Claims (16)

  1. データベース・クラスタのデータ管理方法であって、前記データベース・クラスタは、第1デュアルポート・ソリッド・ステート・ディスク(SSD)、第2デュアルポートSSD、第1ノード、第2ノード、及び第3ノードを具備し、前記第1デュアルポートSSDは、前記第1ノード及び前記第2ノードに接続されており、前記第2デュアルポートSSDは、前記第2ノード及び前記第3ノードに接続されており、前記方法は、
    前記第1ノードがクラッシュした場合に、前記第2ノードが、前記第1デュアルポートSSDから、トランザクションログを取得し、前記トランザクションログに従って、前記第1ノードがクラッシュする前に前記第1ノードに格納されたデータを操作できるように、前記第1ノードが、前記トランザクションログを、前記第1デュアルポートSSDに書き込むステップ、又は、
    前記第2ノードが、前記第1デュアルポートSSDから、前記トランザクションログを取得し、前記トランザクションログを、前記第3ノードに送信し、前記第3ノードが、前記第1ノードがクラッシュする前に前記第1ノードに格納されたデータを操作できるように、前記第1ノードが、トランザクションログを前記第1デュアルポートSSDに書き込むステップ
    を具備し、
    前記第3ノード、前記第1ノード、及び前記第2ノードは、互いにデータ送信可能であることを特徴とするデータベース・クラスタのデータ管理方法。
  2. 前記方法は、
    所定の期間に前記第1ノードが、前記第1デュアルポートSSDのチェックポイントの後であるトランザクションログを取得し、前記チェックポイントの後である前記トランザクションログを、シェアード・ディスクアレイに、アーカイブするステップ
    をさらに具備することを特徴とする請求項1に記載の方法。
  3. 前記方法は、
    前記第1ノード及び前記第2ノードの双方がデータベース・インスタンスである場合には、前記第1ノードが、前記第1デュアルポートSSDを使用して、前記第2ノードとのデータ送信を実行するステップ
    をさらに具備することを特徴とする請求項1又は2に記載の方法。
  4. 前記第1デュアルポートSSDの少なくとも1つのポートは、PCIEポートであり、前記第2デュアルポートSSDの少なくとも1つのポートは、PCIEポートであることを特徴とする請求項1から3のいずれか一項に記載の方法。
  5. 前記方法は、
    前記第1ノードがクラッシュする前に前記第1ノードに格納されたデータを操作するために、前記第2ノードが、他のデータベース処理を開始するステップをさらに具備し、
    前記他のデータベース処理は、前記第2ノードの元のデータベース処理とは独立していることを特徴とする請求項1から4のいずれか一項に記載の方法。
  6. 前記第1ノードがクラッシュする前に前記第1ノードに格納されたデータを操作するために、前記第3ノードが、他のデータベース処理を開始するステップをさらに具備し、
    前記他のデータベース処理は、前記第3ノードの元のデータベース処理とは独立していることを特徴とする請求項1から4のいずれか一項に記載の方法。
  7. データベース・クラスタ内のデータ管理のための第1ノードであって、前記データベース・クラスタは、第1デュアルポート・ソリッド・ステート・ディスク(SSD)、第2デュアルポートSSD、前記第1ノード、第2ノード、及び第3ノードを具備し、前記第1デュアルポートSSDは、前記第1ノード及び前記第2ノードに接続されており、前記第2デュアルポートSSDは、前記第2ノード及び前記第3ノードに接続されており、前記第1ノードは、バスを介して相互に通信可能なプロセッサ、通信インターフェース、及びメモリを具備し、
    前記プロセッサは、前記メモリに格納されている実行可能なプログラムを実行して、
    前記第1ノードがクラッシュした場合に、前記第2ノードが、前記第1デュアルポートSSDから、トランザクションログを読み出し、前記トランザクションログに従って、前記第1ノードがクラッシュする前に前記第1ノードに格納されたデータを操作できるように、前記トランザクションログを前記第1デュアルポートSSDに書き込むこと、又は、
    前記第1ノードがクラッシュした場合に、前記第2ノードが、前記第1デュアルポートSSDから、前記トランザクションログを読み出し、前記トランザクションログを、前記第3ノードに送信し、前記第3ノードが、前記第1ノードがクラッシュする前に前記第1ノードに格納されたデータを操作できるように、トランザクションログを、前記第1デュアルポートSSDに書き込む
    ことを行うように構成されており、
    前記第3ノード、前記第1ノード、及び前記第2ノードは、互いにデータ送信可能であることを特徴とする第1ノード。
  8. 前記プロセッサは、前記メモリに格納されている実行可能なプログラムを実行して、
    前記第1デュアルポートSSDのチェックポイントの後であるトランザクションログを、所定の期間に取得し、
    前記チェックポイントの後である前記トランザクションログを、シェアード・ディスクアレイにアーカイブする、
    ことを行うようにさらに構成されていることを特徴とする請求項7に記載の第1ノード。
  9. 前記プロセッサは、前記メモリに格納されている実行可能なプログラムを実行して、
    前記第1ノード及び前記第2ノードの双方がデータベース・インスタンスである場合には、前記第1デュアルポートSSDを使用して、前記第2ノードとのデータ送信を実行する、
    ことを行うようにさらに構成されていることを特徴とする請求項7又は8に記載の第1ノード。
  10. 前記第1デュアルポートSSDの少なくとも1つのポートは、PCIEポートであり、前記第2デュアルポートSSDの少なくとも1つのポートは、PCIEポートであることを特徴とする請求項7から9のいずれか一項に記載の第1ノード。
  11. データ管理システムであって、第1デュアルポート・ソリッド・ステート・ディスク(SSD)、第2デュアルポートSSD、第1ノード、第2ノード、及び第3ノードを具備し、前記第1デュアルポートSSDは、前記第1ノード及び前記第2ノードに接続されており、前記第2デュアルポートSSDは、前記第2ノード及び前記第3ノードに接続されており、
    前記第1ノードは、トランザクションログを、前記第1デュアルポートSSDに書き込むように構成されており、
    前記第2ノードは、
    前記第1ノードがクラッシュした場合に、前記第1デュアルポートSSDから、前記トランザクションログを取得し、前記トランザクションログに従って、前記第1ノードがクラッシュする前に前記第1ノードに格納されたデータを操作するか、又は、
    前記第1ノードがクラッシュした場合に、前記第1デュアルポートSSDから、前記トランザクションログを取得し、前記トランザクションログを、前記第3ノードに送信し、前記第3ノードが、前記トランザクションログに従って、前記第1ノードがクラッシュする前に前記第1ノードに格納されたデータを操作する
    ように構成されており、
    前記第3ノード、前記第1ノード、及び前記第2ノードは、互いにデータ送信可能であることを特徴とするデータベース・クラスタのデータ管理システム。
  12. 前記第1ノードは、
    前記第1デュアルポートSSDのチェックポイントの後であるトランザクションログを所定の期間に取得し、
    前記チェックポイントの後である前記トランザクションログを、シェアード・ディスクアレイに、アーカイブする
    ようにさらに構成されていることを特徴とする請求項11に記載のシステム。
  13. 前記第1ノードは、
    前記第1ノード及び前記第2ノードの双方がデータベース・インスタンスである場合には、前記第1デュアルポートSSDを使用して、前記第2ノードとのデータ送信を実行する
    ようにさらに構成されていることを特徴とする請求項11又は12に記載のシステム。
  14. 前記第1デュアルポートSSDの少なくとも1つのポートは、PCIEポートであり、前記第2デュアルポートSSDの少なくとも1つのポートは、PCIEポートであることを特徴とする請求項11から13のいずれか一項に記載のシステム。
  15. 前記第ノードは、
    前記第1ノードがクラッシュする前に前記第1ノードに格納されたデータを操作するための他のデータベース処理を開始するようにさらに構成され、
    前記他のデータベース処理は、前記第2ノードの元のデータベース処理とは独立していることを特徴とする請求項11から14のいずれか一項に記載のシステム。
  16. 前記第ノードは、
    前記第1ノードがクラッシュする前に前記第1ノードに格納されたデータを操作するための他のデータベース処理を開始するようにさらに構成され、
    前記他のデータベース処理は、前記第3ノードの元のデータベース処理とは独立していることを特徴とする請求項11から14のいずれか一項に記載のシステム。
JP2017514759A 2014-05-30 2014-11-25 データベース・クラスタのデータ管理方法、ノード、及びシステム Active JP6457633B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201410242052.X 2014-05-30
CN201410242052.XA CN103984768B (zh) 2014-05-30 2014-05-30 一种数据库集群管理数据的方法、节点及系统
PCT/CN2014/092140 WO2015180434A1 (zh) 2014-05-30 2014-11-25 一种数据库集群管理数据的方法、节点及系统

Publications (2)

Publication Number Publication Date
JP2017517087A JP2017517087A (ja) 2017-06-22
JP6457633B2 true JP6457633B2 (ja) 2019-01-23

Family

ID=51276740

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017514759A Active JP6457633B2 (ja) 2014-05-30 2014-11-25 データベース・クラスタのデータ管理方法、ノード、及びシステム

Country Status (7)

Country Link
US (2) US10379977B2 (ja)
EP (1) EP3147797B1 (ja)
JP (1) JP6457633B2 (ja)
KR (1) KR101983208B1 (ja)
CN (1) CN103984768B (ja)
RU (1) RU2653254C1 (ja)
WO (1) WO2015180434A1 (ja)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103984768B (zh) 2014-05-30 2017-09-29 华为技术有限公司 一种数据库集群管理数据的方法、节点及系统
CN106034137A (zh) * 2015-03-09 2016-10-19 阿里巴巴集团控股有限公司 用于分布式系统的智能调度方法及分布式服务系统
CN106960060B (zh) * 2017-04-10 2020-07-31 聚好看科技股份有限公司 一种数据库集群的管理方法及装置
CN109697110B (zh) * 2017-10-20 2023-01-06 阿里巴巴集团控股有限公司 事务协调处理系统、方法、装置及电子设备
US10754798B1 (en) * 2019-09-11 2020-08-25 International Business Machines Corporation Link speed recovery in a data storage system
CN111639008B (zh) * 2020-05-29 2023-08-25 杭州海康威视系统技术有限公司 基于双端口ssd的文件系统状态监测方法、装置及电子设备
KR102428587B1 (ko) 2022-04-13 2022-08-03 주식회사 비투엔 마이크로 서비스 아키텍처 기반의 트랜잭션 가용성과 성능 보장 처리 장치 및 방법
US11983428B2 (en) 2022-06-07 2024-05-14 Western Digital Technologies, Inc. Data migration via data storage device peer channel

Family Cites Families (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0991183A (ja) * 1995-09-27 1997-04-04 Toshiba Corp データベースリカバリ装置
JP3094888B2 (ja) * 1996-01-26 2000-10-03 三菱電機株式会社 採番機構、データ整合性確認機構、トランザクション再実行機構及び分散トランザクション処理システム
US8041735B1 (en) * 2002-11-01 2011-10-18 Bluearc Uk Limited Distributed file system and method
US7028218B2 (en) * 2002-12-02 2006-04-11 Emc Corporation Redundant multi-processor and logical processor configuration for a file server
KR100739674B1 (ko) 2003-05-01 2007-07-13 삼성전자주식회사 결함 관리 방법, 그 장치 및 그 디스크
JP4141921B2 (ja) * 2003-08-29 2008-08-27 富士通株式会社 ファイル処理方法
US7168001B2 (en) * 2004-02-06 2007-01-23 Hewlett-Packard Development Company, L.P. Transaction processing apparatus and method
JP4920248B2 (ja) * 2005-12-02 2012-04-18 株式会社日立製作所 サーバの障害回復方法及びデータベースシステム
JP2007157150A (ja) * 2005-12-06 2007-06-21 Samsung Electronics Co Ltd メモリシステム及びそれを含むメモリ処理方法
US7725446B2 (en) * 2005-12-19 2010-05-25 International Business Machines Corporation Commitment of transactions in a distributed system
JP4856561B2 (ja) * 2007-01-31 2012-01-18 日本電信電話株式会社 ノード制御方法、ノード制御プログラムおよびノード
KR101144808B1 (ko) 2008-09-01 2012-05-11 엘지전자 주식회사 박막형 태양전지 제조방법 및 이를 이용한 박막형 태양전지
US8429134B2 (en) * 2009-09-08 2013-04-23 Oracle International Corporation Distributed database recovery
US8201020B2 (en) * 2009-11-12 2012-06-12 International Business Machines Corporation Method apparatus and system for a redundant and fault tolerant solid state disk
US8407403B2 (en) 2009-12-07 2013-03-26 Microsoft Corporation Extending SSD lifetime using hybrid storage
US8677055B2 (en) * 2010-04-12 2014-03-18 Sandisk Enterprises IP LLC Flexible way of specifying storage attributes in a flash memory-based object store
JP2011227834A (ja) 2010-04-22 2011-11-10 Sony Corp 信号制御装置及び信号制御方法
US8954385B2 (en) * 2010-06-28 2015-02-10 Sandisk Enterprise Ip Llc Efficient recovery of transactional data stores
US8392378B2 (en) * 2010-12-09 2013-03-05 International Business Machines Corporation Efficient backup and restore of virtual input/output server (VIOS) cluster
US8589723B2 (en) * 2010-12-22 2013-11-19 Intel Corporation Method and apparatus to provide a high availability solid state drive
US20120215970A1 (en) * 2011-02-22 2012-08-23 Serge Shats Storage Management and Acceleration of Storage Media in Clusters
US10949415B2 (en) 2011-03-31 2021-03-16 International Business Machines Corporation Logging system using persistent memory
JP5514169B2 (ja) 2011-08-15 2014-06-04 株式会社東芝 情報処理装置および情報処理方法
CN102521389A (zh) * 2011-12-23 2012-06-27 天津神舟通用数据技术有限公司 一种混合使用固态硬盘和传统硬盘的postgresql数据库集群系统及其优化方法
JP5867902B2 (ja) * 2012-03-06 2016-02-24 日本電気株式会社 データベースの非同期レプリケーション方式
CN102681952B (zh) * 2012-05-12 2015-02-18 北京忆恒创源科技有限公司 将数据写入存储设备的方法与存储设备
CN103365987B (zh) * 2013-07-05 2017-04-12 北京人大金仓信息技术股份有限公司 一种基于共享磁盘架构的集群数据库系统及数据处理方法
CN103729442B (zh) * 2013-12-30 2017-11-24 华为技术有限公司 记录事务日志的方法和数据库引擎
US10169169B1 (en) * 2014-05-08 2019-01-01 Cisco Technology, Inc. Highly available transaction logs for storing multi-tenant data sets on shared hybrid storage pools
CN103984768B (zh) * 2014-05-30 2017-09-29 华为技术有限公司 一种数据库集群管理数据的方法、节点及系统

Also Published As

Publication number Publication date
CN103984768A (zh) 2014-08-13
US10379977B2 (en) 2019-08-13
RU2653254C1 (ru) 2018-05-07
EP3147797A4 (en) 2017-04-26
KR101983208B1 (ko) 2019-08-28
US20170083419A1 (en) 2017-03-23
WO2015180434A1 (zh) 2015-12-03
KR20170013319A (ko) 2017-02-06
US20190317872A1 (en) 2019-10-17
CN103984768B (zh) 2017-09-29
US10860447B2 (en) 2020-12-08
EP3147797A1 (en) 2017-03-29
EP3147797B1 (en) 2021-01-06
JP2017517087A (ja) 2017-06-22

Similar Documents

Publication Publication Date Title
JP6457633B2 (ja) データベース・クラスタのデータ管理方法、ノード、及びシステム
US9367598B2 (en) Merging an out of synchronization indicator and a change recording indicator in response to a failure in consistency group formation
US10817386B2 (en) Virtual machine recovery method and virtual machine management device
US20170300505A1 (en) Snapshot creation
US9052833B2 (en) Protection of former primary volumes in a synchronous replication relationship
US9483352B2 (en) Process control systems and methods
CN106776147B (zh) 一种差异数据备份方法和差异数据备份装置
JP2016513306A (ja) データ格納方法、データストレージ装置、及びストレージデバイス
US9317383B2 (en) Communication of conditions at a primary storage controller to a host
KR20140101689A (ko) 리던던트 2차 스토리지 캐시의 재구성
WO2018076633A1 (zh) 一种远程数据复制方法、存储设备及存储系统
US9436554B2 (en) Information processing apparatus and data repairing method
CN110825562A (zh) 数据备份方法、装置、系统和存储介质
JP6376626B2 (ja) データ格納方法、データストレージ装置、及びストレージデバイス
US11269922B2 (en) Database server, database management method, and storage medium

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170126

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170126

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180306

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180601

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20181120

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20181220

R150 Certificate of patent or registration of utility model

Ref document number: 6457633

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250