RU2653254C1 - Способ, узел и система управления данными для кластера базы данных - Google Patents

Способ, узел и система управления данными для кластера базы данных Download PDF

Info

Publication number
RU2653254C1
RU2653254C1 RU2016152176A RU2016152176A RU2653254C1 RU 2653254 C1 RU2653254 C1 RU 2653254C1 RU 2016152176 A RU2016152176 A RU 2016152176A RU 2016152176 A RU2016152176 A RU 2016152176A RU 2653254 C1 RU2653254 C1 RU 2653254C1
Authority
RU
Russia
Prior art keywords
node
port
transaction log
ssd
port ssd
Prior art date
Application number
RU2016152176A
Other languages
English (en)
Inventor
Вэй ЮЙ
Хуэйцзюнь ЛЮ
Original Assignee
Хуавэй Текнолоджиз Ко., Лтд.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Хуавэй Текнолоджиз Ко., Лтд. filed Critical Хуавэй Текнолоджиз Ко., Лтд.
Application granted granted Critical
Publication of RU2653254C1 publication Critical patent/RU2653254C1/ru

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/27Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor
    • G06F16/275Synchronous replication
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2053Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
    • G06F11/2094Redundant storage or storage space
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2023Failover techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2046Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant where the redundant components share persistent storage
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2053Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
    • G06F11/2089Redundant storage control functionality
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2053Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
    • G06F11/2089Redundant storage control functionality
    • G06F11/2092Techniques of failing over between control units
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/11File system administration, e.g. details of archiving or snapshots
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/11File system administration, e.g. details of archiving or snapshots
    • G06F16/113Details of archiving
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/13File access structures, e.g. distributed indices
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/17Details of further file system functions
    • G06F16/1734Details of monitoring file system events, e.g. by the use of hooks, filter drivers, logs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/18File system types
    • G06F16/182Distributed file systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/18File system types
    • G06F16/182Distributed file systems
    • G06F16/1824Distributed file systems implemented using Network-attached Storage [NAS] architecture
    • G06F16/1827Management specifically adapted to NAS
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/0614Improving the reliability of storage systems
    • G06F3/0619Improving the reliability of storage systems in relation to data integrity, e.g. data losses, bit errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0638Organizing or formatting or addressing of data
    • G06F3/064Management of blocks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0646Horizontal data movement in storage systems, i.e. moving data in between storage devices or systems
    • G06F3/065Replication mechanisms
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/067Distributed or networked storage systems, e.g. storage area networks [SAN], network attached storage [NAS]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/0671In-line storage system
    • G06F3/0683Plurality of storage devices
    • G06F3/0688Non-volatile semiconductor memory arrays
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1471Saving, restoring, recovering or retrying involving logging of persistent data for recovery
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2201/00Indexing scheme relating to error detection, to error correction, and to monitoring
    • G06F2201/80Database-specific techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2201/00Indexing scheme relating to error detection, to error correction, and to monitoring
    • G06F2201/805Real-time
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2201/00Indexing scheme relating to error detection, to error correction, and to monitoring
    • G06F2201/82Solving problems relating to consistency
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2213/00Indexing scheme relating to interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
    • G06F2213/0026PCI express

Abstract

Изобретение относится к средствам управления данными для кластера базы данных. Технический результат заключается в повышении надежности работы и быстродействия системы управления. Система включает первый двухпортовый SSD, второй двухпортовый SSD, первый узел, второй узел и третий узел, где первый двухпортовый SSD подсоединен к первому узлу и второму узлу и второй двухпортовый SSD подсоединен ко второму узлу и третьему узлу; и первый узел записывает журнал транзакций в первый двухпортовый SSD, когда первый узел дает сбой, второй узел получает журнал транзакций из первого двухпортового SSD и в соответствии с журналом транзакций оперирует данными, которые хранятся в первом узле, второй узел или третий узел могут использовать двухпортовый SSD для считывания информации журнала отказавшего узла, и заменить первый узел для обеспечения внешнего обслуживания, повышая тем самым скорость восстановления кластера и улучшая доступность системы. 3 н. и 15 з.п.ф-лы. 8 ил.

Description

ОБЛАСТЬ ТЕХНИКИ, К КОТОРОЙ ОТНОСИТСЯ ИЗОБРЕТЕНИЕ
[0001] Настоящее изобретение относится к базам данных и, в частности касается способа, узла и системы управления данными для кластера базы данных.
УРОВЕНЬ ТЕХНИКИ
[0002] Все узлы в кластере базы данных подсоединены к совместно используемому дисковому массиву, а в этом совместно используемом дисковом массиве хранятся данные всех упомянутых узлов. Если узел в кластере базы данных дает сбой, то данные, обновленные в этом узле, нельзя использовать в течение некоторого периода времени, что отрицательно сказывается на выполнении ряда услуг. Обычным решением этой проблемы является обновление журнала узла в совместно используемом дисковом массиве, и тогда, если один узел дает сбой, то другой узел считывает журнал этого узла для выполнения восстановления; если другой узел не может считать журнал упомянутого узла, то данные в этом узле нельзя будет восстановить до тех пор, пока узел не будет перезапущен, и тогда обеспечивается внешнее обслуживание; однако такая обработка связана с очень большими временными затратами, что сказывается на качестве обслуживания. Вдобавок, при обновлении информации в журнале в совместно используемом дисковом массиве рабочие характеристики кластерной системы также могут сильно пострадать из-за большого количества синхронизированных журналов.
СУЩНОСТЬ ИЗОБРЕТЕНИЯ
[0003] Варианты осуществления настоящего изобретения обеспечивает способ, узел и систему управления данными для кластера базы данных, с тем чтобы решить проблему отрицательного воздействия на качество обслуживания, обусловленную процессом восстановления узла, требующим больших временных затрат, после того как узел дал сбой.
[0004] Согласно первому аспекту обеспечен способ управления данными для кластера базы данных, где кластер базы данных включает в себя первый двухпортовый твердотельный диск SSD, второй двухпортовый твердотельный диск SSD, первый узел, второй узел и третий узел, где первый двухпортовый SSD подсоединен к первому узлу и второму узлу, а второй двухпортовый SSD подсоединен ко второму и третьему узлу; причем способ включает в себя:
запись первым узлом журнала транзакций в первый двухпортовый SSD, так что в том случае, когда первый узел дает сбой, второй узел получает журнал транзакций из первого двухпортового SSD, и второй узел в соответствии с журналом транзакций оперирует данными, которые хранятся в первом узле, до того, как первый узел дал сбой; или
запись первым узлом журнала транзакций в первый двухпортовый SSD, так что в том случае, когда первый узел дает сбой, после того как второй узел получает журнал транзакций из первого двухпортового SSD, второй узел посылает журнал транзакций на третий узел, а третий узел оперирует данными, которые хранятся в первом узле, до того, как первый узел дал сбой, причем
третий узел, первый узел и второй узел способны передавать данные друг другу.
[0005] В первом возможном варианте реализации первого аспекта способ дополнительно включает в себя:
получение первым узлом на предварительно установленном периоде времени журнала транзакций, который имеется после контрольной точки первого двухпортового SSD, и архивирование в совместно используемый дисковый массив журнала транзакций, который имеется после указанной контрольной точки.
[0006] Со ссылкой на первый аспект или первый возможный вариант реализации первого аспекта во втором возможном варианте реализации первого аспекта способ дополнительно включает в себя:
в том случае, когда и первый узел, и второй узел являются экземплярами базы данных, непосредственное выполнение первым узлом передачи данных со вторым узлом путем использования первого двухпортового SSD.
[0007] Со ссылкой на второй возможный вариант реализации первого аспекта в третьем возможном варианте реализации первого аспекта по меньшей мере один порт в первом двухпортовом SSD является портом PCIE; и по меньшей мере один порт во втором двухпортовом SSD является портом PCIE.
[0008] Со ссылкой на первый аспект или любой один из возможных вариантов реализации (с первого по третий) первого аспекта в четвертом возможном варианте реализации первого аспекта способ дополнительно включает в себя:
запуск вторым узлом другого процесса базы данных для оперирования данными, которые хранятся в первом узле до того, как первый узел дал сбой, где другой процесс базы данных не зависит от первоначального процесса базы данных во втором узле.
[0009] Со ссылкой на первый аспект или любой один из возможных вариантов реализации (с первого по третий) первого аспекта в пятом возможном варианте реализации первого аспекта способ дополнительно включает в себя:
запуск третьим узлом другого процесса базы данных для оперирования данными, которые хранятся в первом узле до того, как первый узел дал сбой, где другой процесс базы данных не зависит от первоначального процесса базы данных в третьем узле.
[0010] Согласно второму аспекту обеспечен первый узел, где кластер базы данных включает в себя первый двухпортовый твердотельный диск SSD, второй двухпортовый твердотельный диск SSD, первый узел, второй узел и третий узел, где первый двухпортовый SSD подсоединен к первому узлу и второму узлу и второй двухпортовый SSD подсоединен ко второму узлу и третьему узлу; причем первый узел включает в себя:
блок записи, выполненный с возможностью записи журнала транзакций в первый двухпортовый SSD, так что в том случае, когда первый узел дает сбой, второй узел получает журнал транзакций из первого двухпортового SSD, и второй узел в соответствии с журналом транзакций оперирует данными, которые хранятся в первом узле, до того, как первый узел дал сбой; или
запись журнала транзакций в первый двухпортовый SSD, так что в том случае, когда первый узел дает сбой, после того как второй узел получает журнал транзакций из первого двухпортового SSD, второй узел посылает журнал транзакций на третий узел, а третий узел оперирует данными, которые хранятся в первом узле, до того, как первый узел дал сбой, причем
третий узел, первый узел и второй узел способны передавать данные друг другу.
[0011] В первом возможном варианте реализации второго аспекта первый узел дополнительно включает в себя:
блок получения, выполненный с возможностью получения на предварительно установленном периоде времени журнала транзакций, который имеется после контрольной точки первого двухпортового SSD; и
блок архивирования, выполненный с возможностью архивирования в совместно используемый дисковый массив, журнала транзакций, который имеется после указанной контрольной точки.
[0012] Со ссылкой на второй аспект или первый возможный вариант реализации второго аспекта во втором возможном варианте реализации второго аспекта первый узел дополнительно включает в себя:
блок передачи, выполненный с возможностью: в том случае, когда и первый узел, и второй узел являются экземплярами базы данных, непосредственного выполнения передачи данных со вторым узлом путем использования первого двухпортового SSD.
[0013] Со ссылкой на второй возможный вариант реализации второго аспекта в третьем возможном варианте реализации второго аспекта по меньшей мере один порт в первом двухпортовом SSD является портом PCIE; и по меньшей мере один порт во втором двухпортовом SSD является портом PCIE.
[0014] Со ссылкой на второй аспект или любой один из возможных вариантов реализации (с первого по третий) второго аспекта в четвертом возможном варианте реализации второго аспекта первый узел дополнительно включает в себя:
блок запуска, выполненный с возможностью запуска другого процесса базы данных для оперирования данными, которые хранятся в первом узле до того, как первый узел дал сбой, где другой процесс базы данных не зависит от первоначального процесса базы данных во втором узле.
[0015] Со ссылкой на второй аспект или любой один из возможных вариантов реализации (с первого по третий) второго аспекта в пятом возможном варианте реализации второго аспекта первый узел дополнительно включает в себя:
блок запуска, выполненный с возможностью запуска другого процесса базы данных для оперирования данными, которые хранятся в первом узле до того, как первый узел дал сбой, где другой процесс базы данных не зависит от первоначального процесса базы данных в третьем узле.
[0016] Согласно третьему аспекту обеспечена система управления данными для кластера базы данных, где кластер базы данных включает в себя первый двухпортовый твердотельный диск SSD, второй двухпортовый твердотельный диск SSD, первый узел, второй узел и третий узел, где первый двухпортовый SSD подсоединен к первому узлу и второму узлу и второй двухпортовый SSD подсоединен ко второму узлу и третьему узлу;
первый узел выполнен с возможностью записи журнала транзакций в первый двухпортовый SSD; и
второй узел выполнен с возможностью: в том случае, когда первый узел дает сбой, получения журнала транзакций из первого двухпортового SSD и оперирования в соответствии с журналом данными, которые хранятся в первом узле, до того, как первый узел дал сбой; или
в том случае, когда первый узел дает сбой, получения журнала транзакций из первого двухпортового SSD, посылки журнала транзакций на третий узел, а третий узел оперирует данными согласно журналу транзакций, которые хранятся в первом узле, до того, как первый узел дал сбой, причем
третий узел, первый узел и второй узел способны передавать данные друг другу.
[0017] В первом возможном варианте реализации третьего аспекта первый узел дополнительно включает в себя:
блок получения, выполненный с возможностью получения на предварительно установленном периоде времени журнала транзакций, который имеется после контрольной точки двухпортового SSD; и
блок архивирования, выполненный с возможностью архивирования в совместно используемый дисковый массив, журнала транзакций, который имеется после указанной контрольной точки.
[0018] Со ссылкой на третий аспект или первый возможный вариант реализации третьего аспекта во втором возможном варианте реализации третьего аспекта первый узел дополнительно включает в себя:
блок передачи, выполненный с возможностью: в том случае, когда и первый узел, и второй узел являются экземплярами базы данных, непосредственного выполнения передачи данных со вторым узлом путем использования первого двухпортового SSD.
[0019] Со ссылкой на второй возможный вариант реализации третьего аспекта в третьем возможном варианте реализации третьего аспекта по меньшей мере один порт в первом двухпортовом SSD является портом PCIE; и по меньшей мере один порт во втором двухпортовом SSD является портом PCIE.
[0020] Со ссылкой на третий аспект или любой один из возможных вариантов реализации (с первого по третий) третьего аспекта в четвертом возможном варианте реализации третьего аспекта первый узел дополнительно включает в себя:
блок запуска, выполненный с возможностью запуска другого процесса базы данных для оперирования данными, которые хранятся в первом узле до того, как первый узел дал сбой, где другой процесс базы данных не зависит от первоначального процесса базы данных во втором узле.
[0021] Со ссылкой на третий аспект или любой один из возможных вариантов реализации (с первого по третий) третьего аспекта в пятом возможном варианте реализации третьего аспекта блок запуска выполнен с возможностью запуска другого процесса базы данных для оперирования данными, которые хранятся в первом узле до того, как первый узел дал сбой, где другой процесс базы данных не зависит от первоначального процесса базы данных в третьем узле.
[0022] Варианты осуществления настоящего изобретения обеспечивают способ управления данными для кластера базы данных, где кластер базы данных включает в себя первый двухпортовый твердотельный диск SSD, второй двухпортовый твердотельный диск SSD, первый узел, второй узел и третий узел, где первый двухпортовый SSD подсоединен к первому узлу и второму узлу и второй двухпортовый SSD подсоединен ко второму узлу и третьему узлу; и первый узел записывает журнал транзакций в первый двухпортовый SSD, так что в том случае, когда первый узел дает сбой, второй узел получает журнал транзакций из первого двухпортового SSD, и второй узел в соответствии с журналом транзакций оперирует данными, которые хранятся в первом узле, до того как первый узел дал сбой; или первый узел записывает журнал транзакций в первый двухпортовый SSD, так что в том случае, когда первый узел дает сбой, после того как второй узел получает журнал транзакций из первого двухпортового SSD, второй узел посылает журнал транзакций на третий узел, а третий узел оперирует данными, которые хранятся в первом узле, до того как первый узел дал сбой, где между третьим узлом, первым узлом и вторым узлом может выполняться передача данных, так что, когда первый узел дал сбой, второй узел или третий узел могут использовать двухпортовый SSD для считывания информации журнала отказавшего узла, и после выполнения восстановления заменить первый узел для обеспечения внешнего обслуживания, повышая тем самым скорость восстановления кластера и улучшая доступность системы.
КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ
[0023] Для более понятного описания технических решений в вариантах осуществления настоящего изобретения далее кратко представлены сопроводительные чертежи, необходимые для описания вариантов осуществления изобретения или известного уровня техники. Разумеется, что эти сопроводительные чертежи в последующем описании демонстрируют лишь некоторые варианты осуществления настоящего изобретения, а специалисты в данной области техники на основе этих сопроводительных чертежей могут получить другие чертежи, не прикладывая каких-либо творческих усилий.
[0024] Фиг. 1 - схематическое представление системы управления данными для кластера базы данных согласно варианту осуществления настоящего изобретения;
[0025] фиг. 2 - схематическое представление структуры управления данными для кластера базы данных согласно варианту осуществления настоящего изобретения;
[0026] фиг. 3 - схематическое представление структуры управления данными для кластера базы данных согласно варианту осуществления настоящего изобретения;
[0027] фиг. 4 - схематическое представление структуры управления данными для кластера базы данных согласно варианту осуществления настоящего изобретения;
[0028] фиг. 5 - схематическое представление способа управления данными для кластера базы данных согласно варианту осуществления настоящего изобретения;
[0029] фиг. 6 - блок-схема последовательности операций способа управления данными для кластера базы данных согласно варианту осуществления настоящего изобретения;
[0030] фиг. 7 - структурная схема устройств первого узла согласно варианту осуществления настоящего изобретения; и
[0031] фиг. 8 - структурная схема устройств первого узла согласно варианту осуществления настоящего изобретения.
ПОДРОБНОЕ ОПИСАНИЕ ИЗОБРЕТЕНИЯ
[0032] Далее со ссылками на сопроводительные чертежи в вариантах осуществления настоящего изобретения следует подробное описание технических решений, принятых в вариантах осуществления настоящего изобретения. Очевидно, что описанные варианты осуществления - это лишь некоторые примеры, а не все возможные варианты осуществления настоящего изобретения.
[0033] Обратимся к фиг. 1, где представлена структурная схема системы управления данными для кластера базы данных согласно варианту осуществления настоящего изобретения. Как показано на фиг. 1, система включает в себя:
первый двухпортовый твердотельный диск (SSD) 101, второй двухпортовый SSD 102, первый узел 103, второй узел 104 и третий узел 105, где первый двухпортовый -SSD 101 подсоединен к первому узлу 103 и второму узлу 104, второй двухпортовый SSD 102 подсоединен ко второму узлу 104 и третьему узлу 105, а второй узел 104 отдельно подсоединен к первому двухпортовому SSD 101 и второму двухпортовому SSD 102;
первый узел 103 выполнен с возможностью записи журнала транзакций в первый двухпортовый SSD 101; и
второй узел 104 выполнен с возможностью: в том случае, когда первый узел 103 дает сбой, получения журнала транзакций из первого двухпортового SSD 101, и оперирования согласно журналу транзакций данными, которые хранятся в первому узле, до того, как первый узел 103 дает сбой; или
в том случае, когда первый узел 103 дает сбой, для получения журнала транзакций из первого двухпортового SSD 101, посылки журнала транзакций на третий узел 105, и третий узел 105 согласно журналу транзакций, оперирует данными, которые хранятся в первом узле, до того, как первый узел 103 дает сбой, где
передача данных может выполняться между третьим узлом 105, первым узлом 103 и вторым узлом 104.
[0034] Первый узел 103 дополнительно включает в себя:
блок получения, выполненный с возможностью получения на предварительно установленном периоде времени журнала транзакций, который имеется после контрольной точки первого двухпортового SSD; и
блок архивирования, выполненный с возможностью архивирования в совместно используемый дисковый массив журнала транзакций, который имеется после указанной контрольной точки.
[0035] Обратимся, в частности, к фигурам 2-4, на которых схематически представлены структуры управления данными для кластера базы данных согласно вариантам осуществления настоящего изобретения. Как показано на фиг. 2, первый узел создает журнал транзакций, который записывается в SSD в процессе записи фонового журнала; первый узел регулярно считывает из указанного SSD журнал, который имеется после контрольной точки, и в процесс архивирования журнала первого узла в совместно используемый дисковый массив архивируется журнал, имеющийся после контрольной точки; и после восстановления путем считывания журнала первого узла посредством использования первого двухпортового SSD второй узел заменяет в работе первый узел.
[0036] Как показано на фиг. 3, после того как первый узел дал сбой, второй узел считывает журнал первого узла из первого двухпортового SSD, второй узел запускает новый процесс базы данных для выполнения восстановления, и после выполнения восстановления второй узел обеспечивает внешнее обслуживание, и второй узел считывает журнал первого узла, используя первый двухпортовый SSD, и передает этот журнал на другой узел для выполнения восстановления
[0037] Как показано на фиг. 4, после того как первый узел дает сбой, второй узел считывает журнал первого узла из указанного SSD, второй узел передает указанный журнал на третий узел, а после получения данных первого узла и после выполнения операции восстановления третий узел обеспечивает внешнее обслуживание.
[0038] Первый узел дополнительно включает в себя:
блок передачи, выполненный с возможностью: в том случае, когда и первый узел, и второй узел являются экземплярами базы данных, непосредственно выполняет передачу данных со вторым узлом, используя первый двухпортовый SSD.
[0039] В частности, на фиг. 5 схематически представлен способ управления данными для кластера базы данных согласно варианту осуществления настоящего изобретения.
[0040] Как показано на фиг. 5, в том случае, когда и первый узел, и второй узел являются экземплярами базы данных, передача данных может непосредственно выполняться с использованием сдвоенного порта, с тем чтобы избежать проблемы низкой скорости передачи данных, вызванной, например, перегрузкой сети.
[0041] Необязательно, по меньшей мере один порт в первом двухпортовом SSD является портом PCIE, и по меньшей мере один порт во втором двухпортовом SSD является портом PCIE.
[0042] Необязательно, первый узел дополнительно включает в себя:
блок запуска, выполненный с возможностью запуска другого процесса базы данных для оперирования данными, которые хранятся в первом узле, до того, как первый узел дает сбой, где этот другой процесс базы данных не зависит от первоначального процесса базы данных во втором узле.
[0043] Необязательно, первый узел дополнительно включает в себя:
блок запуска, выполненный с возможностью запуска другого процесса базы данных для оперирования данными, которые хранятся в первому узле, до того, как первый узел дает сбой, где этот другой процесс базы данных не зависит от первоначального процесса базы данных в третьем узле.
[0044] Этот вариант осуществления настоящего изобретения обеспечивает систему управления данными для кластера базы данных, где кластер базы данных включает в себя первый двухпортовый SSD, второй двухпортовый SSD, первый узел, второй узел и третий узел, где первый двухпортовый SSD подсоединен к первому узлу и второму узлу и второй двухпортовый SSD подсоединен ко второму узлу и третьему узлу; и первый узел записывает журнал транзакций в первый двухпортовый SSD, так что в том случае, когда первый узел дает сбой, второй узел получает журнал транзакций из первого двухпортового SSD, и второй узел в соответствии с журналом транзакций оперирует данными, которые хранятся в первом узле, до того как первый узел дал сбой; или первый узел записывает журнал транзакций в первый двухпортовый SSD, так что в том случае, когда первый узел дает сбой, после того как второй узел получает журнал транзакций из первого двухпортового SSD, второй узел посылает журнал транзакций на третий узел, а третий узел оперирует данными, которые хранятся в первом узле, до того как первый узел дал сбой, где третий узел, первый узел и второй узел способны передавать данные друг другу, так что, когда первый узел дал сбой, второй узел или третий узел могут использовать двухпортовый SSD для считывания информации журнала отказавшего узла, и после выполнения восстановления заменить первый узел для обеспечения внешнего обслуживания, повышая тем самым скорость восстановления кластера и улучшая доступность системы.
[0045] Обратимся к фиг. 6, где представлена блок-схема последовательности операций способа управления данными для кластера базы данных согласно варианту осуществления настоящего изобретения. Первый двухпортовый SSD подсоединен к первому узлу и второму узлу, второй двухпортовый SSD подсоединен ко второму узлу и третьему узлу, и второй узел отдельно подсоединен к первому двухпортовому SSD и второму двухпортовому SSD. Способ включает в себя:
[0046] Шаг 601: Первый узел записывает журнал транзакций в первый двухпортовый SSD, так что в том случае, когда первый узел дает сбой, второй узел получает журнал транзакций из первого двухпортового SSD, и второй узел в соответствии с журналом транзакций оперирует данными, которые хранятся в первом узле, до того, как первый узел дал сбой; или
первый узел записывает журнал транзакций в первый двухпортовый SSD, так что в том случае, когда первый узел дает сбой, после того как второй узел получает журнал транзакций из первого двухпортового SSD, второй узел посылает журнал транзакций на третий узел, а третий узел оперирует данными, которые хранятся в первом узле, до того, как первый узел дал сбой, причем
третий узел, первый узел и второй узел способны передавать данные друг другу.
[0047] Способ дополнительно включает в себя:
получение первым узлом на предварительно установленном периоде времени журнала транзакций, который имеется после контрольной точки первого двухпортового SSD, и архивирование в совместно используемый дисковый массив журнала транзакций, который имеется после указанной контрольной точки.
[0048] Способ дополнительно включает в себя:
в том случае, когда и первый узел, и второй узел являются экземплярами базы данных, непосредственное выполнение первым узлом передачи данных со вторым узлом путем использования первого двухпортового SSD.
[0049] По меньшей мере один порт в первом двухпортовом SSD является портом PCIE; и по меньшей мере один порт во втором двухпортовом SSD является портом PCIE.
[0050] За подробностями обратитесь к описанию фигур 2-4.
[0051] Способ дополнительно включает в себя:
запуск вторым узлом другого процесса базы данных для оперирования данными, которые хранятся в первом узле до того, как первый узел дал сбой, где другой процесс базы данных не зависит от первоначального процесса базы данных во втором узле.
[0052] Способ дополнительно включает в себя:
запуск третьим узлом другого процесса базы данных для оперирования данными, которые хранятся в первом узле до того, как первый узел дал сбой, где другой процесс базы данных не зависит от первоначального процесса базы данных в третьем узле.
[0053] За подробностями обратитесь к описанию фиг. 5.
[0054] Этот вариант осуществления настоящего изобретения обеспечивает способ управления данными для кластера базы данных, где кластер базы данных включает в себя первый двухпортовый твердотельный диск SSD, второй двухпортовый SSD, первый узел, второй узел и третий узел, где первый двухпортовый SSD подсоединен к первому узлу и второму узлу и второй двухпортовый SSD подсоединен ко второму узлу и третьему узлу; и первый узел записывает журнал транзакций в первый двухпортовый SSD, так что в том случае, когда первый узел дает сбой, второй узел получает журнал транзакций из первого двухпортового SSD, и второй узел в соответствии с журналом транзакций оперирует данными, которые хранятся в первом узле, до того как первый узел дал сбой; или первый узел записывает журнал транзакций в первый двухпортовый SSD, так что в том случае, когда первый узел дает сбой, после того как второй узел получает журнал транзакций из первого двухпортового SSD, второй узел посылает журнал транзакций на третий узел, а третий узел оперирует данными, которые хранятся в первом узле, до того как первый узел дал сбой, где третий узел, первый узел и второй узел способны передавать данные друг другу, так что, когда первый узел дал сбой, второй узел или третий узел могут использовать двухпортовый SSD для считывания информации журнала отказавшего узла, и после выполнения восстановления заменить первый узел для обеспечения внешнего обслуживания, повышая тем самым скорость восстановления кластера и улучшая доступность системы.
[0055] Обратимся к фиг. 7, где представлена структурная схема устройств первого узла согласно варианту осуществления настоящего изобретения. Как показано на фиг.7,
кластер базы данных включает в себя первый двухпортовый твердотельный диск SSD, второй двухпортовый SSD, первый узел, второй узел и третий узел, где первый двухпортовый SSD подсоединен к первому узлу и второму узлу и второй двухпортовый SSD подсоединен ко второму узлу и третьему узлу; причем первый узел включает в себя:
блок 701 записи, выполненный с возможностью записи журнала транзакций в первый двухпортовый SSD, так что в том случае, когда первый узел дает сбой, второй узел получает журнал транзакций из первого двухпортового SSD, и второй узел в соответствии с журналом транзакций оперирует данными, которые хранятся в первом узле, до того, как первый узел дал сбой; или
запись журнала транзакций в первый двухпортовый SSD, так что в том случае, когда первый узел дает сбой, после того как второй узел получает журнал транзакций из первого двухпортового SSD, второй узел посылает журнал транзакций на третий узел, а третий узел оперирует данными, которые хранятся в первом узле, до того, как первый узел дал сбой, причем
третий узел, первый узел и второй узел способны передавать данные друг другу.
[0056] Необязательно, первый узел дополнительно включает в себя:
блок получения, выполненный с возможностью получения на предварительно установленном периоде времени журнала транзакций, который имеется после контрольной точки первого двухпортового SSD; и
блок архивирования, выполненный с возможностью архивирования в совместно используемый дисковый массив, журнала транзакций, который имеется после указанной контрольной точки.
[0057] Необязательно, первый узел дополнительно включает в себя:
блок передачи, выполненный с возможностью: в том случае, когда и первый узел, и второй узел являются экземплярами базы данных, непосредственного выполнения передачи данных со вторым узлом путем использования первого двухпортового SSD.
[0058] По меньшей мере один порт в первом двухпортовом SSD является портом PCIE; и по меньшей мере один порт во втором двухпортовом SSD является портом PCIE.
[0059] Необязательно, первый узел дополнительно включает в себя:
блок запуска, выполненный с возможностью запуска другого процесса базы данных для оперирования данными, которые хранятся в первом узле до того, как первый узел дал сбой, где другой процесс базы данных не зависит от первоначального процесса базы данных во втором узле.
[0060] Необязательно, первый узел дополнительно включает в себя:
блок запуска, выполненный с возможностью запуска другого процесса базы данных для оперирования данными, которые хранятся в первом узле до того, как первый узел дал сбой, где другой процесс базы данных не зависит от первоначального процесса базы данных в третьем узле.
[0061] За подробностями обратитесь к описаниям фигур 2-5.
[0062] Этот вариант осуществления настоящего изобретения обеспечивает первый узел, где первый узел записывает журнал транзакций в первый двухпортовый SSD, так что в том случае, когда первый узел дает сбой, второй узел получает журнал транзакций из первого двухпортового SSD, и второй узел в соответствии с журналом транзакций оперирует данными, которые хранятся в первом узле, до того как первый узел дал сбой; или первый узел записывает журнал транзакций в первый двухпортовый SSD, так что в том случае, когда первый узел дает сбой, после того как второй узел получает журнал транзакций из первого двухпортового SSD, второй узел посылает журнал транзакций на третий узел, а третий узел оперирует данными, которые хранятся в первом узле, до того как первый узел дал сбой, где третий узел, первый узел и второй узел способны передавать данные друг другу, так что, когда первый узел дал сбой, второй узел или третий узел могут использовать двухпортовый SSD для считывания информации журнала отказавшего узла, и после выполнения восстановления заменить первый узел для обеспечения внешнего обслуживания, повышая тем самым скорость восстановления кластера и улучшая доступность системы.
[0063] На фиг.8 представлена структурная схема устройств первого узла согласно варианту осуществления настоящего изобретения. Обратимся к фиг. 8, где показан первый узел 800 согласно варианту осуществления настоящего изобретения, причем конкретный вариант осуществления настоящего изобретения не ограничивает специфическую реализацию первого узла. Первый узел 800 включает в себя:
процессор 801, коммуникационный интерфейс802, память 803 и шину 804.
[0064] Процессор 801, коммуникационный интерфейс 802 и память 803 полностью взаимосвязаны путем использования шины 804.
[0065] Коммуникационный интерфейс 802 выполнен с возможностью осуществления связи с другим устройством, а процессор 801 выполнен с возможностью выполнения программы.
[0066] В частности, указанная программа может включать в себя программный код, а программный код включает в себя команду компьютерной операции.
[0067] Процессор 801 может представлять собой центральный обрабатывающий блок (CPU) или прикладную специализированную интегральную схему (ASIC) или может быть выполнен в виде одной или нескольких интегральных схем реализации вариантов осуществления настоящего изобретения.
[0068] Память 803 выполнена с возможностью хранения программы. Память 803 может представлять собой энергозависимую память, такую как память с произвольным доступом (RAM) или энергонезависимую память, такую как память только для считывания(ROM), флэш-память, накопитель на жестком диске (HDD) или твердотельный накопитель (SSD). Процессор 801 выполняет нижеследующий способ согласно программной инструкции, хранящейся в памяти 803:
запись первым узлом журнала транзакций в первый двухпортовый SSD, так что в том случае, когда первый узел дает сбой, второй узел получает журнал транзакций из первого двухпортового SSD, и второй узел в соответствии с журналом транзакций оперирует данными, которые хранятся в первом узле, до того, как первый узел дал сбой; или
запись первым узлом журнала транзакций в первый двухпортовый SSD, так что в том случае, когда первый узел дает сбой, после того как второй узел получает журнал транзакций из первого двухпортового SSD, второй узел посылает журнал транзакций на третий узел, а третий узел оперирует данными, которые хранятся в первом узле, до того, как первый узел дал сбой, причем
третий узел, первый узел и второй узел способны передавать данные друг другу.
[0069] Способ дополнительно включает в себя:
получение первым узлом на предварительно установленном периоде времени журнала транзакций, который имеется после контрольной точки первого двухпортового SSD, и архивирование в совместно используемый дисковый массив, журнала транзакций, который имеется после указанной контрольной точки.
[0070] Способ дополнительно включает в себя:
в том случае, когда и первый узел, и второй узел являются экземплярами базы данных, непосредственное выполнение первым узлом передачи данных со вторым узлом путем использования первого двухпортового SSD.
[0071] По меньшей мере один порт в первом двухпортовом SSD является портом PCIE; и по меньшей мере один порт во втором двухпортовом SSD является портом PCIE.
[0072] Способ дополнительно включает в себя:
запуск вторым узлом другого процесса базы данных для оперирования данными, которые хранятся в первом узле до того, как первый узел дал сбой, где другой процесс базы данных не зависит от первоначального процесса базы данных во втором узле.
[0073] Способ дополнительно включает в себя:
запуск третьим узлом другого процесса базы данных для оперирования данными, которые хранятся в первом узле до того, как первый узел дал сбой, где другой процесс базы данных не зависит от первоначального процесса базы данных в третьем узле.
[0074] Этот вариант осуществления настоящего изобретения обеспечивает первый узел, где первый узел записывает журнал транзакций в первый двухпортовый SSD, так что в том случае, когда первый узел дает сбой, второй узел получает журнал транзакций из первого двухпортового SSD, и второй узел в соответствии с журналом транзакций оперирует данными, которые хранятся в первом узле, до того как первый узел дал сбой; или первый узел записывает журнал транзакций в первый двухпортовый SSD, так что в том случае, когда первый узел дает сбой, после того как второй узел получает журнал транзакций из первого двухпортового SSD, второй узел посылает журнал транзакций на третий узел, а третий узел оперирует данными, которые хранятся в первом узле, до того как первый узел дал сбой, где третий узел, первый узел и второй узел способны передавать данные друг другу, так что, когда первый узел дает сбой, второй узел или третий узел могут использовать двухпортовый SSD для считывания информации журнала отказавшего узла, и после выполнения восстановления заменить первый узел для обеспечения внешнего обслуживания, повышая тем самым скорость восстановления кластера и улучшая доступность системы.
[0075] Приведенные выше описания являются лишь примерными и конкретными вариантами реализации настоящего изобретения, и они не имеют своей целью ограничение объема защиты настоящего изобретения. Любые изменения или замены в техническом объеме, раскрытом в настоящем изобретении, которые без труда придут на ум специалистам в данной области техники, не должны выходить за рамки объема защиты настоящего изобретения. Таким образом, объем защиты настоящего изобретения должен соответствовать объему защиты формулы изобретения.

Claims (41)

1. Способ управления данными для кластера базы данных, где кластер базы данных содержит первый двухпортовый твердотельный диск SSD, второй двухпортовый SSD, первый узел, второй узел и третий узел, где первый двухпортовый SSD подсоединен к первому узлу и второму узлу, а второй двухпортовый SSD подсоединен ко второму узлу и третьему узлу; причем способ содержит:
запись первым узлом журнала транзакций в первый двухпортовый SSD, так что в том случае, когда первый узел дает сбой, второй узел получает журнал транзакций из первого двухпортового SSD и в соответствии с журналом транзакций оперирует данными, которые хранятся в первом узле, до того, как первый узел дал сбой; или
запись первым узлом журнала транзакций в первый двухпортовый SSD, так что в том случае, когда первый узел дает сбой, второй узел получает журнал транзакций из первого двухпортового SSD, и посылает журнал транзакций на третий узел, а третий узел оперирует данными, которые хранятся в первом узле, до того как первый узел дал сбой, причем
третий узел, первый узел и второй узел способны передавать данные друг другу.
2. Способ по п. 1, в котором способ дополнительно содержит:
получение первым узлом на предварительно установленном периоде времени журнала транзакций, который имеется после контрольной точки первого двухпортового SSD, и архивирование в совместно используемый дисковый массив, журнала транзакций, который имеется после указанной контрольной точки.
3. Способ по п. 1, в котором способ дополнительно содержит:
когда и первый узел, и второй узел являются экземплярами базы данных, непосредственное выполнение первым узлом передачи данных со вторым узлом путем использования первого двухпортового SSD.
4. Способ по п. 3, в котором по меньшей мере один порт в первом двухпортовом SSD является портом PCIE; и по меньшей мере один порт во втором двухпортовом SSD является портом PCIE.
5. Способ по п. 1, в котором способ дополнительно содержит:
запуск вторым узлом другого процесса базы данных для оперирования данными, которые хранятся в первом узле до того, как первый узел дал сбой, где другой процесс базы данных не зависит от первоначального процесса базы данных во втором узле.
6. Способ по п. 1, в котором способ дополнительно содержит:
запуск третьим узлом другого процесса базы данных для оперирования данными, которые хранятся в первом узле до того, как первый узел дал сбой, где другой процесс базы данных не зависит от первоначального процесса базы данных в третьем узле.
7. Первый узел для управления данными в кластере базы данных, в котором кластер базы данных включает в себя первый двухпортовый твердотельный диск SSD, второй двухпортовый SSD, первый узел, второй узел и третий узел, где первый двухпортовый SSD подсоединен к первому узлу и второму узлу и второй двухпортовый SSD подсоединен ко второму узлу и третьему узлу; причем первый узел содержит: процессор, коммуникационный интерфейс и память, способные осуществлять связь друг с другом через шину, где процессор выполнен с возможностью выполнения исполняемой программы, хранящейся в указанной памяти, с тем чтобы:
записывать журнал транзакций в первый двухпортовый SSD, так что, когда первый узел дает сбой, второй узел считывает журнал транзакций из первого двухпортового SSD, и в соответствии с журналом транзакций оперирует данными, которые хранятся в первом узле, до того, как первый узел дал сбой; или
записывать журнал транзакций в первый двухпортовый SSD, так что в том случае, когда первый узел дает сбой, второй узел считывает журнал транзакций из первого двухпортового SSD и посылает журнал транзакций на третий узел, а третий узел оперирует данными, которые хранятся в первом узле, до того, как первый узел дал сбой, причем
третий узел, первый узел и второй узел способны передавать данные друг другу.
8. Первый узел по п. 7, в котором процессор узел дополнительно выполнен с возможностью выполнения исполняемой программы, хранящейся в указанной памяти, с тем чтобы:
получать на предварительно установленном периоде времени журнал транзакций, который имеется после контрольной точки первого двухпортового SSD; и
архивировать в совместно используемый дисковый массив, журнала транзакций, который имеется после указанной контрольной точки.
9. Первый узел по п.7, в котором процессор дополнительно выполнен с возможностью выполнения исполняемой программы, хранящейся в указанной памяти, с тем чтобы:
непосредственно выполнить передачу данных со вторым узлом путем использования первого двухпортового SSD, когда и первый узел, и второй узел являются экземплярами базы данных.
10. Первый узел по п. 9, в котором по меньшей мере один порт в первом двухпортовом SSD является портом PCIE; и по меньшей мере один порт во втором двухпортовом SSD является портом PCIE.
11. Первый узел по п. 7, в котором процессор дополнительно выполнен с возможностью выполнения исполняемой программы, хранящейся в указанной памяти, с тем чтобы:
запустить другой процесс базы данных для оперирования данными, которые хранятся в первом узле до того, как первый узел дал сбой, где другой процесс базы данных не зависит от первоначального процесса базы данных во втором узле.
12. Первый узел по п. 7, в котором процессор дополнительно выполнен с возможностью выполнения исполняемой программы, хранящейся в указанной памяти, с тем чтобы:
запустить другой процесс базы данных для оперирования данными, которые хранятся в первом узле до того, как первый узел дал сбой, где другой процесс базы данных не зависит от первоначального процесса базы данных в третьем узле.
13. Система управления данными, содержащая первый двухпортовый твердотельный диск SSD, второй двухпортовый SSD, первый узел, второй узел и третий узел, где первый двухпортовый SSD подсоединен к первому узлу и второму узлу, а второй двухпортовый SSD подсоединен ко второму узлу и третьему узлу;
первый узел выполнен с возможностью записи журнала транзакций в первый двухпортовый SSD; и
второй узел выполнен с возможностью: получения журнала транзакций из первого двухпортового SSD, когда первый узел дает сбой, и оперирования согласно журналу транзакций данными, которые хранятся в первому узле, до того, как первый узел дает сбой; или
получения журнала транзакций из первого двухпортового SSD, когда первый узел дает сбой, и посылки журнала транзакций на третий узел, и третий узел согласно журналу транзакций, оперирует данными, которые хранятся в первом узле, до того, как первый узел дает сбой, где
третий узел, первый узел и второй узел способны передавать данные друг другу.
14. Система по п. 13, в которой первый узел дополнительно выполнен с возможностью: получения на предварительно установленном периоде времени журнала транзакций, который имеется после контрольной точки первого двухпортового SSD; и
блок архивирования в совместно используемый дисковый массив журнала транзакций, который имеется после указанной контрольной точки.
15. Система по п. 13, в которой первый узел дополнительно
выполнен с возможностью непосредственного выполнения передачи данных со вторым узлом путем использования первого двухпортового SSD когда и первый узел, и второй узел являются экземплярами базы данных.
16. Система по п. 15, в которой по меньшей мере один порт в первом двухпортовом SSD является портом PCIE, и по меньшей мере один порт во втором двухпортовом SSD является портом PCIE.
17. Система по п. 13, где первый узел дополнительно выполнен с возможностью:
запуска другого процесса базы данных для оперирования данными, которые хранятся в первому узле, до того, как первый узел дает сбой, где этот другой процесс базы данных не зависит от первоначального процесса базы данных во втором узле.
18. Система по п. 13, где первый узел дополнительно выполнен с возможностью:
запуска другого процесса базы данных для оперирования данными, которые хранятся в первом узле, до того, как первый узел дает сбой, где этот другой процесс базы данных на зависит от первоначального процесса базы данных в третьем узле.
RU2016152176A 2014-05-30 2014-11-25 Способ, узел и система управления данными для кластера базы данных RU2653254C1 (ru)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201410242052.X 2014-05-30
CN201410242052.XA CN103984768B (zh) 2014-05-30 2014-05-30 一种数据库集群管理数据的方法、节点及系统
PCT/CN2014/092140 WO2015180434A1 (zh) 2014-05-30 2014-11-25 一种数据库集群管理数据的方法、节点及系统

Publications (1)

Publication Number Publication Date
RU2653254C1 true RU2653254C1 (ru) 2018-05-07

Family

ID=51276740

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2016152176A RU2653254C1 (ru) 2014-05-30 2014-11-25 Способ, узел и система управления данными для кластера базы данных

Country Status (7)

Country Link
US (2) US10379977B2 (ru)
EP (1) EP3147797B1 (ru)
JP (1) JP6457633B2 (ru)
KR (1) KR101983208B1 (ru)
CN (1) CN103984768B (ru)
RU (1) RU2653254C1 (ru)
WO (1) WO2015180434A1 (ru)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103984768B (zh) * 2014-05-30 2017-09-29 华为技术有限公司 一种数据库集群管理数据的方法、节点及系统
CN106034137A (zh) * 2015-03-09 2016-10-19 阿里巴巴集团控股有限公司 用于分布式系统的智能调度方法及分布式服务系统
CN106960060B (zh) * 2017-04-10 2020-07-31 聚好看科技股份有限公司 一种数据库集群的管理方法及装置
CN109697110B (zh) * 2017-10-20 2023-01-06 阿里巴巴集团控股有限公司 事务协调处理系统、方法、装置及电子设备
US10754798B1 (en) * 2019-09-11 2020-08-25 International Business Machines Corporation Link speed recovery in a data storage system
CN111639008B (zh) * 2020-05-29 2023-08-25 杭州海康威视系统技术有限公司 基于双端口ssd的文件系统状态监测方法、装置及电子设备
KR102428587B1 (ko) 2022-04-13 2022-08-03 주식회사 비투엔 마이크로 서비스 아키텍처 기반의 트랜잭션 가용성과 성능 보장 처리 장치 및 방법

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110113279A1 (en) * 2009-11-12 2011-05-12 International Business Machines Corporation Method Apparatus and System for a Redundant and Fault Tolerant Solid State Disk
US20120036161A1 (en) * 2002-11-01 2012-02-09 Bluearc Uk Limited Distributed File System and Method
US20130013569A1 (en) * 2010-12-09 2013-01-10 Ibm Corporation Efficient Backup and Restore of Virtual Input/Output Server (VIOS) Cluster
RU2473981C2 (ru) * 2003-05-01 2013-01-27 Самсунг Электроникс Ко., Лтд. Устройство для воспроизведения данных с носителя записи

Family Cites Families (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0991183A (ja) * 1995-09-27 1997-04-04 Toshiba Corp データベースリカバリ装置
JP3094888B2 (ja) * 1996-01-26 2000-10-03 三菱電機株式会社 採番機構、データ整合性確認機構、トランザクション再実行機構及び分散トランザクション処理システム
US7028218B2 (en) * 2002-12-02 2006-04-11 Emc Corporation Redundant multi-processor and logical processor configuration for a file server
JP4141921B2 (ja) * 2003-08-29 2008-08-27 富士通株式会社 ファイル処理方法
US7168001B2 (en) * 2004-02-06 2007-01-23 Hewlett-Packard Development Company, L.P. Transaction processing apparatus and method
JP4920248B2 (ja) * 2005-12-02 2012-04-18 株式会社日立製作所 サーバの障害回復方法及びデータベースシステム
JP2007157150A (ja) * 2005-12-06 2007-06-21 Samsung Electronics Co Ltd メモリシステム及びそれを含むメモリ処理方法
US7725446B2 (en) * 2005-12-19 2010-05-25 International Business Machines Corporation Commitment of transactions in a distributed system
JP4856561B2 (ja) * 2007-01-31 2012-01-18 日本電信電話株式会社 ノード制御方法、ノード制御プログラムおよびノード
KR101144808B1 (ko) 2008-09-01 2012-05-11 엘지전자 주식회사 박막형 태양전지 제조방법 및 이를 이용한 박막형 태양전지
US8429134B2 (en) * 2009-09-08 2013-04-23 Oracle International Corporation Distributed database recovery
US8407403B2 (en) 2009-12-07 2013-03-26 Microsoft Corporation Extending SSD lifetime using hybrid storage
US8725951B2 (en) * 2010-04-12 2014-05-13 Sandisk Enterprise Ip Llc Efficient flash memory-based object store
JP2011227834A (ja) 2010-04-22 2011-11-10 Sony Corp 信号制御装置及び信号制御方法
US8666939B2 (en) * 2010-06-28 2014-03-04 Sandisk Enterprise Ip Llc Approaches for the replication of write sets
US8589723B2 (en) * 2010-12-22 2013-11-19 Intel Corporation Method and apparatus to provide a high availability solid state drive
US20120215970A1 (en) * 2011-02-22 2012-08-23 Serge Shats Storage Management and Acceleration of Storage Media in Clusters
US10949415B2 (en) 2011-03-31 2021-03-16 International Business Machines Corporation Logging system using persistent memory
JP5514169B2 (ja) * 2011-08-15 2014-06-04 株式会社東芝 情報処理装置および情報処理方法
CN102521389A (zh) * 2011-12-23 2012-06-27 天津神舟通用数据技术有限公司 一种混合使用固态硬盘和传统硬盘的postgresql数据库集群系统及其优化方法
JP5867902B2 (ja) * 2012-03-06 2016-02-24 日本電気株式会社 データベースの非同期レプリケーション方式
CN102681952B (zh) * 2012-05-12 2015-02-18 北京忆恒创源科技有限公司 将数据写入存储设备的方法与存储设备
CN103365987B (zh) * 2013-07-05 2017-04-12 北京人大金仓信息技术股份有限公司 一种基于共享磁盘架构的集群数据库系统及数据处理方法
CN103729442B (zh) * 2013-12-30 2017-11-24 华为技术有限公司 记录事务日志的方法和数据库引擎
US10169169B1 (en) * 2014-05-08 2019-01-01 Cisco Technology, Inc. Highly available transaction logs for storing multi-tenant data sets on shared hybrid storage pools
CN103984768B (zh) * 2014-05-30 2017-09-29 华为技术有限公司 一种数据库集群管理数据的方法、节点及系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120036161A1 (en) * 2002-11-01 2012-02-09 Bluearc Uk Limited Distributed File System and Method
RU2473981C2 (ru) * 2003-05-01 2013-01-27 Самсунг Электроникс Ко., Лтд. Устройство для воспроизведения данных с носителя записи
US20110113279A1 (en) * 2009-11-12 2011-05-12 International Business Machines Corporation Method Apparatus and System for a Redundant and Fault Tolerant Solid State Disk
US20130013569A1 (en) * 2010-12-09 2013-01-10 Ibm Corporation Efficient Backup and Restore of Virtual Input/Output Server (VIOS) Cluster

Also Published As

Publication number Publication date
KR20170013319A (ko) 2017-02-06
US20170083419A1 (en) 2017-03-23
EP3147797A4 (en) 2017-04-26
EP3147797A1 (en) 2017-03-29
CN103984768A (zh) 2014-08-13
JP6457633B2 (ja) 2019-01-23
US10379977B2 (en) 2019-08-13
CN103984768B (zh) 2017-09-29
KR101983208B1 (ko) 2019-08-28
JP2017517087A (ja) 2017-06-22
US20190317872A1 (en) 2019-10-17
EP3147797B1 (en) 2021-01-06
US10860447B2 (en) 2020-12-08
WO2015180434A1 (zh) 2015-12-03

Similar Documents

Publication Publication Date Title
RU2653254C1 (ru) Способ, узел и система управления данными для кластера базы данных
US10108367B2 (en) Method for a source storage device sending data to a backup storage device for storage, and storage device
US10261853B1 (en) Dynamic replication error retry and recovery
US11397648B2 (en) Virtual machine recovery method and virtual machine management device
EP3961365A1 (en) Synchronously replicating datasets and other managed objects to cloud-based storage systems
US9052833B2 (en) Protection of former primary volumes in a synchronous replication relationship
US20180101558A1 (en) Log-shipping data replication with early log record fetching
JP2016513306A (ja) データ格納方法、データストレージ装置、及びストレージデバイス
US11184435B2 (en) Message transmission method and apparatus in cluster file system
US20170139605A1 (en) Control device and control method
US11210003B2 (en) Method, device and computer program product for restoring data based on replacing child node identifiers with parent node identifier
US20170277439A1 (en) Techniques for Path Optimization in Storage Networks
US8745333B2 (en) Systems and methods for backing up storage volumes in a storage system
US11226875B2 (en) System halt event recovery
JP6376626B2 (ja) データ格納方法、データストレージ装置、及びストレージデバイス
CN104572350B (zh) 一种元数据处理方法及装置
US11249868B2 (en) Method of fault management in a network of nodes and associated part of network of nodes
CN114385412A (zh) 存储管理方法、设备和计算机程序产品
CN117130830A (zh) 对象的数据恢复方法、装置、计算机设备及存储介质
CN115202561A (zh) 用于管理存储系统的方法、设备和计算机程序产品
CN117076209A (zh) 执行计算任务的方法、装置和存储介质