CN105389368A - 一种mpp架构数据库集群元数据管理方法 - Google Patents

一种mpp架构数据库集群元数据管理方法 Download PDF

Info

Publication number
CN105389368A
CN105389368A CN201510778860.2A CN201510778860A CN105389368A CN 105389368 A CN105389368 A CN 105389368A CN 201510778860 A CN201510778860 A CN 201510778860A CN 105389368 A CN105389368 A CN 105389368A
Authority
CN
China
Prior art keywords
cluster
management
metadata
cluster metadata
clustered node
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510778860.2A
Other languages
English (en)
Inventor
赵伟
武新
王洪越
杨伟伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
TIANJIN NANKAI UNIVERSITY GENERAL DATA TECHNOLOGIES Co Ltd
Original Assignee
TIANJIN NANKAI UNIVERSITY GENERAL DATA TECHNOLOGIES Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by TIANJIN NANKAI UNIVERSITY GENERAL DATA TECHNOLOGIES Co Ltd filed Critical TIANJIN NANKAI UNIVERSITY GENERAL DATA TECHNOLOGIES Co Ltd
Priority to CN201510778860.2A priority Critical patent/CN105389368A/zh
Publication of CN105389368A publication Critical patent/CN105389368A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/27Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor
    • G06F16/273Asynchronous replication or reconciliation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Computing Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供一种MPP架构数据库集群元数据管理方法,通过在数据库集群中增加内存数据库,实现集群元数据的统一管理。采用本发明中的方法,可以保证数据库集群中集群元数据的一致性,以及实现快速写入及读取集群元数据,解决集群失效节点重新加入集群时集群元数据不一致问题,进而提高数据库集群的高可用性。

Description

一种MPP架构数据库集群元数据管理方法
技术领域
本发明涉及数据库集群的元数据管理技术,尤其涉及一种MPP架构数据库集群元数据管理方法。
背景技术
随着信息化技术的快速发展,一个企业的用户数量、数据量均呈现爆炸式增长,在业务量提高的同时,数据库的访问量和数据量快速增长对数据库处理能力和计算强度也相应增大,使得单一节点数据库根本无法承担。在这样一个背景下,大型分布式数据库集群产生了,所谓数据库集群,是指利用两台或多台数据库服务,构成一个虚拟单一数据库逻辑映像,像单数据库那样,向客户端提供透明的数据服务。
在数据库系统中,数据库的表(Table)、索引(Index)、视图(View)等数据库对象的定义称之为数据库元数据。对于单数据库,数据库元数据只有一份,保存在数据库服务中,由数据库自身管理,所有链接到数据库的客户端访问同一份数据库元数据,并依据元数据访问数据库中的数据。对于数据库集群,将数据库元数据称为集群元数据,根据架构的不同,集群元数据存放的位置也有所不同。目前,有两种主流的数据库集群架构,带中心节点的集群架构和不带中心节点的MPP架构。带中心节点的集群架构,集群元数据只有一份,由中心节点统一负责管理,应用客户端统一从中心节点接入数据库集群,并获得集群元数据和数据库集群提供的服务;不带中心节点的MPP架构,集群元数据有多份,每个集群节点一份,且完全相同,由各个集群节点自身维护,应用客户端可以从任意集群节点接入数据库集群,并获得一致的集群元数据和数据库集群提供的服务。
不带中心节点的MPP架构的数据库集群如图1所示,由多个集群节点组成,本例中由3个集群节点组成,每个集群节点运行一个独立的数据库,为满足数据库集群向客户端提供透明的数据服务需求——即无论客户端从哪个集群节点接入数据库集群都和接入单一数据库一样,数据库集群的每个集群节点所存储的集群元数据必须完全相同,由此,当连接到集群节点1的客户端发起一个管理元数据的请求(例如创建表Table1)时,该元数据变更需要在集群节点1、集群节点2和集群节点3上均实现才能够保证每个集群节点所存储的集群元数据是相同的,集群元数据管理流程参考图2所示。
在上述数据库集群中,现有集群元数据管理方法在处理单个客户端发起的多个管理元数据请求或者多个客户端发起不同的管理元数据请求时,可以保证每个集群节点所存储的集群元数据是相同的。但是,在高并发场景下,如果从不同集群节点接入的客户端同时发起相同的管理元数据请求,例如:接入集群节点1的客户端请求建表Table2(idint,namechar(20)),接入集群节点2的客户端请求建表Table2(idint))时,会导致同时失败或者部分成功,即在某些节点上创建为Table2(idint,namechar(20)),某些节点上创建为Table2(idint)),从而导致集群元数据不一致现象。此外,如果集群中某个集群节点失效,会导致在该失效集群节点无法进行管理元数据的操作,则在该集群节点恢复正常状态之前,集群无法管理元数据信息。综上所述,集群元数据管理方法亟待改进。
发明内容
本发明所要解决的技术问题是在现有技术的基础上,提出一种数据库集群元数据管理的系统组成和方法,从而解决数据库集群元数据管理过程中可能出现的集群元数据不一致问题,提高数据库集群的高可用性,为应用系统提供更高质量的服务。
为了解决上述技术问题,本发明所提出的一种MPP架构数据库集群元数据管理方法,包括如下步骤:
(1)MPP架构数据库集群设置内存数据库,所述内存数据库为分布式、可扩展的内存数据库,分布在每个集群节点;
(2)所述内存数据库虚拟为一个单一数据库为每个集群节点提供集群元数据管理服务。
进一步的,步骤(2)所述集群元数据管理服务流程为:
(21)某个集群节点接收到客户端的管理集群元数据请求以后,该集群节点将本次管理集群元数据请求发送给内存数据库;
(22)内存数据库执行集群元数据管理,并返回管理集群元数据响应消息给集群节点;
(23)集群节点发送管理集群元数据响应消息给客户端,客户端接收到管理集群元数据响应消息,本次元数据管理完成。
优选的,所述集群元数据管理包括实现集群元数据的增加、变更、删除和读取功能。
优选的,所述内存数据库与集群节点之间通过标准SQL接口完成集群元数据的管理。
本发明具有的优点和积极效果是:
1.保证集群元数据一致:内存数据库具备事务能力,提供ACID特性,集群元数据存储在内存数据库中,内存数据库自身可以保障数据的一致性;
2.集群元数据高可用:使用内存数据库管理集群元数据,对于每个集群节点来说,如同访问一个单点数据库,不需要关注集群元数据存储的位置,集群元数据的存储由内存数据库负责管理,内存数据库将数据库分布存储在每个集群节点上,本身具备高可用机制,即使有某个集群节点宕机,内存数据库依然可以对外提供服务;
3.快速恢复集群元数据管理功能:集群中某个集群节点失效脱离集群以后,当恢复该集群节点时,该集群节点自动加入内存数据库,并可以立即提供集群元数据管理功能;
4.并发管理集群元数据:内存数据库支持并发数据处理,由此,各个集群节点可并发的发起管理集群元数据请求。
附图说明
图1是数据库集群现状组成图的示意图;
图2是数据库集群现状元数据管理流程说明图;
图3是增加内存数据库的数据库集群组成的示意图;
图4是本发明实施例示意图;
图5是本发明的实施示意流程说明图。
具体实施方式
下面通过实施例对本发明作更详细的说明。
图3中,表示了增加内存数据库的数据库集群组成的示意图
图4为应用实例,可以看出,内存数据库采用了VoltDB数据库,分布式、可扩展,分布在每个集群节点,VoltDB与集群节点之间通过标准SQL接口完成集群元数据的增加、变更、删除和读取等功能。
图5给出了本发明的实施示意流程说明,具体包括以下步骤:
201:客户端1接入集群节点1,发送管理集群元数据请求,例如创建一个表Table1
202:集群节点1接收到客户端的管理集群元数据请求(建Table1),发送管理集群元数据请求给内存数据库
203:内存数据库管理集群元数据,创建表Table1成功,发管理集群元数据请求响应给集群节点1
204:集群节点1接收到发管理元数据响应消息后,发送发管理元数据响应消息给客户端1
205:客户端1接收到集群节点1的管理元数据响应消息(建表Table1成功),本次元数据管理完成
以上对本发明的实施例进行了详细说明,但所述内容仅为本发明的较佳实施例,不能被认为用于限定本发明的实施范围。凡依本发明范围所作的均等变化与改进等,均应仍归属于本专利涵盖范围之内。

Claims (4)

1.一种MPP架构数据库集群元数据管理方法,其特征在于,包括如下步骤:
(1)MPP架构数据库集群设置内存数据库,所述内存数据库为分布式、可扩展的内存数据库,分布在每个集群节点;
(2)所述内存数据库虚拟为一个单一数据库为每个集群节点提供集群元数据管理服务。
2.根据权利要求1所述的一种MPP架构数据库集群元数据管理方法,其特征在于,步骤(2)所述集群元数据管理服务流程为:
(21)某个集群节点接收到客户端的管理集群元数据请求以后,该集群节点将本次管理集群元数据请求发送给内存数据库;
(22)内存数据库执行集群元数据管理,并返回管理集群元数据响应消息给集群节点;
(23)集群节点发送管理集群元数据响应消息给客户端,客户端接收到管理集群元数据响应消息,本次元数据管理完成。
3.根据权利要求1或2所述的一种MPP架构数据库集群元数据管理方法,其特征在于,所述集群元数据管理包括实现集群元数据的增加、变更、删除和读取功能。
4.根据权利要求1或2所述的一种MPP架构数据库集群元数据管理方法,其特征在于,所述内存数据库与集群节点之间通过标准SQL接口完成集群元数据的管理。
CN201510778860.2A 2015-11-16 2015-11-16 一种mpp架构数据库集群元数据管理方法 Pending CN105389368A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510778860.2A CN105389368A (zh) 2015-11-16 2015-11-16 一种mpp架构数据库集群元数据管理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510778860.2A CN105389368A (zh) 2015-11-16 2015-11-16 一种mpp架构数据库集群元数据管理方法

Publications (1)

Publication Number Publication Date
CN105389368A true CN105389368A (zh) 2016-03-09

Family

ID=55421658

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510778860.2A Pending CN105389368A (zh) 2015-11-16 2015-11-16 一种mpp架构数据库集群元数据管理方法

Country Status (1)

Country Link
CN (1) CN105389368A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106250566A (zh) * 2016-08-31 2016-12-21 天津南大通用数据技术股份有限公司 一种分布式数据库及其数据运算的管理方法
WO2017157189A1 (en) * 2016-03-16 2017-09-21 Huawei Technologies Co., Ltd. Data streaming broadcasts in massively parallel processing databases

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005111788A3 (en) * 2004-05-07 2008-04-03 Asempra Technologies Inc Moving real-time data events across devices in a network
CN101697526A (zh) * 2009-10-10 2010-04-21 中国科学技术大学 分布式文件系统中元数据管理的负载均衡方法及其系统
CN102710790A (zh) * 2012-06-20 2012-10-03 深圳市远行科技有限公司 一种基于元数据管理的分布式缓存实现方法及系统
CN103116525A (zh) * 2013-01-24 2013-05-22 贺海武 一种Internet环境下MapReduce计算方法
CN104484470A (zh) * 2014-12-31 2015-04-01 天津南大通用数据技术股份有限公司 一种数据库集群元数据管理方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005111788A3 (en) * 2004-05-07 2008-04-03 Asempra Technologies Inc Moving real-time data events across devices in a network
CN101697526A (zh) * 2009-10-10 2010-04-21 中国科学技术大学 分布式文件系统中元数据管理的负载均衡方法及其系统
CN102710790A (zh) * 2012-06-20 2012-10-03 深圳市远行科技有限公司 一种基于元数据管理的分布式缓存实现方法及系统
CN103116525A (zh) * 2013-01-24 2013-05-22 贺海武 一种Internet环境下MapReduce计算方法
CN104484470A (zh) * 2014-12-31 2015-04-01 天津南大通用数据技术股份有限公司 一种数据库集群元数据管理方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017157189A1 (en) * 2016-03-16 2017-09-21 Huawei Technologies Co., Ltd. Data streaming broadcasts in massively parallel processing databases
CN106250566A (zh) * 2016-08-31 2016-12-21 天津南大通用数据技术股份有限公司 一种分布式数据库及其数据运算的管理方法

Similar Documents

Publication Publication Date Title
US11422982B2 (en) Scaling stateful clusters while maintaining access
CN109783438B (zh) 基于librados的分布式NFS系统及其构建方法
CN106446126B (zh) 一种海量空间信息数据存储管理方法及存储管理系统
CN102541990B (zh) 利用虚拟分区的数据库重新分布方法和系统
US20170220614A1 (en) Consistent ring namespaces facilitating data storage and organization in network infrastructures
CN103237046B (zh) 支持混合云存储应用的分布式文件系统及实现方法
CN105025053A (zh) 基于云存储技术的分布式文件的上传方法及其系统
WO2019001017A1 (zh) 集群间数据迁移方法、系统、服务器及计算机存储介质
CN109194711B (zh) 一种组织架构的同步方法、客户端、服务端及介质
CN102930062A (zh) 一种数据库快速水平扩展的方法
CN103631924B (zh) 一种分布式数据库平台的应用方法和系统
CN103595797B (zh) 一种分布式存储系统中的缓存方法
US9836516B2 (en) Parallel scanners for log based replication
CN106293490A (zh) 数据存储、读取的方法、装置及系统
CN103067488A (zh) 一种统一存储的实现方法
CN104484470A (zh) 一种数据库集群元数据管理方法
CN104462185A (zh) 一种基于混合结构的数字图书馆云存储系统
US10929100B2 (en) Mitigating causality discrepancies caused by stale versioning
CN110784498B (zh) 一种个性化数据容灾方法及装置
US10152493B1 (en) Dynamic ephemeral point-in-time snapshots for consistent reads to HDFS clients
CN104054076B (zh) 数据存储方法、数据库存储节点故障处理方法及装置
CN105354250A (zh) 一种面向云存储的数据存储方法及装置
CN107832159A (zh) 管理分布式锁的方法和计算机可读存储介质
CN105069151A (zh) HBase二级索引构建装置和方法
CN105426469A (zh) 一种数据库集群元数据管理方法及系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20160309

RJ01 Rejection of invention patent application after publication