CN112835915B - Mpp数据库系统、数据存储方法及数据查询方法 - Google Patents
Mpp数据库系统、数据存储方法及数据查询方法 Download PDFInfo
- Publication number
- CN112835915B CN112835915B CN201911167039.1A CN201911167039A CN112835915B CN 112835915 B CN112835915 B CN 112835915B CN 201911167039 A CN201911167039 A CN 201911167039A CN 112835915 B CN112835915 B CN 112835915B
- Authority
- CN
- China
- Prior art keywords
- data
- nodes
- node
- public
- shared storage
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/23—Updating
- G06F16/2308—Concurrency control
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/14—Error detection or correction of the data by redundancy in operation
- G06F11/1402—Saving, restoring, recovering or retrying
- G06F11/1446—Point-in-time backing up or restoration of persistent data
- G06F11/1448—Management of the data involved in backup or backup restore
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2453—Query optimisation
- G06F16/24532—Query optimisation of parallel queries
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明实施例涉及数据库技术领域,公开了一种MPP数据库系统、数据存储方法及数据查询方法,该系统包括:管理节点和多个数据节点组,所述管理节点和每一个所述数据节点通过高速通信网络通信互联;所述管理节点用于管理所述MPP数据库的资源,监控所述MPP数据库的运行;每一个所述数据节点组包括多个数据节点和共享存储模块,每一个所述数据节点均与所述共享存储模块通信互联;所述数据节点用于存储非公共数据的片段,所述共享存储模块用于存储公共数据,每一所述数据节点组的共享存储模块所存储的公共数据相同;所述数据节点访问所述数据节点所在的数据节点组的共享存储模块,以获取所述公共数据。通过上述系统,优化了公共数据的存储。
Description
技术领域
本发明实施例涉及数据库技术领域,具体涉及一种MPP数据库系统、数据存储方法及数据查询方法。
背景技术
大规模并行处理数据库是一种非共享型的数据库集群。在该数据库集群中,每一个节点是一个单独的数据库。每一个节点拥有自己的CPU、内存和磁盘。节点之间的信息交互通过节点之间的高速通信网络实现。在大规模并行处理数据库架构中,数据进行分布式存储,从而提高了系统的性能。但是,对于一些公共数据,例如,维度表,在进行分布式存储后,需要从所有节点获取全量的维度表信息,降低了数据库集群的并发分析性能。
现有技术中将公共数据复制到所有数据节点上,每个节点均包含一份完整的公共数据,从而实现从一个节点上就可以获取全量的维度表信息。
在实现本发明实施例的过程中,发明人发现:现有技术中的方法在存在很多公共数据的情况下会造成数据库集群存储空间的浪费。
发明内容
鉴于上述问题,本发明实施例提供了一种MPP数据库系统、数据存储方法及数据查询方法,克服了上述问题或者至少部分地解决了上述问题。
根据本发明实施例的一个方面,提供了一种MPP数据库系统,所述系统包括:
管理节点和多个数据节点组,所述管理节点和每一个所述数据节点通过高速通信网络通信互联;
所述管理节点用于管理所述MPP数据库的资源,监控所述MPP数据库的运行;
每一个所述数据节点组包括多个数据节点和共享存储模块,每一个所述数据节点均与所述共享存储模块通信互联,每一个所述数据节点组的共享存储模块之间通信互联;
所述数据节点用于存储非公共数据的片段,所述共享存储模块用于存储公共数据,每一所述数据节点组的共享存储模块所存储的公共数据相同;
所述数据节点访问所述数据节点所在的数据节点组的共享存储模块,以获取所述公共数据。
在一种可选的方式中,所述非公共数据的片段平均存储在不同的所述数据节点上。
在一种可选的方式中,所述非公共数据包括多个数据表,每一个数据表包括多个片段,所有数据表的片段平均存储在不同的所述数据节点上。
在一种可选的方式中,同一数据节点组内的数据节点存储有该数据节点组内其他数据节点上片段的备份。
在一种可选的方式中,所述备份包括主备份和从备份,每一个片段的主备份和从备份存储在不同的数据节点上。
在一种可选的方式中,所述管理节点包括主管理节点和从管理节点,所述从管理节点是所述主管理节点的备份节点。
根据本发明实施例的另一方面,提供了一种数据存储方法,所述方法应用于MPP数据库系统,所述MPP数据库系统包括多个数据节点组,每一个数据节点组包括多个数据节点和共享存储模块,所述方法包括:
确定所述数据的数据类型,所述数据类型包括公共数据和非公共数据;
如果所述数据为公共数据,将所述数据存储至每一个所述数据节点组内的共享存储模块中;
如果所述数据为非公共数据,将所述数据的片段存储至所述数据节点中。
在一种可选的方式中,如果所述数据为非公共数据,将所述数据存储至所述数据节点中,包括:
将所述非公共数据中的每一数据表分为多个片段;
通过哈希分布算法将所述多个片段平均存储至不同的所述数据节点中。
根据本发明实施例的另一方面,提供了一种数据查询方法,所述方法应用于MPP数据库系统,所述MPP数据库系统包括多个数据节点组,每一个数据节点组包括多个数据节点和共享存储模块,其特征在于,所述方法包括:
获取数据查询请求;
根据所述数据查询请求确定待查询数据的数据类型;
如果所述待查询数据为公共数据,则从任意一个数据节点组的共享内存中获取所述待查询数据;
如果所述待查询数据为非公共数据,则根据所述待查询数据包含的字段查询包含该字段的数据节点,得到包含该字段的片段;
将所有所述片段合并,得到所述待查询数据。
根据本发明实施例的又一方面,提供了一种计算设备,包括处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行上述的一种数据存储方法,以及,上述的一种数据查询方法。
本发明实施例将数据节点组成数据节点组,数据节点组中包括共享存储模块,用于存储公共数据。节点组中的节点通过访问共享存储模块可以获得全量的公共数据,从而实现公共数据的快速查询,提高了MPP数据库的并发分析性能;此外,数据节点存储有非公共数据的片段,由于非公共数据的片段相较于公共数据内存占用更少,从而减少了数据节点的数据存储,提高了数据节点的性能。
上述说明仅是本发明实施例技术方案的概述,为了能够更清楚了解本发明实施例的技术手段,而可依照说明书的内容予以实施,并且为了让本发明实施例的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了本发明实施例提供的一种MPP数据库系统的结构示意图;
图2示出了本发明另一实施例提供的一种MPP数据库系统的结构示意图;
图3示出了本发明实施例提供的一种数据存储方法的流程图;
图4示出了本发明实施例提供的一种数据查询方法的流程图;
图5示出了本发明实施例提供的一种计算设备的结构示意图。
具体实施方式
下面将参照附图更详细地描述本发明的示例性实施例。虽然附图中显示了本发明的示例性实施例,然而应当理解,可以以各种形式实现本发明而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本发明,并且能够将本发明的范围完整的传达给本领域的技术人员。
本发明实施例的应用场景是大规模并行处理(massively parallel processing,MPP)数据库的数据存储。本发明实施例提出了一种MPP数据库的架构,该MPP数据库包括多个数据节点组,每一个数据节点组包括多个数据节点。数据节点组中的共享存储模块可以存储公共数据。每一个数据节点组中的共享存储模块所存储的公共数据相同。本发明实施例实现了从一个节点组上获取公共数据,节约了数据节点的内存。下面对本发明的各具体实施例进行说明。
图1示出了本发明实施例的一种MPP数据库系统的结构示意图。如图1所示,该系统包括管理节点10和多个数据节点组20。管理节点10和每一个数据节点20通过高速通信网络进行通信。其中,高速通信网络可以是任何一种高速网,例如,以太网、光纤等。
管理节点10用于管理MPP数据库的资源,监控MPP数据库的运行。具体的,管理节点10用于监控MPP数据库中各个功能单元和物理资源的运行情况。例如,监控数据节点组中各数据节点接受数据、存储数据和发送数据的功能;监控数据节点组中共享存储模块的物理资源。
数据节点组20本发明实施例的MPP数据库系统的基本单元。在MPP数据库扩容时,以数据节点组为单位进行数据节点的增加。数据节点组20包括多个数据节点21和共享存储模块22。每一个数据节点21均与共享存储模块22通信互联,以获取共享存储模块中的数据。每一个数据节点组20中所包含的数据节点21的具体数量不限,每一个数据节点组20中所包含的数据节点21的数量可以相同,也可以不同。当一个数据节点组20中的数据节点21的数量过多时,多个数据节点21同时访问共享存储模块22,造成共享存储模块22的工作效率降低。因此,一个数据节点组20中所包含的数据节点21的数量不宜过多。本发明实施例中,每一个数据节点组20中所包含的数据节点21的数量相同,均包含3个数据节点。如图1所示,数据节点1、数据节点2和数据节点3均属于同一个数据节点组,数据节点4、数据节点5和数据节点6属于同一个数据节点组。每一个数据节点21均与共享存储模块22通信互联,以获取共享存储模块22中存储的数据。
在该系统中,数据节点21的操作系统、CPU、内存、磁盘等都是独立的,不存在共享,从而保证了MPP数据库系统的高并发性。数据节点21用于存储非公共数据片段。其中,非公共数据片段是整个非公共数据的一部分。例如,非公共数据包括多个数据表,多个数据表通过哈希分布被分配到每个数据节点,每一个数据表作为一个非公共数据片段存储在其中一个数据节点上。当需要访问某一个数据表时,通过哈希分布记录的该数据表的键值可以直接访问该数据表所在所在的数据节点,从而获取完整的数据表。
共享存储模块22是数据节点组20内的共享存储空间。共享存储模块22用于存储公共数据,例如,维度表数据。维度表数据用于表示所存储的数据中使用标识进行指示的字段与该标识之间的对应关系。例如,在通信运营业务中,每一个数据表包含了进行通信业务的相关信息。例如,某一个数据表包含有签约该通信运营商的三千万客户信息,客户信息字典包括如表1所示的如下字段:
表1
字段 | 数据类型 | 字段含义 |
user_id | number(11) | 客户编码 |
name | varchar2 | 姓名 |
sex | number(1) | 性别 |
age | number(5) | 年龄 |
city_id | number(3) | 地市 |
count_id | number(3) | 区县编码 |
在表1中,sex、city_id等字段可以用标识指示。例如,对于字段sex,用1表示男性,用2表示女性。此时,通过维度表存储关键字与该关键字所表示的字段之间的对应关系。以sex为例,该字段所对应的维度表如表2所示。
表2
字段 | 数据类型 | 字段含义 |
1 | varchar2 | 男 |
2 | varchar2 | 女 |
共享存储模块22由管理节点10进行管理。在管理节点10中存储有共享存储模块22的所有公共数据的信息。管理节点10周期性的对共享存储模块22进行检测,并设定共享存储模块22的存储容量阈值。当共享存储模块22中的公共数据达到存储容量阈值时,对共享存储模块22中的公共数据进行清理或扩容,以使共享存储模块22正常工作。每一个数据节点组20的共享存储模块22所存储的公共数据相同。当任意一个数据节点21需要获取公共数据时,可以从该数据节点21所属的数据节点组20的共享存储模块中获取公共数据。
本发明实施例将数据节点组成数据节点组,数据节点组中包括共享存储模块,用于存储公共数据。节点组中的节点通过访问共享存储模块可以获得全量的公共数据,从而实现公共数据的快速查询,提高了MPP数据库的并发分析性能;此外,数据节点存储有非公共数据的片段,由于非公共数据的片段相较于公共数据内存占用更少,从而减少了数据节点的数据存储,提高了数据节点的性能。
在一些实施例中,数据节点组20的共享存储模块22之间通信互联,实现每一数据节点组20的共享存储模块22之间公共数据的共享。当其中一个数据节点组20的共享存储模块22发生故障时,可以通过访问其他数据节点组20的共享存储模块22获取公共数据,以进行数据恢复,从而提高了公共数据存储的安全性和稳定性。
在一些实施例中,非公共数据的片段平均存储在不同的数据节点21上。每一个片段所占用的内存大致相同。应理解,本发明实施例中的“平均”是相对平均,而不是绝对平均。在一些情况下,非公共数据的片段无法绝对的进行平均。例如,在一些实施例中,非公共数据的片段共有N个,数据节点21共有M个,当N不是M的整数倍时,非公共数据的片段无法绝对平均的存储在数据节点21上。通过平均进行存储,当需要全量的非公共数据时,每一个数据节点21的访问时间大致相同,从而提高数据库的工作效率。
在一些实施例中,非公共数据包括多个数据表。每一个数据表可以作为一个片段存储在数据节点21上。当需要获取某一个数据表时,访问该数据表所在的数据节点21即可。
在另外一些实施例中,将每一个数据表分为多个片段。每一个数据表分为片段的具体个数可以依该数据表的具体情况而定。例如,在一种实施例中,所有数据表所占用的内存为P兆,所有数据表共分为Q个片段,则每一个片段的内存为P/Q,则对于一个占用内存为A兆的数据表,其划分的数据片段个数为A/(P/Q)。将数据表划分为片段之后,将所有片段通过哈希分布算法平均存储在不同的数据节点21上。图2示本发明另一实施例的一种MPP数据库系统的结构示意图。在本实施例中,非公共数据包括多个数据表,其中包括数据表1、数据表2、数据表3和数据表4,数据表1的其中三个片段表1-1、表1-2和表1-3分别存储在数据节点1、数据节点3和数据节点4上;数据表2的其中一个片段表2-1存储在数据节点2上;数据表3的其中一个片段表3-1存储在数据节点5上;表4的其中一个片段表4-2存储在数据节点6上。其他的数据表以及上述各数据表的其他片段未在图2中穷举。通过上述方式,避免了某些数据节点21的内存占用率过大,提高了数据节点的工作性能。
在一些实施例中,同一数据节点组20内的数据节点22存储有该数据节点组20内其他数据节点22上片段的备份。如图2所示,在存储有表1-1的数据节点上,还存储有表2-1和表1-2的备份。通过本实施例,当其中一个数据节点22出现数据丢失等故障时,可以通过与同一数据节点组内的其他数据节点之间的通信实现数据恢复。
在一些实施例中,请继续参阅图2,上述备份包括主备份和从备份,主备份和从备份存储在不同的数据节点上。例如,数据节点1上除存储有表1-1,还存储有表1-2的主备份以及表2-1的从备份,数据节点2上除存储有表2-1,还存储有表1-1的主备份以及表1-2的从备份,数据节点3上存储有表1-2、表1-2的主备份以及表1-1的从备份。应理解,一个片段的从备份的数量可以为多个,优选的,从备份的数量为一个,以降低从备份所占用的数据节点的内存空间。当某一个数据节点故障时,优先获取同一数据节点组内其他数据节点的主备份,当主备份无法获取时,获取从备份,从而进一步保证了数据的安全性。
在一些实施例中,管理节点10包括主管理节点和从管理节点,从管理节点是主管理节点的备份节点。当主管理节点和从管理节点均正常时,由主管理节点对MPP数据库的资源进行管理,并监控MPP数据库的运行。当主管理节点发生故障时,从管理节点主动替代主管理节点提供资源管理服务。通过本发明实施例,提高了MPP数据库资源管理的稳定性。
图3是本发明实施例的一种数据存储方法的流程图,该方法应用于MPP数据库系统中,MPP数据库系统包括管理节点和数据节点组,数据节点组包括多个数据节点和共享存储模块。该方法包括以下步骤:
步骤110:确定待存储数据的数据类型。
其中,数据类型包括公共数据和非公共数据。待存储数据包含有数据标识,该数据标识用于表示带存储数据的数据类型。本发明实施例并不限定数据标识的具体内容和具体形式。在一种实施方式中,数据标识为待存储数据包含的字段,根据该字段确定数据类型。例如,某一待存储数据包含的字段为维度表信息,则该存储数据为非公共数据。
步骤120:如果待存储数据为公共数据,将待存储数据存储至每一个数据节点组内的共享存储模块中。
其中,每一个数据节点组内的共享存储模块所存储的数据相同,均为待存储的公共数据。数节点组内的数据节点可以访问共享存储模块,以获取公共数据。
步骤130:如果待存储数据为非公共数据,将待存储数据的片段存储至数据节点中。
其中,在将待存储数据存储至数据节点中时,将待存储数据划分为若干片段,将所有片段通过哈希分布算法平均存储在不同的数据节点中。
本发明实施例将公共数据存储至数据节点组的共享存储模块中,数据节点组中的数据节点通过访问共享存储模块可以获得公共数据,从而实现了公共数据的快速查询,提高了MPP数据库的并发分析性能;此外,由于非公共数据的片段相较于公共数据内存占用更少,将非公共数据的片段存储至数据节点中减少了数据节点的数据存储,提高了数据节点的性能。
图4示出了本发明实施例的一种数据查询方法的流程图,该方法应用于MPP数据库系统,MPP数据库系统包括多个数据节点组,每一个数据节点组包括多个数据节点和共享存储模块,该方法包括如图4所示的如下步骤:
步骤210:获取数据查询请求。
其中,数据查询请求来自于用户端的应用程序。该应用程序是和业务相关的应用,查询请求中包括待查询数据的相关字段。例如,在查询客户信息时,包含了客户编码这一字段。
步骤220:根据数据查询请求确定待查询数据的数据类型。
其中,数据类型包括公共数据和非公共数据。根据查询请求中包含的待查询数据的相关字段可以确定待查询数据的数据类型。在一些实施例中,用户查询请求中包括公共数据和非公共数据,则返回该查询请求对应的待查询数据时,待查询数据同时包括查询字段相关的公共数据和非公共数据。
步骤230:如果待查询数据为公共数据,则从任意一个数据节点组的共享存储模块中获取待查询数据。
其中,每一个数据节点组中的共享存储模块用于存储公共数据,且不同的数据节点组的共享存储模块所存储的公共数据相同。
步骤240:如果待查询数据为非公共数据,则根据待查询数据包含的字段查询包含该字段的数据节点,得到包含该字段的片段。
其中,非公共数据以片段的形式存储在不同的数据节点上。因此,在查询的时候,需要查询所有包含该字段的数据节点,以获取所有包含该字段的非公共数据。
步骤250:将所有片段合并,得到待查询数据。
将所有包含该字段的片段合并,得到待查询数据。
通过本发明实施例,实现了公共数据的快速查询,相较于现有技术中将分布式存储的公共数据合并的查询方式,本发明实施例对于公共数据的查询效率更高;此外,本发明实施例能够实现非公共数据的查询。
本发明实施例提供了一种非易失性存储介质,所述存储介质存储有至少一可执行指令,该可执行指令可执行上述实施例中的一种数据存储方法。
图5示出了本发明实施例的一种计算设备的结构示意图,本发明具体实施例并不对计算设备的具体实现做限定。
如图5所示,该计算设备可以包括:处理器(processor)402、通信接口(Communications Interface)404、存储器(memory)406、以及通信总线408。
其中:处理器402、通信接口404、以及存储器406通过通信总线408完成相互间的通信。通信接口404,用于与其它设备比如客户端或其它服务器等的网元通信。处理器402,用于执行程序410,具体可以执行上述用于数据存储方法实施例中的相关步骤。
具体地,程序410可以包括程序代码,该程序代码包括操作指令。
处理器402可能是中央处理器CPU,或者是特定集成电路ASIC(ApplicationSpecific Integrated Circuit),或者是被配置成实施本发明实施例的一个或多个集成电路。计算设备包括的一个或多个处理器,可以是同一类型的处理器,如一个或多个CPU;也可以是不同类型的处理器,如一个或多个CPU以及一个或多个ASIC。
存储器406,用于存放程序410。存储器406可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
程序410具体可以用于使得处理器402执行图3所示的步骤110~步骤130,以及,图4中的步骤210~步骤250。
在此提供的算法或显示不与任何特定、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明实施例也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本发明并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明实施例的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。上述实施例中的步骤,除有特殊说明外,不应理解为对执行顺序的限定。
Claims (9)
1.一种MPP数据库系统,其特征在于,所述系统包括:
管理节点和多个数据节点组,所述管理节点和每一个所述数据节点通过高速通信网络通信互联;
所述管理节点用于管理所述MPP数据库的资源,监控所述MPP数据库的运行;
每一个所述数据节点组包括多个数据节点和共享存储模块,每一个所述数据节点均与所述共享存储模块通信互联,每一个所述数据节点组的共享存储模块之间通信互联;同一数据节点组内的数据节点存储有该数据节点组内其他数据节点上片段的备份;
所述数据节点用于存储非公共数据的片段,所述共享存储模块用于存储公共数据,每一所述数据节点组的共享存储模块所存储的公共数据相同;
所述数据节点访问所述数据节点所在的数据节点组的共享存储模块,以获取所述公共数据。
2.根据权利要求1所述的系统,其特征在于,所述非公共数据的片段平均存储在不同的所述数据节点上。
3.根据权利要求2所述的系统,其特征在于,所述非公共数据包括多个数据表,每一个数据表包括多个片段,所有数据表的片段平均存储在不同的所述数据节点上。
4.根据权利要求1所述的系统,其特征在于,所述备份包括主备份和从备份,每一个片段的主备份和从备份存储在不同的数据节点上。
5.根据权利要求1所述的系统,其特征在于,所述管理节点包括主管理节点和从管理节点,所述从管理节点是所述主管理节点的备份节点。
6.一种数据存储方法,其特征在于,所述方法应用于如权利要求1-5任一项所述的MPP数据库系统,所述MPP数据库系统包括多个数据节点组,每一个数据节点组包括多个数据节点和共享存储模块,所述方法包括:
确定待存储数据的数据类型,所述数据类型包括公共数据和非公共数据;
如果所述待存储数据为公共数据,将所述数据存储至每一个所述数据节点组内的共享存储模块中;
如果所述待存储数据为非公共数据,将所述数据的片段存储至所述数据节点中。
7.根据权利要求6所述的方法,其特征在于,如果所述数据为非公共数据,将所述数据存储至所述数据节点中,包括:
将所述非公共数据中的每一数据表分为多个片段;
通过哈希分布算法将所述多个片段平均存储至不同的所述数据节点中。
8.一种数据查询方法,所述方法应用于如权利要求1-5任一项所述的MPP数据库系统,所述MPP数据库系统包括多个数据节点组,每一个数据节点组包括多个数据节点和共享存储模块,其特征在于,所述方法包括:
获取数据查询请求;
根据所述数据查询请求确定待查询数据的数据类型;
如果所述待查询数据为公共数据,则从任意一个数据节点组的共享存储模块中获取所述待查询数据;
如果所述待查询数据为非公共数据,则根据所述待查询数据包含的字段查询包含该字段的数据节点,得到包含该字段的片段;
将所有所述片段合并,得到所述待查询数据。
9.一种计算设备,其特征在于,包括处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行权利要求6或7所述的一种数据存储方法,以及,权利要求8所述的一种数据查询方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911167039.1A CN112835915B (zh) | 2019-11-25 | 2019-11-25 | Mpp数据库系统、数据存储方法及数据查询方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911167039.1A CN112835915B (zh) | 2019-11-25 | 2019-11-25 | Mpp数据库系统、数据存储方法及数据查询方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112835915A CN112835915A (zh) | 2021-05-25 |
CN112835915B true CN112835915B (zh) | 2023-07-18 |
Family
ID=75922305
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911167039.1A Active CN112835915B (zh) | 2019-11-25 | 2019-11-25 | Mpp数据库系统、数据存储方法及数据查询方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112835915B (zh) |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107508694A (zh) * | 2016-06-14 | 2017-12-22 | 中兴通讯股份有限公司 | 一种集群内的节点管理方法及节点设备 |
CN108431804A (zh) * | 2015-10-23 | 2018-08-21 | 甲骨文国际公司 | 将多个容器数据库分组为单个容器数据库集群的能力 |
CN108509296A (zh) * | 2018-03-19 | 2018-09-07 | 网宿科技股份有限公司 | 一种处理设备故障的方法和系统 |
CN109117265A (zh) * | 2018-07-12 | 2019-01-01 | 北京百度网讯科技有限公司 | 在集群中调度作业的方法、装置、设备及存储介质 |
CN109388960A (zh) * | 2018-10-24 | 2019-02-26 | 全链通有限公司 | 基于区块链的信息共享及安全多方计算模型 |
CN110019066A (zh) * | 2017-09-21 | 2019-07-16 | 阿里巴巴集团控股有限公司 | 数据库处理方法及装置、系统 |
CN110232136A (zh) * | 2019-06-19 | 2019-09-13 | 浙江中普科技咨询有限公司 | 一种基于云计算的大数据处理系统 |
CN110309156A (zh) * | 2018-03-01 | 2019-10-08 | 阿里巴巴集团控股有限公司 | 数据库系统、数据库更新、扩容方法及设备 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150006895A1 (en) * | 2009-06-01 | 2015-01-01 | Maidsafe Foundation | Distributed network system |
US9792452B2 (en) * | 2014-09-12 | 2017-10-17 | Anthony Tan | Pervasive intermediate network attached storage application |
-
2019
- 2019-11-25 CN CN201911167039.1A patent/CN112835915B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108431804A (zh) * | 2015-10-23 | 2018-08-21 | 甲骨文国际公司 | 将多个容器数据库分组为单个容器数据库集群的能力 |
CN107508694A (zh) * | 2016-06-14 | 2017-12-22 | 中兴通讯股份有限公司 | 一种集群内的节点管理方法及节点设备 |
CN110019066A (zh) * | 2017-09-21 | 2019-07-16 | 阿里巴巴集团控股有限公司 | 数据库处理方法及装置、系统 |
CN110309156A (zh) * | 2018-03-01 | 2019-10-08 | 阿里巴巴集团控股有限公司 | 数据库系统、数据库更新、扩容方法及设备 |
CN108509296A (zh) * | 2018-03-19 | 2018-09-07 | 网宿科技股份有限公司 | 一种处理设备故障的方法和系统 |
CN109117265A (zh) * | 2018-07-12 | 2019-01-01 | 北京百度网讯科技有限公司 | 在集群中调度作业的方法、装置、设备及存储介质 |
CN109388960A (zh) * | 2018-10-24 | 2019-02-26 | 全链通有限公司 | 基于区块链的信息共享及安全多方计算模型 |
CN110232136A (zh) * | 2019-06-19 | 2019-09-13 | 浙江中普科技咨询有限公司 | 一种基于云计算的大数据处理系统 |
Non-Patent Citations (3)
Title |
---|
Gihwan Oh 等.SHARE Interface in Flash Storage for Relational and NoSQL Databases.《SIGMOD '16: Proceedings of the 2016 International Conference on Management of Data》.2016,343-354. * |
可扩展数据库系统数据完整性约束的实现与优化;黄建伟;《中国优秀硕士学位论文全文数据库 (信息科技辑)》;I138-517 * |
基于云存储的小型机数据库集群系统的研究;练亚雄;《上海应用技术学院学报(自然科学版)》;299-303 * |
Also Published As
Publication number | Publication date |
---|---|
CN112835915A (zh) | 2021-05-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20230385262A1 (en) | System And Method For Large-Scale Data Processing Using An Application-Independent Framework | |
US11386091B2 (en) | Joining large database tables | |
KR102198680B1 (ko) | 확장 가능한 멀티-스테이지 데이터 처리 시스템들에서의 효율적인 데이터 캐싱 관리 | |
US7774568B2 (en) | Clustered snapshots in networks | |
US9548912B2 (en) | System and method for supporting smart buffer management in a distributed data grid | |
US5423037A (en) | Continuously available database server having multiple groups of nodes, each group maintaining a database copy with fragments stored on multiple nodes | |
CN102402395B (zh) | 基于仲裁磁盘的高可用系统不间断运行方法 | |
US8775464B2 (en) | Method and system of mapreduce implementations on indexed datasets in a distributed database environment | |
CN104751359B (zh) | 用于支付清算的系统及方法 | |
CN108459913B (zh) | 数据并行处理方法、装置及服务器 | |
CN103399894A (zh) | 一种基于共享存储池的分布式事务处理方法 | |
US9710532B2 (en) | Method for avoiding conflicts in database cluster | |
CN116955361A (zh) | 存储器内密钥范围搜索方法和系统 | |
CN107969153B (zh) | 一种资源分配方法、装置及numa系统 | |
CN110109931B (zh) | 一种用于防止rac实例间数据访问发生冲突的方法及系统 | |
US20150278543A1 (en) | System and Method for Optimizing Storage of File System Access Control Lists | |
CN107315756B (zh) | 一种日志处理方法及装置 | |
CN112835915B (zh) | Mpp数据库系统、数据存储方法及数据查询方法 | |
CN112711606A (zh) | 数据库访问方法、装置、计算机设备和存储介质 | |
US9910893B2 (en) | Failover and resume when using ordered sequences in a multi-instance database environment | |
US20080250421A1 (en) | Data Processing System And Method | |
US8700822B2 (en) | Parallel aggregation system | |
CN110019229B (zh) | 数据库配置系统 | |
CN106649584A (zh) | 一种主从式数据库系统中的索引处理方法和装置 | |
US8326990B1 (en) | Automated optimal workload balancing during failover in share-nothing database systems |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |