CN111259062A - 一种能够保证分布式数据库全表查询语句结果集顺序的方法和装置 - Google Patents

一种能够保证分布式数据库全表查询语句结果集顺序的方法和装置 Download PDF

Info

Publication number
CN111259062A
CN111259062A CN202010040971.4A CN202010040971A CN111259062A CN 111259062 A CN111259062 A CN 111259062A CN 202010040971 A CN202010040971 A CN 202010040971A CN 111259062 A CN111259062 A CN 111259062A
Authority
CN
China
Prior art keywords
range
data
node
sequence
execution plan
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010040971.4A
Other languages
English (en)
Other versions
CN111259062B (zh
Inventor
江磊
陈磊
张乾坤
樊文昌
周恒�
高子奇
史大义
周正德
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong Electronic Port Co ltd
Original Assignee
Shandong Huimao Electronic Port Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong Huimao Electronic Port Co Ltd filed Critical Shandong Huimao Electronic Port Co Ltd
Priority to CN202010040971.4A priority Critical patent/CN111259062B/zh
Publication of CN111259062A publication Critical patent/CN111259062A/zh
Application granted granted Critical
Publication of CN111259062B publication Critical patent/CN111259062B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/248Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2471Distributed queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/27Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Fuzzy Systems (AREA)
  • Mathematical Physics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种能够保证分布式数据库全表查询语句结果集顺序的方法和装置,属于分布式数据库查询技术领域,该方法中数据以Range为基本存储单元,网关节点根据从元数据解析的Range信息,并根据Range的StartKey的顺序生成执行计划,然后按照顺序将执行计划发送到对应节点执行,并对返回结果按照执行计划发送的顺序进行组合;所述Range为分布式数据库数据存储单元,Range中存储的数据按照表中数据行的编号进行排序。装置包括基本存储单元、网关节点以及执行模块,基本存储单元由若干条有序数据组成,存储在节点上。本发明能够实现分布式数据库管理系统下保证多次查询操作返回的结果集中的顺序一致。

Description

一种能够保证分布式数据库全表查询语句结果集顺序的方法 和装置
技术领域
本发明涉及分布式数据库查询技术领域,具体地说是一种能够保证分布式数据库全表查询语句结果集顺序的方法和装置。
背景技术
查询操作是数据库核心的操作,数据库中其他的操作均或多或少的依赖于查询操作返回的结果集。分布式数据库将计算和存储分布在不同的节点上。数据被分割开来,存储在不同的数据库服务器上,随着数据量的增加服务器的数目也随之增加。分布式技术支持硬件以水平扩展的方式来获得线性增长的性能和存储,同时对硬件的性能要求也较为宽松。在分布式数据库中,每个服务器节点只存储数据的一部分,节点之间是彼此信任的,这些节点组合成一个完整的分布式数据库。
在分布式数据库进行相关操作时,会将总的工作任务分解成若干个小的任务,通过分布式并行执行的方式将其完成。因此,在对一个分布式数据库进行数据查询操作时,会将一个查询操作分解为若干个执行计划,由各个节点执行具体的查询操作,从而能够得到若干个结果集,最后将这些结果集整合起来形成一个总的结果集返回给用户。
通过分析上述的流程,由于网络带宽不同,各个节点性能存在差异,各个节点形成返回结果集所用的时间存在较大差异。当多次执行不加排序约束的 SELECT语句时,会使得最终结果集中的数据的顺序不一致。
发明内容
本发明的技术任务是针对以上不足之处,提供一种能够保证分布式数据库全表查询语句结果集顺序的方法和装置,能够实现分布式数据库管理系统下保证多次查询操作返回的结果集中的顺序一致。
本发明解决其技术问题所采用的技术方案是:
一种能够保证分布式数据库全表查询语句结果集顺序的方法,该方法基于分布式数据库,数据以Range为基本存储单元,网关节点根据从元数据解析的 Range信息,并根据Range的StartKey的顺序生成执行计划,然后按照顺序将执行计划发送到对应节点执行,并对返回结果按照执行计划发送的顺序进行组合;
所述Range为分布式数据库数据存储单元,Range中存储的数据按照表中数据行的编号进行排序。
由于各个Range中存储的数据已经按照表中数据行编号进行排序,所以各个节点返回的查询结果中的数据是排好的,网关节点在对返回结果进行组合的过程中,无论各个执行计划返回结果的顺序如何,只要对返回结果按照执行计划发送的顺序进行组合,就可以保证多次查询操作返回结果的顺序。
该方法可以在不需要对返回结果集进行全量排序的情况下,实现结果集顺序的一致,并且不影响原有功能,排序性能高,解决在现有分布式数据库中存在的进行多次全表查询时出现的返回的结果集中数据的顺序不一致的问题。
优选的,Range是分布式数据库数据存储的基本单元,在分布式数据库中,若干条有序数据组成一个Range,存储在节点上,一个节点可以存储一个或多个 Range。
进一步的,Range的数据结构中包含RangeID、Node信息、StartKey和 EndKey,其中,
RangeID用于标记自身,当一个节点中存储多个Range时,通过RangeID来进行区分;
Node信息包括所在节点的地址和端口信息;
StartKey是Range存储数据的起始值,EndKey是Range存储数据的结束值,存储范围的表示是左闭右开的[StartKey,EndKey)。
网关节点根据从元数据解析的Range信息,所述元数据是描述其它数据的数据,描述数据的属性信息,其使用目的在于识别资源,实现简单高效地管理大量网络化数据;实现信息资源的有效发现、查找。元数据一经建立,便可共享。
Range中存储的数据按照表中数据行的编号进行排序,表中数据行的编号表示为rowid,分布式数据库的表中的每一行数据都有一个唯一的标识符称为 rowid,可以使用它来进行数据访问。表中每增加一条数据时,rowid便会自动加一。
所述Node信息包括Range所在节点的地址和端口信息,Node即节点,分布式数据库的组成单元,通常指一台物理机或虚拟服务器。
进一步的,所述网关节点为用户客户端访问的节点,分布式数据库中,各网关节点对等,两两之间能够相互通信,用户通过链接任意一个网关节点进行操作,由该节点将操作具体化,并下发给其余各个节点执行,并将返回的结果进行组合,返回给用户。
优选的,该方法中生成执行计划的具体方式如下:
当查询语句到达网关节点时,记该网关节点为Node1,首先从该节点中获取元数据metadata,从元数据metadata中解析出t1表中数据存储的相关Range 信息,Node1根据Range信息,按照StartKey生成执行计划,并将执行计划按照顺序分发给对应的节点执行。
该方案的优化之处在于:制定的执行计划是有序的,其次序与t1表的Range 存储时生成的元数据中的StartKey的次序有关。每个计划负责查询特定范围的数据,取Range上[StartKey,EndKey)范围内的数据。
进一步的,返回结果的具体方式如下:
执行计划之后,将得到的结果集返回给Node1,Node1对结果集进行整合:当全部结果集返回时,按照执行计划下发的顺序对各个结果集进行重新排列,使其有序,将最终的结果集返回给用户。
该方案的优化之处是:执行计划和返回的结果集是一一对应的,执行计划的下发顺序代表了期待的返回的结果集的顺序。当返回结果集的顺序与期待的顺序不一致时,则对其按照执行计划的顺序进行调整,以保证多次查询数据得到的数据顺序一致。
为证明该方法的效果,多次执行全表查询语句,返回结果的顺序一致,在数据库中创建表t,在表t中新增带有ID的数据,如ID为1,2,3的数据,使具有不同ID的数据分布在不同的Range中,对表t执行多次“SELECT*FROM t;”统计出现的结果及出现的次数,校验返回结果集顺序一致性。
本发明还要求保护一种能够保证分布式数据库全表查询语句结果集顺序的装置,该装置包括基本存储单元、网关节点以及执行模块,基本存储单元由若干条有序数据组成,存储在节点上;
网关节点根据基本存储单元的数据顺序生成执行计划,然后按照该顺序将执行计划发送至基本存储单元对应的节点进行执行;
网关节点对返回的结果按照执行计划发送的顺序进行组合,实现结果集顺序的一致。
一个节点可以存储一个或多个所述的基本存储单元。
进一步的,所述基本存储单元为Range,Range包含RangeID、Node信息、 StartKey和EndKey,其中,
RangeID用于标记自身,当一个节点中存储多个Range时,通过RangeID来进行区分;
Node信息包括所在节点的地址和端口;
StartKey是Range存储数据的起始值,EndKey是Range存储数据的结束值,存储范围的表示是左闭右开的[StartKey,EndKey);
所述网关节点根据从元数据解析的Range信息,根据Range的StartKey的顺序生成执行计划;Range中存储的数据按照表中数据行的编号进行排序,表中每增加一条数据,表中数据行的编号自动加一。
具体的,该装置运行过程如下:
1)、获取分布式数据库数据,解析基本存储单元的信息;
2)、根据基本存储单元的信息和该基本存储单元的数据顺序生成有序的执行计划;
3)、并发下发执行计划;
4)、执行模块执行所述执行计划并返回执行结果;
5)、返回结果按照执行计划下发的顺序进行调整;
6)、返回最终结果到客户端。
本发明的一种能够保证分布式数据库全表查询语句结果集顺序的方法和装置与现有技术相比,具有以下有益效果:
制定的执行计划是有序的,其次序与t1表的Range存储时生成的元数据中的StartKey的次序有关。每个计划负责查询特定范围的数据,取Range上 [StartKey,EndKey)范围内的数据。
执行计划和返回的结果集是一一对应的,执行计划的下发顺序代表了期待的返回的结果集的顺序。当返回结果集的顺序与期待的顺序不一致时,则对其按照执行计划的顺序进行调整,以保证多次查询数据得到的数据顺序一致。
该方法和装置可以在不需要对返回结果集进行全量排序的情况下,实现结果集顺序的一致,并且不影响原有功能,且排序性能高。
附图说明
图1是本发明能够保证分布式数据库全表查询语句结果集顺序的方法的结构示意图;
图2是本发明能够保证分布式数据库全表查询语句结果集顺序的装置的操作流程图。
具体实施方式
下面结合附图和具体实施例对本发明作进一步说明。
实施例一
一种能够保证分布式数据库全表查询语句结果集顺序的方法,该方法基于浪潮云海分布式数据库,数据以Range为基本存储单元。网关节点根据从元数据metadata解析的Range信息,并根据Range的StartKey的顺序生成执行计划,然后按照顺序将执行计划发送到对应节点执行,并对返回结果按照执行计划发送的顺序进行组合。
所述Range是浪潮云海分布式数据库数据存储的基本单元,浪潮云海分布式数据库中,若干条有序数据组成一个Range,存储在节点上,一个节点可以存储一个或多个Range。
Range的数据结构中包含RangeID、Node信息、StartKey和EndKey等部分,其中,
RangeID用于标记自身,当一个节点中存储多个Range时,通过RangeID来进行区分;
Node信息主要指所在节点的地址和端口;
StartKey是Range存储数据的起始值,EndKey是Range存储数据的结束值,存储范围的表示是左闭右开的[StartKey,EndKey)。
Range中存储的数据按照表中数据行的编号进行排序,分布式数据库的表中的每一行数据都有一个唯一的标识符称为rowid,可以使用它来进行数据访问。表中每增加一条数据时,rowid便会自动加一。
网关节点为用户客户端访问的节点,分布式数据库中,各网关节点对等,两两之间能够相互通信,用户通过链接任意一个网关节点进行操作,由该节点将操作具体化,并下发给其余各个节点执行,并将返回的结果进行组合,返回给用户。
Node即节点,分布式数据库的组成单元,通常指一台物理机或虚拟服务器。
由于各个Range中存储的数据已经按照表中数据行编号进行排序,所以各个节点返回的查询结果中的数据是排好的,网关节点在对返回结果进行组合的过程中,无论各个执行计划返回结果的顺序如何,只要对返回结果按照执行计划发送的顺序进行组合,就可以保证多次查询操作返回结果的顺序。
该方法可以在不需要对返回结果集进行全量排序的情况下,实现结果集顺序的一致,并且不影响原有功能,排序性能高,解决在现有分布式数据库中存在的进行多次全表查询时出现的返回的结果集中数据的顺序不一致的问题。
该方法中生成执行计划时:
当查询语句到达网关节点时,记该网关节点为Node1,首先从该节点中获取元数据metadata,从元数据metadata中解析出t1表中数据存储的相关Range 信息,Node1根据Range信息,按照StartKey生成执行计划,并将执行计划按照顺序分发给对应的节点执行。
该方案的优化之处在于:制定的执行计划是有序的,其次序与t1表的Range 存储时生成的元数据中的StartKey的次序有关。每个计划负责查询特定范围的数据,取Range上[StartKey,EndKey)范围内的数据。
返回结果时:
执行计划之后,将得到的结果集返回给Node1,Node1对结果集进行整合:当全部结果集返回时,按照执行计划下发的顺序对各个结果集进行重新排列,使其有序,将最终的结果集返回给用户。
该方案的优化之处是:执行计划和返回的结果集是一一对应的,执行计划的下发顺序代表了期待的返回的结果集的顺序。当返回结果集的顺序与期待的顺序不一致时,则对其按照执行计划的顺序进行调整,以保证多次查询数据得到的数据顺序一致。
通过本方法多次执行全表查询语句,返回结果的顺序保持一致。
本方法在已设计的50多个场景中的通过率达到了100%。下面对其中最简单而经典的场景进行表述,如下所述:
在数据库中创建如下所示的表t,并新增ID为1,2,3的数据,如表1 所示。然后在2,3的位置对表进行分隔,使得ID为1,2,3的数据分布在不同的Range。
表1数据库创建表t的结构及内容
ID Name Age
1 Zhou 25
2 Wu 26
3 Zheng 27
对表t执行200次“SELECT*FROM t;”统计出现的结果及其出现的次数。
不使用优化方案,执行200次SELECT操作出现的结果和每种结果的次数,如表2所示。
表2不使用优化方案得到的结果集顺序及频率
可能的结果 次数
(1,2,3) 30
(1,3,2) 35
(2,1,3) 31
(2,3,1) 29
(3,2,1) 37
(3,1,2) 38
使用优化方案,执行200次SELECT操作出现的结果和每种结果的次数,如表3所示。
表3不使用优化方案得到的结果集顺序及频率
可能的结果 次数
(1,2,3) 200
(1,3,2) 0
(2,1,3) 0
(2,3,1) 0
(3,2,1) 0
(3,1,2) 0
注:因为ID作为主键,仅统计ID出现的顺序,例如(1,2,3)表示的情况是:
ID Name Age
1 Zhou 25
2 Wu 26
3 Zheng 27
(3,1,2)表示的情况是:
ID Name Age
3 Zheng 27
1 Zhou 25
2 Wu 26
从上面的两个案例的对比中,该优化方案能够有效解决分布式数据库存在的执行全表查询语句时出现的数据顺序不一致的问题。
该方法的结构图如图1所示。
该方法的执行步骤如下:
1、获取Mata数据,解析Range信息;
2)、根据Range信息和Range的StartKey生成有序的执行计划;
3)、并发下发执行计划;
4)、对应节点执行所述执行计划并返回执行结果;
5)、返回结果按照执行计划下发的顺序进行调整;
6)、返回最终结果到客户端。
实施例二
一种能够保证分布式数据库全表查询语句结果集顺序的装置,该装置包括基本存储单元、网关节点以及执行模块,基本存储单元由若干条有序数据组成,存储在节点上。
网关节点根据基本存储单元的数据顺序生成执行计划,然后按照该顺序将执行计划发送至基本存储单元对应的节点进行执行;
网关节点对返回的结果按照执行计划发送的顺序进行组合,实现结果集顺序的一致。
一个节点可以存储一个或多个所述的基本存储单元。
所述基本存储单元为Range,Range是浪潮云海分布式数据库数据存储的基本单元,浪潮云海分布式数据库中,若干条有序数据组成一个Range,存储在节点上,一个节点可以存储一个或多个Range。
Range包含RangeID、Node信息、StartKey和EndKey,其中,
RangeID用于标记自身,当一个节点中存储多个Range时,通过RangeID来进行区分;
Node信息包括所在节点的地址和端口;
StartKey是Range存储数据的起始值,EndKey是Range存储数据的结束值,存储范围的表示是左闭右开的[StartKey,EndKey);
所述网关节点根据从元数据metadata解析的Range信息,根据Range的 StartKey的顺序生成执行计划;各个Range中存储的数据按照rowid(表中数据行的编号)排序,所以各个节点返回的查询结果中的数据时排好序的。
Range中存储的数据按照表中数据行的编号进行排序,表中每增加一条数据,表中数据行的编号自动加一。
网关节点在对返回结果进行组合的过程中,无论各个执行计划返回结果的顺序如何,只要对返回结果按照执行计划发送的顺序进行组合,就可以保证多次查询操作返回结果的顺序。
如图2所示,该装置运行过程如下:
1)、获取分布式数据库数据,解析基本存储单元的信息;
2)、根据基本存储单元的信息和该基本存储单元的数据顺序生成有序的执行计划;
3)、并发下发执行计划;
4)、执行模块执行所述执行计划并返回执行结果;
5)、返回结果按照执行计划下发的顺序进行调整;
6)、返回最终结果到客户端。
通过上面具体实施方式,所述技术领域的技术人员可容易的实现本发明。但是应当理解,本发明并不限于上述的具体实施方式。在公开的实施方式的基础上,所述技术领域的技术人员可任意组合不同的技术特征,从而实现不同的技术方案。
除说明书所述的技术特征外,均为本专业技术人员的已知技术。

Claims (10)

1.一种能够保证分布式数据库全表查询语句结果集顺序的方法,其特征在于该方法中数据以Range为基本存储单元,网关节点根据从元数据解析的Range信息,并根据Range的StartKey的顺序生成执行计划,然后按照顺序将执行计划发送到对应节点执行,并对返回结果按照执行计划发送的顺序进行组合;
所述Range为分布式数据库数据存储单元,Range中存储的数据按照表中数据行的编号进行排序。
2.根据权利要求1所述的一种能够保证分布式数据库全表查询语句结果集顺序的方法,其特征在于若干条有序数据组成一个Range,存储在节点上,一个节点可以存储一个或多个Range。
3.根据权利要求2所述的一种能够保证分布式数据库全表查询语句结果集顺序的方法,其特征在于Range的数据结构包含RangeID、Node信息、StartKey和EndKey,其中,
RangeID用于标记自身,当一个节点中存储多个Range时,通过RangeID来进行区分;
Node信息包括所在节点的地址和端口;
StartKey是Range存储数据的起始值,EndKey是Range存储数据的结束值,存储范围的表示是左闭右开的[StartKey,EndKey)。
4.根据权利要求1所述的一种能够保证分布式数据库全表查询语句结果集顺序的方法,其特征在于所述网关节点为用户客户端访问的节点,分布式数据库中,各网关节点对等,两两之间能够相互通信,用户通过链接任意一个网关节点进行操作,由该节点将操作具体化,并下发给其余各个节点执行,并将返回的结果进行组合,返回给用户。
5.根据权利要求1或2或3或4所述的一种能够保证分布式数据库全表查询语句结果集顺序的方法,其特征在于生成执行计划的具体方式如下:
当查询语句到达网关节点时,记该网关节点为Node1,首先从该节点中获取元数据,从元数据中解析出t1表中数据存储的相关Range信息,Node1根据Range信息,按照StartKey生成执行计划,并将执行计划按照顺序分发给对应的节点执行。
6.根据权利要求5所述的一种能够保证分布式数据库全表查询语句结果集顺序的方法,其特征在于返回结果的具体方式如下:
执行计划之后,将得到的结果集返回给Node1,Node1对结果集进行整合,当全部结果集返回时,按照执行计划下发的顺序对各个结果集进行重新排列,使其有序,将最终的结果集返回给用户。
7.根据权利要求6所述的一种能够保证分布式数据库全表查询语句结果集顺序的方法,其特征在于在数据库中创建表t,在表t中新增带有ID的数据,使具有不同ID的数据分布在不同的Range中,对表t执行多次“SELECT*FROMt;”统计出现的结果及出现的次数,校验返回结果集顺序一致性。
8.一种能够保证分布式数据库全表查询语句结果集顺序的装置,其特征在于包括基本存储单元、网关节点以及执行模块,基本存储单元由若干条有序数据组成,存储在节点上;
网关节点根据基本存储单元的数据顺序生成执行计划,然后按照该顺序将执行计划发送至基本存储单元对应的节点进行执行;
网关节点对返回的结果按照执行计划发送的顺序进行组合,实现结果集顺序的一致。
9.根据权利要求8所述的一种能够保证分布式数据库全表查询语句结果集顺序的装置,其特征在于所述基本存储单元为Range,Range包含RangeID、Node信息、StartKey和EndKey,其中,
RangeID用于标记自身,当一个节点中存储多个Range时,通过RangeID来进行区分;
Node信息包括所在节点的地址和端口;
StartKey是Range存储数据的起始值,EndKey是Range存储数据的结束值,存储范围的表示是左闭右开的[StartKey,EndKey);
所述网关节点根据从元数据解析的Range信息,根据Range的StartKey的顺序生成执行计划;Range中存储的数据按照表中数据行的编号进行排序。
10.根据权利要求8或9所述的一种能够保证分布式数据库全表查询语句结果集顺序的装置,其特征在于该装置运行过程如下:
1)、获取分布式数据库数据,解析基本存储单元的信息;
2)、根据基本存储单元的信息和该基本存储单元的数据顺序生成有序的执行计划;
3)、并发下发执行计划;
4)、执行模块执行所述执行计划并返回执行结果;
5)、返回结果按照执行计划下发的顺序进行调整;
6)、返回最终结果到客户端。
CN202010040971.4A 2020-01-15 2020-01-15 一种能够保证分布式数据库全表查询语句结果集顺序的方法和装置 Active CN111259062B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010040971.4A CN111259062B (zh) 2020-01-15 2020-01-15 一种能够保证分布式数据库全表查询语句结果集顺序的方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010040971.4A CN111259062B (zh) 2020-01-15 2020-01-15 一种能够保证分布式数据库全表查询语句结果集顺序的方法和装置

Publications (2)

Publication Number Publication Date
CN111259062A true CN111259062A (zh) 2020-06-09
CN111259062B CN111259062B (zh) 2023-08-01

Family

ID=70948834

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010040971.4A Active CN111259062B (zh) 2020-01-15 2020-01-15 一种能够保证分布式数据库全表查询语句结果集顺序的方法和装置

Country Status (1)

Country Link
CN (1) CN111259062B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112905615A (zh) * 2021-03-02 2021-06-04 浪潮云信息技术股份公司 一种基于顺序校验的分布式一致性协议提交方法及系统
CN114817402A (zh) * 2022-04-25 2022-07-29 山东浪潮科学研究院有限公司 分布式数据库于多region部署场景下的SQL执行优化方法

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100299337A1 (en) * 2009-05-19 2010-11-25 Sap Ag Computer System for Processing a Query
CN102270232A (zh) * 2011-07-21 2011-12-07 华中科技大学 一种存储优化的语义数据查询系统
CN103617232A (zh) * 2013-11-26 2014-03-05 北京京东尚科信息技术有限公司 一种针对HBase表的分页查询方法
CN104461400A (zh) * 2014-12-25 2015-03-25 浪潮(北京)电子信息产业有限公司 处理访存请求冲突的方法和装置
CN105045791A (zh) * 2014-03-26 2015-11-11 日本电气株式会社 数据库设备
CN106030579A (zh) * 2014-02-25 2016-10-12 国际商业机器公司 用于针对存储器内的多个存储区域扫描指定量的结果的方法、系统和计算机程序
CN110442642A (zh) * 2019-06-19 2019-11-12 北京航天智造科技发展有限公司 分布式数据库的数据处理方法、装置和存储介质
CN110678854A (zh) * 2017-05-31 2020-01-10 华为技术有限公司 数据查询的方法和装置

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100299337A1 (en) * 2009-05-19 2010-11-25 Sap Ag Computer System for Processing a Query
CN102270232A (zh) * 2011-07-21 2011-12-07 华中科技大学 一种存储优化的语义数据查询系统
CN103617232A (zh) * 2013-11-26 2014-03-05 北京京东尚科信息技术有限公司 一种针对HBase表的分页查询方法
CN106030579A (zh) * 2014-02-25 2016-10-12 国际商业机器公司 用于针对存储器内的多个存储区域扫描指定量的结果的方法、系统和计算机程序
CN105045791A (zh) * 2014-03-26 2015-11-11 日本电气株式会社 数据库设备
CN104461400A (zh) * 2014-12-25 2015-03-25 浪潮(北京)电子信息产业有限公司 处理访存请求冲突的方法和装置
CN110678854A (zh) * 2017-05-31 2020-01-10 华为技术有限公司 数据查询的方法和装置
CN110442642A (zh) * 2019-06-19 2019-11-12 北京航天智造科技发展有限公司 分布式数据库的数据处理方法、装置和存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
秦东明等: "基于分布式无共享架构的海量数据并行查询平台" *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112905615A (zh) * 2021-03-02 2021-06-04 浪潮云信息技术股份公司 一种基于顺序校验的分布式一致性协议提交方法及系统
CN114817402A (zh) * 2022-04-25 2022-07-29 山东浪潮科学研究院有限公司 分布式数据库于多region部署场景下的SQL执行优化方法

Also Published As

Publication number Publication date
CN111259062B (zh) 2023-08-01

Similar Documents

Publication Publication Date Title
CA2906669C (en) Efficiently performing operations on distinct data values
US10452625B2 (en) Data lineage analysis
US9047333B2 (en) Dynamic updates to a semantic database using fine-grain locking
CN103970902B (zh) 一种大量数据情况下的可靠即时检索方法及系统
CN108664516A (zh) 查询优化方法及相关装置
CN102722531B (zh) 一种云环境中基于分片位图索引的查询方法
CN108804459B (zh) 数据查询方法及装置
CN103646111A (zh) 大数据环境下实现实时数据关联的系统及方法
CN110659282B (zh) 数据路由的构建方法、装置、计算机设备和存储介质
CN108509437A (zh) 一种ElasticSearch查询加速方法
EP2901344A1 (en) System and method for flexible distributed massively parallel processing (mpp) database
CN105117442B (zh) 一种基于概率的大数据查询方法
CN104268295A (zh) 一种数据查询方法及装置
CN107783985A (zh) 一种分布式数据库查询方法、装置及管理系统
CN111259062A (zh) 一种能够保证分布式数据库全表查询语句结果集顺序的方法和装置
CN108733727A (zh) 一种查询处理方法、数据源注册方法及查询引擎
CN101916281B (zh) 并行计算系统及去重计数方法
CN108140022B (zh) 数据查询方法和数据库系统
KR20080096004A (ko) 웹로그의 시계열 분석을 위한 데이터 저장 및 조회 방법그리고 상기 방법을 수행하는 시스템
CN111125199B (zh) 一种数据库访问方法、装置及电子设备
CN111666344A (zh) 异构数据同步方法及装置
CN108427736A (zh) 一种用于查询数据的方法
CN108182204A (zh) 基于房产交易多维度数据的数据查询的处理方法及装置
CN110175202A (zh) 用于数据库的表的外连接的方法和系统
Suganya et al. Efficient fragmentation and allocation in distributed databases

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20230703

Address after: Energy Building 1-2201, No. 10777 Jingshi Road, Jinan Area, China (Shandong) Pilot Free Trade Zone, Jinan City, Shandong Province, 250013

Applicant after: Shandong Electronic Port Co.,Ltd.

Address before: Floor S06, Inspur Science Park, No. 1036, Inspur Road, hi tech Zone, Jinan City, Shandong Province

Applicant before: SHANDONG HUIMAO ELECTRONIC PORT Co.,Ltd.

TA01 Transfer of patent application right
GR01 Patent grant
GR01 Patent grant