CN114328614A - 查询计划选择系统、方法、电子设备及介质 - Google Patents

查询计划选择系统、方法、电子设备及介质 Download PDF

Info

Publication number
CN114328614A
CN114328614A CN202210204269.6A CN202210204269A CN114328614A CN 114328614 A CN114328614 A CN 114328614A CN 202210204269 A CN202210204269 A CN 202210204269A CN 114328614 A CN114328614 A CN 114328614A
Authority
CN
China
Prior art keywords
query
sub
cardinality
conditions
initial estimation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210204269.6A
Other languages
English (en)
Other versions
CN114328614B (zh
Inventor
朱鎔
陈唯
普法德勒·安德烈亚斯·沃纳·罗伯特
黄柏彤
曾恬静
丁博麟
周靖人
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba China Co Ltd
Original Assignee
Alibaba China Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba China Co Ltd filed Critical Alibaba China Co Ltd
Priority to CN202210204269.6A priority Critical patent/CN114328614B/zh
Publication of CN114328614A publication Critical patent/CN114328614A/zh
Application granted granted Critical
Publication of CN114328614B publication Critical patent/CN114328614B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本公开提供了一种查询计划选择系统、方法、电子设备及介质,所述查询计划选择系统包括:子查询条件确定模块,被配置为根据查询条件确定M个子查询条件,其中,所述子查询条件用于构造多个不同的查询计划,所述查询计划用于对数据库进行查询以得到对应于所述查询条件的查询结果,M>1;初始估计基数确定模块,被配置为确定所述子查询条件的初始估计基数;目标查询计划选择模块,被配置为根据所述M个子查询条件的初始估计基数和所述M个子查询条件的初始估计基数的缩放结果,选择目标查询计划。

Description

查询计划选择系统、方法、电子设备及介质
技术领域
本公开涉及数据库技术领域,具体涉及一种查询计划选择系统、方法、电子设备及介质。
背景技术
查询优化器是数据库的核心组件,用于根据查询条件生成可执行的查询计划,根据查询计划对数据库进行查询以得到相应的查询结果。当根据查询条件在多个数据表中执行查询时,可以根据查询条件生成多个子查询条件,每个子查询条件针对所述多个数据表中的一个或几个数据表的连接表执行查询。
对子查询条件进行不同的组合,可以得到不同的查询计划。对于每个查询计划,先分别根据其包含的子查询条件得到相应的子查询结果,再对子查询结果进行连接以得到查询条件的查询结果。由于每个查询计划的执行时间不同,所以,希望通过查询优化器对查询计划进行选择,以得到优选的查询计划。
发明内容
为了解决相关技术中的问题,本公开实施例提供一种查询计划选择系统、方法、电子设备及介质。
第一方面,本公开提供了一种查询计划选择系统,包括:
子查询条件确定模块,被配置为根据查询条件确定M个子查询条件,其中,所述子查询条件用于构造多个不同的查询计划,所述查询计划用于对数据库进行查询以得到对应于所述查询条件的查询结果,M>1;
初始估计基数确定模块,被配置为确定所述子查询条件的初始估计基数;
目标查询计划选择模块,被配置为根据所述M个子查询条件的初始估计基数和所述M个子查询条件的初始估计基数的缩放结果,选择目标查询计划。
根据本公开的实施例,所述目标查询计划选择模块包括:
参数集合生成模块,被配置为根据所述M个子查询条件的初始估计基数生成多个参数集合,所述参数集合中的M个参数是相应的子查询条件的初始估计基数,或者是相应的子查询条件的初始估计基数的缩小或放大结果;
执行代价确定模块,被配置为基于所述参数集合,确定多个查询计划各自对应的执行代价;
查询计划确定模块,被配置为根据所述执行代价确定所述目标查询计划。
根据本公开的实施例,所述根据所述子查询条件的初始估计基数生成多个参数集合,包括:
根据所述M个子查询条件的初始估计基数生成第一组参数集合,所述第一组参数集合包括一个参数集合,所述一个参数集合中的M个参数是相应的子查询条件的初始估计基数;
通过对第i组参数集合中的各参数集合中的第i+1个参数进行缩小和放大,生成第i+1组参数集合,1≤i≤N,N<M;
将所述第1~N组参数集合中的参数集合作为所述多个参数集合。
根据本公开的实施例,所述一个参数集合中的参数按照相应子查询条件涉及的数据表数量和相应子查询条件的初始估计基数的大小进行排序。
根据本公开的实施例,所述基于所述参数集合,确定多个查询计划各自对应的执行代价,包括:
将所述参数集合中的参数作为相应的子查询条件的估计基数;
根据所述查询计划对应的子查询条件的估计基数,确定所述查询计划的执行代价。
根据本公开的实施例,所述根据所述执行代价确定所述目标查询计划,包括:
将执行代价最小的查询计划作为所述目标查询计划。
根据本公开的实施例,至少根据所述初始估计基数的误差范围确定所述初始估计基数进行缩放的缩放系数。
第二方面,本公开提供了一种查询计划选择方法,包括:
根据查询条件确定M个子查询条件,其中,所述子查询条件用于构造多个不同的查询计划,所述查询计划用于对数据库进行查询以得到对应于所述查询条件的查询结果,M>1;
确定所述子查询条件的初始估计基数;
根据所述M个子查询条件的初始估计基数和所述M个子查询条件的初始估计基数的缩放结果,选择目标查询计划。
根据本公开的实施例,所述根据所述M个子查询条件的初始估计基数和所述M个子查询条件的初始估计基数的缩放结果,选择目标查询计划,包括:
根据所述M个子查询条件的初始估计基数生成多个参数集合,所述参数集合中的M个参数是相应的子查询条件的初始估计基数,或者是相应的子查询条件的初始估计基数的缩小或放大结果;
基于所述参数集合,确定多个查询计划各自对应的执行代价;
根据所述执行代价确定所述目标查询计划。
根据本公开的实施例,所述根据所述子查询条件的初始估计基数生成多个参数集合,包括:
根据所述M个子查询条件的初始估计基数生成第一组参数集合,所述第一组参数集合包括一个参数集合,所述一个参数集合中的M个参数是相应的子查询条件的初始估计基数;
通过对第i组参数集合中的各参数集合中的第i+1个参数进行缩小和放大,生成第i+1组参数集合,1≤i≤N,N<M;
将所述第1~N组参数集合中的参数集合作为所述多个参数集合。
根据本公开的实施例,所述一个参数集合中的参数按照相应子查询条件涉及的数据表数量和相应子查询条件的初始估计基数的大小进行排序。
根据本公开的实施例,所述基于所述参数集合,确定多个查询计划各自对应的执行代价,包括:
将所述参数集合中的参数作为相应的子查询条件的估计基数;
根据所述查询计划对应的子查询条件的估计基数,确定所述查询计划的执行代价。
根据本公开的实施例,所述根据所述执行代价确定所述目标查询计划,包括:
将执行代价最小的查询计划作为所述目标查询计划。
根据本公开的实施例,至少根据所述初始估计基数的误差范围确定所述初始估计基数进行缩放的缩放系数。
第三方面,本公开实施例提供了一种电子设备,包括存储器和处理器,其中,所述存储器用于存储一条或多条计算机指令,其中,所述一条或多条计算机指令被所述处理器执行以实现如第二种方面中任一项所述的方法。
第四方面,本公开实施例中提供了一种计算机可读存储介质,其上存储有计算机指令,该计算机指令被处理器执行时实现如第二种方面中任一项所述的方法。
第五方面,本公开实施例中提供了一种计算机程序产品,包括计算机指令,该计算机指令被处理器执行时实现如第二种方面中任一项所述的方法步骤。
根据本公开实施例提供的技术方案,能够充分利用已有的查询优化器中的子查询条件基数估计机制,基于子查询条件的估计基数选择目标查询计划,编写代码的工作量小,与已有查询优化器能够良好兼容,针对不同数据库系统具有良好的通用性。而且,本公开实施例通过对估计基数进行缩放,基于子查询条件的估计基数和估计基数的缩放结果选择查询计划,能够有效地减小估计基数误差对查询计划选择的影响。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
结合附图,通过以下非限制性实施方式的详细描述,本公开的其它特征、目的和优点将变得更加明显。以下是对附图的说明。
图1示出根据本公开的实施例的查询计划选择系统的框图。
图2示出了根据本公开实施例的查询计划选择方法的流程图。
图3示出根据本公开的实施例的电子设备的结构框图。
图4示出适于用来实现根据本公开实施例的方法的计算机系统的结构示意图。
图5示出适于用来实现根据本公开实施例的方法的分布式数据库系统的结构示意图。
具体实施方式
下文中,将参考附图详细描述本公开的示例性实施例,以使本领域技术人员可容易地实现它们。此外,为了清楚起见,在附图中省略了与描述示例性实施例无关的部分。
在本公开中,应理解,诸如“包括”或“具有”等的术语旨在指示本说明书中所公开的特征、数字、步骤、行为、部件、部分或其组合的存在,并且不欲排除一个或多个其他特征、数字、步骤、行为、部件、部分或其组合存在或被添加的可能性。
另外还需要说明的是,在不冲突的情况下,本公开中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本公开。
在本公开中,对用户信息或用户数据的获取均为经用户授权、确认,或由用户主动选择的操作。
如前所述,查询优化器是数据库的核心组件,用于根据查询条件生成可执行的查询计划,根据查询计划对数据库进行查询以得到相应的查询结果。当根据查询条件在多个数据表中执行查询时,可以根据查询条件生成多个子查询条件,每个子查询条件针对所述多个数据表中的一个或几个数据表的连接表执行查询。
对子查询条件进行不同的组合,可以得到不同的查询计划。对于每个查询计划,先分别根据其包含的子查询条件得到相应的子查询结果,再对子查询结果进行连接以得到查询条件的查询结果。由于每个查询计划的执行时间不同,所以,希望通过查询优化器对查询计划进行选择,以得到优选的查询计划。
已有的查询计划选择系统针对查询优化器的三大核心模块,分别设计了机器模型,然后进行堆叠替代。该系统需要对现有数据库组件进行完全替换,其工作量不亚于完全从头设计。而且,替换后的系统的稳定性难以保证、兼容性差、优化效果也没有保证。
鉴于此,本公开实施例提供了一种查询计划选择系统,包括:子查询条件确定模块,被配置为根据查询条件确定M个子查询条件,其中,所述子查询条件用于构造多个不同的查询计划,所述查询计划用于对数据库进行查询以得到对应于所述查询条件的查询结果,M>1;初始估计基数确定模块,被配置为确定所述子查询条件的初始估计基数;目标查询计划确定模块,被配置为根据所述M个子查询条件的初始估计基数和所述M个子查询条件的初始估计基数的缩放结果,选择目标查询计划。
根据本公开的实施例,能够充分利用已有的查询优化器中的子查询条件基数估计机制,基于子查询条件的估计基数选择目标查询计划,编写代码的工作量小,与已有查询优化器能够良好兼容,针对不同数据库系统具有良好的通用性。而且,本公开实施例通过对估计基数进行缩放,基于子查询条件的估计基数和估计基数的缩放结果选择查询计划,能够有效地减小估计基数误差对查询计划选择的影响。
图1示出根据本公开的实施例的查询计划选择系统的框图。
如图1所示,一种查询计划选择系统100包括子查询条件确定模块110、初始估计基数确定模块120、目标查询计划选择模块130。
根据本公开的实施例,查询计划选择系统100可以在数据库的查询优化器中实现。本公开实施例能够充分利用已有的查询优化器中的子查询条件基数估计机制,基于子查询条件的估计基数选择目标查询计划,编写代码的工作量小,与已有查询优化器能够良好兼容,且针对不同数据库系统具有良好的通用性。
子查询条件确定模块110被配置为根据查询条件确定M个子查询条件,其中,所述子查询条件用于构造多个不同的查询计划,所述查询计划用于对数据库进行查询以得到对应于所述查询条件的查询结果,M>1。初始估计基数确定模块120被配置为确定所述子查询条件的初始估计基数。标查询计划选择模块130被配置为根据所述M个子查询条件的初始估计基数和所述M个子查询条件的初始估计基数的缩放结果,选择目标查询计划。
根据本公开的实施例,目标查询计划选择模块130包括参数集合生成模块131、执行代价确定模块132、查询计划确定模块133。
参数集合生成模块131被配置为根据所述M个子查询条件的初始估计基数生成多个参数集合,所述参数集合中的M个参数是相应的子查询条件的初始估计基数,或者是相应的子查询条件的初始估计基数的缩小或放大结果。执行代价确定模块132被配置为基于所述参数集合,确定多个查询计划各自对应的执行代价。查询计划确定模块133被配置为根据所述执行代价确定所述目标查询计划。
例如,给定数据库SQL查询Q,Q的所有部分查询(包含其自身)称为其子查询,记为
Figure 514477DEST_PATH_IMAGE001
。假如查询Q涉及四个数据表A、B、C、D的链式连接,记为
Figure 900459DEST_PATH_IMAGE002
,查询Q 对于每个数据表A,B,C,D均有相应的过滤条件,则查询Q的所有子查询如下:
Figure 883458DEST_PATH_IMAGE003
Figure 747509DEST_PATH_IMAGE004
Figure 296302DEST_PATH_IMAGE005
即,Q1是根据对于数据表A、B、C、D的过滤条件对数据表A、B、C、D的链式连接进行查询,Q2是根据对于数据表A、B、C的过滤条件对数据表A、B、C的链式连接进行查询,Q3是根据对于数据表B、C、D的过滤条件对数据表B、C、D的链式连接进行查询,Q4是根据对于数据表A、B的过滤条件对数据表A、B的链式连接进行查询,Q5是根据对于数据表B、C的过滤条件对数据表B、C的链式连接进行查询,Q6是根据对于数据表C、D的过滤条件对数据表C、D的链式连接进行查询,Q7是根据对于数据表A的过滤条件对数据表A进行查询,Q8是根据对于数据表B的过滤条件对数据表B进行查询,Q9是根据对于数据表C的过滤条件对数据表C进行查询,Q10是根据对于数据表D的过滤条件对数据表D进行查询。
对于查询Q的执行是每次两个表进行的迭代过程,因为有很多不同的方式,称之为查询计划(Plan)。例如,如下两种方式均可以得到查询Q的结果:
Plan A: 先做Q7和Q8,即分别得到表A和表B上的记录;然后将其连接,得到
Figure 587606DEST_PATH_IMAGE006
上的结果;然后做
Figure 933268DEST_PATH_IMAGE007
,将
Figure 335431DEST_PATH_IMAGE008
上的结果和表C连接;最后做
Figure 473151DEST_PATH_IMAGE009
Figure 669777DEST_PATH_IMAGE010
上的结果和表D连接,即得到查询Q的结果。
Plan B: 先做Q9和Q10,即分别得到表C和表D上的记录;然后将其连接,得到
Figure 892948DEST_PATH_IMAGE011
上的结果;然后做
Figure 98801DEST_PATH_IMAGE012
,将
Figure 91028DEST_PATH_IMAGE013
上的结果和表B连接;最后做
Figure 724135DEST_PATH_IMAGE014
Figure 700181DEST_PATH_IMAGE015
上的结果和表A连接,即得到查询Q的结果。
查询条件Q还有很多其他的查询计划,每一种查询计划都具有相应的执行代价。可以根据查询计划中包含的子查询的基数计算查询计划的执行代价。每个子查询Qi得到的记录数量称为其基数,记为C(Qi),其反映了执行子查询Qi所需要的执行代价,每个查询计划的执行代价C(Plan X)为该查询计划的所有子查询的基数的和,例如:
C(Plan A) =
Figure 444146DEST_PATH_IMAGE016
C(Plan B) =
Figure 822038DEST_PATH_IMAGE017
理想情况下,如果知道了查询Q的所有子查询Qi的真实基数,则可以遍历所有可能的查询计划,并选取其中执行代价最小的查询计划作为目标查询计划,执行该目标查询计划,得到查询条件对应的查询结果。
但是,在实际情况中,通常只能得到每个子查询Qi的估计基数C’(Qi),因此,可以遍历所有可能的查询计划,针对每个查询计划,对其包含的子查询的估计基数求和,得到该查询计划的执行代价,选择执行代价最小的查询计划执行。但是,因为基数估计往往存在误差,因此通过C’(Qi)选择得到的查询计划在实际中可能并不是更优的。例如对于上面的查询Q,假定其所有子查询的真实基数和估计基数如下:
Figure 891625DEST_PATH_IMAGE018
按照上表中真实基数C(Qi)计算可以得到,Plan A和Plan B的执行代价分别为11120和12620,因此实际上Plan A更优。但是按照C’(Qi)计算可以得到,Plan A和Plan B的执行代价分别为23540和21140,则此时认为Plan B更优。
根据本公开的实施例,为了修正基数估计误差对选择查询计划的影响,可以对子查询条件的初始估计基数在其误差范围内进行缩放,根据子查询条件的初始估计基数和初始估计基数的缩放结果确定查询计划的执行代价,选择执行代价最小的查询计划作为目标查询计划。
图2示出了根据本公开实施例的查询计划选择方法的流程图。如图2所示,所述查询计划选择方法包括以下步骤S101 - S103:
在步骤S101中,根据查询条件确定M个子查询条件,其中,所述子查询条件用于构造多个不同的查询计划,所述查询计划用于对数据库进行查询以得到对应于所述查询条件的查询结果,M>1;
在步骤S102中,确定所述子查询条件的初始估计基数;
在步骤S103中,根据所述M个子查询条件的初始估计基数和所述M个子查询条件的初始估计基数的缩放结果,选择目标查询计划。
根据本公开的实施例,所述根据所述M个子查询条件的初始估计基数和所述M个子查询条件的初始估计基数的缩放结果,选择目标查询计划,包括:根据所述M个子查询条件的初始估计基数生成多个参数集合,所述参数集合中的M个参数是相应的子查询条件的初始估计基数,或者是相应的子查询条件的初始估计基数的缩小或放大结果;基于所述参数集合,确定多个查询计划各自对应的执行代价;根据所述执行代价确定所述目标查询计划。
如图1和图2所示,在获取查询条件之后,可以根据查询条件确定M个子查询条件,所述子查询条件用于构造多个不同的查询计划,所述查询计划用于对数据库进行查询以得到对应于所述查询条件的查询结果,M>1。
例如,在上面的示例中,根据查询条件Q可以获取10个子查询条件Q1~Q10,即M=10。然后,可以根据已有的基数估计算法,确定10个子查询条件Q1~Q10的估计基数。为了与估计基数的缩放结果相区分,这里将根据基数估计算法得到的估计基数称为初始估计基数。
根据本公开的实施例,至少根据所述初始估计基数的误差范围确定所述初始估计基数进行缩放的缩放系数。例如,将缩放系数设置为使得初始估计基数的缩放结果在相应初始估计基数的可能取值范围内。假设初始估计基数为3000,考虑其误差范围之后,初始估计基数的可能取值范围为300~30000,则可以选择两个缩放系数0.1和10。如果希望得到更加精确的结果,可以选择更多的缩放系数,例如0.2、0.5、2、5等,只要缩放结果在初始估计基数的可能取值范围内即可。
根据本公开的实施例,可以根据所述M个子查询条件的初始估计基数生成多个参数集合,所述参数集合中的M个参数是相应的子查询条件的初始估计基数,或者是相应的子查询条件的初始估计基数的缩小或放大结果。
例如,在上面的示例中,可以基于初始估计基数C’(Qi)得到参数集合{C’(Qi)},对参数集合{C’(Qi)}中的任意一个或多个参数进行缩放,可以得到新的参数集合。针对每个参数集合,将其中的参数作为对应的子查询的估计基数,计算各查询计划的执行代价,选择执行代价最小的查询计划作为目标查询计划。这样,可以有效地减小基数估计误差对选择查询计划造成的干扰。
根据本公开的实施例,所述根据所述子查询条件的初始估计基数生成多个参数集合,包括:根据所述M个子查询条件的初始估计基数生成第一组参数集合,所述第一组参数集合包括一个参数集合,所述一个参数集合中的M个参数是相应的子查询条件的初始估计基数;通过对第i组参数集合中的各参数集合中的第i+1个参数进行缩小和放大,生成第i+1组参数集合,1≤i≤N,N<M;将所述第1~N组参数集合中的参数集合作为所述多个参数集合。
下面结合上述示例,说明根据子查询条件的初始估计基数生成多个参数集合的过程。
Figure 89388DEST_PATH_IMAGE019
如上表所示,C’(Qi)行是第一组参数集合,该第一组参数集合包括一个参数集合{C’(Qi)},1≤i≤10,其中的10个参数分别是子查询条件Q1~Q10的初始估计基数。
选择两个缩放系数0.1和10,对第一组参数集合中的第二个参数C’(Q2)=3000进行缩放,得到第二组参数集合,第二组参数集合包括两个参数集合{C’k1(Qi)}和{C’k2(Qi)}。
如上所述,基于第一组参数集合中的初始估计基数,确定Plan A和Plan B的执行代价分别为23540和21140,还可以计算其他各查询计划Plan X的执行代价。基于第二组参数集合中的参数集合{C’k1(Qi)},Plan A的执行代价为20840,Plan B的执行代价为21140,此时认为Plan A是较优的查询计划。基于第二组参数集合中的参数集合{C’k2(Qi)},Plan A的执行代价为50540,Plan B的执行代价为21140,还可以计算其他各查询计划Plan X的执行代价。
然后,通过对第二组参数集合中的各参数集合中的第三个参数C’(Q3)=1000进行缩小和放大,生成第三组参数集合,第三组参数集合包括四个参数集合{C’k11(Qi)}、{C’k12(Qi)}、{C’k21(Qi)}和{C’k22(Qi)}。
Figure 637044DEST_PATH_IMAGE020
针对第三组参数集合中的每个参数集合{C’k11(Qi)}、{C’k12(Qi)}、{C’k21(Qi)}和{C’k22(Qi)},分别计算Plan A和Plan B,以及其他各查询计划Plan X的执行代价。
以此类推,通过对第i组参数集合中的各参数集合中的第i+1个参数进行缩小和放大,生成第i+1组参数集合,1≤i≤N,N<M。
针对以上的示例,可以生成N+1组参数集合,N+1最多等于子查询条件的数量。
根据本公开的实施例,在进行缩放之前,将所述第一组参数集合中的一个参数集合中的参数按照相应子查询条件涉及的数据表数量和相应子查询条件的初始估计基数的大小进行排序。
例如,对所有参数按照对应的子查询Qi涉及的数据表的数量排序,涉及的数据表数量多的子查询对应的参数排在涉及的数据表数量少的子查询对应的参数之前。涉及的数据表数量相同时,按照初始估计基数值大小进行排序,大初始估计基数值对应的参数排在小初始估计基数值对应的参数之前。
参考以上示例,例如,Q1涉及4个数据表,Q2~Q4涉及三个数据表,因此Q1排在Q2~Q4之前。Q2、Q3、Q4的估计基数分别为3000、1000和500,因此Q2排在Q3前面,Q3排在Q4前面。其他参数的排序方式以此类推。
这样排序的好处是,涉及的数据表多、估计基数大的子查询条件的估计基数会先经历缩放。因为这些子查询条件的估计基数的误差对执行代价计算结果的影响更大,因此优先对它们进行缩放。对于涉及的数据表少、估计基数小的子查询条件,其估计基数的误差对执行代价计算结果的影响较小,可以根据实际情况省略对它们的缩放,以加快查询计划选择速度。
根据本公开的实施例,所述基于所述参数集合,确定多个查询计划各自对应的执行代价,包括:将所述参数集合中的参数作为相应的子查询条件的估计基数;根据所述查询计划对应的子查询条件的估计基数,确定所述查询计划的执行代价。
具体地,将第1~N组参数集合中的参数集合作为所述多个参数集合,针对每个参数集合,计算各查询计划的执行代价,选择执行代价最小的查询计划作为目标查询计划。这样,通过对初始估计基数进行缩放,基于初始估计基数及其缩放结果计算查询计划的执行代价,隐式修正了估计基数误差对选择查询计划的影响。
本公开还公开了一种电子设备,图3示出根据本公开的实施例的电子设备的结构框图。
如图3所示,所述电子设备300包括存储器301和处理器302,其中,存储器301用于存储一条或多条计算机指令,其中,所述一条或多条计算机指令被所述处理器302执行以实现根据本公开的实施例的方法。
在本公开实施例中,所述查询计划选择方法,包括:
根据查询条件确定M个子查询条件,其中,所述子查询条件用于构造多个不同的查询计划,所述查询计划用于对数据库进行查询以得到对应于所述查询条件的查询结果,M>1;
确定所述子查询条件的初始估计基数;
根据所述M个子查询条件的初始估计基数和所述M个子查询条件的初始估计基数的缩放结果,选择目标查询计划。
根据本公开的实施例,所述根据所述M个子查询条件的初始估计基数和所述M个子查询条件的初始估计基数的缩放结果,选择目标查询计划,包括:
根据所述M个子查询条件的初始估计基数生成多个参数集合,所述参数集合中的M个参数是相应的子查询条件的初始估计基数,或者是相应的子查询条件的初始估计基数的缩小或放大结果;
基于所述参数集合,确定多个查询计划各自对应的执行代价;
根据所述执行代价确定所述目标查询计划。
根据本公开的实施例,所述根据所述子查询条件的初始估计基数生成多个参数集合,包括:
根据所述M个子查询条件的初始估计基数生成第一组参数集合,所述第一组参数集合包括一个参数集合,所述一个参数集合中的M个参数是相应的子查询条件的初始估计基数;
通过对第i组参数集合中的各参数集合中的第i+1个参数进行缩小和放大,生成第i+1组参数集合,1≤i≤N,N<M;
将所述第1~N组参数集合中的参数集合作为所述多个参数集合。
根据本公开的实施例,所述一个参数集合中的参数按照相应子查询条件涉及的数据表数量和相应子查询条件的初始估计基数的大小进行排序。
根据本公开的实施例,所述基于所述参数集合,确定多个查询计划各自对应的执行代价,包括:
将所述参数集合中的参数作为相应的子查询条件的估计基数;
根据所述查询计划对应的子查询条件的估计基数,确定所述查询计划的执行代价。
根据本公开的实施例,所述根据所述执行代价确定所述目标查询计划,包括:
将执行代价最小的查询计划作为所述目标查询计划。
根据本公开的实施例,至少根据所述初始估计基数的误差范围确定所述初始估计基数进行缩放的缩放系数。
图4示出适于用来实现根据本公开实施例的方法的计算机系统的结构示意图。
如图4所示,计算机系统400包括处理单元401,其可以根据存储在只读存储器(ROM)402中的程序或者从存储部分408加载到随机访问存储器(RAM)403中的程序而执行上述实施例中的各种处理。在RAM 403中,还存储有系统400操作所需的各种程序和数据。处理单元 401、ROM 402以及RAM 403通过总线404彼此相连。输入/输出(I/O)接口405也连接至总线404。
以下部件连接至I/O接口405:包括键盘、鼠标等的输入部分406;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分407;包括硬盘等的存储部分408;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分409。通信部分409经由诸如因特网的网络执行通信处理。驱动器410也根据需要连接至I/O接口405。可拆卸介质411,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器410上,以便于从其上读出的计算机程序根据需要被安装入存储部分408。其中,所述处理单元401可实现为CPU、GPU、TPU、FPGA、NPU等处理单元。
特别地,根据本公开的实施例,上文描述的方法可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括计算机指令,该计算机指令被处理器执行时实现上文所述的方法步骤。在这样的实施例中,该计算机程序产品可以通过通信部分409从网络上被下载和安装,和/或从可拆卸介质411被安装。
图5示出适于用来实现根据本公开实施例的方法的分布式数据库系统的结构示意图。
如图5所示,分布式数据库系统501可以包括互联的多个主机,例如包括主机1、主机2、主机3……主机n。分布式数据库系统501中的主机可以用于实现以下一项或多项功能:存储数据表(例如,包括单表和/或通过连接单表生成的连接表等);实现与外部设备的通信;执行指定计算操作。例如,分布式数据库系统501中的主机可以用于实现根据本公开实施例的查询计划选择系统和方法。具体地,根据本公开实施例的查询计划选择系统中的各个模块,和/或根据本公开实施例的查询计划选择方法可以使用分布式数据库系统501中的一个或多个主机实现,例如,可以在基于所述主机创建的虚拟机、容器、云服务器中实现。
分布式数据库系统501与客户端502通信,从客户端502获取查询条件,基于查询条件和自身存储的与查询条件相关的表进行查询计划选择,根据选择的目标查询计划执行查询,然后向客户端502返回查询条件的查询结果。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开实施例中所涉及到的单元或模块可以通过软件的方式实现,也可以通过可编程硬件的方式来实现。所描述的单元或模块也可以设置在处理器中,这些单元或模块的名称在某种情况下并不构成对该单元或模块本身的限定。
作为另一方面,本公开还提供了一种计算机可读存储介质,该计算机可读存储介质可以是上述实施例中电子设备或计算机系统中所包含的计算机可读存储介质;也可以是单独存在,未装配入设备中的计算机可读存储介质。计算机可读存储介质存储有一个或者一个以上程序,所述程序被一个或者一个以上的处理器用来执行描述于本公开的方法。
以上描述仅为本公开的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本公开中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离所述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本公开中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

Claims (14)

1.一种查询计划选择系统,包括:
子查询条件确定模块,被配置为根据查询条件确定M个子查询条件,其中,所述子查询条件用于构造多个不同的查询计划,所述查询计划用于对数据库进行查询以得到对应于所述查询条件的查询结果,M>1;
初始估计基数确定模块,被配置为确定所述子查询条件的初始估计基数;
目标查询计划选择模块,被配置为根据所述M个子查询条件的初始估计基数和所述M个子查询条件的初始估计基数的缩放结果,选择目标查询计划。
2.根据权利要求1所述的系统,其中,所述目标查询计划选择模块包括:
参数集合生成模块,被配置为根据所述M个子查询条件的初始估计基数生成多个参数集合,所述参数集合中的M个参数是相应的子查询条件的初始估计基数,或者是相应的子查询条件的初始估计基数的缩小或放大结果;
执行代价确定模块,被配置为基于所述参数集合,确定多个查询计划各自对应的执行代价;
查询计划确定模块,被配置为根据所述执行代价确定所述目标查询计划。
3.根据权利要求2所述的系统,其中,所述根据所述子查询条件的初始估计基数生成多个参数集合,包括:
根据所述M个子查询条件的初始估计基数生成第一组参数集合,所述第一组参数集合包括一个参数集合,所述一个参数集合中的M个参数是相应的子查询条件的初始估计基数;
通过对第i组参数集合中的各参数集合中的第i+1个参数进行缩小和放大,生成第i+1组参数集合,1≤i≤N,N<M;
将所述第1~N组参数集合中的参数集合作为所述多个参数集合。
4.根据权利要求3所述的系统,其中,所述一个参数集合中的参数按照相应子查询条件涉及的数据表数量和相应子查询条件的初始估计基数的大小进行排序。
5.根据权利要求2所述的系统,其中,所述基于所述参数集合,确定多个查询计划各自对应的执行代价,包括:
将所述参数集合中的参数作为相应的子查询条件的估计基数;
根据所述查询计划对应的子查询条件的估计基数,确定所述查询计划的执行代价。
6.根据权利要求2所述的系统,其中,所述根据所述执行代价确定所述目标查询计划,包括:
将执行代价最小的查询计划作为所述目标查询计划。
7.根据权利要求1所述的系统,其中,至少根据所述初始估计基数的误差范围确定所述初始估计基数进行缩放的缩放系数。
8.一种查询计划选择方法,包括:
根据查询条件确定M个子查询条件,其中,所述子查询条件用于构造多个不同的查询计划,所述查询计划用于对数据库进行查询以得到对应于所述查询条件的查询结果,M>1;
确定所述子查询条件的初始估计基数;
根据所述M个子查询条件的初始估计基数和所述M个子查询条件的初始估计基数的缩放结果,选择目标查询计划。
9.根据权利要求8所述的方法,其中,所述根据所述M个子查询条件的初始估计基数和所述M个子查询条件的初始估计基数的缩放结果,选择目标查询计划,包括:
根据所述M个子查询条件的初始估计基数生成多个参数集合,所述参数集合中的M个参数是相应的子查询条件的初始估计基数,或者是相应的子查询条件的初始估计基数的缩小或放大结果;
基于所述参数集合,确定多个查询计划各自对应的执行代价;
根据所述执行代价确定所述目标查询计划。
10.根据权利要求9所述的方法,其中,所述根据所述子查询条件的初始估计基数生成多个参数集合,包括:
根据所述M个子查询条件的初始估计基数生成第一组参数集合,所述第一组参数集合包括一个参数集合,所述一个参数集合中的M个参数是相应的子查询条件的初始估计基数;
通过对第i组参数集合中的各参数集合中的第i+1个参数进行缩小和放大,生成第i+1组参数集合,1≤i≤N,N<M;
将所述第1~N组参数集合中的参数集合作为所述多个参数集合。
11.根据权利要求10所述的方法,其中,所述一个参数集合中的参数按照相应子查询条件涉及的数据表数量和相应子查询条件的初始估计基数的大小进行排序。
12.根据权利要求9所述的方法,其中,所述基于所述参数集合,确定多个查询计划各自对应的执行代价,包括:
将所述参数集合中的参数作为相应的子查询条件的估计基数;
根据所述查询计划对应的子查询条件的估计基数,确定所述查询计划的执行代价。
13.一种电子设备,包括存储器和处理器;其中,所述存储器用于存储一条或多条计算机指令,其中,所述一条或多条计算机指令被所述处理器执行以实现权利要求8-12中任一项所述的方法步骤。
14.一种可读存储介质,其上存储有计算机指令,该计算机指令被处理器执行时实现权利要求8-12中任一项所述的方法步骤。
CN202210204269.6A 2022-03-03 2022-03-03 查询计划选择系统、方法、电子设备及介质 Active CN114328614B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210204269.6A CN114328614B (zh) 2022-03-03 2022-03-03 查询计划选择系统、方法、电子设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210204269.6A CN114328614B (zh) 2022-03-03 2022-03-03 查询计划选择系统、方法、电子设备及介质

Publications (2)

Publication Number Publication Date
CN114328614A true CN114328614A (zh) 2022-04-12
CN114328614B CN114328614B (zh) 2022-07-05

Family

ID=81029956

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210204269.6A Active CN114328614B (zh) 2022-03-03 2022-03-03 查询计划选择系统、方法、电子设备及介质

Country Status (1)

Country Link
CN (1) CN114328614B (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060026133A1 (en) * 2004-07-27 2006-02-02 Oracle International Corporation Determining query cost based on subquery filtering factor
US20100235347A1 (en) * 2009-03-14 2010-09-16 Microsoft Corporation Techniques for exact cardinality query optimization
CN109241093A (zh) * 2017-06-30 2019-01-18 华为技术有限公司 一种数据查询的方法、相关装置及数据库系统
CN110688393A (zh) * 2019-09-29 2020-01-14 星环信息科技(上海)有限公司 查询语句优化方法、装置、计算机设备及存储介质
CN111435351A (zh) * 2019-01-15 2020-07-21 阿里巴巴集团控股有限公司 数据库查询优化方法、设备及存储介质
CN111512283A (zh) * 2017-12-21 2020-08-07 华为技术有限公司 数据库中的基数估算
CN111670433A (zh) * 2018-01-31 2020-09-15 易享信息技术有限公司 查询优化器约束

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060026133A1 (en) * 2004-07-27 2006-02-02 Oracle International Corporation Determining query cost based on subquery filtering factor
US20100235347A1 (en) * 2009-03-14 2010-09-16 Microsoft Corporation Techniques for exact cardinality query optimization
CN109241093A (zh) * 2017-06-30 2019-01-18 华为技术有限公司 一种数据查询的方法、相关装置及数据库系统
CN111512283A (zh) * 2017-12-21 2020-08-07 华为技术有限公司 数据库中的基数估算
CN111670433A (zh) * 2018-01-31 2020-09-15 易享信息技术有限公司 查询优化器约束
CN111435351A (zh) * 2019-01-15 2020-07-21 阿里巴巴集团控股有限公司 数据库查询优化方法、设备及存储介质
CN110688393A (zh) * 2019-09-29 2020-01-14 星环信息科技(上海)有限公司 查询语句优化方法、装置、计算机设备及存储介质

Also Published As

Publication number Publication date
CN114328614B (zh) 2022-07-05

Similar Documents

Publication Publication Date Title
AU2006262110B2 (en) Aggregating data with complex operations
US7908242B1 (en) Systems and methods for optimizing database queries
US7856416B2 (en) Automated latent star schema discovery tool
US7181460B2 (en) User-defined aggregate functions in database systems without native support
US10169412B2 (en) Selectivity estimation for query execution planning in a database
WO2015139018A1 (en) Mapping attributes of keyed entities
US20170139989A1 (en) Pruning of Table Partitions from a Calculation Scenario for Executing a Query
US20100235344A1 (en) Mechanism for utilizing partitioning pruning techniques for xml indexes
US20070233634A1 (en) Method and system for estimating cardinality in a database system
US9098550B2 (en) Systems and methods for performing data analysis for model proposals
US20190354516A1 (en) Single-level, multi-dimension, hash-based table partitioning
US11036734B2 (en) Fusing global reporting aggregate computation with the underlying operation in the query tree for efficient evaluation
US20230185818A1 (en) Systems and methods for generation and display of query visualizations
US20090030880A1 (en) Model-Based Analysis
CN115422205A (zh) 数据处理方法、装置、电子设备及存储介质
CN107735781B (zh) 存储查询结果的方法和装置、计算设备
CN109344169B (zh) 数据处理方法及装置
CN114328614B (zh) 查询计划选择系统、方法、电子设备及介质
US9092472B1 (en) Data merge based on logical segregation
US20190266163A1 (en) System and method for behavior-on-read query processing
Procopio et al. Load-n-go: Fast approximate join visualizations that improve over time
CN109213922B (zh) 一种对搜索结果排序的方法和装置
CN115718768A (zh) 一种多市场数据查询方法、系统及装置
US11455308B2 (en) Partition aware partial query processing
US20050021543A1 (en) Systems and methods for combining database tables

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: Room 554, 5 / F, building 3, 969 Wenyi West Road, Wuchang Street, Yuhang District, Hangzhou City, Zhejiang Province

Applicant after: Alibaba (China) Co.,Ltd.

Address before: 310052 room 508, 5th floor, building 4, No. 699 Wangshang Road, Changhe street, Binjiang District, Hangzhou City, Zhejiang Province

Applicant before: Alibaba (China) Co.,Ltd.

CB02 Change of applicant information
GR01 Patent grant
GR01 Patent grant