CN109947791B - 一种数据库语句优化方法、装置、设备及存储介质 - Google Patents

一种数据库语句优化方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN109947791B
CN109947791B CN201910239809.2A CN201910239809A CN109947791B CN 109947791 B CN109947791 B CN 109947791B CN 201910239809 A CN201910239809 A CN 201910239809A CN 109947791 B CN109947791 B CN 109947791B
Authority
CN
China
Prior art keywords
layer
query
clause
function
grouping
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910239809.2A
Other languages
English (en)
Other versions
CN109947791A (zh
Inventor
万伟
朱仲颖
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Dameng Database Co Ltd
Original Assignee
Shanghai Dameng Database Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Dameng Database Co Ltd filed Critical Shanghai Dameng Database Co Ltd
Priority to CN201910239809.2A priority Critical patent/CN109947791B/zh
Publication of CN109947791A publication Critical patent/CN109947791A/zh
Application granted granted Critical
Publication of CN109947791B publication Critical patent/CN109947791B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种数据库语句优化方法、装置、设备及存储介质。该方法包括:获取用户输入的查询语句;若所述查询语句包括外层分组子句和表单子句,则根据所述外层分组子句构建内层分组子句,其中,所述表单子句的表单项为派生表且不包括分组子句;根据所述内层分组子句转换所述查询语句,通过本发明的技术方案,能够实现提高数据库语句的执行效率。

Description

一种数据库语句优化方法、装置、设备及存储介质
技术领域
本发明实施例涉及计算机技术,尤其涉及一种数据库语句优化方法、装置、设备及存储介质。
背景技术
分组查询是数据库中常见的一种查询。在数据库SQL(Structured QueryLanguage,结构化查询语言)语句中可使用GROUP BY子句指定对数据按指定的列进行分组。例如,设表T中每一行数据记录了一个员工的基本信息,“SELECT部门号,COUNT(*)FROM TGROUP BY部门号;”语句指定对表T的数据按指定的分组列“部门号”进行分组,然后对每个分组使用COUNT(*)集函数统计组内记录行数,最后返回的是每个部门的部门号及人数。
通常,数据库对于分组的实现是将所有记录从FROM项中提取出来,如果有WHERE过滤条件,则将这些记录按照WHERE条件进行过滤,将满足条件的所有记录按照GROUP BY指定的分组列进行分组。当FROM项为派生表(类似一个根据SELECT语句构建的临时表)时,有时这种传统实现方式的性能会非常低。
假设有表T,该表有C1、C2、C3三列,有形如下列的查询:
SELECT MAX(D1),D2 FROM(SELECT C1 AS D1,FUNC(C2)AS D2,C3 ASD3 FROM T)GROUP BY D2;
由于这个查询的FROM项为派生表,则从FROM项提取记录时,需要对T表的每一条记录执行一次派生表的子查询“SELECT C1 AS D1,FUNC(C2)AS D2,C3 AS D3 FROM T”,如果T表数据量很大,查询效率会较低。当查询项中还包含函数计算如本例中的FUNC()时,对T表的每一条记录都需要计算FUNC()函数,如果函数本身较耗时,则查询的效率会更低。
发明内容
本发明实施例提供一种数据库语句优化方法、装置、设备及存储介质,以实现提高数据库语句的执行效率。
第一方面,本发明实施例提供了一种数据库语句优化方法,包括:
获取用户输入的查询语句;
若所述查询语句包括外层分组子句和表单子句,则根据所述外层分组子句构建内层分组子句,其中,所述表单子句的表单项为派生表且不包括分组子句;
根据所述内层分组子句转换所述查询语句。
进一步的,外层分组项中包括所述派生表的列。
进一步的,根据所述内层分组子句转换所述查询语句包括:
若所述派生表中存在不是外层分组项的查询项,则删除所述派生表的查询项。
进一步的,删除所述派生表的查询项之后,还包括:
新建内层派生表,所述内层派生表包括:包含内层分组子句的内层查询语句,根据外层分组子句构建所述内层查询语句;
根据所述内层派生表构建中间层派生表;
根据所述中间层派生表转换所述查询语句。
进一步的,所述查询语句还包括外层集函数,其中,所述外层集函数包括MAX函数、MIN函数、COUNT函数以及SUM函数中的至少一种,且所述SUM函数的参数为所述派生表的列,所述MAX函数、MIN函数和COUNT函数的参数为常数和/或所述派生表的列。
进一步的,根据所述内层分组子句转换所述查询语句包括:
若所述派生表中存在不是外层分组项且不是外层集函数的参数的查询项,则删除所述派生表的查询项。
进一步的,删除所述派生表的查询项之后,还包括:
新建内层派生表,所述内层派生表包括:包含内层集函数和内层分组子句的内层查询语句,根据外层分组子句构建所述内层查询语句,根据外层集函数构建内层集函数;
根据所述内层派生表构建中间层派生表;
根据所述中间层派生表转换所述查询语句。
进一步的,还包括:
若外层集函数为COUNT函数,且COUNT函数的参数为所述派生表的列,则将所述COUNT函数转换为SUM函数,参数不变;
若外层集函数为COUNT函数,且COUNT函数的参数为常数,则将所述COUNT函数转换为SUM函数,参数转换为TMPCOL。
第二方面,本发明实施例还提供了一种数据库语句优化装置,该装置包括:
获取模块,用于获取用户输入的查询语句;
构建模块,用于若所述查询语句包括外层分组子句和表单子句,则根据所述外层分组子句构建内层分组子句,其中,所述表单子句的表单项为派生表且不包括分组子句;
转换模块,用于根据所述内层分组子句转换所述查询语句。
第三方面,本发明实施例还提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如本发明实施例中任一所述的数据库语句优化方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本发明实施例中任一所述的数据库语句优化方法。
本发明实施例通过获取用户输入的查询语句;若所述查询语句包括外层分组子句和表单子句,则根据所述外层分组子句构建内层分组子句,其中,所述表单子句的表单项为派生表且不包括分组子句;根据所述内层分组子句转换所述查询语句,能够提高数据库语句的执行效率。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1是本发明实施例一中的一种数据库语句优化方法的流程图;
图2是本发明实施例二中的一种数据库语句优化方法的流程图;
图3是本发明实施例三中的一种数据库语句优化装置的结构示意图;
图4是本发明实施例四中的一种计算机设备的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。同时,在本发明的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
实施例一
图1为本发明实施例一提供的一种数据库语句优化方法的流程图,本实施例可适用于数据库语句优化的情况,该方法可以由本发明实施例中的数据库语句优化装置来执行,该装置可采用软件和/或硬件的方式实现,如图1所示,该方法具体包括如下步骤:
S110,获取用户输入的查询语句。
其中,所述用户输入的查询语句的获取方式可以为实时获取用户输入的查询语句,也可以为间隔预设时间获取用户输入的查询语句,或者可以为周期性获取用户输入的查询语句,本发明实施例对此不进行限制。
其中,所述查询语句为数据库SQL语句。
具体的,获取用户输入的查询语句,例如可以是,获取用户输入的查询语句:SELECT MAX(D1),D2 FROM(SELECT C1 AS D1,FUNC(C2)AS D2,C3 AS D3 FROM T)GROUP BYD2。
S120,若查询语句包括外层分组子句和表单子句,则根据外层分组子句构建内层分组子句,其中,表单子句的表单项为派生表且不包括分组子句。
其中,所述外层分组子句为表单子句外的GROUP BY子句,例如可以是,若查询语句为SELECT MAX(D1),D2 FROM(SELECT C1 AS D1,FUNC(C2)AS D2,C3 AS D3 FROM T)GROUPBY D2,则其中GROUP BY D2为外层分组子句,GROUP BY D2位于表单子句外。
其中,所述表单子句的表单项为派生表,例如可以是,若表单子句为FROM(SELECTC1 AS D1,FUNC(C2)AS D2,C3 AS D3 FROM T),(SELECT C1 AS D1,FUNC(C2)AS D2,C3 ASD3 FROM T)为派生表,且(SELECT C1 AS D1,FUNC(C2)AS D2,C3 AS D3 FROM T)中不包括分组子句。
其中,所述内层分组子句为派生表中包括的分组子句,例如可以是,FROM(SELECTC2,MAX(C1)AS D1 FROM T GROUP BY C2),其中,GROUP BY C2为内层分组子句。
其中,根据外层分组子句构建内层分组子句的方式可以为根据外层分组子句的外层分组项确定内层分组子句的内层分组项,根据内层分组项构建内层分组子句。
具体的,若查询语句包括外层分组子句和表单子句,则根据外层分组子句构建内层分组子句,其中,表单子句的表单项为派生表且不包括分组子句。例如可以是,若查询语句为SELECT D2 FROM(SELECT C1 AS D1,FUNC(C2)AS D2,C3 AS D3 FROM T)GROUP BY D2,根据GROUP BY D2构建内层分组子句GROUP BY C2。
S130,根据内层分组子句转换查询语句。
其中,根据内层分组子句转换查询语句可以为根据内层分组子句新建内层派生表,根据内层派生表转换查询语句;还可以为根据内层分组子句新建内层派生表,根据内层派生表构建中间层派生表,根据中间层派生表转换查询语句。本发明实施例对此不进行限制。
具体的,根据内层分组子句转换查询语句,例如可以是,若转换前查询语句为SELECT D2 FROM(SELECT C1 AS D1,FUNC(C2)AS D2,C3 AS D3 FROM T)GROUP BY D2,内层分组子句为GROUP BY C2,转换后的查询语句为SELECT D2 FROM(SELECT D1,FUNC(C2)ASD2 FROM(SELECT C2 FROM T GROUP BY C2))GROUP BY D2。
可选的,外层分组项中包括所述派生表的列。
其中,所述派生表的列为所述派生表的查询项中的参数,例如可以是,若派生表为:SELECT C1 AS D1,FUNC(C2)AS D2,C3 AS D3 FROM T,其中,C1 AS D1为派生表的查询项,FUNC(C2)AS D2为派生表的查询项,C3 AS D3为派生表的查询项,其中,D1为派生表的列,D2为派生表的列,D3为派生表的列,C1为T表的列,C2为T表的列,C3为T表的列,其中,T表为普通表,也就是数据库中存储的表。
可选的,根据所述内层分组子句转换所述查询语句包括:
若所述派生表中存在不是外层分组项的查询项,则删除所述派生表的查询项。
其中,外层分组项为GROUP BY子句指定的列,例如可以是,若外层分组子句为GROUP BY D2,外层分组项为D2。
具体的,判断派生表中的查询项中是否存在不是外层分组项的查询项,若存在,则删除,例如可以是,若派生表为:SELECT FUNC(C2)AS D2,C3 AS D3 FROM T,其中,FUNC(C2)AS D2为派生表的查询项,C3 AS D3为派生表的查询项,外层分组项为D2,则C3 AS D3中存在不是外层分组项的查询项,删除C3 AS D3。
可选的,删除所述派生表的查询项之后,还包括:
新建内层派生表,所述内层派生表包括:包含内层分组子句的内层查询语句,根据外层分组子句构建所述内层查询语句。
其中,根据外层分组子句构建所述内层查询语句的方式可以为根据外层分组子句收集其对应派生表的列,例如可以是,若外层分组子句为GROUP BY D2,则根据GROUP BY D2构建内层查询语句SELECT C2。
具体的,根据外层分组子句构建内层查询语句,将内层查询语句和内层分组子句作为内层派生表。
根据所述内层派生表构建中间层派生表;
根据所述中间层派生表转换所述查询语句。
在一个具体的例子中,对用户输入的SQL查询语句进行语法和语义解析,判断是否为满足本方法的可优化的查询语句,用户输入的原始查询语句为:SELECT D2 FROM(SELECTC1 AS D1,FUNC(C2)AS D2,C3 AS D3 FROM T)GROUP BY D2,应同时满足如下条件:查询语句中包含外层分组子句(GROUP BY子句);表单项(FROM项)为派生表;外层分组项(GROUP BY子句指定的列)中有派生表的列。(如外层分组子句GROUP BY D2,D2的实现是FUNC(C2),包含属于T表的C2列);派生表的定义本身不能有外层分组子句;若满足上述优化条件,则继续进行优化处理,否则不进行优化处理,按通用分组算法处理;处理原始查询语句中派生表的所有查询项,根据类型进行不同标记,优先判断是否是外层分组项,若未被外层引用,则可以直接去除。如前面的例子中用户输入的原始查询语句为:SELECT D2 FROM(SELECT C1 ASD1,FUNC(C2)AS D2,C3 AS D3 FROM T)GROUP BY D2,原始查询语句的派生表有三个查询项:C1 AS D1、FUNC(C2)AS D2和C3 AS D3,D2是外层分组项,D1和D3没被外层引用。构建内层查询项:外层分组项收集其对应派生表的列;如继续前面的例子:D2列收集到C2列;D1和D3可以不处理,则构建出内层查询项为:"SELECT C2"。构建内层派生表的其余部分:FROM项可以直接使用原始语句中派生表的FROM项,如例子中的"FROM T",内部分组项则根据外层分组项构建,如例子中的D2列收集到的C2列,即"GROUP BY C2"。如继续前面的例子,得到内层查询为:"SELECT C2 FROM T GROUP BY C2"。将原始查询语句中派生表的FROM T修改为上一步中构建出的内层派生表。如继续前面的例子,派生表的FROM T修改为"FROM(SELECTC2 FROM T GROUP BY C2)"。修改原始查询语句中派生表的查询项,没被引用则直接去除该项,则构建出优化语句的中间层查询。如继续前面的例子,FUNC(C2)AS D2不变,C1 AS D1和C3 AS D3直接丢弃。则得到中间层查询为:"SELECT FUNC(C2)AS D2 FROM(SELECT C2 FROMT GROUP BY C2)"将上一步骤得到的中间层查询作为外层查询的FROM项,外层查询的其余部分直接使用原始语句的外层查询相关部分。如继续前面的例子,得到最终的优化语句为:“SELECT D2 FROM(SELECT FUNC(C2)AS D2 FROM(SELECT C2 FROM T GROUP BY C2))GROUPBY D2”。
本实施例的技术方案,通过获取用户输入的查询语句;若所述查询语句包括外层分组子句和表单子句,则根据所述外层分组子句构建内层分组子句,其中,所述表单子句的表单项为派生表且不包括分组子句;根据所述内层分组子句转换所述查询语句,能够提高数据库语句的执行效率。
实施例二
图2为本发明实施例二中的一种数据库语句优化方法的流程图,本实施例以上述实施例为基础进行优化,在本实施例中,所述查询语句还包括外层集函数,其中,所述外层集函数包括MAX函数、MIN函数、COUNT函数以及SUM函数中的至少一种,且所述SUM函数的参数为所述派生表的列,所述MAX函数、MIN函数和COUNT函数的参数为常数和/或所述派生表的列。
如图2所示,本实施例的方法具体包括如下步骤:
S210,获取用户输入的查询语句。
S220,若查询语句包括外层分组子句、表单子句和外层集函数,则根据外层分组子句构建内层分组子句,其中,表单子句的表单项为派生表且不包括分组子句。
其中,所述外层集函数包括MAX函数、MIN函数、COUNT函数以及SUM函数中的至少一种,且所述SUM函数的参数为所述派生表的列,所述MAX函数、MIN函数和COUNT函数的参数为常数和/或所述派生表的列。
S230,根据内层分组子句转换查询语句。
可选的,根据所述内层分组子句转换所述查询语句包括:
若所述派生表中存在不是外层分组项且不是外层集函数的参数的查询项,则删除所述派生表的查询项。
具体的,判断派生表中的查询项中是否存在不是外层分组项且不是外层集函数的参数的查询项,若存在,则删除,例如可以是,用户输入的原始查询语句为:SELECT MAX(D1),D2 FROM(SELECT C1 AS D1,FUNC(C2)AS D2,C3 AS D3 FROM T)GROUP BY D2,派生表为:SELECT C1 AS D1,FUNC(C2)AS D2,C3 AS D3 FROM T,其中,C1 AS D1中的D1不是外层分组项,D1是集函数的参数,FUNC(C2)AS D2为派生表的查询项,C3 AS D3为派生表的查询项,外层分组项为D2,则C3 AS D3既不是外层分组项又不是外层集函数的参数的查询项,删除C3 AS D3。
可选的,删除所述派生表的查询项之后,还包括:
新建内层派生表,所述内层派生表包括:内层查询语句、内层集函数和内层分组子句,根据外层分组子句构建所述内层查询语句,根据外层集函数构建内层集函数。
其中,根据外层集函数构建内层集函数的方式可以为根据外层集函数的参数确定内层集函数的参数,进而根据内层集函数的参数构建内层集函数,例如可以是,若外层集函数为MAX(D1),且C1 AS D1,则内层集函数为MAX(C1)。
根据所述内层派生表构建中间层派生表;
根据所述中间层派生表转换所述查询语句。
可选的,还包括:
若外层集函数为COUNT函数,且COUNT函数的参数为所述派生表的列,则将所述COUNT函数转换为SUM函数,参数不变;
若外层集函数为COUNT函数,且COUNT函数的参数为常数,则将所述COUNT函数转换为SUM函数,参数转换为TMPCOL。
在一个具体的例子中,对用户输入的SQL查询语句进行语法和语义解析,判断是否为满足本方法的可优化的查询语句,用户输入的原始查询语句为:SELECT MAX(D1),D2FROM(SELECT C1 AS D1,FUNC(C2)AS D2,C3 AS D3 FROM T)GROUP BY D2,应同时满足如下条件:查询语句中包含外层分组子句(GROUP BY子句);表单项(FROM项)为派生表;外层分组项(GROUPBY子句指定的列)中有派生表的列。(如外层分组子句GROUP BY D2,D2的实现是FUNC(C2),包含属于T表的C2列);外层集函数的类型只能是MAX/MIN/COUNT/SUM,SUM的参数只能是派生表的列,MAX/MIN/COUNT的参数另外还可以是常数,派生表的定义本身不能有外层分组子句和集函数;若满足上述优化条件,则继续进行优化处理,否则不进行优化处理,按通用分组算法处理;处理原始查询语句中派生表的所有查询项,根据类型进行不同标记,优先判断是否是外层分组项,其次判断是否是外层的查询项的集函数的参数,若未被外层引用,则可以直接去除。原始查询语句:SELECT MAX(D1),D2 FROM(SELECT C1 AS D1,FUNC(C2)AS D2,C3 AS D3 FROM T)GROUP BY D2,原始查询语句的派生表有三个查询项:C1 ASD1,FUNC(C2)AS D2和C3 AS D3,第一个D1不是外层分组项但是是集函数的参数,D2是外层分组项,D3没被外层引用。构建内层查询项:外层分组项收集其对应派生表的列;如继续前面的例子:D2列收集到C2列;D1列构建出新的MAX(C1),D3可以不处理,则构建出内层查询项为:"SELECT C2,MAX(C1)AS D1"。说明:由于C1列作为外层MAX(D1)的参数,因此,改造派生表时,需要将C1列改为MAX(C1),与外层查询项保持一致,避免影响查询结果,构建内层派生表的其余部分:FROM项可以直接使用原始语句中派生表的FROM项,如例子中的"FROM T",内部分组项则根据外层分组项构建,如例子中的D2列收集到的C2列,即"GROUP BY C2"。如继续前面的例子,得到内层查询为:"SELECT C2,MAX(C1)AS D1 FROM T GROUP BY C2"。将原始查询语句中派生表的FROMT修改为上一步中构建出的内层派生表。如继续前面的例子,派生表的FROM T修改为"FROM(SELECT C2,MAX(C1)AS D1 FROM T GROUP BY C2)"。修改原始查询语句中派生表的查询项,没被引用则直接去除该项,则构建出优化语句的中间层查询。如继续前面的例子,C1 AS D1改为D1,FUNC(C2)AS D2不变,C3 AS D3直接丢弃。则得到中间层查询为:"SELECT D1,FUNC(C2)AS D2 FROM(SELECT C2,MAX(C1)AS D1 FROM T GROUP BYC2)"。将上一步骤得到的中间层查询作为外层查询的FROM项,外层查询的其余部分直接使用原始语句的外层查询相关部分。如继续前面的例子,得到最终的优化语句为:“SELECTMAX(D1),D2 FROM(SELECT D1,FUNC(C2)AS D2 FROM(SELECT C2,MAX(C1)AS D1 FROM TGROUP BY C2))GROUP BY D2”。特殊处理说明:为了保证优化语句与原始语句的等价,需要对外层集函数为COUNT的情况进行特殊处理:如果集函数COUNT的参数是列,比如COUNT(D1),则需要将其改为SUM(D1)。如果集函数COUNT的参数是常数,比如COUNT(10),则需要在内层指定新的别名TMPCOL,中间层也需要多加一个查询项TMPCOL,外层的COUNT(10)则改为SUM(TMPCOL)。优化语句构建完成,用优化语句替代原始语句,对优化语句重新进行词法、语法、语义分析并执行。
经过优化后,语句执行时先执行内层的SELECT(SELECT C2,MAX(C1)AS D1 FROM TGROUP BY C2),对T表的数据根据C2列进行分组,可以大幅减少中间结果集的行数。再以这个中间结果集作为中间层SELECT(SELECT D1,FUNC(C2)AS D2 FROM())的FROM项,虽然查询的层数由原始的两层变为了三层,但因为在内层查询就大幅减小了中间结果集的规模,后面两层查询效率都会很高,从而提高整条语句的执行效率。当查询项中包含函数计算如本例中的FUNC()时,FUNC()只需要计算中间结果集行数的次数,能大幅提升整条语句的执行效率。
本实施例的技术方案,通过获取用户输入的查询语句;若所述查询语句包括外层分组子句、外层集函数和表单子句,则根据所述外层分组子句构建内层分组子句,其中,所述表单子句的表单项为派生表且不包括分组子句;根据所述内层分组子句转换所述查询语句,能够提高数据库语句的执行效率。
实施例三
图3为本发明实施例三提供的一种数据库语句优化装置的结构示意图。本实施例可适用于数据库语句优化的情况,该装置可采用软件和/或硬件的方式实现,该装置可集成在任何提供数据库语句优化的功能的设备中,如图3所示,所述数据库语句优化装置具体包括:获取模块310、构建模块320和转换模块330。
其中,获取模块310,用于获取用户输入的查询语句;
构建模块320,用于若所述查询语句包括外层分组子句和表单子句,则根据所述外层分组子句构建内层分组子句,其中,所述表单子句的表单项为派生表且不包括分组子句;
转换模块330,用于根据所述内层分组子句转换所述查询语句。
可选的,外层分组项中包括所述派生表的列。
可选的,转换模块包括:
第一删除单元,用于若所述派生表中存在不是外层分组项的查询项,则删除所述派生表的查询项。
可选的,还包括:
第一新建单元,用于新建内层派生表,所述内层派生表包括:包含内层分组子句的内层查询语句,根据外层分组子句构建所述内层查询语句;
第一派生表构建单元,用于根据所述内层派生表构建中间层派生表;
第一语句转换单元,用于根据所述中间层派生表转换所述查询语句。
可选的,所述查询语句还包括外层集函数,其中,所述外层集函数包括MAX函数、MIN函数、COUNT函数以及SUM函数中的至少一种,且所述SUM函数的参数为所述派生表的列,所述MAX函数、MIN函数和COUNT函数的参数为常数和/或所述派生表的列。
可选的,转换模块包括:
第二删除单元,用于若所述派生表中存在不是外层分组项且不是外层集函数的参数的查询项,则删除所述派生表的查询项。
可选的,还包括:
第二新建单元,用于新建内层派生表,所述内层派生表包括:包含内层集函数和内层分组子句的内层查询语句,根据外层分组子句构建所述内层查询语句,根据外层集函数构建内层集函数;
第二派生表构建单元,用于根据所述内层派生表构建中间层派生表;
第二语句转换单元,用于根据所述中间层派生表转换所述查询语句。
可选的,还包括:
第一函数转换单元,用于若外层集函数为COUNT函数,且COUNT函数的参数为所述派生表的列,则将所述COUNT函数转换为SUM函数,参数不变;
第二函数转换单元,用于若外层集函数为COUNT函数,且COUNT函数的参数为常数,则将所述COUNT函数转换为SUM函数,参数转换为TMPCOL。
上述产品可执行本发明任意实施例所提供的方法,具备执行方法相应的功能模块和有益效果。
本实施例的技术方案,通过获取用户输入的查询语句;若所述查询语句包括外层分组子句和表单子句,则根据所述外层分组子句构建内层分组子句,其中,所述表单子句的表单项为派生表且不包括分组子句;根据所述内层分组子句转换所述查询语句,能够实现提高数据库语句的执行效率。
实施例四
图4为本发明实施例四中的一种计算机设备的结构示意图。图4示出了适于用来实现本发明实施方式的示例性计算机设备12的框图。图4显示的计算机设备12仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图4所示,计算机设备12以通用计算设备的形式表现。计算机设备12的组件可以包括但不限于:一个或者多个处理器或者处理单元16,系统存储器28,连接不同系统组件(包括系统存储器28和处理单元16)的总线18。
总线18表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(ISA)总线,微通道体系结构(MAC)总线,增强型ISA总线、视频电子标准协会(VESA)局域总线以及外围组件互连(PCI)总线。
计算机设备12典型地包括多种计算机系统可读介质。这些介质可以是任何能够被计算机设备12访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
系统存储器28可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(RAM)30和/或高速缓存存储器32。计算机设备12可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统34可以用于读写不可移动的、非易失性磁介质(图4未显示,通常称为“硬盘驱动器”)。尽管图4中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如CD-ROM,DVD-ROM或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线18相连。存储器28可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明各实施例的功能。
具有一组(至少一个)程序模块42的程序/实用工具40,可以存储在例如存储器28中,这样的程序模块42包括——但不限于——操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42通常执行本发明所描述的实施例中的功能和/或方法。
计算机设备12也可以与一个或多个外部设备14(例如键盘、指向设备、显示器24等)通信,还可与一个或者多个使得用户能与该计算机设备12交互的设备通信,和/或与使得该计算机设备12能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口22进行。另外,本实施例中的计算机设备12,显示器24不是作为独立个体存在,而是嵌入镜面中,在显示器24的显示面不予显示时,显示器24的显示面与镜面从视觉上融为一体。并且,计算机设备12还可以通过网络适配器20与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器20通过总线18与计算机设备12的其它模块通信。应当明白,尽管图中未示出,可以结合计算机设备12使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
处理单元16通过运行存储在系统存储器28中的程序,从而执行各种功能应用以及数据处理,例如实现本发明实施例所提供的数据库语句优化方法:获取用户输入的查询语句;若所述查询语句包括外层分组子句和表单子句,则根据所述外层分组子句构建内层分组子句,其中,所述表单子句的表单项为派生表且不包括分组子句;根据所述内层分组子句转换所述查询语句。
实施例五
本发明实施例五提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本申请所有发明实施例提供的数据库语句优化方法:获取用户输入的查询语句;若所述查询语句包括外层分组子句和表单子句,则根据所述外层分组子句构建内层分组子句,其中,所述表单子句的表单项为派生表且不包括分组子句;根据所述内层分组子句转换所述查询语句。
可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括——但不限于——电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于——无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (8)

1.一种数据库语句优化方法,其特征在于,包括:
获取用户输入的查询语句;
若所述查询语句包括外层分组子句和表单子句,则根据所述外层分组子句构建内层分组子句,其中,所述表单子句的表单项为派生表且不包括分组子句;
根据所述内层分组子句转换所述查询语句;
外层分组项中包括所述派生表的列;
所述根据所述内层分组子句转换所述查询语句包括:
若所述派生表中存在不是外层分组项的查询项,则删除所述派生表的查询项;
所述删除所述派生表的查询项之后,还包括:
新建内层派生表,所述内层派生表包括:包含内层分组子句的内层查询语句,根据外层分组子句构建所述内层查询语句;
根据所述内层派生表构建中间层派生表;
根据所述中间层派生表转换所述查询语句。
2.根据权利要求1所述的方法,其特征在于,所述查询语句还包括外层集函数,其中,所述外层集函数包括MAX函数、MIN函数、COUNT函数以及SUM函数中的至少一种,且所述SUM函数的参数为所述派生表的列,所述MAX函数、MIN函数和COUNT函数的参数为常数和/或所述派生表的列。
3.根据权利要求2所述的方法,其特征在于,根据所述内层分组子句转换所述查询语句包括:
若所述派生表中存在不是外层分组项且不是外层集函数的参数的查询项,则删除所述派生表的查询项。
4.根据权利要求3所述的方法,其特征在于,删除所述派生表的查询项之后,还包括:
新建内层派生表,所述内层派生表包括:包含内层集函数和内层分组子句的内层查询语句,根据外层分组子句构建所述内层查询语句,根据外层集函数构建内层集函数;
根据所述内层派生表构建中间层派生表;
根据所述中间层派生表转换所述查询语句。
5.根据权利要求3所述的方法,其特征在于,还包括:
若外层集函数为COUNT函数,且COUNT函数的参数为所述派生表的列,则将所述COUNT函数转换为SUM函数,参数不变;
若外层集函数为COUNT函数,且COUNT函数的参数为常数,则将所述COUNT函数转换为SUM函数,参数转换为TMPCOL。
6.一种数据库语句优化装置,其特征在于,包括:
获取模块,用于获取用户输入的查询语句;
构建模块,用于若所述查询语句包括外层分组子句和表单子句,则根据所述外层分组子句构建内层分组子句,其中,所述表单子句的表单项为派生表且不包括分组子句;
转换模块,用于根据所述内层分组子句转换所述查询语句;
外层分组项中包括所述派生表的列;
转换模块包括:
第一删除单元,用于若所述派生表中存在不是外层分组项的查询项,则删除所述派生表的查询项;
第一新建单元,用于新建内层派生表,所述内层派生表包括:包含内层分组子句的内层查询语句,根据外层分组子句构建所述内层查询语句;
第一派生表构建单元,用于根据所述内层派生表构建中间层派生表;
第一语句转换单元,用于根据所述中间层派生表转换所述查询语句。
7.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-5中任一所述的方法。
8.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-5中任一所述的方法。
CN201910239809.2A 2019-03-27 2019-03-27 一种数据库语句优化方法、装置、设备及存储介质 Active CN109947791B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910239809.2A CN109947791B (zh) 2019-03-27 2019-03-27 一种数据库语句优化方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910239809.2A CN109947791B (zh) 2019-03-27 2019-03-27 一种数据库语句优化方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN109947791A CN109947791A (zh) 2019-06-28
CN109947791B true CN109947791B (zh) 2021-01-26

Family

ID=67012068

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910239809.2A Active CN109947791B (zh) 2019-03-27 2019-03-27 一种数据库语句优化方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN109947791B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110968593B (zh) * 2019-12-10 2023-10-03 上海达梦数据库有限公司 数据库sql语句优化方法、装置、设备和存储介质
CN110990423B (zh) * 2019-12-12 2023-04-18 上海达梦数据库有限公司 Sql语句的执行方法、装置、设备和存储介质
CN111488360B (zh) * 2020-04-14 2023-04-18 上海达梦数据库有限公司 一种行级安全的实现方法、装置、设备及存储介质
CN112100198B (zh) * 2020-09-09 2023-12-08 上海达梦数据库有限公司 数据库sql语句优化方法、装置、设备及存储介质
CN112100199B (zh) * 2020-09-21 2024-03-26 上海达梦数据库有限公司 一种基于数据集分组的分析方法、装置、设备及介质
CN112328622A (zh) * 2020-11-05 2021-02-05 上海达梦数据库有限公司 分组处理方法、装置、电子设备和存储介质
CN113535756B (zh) * 2021-07-30 2023-05-30 上海达梦数据库有限公司 数据查询方法、装置、设备及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102402615A (zh) * 2011-12-22 2012-04-04 哈尔滨工程大学 一种基于结构化查询语言语句的源信息追踪方法
CN102915344A (zh) * 2012-09-25 2013-02-06 新浪网技术(中国)有限公司 一种sql语句处理方法及装置
CN103853818A (zh) * 2014-02-12 2014-06-11 博易智软(北京)技术股份有限公司 多维数据的处理方法和装置
CN104199831A (zh) * 2014-07-31 2014-12-10 深圳市腾讯计算机系统有限公司 信息处理方法及装置

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104765731B (zh) * 2014-01-02 2018-05-18 国际商业机器公司 数据库查询优化方法和设备
CN105550270B (zh) * 2015-12-09 2019-07-12 百度在线网络技术(北京)有限公司 数据库查询方法和装置
CN108304505B (zh) * 2018-01-18 2020-09-11 上海达梦数据库有限公司 一种sql语句的处理方法、装置、服务器及存储介质
CN108628975B (zh) * 2018-04-25 2020-08-21 上海达梦数据库有限公司 一种数据库sql语句优化方法及装置
CN109508339B (zh) * 2018-11-12 2020-10-09 上海达梦数据库有限公司 一种数据查询方法、装置、终端设备和存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102402615A (zh) * 2011-12-22 2012-04-04 哈尔滨工程大学 一种基于结构化查询语言语句的源信息追踪方法
CN102915344A (zh) * 2012-09-25 2013-02-06 新浪网技术(中国)有限公司 一种sql语句处理方法及装置
CN103853818A (zh) * 2014-02-12 2014-06-11 博易智软(北京)技术股份有限公司 多维数据的处理方法和装置
CN104199831A (zh) * 2014-07-31 2014-12-10 深圳市腾讯计算机系统有限公司 信息处理方法及装置

Also Published As

Publication number Publication date
CN109947791A (zh) 2019-06-28

Similar Documents

Publication Publication Date Title
CN109947791B (zh) 一种数据库语句优化方法、装置、设备及存储介质
CN108304505B (zh) 一种sql语句的处理方法、装置、服务器及存储介质
US8037108B1 (en) Conversion of relational databases into triplestores
US8046352B2 (en) Expression replacement in virtual columns
US20090248651A1 (en) Apparatus and method for maintaining metadata version awareness during set evaluation for olap hierarchies
US8417690B2 (en) Automatically avoiding unconstrained cartesian product joins
CN103186541A (zh) 一种映射关系生成方法及装置
US9569485B2 (en) Optimizing database query
CN110688544A (zh) 一种查询数据库的方法、设备及存储介质
CN110889013B (zh) 一种基于xml的数据关联方法、装置、服务器及存储介质
US20220222250A1 (en) Cost-based optimization for document-oriented database queries on arrays
CN109493928B (zh) 基于条件树的患者数据筛选方法、系统、设备及存储介质
CN114168616A (zh) 数据采集方法、装置、电子设备及存储介质
CN113962597A (zh) 一种数据分析方法、装置、电子设备及存储介质
CN111782738B (zh) 构建数据仓库表级别血缘关系的方法及装置
CN110874366A (zh) 数据处理、查询方法和装置
CN116680445B (zh) 基于知识图谱的电力光通信系统多源异构数据融合方法及系统
CN112286964A (zh) 一种sql语句优化方法、装置、设备及存储介质
CN109918367B (zh) 一种结构化数据的清洗方法、装置、电子设备及存储介质
CN111475534B (zh) 一种数据查询方法及相关设备
CN114880483A (zh) 一种元数据知识图谱构建方法、存储介质及系统
CN113722296A (zh) 一种农业信息处理方法、装置、电子设备及存储介质
CN108008947B (zh) 一种编程语句的智能提示方法、装置、服务器及存储介质
CN114625757B (zh) 基于领域特定语言的任务执行方法及装置、介质、设备
CN117076515B (zh) 医疗管理系统中元数据的溯源方法、装置、服务器及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant