CN109947804B - 数据集合查询的优化方法、装置、服务器和存储介质 - Google Patents

数据集合查询的优化方法、装置、服务器和存储介质 Download PDF

Info

Publication number
CN109947804B
CN109947804B CN201910213636.7A CN201910213636A CN109947804B CN 109947804 B CN109947804 B CN 109947804B CN 201910213636 A CN201910213636 A CN 201910213636A CN 109947804 B CN109947804 B CN 109947804B
Authority
CN
China
Prior art keywords
query
target
statement
data set
data table
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910213636.7A
Other languages
English (en)
Other versions
CN109947804A (zh
Inventor
朱仲颖
刘志勇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Dameng Database Co Ltd
Original Assignee
Shanghai Dameng Database Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Dameng Database Co Ltd filed Critical Shanghai Dameng Database Co Ltd
Priority to CN201910213636.7A priority Critical patent/CN109947804B/zh
Publication of CN109947804A publication Critical patent/CN109947804A/zh
Application granted granted Critical
Publication of CN109947804B publication Critical patent/CN109947804B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例公开了一种数据集合查询的优化方法、装置、服务器和存储介质,其中,该方法包括:获取数据集合查询请求;若数据集合查询请求中存在满足优化条件的目标数据表,则提取目标数据表对应的公共连接查询语句;基于公共连接查询语句对数据集合查询请求进行集合查询处理,得到目标集合查询结果。本发明实施例通过提取数据集合查询中的公共连接查询语句,可以减少公共连接查询语句中的数据表的连接查询次数,当查询语句数量较大且较为复杂时,大大提升了查询效率。

Description

数据集合查询的优化方法、装置、服务器和存储介质
技术领域
本发明实施例涉及数据库技术领域,尤其涉及一种数据集合查询的优化方法、装置、服务器和存储介质。
背景技术
结构化查询语言(Structured Query Language,SQL)是最重要也是最常用的关系数据库操作语言,在结构化查询语言中集合运算是其中一种重要的运算。
结构化查询语言中的集合运算包括对数据库的查询结果进行的并集或者交集,分别采用“UNION ALL”和“INTERSECT ALL”来表示。在当前通用的数据库技术中,为了实现一个A查询结果与B查询结果的集合运算,通常都是先分别做A查询和B查询,得到A查询结果与B查询结果之后再求集合。但是,当集合运算的查询语句数量较大且较为复杂时,上述查询方式用时较长,查询效率较低。
发明内容
本发明实施例提供了一种数据集合查询的优化方法、装置、服务器和存储介质,可以解决现有技术中查询效率低的问题。
第一方面,本发明实施例提供了一种数据集合查询的优化方法,包括:
获取数据集合查询请求;
若所述数据集合查询请求中存在满足优化条件的目标数据表,则提取所述目标数据表对应的公共连接查询语句;
基于所述公共连接查询语句对所述数据集合查询请求进行集合查询处理,得到目标集合查询结果。
进一步的,获取数据集合查询请求之后,还包括:
递归分析所述数据集合查询请求中的每个语句,确定属于交叉连接查询的目标查询语句。
进一步的,所述目标查询语句的数量为至少两个,
若所述数据集合查询请求中存在满足优化条件的目标数据表,包括:
若每个所述目标查询语句中均存在一个查询条件相同的数据表,则将所述数据表确定为满足优化条件的目标数据表。
进一步的,提取所述目标数据表对应的公共连接查询语句,包括:
将所述目标数据表及其对应的相同的查询条件确定为公共连接查询语句。
进一步的,基于所述公共连接查询语句对所述数据集合查询请求进行集合查询处理,得到目标集合查询结果,包括:
对所述公共连接查询语句以及派生视图查询语句进行集合查询处理,得到所述数据集合查询请求的目标集合查询结果;
所述派生视图查询语句包括所述数据集合查询请求中公共连接查询语句之外的查询语句。
进一步的,对所述公共连接查询语句以及派生视图查询语句进行集合查询处理,得到所述数据集合查询请求的目标集合查询结果,包括:
对所述派生视图查询语句进行集合查询处理,得到第一查询结果;
对所述公共连接查询语句和所述第一查询结果进行连接查询处理,得到所述数据集合查询请求的目标集合查询结果。
进一步的,所述集合查询处理包括对至少两个查询结果求并集或者交集。
第二方面,本发明实施例还提供了一种数据集合查询的优化装置,该装置包括:
集合查询请求模块,用于获取数据集合查询请求;
公共连接查询模块,用于若所述数据集合查询请求中存在满足优化条件的目标数据表,则提取所述目标数据表对应的公共连接查询语句;
集合查询处理模块,用于基于所述公共连接查询语句对所述数据集合查询请求进行集合查询处理,得到目标集合查询结果。
进一步的,所述装置还包括:
交叉连接查询模块,用于递归分析所述数据集合查询请求中的每个语句,确定属于交叉连接查询的目标查询语句。
进一步的,所述目标查询语句的数量为至少两个,所述公共连接查询模块包括:
优化条件单元,用于若每个所述目标查询语句中均存在一个查询条件相同的数据表,则将所述数据表确定为满足优化条件的目标数据表。
进一步的,所述公共连接查询模块还包括:
公共连接查询语句单元,用于将所述目标数据表及其对应的相同的查询条件确定为公共连接查询语句。
进一步的,所述集合查询处理模块具体用于:
对所述公共连接查询语句以及派生视图查询语句进行集合查询处理,得到所述数据集合查询请求的目标集合查询结果;
所述派生视图查询语句包括所述数据集合查询请求中公共连接查询语句之外的查询语句。
进一步的,所述集合查询处理模块包括:
第一集合查询单元,用于对所述派生视图查询语句进行集合查询处理,得到第一查询结果;
第二集合查询单元,用于对所述公共连接查询语句和所述第一查询结果进行连接查询处理,得到所述数据集合查询请求的目标集合查询结果。
进一步的,所述集合查询处理包括对至少两个查询结果求并集或者交集。
第三方面,本发明实施例还提供了一种服务器,所述服务器包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如上所述的数据集合查询的优化方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上所述的数据集合查询的优化方法。
本发明实施例通过获取数据集合查询请求,若数据集合查询请求中存在满足优化条件的目标数据表,则提取目标数据表对应的公共连接查询语句,并基于公共连接查询语句对数据集合查询请求进行集合查询处理,得到目标集合查询结果。本发明实施例通过提取数据集合查询中的公共连接查询语句,可以减少公共连接查询语句中的数据表的连接查询次数,当查询语句数量较大且较为复杂时,大大提升了查询效率。
附图说明
图1为本发明实施例一中的数据集合查询的优化方法的流程图;
图2为本发明实施例一中的数据集合查询的优化方法的示意图;
图3为本发明实施例二中的数据集合查询的优化方法的流程图;
图4为本发明实施例三中的数据集合查询的优化装置的结构示意图;
图5为本发明实施例四中的服务器的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
实施例一
图1为本发明实施例一中的数据集合查询的优化方法的流程图,本实施例可适用于数据库中实现数据集合查询的情况,该方法可以由数据集合查询的优化装置执行,该装置可以采用软件和/或硬件的方式实现,例如该装置可配置于服务器中。
本实施例中的数据集合查询的优化方法针对的数据集合查询请求中可以包括多个查询语句,具体参见图2。图2为本发明实施例一中的数据集合查询的优化方法的示意图,图2中查询语句可以包括查询语句A、查询语句B、查询语句C和查询语句D等等,若存在公共连接查询语句,则提取该公共连接查询语句,并对公共连接查询语句和除公共连接查询语句之外的查询语句进行集合查询处理,得到目标集合查询结果。
如图1所示,该方法具体可以包括:
S110、获取数据集合查询请求。
其中,数据集合查询可以为在数据库中对至少两个查询结果进行的并集或者交集,本实施例中对查询结果对应的查询条件不作限定。数据集合查询请求可以采用结构化查询语言,其中采用“UNION ALL”和“INTERSECT ALL”来分别表示对查询结果求并集和交集。
具体的,数据集合查询的优化装置可以通过预设的算法或者程序获取数据集合查询请求。
S120、若数据集合查询请求中存在满足优化条件的目标数据表,则提取目标数据表对应的公共连接查询语句。
其中,目标数据表可以为数据集合查询请求中满足优化条件的数据表,公共连接查询语句为目标数据表对应的满足优化条件的查询语句。
本实施例中,获取数据集合查询请求之后,还包括:递归分析数据集合查询请求中的每个语句,确定属于交叉(cross)连接查询的目标查询语句。其中交叉连接又称笛卡尔乘积,是指两个关系中所有元组的任意组合。本实施例中的优化方法针对的是属于交叉连接查询的查询语句,对于其他的查询语句直接执行不进行优化。
具体的,对数据集合查询请求中每个目标查询语句进行分析,判断每个目标查询语句中是否均存在一个查询条件相同的数据表,若存在,则将查询条件相同的数据表确定为上述的目标数据表。进一步的,提取目标数据表对应的公共连接查询语句,可以包括:将目标数据表及其对应的相同的查询条件确定为公共连接查询语句。
进一步的,对数据集合查询请求中每个目标查询语句进行分析可以包括:对于一个目标查询语句,可以将目标查询语句中的查询条件即“where”条件关联的数据表及可提取的查询条件(例如过滤条件)记录到待确定为公共连接查询语句的链表中,并且将除可提取的查询条件之外的数据表和查询条件留在目标查询语句中。例如,对于一个目标查询语句“SELECT*FROM T1,T2 WHERE T1.C1=T2.D1 AND T1.C1>5000”,将数据表T1及可提取的查询条件“T1.C1=T2.D1 AND T1.C1>5000”记录到待确定为公共连接查询语句的链表中,留在目标查询语句中的即为“SELECT*FROM T2 WHERE T2.D1>500”。
由于待确定为公共连接查询语句的链表中的数据表可以为多个,可以对其中的数据表进行排序,查询条件仅仅关联一个数据表的数据表排序靠前,如果多个数据表存在查询条件(例如过滤条件),根据返回匹配指定条件的行数的函数(count函数)获取数据表中数据总行数,数据总行数多的数据表(又称为大表)排序靠前。
进一步的,待确定为公共连接查询语句的链表中的多个数据表之间进行对比,若数据表及其查询条件均相同,则将该数据表确定为目标数据表,将目标数据表及其对应的相同的查询条件确定为公共连接查询语句。
示例性的,对于目标查询语句“SELECT*FROM T1,T2 WHERE T1.C1=T2.D1 ANDT1.C1>5000”和“SELECT*FROM T1,T3 WHERE T1.C1>5000”,则T1为目标数据表,则将T1和其对应的相同的查询条件“T1.C1>5000”确定为公共连接查询语句“WHERE T1.C1>5000”。
S130、基于公共连接查询语句对数据集合查询请求进行集合查询处理,得到目标集合查询结果。
其中,集合查询处理可以包括对至少两个查询结果求并集或者交集。
基于公共连接查询语句对数据集合查询请求进行集合查询处理,得到目标集合查询结果,可以包括:对公共连接查询语句以及派生视图查询语句进行集合查询处理,得到数据集合查询请求的目标集合查询结果;派生视图查询语句包括数据集合查询请求中公共连接查询语句之外的查询语句。其中,派生视图查询语句中包括数据集合查询请求中不属于交叉连接查询的查询语句和除公共连接查询语句之外的目标查询语句,目标查询语句即为属于交叉连接查询的查询语句。
进一步的,对公共连接查询语句以及派生视图查询语句进行集合查询处理,得到数据集合查询请求的目标集合查询结果,可以包括:对派生视图查询语句进行集合查询处理,得到第一查询结果;对公共连接查询语句和第一查询结果进行连接查询处理,得到数据集合查询请求的目标集合查询结果。
本实施例提供的技术方案,通过获取数据集合查询请求,若数据集合查询请求中存在满足优化条件的目标数据表,则提取目标数据表对应的公共连接查询语句,并基于公共连接查询语句对数据集合查询请求进行集合查询处理,得到目标集合查询结果。本实施例通过提取数据集合查询中的公共连接查询语句,可以减少公共连接查询语句中的数据表的连接查询次数,当查询语句数量较大且较为复杂时,大大提升了查询效率。
实施例二
图3为本发明实施例二中的数据集合查询的优化方法的流程图。本实施例在上述实施例的基础上,对上述数据集合查询的优化方法进行了进一步的具体化。相应的,如图3所示,本实施例的方法具体包括:
S210、获取数据集合查询请求。
S220、递归分析数据集合查询请求中的每个语句,确定属于交叉连接查询的目标查询语句。
其中,交叉连接又称笛卡尔乘积,是指两个关系中所有元组的任意组合。进一步的,交叉连接返回的结果,是被连接的两个数据表中所有数据行的笛卡尔积,返回结果集合中的数据行数等于第一个数据表中符合查询条件的数据行数乘以第二个数据表中符合查询条件的数据行数。例如,第一个数据表中有4个部门,第二数据表中有4个员工,那么,交叉连接的结果就有16条数据,可以采用“SELECT*FROM表1 CROSS JOIN表2”来表示。
本实施例中的优化方法针对的是属于交叉连接查询的查询语句,对于其他的查询语句直接执行不进行优化。
S230、每个目标查询语句中是否均存在一个查询条件相同的数据表。
对每个目标查询语句中的数据表及其查询条件进行比对,判断是否均存在一个查询条件相同的数据表,若存在,则执行S240,若不存在,则执行S270。其中查询条件的类型本实施例中不作限定,查询条件可以包括过滤条件等。例如查询条件可以为“T1.C1=T2.D1”,表示求数据表T1和数据表T2相同的数据,或者“T1.C1>5000”,表示求数据表T1中值大于5000的数据。
S240、将数据表确定为满足优化条件的目标数据表。
S250、将目标数据表及其对应的相同的查询条件确定为公共连接查询语句。
S260、对公共连接查询语句以及派生视图查询语句进行集合查询处理,得到数据集合查询请求的目标集合查询结果。
其中,派生视图查询语句包括数据集合查询请求中公共连接查询语句之外的查询语句。
具体的,对公共连接查询语句以及派生视图查询语句进行集合查询处理,得到数据集合查询请求的目标集合查询结果,可以包括:对派生视图查询语句进行集合查询处理,得到第一查询结果;对公共连接查询语句和第一查询结果进行连接查询处理,得到数据集合查询请求的目标集合查询结果。其中,连接查询为交叉连接查询,派生视图查询语句中包括数据集合查询请求中不属于交叉连接查询的查询语句和除公共连接查询语句之外的目标查询语句,目标查询语句即为属于交叉连接查询的查询语句。对派生视图查询语句中的各个查询语句进行对应的查询处理,并对得到的各个查询结果求并集或者交集,得到第一查询结果;对公共连接查询语句和第一查询结果进行交叉连接查询,得到的结果为最终的数据集合查询请求的目标集合查询结果。
S270、对数据集合查询请求进行集合查询处理,得到目标集合查询结果。
若每个目标查询语句中不满足均存在一个查询条件相同的数据表的优化条件,则直接对该数据集合查询请求进行集合查询处理,具体处理的过程与现有技术中相同,先分别得到各目标查询语句中的查询结果,再对查询结果求交集或者并集。
进一步的,通过一个示例对数据集合查询的优化方法进行具体的说明。若一个数据集合查询请求中的集合查询语句为“SELECT*FROM T1,T2,T3 WHERE C1=D1 AND D2=E2AND C1>5000 UNION ALL SELECT*FROM T1,T2,T4 WHERE C1=D1 AND D2=F2 AND C1>5000”,其中包括两个查询语句“SELECT*FROM T1,T2,T3 WHERE C1=D1 AND D2=E2 ANDC1>5000”和“SELECT*FROM T1,T2,T4WHERE C1=D1 AND D2=F2 AND C1>5000”,对比这两个查询语句中各个数据表的查询条件,确定四个数据表中,表T1的查询条件相同,都为“C1=D1 AND C1>5000”,则确定的公共连接查询语句可以为“WHERE T1.C1=V.D1 AND T1.C1>5000”。集合查询语句可以改写为“SELECT*FROM T1,(SELECT*FROM T2,T3 WHERE D2=E2AND T2.D1>5000UNION ALL SELECT*FROM T2,T4 WHERE D2=F2 AND T2.D1>5000)VWHERET1.C1=V.D1 AND T1.C1>5000”,其中派生视图查询语句为“SELECT*FROM T2,T3 WHERE D2=E2 AND T2.D1>5000 UNION ALL SELECT*FROM T2,T4 WHERE D2=F2 AND T2.D1>5000”。对公共连接查询语句以及派生视图查询语句进行集合查询处理,得到数据集合查询请求的目标集合查询结果。改写之前的集合查询语句中查询条件对应全部列,改写后也对应全部列,改写之前的集合查询语句中查询条件对应具体列,改写后也对应具体列。
上述示例中优化前集合查询的过程为:数据表T1先与数据表T2、数据表T3做连接查询得到第一结果集,数据表T1再跟数据表T2、数据表T4做连接查询得到第二结果集,然后对第一结果集和第二结果集求并集或交集,得到最终集合查询结果。优化后集合查询的过程为:数据表T2、数据表T3做连接查询得到第一结果集,数据表T2、数据表T4做连接查询得到第二结果集,第一结果集与第二结果集并集或交集的结果再与数据表T1做连接查询得到最终集合查询结果。由此,上述示例中的数据表T1仅仅进行了一次连接查询操作,即实现集合查询。
需要说明的是,上述示例中只是针对四个数据表,且仅包括两个查询语句,是一个简单的示例。数据库中面对的数据集合请求的语句往往非常复杂,本实施例中的优化方法,通过提取出公共连接查询语句,减少查询次数。
本实施例提供的技术方案,通过获取数据集合查询请求,递归分析数据集合查询请求中的每个语句,确定属于交叉连接查询的目标查询语句,若每个目标查询语句中均存在一个查询条件相同的数据表,将数据表确定为满足优化条件的目标数据表,将目标数据表及其对应的相同的查询条件确定为公共连接查询语句,并对公共连接查询语句以及派生视图查询语句进行集合查询处理,得到数据集合查询请求的目标集合查询结果。本实施例通过提取数据集合查询中的公共连接查询语句,可以减少公共连接查询语句中的数据表的连接查询次数,当查询语句数量较大且较为复杂时,大大提升了查询效率。
实施例三
图4为本发明实施例三中的数据集合查询的优化装置的结构示意图,本实施例可适用于数据库中实现数据集合查询的情况。本发明实施例所提供的数据集合查询的优化装置可执行本发明任意实施例所提供的数据集合查询的优化方法,具备执行方法相应的功能模块和有益效果。该装置具体包括集合查询请求模块310、公共连接查询模块320和集合查询处理模块330,其中:
集合查询请求模块310,用于获取数据集合查询请求;
公共连接查询模块320,用于若数据集合查询请求中存在满足优化条件的目标数据表,则提取目标数据表对应的公共连接查询语句;
集合查询处理模块330,用于基于公共连接查询语句对数据集合查询请求进行集合查询处理,得到目标集合查询结果。
本发明实施例通过获取数据集合查询请求,若数据集合查询请求中存在满足优化条件的目标数据表,则提取目标数据表对应的公共连接查询语句,并基于公共连接查询语句对数据集合查询请求进行集合查询处理,得到目标集合查询结果。本发明实施例通过提取数据集合查询中的公共连接查询语句,可以减少公共连接查询语句中的数据表的连接查询次数,当查询语句数量较大且较为复杂时,大大提升了查询效率。
进一步的,该装置还包括:
交叉连接查询模块,用于递归分析数据集合查询请求中的每个语句,确定属于交叉连接查询的目标查询语句。
进一步的,目标查询语句的数量为至少两个,公共连接查询模块320包括:
优化条件单元,用于若每个目标查询语句中均存在一个查询条件相同的数据表,则将数据表确定为满足优化条件的目标数据表。
进一步的,公共连接查询模块320还包括:
公共连接查询语句单元,用于将目标数据表及其对应的相同的查询条件确定为公共连接查询语句。
进一步的,该集合查询处理模块330具体用于:
对公共连接查询语句以及派生视图查询语句进行集合查询处理,得到数据集合查询请求的目标集合查询结果;
派生视图查询语句包括数据集合查询请求中公共连接查询语句之外的目标查询语句。
进一步的,集合查询处理模块330包括:
第一集合查询单元,用于对所述派生视图查询语句进行集合查询处理,得到第一查询结果;
第二集合查询单元,用于对所述公共连接查询语句和所述第一查询结果进行连接查询处理,得到所述数据集合查询请求的目标集合查询结果。
进一步的,集合查询处理包括对至少两个查询结果求并集或者交集。
本发明实施例所提供的数据集合查询的优化装置可执行本发明任意实施例所提供的数据集合查询的优化方法,具备执行方法相应的功能模块和有益效果。
实施例四
图5为本发明实施例四中的服务器的结构示意图。图5示出了适于用来实现本发明实施方式的示例性服务器412的框图。图5显示的服务器412仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图5所示,服务器412以通用服务器的形式表现。服务器412的组件可以包括但不限于:一个或者多个处理器416,存储装置428,连接不同系统组件(包括存储装置428和处理器416)的总线418。
总线418表示几类总线结构中的一种或多种,包括存储装置总线或者存储装置控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(Industry SubversiveAlliance,ISA)总线,微通道体系结构(Micro Channel Architecture,MAC)总线,增强型ISA总线、视频电子标准协会(Video Electronics Standards Association,VESA)局域总线以及外围组件互连(Peripheral Component Interconnect,PCI)总线。
服务器412典型地包括多种计算机系统可读介质。这些介质可以是任何能够被服务器412访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
存储装置428可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(Random Access Memory,RAM)430和/或高速缓存存储器432。服务器412可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统434可以用于读写不可移动的、非易失性磁介质(图5未显示,通常称为“硬盘驱动器”)。尽管图5中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘,例如只读光盘(Compact Disc Read-Only Memory,CD-ROM),数字视盘(Digital Video Disc-Read Only Memory,DVD-ROM)或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线418相连。存储装置428可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明各实施例的功能。
具有一组(至少一个)程序模块442的程序/实用工具440,可以存储在例如存储装置428中,这样的程序模块442包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块442通常执行本发明所描述的实施例中的功能和/或方法。
服务器412也可以与一个或多个外部设备414(例如键盘、指向终端、显示器424等)通信,还可与一个或者多个使得用户能与该服务器412交互的终端通信,和/或与使得该服务器412能与一个或多个其它计算终端进行通信的任何终端(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口422进行。并且,服务器412还可以通过网络适配器420与一个或者多个网络(例如局域网(Local Area Network,LAN),广域网(Wide AreaNetwork,WAN)和/或公共网络,例如因特网)通信。如图5所示,网络适配器420通过总线418与服务器412的其它模块通信。应当明白,尽管图中未示出,可以结合服务器412使用其它硬件和/或软件模块,包括但不限于:微代码、终端驱动器、冗余处理器、外部磁盘驱动阵列、磁盘阵列(Redundant Arrays of Independent Disks,RAID)系统、磁带驱动器以及数据备份存储系统等。
处理器416通过运行存储在存储装置428中的程序,从而执行各种功能应用以及数据处理,例如实现本发明实施例所提供的数据集合查询的优化方法,该方法包括:
获取数据集合查询请求;
若数据集合查询请求中存在满足优化条件的目标数据表,则提取目标数据表对应的公共连接查询语句;
基于公共连接查询语句对数据集合查询请求进行集合查询处理,得到目标集合查询结果。
实施例五
本发明实施例五还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本发明实施例所提供的数据集合查询的优化方法,该方法包括:
获取数据集合查询请求;
若数据集合查询请求中存在满足优化条件的目标数据表,则提取目标数据表对应的公共连接查询语句;
基于公共连接查询语句对数据集合查询请求进行集合查询处理,得到目标集合查询结果。
本发明实施例的计算机存储介质,可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或终端上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (8)

1.一种数据集合查询的优化方法,其特征在于,包括:
获取数据集合查询请求;
若所述数据集合查询请求中存在满足优化条件的目标数据表,则提取所述目标数据表对应的公共连接查询语句,其中,所述公共连接查询语句为目标数据表对应的满足优化条件的查询语句;
基于所述公共连接查询语句对所述数据集合查询请求进行集合查询处理,得到目标集合查询结果;
其中,获取数据集合查询请求之后,还包括:
递归分析所述数据集合查询请求中的每个语句,确定属于交叉连接查询的目标查询语句;
所述目标查询语句的数量为至少两个,若所述数据集合查询请求中存在满足优化条件的目标数据表,包括:
若每个所述目标查询语句中均存在一个查询条件相同的数据表,则将所述数据表确定为满足优化条件的目标数据表。
2.根据权利要求1所述的方法,其特征在于,提取所述目标数据表对应的公共连接查询语句,包括:
将所述目标数据表及其对应的相同的查询条件确定为公共连接查询语句。
3.根据权利要求1所述的方法,其特征在于,基于所述公共连接查询语句对所述数据集合查询请求进行集合查询处理,得到目标集合查询结果,包括:
对所述公共连接查询语句以及派生视图查询语句进行集合查询处理,得到所述数据集合查询请求的目标集合查询结果;
所述派生视图查询语句包括所述数据集合查询请求中公共连接查询语句之外的查询语句。
4.根据权利要求3所述的方法,其特征在于,对所述公共连接查询语句以及派生视图查询语句进行集合查询处理,得到所述数据集合查询请求的目标集合查询结果,包括:
对所述派生视图查询语句进行集合查询处理,得到第一查询结果;
对所述公共连接查询语句和所述第一查询结果进行连接查询处理,得到所述数据集合查询请求的目标集合查询结果。
5.根据权利要求1-4中任一所述的方法,其特征在于,所述集合查询处理包括对至少两个查询结果求并集或者交集。
6.一种数据集合查询的优化装置,其特征在于,包括:
集合查询请求模块,用于获取数据集合查询请求;
公共连接查询模块,用于若所述数据集合查询请求中存在满足优化条件的目标数据表,则提取所述目标数据表对应的公共连接查询语句,其中,所述公共连接查询语句为目标数据表对应的满足优化条件的查询语句;
集合查询处理模块,用于基于所述公共连接查询语句对所述数据集合查询请求进行集合查询处理,得到目标集合查询结果;
所述装置还包括:
交叉连接查询模块,用于递归分析数据集合查询请求中的每个语句,确定属于交叉连接查询的目标查询语句;
目标查询语句的数量为至少两个,公共连接查询模块包括:
优化条件单元,用于若每个目标查询语句中均存在一个查询条件相同的数据表,则将数据表确定为满足优化条件的目标数据表。
7.一种服务器,其特征在于,所述服务器包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-5中任一所述的数据集合查询的优化方法。
8.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-5中任一所述的数据集合查询的优化方法。
CN201910213636.7A 2019-03-20 2019-03-20 数据集合查询的优化方法、装置、服务器和存储介质 Active CN109947804B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910213636.7A CN109947804B (zh) 2019-03-20 2019-03-20 数据集合查询的优化方法、装置、服务器和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910213636.7A CN109947804B (zh) 2019-03-20 2019-03-20 数据集合查询的优化方法、装置、服务器和存储介质

Publications (2)

Publication Number Publication Date
CN109947804A CN109947804A (zh) 2019-06-28
CN109947804B true CN109947804B (zh) 2021-04-06

Family

ID=67010284

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910213636.7A Active CN109947804B (zh) 2019-03-20 2019-03-20 数据集合查询的优化方法、装置、服务器和存储介质

Country Status (1)

Country Link
CN (1) CN109947804B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112199390B (zh) * 2020-09-30 2023-05-30 上海达梦数据库有限公司 一种数据库中数据查询方法、装置、设备及存储介质
CN112732761B (zh) * 2021-01-13 2022-08-23 青岛海信网络科技股份有限公司 一种数据碰撞方法及装置
CN113157736B (zh) * 2021-04-28 2024-01-05 联通沃音乐文化有限公司 分布式数据库中的查询计划优化方法及系统
CN113535756B (zh) * 2021-07-30 2023-05-30 上海达梦数据库有限公司 数据查询方法、装置、设备及存储介质
CN114780554B (zh) * 2022-06-22 2023-04-18 北京奥星贝斯科技有限公司 处理数据库查询语句的方法及装置

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8150861B2 (en) * 2005-09-20 2012-04-03 Oracle International Corporation Technique for implementing database queries for data streams using a curved fitting based approach
CN103186653A (zh) * 2011-12-30 2013-07-03 国际商业机器公司 辅助查询方法和设备、查询方法和设备及命名查询系统
CN104123288A (zh) * 2013-04-24 2014-10-29 阿里巴巴集团控股有限公司 一种数据查询方法及装置
CN104182405A (zh) * 2013-05-22 2014-12-03 阿里巴巴集团控股有限公司 一种连接查询方法及装置
CN106933919A (zh) * 2015-12-31 2017-07-07 北京国双科技有限公司 数据表的连接方法及装置
CN107168977A (zh) * 2016-03-08 2017-09-15 阿里巴巴集团控股有限公司 一种数据查询的优化方法及装置
CN109308300A (zh) * 2018-09-27 2019-02-05 上海达梦数据库有限公司 一种逻辑运算的处理方法、装置、转换插件及存储介质

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8150861B2 (en) * 2005-09-20 2012-04-03 Oracle International Corporation Technique for implementing database queries for data streams using a curved fitting based approach
CN103186653A (zh) * 2011-12-30 2013-07-03 国际商业机器公司 辅助查询方法和设备、查询方法和设备及命名查询系统
CN104123288A (zh) * 2013-04-24 2014-10-29 阿里巴巴集团控股有限公司 一种数据查询方法及装置
CN104182405A (zh) * 2013-05-22 2014-12-03 阿里巴巴集团控股有限公司 一种连接查询方法及装置
CN106933919A (zh) * 2015-12-31 2017-07-07 北京国双科技有限公司 数据表的连接方法及装置
CN107168977A (zh) * 2016-03-08 2017-09-15 阿里巴巴集团控股有限公司 一种数据查询的优化方法及装置
CN109308300A (zh) * 2018-09-27 2019-02-05 上海达梦数据库有限公司 一种逻辑运算的处理方法、装置、转换插件及存储介质

Also Published As

Publication number Publication date
CN109947804A (zh) 2019-06-28

Similar Documents

Publication Publication Date Title
CN109947804B (zh) 数据集合查询的优化方法、装置、服务器和存储介质
CN107506451B (zh) 用于数据交互的异常信息监控方法及装置
CN108304505B (zh) 一种sql语句的处理方法、装置、服务器及存储介质
CN108509556B (zh) 数据迁移方法和装置、服务器、存储介质
US9235622B2 (en) System and method for an efficient query sort of a data stream with duplicate key values
US8924373B2 (en) Query plans with parameter markers in place of object identifiers
US8046352B2 (en) Expression replacement in virtual columns
CN113760891B (zh) 一种数据表的生成方法、装置、设备和存储介质
US9218394B2 (en) Reading rows from memory prior to reading rows from secondary storage
CN110688544A (zh) 一种查询数据库的方法、设备及存储介质
CN112463800A (zh) 数据读取方法、装置、服务器及存储介质
CN109241100B (zh) 一种查询方法、装置、设备及存储介质
CN109815241B (zh) 数据查询方法、装置、设备和存储介质
CN112612832B (zh) 节点分析方法、装置、设备及存储介质
CN110874366A (zh) 数据处理、查询方法和装置
US11157506B2 (en) Multiform persistence abstraction
CN109542912B (zh) 区间数据存储方法、装置、服务器及存储介质
WO2024108638A1 (zh) 一种基于分片索引的自适应查询方法和装置
US20080162413A1 (en) Accelerating queries using temporary enumeration representation
CN109697234B (zh) 实体的多属性信息查询方法、装置、服务器和介质
US20080162441A1 (en) Accelerating queries using secondary semantic column enumeration
CN114547086B (zh) 数据处理方法、装置、设备及计算机可读存储介质
US9305080B2 (en) Accelerating queries using delayed value projection of enumerated storage
CN113886425A (zh) 数据处理方法、装置、设备以及存储介质
CN114490724A (zh) 处理数据库查询语句的方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant