CN112732752A - 一种查询语句优化方法、装置、设备和存储介质 - Google Patents

一种查询语句优化方法、装置、设备和存储介质 Download PDF

Info

Publication number
CN112732752A
CN112732752A CN202110124950.5A CN202110124950A CN112732752A CN 112732752 A CN112732752 A CN 112732752A CN 202110124950 A CN202110124950 A CN 202110124950A CN 112732752 A CN112732752 A CN 112732752A
Authority
CN
China
Prior art keywords
query statement
optimization
query
clause
statement
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110124950.5A
Other languages
English (en)
Inventor
张钦
孟正凌
韩朱忠
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Dameng Database Co Ltd
Original Assignee
Shanghai Dameng Database Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Dameng Database Co Ltd filed Critical Shanghai Dameng Database Co Ltd
Priority to CN202110124950.5A priority Critical patent/CN112732752A/zh
Publication of CN112732752A publication Critical patent/CN112732752A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2453Query optimisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/242Query formulation
    • G06F16/2433Query languages
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution
    • G06F16/24553Query execution of query operations

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种查询语句优化方法、装置、设备和存储介质,其特征在于,包括:获取查询语句;如果所述查询语句满足优化条件,则根据所述查询语句所包含的子句,确定所述查询语句的优化方式,其中,所述子句包括引用表和被引用表,所述引用表引用所述被引用表的列作为所述引用表的外键;基于所述优化方式,对所述查询语句进行优化。上述技术方案,在获取到查询语言之后,如果查询语句满足优化条件,则根据其包含的子句,确定优化方式,进而根据对应的优化方式,对查询语句进行优化,优化后的查询语句可以提升查询语句的执行效率。

Description

一种查询语句优化方法、装置、设备和存储介质
技术领域
本发明实施例涉及数据库查询技术,尤其涉及一种查询语句优化方法、装置、设备和存储介质。
背景技术
如今,数据库已成为一个成熟软件系统中不可或缺的必要组成部分,而对数据库的查询操作,则是数据库系统中最简单最常用的操作。但是随着企业业务复杂度的不断提高,数据库的查询操作也变得越来越复杂,这就需要编写更加复杂的数据库查询语句,即查询语句,来访问数据库。
现有技术中,对于用户输入的查询语句,数据库管理系统先对其进行语法和语义解析,然后根据查询语句涉及的表的统计信息选择最优的执行计划,最后按照这个执行计划执行得到结果。
但是,当查询语句中包含多表连接查询操作时,经常存在一些表只参与连接,但若消除该表也并不影响最终的查询结果,这样的表我们称之为冗余表。冗余表的存在徒增了参与连接的表的数量,随着参与连接的表的数量的增加,优化器生成执行计划时需要考虑的情况就更多,连接生成的中间结果集也更庞大,势必影响查询的执行效率。所以,亟需一种查询语句优化方法,能够有效提升查询语句的执行效率。
发明内容
本发明提供一种查询语句优化方法、装置、设备和存储介质,以提升查询语句的执行效率。
第一方面,本发明实施例提供了一种查询语句优化方法,包括:
获取查询语句;
如果所述查询语句满足优化条件,则根据所述查询语句所包含的子句,确定所述查询语句的优化方式,其中,所述子句包括引用表和被引用表,所述引用表引用所述被引用表的列作为所述引用表的外键;
基于所述优化方式,对所述查询语句进行优化。
进一步地,所述优化条件包括第一优化条件,所述第一优化条件为所述查询语句包含where子句且where子句不包含or,
相应地,如果所述查询语句满足第一优化条件,根据所述查询语句所包含的子句,确定所述查询语句的优化方式,包括:
如果所述查询语句包含的where子句的条件表达式为exists子查询,且所述exists子查询满足第三优化条件,则确定所述优化方式为exists优化;
如果所述查询语句包含的where子句的条件表达式为in子查询,且所述in子查询满足第四优化条件,则确定所述优化方式为in优化。
进一步地,如果所述优化方式为exists优化,
相应地,基于所述优化方式,对所述查询语句进行优化,包括:
删除所述exists子查询中的第一两表等值连接条件;
将所述exists子查询中剩余的第一条件表达式添加至第一where子句中,并删除所述exists子查询;
在所述第一where子句中添加第一引用表的外键is not null的条件语句,完成对所述查询语句的优化。
进一步地,如果所述优化方式为in优化,
相应地,基于所述优化方式,对所述查询语句进行优化,包括:
将所述in子查询中的第二条件表达式添加至第二where子句中,并删除所述in子查询;
在所述第二where子句中添加第二引用表的外键is not null的条件语句,获得优化后的查询语句。
进一步地,所述优化条件包括第二优化条件,所述第二优化条件为所述查询语句包含两表等值连接条件,且所述查询语句中不包含or,
相应地,如果所述查询语句满足第二优化条件,根据所述查询语句所包含的子句,确定所述查询语句的优化方式,包括:
如果所述查询语句包含的子句包含两表等值连接条件,且所述查询语句满足第五优化条件,则确定所述查询语句的优化方式为等值连接优化。
进一步地,如果所述优化方式为等值连接优化,基于所述优化方式,对所述查询语句进行优化,包括:
删除所述查询语句中的第二两表等值连接条件;
将包含所述第二两表等值连接条件的第三条件表达式改写为第三where子句;
删除第三引用表与被引用表的连接句;
在所述第三where子句中添加所述第三引用表的外键is not null的条件语句,获得优化后的查询语句。
进一步地,在基于所述优化方式,对所述查询语句进行优化之后,还包括:
根据所述查询语句涉及的表的统计信息,确定目标执行计划;
基于所述目标执行计划执行查询,得到查询结果。
第二方面,本发明实施例还提供了一种查询语句优化装置,所述装置包括:
获取模块,用于获取查询语句;
确定模块,用于如果所述查询语句满足优化条件,则根据所述查询语句所包含的子句,确定所述查询语句的优化方式,其中,所述子句包括引用表和被引用表,所述引用表引用所述被引用表的列作为所述引用表的外键;
优化模块,用于基于所述优化方式,对所述查询语句进行优化。
第三方面,本发明实施例还提供了一种查询语句优化设备,所述设备:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如第一方面中任一所述的查询语句优化方法。
第四方面,本发明实施例还提供了一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行如第一方面中任一所述的查询语句优化方法。
本发明实施例提供的技术方案,通过获取查询语句;如果所述查询语句满足优化条件,则根据所述查询语句所包含的子句,确定所述查询语句的优化方式,其中,所述子句包括引用表和被引用表,所述引用表引用所述被引用表的列作为所述引用表的外键;基于所述优化方式,对所述查询语句进行优化。上述技术方案,在获取到查询语言之后,如果查询语句满足优化条件,则根据其包含的子句,确定优化方式,进而根据对应的优化方式,对查询语句进行优化,优化后的查询语句可以提升查询语句的执行效率。
附图说明
图1为本发明实施例一提供的一种查询语句优化方法的流程图;
图2为本发明实施例二提供的一种查询语句优化方法的流程图;
图3为本发明实施例三提供的一种查询语句优化装置的结构图;
图4为本发明实施例四提供的一种查询语句优化设备的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
在更加详细地讨论示例性实施例之前应当提到的是,一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各项操作(或步骤)描述成顺序的处理,但是其中的许多操作可以被并行地、并发地或者同时实施。此外,各项操作的顺序可以被重新安排。当其操作完成时所述处理可以被终止,但是还可以具有未包括在附图中的附加步骤。所述处理可以对应于方法、函数、规程、子例程、子程序等等。此外,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
查询语句中经常使用多表连接查询操作。连接操作符一次对两个表进行连接,当N(N≥2)个表参与连接时,会进行N-1次两表连接操作。各个表参与连接的顺序由优化器根据代价估算来决定。
当查询语句中包含多表连接查询操作时,经常存在一些表只参与连接,但若消除该表也并不影响最终的查询结果,这样的表我们称之为冗余表。冗余表的存在徒增了参与连接的表的数量,随着参与连接的表的数量的增加,优化器生成执行计划时需要考虑的情况就更多,连接生成的中间结果集也更庞大,势必影响查询的执行效率。
所以可以基于下述实施例对查询语句进行优化,以提升查询语句的执行效率。
实施例一
图1为本发明实施例一提供的一种查询语句优化方法的流程图,本实施例可适用于查询语句中包含多表连接查询操作,需要提升查询语句的执行效率的情况,该方法可以由计算机设备来执行,具体包括如下步骤:
步骤110、获取查询语句。
其中,查询语句可以包括结构化查询语言(Structured Query Language,SQL)查询语句。
具体地,在对数据库进行查询时,在接收到用户触发的查询信息后,可以获取到查询语句。对查询语句进行语法和语义解析,可以确定其具体的查询事项或者查询数据信息等。进而,可以根据解析结果对查询语句进行等价语义转换优化,再根据查询语句涉及的表的统计信息选择目标执行计划,最后按照目标执行计划执行得到查询结果。其中,用户可以通过按键触发或者触屏触发得到查询信息。
本发明实施例中,可以在等价语义转换优化阶段,基于两表等值连接条件对查询语句进行优化。
查询语句所包含的子句可以包括两表等值连接条件,两表等值连接条件可以进一步包括引用表和被引用表,引用表可以引用被引用表的列作为引用表的外键。一表可以引用另一表的列作为其外键,引用另一表的列作为其外键的表可以称为引用表,自身列被引用的表可以称为被引用表。引用表可以引用被引用表的一列作为其外键,可以称为单列外键;也可以引用被引用表的多列作为其外键,可以称为多列外键。如果是单列外键的情况,则该两表等值连接条件为引用表的外键列与被引用表的被引用列的等值表达式;如果是多列外键的情况,则该两表等值连接条件为引用表的各个外键列与其对应的被引用表的被引用列的所有等值表达式。
本发明实施例中,如果是单列外键的情况,可以根据如下方式创建引用表和被引用表。
create table t2(d1 int unique,d2 int);
create table t1(c1 int,c2 int,foreign key(c1)references t2(d1));
其中,在单列外键的情况中,被引用表的被引用项为t2.d1,引用表的外键项为t1.c1。
如果是多列外键的情况,可以根据如下方式创建引用表和被引用表。
create table t4(d1 int,d2 int,d3 int,unique(d1,d2));
create table t3(c1 int,c2 int,c3 int,foreign key(c1,c2)references t4(d1,d2));
其中,在多列外键的情况中,被引用表的被引用项为t4(d1,d2),引用表的外键项为t3(c1,c2)。
步骤120、如果所述查询语句满足优化条件,则根据所述查询语句所包含的子句,确定所述查询语句的优化方式,其中,所述子句包括引用表和被引用表,所述引用表引用所述被引用表的列作为所述引用表的外键。
其中,优化条件可以包括第一优化条件和第二优化条件,其中,第一优化条件可以为查询语句中包含where子句且where子句中不包含or,第二优化条件可以为查询语句中包含两表等值连接条件且查询语句中不包含or。
当查询语句包含的子句不同时,其对应的优化方式也不同。在确定查询语句满足任一优化条件后,可以根据该查询语句所包含的子句,确定其对应的优化方式。
具体地,如果查询语句满足第一优化条件、查询语句包含的where子句的条件表达式为exists子查询,且所述exists子查询满足第三优化条件,则确定优化方式为exists优化。其中,第三优化条件可以包括:1)exists子查询是相关子查询;2)exists子查询的from项中只包含被引用表;3)exists子查询中不包含having子句、connect by子句和top子句;4)exists子查询的条件中不存在伪列rownum;5)exists子查询的查询项中不包含集函数;6)对于被引用表,exists子查询的查询条件中必须包含且只包含两表等值连接条件,例如:t1.c1=t2.d1,此外exists子查询的查询条件中不能涉及被引用表的其他列,需要说明的是,此处只针对被引用表,exists子查询的查询条件中可以涉及其他除被引用表外任意表的任意列;7)exists子查询如果为not exists,则子查询的where子句中有且只有两表等值连接条件,例如:t1.c1=t2.d1。
如果查询语句满足第一优化条件、查询语句包含的where子句的条件表达式为in子查询,且in子查询满足第四优化条件,则确定优化方式为in优化。其中,第四优化条件可以包括:1)in子查询不是not in子查询;2)in子查询只有一个查询分支,即in子查询不包含集合操作;3)in子查询的from项中只包含一个被引用表;4)in子查询的查询项中只包含被引用表的被引用项;5)in子查询中不包含having子句、connect by子句和top子句;6)in子查询的条件中不存在伪列rownum;7)in子查询的左表达式必须是引用表的外键项;8)in子查询的条件中不能涉及被引用表的列。
如果查询语句满足第二优化条件、且所述查询语句满足第五优化条件,则确定所述查询语句的优化方式为等值连接优化。其中,第五优化条件可以包括:对于被引用表,当前优化层级的查询语句的查询条件中必须包含且只包含两表等值连接条件,例如:t1.c1=t2.d1,此外当前优化层级的查询语句的查询条件中不能涉及被引用表的其他列。当然,此处只针对被引用表,当前优化层级的查询语句的查询条件中可以涉及其他除被引用表外任意表的任意列。
如果查询语句不满足上述优化条件中的任一项,则可以重新确定查询语句的优化方式。当然,在实际应用中,如果查询语句不满足任一优化条件,则该查询语句无需进行优化,可以退出查询语句优化,并继续执行查询语句。
本发明实施例中,优化条件和优化方式可以存储在数据库中。比对查询语句和各优化条件,若查询语句满足任一优化条件,需要对查询语句进行优化,则可以根据查询语句所包含的子句,在数据库中调取对应的优化方式。
步骤130、基于所述优化方式,对所述查询语句进行优化。
其中,优化方式可以包括exists优化、in优化和等值连接优化,当查询语句包含不同的子句时,其对应的优化方式也不同。
本发明实施例中,可以根据对应的优化方式,对查询语句进行优化。
本发明实施例一提供的一种查询语句优化方法,通过获取查询语句;如果所述查询语句满足优化条件,则根据所述查询语句所包含的子句,确定所述查询语句的优化方式,其中,所述子句包括引用表和被引用表,所述引用表引用所述被引用表的列作为所述引用表的外键;基于所述优化方式,对所述查询语句进行优化。上述技术方案,在获取到查询语言之后,如果查询语句满足优化条件,则根据其包含的子句,确定优化方式,进而根据对应的优化方式,对查询语句进行优化,优化后的查询语句可以提升查询语句的执行效率。
实施例二
图2为本发明实施例二提供的一种查询语句优化方法的流程图,本实施例是在上述实施例的基础上进行具体化。在本实施例中,该方法还可以包括:
步骤210、获取查询语句。
具体获取查询语句的方式和步骤在实施例一中已经进行了详细的描述,在此不再赘述。
步骤220、如果所述查询语句满足优化条件,则根据所述查询语句所包含的子句,确定所述查询语句的优化方式,其中,所述子句包括引用表和被引用表,所述引用表引用所述被引用表的列作为所述引用表的外键。
如前实施例一所述,优化条件可以包括第一条件和第二优化条件。
一种实施方式中,所述优化条件包括第一优化条件,所述第一优化条件为所述查询语句包含where子句且where子句不包含or,相应地,步骤220具体可以包括:
如果所述查询语句包含的where子句的条件表达式为exists子查询,且所述exists子查询满足第三优化条件,则确定所述优化方式为exists优化;如果所述查询语句包含的where子句的条件表达式为in子查询,且所述in子查询满足第四优化条件,则确定所述优化方式为in优化。
另一种实施方式中,所述优化条件包括第二优化条件,所述第二优化条件为所述查询语句包含两表等值连接条件,且查询语句中不包含or,相应地,步骤220具体可以包括:如果所述查询语句包含的子句包含两表等值连接条件,且所述查询语句满足第五优化条件,则确定所述查询语句的优化方式为等值连接优化。
本发明实施例中,在查询语句满足任一优化条件的前提下,可以根据查询语句所包含的子句,确定其对应的优化方式,进而可以通过优化方式对查询语句进行优化。
步骤230、基于所述优化方式,对所述查询语句进行优化。
一种实施方式中,如果所述优化方式为exists优化,相应地,步骤130具体可以包括:
删除所述exists子查询中的第一两表等值连接条件;将所述exists子查询中剩余的第一条件表达式添加至第一where子句中,并删除所述exists子查询;在所述第一where子句中添加第一引用表的外键is not null的条件语句,完成对所述查询语句的优化。
如果查询语句为“select*from t1 where t1.c2<5and exists(select*fromt2where t2.d1=t1.c1 and t1.c2>1);”,该查询语句满足第一优化条件、查询语句包含的where子句的条件表达式为exists子查询,且exists子查询满足第三优化条件,则该查询语句的优化方式可以为exists优化,即可以基于exists优化对查询语句进行优化。
具体地,可以基于以下步骤对查询语句进行优化:1)删除exists子查询中的第一两表等值连接条件,即删除t2.d1=t1.c1,可以得到“select*from t1 where t1.c2<5andexists(select*from t2 where t1.c2>1);”;2)将exists子查询中剩余的第一条件表达式添加至第一where子句中,具体地,可以通过and连接将当前exists子查询中剩余的第一条件表达式添加到上层查询的第一where子句中,即将t1.c2>1通过and连接添加到上层查询的第一where子句中,得到“select*from t1 where t1.c2<5and t1.c2>1and exists(select*from t2 where t1.c2>1);”;3)删除exists子查询,即删除exists子查询得到“select*from t1 where t1.c2<5and t1.c2>1;”;4)在第一where子句中添加第一引用表的外键is not null的条件语句,即通过and连接在上层查询的where子句中添加引用表的外键项is not null的条件语句,如果优化前的exists子查询是not exists,则改为通过and连接添加引用表的外键项is null的条件语句,得到的优化后查询语句可以为“select*from t1 where t1.c2<5and t1.c2>1and t1.c1 is not null;”。
另外,如果查询语句的引用表包含多列外键,则可以添加外键项中的所有列均为is not null或者is null的条件语句。
本发明实施例中,通过上述exists优化的步骤,可以将查询语句“select*from t1where t1.c2<5and exists(select*from t2 where t2.d1=t1.c1 and t1.c2>1);”进行优化,得到的优化后查询语句可以为“select*from t1 where t1.c2<5and t1.c2>1andt1.c1 is not null;”,实现了对查询语句的优化。
一种实施方式中,如果所述优化方式为in优化,相应地,步骤130具体可以包括:
将所述in子查询中的第二条件表达式添加至第二where子句中,并删除所述in子查询;在所述第二where子句中添加第二引用表的外键is not null的条件语句,获得优化后的查询语句。
如果查询语句为“select*from t1 where t1.c2<5and t1.c1 in(selectt2.d1from t2 where t1.c2>1);”;该查询语句满足第二优化条件、查询语句包含的where子句的条件表达式为in子查询,且所述in子查询满足第四优化条件,则该查询语句的优化方式可以为in优化,即可以基于in优化对查询语句进行优化。
具体地,可以基于以下步骤对查询语句进行优化:1)将in子查询中的第二条件表达式添加至第二where子句中,具体地,可以通过and将当前in子查询中的第二条件表达式连接添加到上层查询的第二where子句中,即将t1.c2>1通过and连接添加到上层查询的第二where子句中,得到“select*from t1 where t1.c2<5and t1.c2>1and t1.c1 in(selectt2.d1 from t2 where t1.c2>1);”;2)删除in子查询,即删除in子查询得到“select*fromt1 where t1.c2<5and t1.c2>1;”;3)在所述第二where子句中添加第二引用表的外键isnot null的条件语句,具体地,通过and连接在上层查询的第二where子句中添加引用表的外键项is not null的条件语句,得到的优化后查询语句可以为“select*from t1 wheret1.c2<5and t1.c2>1and t1.c1 is not null;”。
需要说明的是,如果in子查询的条件表达式包含not in,则无需对查询语句进行优化,可以退出优化。另外,如果查询语句的引用表包含多列外键,则可以添加外键项中的所有列均为is not null的条件语句。
本发明实施例中,通过上述in优化的步骤,可以将查询语句“select*from t1where t1.c2<5and t1.c1 in(select t2.d1 from t2 where t1.c2>1);”进行优化,得到的优化后查询语句可以为“select*from t1 where t1.c2<5and t1.c2>1and t1.c1 isnot null;”,实现了对查询语句的优化。
一种实施方式中,如果所述优化方式为等值连接优化,相应地,步骤130具体可以包括:
删除所述查询语句中的第二两表等值连接条件;将包含所述第二两表等值连接条件的第三条件表达式改写为第三where子句;删除第三引用表与被引用表的连接句;在所述第三where子句中添加所述第三引用表的外键is not null的条件语句,获得优化后的查询语句。
如果查询语句为“select t1.*from t1 join t2 on t1.c1=t2.d1 and t1.c2=2;”,该查询语句满足第二优化条件且所述查询语句满足第五优化条件,则确定所述查询语句的优化方式为等值连接优化,即可以基于等值连接优化对查询语句进行优化。
具体地,可以基于以下步骤对查询语句进行优化:1)删除所述查询语句中的第二两表等值连接条件,即删除t1.c1=t2.d1,得到“select t1.*from t1 join t2on t1.c2=2;”;2)将包含所述第二两表等值连接条件的第三条件表达式改写为第三where子句,即改写后得到“select t1.*from t1 join t2 where t1.c2=2;”;3)删除第三引用表与被引用表的连接句,即删除from项中的被引用表,删除连接后得到“select t1.*from t1 wheret1.c2=2;”;4)在所述第三where子句中添加所述第三引用表的外键is not null的条件语句,即通过and连接的方式在第三where子句中添加引用表的外键项is not null的条件语句,得到的优化后查询语句可以为“select t1.*from t1 where t1.c2=2and t1.c1 isnot null;”。
另外,如果查询语句的引用表包含多列外键,则可以添加外键项中的所有列均为is not null的条件语句。
本发明实施例中,通过上述等值连接优化的步骤,可以将查询语句“select t1.*from t1 join t2 on t1.c1=t2.d1 and t1.c2=2;”进行优化,得到的优化后查询语句可以为“select t1.*from t1 where t1.c2=2and t1.c1 is not null;”,实现了对查询语句的优化。
步骤240、根据所述查询语句涉及的表的统计信息,确定目标执行计划。
其中,目标执行计划可以为最优的执行计划。优化器可以根据解析查询语句得到的语义信息,生成不同的执行计划,然后选择最优的执行计划。
具体地,在开始执行之前,在查询语句里面有多个索引的时候,经过优化处理,可以确定目标索引,或者在查询语句有多表关联的时候,可确定表的连接顺序,进而生成最优的执行计划,即目标执行计划。
步骤250、基于所述目标执行计划执行查询,得到查询结果。
具体地,开始执行的时候,首先确认是否有操作查询语句的权限,如果没有权限则可以返回没有权限的错误;如果有权限,可以打开权限进行执行查询语句,打开权限的时候可以根据查询语句所包含的表的引擎定义,去调用引擎提供的接口,对预设行进行查询,并将预设行存在结果集中;继续调用引擎接口取下一行,重复相同的逻辑判断,直到取到这个表的最后一行;将上述执行过程的所有满足条件的行组成的记录集作为结果集返回给客户端,结果集即为查询结果。
本发明实施例二提供的一种查询语句优化方法,通过获取查询语句;如果所述查询语句满足优化条件,则根据所述查询语句所包含的子句,确定所述查询语句的优化方式,其中,所述子句包括引用表和被引用表,所述引用表引用所述被引用表的列作为所述引用表的外键;基于所述优化方式,对所述查询语句进行优化。上述技术方案,在获取到查询语句之后,如果查询语句满足优化条件,则根据其包含的子句,确定优化方式,进而根据对应的优化方式,对查询语句进行优化,优化后的查询语句可以提升查询语句的执行效率。另外,执行优化后的查询语句可以进一步提高查询语句的执行效率。
实施例三
图3为本发明实施例三提供的一种查询语句优化装置的结构图,该装置可以适用于查询语句中包含多表连接查询操作的情况,提高查询语句的执行效率。该装置可以通过软件和/或硬件实现,并一般集成在计算机设备中。
如图3所示,该装置包括:
获取模块310,用于获取查询语句;
确定模块320,用于如果所述查询语句满足优化条件,则根据所述查询语句所包含的子句,确定所述查询语句的优化方式,其中,所述子句包括引用表和被引用表,所述引用表引用所述被引用表的列作为所述引用表的外键;
优化模块330,用于基于所述优化方式,对所述查询语句进行优化。
本发明实施例三提供的一种查询语句优化装置,通过获取查询语句;如果所述查询语句满足优化条件,则根据所述查询语句所包含的子句,确定所述查询语句的优化方式,其中,所述子句包括引用表和被引用表,所述引用表引用所述被引用表的列作为所述引用表的外键;基于所述优化方式,对所述查询语句进行优化。上述技术方案,在获取到查询语言之后,如果查询语句满足优化条件,则根据其包含的子句,确定优化方式,进而根据对应的优化方式,对查询语句进行优化,优化后的查询语句可以提升查询语句的执行效率。
在上述实施例的基础上,所述优化条件包括第一优化条件,所述第一优化条件为所述查询语句包含where子句且where子句不包含or,相应地,确定模块320具体用于:
如果所述查询语句包含的where子句的条件表达式为exists子查询,且所述exists子查询满足第三优化条件,则确定所述优化方式为exists优化;
如果所述查询语句包含的where子句的条件表达式为in子查询,且所述in子查询满足第四优化条件,则确定所述优化方式为in优化。
在上述实施例的基础上,如果所述优化方式为exists优化,优化模块330具体用于:
删除所述exists子查询中的第一两表等值连接条件;
将所述exists子查询中剩余的第一条件表达式添加至第一where子句中,并删除所述exists子查询;
在所述第一where子句中添加第一引用表的外键is not null的条件语句,完成对所述查询语句的优化。
在上述实施例的基础上,如果所述优化方式为in优化,优化模块330具体用于:
将所述in子查询中的第二条件表达式添加至第二where子句中,并删除所述in子查询;
在所述第二where子句中添加第二引用表的外键is not null的条件语句,获得优化后的查询语句。
在上述实施例的基础上,所述优化条件包括第二优化条件,所述第二优化条件为所述查询语句包含两表等值连接条件,且查询语句中不包含or,相应地,确定模块320具体用于:
如果所述查询语句包含的子句包含两表等值连接条件,且所述查询语句满足第五优化条件,则确定所述查询语句的优化方式为等值连接优化。
在上述实施例的基础上,如果所述优化方式为等值连接优化,优化模块330具体用于:
删除所述查询语句中的第二两表等值连接条件;
将包含所述第二两表等值连接条件的第三条件表达式改写为第三where子句;
删除第三引用表与被引用表的连接句;
在所述第三where子句中添加所述第三引用表的外键is not null的条件语句,获得优化后的查询语句。
本发明实施例所提供的查询语句优化装置可执行本发明任意实施例所提供的查询语句优化方法,具备执行方法相应的功能模块和有益效果。
实施例四
图4为本发明实施例四提供的一种查询语句优化设备的结构示意图,如图4所示,该查询语句优化设备包括处理器410和存储器420;查询语句优化设备中处理器410的数量可以是一个或多个,图4中以一个处理器410为例;查询语句优化设备中的处理器410和存储器420可以通过总线或其他方式连接,图4中以通过总线连接为例。
存储器420作为一种计算机可读存储介质,可用于存储软件程序、计算机可执行程序以及模块,如本发明实施例中的查询语句优化方法对应的程序指令/模块(例如,查询语句优化装置中的获取模块310、确定模块320和优化模块330)。处理器410通过运行存储在存储器420中的软件程序、指令以及模块,从而执行查询语句优化设备的各种功能应用以及数据处理,即实现上述的查询语句优化方法。
存储器420可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序;存储数据区可存储根据终端的使用所创建的数据等。此外,存储器420可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中,存储器420可进一步包括相对于处理器410远程设置的存储器,这些远程存储器可以通过网络连接至查询语句优化设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
本发明实施例提供的查询语句优化设备可以执行上述实施例提供的查询语句优化方法,具备相应的功能和有益效果。
实施例五
本发明实施例五还提供一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行一种查询语句优化方法,该方法包括:
获取查询语句;
如果所述查询语句满足优化条件,则根据所述查询语句所包含的子句,确定所述查询语句的优化方式,其中,所述子句包括引用表和被引用表,所述引用表引用所述被引用表的列作为所述引用表的外键;
基于所述优化方式,对所述查询语句进行优化。
当然,本发明实施例所提供的一种包含计算机可执行指令的存储介质,其计算机可执行指令不限于如上所述的方法操作,还可以执行本发明任意实施例所提供的查询语句优化方法中的相关操作.
通过以上关于实施方式的描述,所属领域的技术人员可以清楚地了解到,本发明可借助软件及必需的通用硬件来实现,当然也可以通过硬件实现,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如计算机的软盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(RandomAccess Memory,RAM)、闪存(FLASH)、硬盘或光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
值得注意的是,上述查询语句优化装置的实施例中,所包括的各个单元和模块只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (10)

1.一种查询语句优化方法,其特征在于,包括:
获取查询语句;
如果所述查询语句满足优化条件,则根据所述查询语句所包含的子句,确定所述查询语句的优化方式,其中,所述子句包括引用表和被引用表,所述引用表引用所述被引用表的列作为所述引用表的外键;
基于所述优化方式,对所述查询语句进行优化。
2.根据权利要求1所述的查询语句优化方法,其特征在于,所述优化条件包括第一优化条件,所述第一优化条件为所述查询语句包含where子句且where子句不包含or,
相应地,如果所述查询语句满足第一优化条件,根据所述查询语句所包含的子句,确定所述查询语句的优化方式,包括:
如果所述查询语句包含的where子句的条件表达式为exists子查询,且所述exists子查询满足第三优化条件,则确定所述优化方式为exists优化;
如果所述查询语句包含的where子句的条件表达式为in子查询,且所述in子查询满足第四优化条件,则确定所述优化方式为in优化。
3.根据权利要求2所述的查询语句优化方法,其特征在于,如果所述优化方式为exists优化,
相应地,基于所述优化方式,对所述查询语句进行优化,包括:
删除所述exists子查询中的第一两表等值连接条件;
将所述exists子查询中剩余的第一条件表达式添加至第一where子句中,并删除所述exists子查询;
在所述第一where子句中添加第一引用表的外键is not null的条件语句,完成对所述查询语句的优化。
4.根据权利要求2所述的查询语句优化方法,其特征在于,如果所述优化方式为in优化,
相应地,基于所述优化方式,对所述查询语句进行优化,包括:
将所述in子查询中的第二条件表达式添加至第二where子句中,并删除所述in子查询;
在所述第二where子句中添加第二引用表的外键is not null的条件语句,获得优化后的查询语句。
5.根据权利要求1所述的查询语句优化方法,其特征在于,所述优化条件包括第二优化条件,所述第二优化条件为所述查询语句包含两表等值连接条件,且所述查询语句中不包含or,
相应地,如果所述查询语句满足第二优化条件,根据所述查询语句所包含的子句,确定所述查询语句的优化方式,包括:
如果所述查询语句包含的子句包含两表等值连接条件,且所述查询语句满足第五优化条件,则确定所述查询语句的优化方式为等值连接优化。
6.根据权利要求5所述的查询语句优化方法,其特征在于,如果所述优化方式为等值连接优化,基于所述优化方式,对所述查询语句进行优化,包括:
删除所述查询语句中的第二两表等值连接条件;
将包含所述第二两表等值连接条件的第三条件表达式改写为第三where子句;
删除第三引用表与被引用表的连接句;
在所述第三where子句中添加所述第三引用表的外键is not null的条件语句,获得优化后的查询语句。
7.根据权利要求1所述的查询语句优化方法,其特征在于,在基于所述优化方式,对所述查询语句进行优化之后,还包括:
根据所述查询语句涉及的表的统计信息,确定目标执行计划;
基于所述目标执行计划执行查询,得到查询结果。
8.一种查询语句优化装置,其特征在于,包括:
获取模块,用于获取查询语句;
确定模块,用于如果所述查询语句满足优化条件,则根据所述查询语句所包含的子句,确定所述查询语句的优化方式,其中,所述子句包括引用表和被引用表,所述引用表引用所述被引用表的列作为所述引用表的外键;
优化模块,用于基于所述优化方式,对所述查询语句进行优化。
9.一种查询语句优化设备,其特征在于,所述设备:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-7中任一所述的查询语句优化方法。
10.一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行如权利要求1-7中任一所述的查询语句优化方法。
CN202110124950.5A 2021-01-29 2021-01-29 一种查询语句优化方法、装置、设备和存储介质 Pending CN112732752A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110124950.5A CN112732752A (zh) 2021-01-29 2021-01-29 一种查询语句优化方法、装置、设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110124950.5A CN112732752A (zh) 2021-01-29 2021-01-29 一种查询语句优化方法、装置、设备和存储介质

Publications (1)

Publication Number Publication Date
CN112732752A true CN112732752A (zh) 2021-04-30

Family

ID=75594710

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110124950.5A Pending CN112732752A (zh) 2021-01-29 2021-01-29 一种查询语句优化方法、装置、设备和存储介质

Country Status (1)

Country Link
CN (1) CN112732752A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113535756A (zh) * 2021-07-30 2021-10-22 上海达梦数据库有限公司 数据查询方法、装置、设备及存储介质
CN114490724A (zh) * 2022-04-15 2022-05-13 北京奥星贝斯科技有限公司 处理数据库查询语句的方法和装置
CN114969101A (zh) * 2022-07-13 2022-08-30 北京奥星贝斯科技有限公司 Sql语句的处理方法及装置

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5615361A (en) * 1995-02-07 1997-03-25 International Business Machines Corporation Exploitation of uniqueness properties using a 1-tuple condition for the optimization of SQL queries
US5724570A (en) * 1995-06-07 1998-03-03 Tandem Computers Incorporated Method and apparatus for a complete SQL subquery elimination process
US5732258A (en) * 1996-02-08 1998-03-24 Oracle Corporation Method and apparatus for efficiently evaluating exists and not exists equivalent subqueries
US20030009450A1 (en) * 2001-06-21 2003-01-09 International Business Machines Corporation Left outer join elimination on key
US20090070315A1 (en) * 2007-09-12 2009-03-12 Oracle International Corporation Table elimination optimizations
CN102902778A (zh) * 2012-09-28 2013-01-30 用友软件股份有限公司 查询语句优化装置和查询语句优化方法
US20140067789A1 (en) * 2012-09-04 2014-03-06 Oracle International Corporation Optimization technique of generalized disjunctive semi/anti join
US20140379690A1 (en) * 2013-06-20 2014-12-25 Oracle International Corporation Transforming a query by eliminating a subquery
US20150339349A1 (en) * 2014-05-21 2015-11-26 Oracle International Corporation Outer-joined and cross-joined table elimination for duplicate-insignificant queries
CN106777054A (zh) * 2016-12-09 2017-05-31 北京华胜信泰数据技术有限公司 半连接合并方法和半连接合并装置
CN109508339A (zh) * 2018-11-12 2019-03-22 上海达梦数据库有限公司 一种数据查询方法、装置、终端设备和存储介质

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5615361A (en) * 1995-02-07 1997-03-25 International Business Machines Corporation Exploitation of uniqueness properties using a 1-tuple condition for the optimization of SQL queries
US5724570A (en) * 1995-06-07 1998-03-03 Tandem Computers Incorporated Method and apparatus for a complete SQL subquery elimination process
US5732258A (en) * 1996-02-08 1998-03-24 Oracle Corporation Method and apparatus for efficiently evaluating exists and not exists equivalent subqueries
US20030009450A1 (en) * 2001-06-21 2003-01-09 International Business Machines Corporation Left outer join elimination on key
US20090070315A1 (en) * 2007-09-12 2009-03-12 Oracle International Corporation Table elimination optimizations
US20140067789A1 (en) * 2012-09-04 2014-03-06 Oracle International Corporation Optimization technique of generalized disjunctive semi/anti join
CN102902778A (zh) * 2012-09-28 2013-01-30 用友软件股份有限公司 查询语句优化装置和查询语句优化方法
US20140379690A1 (en) * 2013-06-20 2014-12-25 Oracle International Corporation Transforming a query by eliminating a subquery
US20150339349A1 (en) * 2014-05-21 2015-11-26 Oracle International Corporation Outer-joined and cross-joined table elimination for duplicate-insignificant queries
CN106777054A (zh) * 2016-12-09 2017-05-31 北京华胜信泰数据技术有限公司 半连接合并方法和半连接合并装置
CN109508339A (zh) * 2018-11-12 2019-03-22 上海达梦数据库有限公司 一种数据查询方法、装置、终端设备和存储介质

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113535756A (zh) * 2021-07-30 2021-10-22 上海达梦数据库有限公司 数据查询方法、装置、设备及存储介质
CN113535756B (zh) * 2021-07-30 2023-05-30 上海达梦数据库有限公司 数据查询方法、装置、设备及存储介质
CN114490724A (zh) * 2022-04-15 2022-05-13 北京奥星贝斯科技有限公司 处理数据库查询语句的方法和装置
CN114490724B (zh) * 2022-04-15 2022-06-14 北京奥星贝斯科技有限公司 处理数据库查询语句的方法和装置
CN114969101A (zh) * 2022-07-13 2022-08-30 北京奥星贝斯科技有限公司 Sql语句的处理方法及装置
CN114969101B (zh) * 2022-07-13 2022-10-21 北京奥星贝斯科技有限公司 Sql语句的处理方法及装置

Similar Documents

Publication Publication Date Title
CN112732752A (zh) 一种查询语句优化方法、装置、设备和存储介质
US8332389B2 (en) Join order for a database query
US10133778B2 (en) Query optimization using join cardinality
Simitsis et al. State-space optimization of ETL workflows
US8396852B2 (en) Evaluating execution plan changes after a wakeup threshold time
US7730055B2 (en) Efficient hash based full-outer join
US8965918B2 (en) Decomposed query conditions
CN101021874A (zh) 一种对查询sql请求进行优化的方法及装置
US20080288444A1 (en) Evaluating Multi-Table Join Selectivity in a Computer Database
CN110502532B (zh) 远程数据库对象的优化方法、装置、设备和存储介质
CN102541631B (zh) 以多线程不同驱动源执行计划处理查询的方法和系统
US8554760B2 (en) System and method for optimizing queries
CN111198898B (zh) 大数据查询方法及大数据查询装置
CN112988782A (zh) Hive支持交互式查询的方法、装置及存储介质
CN112100198A (zh) 数据库sql语句优化方法、装置、设备及存储介质
CN113918605A (zh) 数据查询方法、装置、设备以及计算机存储介质
CN111814458A (zh) 规则引擎系统优化方法、装置、计算机设备及存储介质
WO2018090557A1 (zh) 查询数据表的方法和装置
US8150865B2 (en) Techniques for coalescing subqueries
CN108959571B (zh) Sql语句的运算方法、装置、终端设备及存储介质
RU2515565C1 (ru) Способ обновления структурированных данных в системе управления реляционными базами данных
CN112199390A (zh) 一种数据库中数据查询方法、装置、设备及存储介质
CN116610697A (zh) 数据库查询语句的查询方法、存储介质及设备
CN114490724B (zh) 处理数据库查询语句的方法和装置
CN115934760A (zh) 数据库查询语句的优化方法、存储介质与计算机设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination