CN103646067A

CN103646067A - 一种提高数据库查询效率的方法和系统

Info

Publication number: CN103646067A
Application number: CN201310647102.8A
Authority: CN
Inventors: 兰俊松; 王德鹏; 刘念林
Original assignee: Sichuan Jiuzhou Electric Group Co Ltd
Current assignee: Sichuan Jiuzhou Electric Group Co Ltd
Priority date: 2013-12-06
Filing date: 2013-12-06
Publication date: 2014-03-19

Abstract

本发明涉及数据库查询技术领域，本发明公开了一种提高数据库查询效率的方法，其具体包括以下的步骤：步骤一、提取出查询语句，将查询语句采用条件集进行描述，条件集Ｇ＝｛ｇ1，g2，ｇ3,…，ｇn｝，gi为条件项（i=1,2,3，…，n），每个gi由原子条件tij（j=1,2,3，…，m）组成；步骤二、遍历G的全部条件项，将每个条件项下的原子条件与其他原子条件逐一进行比较，当某个条件项下两个原子条件之间有逻辑上的相互包含关系时，则将范围较大（即外延较小）的原子条件舍去，得到新的条件集，并采用新的条件集进行数据库的查询。通过优化每个条件项下的原子条件，将原子条件之间的逻辑关系进行优化，减少从数据库中提取数据的操作，从而提高数据库的查询效率。

Description

一种提高数据库查询效率的方法和系统

技术领域

本发明属于数据库查询技术领域，尤其涉及一种提高数据库查询效率的方法和系统。

背景技术

目前主流数据库中提高查询效率的方法基本上都是基于某种具体的关系型数据库RDBMS系统进行的，并且都在某种程度上运用了某种具体的关系型数据库的特性进行处理。这种现状导致对通用的关系型数据库RDBMS系统缺乏统一和高效的查询方法。在局部应用和小规模应用时，查询效率低的问题还不突出，但一旦涉及到用户分布式应用，甚至迁移和移植数据库，原有的提高查询效率的方法将完全失效。

目前在数据库查询效率提升方面，都是各个厂商或者某个特定的关系数据库进行特定的查询效率优化，常见的有索引优化，存储空间的优化，数据页的链接，特定的主键设计等等。但是需要特定数据库提供不同的功能支持和函数接口，并且在这个层面不同的关系型数据库提供的数据操作语言DML、数据定义语言DDL在语法和词法上相差甚远，根本无法达到统一和通用。

发明内容

本发明的目的是针对现有技术中没有一种有效、通用的方法来提高数据库查询效率的技术问题，本发明公开了一种提高数据库查询效率的方法。本发明还公开了提高数据库查询效率方法的实现系统。

本发明的目的通过下述技术方案来实现：

一种提高数据库查询效率的方法，其具体包括以下的步骤：步骤一、提取出查询语句，将查询语句采用条件集进行描述，其中条件集Ｇ＝｛ｇ1，g2，ｇ3,…，ｇn｝，gi为条件项（i=1,2,3，…，n），每个gi由原子条件tij（j=1,2,3，…，m）组成；条件项为只含有原子条件tij和“与”运算符的逻辑表达式；原子条件为不含“与”且不含“或”运算符的逻辑表达式；步骤二、遍历G的全部条件项，将每个条件项下的原子条件与其他原子条件逐一进行比较，当某个条件项下两个原子条件之间有逻辑上的相互包含关系时，则将范围较大外延较小的原子条件舍去，得到新的条件集，并采用新的条件集进行数据库的查询。

更进一步地，上述方法还包括：当其中一个条件项是一个原子条件时，将这个原子条件与其他条件项的原子条件进行比较，当其他条件项的某个原子条件与这个原子条件相同时，将相同的原子条件构成条件集Ｇ的一个子集，其他的条件构成条件集Ｇ的另外的子集，从而形成新的条件集。

更进一步地，上述方法还包括：当其中一个条件项包括两个或者两个以上的原子条件时，依次取出每一个原子条件，将取出的原子条件与其他其他条件项的原子条件进行比较，当其他条件项的某个原子条件与这个取出的原子条件相同时，将相同的原子条件构成条件集Ｇ的一个子集，其他的条件构成条件集Ｇ另外的子集，从而形成新的条件集。

本发明还公开了一种提高数据库查询效率方法的实现系统，其具体包括语查询语句提取模块和查询语句优化模块，所述查询语句提取模块用于提取出查询语句，将查询语句采用条件集进行描述，其中条件集Ｇ＝｛ｇ1，g2，ｇ3,…，ｇn｝，gi为条件项（i=1,2,3，…，n），每个gi由原子条件tij（j=1,2,3，…，m）组成；条件项为只含有原子条件tij和“与”运算符的逻辑表达式；原子条件为不含“与”且不含“或”运算符的逻辑表达式；所述查询语句优化模块用于遍历G的全部条件项，将每个条件项下的原子条件与其他原子条件逐一进行比较，当某个条件项下两个原子条件之间有逻辑上的相互包含关系时，则将范围较大外延较小的原子条件舍去，得到新的条件集，并采用新的条件集进行数据库的查询。

更进一步地，上述系统还还包括公共原子条件提取模块，所述公共原子条件提取模块用于当其中一个条件项是一个原子条件时，将这个原子条件与其他条件项的原子条件进行比较，当其他条件项的某个原子条件与这个原子条件相同时，将相同的原子条件构成条件集Ｇ的一个子集，其他的条件构成条件集Ｇ的另外的子集，从而形成新的条件集。

更进一步地，上述公共原子条件提取模块还用于当其中一个条件项包括两个或者两个以上的原子条件时，依次取出每一个原子条件，将取出的原子条件与其他其他条件项的原子条件进行比较，当其他条件项的某个原子条件与这个取出的原子条件相同时，将相同的原子条件构成条件集Ｇ的一个子集，其他的条件构成条件集Ｇ另外的子集，从而形成新的条件集。

通过采用以上技术方案，本发明具有以下有益效果：通过优化查询条件，将条件项下的原子条件之间的逻辑关系进行优化，将条件项之间的逻辑关系进行优化，减少从数据库中提取数据的操作，从而提高数据库的查询效率。

附图说明

图1为本发明的提高数据库查询效率的方法的流程图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合说明书附图及具体实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

如图1所示的本发明的提高数据库查询效率的方法的流程图。

其中查询条件的文法定义如下：

条件集Ｇ：<g>|<gi>or <gj>；

条件项g：<ti1>and<tik>；

原子条件t：ti1，ti2，ti3…tim。

其查询语句的优化过程如下：

a.将各条件项g中的原子条件进行比较，若各条件项的原子条件中有相互包含关系，则将外延小的原子条件t舍去；初始量m=1（1<m<p,p为条件项数）。

b.若m=p，遍历G的全部条件项，即得到优化结果。

c.若项gm是一个原子条件tm1，则将tm1与各条件项gi（i≠m）的tij比较，若存在gk，其中包含tkj与tm1相同，则将这部分gk与gm构成G的一个子集G＊，剩余元素构成子集C＊，将G＊的公共项提取出来，得到新的集合记作G＊＊；转至（b），继续处理G＊＊；

d.若项gm为两个或者两个以上的原子条件tmj和tmk（k≠j）的and运算，则取第一个原子条件tmj，做（c）的处理，若G＊＊为非空集合，转至（b），继续处理G＊＊；若G＊＊为空集合，取下一个原子条件，做（c）处理，直到G＊＊非空；重复上述的（b）--（d），直到取遍G的全部条件项，所得新的G＊＊与提取的序列即为优化后的查询条件。

本发明公开了一种提高数据库查询效率的方法，其具体包括以下的步骤：步骤一、提取出查询语句，将查询语句采用条件集进行描述，其中条件集Ｇ＝｛ｇ1，g2，ｇ3,…，ｇn｝，gi为条件项（i=1,2,3，…，n），每个gi由原子条件tij（j=1,2,3，…，m）组成；条件项为只含有原子条件tij和“与”运算符的逻辑表达式；原子条件为不含“与”且不含“或”运算符的逻辑表达式；步骤二、遍历G的全部条件项，将每个条件项下的原子条件与其他原子条件逐一进行比较，当某个条件项下两个原子条件之间有逻辑上的相互包含关系时，则将范围较大（即外延较小）的原子条件舍去，得到新的条件集，并采用新的条件集进行数据库的查询；比如其中一个条件项下的两个原子条件分别为id>5、id>7，这两个原子条件之间就有逻辑上的相互包含关系，id>7的必然id>5，而id>5相对于id>7的范围更大，即外延相对较小，而每个条件项下两个原子条件之间都是“与”运算，此时，可以直接将id>5这个范围大、外延小的原子条件舍去，只剩下id>7的这一个原子条件。通过优化每个条件项下的原子条件，将原子条件之间的逻辑关系进行优化，减少从数据库中提取数据的操作，从而提高数据库的查询效率。

更进一步地，上述方法还包括：当其中一个条件项是一个原子条件时，将这个原子条件与其他条件项的原子条件进行比较，当其他条件项的某个原子条件与这个原子条件相同时，将相同的原子条件构成条件集Ｇ的一个子集，其他的条件构成条件集Ｇ的另外的子集，从而形成新的条件集。若条件项gm是一个原子条件tm1，则：将tm1与各个条件项gi（i≠m）的tij进行比较，若存在gk，其中包含tkj，tkj与tm1相同，则将这个相同部分构成G的一个子集，剩余元素构成G的另外的子集，从而形成新的条件集，并通过新的条件集进行数据库查询。通过上述方法将条件项与条件项之间的逻辑关系进行优化，避免重复处理不同条件项下的同一个原子条件，进一步提高了数据库查询的效率。

更进一步地，上述方法还包括：当其中一个条件项包括两个或者两个以上的原子条件时，依次取出每一个原子条件，将取出的原子条件与其他其他条件项的原子条件进行比较，当其他条件项的某个原子条件与这个取出的原子条件相同时，将相同的原子条件构成条件集Ｇ的一个子集，其他的条件构成条件集Ｇ另外的子集，从而形成新的条件集。若条件项gm为两个或者两个以上的原子条件tmj和tmk（k≠j）的and运算，则取第一个原子条件tmj，将tmj与各个条件项gi（i≠m）的tij进行比较，若存在gk，其中包含tkj，tkj与tmj相同，则将这个相同部分构成G的一个子集，剩余元素构成G的另外一个子集。依次类推，直到完成所有条件项中原子条件的处理，得到新的条件集，并采用新的条件集进行查询，从而提高数据库的查询效率。

本发明还公开了一种提高数据库查询效率方法的实现系统，其具体包括语查询语句提取模块和查询语句优化模块，所述查询语句提取模块用于提取出查询语句，将查询语句采用条件集进行描述，其中条件集Ｇ＝｛ｇ1，g2，ｇ3,…，ｇn｝，gi为条件项（i=1,2,3，…，n），每个gi由原子条件tij（j=1,2,3，…，m）组成；条件项为只含有原子条件tij和“与”运算符的逻辑表达式；原子条件为不含“与”且不含“或”运算符的逻辑表达式；所述查询语句优化模块用于遍历G的全部条件项，将每个条件项下的原子条件与其他原子条件逐一进行比较，当某个条件项下两个原子条件之间有逻辑上的相互包含关系时，则将范围较大（即外延较小）的原子条件舍去，得到新的条件集，并采用新的条件集进行数据库的查询；比如其中一个条件项下的两个原子条件分别为id>5、id>7，这两个原子条件之间就有逻辑上的相互包含关系，id>7的必然id>5，而id>5相对于id>7的范围更大，即外延相对较小，而每个条件项下两个原子条件之间都是“与”运算，此时，可以直接将id>5这个范围大、外延小的原子条件舍去，只剩下id>7的这一个原子条件。通过优化每个条件项下的原子条件，将原子条件之间的逻辑关系进行优化，减少从数据库中提取数据的操作，从而提高数据库的查询效率。

更进一步地，上述系统还还包括公共原子条件提取模块，所述公共原子条件提取模块用于当其中一个条件项是一个原子条件时，将这个原子条件与其他条件项的原子条件进行比较，当其他条件项的某个原子条件与这个原子条件相同时，将相同的原子条件构成条件集Ｇ的一个子集，其他的条件构成条件集Ｇ的另外的子集，从而形成新的条件集。若条件项gm是一个原子条件tm1，则：将tm1与各个条件项gi（i≠m）的tij进行比较，若存在gk，其中包含tkj，tkj与tm1相同，则将这个相同部分构成G的一个子集，剩余元素构成G的另外的子集，从而形成新的条件集，并通过新的条件集进行数据库查询。通过上述方法将条件项与条件项之间的逻辑关系进行优化，避免重复处理不同条件项下的同一个原子条件，进一步提高了数据库查询的效率。

更进一步地，上述公共原子条件提取模块还用于当其中一个条件项包括两个或者两个以上的原子条件时，依次取出每一个原子条件，将取出的原子条件与其他其他条件项的原子条件进行比较，当其他条件项的某个原子条件与这个取出的原子条件相同时，将相同的原子条件构成条件集Ｇ的一个子集，其他的条件构成条件集Ｇ另外的子集，从而形成新的条件集。若条件项gm为两个或者两个以上的原子条件tmj和tmk（k≠j）的and运算，则取第一个原子条件tmj，将tmj与各个条件项gi（i≠m）的tij进行比较，若存在gk，其中包含tkj，tkj与tmj相同，则将这个相同部分构成G的一个子集，剩余元素构成G的另外一个子集。依次类推，直到完成所有条件项中原子条件的处理，得到新的条件集，并采用新的条件集进行查询，从而提高数据库的查询效率。

上述的实施例中所给出的系数和参数，是提供给本领域的技术人员来实现或使用本发明的，本发明并不限定仅取前述公开的数值，在不脱离本发明的发明思想的情况下，本领域的技术人员可以对上述实施例做出种种修改或调整，因而本发明的保护范围并不被上述实施例所限，而应该是符合权利要求书提到的创新性特征的最大范围。

Claims

1.一种提高数据库查询效率的方法，其具体包括以下的步骤：步骤一、提取出查询语句，将查询语句采用条件集进行描述，其中条件集Ｇ＝｛ｇ1，g2，ｇ3,…，ｇn｝，gi为条件项（i=1,2,3，…，n），每个gi由原子条件tij（j=1,2,3，…，m）组成；条件项为只含有原子条件tij和“与”运算符的逻辑表达式；原子条件为不含“与”且不含“或”运算符的逻辑表达式；步骤二、遍历G的全部条件项，将每个条件项下的原子条件与其他原子条件逐一进行比较，当某个条件项下两个原子条件之间有逻辑上的相互包含关系时，则将范围较大外延较小的原子条件舍去，得到新的条件集，并采用新的条件集进行数据库的查询。

2.如权利要求1所述的提高数据库查询效率的方法，其特征在于所述方法还包括：当其中一个条件项是一个原子条件时，将这个原子条件与其他条件项的原子条件进行比较，当其他条件项的某个原子条件与这个原子条件相同时，将相同的原子条件构成条件集Ｇ的一个子集，其他的条件构成条件集Ｇ的另外的子集，从而形成新的条件集。

3.如权利要求1或者2所述的提高数据库查询效率的方法，其特征在于所述方法还包括：当其中一个条件项包括两个或者两个以上的原子条件时，依次取出每一个原子条件，将取出的原子条件与其他其他条件项的原子条件进行比较，当其他条件项的某个原子条件与这个取出的原子条件相同时，将相同的原子条件构成条件集Ｇ的一个子集，其他的条件构成条件集Ｇ另外的子集，从而形成新的条件集。

4.一种提高数据库查询效率方法的实现系统，其特征在于具体包括语查询语句提取模块和查询语句优化模块，所述查询语句提取模块用于提取出查询语句，将查询语句采用条件集进行描述，其中条件集Ｇ＝｛ｇ1，g2，ｇ3,…，ｇn｝，gi为条件项（i=1,2,3，…，n），每个gi由原子条件tij（j=1,2,3，…，m）组成；条件项为只含有原子条件tij和“与”运算符的逻辑表达式；原子条件为不含“与”且不含“或”运算符的逻辑表达式；所述查询语句优化模块用于遍历G的全部条件项，将每个条件项下的原子条件与其他原子条件逐一进行比较，当某个条件项下两个原子条件之间有逻辑上的相互包含关系时，则将范围较大外延较小的原子条件舍去，得到新的条件集，并采用新的条件集进行数据库的查询。

5.如权利要求4所述提高数据库查询效率方法的实现系统，其特征在于所述系统还还包括公共原子条件提取模块，所述公共原子条件提取模块用于当其中一个条件项是一个原子条件时，将这个原子条件与其他条件项的原子条件进行比较，当其他条件项的某个原子条件与这个原子条件相同时，将相同的原子条件构成条件集Ｇ的一个子集，其他的条件构成条件集Ｇ的另外的子集，从而形成新的条件集。

6.如权利要求5所述提高数据库查询效率方法的实现系统，其特征在于所述公共原子条件提取模块还用于当其中一个条件项包括两个或者两个以上的原子条件时，依次取出每一个原子条件，将取出的原子条件与其他其他条件项的原子条件进行比较，当其他条件项的某个原子条件与这个取出的原子条件相同时，将相同的原子条件构成条件集Ｇ的一个子集，其他的条件构成条件集Ｇ另外的子集，从而形成新的条件集。