CN114817293A

CN114817293A - 一种基于分布式sql的数据查询方法及系统

Info

Publication number: CN114817293A
Application number: CN202210330524.1A
Authority: CN
Inventors: 王凯强; 付丽丽; 冉宇哲; 韩杰娇; 范伟宁; 杨铭; 谢佩辉
Original assignee: Huaneng Information Technology Co Ltd
Current assignee: Huaneng Information Technology Co Ltd
Priority date: 2022-03-31
Filing date: 2022-03-31
Publication date: 2022-07-29
Anticipated expiration: 2042-03-31
Also published as: CN114817293B

Abstract

本发明公开了一种基于分布式SQL的数据查询方法，应用于包括SQL的平台中，该方法包括：接收数据查询请求，若所述数据查询请求为第一次查询，则根据所述数据查询请求的类型确定对应的查询区域；基于所述数据查询请求获取查询语句，并将所述查询语句拆分有若干个关键词，在所述查询区域内选择出与所述关键词关联程度最高的数据作为初始查询结果；若所述初始查询结果不唯一，则从剩余字里挑选出若干个关键字，从所述初始查询结果中基于所述关键字选取最终查询结果。通过将以往查询的结果记录在所述历史缓存区域，直接将历史缓存区域内的最终查询结果调取，节省了时间。通过关键词关联程度和关键字双重查询机制，使数据信息查询简单有效，提高查询效率。

Description

一种基于分布式SQL的数据查询方法及系统

技术领域

本申请涉及数据查询技术领域，更具体地，涉及一种基于分布式SQL的数据查询方法及系统。

背景技术

结构化查询语言（Structured Query Language）简称SQL，是一种特殊目的的编程语言，是一种数据库查询和程序设计语言，用于存取数据以及查询、更新和管理关系数据库系统。

结构化查询语言是高级的非过程化编程语言，允许用户在高层数据结构上工作。它不要求用户指定对数据的存放方法，也不需要用户了解具体的数据存放方式，所以具有完全不同底层结构的不同数据库系统, 可以使用相同的结构化查询语言作为数据输入与管理的接口。结构化查询语言语句可以嵌套，这使它具有极大的灵活性和强大的功能。

现有的SQL数据查询技术中，数据查询往往要在所有数据库中进行检索，这样做查询速率大大降低。且仅仅凭借单个关键词对数据库中查询，经常得到含有某个关键词的多条数据，查询准确度非常低。

因此，如何提高查询速率和准确性，是目前有待解决的技术问题。

发明内容

本发明提供一种基于分布式SQL的数据查询方法，用以解决现有技术中数据查询速度慢且准确性低的技术问题。该方法应用于包括SQL的平台中，该方法包括：

接收数据查询请求，若所述数据查询请求为第一次查询，则根据所述数据查询请求的类型确定对应的查询区域；

基于所述数据查询请求获取查询语句，并将所述查询语句拆分有若干个关键词，在所述查询区域内选择出与所述关键词关联程度最高的数据作为初始查询结果；

若所述初始查询结果不唯一，则从剩余字里挑选出若干个关键字，从所述初始查询结果中基于所述关键字选取最终查询结果；

其中，所述剩余字为所述查询语句中去除所述关键词后剩余的字，所述关键词和所述关键字均能表征所述查询语句。

本申请一些实施例中，所述方法还包括：

将每次得到的所述最终查询结果记录在历史缓存区域内；

若所述数据查询请求并非是第一次查询，则根据所述数据查询请求在所述历史缓存区域内获取所述最终查询结果。

本申请一些实施例中，所述方法还包括：

若所述初始查询结果唯一，则将所述初始查询结果作为最终查询结果并记录在所述历史缓存区域内。

本申请一些实施例中，基于所述数据查询请求获取查询语句，具体为：

获取所述查询区域中语句的格式，将所述数据查询请求转换为与所述格式相匹配的所述查询语句。

本申请一些实施例中，并将所述查询语句拆分有若干个关键词，在所述查询区域内选择出与所述关键词关联程度最高的数据作为初始查询结果，具体为：

将所述查询语句拆分有S个所述关键词，所述查询区域内一条数据有M个所述关键词，关联程度为M/S的取值，从所述查询区域内选择M/S取值最高的数据作为初始查询结果；

其中，S、M均为正整数，S大于M，M/S取值不大于1。

本申请一些实施例中，所述方法还包括：

每一个所述数据查询请求的类型对应有一个所述查询区域。

本申请一些实施例中，从所述初始查询结果中基于所述关键字选取最终查询结果，具体为：

除去若干个所述初始查询结果中的所述关键词，得到若干个初始剩余字，将所述关键字与所述初始剩余字进行匹配，将匹配到的结果作为最终查询结果。

对应的，本申请还提供了一种基于分布式SQL的数据查询系统，该系统应用于包括SQL的平台中，该系统包括：

接收模块，用于接收数据查询请求，若所述数据查询请求为第一次查询，则根据所述数据查询请求的类型确定对应的查询区域；

查询模块，用于基于所述数据查询请求获取查询语句，并将所述查询语句拆分有若干个关键词，在所述查询区域内选择出与所述关键词关联程度最高的数据作为初始查询结果；

匹配模块，用于若所述初始查询结果不唯一，则从剩余字里挑选出若干个关键字，从所述初始查询结果中基于所述关键字选取最终查询结果；

本申请一些实施例中，所述查询模块，具体用于：

获取所述查询区域中语句的格式，将所述数据查询请求转换为与所述格式相匹配的所述查询语句；将所述查询语句拆分有S个所述关键词，所述查询区域内一条数据有M个所述关键词，关联程度为M/S的取值，从所述查询区域内选择M/S取值最高的数据作为初始查询结果；

所述匹配模块，具体用于：

通过应用以上技术方案，该方法包括，接收数据查询请求，若所述数据查询请求为第一次查询，则根据所述数据查询请求的类型确定对应的查询区域；基于所述数据查询请求获取查询语句，并将所述查询语句拆分有若干个关键词，在所述查询区域内选择出与所述关键词关联程度最高的数据作为初始查询结果；若所述初始查询结果不唯一，则从剩余字里挑选出若干个关键字，从所述初始查询结果中基于所述关键字选取最终查询结果。通过将以往查询的结果记录在所述历史缓存区域，发现以往相同查询请求时，直接将历史缓存区域内的最终查询结果调取，节省了查询过程中执行树的生成过程，且降低了反应时间和延迟。通过设置了关键词的关联程度，针对查询请求类型确定某一查询区域，在该区域内选择关键词关联程度最高的数据作为最终查询结果。能够快速精准的查询出所需数据信息，并非仅仅通过某个关键词来查询数据信息，使数据查询有效性得到提高。而且，若通过关联程度得到的结果不唯一，还会对初始查询结果去除关键词后的初始剩余字与所述剩余字进行匹配，得到唯一的查询结果，避免了查询错误的发生。通过关键词关联程度和关键字双重查询机制，使数据信息查询简单有效，提高了查询效率，使系统流程更加便捷。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1示出了本发明实施例提出的一种基于分布式SQL的数据查询方法的流程示意图；

图2示出了本发明实施例提出的一种基于分布式SQL的数据查询系统的结构示意图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

本申请提供了一种基于分布式SQL的数据查询方法，如图1所示，该方法应用于包括SQL的平台中，该方法包括以下步骤：

步骤S101，接收数据查询请求，若所述数据查询请求为第一次查询，则根据所述数据查询请求的类型确定对应的查询区域；

步骤S102，基于所述数据查询请求获取查询语句，并将所述查询语句拆分有若干个关键词，在所述查询区域内选择出与所述关键词关联程度最高的数据作为初始查询结果；

步骤S103，若所述初始查询结果不唯一，则从剩余字里挑选出若干个关键字，从所述初始查询结果中基于所述关键字选取最终查询结果。

在步骤S101中，接收数据查询请求，若所述数据查询请求为第一次查询，则根据所述数据查询请求的类型确定对应的查询区域。

本实施例中，接收客户端或平台内部发送的数据查询请求，判断所述数据查询请求是否为第一次查询，即该所述数据查询请求以往不曾查询过。根据数据查询请求的属性划分有若干个类型，每个类型对应有一个固定查询区域，据此对查询区域进行划分。基于所述数据查询请求的类型确定与其类型对应的某个查询区域。并在该区域内部进行查询。

为了提高数据查询的效率，本申请一些实施例中，所述方法还包括：将每次得到的所述最终查询结果记录在历史缓存区域内；若所述数据查询请求并非是第一次查询，则根据所述数据查询请求在所述历史缓存区域内获取所述最终查询结果。

本实施例中，以往每次查询都将最终查询结果记录在所述历史缓存区域内，当所述数据查询请求与以往请求相同时，直接从所述历史缓存区域内调取出数据信息作为最终查询结果。通过将以往查询的结果记录在所述历史缓存区域，发现以往相同查询请求时，直接将历史缓存区域内的最终查询结果调取，节省了查询过程中执行树的生成过程，且降低了反应时间和延迟。

在步骤S102中，基于所述数据查询请求获取查询语句，并将所述查询语句拆分有若干个关键词，在所述查询区域内选择出与所述关键词关联程度最高的数据作为初始查询结果。

本实施例中，将所述数据查询请求转为查询语句，该语句能够在所述查询区域内进行查询，将所述查询语句拆分有若干个关键词，所述关键词能在一定程度表征所述查询语句，注意此时，所述查询语句拆分有若干个关键词后，还剩有若干字。在所述查询区域内选择出与所述关键词关联程度最高的数据作为初始查询结果，关键词关联程度为查询区域内的数据包括上述关键词的程度，程度越高优先查询的级别越高。

为了提高数据查询的准确度，本申请一些实施例中，获取所述查询区域中语句的格式，将所述数据查询请求转换为与所述格式相匹配的所述查询语句，以此使查询语句在查询区域内的查询的适配性更高。

可以理解的是，查询区域的语句格式并非是本申请保护重点，而是查询语句格式与所述查询区域内语句格式相同，更加方便查找。不同查询区域的格式可以不同，但查询语句格式必定与对应的查询区域的格式相同，此构思点所展开的方案均属于本申请保护范围。

为了进一步提高数据查询的准确度，在本申请一些实施例中，并将所述查询语句拆分有若干个关键词，在所述查询区域内选择出与所述关键词关联程度最高的数据作为初始查询结果，具体为：将所述查询语句拆分有S个所述关键词，所述查询区域内一条数据有M个所述关键词，关联程度为M/S的取值，从所述查询区域内选择M/S取值最高的数据作为初始查询结果。

本实施例中，S、M均为正整数，S大于M，M/S取值不大于1。M个关键词全部从属于S个关键词。M/S的取值说明了查询语句与所述查询区域内语句的相关程度，M/S的取值越大，说明相关程度越高，查询区域内的该数据更加贴合查询要求。反之同理，M/S的取值越小，说明相关程度越低，查询区域内的该数据更不贴合查询要求。所以，从所述查询区域内选择M/S取值最高的数据作为初始查询结果，将关联程度最高的数据作为初始查询结果。通过设置了关键词的关联程度，针对查询请求类型确定某一查询区域，在该区域内选择关键词关联程度最高的数据作为最终查询结果。能够快速精准的查询出所需数据信息，并非仅仅通过某个关键词来查询数据信息，使数据查询有效性得到提高。

本申请一些实施例中，若所述初始查询结果唯一，则将所述初始查询结果作为最终查询结果并记录在所述历史缓存区域内。

在步骤S103中，若所述初始查询结果不唯一，则从剩余字里挑选出若干个关键字，从所述初始查询结果中基于所述关键字选取最终查询结果。

本实施例中，如果所述初始查询结果不唯一，即M/S的最大值有两条及以上的数据，则从剩余字里挑选出若干个关键字，所述剩余字为所述查询语句中去除所述关键词后剩余的字，关键字能在一定程度上表征所述查询语句，从所述初始查询结果中基于所述关键字选取最终查询结果。

除去若干个所述初始查询结果中的所述关键词，得到若干个初始剩余字，将所述关键字与所述初始剩余字进行匹配，将匹配到的结果作为最终查询结果。对初始查询结果去除关键词后的初始剩余字与所述剩余字进行匹配，得到唯一的查询结果，避免了查询错误的发生。通过关键词关联程度和关键字双重查询机制，使数据信息查询简单有效，提高了查询效率，使系统流程更加便捷。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到本发明可以通过硬件实现，也可以借助软件加必要的通用硬件平台的方式来实现。基于这样的理解，本发明的技术方案可以以软件产品的形式体现出来，该软件产品可以存储在一个非易失性存储介质（可以是CD-ROM，U盘，移动硬盘等）中，包括若干指令用以使得一台计算机设备（可以是个人计算机，服务器，或者网络设备等）执行本发明各个实施场景所述的方法。

为了进一步阐述本发明的技术思想，现结合具体的应用场景，对本发明的技术方案进行说明。

该方法包括以下步骤：

步骤S101，接收数据查询请求，若所述数据查询请求为第一次查询，则根据所述数据查询请求的类型确定对应的查询区域；将每次得到的所述最终查询结果记录在历史缓存区域内；若所述数据查询请求并非是第一次查询，则根据所述数据查询请求在所述历史缓存区域内获取所述最终查询结果。

可以通过将数据查询语句转换为哈希值，并通过哈希值在所述历史缓存区域内进行检测得到最终查询结果，还可以通过其它一些手段在历史缓存区域检测得到该结果，这不影响本申请的保护范围。

步骤S102，基于所述数据查询请求获取查询语句，并将所述查询语句拆分有若干个关键词，在所述查询区域内选择出与所述关键词关联程度最高的数据作为初始查询结果。

可以提前设定查询语句含义，根据所述含义划分成若干个关键词，但需要注意的是，所述关键词要能表征查询语句。关键词的数量或长度不是保护重点，所述关键词只是查询数据的媒介或桥梁。

步骤S103，若所述初始查询结果唯一，则将所述初始查询结果作为最终查询结果并记录在所述历史缓存区域内。若所述初始查询结果不唯一，则从剩余字里挑选出若干个关键字，从所述初始查询结果中基于所述关键字选取最终查询结果。

可以提前设定查询语句含义，根据所述含义划分成若干个关键字，但需要注意的是，所述关键字要能表征查询语句。关键字的数量或长度不是保护重点，所述关键词只是查询数据的媒介或桥梁。

接收模块201，用于接收数据查询请求，若所述数据查询请求为第一次查询，则根据所述数据查询请求的类型确定对应的查询区域；

查询模块202，用于基于所述数据查询请求获取查询语句，并将所述查询语句拆分有若干个关键词，在所述查询区域内选择出与所述关键词关联程度最高的数据作为初始查询结果；

匹配模块203，用于若所述初始查询结果不唯一，则从剩余字里挑选出若干个关键字，从所述初始查询结果中基于所述关键字选取最终查询结果；

本申请一些实施例中，所述查询模块202，具体用于：

所述匹配模块203，具体用于：

本领域技术人员可以理解实施场景中的系统中的模块可以按照实施场景描述进行分布于实施场景的系统中，也可以进行相应变化位于不同于本实施场景的一个或多个系统中。上述实施场景的模块可以合并为一个模块，也可以进一步拆分成多个子模块。

最后应说明的是：以上实施例仅用以说明本申请的技术方案，而非对其限制；尽管参照前述实施例对本申请进行了详细的说明，本领域的普通技术人员当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不驱使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

Claims

1.一种基于分布式SQL的数据查询方法，其特征在于，应用于包括SQL的平台中，所述方法包括：

2.如权利要求1所述的方法，其特征在于，所述方法还包括：

将每次得到的所述最终查询结果记录在历史缓存区域内；

3.如权利要求2所述的方法，其特征在于，所述方法还包括：

4.如权利要求1所述的方法，其特征在于，基于所述数据查询请求获取查询语句，具体为：

5.如权利要求1所述的方法，其特征在于，并将所述查询语句拆分有若干个关键词，在所述查询区域内选择出与所述关键词关联程度最高的数据作为初始查询结果，具体为：

其中，S、M均为正整数，S大于M，M/S取值不大于1。

6.如权利要求1所述的方法，其特征在于，所述方法还包括：

每一个所述数据查询请求的类型对应有一个所述查询区域。

7.如权利要求1所述的方法，其特征在于，从所述初始查询结果中基于所述关键字选取最终查询结果，具体为：

8.一种基于分布式SQL的数据查询系统，其特征在于，应用于包括SQL的平台中，所述系统包括：

9.如权利要求8所述的系统，其特征在于，所述系统还包括缓存模块，用于：

将每次得到的所述最终查询结果记录在历史缓存区域内；

若所述数据查询请求并非是第一次查询，则根据所述数据查询请求在所述历史缓存区域内获取所述最终查询结果；

所述系统还包括第一查询模块，用于：

若所述初始查询结果唯一，则将所述初始查询结果作为最终查询结果并记录在所述历史缓存区域内；

所述系统还包括对应模块，用于：

每一个所述数据查询请求的类型对应有一个所述查询区域。

10.如权利要求8所述的系统，其特征在于，所述查询模块，具体用于：

所述匹配模块，具体用于：