CN114817293A - 一种基于分布式sql的数据查询方法及系统 - Google Patents

一种基于分布式sql的数据查询方法及系统 Download PDF

Info

Publication number
CN114817293A
CN114817293A CN202210330524.1A CN202210330524A CN114817293A CN 114817293 A CN114817293 A CN 114817293A CN 202210330524 A CN202210330524 A CN 202210330524A CN 114817293 A CN114817293 A CN 114817293A
Authority
CN
China
Prior art keywords
query
data
keywords
result
initial
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210330524.1A
Other languages
English (en)
Other versions
CN114817293B (zh
Inventor
王凯强
付丽丽
冉宇哲
韩杰娇
范伟宁
杨铭
谢佩辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huaneng Information Technology Co Ltd
Original Assignee
Huaneng Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huaneng Information Technology Co Ltd filed Critical Huaneng Information Technology Co Ltd
Priority to CN202210330524.1A priority Critical patent/CN114817293B/zh
Publication of CN114817293A publication Critical patent/CN114817293A/zh
Application granted granted Critical
Publication of CN114817293B publication Critical patent/CN114817293B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/242Query formulation
    • G06F16/2433Query languages
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution
    • G06F16/24552Database cache management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2471Distributed queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/27Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Fuzzy Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于分布式SQL的数据查询方法,应用于包括SQL的平台中,该方法包括:接收数据查询请求,若所述数据查询请求为第一次查询,则根据所述数据查询请求的类型确定对应的查询区域;基于所述数据查询请求获取查询语句,并将所述查询语句拆分有若干个关键词,在所述查询区域内选择出与所述关键词关联程度最高的数据作为初始查询结果;若所述初始查询结果不唯一,则从剩余字里挑选出若干个关键字,从所述初始查询结果中基于所述关键字选取最终查询结果。通过将以往查询的结果记录在所述历史缓存区域,直接将历史缓存区域内的最终查询结果调取,节省了时间。通过关键词关联程度和关键字双重查询机制,使数据信息查询简单有效,提高查询效率。

Description

一种基于分布式SQL的数据查询方法及系统
技术领域
本申请涉及数据查询技术领域,更具体地,涉及一种基于分布式SQL的数据查询方法及系统。
背景技术
结构化查询语言(Structured Query Language)简称SQL,是一种特殊目的的编程语言,是一种数据库查询和程序设计语言,用于存取数据以及查询、更新和管理关系数据库系统。
结构化查询语言是高级的非过程化编程语言,允许用户在高层数据结构上工作。它不要求用户指定对数据的存放方法,也不需要用户了解具体的数据存放方式,所以具有完全不同底层结构的不同数据库系统, 可以使用相同的结构化查询语言作为数据输入与管理的接口。结构化查询语言语句可以嵌套,这使它具有极大的灵活性和强大的功能。
现有的SQL数据查询技术中,数据查询往往要在所有数据库中进行检索,这样做查询速率大大降低。且仅仅凭借单个关键词对数据库中查询,经常得到含有某个关键词的多条数据,查询准确度非常低。
因此,如何提高查询速率和准确性,是目前有待解决的技术问题。
发明内容
本发明提供一种基于分布式SQL的数据查询方法,用以解决现有技术中数据查询速度慢且准确性低的技术问题。该方法应用于包括SQL的平台中,该方法包括:
接收数据查询请求,若所述数据查询请求为第一次查询,则根据所述数据查询请求的类型确定对应的查询区域;
基于所述数据查询请求获取查询语句,并将所述查询语句拆分有若干个关键词,在所述查询区域内选择出与所述关键词关联程度最高的数据作为初始查询结果;
若所述初始查询结果不唯一,则从剩余字里挑选出若干个关键字,从所述初始查询结果中基于所述关键字选取最终查询结果;
其中,所述剩余字为所述查询语句中去除所述关键词后剩余的字,所述关键词和所述关键字均能表征所述查询语句。
本申请一些实施例中,所述方法还包括:
将每次得到的所述最终查询结果记录在历史缓存区域内;
若所述数据查询请求并非是第一次查询,则根据所述数据查询请求在所述历史缓存区域内获取所述最终查询结果。
本申请一些实施例中,所述方法还包括:
若所述初始查询结果唯一,则将所述初始查询结果作为最终查询结果并记录在所述历史缓存区域内。
本申请一些实施例中,基于所述数据查询请求获取查询语句,具体为:
获取所述查询区域中语句的格式,将所述数据查询请求转换为与所述格式相匹配的所述查询语句。
本申请一些实施例中,并将所述查询语句拆分有若干个关键词,在所述查询区域内选择出与所述关键词关联程度最高的数据作为初始查询结果,具体为:
将所述查询语句拆分有S个所述关键词,所述查询区域内一条数据有M个所述关键词,关联程度为M/S的取值,从所述查询区域内选择M/S取值最高的数据作为初始查询结果;
其中,S、M均为正整数,S大于M,M/S取值不大于1。
本申请一些实施例中,所述方法还包括:
每一个所述数据查询请求的类型对应有一个所述查询区域。
本申请一些实施例中,从所述初始查询结果中基于所述关键字选取最终查询结果,具体为:
除去若干个所述初始查询结果中的所述关键词,得到若干个初始剩余字,将所述关键字与所述初始剩余字进行匹配,将匹配到的结果作为最终查询结果。
对应的,本申请还提供了一种基于分布式SQL的数据查询系统,该系统应用于包括SQL的平台中,该系统包括:
接收模块,用于接收数据查询请求,若所述数据查询请求为第一次查询,则根据所述数据查询请求的类型确定对应的查询区域;
查询模块,用于基于所述数据查询请求获取查询语句,并将所述查询语句拆分有若干个关键词,在所述查询区域内选择出与所述关键词关联程度最高的数据作为初始查询结果;
匹配模块,用于若所述初始查询结果不唯一,则从剩余字里挑选出若干个关键字,从所述初始查询结果中基于所述关键字选取最终查询结果;
其中,所述剩余字为所述查询语句中去除所述关键词后剩余的字,所述关键词和所述关键字均能表征所述查询语句。
本申请一些实施例中,所述查询模块,具体用于:
获取所述查询区域中语句的格式,将所述数据查询请求转换为与所述格式相匹配的所述查询语句;将所述查询语句拆分有S个所述关键词,所述查询区域内一条数据有M个所述关键词,关联程度为M/S的取值,从所述查询区域内选择M/S取值最高的数据作为初始查询结果;
所述匹配模块,具体用于:
除去若干个所述初始查询结果中的所述关键词,得到若干个初始剩余字,将所述关键字与所述初始剩余字进行匹配,将匹配到的结果作为最终查询结果。
通过应用以上技术方案,该方法包括,接收数据查询请求,若所述数据查询请求为第一次查询,则根据所述数据查询请求的类型确定对应的查询区域;基于所述数据查询请求获取查询语句,并将所述查询语句拆分有若干个关键词,在所述查询区域内选择出与所述关键词关联程度最高的数据作为初始查询结果;若所述初始查询结果不唯一,则从剩余字里挑选出若干个关键字,从所述初始查询结果中基于所述关键字选取最终查询结果。通过将以往查询的结果记录在所述历史缓存区域,发现以往相同查询请求时,直接将历史缓存区域内的最终查询结果调取,节省了查询过程中执行树的生成过程,且降低了反应时间和延迟。通过设置了关键词的关联程度,针对查询请求类型确定某一查询区域,在该区域内选择关键词关联程度最高的数据作为最终查询结果。能够快速精准的查询出所需数据信息,并非仅仅通过某个关键词来查询数据信息,使数据查询有效性得到提高。而且,若通过关联程度得到的结果不唯一,还会对初始查询结果去除关键词后的初始剩余字与所述剩余字进行匹配,得到唯一的查询结果,避免了查询错误的发生。通过关键词关联程度和关键字双重查询机制,使数据信息查询简单有效,提高了查询效率,使系统流程更加便捷。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出了本发明实施例提出的一种基于分布式SQL的数据查询方法的流程示意图;
图2示出了本发明实施例提出的一种基于分布式SQL的数据查询系统的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请提供了一种基于分布式SQL的数据查询方法,如图1所示,该方法应用于包括SQL的平台中,该方法包括以下步骤:
步骤S101,接收数据查询请求,若所述数据查询请求为第一次查询,则根据所述数据查询请求的类型确定对应的查询区域;
步骤S102,基于所述数据查询请求获取查询语句,并将所述查询语句拆分有若干个关键词,在所述查询区域内选择出与所述关键词关联程度最高的数据作为初始查询结果;
步骤S103,若所述初始查询结果不唯一,则从剩余字里挑选出若干个关键字,从所述初始查询结果中基于所述关键字选取最终查询结果。
在步骤S101中,接收数据查询请求,若所述数据查询请求为第一次查询,则根据所述数据查询请求的类型确定对应的查询区域。
本实施例中,接收客户端或平台内部发送的数据查询请求,判断所述数据查询请求是否为第一次查询,即该所述数据查询请求以往不曾查询过。根据数据查询请求的属性划分有若干个类型,每个类型对应有一个固定查询区域,据此对查询区域进行划分。基于所述数据查询请求的类型确定与其类型对应的某个查询区域。并在该区域内部进行查询。
为了提高数据查询的效率,本申请一些实施例中,所述方法还包括:将每次得到的所述最终查询结果记录在历史缓存区域内;若所述数据查询请求并非是第一次查询,则根据所述数据查询请求在所述历史缓存区域内获取所述最终查询结果。
本实施例中,以往每次查询都将最终查询结果记录在所述历史缓存区域内,当所述数据查询请求与以往请求相同时,直接从所述历史缓存区域内调取出数据信息作为最终查询结果。通过将以往查询的结果记录在所述历史缓存区域,发现以往相同查询请求时,直接将历史缓存区域内的最终查询结果调取,节省了查询过程中执行树的生成过程,且降低了反应时间和延迟。
在步骤S102中,基于所述数据查询请求获取查询语句,并将所述查询语句拆分有若干个关键词,在所述查询区域内选择出与所述关键词关联程度最高的数据作为初始查询结果。
本实施例中,将所述数据查询请求转为查询语句,该语句能够在所述查询区域内进行查询,将所述查询语句拆分有若干个关键词,所述关键词能在一定程度表征所述查询语句,注意此时,所述查询语句拆分有若干个关键词后,还剩有若干字。在所述查询区域内选择出与所述关键词关联程度最高的数据作为初始查询结果,关键词关联程度为查询区域内的数据包括上述关键词的程度,程度越高优先查询的级别越高。
为了提高数据查询的准确度,本申请一些实施例中,获取所述查询区域中语句的格式,将所述数据查询请求转换为与所述格式相匹配的所述查询语句,以此使查询语句在查询区域内的查询的适配性更高。
可以理解的是,查询区域的语句格式并非是本申请保护重点,而是查询语句格式与所述查询区域内语句格式相同,更加方便查找。不同查询区域的格式可以不同,但查询语句格式必定与对应的查询区域的格式相同,此构思点所展开的方案均属于本申请保护范围。
为了进一步提高数据查询的准确度,在本申请一些实施例中,并将所述查询语句拆分有若干个关键词,在所述查询区域内选择出与所述关键词关联程度最高的数据作为初始查询结果,具体为:将所述查询语句拆分有S个所述关键词,所述查询区域内一条数据有M个所述关键词,关联程度为M/S的取值,从所述查询区域内选择M/S取值最高的数据作为初始查询结果。
本实施例中,S、M均为正整数,S大于M,M/S取值不大于1。M个关键词全部从属于S个关键词。M/S的取值说明了查询语句与所述查询区域内语句的相关程度,M/S的取值越大,说明相关程度越高,查询区域内的该数据更加贴合查询要求。反之同理,M/S的取值越小,说明相关程度越低,查询区域内的该数据更不贴合查询要求。所以,从所述查询区域内选择M/S取值最高的数据作为初始查询结果,将关联程度最高的数据作为初始查询结果。通过设置了关键词的关联程度,针对查询请求类型确定某一查询区域,在该区域内选择关键词关联程度最高的数据作为最终查询结果。能够快速精准的查询出所需数据信息,并非仅仅通过某个关键词来查询数据信息,使数据查询有效性得到提高。
本申请一些实施例中,若所述初始查询结果唯一,则将所述初始查询结果作为最终查询结果并记录在所述历史缓存区域内。
在步骤S103中,若所述初始查询结果不唯一,则从剩余字里挑选出若干个关键字,从所述初始查询结果中基于所述关键字选取最终查询结果。
本实施例中,如果所述初始查询结果不唯一,即M/S的最大值有两条及以上的数据,则从剩余字里挑选出若干个关键字,所述剩余字为所述查询语句中去除所述关键词后剩余的字,关键字能在一定程度上表征所述查询语句,从所述初始查询结果中基于所述关键字选取最终查询结果。
本申请一些实施例中,从所述初始查询结果中基于所述关键字选取最终查询结果,具体为:
除去若干个所述初始查询结果中的所述关键词,得到若干个初始剩余字,将所述关键字与所述初始剩余字进行匹配,将匹配到的结果作为最终查询结果。对初始查询结果去除关键词后的初始剩余字与所述剩余字进行匹配,得到唯一的查询结果,避免了查询错误的发生。通过关键词关联程度和关键字双重查询机制,使数据信息查询简单有效,提高了查询效率,使系统流程更加便捷。
通过应用以上技术方案,该方法包括,接收数据查询请求,若所述数据查询请求为第一次查询,则根据所述数据查询请求的类型确定对应的查询区域;基于所述数据查询请求获取查询语句,并将所述查询语句拆分有若干个关键词,在所述查询区域内选择出与所述关键词关联程度最高的数据作为初始查询结果;若所述初始查询结果不唯一,则从剩余字里挑选出若干个关键字,从所述初始查询结果中基于所述关键字选取最终查询结果。通过将以往查询的结果记录在所述历史缓存区域,发现以往相同查询请求时,直接将历史缓存区域内的最终查询结果调取,节省了查询过程中执行树的生成过程,且降低了反应时间和延迟。通过设置了关键词的关联程度,针对查询请求类型确定某一查询区域,在该区域内选择关键词关联程度最高的数据作为最终查询结果。能够快速精准的查询出所需数据信息,并非仅仅通过某个关键词来查询数据信息,使数据查询有效性得到提高。而且,若通过关联程度得到的结果不唯一,还会对初始查询结果去除关键词后的初始剩余字与所述剩余字进行匹配,得到唯一的查询结果,避免了查询错误的发生。通过关键词关联程度和关键字双重查询机制,使数据信息查询简单有效,提高了查询效率,使系统流程更加便捷。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到本发明可以通过硬件实现,也可以借助软件加必要的通用硬件平台的方式来实现。基于这样的理解,本发明的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施场景所述的方法。
为了进一步阐述本发明的技术思想,现结合具体的应用场景,对本发明的技术方案进行说明。
该方法包括以下步骤:
步骤S101,接收数据查询请求,若所述数据查询请求为第一次查询,则根据所述数据查询请求的类型确定对应的查询区域;将每次得到的所述最终查询结果记录在历史缓存区域内;若所述数据查询请求并非是第一次查询,则根据所述数据查询请求在所述历史缓存区域内获取所述最终查询结果。
可以通过将数据查询语句转换为哈希值,并通过哈希值在所述历史缓存区域内进行检测得到最终查询结果,还可以通过其它一些手段在历史缓存区域检测得到该结果,这不影响本申请的保护范围。
步骤S102,基于所述数据查询请求获取查询语句,并将所述查询语句拆分有若干个关键词,在所述查询区域内选择出与所述关键词关联程度最高的数据作为初始查询结果。
可以提前设定查询语句含义,根据所述含义划分成若干个关键词,但需要注意的是,所述关键词要能表征查询语句。关键词的数量或长度不是保护重点,所述关键词只是查询数据的媒介或桥梁。
步骤S103,若所述初始查询结果唯一,则将所述初始查询结果作为最终查询结果并记录在所述历史缓存区域内。若所述初始查询结果不唯一,则从剩余字里挑选出若干个关键字,从所述初始查询结果中基于所述关键字选取最终查询结果。
可以提前设定查询语句含义,根据所述含义划分成若干个关键字,但需要注意的是,所述关键字要能表征查询语句。关键字的数量或长度不是保护重点,所述关键词只是查询数据的媒介或桥梁。
对应的,本申请还提供了一种基于分布式SQL的数据查询系统,该系统应用于包括SQL的平台中,该系统包括:
接收模块201,用于接收数据查询请求,若所述数据查询请求为第一次查询,则根据所述数据查询请求的类型确定对应的查询区域;
查询模块202,用于基于所述数据查询请求获取查询语句,并将所述查询语句拆分有若干个关键词,在所述查询区域内选择出与所述关键词关联程度最高的数据作为初始查询结果;
匹配模块203,用于若所述初始查询结果不唯一,则从剩余字里挑选出若干个关键字,从所述初始查询结果中基于所述关键字选取最终查询结果;
其中,所述剩余字为所述查询语句中去除所述关键词后剩余的字,所述关键词和所述关键字均能表征所述查询语句。
本申请一些实施例中,所述查询模块202,具体用于:
获取所述查询区域中语句的格式,将所述数据查询请求转换为与所述格式相匹配的所述查询语句;将所述查询语句拆分有S个所述关键词,所述查询区域内一条数据有M个所述关键词,关联程度为M/S的取值,从所述查询区域内选择M/S取值最高的数据作为初始查询结果;
所述匹配模块203,具体用于:
除去若干个所述初始查询结果中的所述关键词,得到若干个初始剩余字,将所述关键字与所述初始剩余字进行匹配,将匹配到的结果作为最终查询结果。
本领域技术人员可以理解实施场景中的系统中的模块可以按照实施场景描述进行分布于实施场景的系统中,也可以进行相应变化位于不同于本实施场景的一个或多个系统中。上述实施场景的模块可以合并为一个模块,也可以进一步拆分成多个子模块。
最后应说明的是:以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不驱使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

Claims (10)

1.一种基于分布式SQL的数据查询方法,其特征在于,应用于包括SQL的平台中,所述方法包括:
接收数据查询请求,若所述数据查询请求为第一次查询,则根据所述数据查询请求的类型确定对应的查询区域;
基于所述数据查询请求获取查询语句,并将所述查询语句拆分有若干个关键词,在所述查询区域内选择出与所述关键词关联程度最高的数据作为初始查询结果;
若所述初始查询结果不唯一,则从剩余字里挑选出若干个关键字,从所述初始查询结果中基于所述关键字选取最终查询结果;
其中,所述剩余字为所述查询语句中去除所述关键词后剩余的字,所述关键词和所述关键字均能表征所述查询语句。
2.如权利要求1所述的方法,其特征在于,所述方法还包括:
将每次得到的所述最终查询结果记录在历史缓存区域内;
若所述数据查询请求并非是第一次查询,则根据所述数据查询请求在所述历史缓存区域内获取所述最终查询结果。
3.如权利要求2所述的方法,其特征在于,所述方法还包括:
若所述初始查询结果唯一,则将所述初始查询结果作为最终查询结果并记录在所述历史缓存区域内。
4.如权利要求1所述的方法,其特征在于,基于所述数据查询请求获取查询语句,具体为:
获取所述查询区域中语句的格式,将所述数据查询请求转换为与所述格式相匹配的所述查询语句。
5.如权利要求1所述的方法,其特征在于,并将所述查询语句拆分有若干个关键词,在所述查询区域内选择出与所述关键词关联程度最高的数据作为初始查询结果,具体为:
将所述查询语句拆分有S个所述关键词,所述查询区域内一条数据有M个所述关键词,关联程度为M/S的取值,从所述查询区域内选择M/S取值最高的数据作为初始查询结果;
其中,S、M均为正整数,S大于M,M/S取值不大于1。
6.如权利要求1所述的方法,其特征在于,所述方法还包括:
每一个所述数据查询请求的类型对应有一个所述查询区域。
7.如权利要求1所述的方法,其特征在于,从所述初始查询结果中基于所述关键字选取最终查询结果,具体为:
除去若干个所述初始查询结果中的所述关键词,得到若干个初始剩余字,将所述关键字与所述初始剩余字进行匹配,将匹配到的结果作为最终查询结果。
8.一种基于分布式SQL的数据查询系统,其特征在于,应用于包括SQL的平台中,所述系统包括:
接收模块,用于接收数据查询请求,若所述数据查询请求为第一次查询,则根据所述数据查询请求的类型确定对应的查询区域;
查询模块,用于基于所述数据查询请求获取查询语句,并将所述查询语句拆分有若干个关键词,在所述查询区域内选择出与所述关键词关联程度最高的数据作为初始查询结果;
匹配模块,用于若所述初始查询结果不唯一,则从剩余字里挑选出若干个关键字,从所述初始查询结果中基于所述关键字选取最终查询结果;
其中,所述剩余字为所述查询语句中去除所述关键词后剩余的字,所述关键词和所述关键字均能表征所述查询语句。
9.如权利要求8所述的系统,其特征在于,所述系统还包括缓存模块,用于:
将每次得到的所述最终查询结果记录在历史缓存区域内;
若所述数据查询请求并非是第一次查询,则根据所述数据查询请求在所述历史缓存区域内获取所述最终查询结果;
所述系统还包括第一查询模块,用于:
若所述初始查询结果唯一,则将所述初始查询结果作为最终查询结果并记录在所述历史缓存区域内;
所述系统还包括对应模块,用于:
每一个所述数据查询请求的类型对应有一个所述查询区域。
10.如权利要求8所述的系统,其特征在于,所述查询模块,具体用于:
获取所述查询区域中语句的格式,将所述数据查询请求转换为与所述格式相匹配的所述查询语句;将所述查询语句拆分有S个所述关键词,所述查询区域内一条数据有M个所述关键词,关联程度为M/S的取值,从所述查询区域内选择M/S取值最高的数据作为初始查询结果;
所述匹配模块,具体用于:
除去若干个所述初始查询结果中的所述关键词,得到若干个初始剩余字,将所述关键字与所述初始剩余字进行匹配,将匹配到的结果作为最终查询结果。
CN202210330524.1A 2022-03-31 2022-03-31 一种基于分布式sql的数据查询方法及系统 Active CN114817293B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210330524.1A CN114817293B (zh) 2022-03-31 2022-03-31 一种基于分布式sql的数据查询方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210330524.1A CN114817293B (zh) 2022-03-31 2022-03-31 一种基于分布式sql的数据查询方法及系统

Publications (2)

Publication Number Publication Date
CN114817293A true CN114817293A (zh) 2022-07-29
CN114817293B CN114817293B (zh) 2022-11-08

Family

ID=82532838

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210330524.1A Active CN114817293B (zh) 2022-03-31 2022-03-31 一种基于分布式sql的数据查询方法及系统

Country Status (1)

Country Link
CN (1) CN114817293B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116541420A (zh) * 2023-07-07 2023-08-04 上海爱可生信息技术股份有限公司 向量数据的查询方法

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5367675A (en) * 1991-12-13 1994-11-22 International Business Machines Corporation Computer automated system and method for optimizing the processing of a query in a relational database system by merging subqueries with the query
US20030074352A1 (en) * 2001-09-27 2003-04-17 Raboczi Simon D. Database query system and method
CN108108456A (zh) * 2017-12-28 2018-06-01 重庆邮电大学 一种基于元数据的信息资源分布式查询方法
CN108804459A (zh) * 2017-05-02 2018-11-13 杭州海康威视数字技术股份有限公司 数据查询方法及装置
CN109241137A (zh) * 2018-08-27 2019-01-18 中国建设银行股份有限公司 一种联行号模糊查询方法及装置
CN109299215A (zh) * 2018-09-28 2019-02-01 平安科技(深圳)有限公司 倒排索引查询的资源分配方法、装置及存储介质、服务器
CN110489446A (zh) * 2019-09-10 2019-11-22 北京东方国信科技股份有限公司 基于分布式数据库的查询方法及装置
CN111177478A (zh) * 2019-12-24 2020-05-19 北京明略软件系统有限公司 一种查询方法、装置及系统
CN113779060A (zh) * 2021-01-26 2021-12-10 北京沃东天骏信息技术有限公司 数据查询方法和装置
CN113886420A (zh) * 2021-09-29 2022-01-04 平安国际智慧城市科技股份有限公司 Sql语句的生成方法、装置、电子设备及存储介质
CN114003619A (zh) * 2021-10-29 2022-02-01 北京房江湖科技有限公司 一种数据库查询的方法、装置、电子设备及存储介质

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5367675A (en) * 1991-12-13 1994-11-22 International Business Machines Corporation Computer automated system and method for optimizing the processing of a query in a relational database system by merging subqueries with the query
US20030074352A1 (en) * 2001-09-27 2003-04-17 Raboczi Simon D. Database query system and method
CN108804459A (zh) * 2017-05-02 2018-11-13 杭州海康威视数字技术股份有限公司 数据查询方法及装置
CN108108456A (zh) * 2017-12-28 2018-06-01 重庆邮电大学 一种基于元数据的信息资源分布式查询方法
CN109241137A (zh) * 2018-08-27 2019-01-18 中国建设银行股份有限公司 一种联行号模糊查询方法及装置
CN109299215A (zh) * 2018-09-28 2019-02-01 平安科技(深圳)有限公司 倒排索引查询的资源分配方法、装置及存储介质、服务器
CN110489446A (zh) * 2019-09-10 2019-11-22 北京东方国信科技股份有限公司 基于分布式数据库的查询方法及装置
CN111177478A (zh) * 2019-12-24 2020-05-19 北京明略软件系统有限公司 一种查询方法、装置及系统
CN113779060A (zh) * 2021-01-26 2021-12-10 北京沃东天骏信息技术有限公司 数据查询方法和装置
CN113886420A (zh) * 2021-09-29 2022-01-04 平安国际智慧城市科技股份有限公司 Sql语句的生成方法、装置、电子设备及存储介质
CN114003619A (zh) * 2021-10-29 2022-02-01 北京房江湖科技有限公司 一种数据库查询的方法、装置、电子设备及存储介质

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Y. LEPOUCHARD 等: "Performance of KDB-trees with query-based splitting", 《PROCEEDINGS. INTERNATIONAL CONFERENCE ON INFORMATION TECHNOLOGY: CODING AND COMPUTING》 *
张晨煜 等: "基于分布式数据库的相关子查询优化", 《西北工业大学学报》 *
王鸿蒙: "海量异构数据集成系统的设计与实现", 《中国优秀硕士学位论文全文数据库信息科技辑》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116541420A (zh) * 2023-07-07 2023-08-04 上海爱可生信息技术股份有限公司 向量数据的查询方法
CN116541420B (zh) * 2023-07-07 2023-09-15 上海爱可生信息技术股份有限公司 向量数据的查询方法

Also Published As

Publication number Publication date
CN114817293B (zh) 2022-11-08

Similar Documents

Publication Publication Date Title
JP5437557B2 (ja) 検索処理方法及び検索システム
US11366840B2 (en) Log-aided automatic query expansion approach based on topic modeling
CN111258966A (zh) 一种数据去重方法、装置、设备及存储介质
CN109669925B (zh) 非结构化数据的管理方法及装置
EP3499388B1 (en) Method and device for processing join query
WO2019171190A1 (en) System and method for searching based on text blocks and associated search operators
CN112162983A (zh) 数据库索引建议处理方法、装置、介质和电子设备
CN114817293B (zh) 一种基于分布式sql的数据查询方法及系统
CN111324607B (zh) Sql语句复用方法和装置
US20110113052A1 (en) Query result iteration for multiple queries
JP4237813B2 (ja) 構造化文書管理システム
CN112131214A (zh) 数据写入、数据查询的方法、系统、设备和存储介质
WO2012164738A1 (ja) データベース管理システム、装置及び方法
CN111984625B (zh) 数据库负载特征处理方法、装置、介质和电子设备
US10019483B2 (en) Search system and search method
US11720563B1 (en) Data storage and retrieval system for a cloud-based, multi-tenant application
CN116775830A (zh) 一种在线技术文档搜索方法、设备及介质
WO2022111148A1 (en) Metadata indexing for information management
CN115794861A (zh) 基于特征摘要的离线数据查询复用方法及其应用
CN114064729A (zh) 一种数据检索方法、装置、设备及存储介质
JP4091586B2 (ja) 構造化文書管理システム、索引構築方法及びプログラム
CN110659345B (zh) 事实报表的数据推送方法、装置、设备及存储介质
CN117389980B (zh) 日志文件分析方法及装置、计算机设备和可读存储介质
JPH1196170A (ja) データベース作成方法および情報検索方法および情報検索装置および記録媒体
JP4304226B2 (ja) 構造化文書管理システム、構造化文書管理方法及びプログラム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant