CN116383233B - 一种分布式数据库高速检索方法及系统 - Google Patents
一种分布式数据库高速检索方法及系统 Download PDFInfo
- Publication number
- CN116383233B CN116383233B CN202310291416.2A CN202310291416A CN116383233B CN 116383233 B CN116383233 B CN 116383233B CN 202310291416 A CN202310291416 A CN 202310291416A CN 116383233 B CN116383233 B CN 116383233B
- Authority
- CN
- China
- Prior art keywords
- search
- database
- keywords
- databases
- search result
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 47
- 238000006243 chemical reaction Methods 0.000 claims abstract description 114
- 238000013500 data storage Methods 0.000 claims abstract description 15
- 238000013441 quality evaluation Methods 0.000 claims description 16
- 230000007547 defect Effects 0.000 claims description 13
- 238000011002 quantification Methods 0.000 claims description 9
- 238000011156 evaluation Methods 0.000 claims description 7
- 230000003213 activating effect Effects 0.000 claims description 5
- 238000004590 computer program Methods 0.000 claims description 2
- 238000012545 processing Methods 0.000 abstract description 6
- 238000003058 natural language processing Methods 0.000 description 23
- 238000010586 diagram Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 238000013139 quantization Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/242—Query formulation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/27—Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Computing Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种分布式数据库高速检索方法及系统,应用于数据处理技术领域,该方法包括:通过获取数据库类型,基于数据库类型进行数据库识别,获取多组数据库。基于多组数据库进行分布式连接,生成第一分布式数据库,对布式数据库进行访问配置。获取第一检索指令的请求信息,根据第一检索指令中的目标检索数据库的数据存储格式,采用NLP同义处理器对检索关键字进行对应转换,生成基于目标检索数据库分别对应的转换关键字。基于转换关键字对目标检索数据库进行检索,获取第一检索结果。解决了现有技术中数据库检索存在检索速度低,检索进度缓慢的技术问题。
Description
技术领域
本发明涉及数据处理领域,尤其涉及一种分布式数据库高速检索方法及系统。
背景技术
随着互联网的发展产生了大量的数据,而数据库作为数据存储的载体存放着大量的互联网数据,比如文本数据、图像数据、音频数据、文件数据等。然而在现有技术中数据库检索采用分区遍历的方式,查找对应的检索信息,导致数据库检索速度低,检索进度缓慢的问题。
因此,在现有技术中数据库检索存在检索速度低,检索进度缓慢的技术问题。
发明内容
本申请通过提供一种分布式数据库高速检索方法及系统,解决了在现有技术中数据库检索存在检索速度低,检索过程复杂的技术问题。
本申请提供一种分布式数据库高速检索方法,所述方法应用于分布式数据库高速检索系统,所述系统与NLP同义处理器通信连接,所述方法包括:获取多个数据库对应的数据库类型;基于所述多个数据库对应的数据库类型进行数据库识别,获取多组数据库,其中,每组数据库的数据源格式相同;基于所述多组数据库进行分布式连接,生成第一分布式数据库;对所述第一分布式数据库进行访问配置,得到分布式访问配置参数集;获取第一检索指令的请求信息,其中,所述第一检索指令的请求信息包括目标检索数据库和检索关键字,且所述目标检索数据库的数量至少为1;根据所述第一检索指令中的所述目标检索数据库的数据存储格式,采用NLP同义处理器对所述检索关键字进行对应转换,生成基于所述目标检索数据库分别对应的转换关键字;基于所述转换关键字对所述目标检索数据库进行检索,获取第一检索结果。
本申请还提供了一种分布式数据库高速检索系统,所述系统与NLP同义处理器通信连接,所述系统包括:数据库类型获取模块,用于获取多个数据库对应的数据库类型;多组数据库获取模块,用于基于所述多个数据库对应的数据库类型进行数据库识别,获取多组数据库,其中,每组数据库的数据源格式相同;第一分布式数据库生成模块,用于基于所述多组数据库进行分布式连接,生成第一分布式数据库;访问参数集配置模块,用于对所述第一分布式数据库进行访问配置,得到分布式访问配置参数集;第一检索指令获取模块,用于获取第一检索指令的请求信息,其中,所述第一检索指令的请求信息包括目标检索数据库和检索关键字,且所述目标检索数据库的数量至少为1;检索关键字转换模块,用于根据所述第一检索指令中的所述目标检索数据库的数据存储格式,采用NLP同义处理器对所述检索关键字进行对应转换,生成基于所述目标检索数据库分别对应的转换关键字;检索结果获取模块,用于基于所述转换关键字对所述目标检索数据库进行检索,获取第一检索结果。
本申请还提供了一种电子设备,包括:
存储器,用于存储可执行指令;
处理器,用于执行所述存储器中存储的可执行指令时,实现本申请实施例提供的一种分布式数据库高速检索方法。
本申请实施例提供一种计算机可读存储介质,存储有计算机程序,该程序被处理器执行时,实现本申请实施例提供的一种分布式数据库高速检索方法。
拟通过本申请提出的一种分布式数据库高速检索方法及系统,通过获取数据库类型,基于数据库类型进行数据库识别,获取多组数据库。基于多组数据库进行分布式连接,生成第一分布式数据库,对布式数据库进行访问配置。获取第一检索指令的请求信息,根据第一检索指令中的目标检索数据库的数据存储格式,采用NLP同义处理器对检索关键字进行对应转换,生成基于目标检索数据库分别对应的转换关键字。基于转换关键字对目标检索数据库进行检索,获取第一检索结果。实现了对检索人员的检索关键字进行处理,基于同义处理器对所述检索关键字进行转换,使得计算机可以直接在数据库中查找对应的转换关键字,提高了数据库的检索效率。解决了现有技术中数据库检索存在检索速度低,检索进度缓慢的技术问题。
上述说明仅是本申请技术方案的概述,为了能够更清楚了解本申请的技术手段,而可依照说明书的内容予以实施,并且为了让本申请的上述和其它目的、特征和优点能够更明显易懂,以下特举本申请的具体实施方式。
附图说明
为了更清楚地说明本公开实施例的技术方案,下面将对本公开实施例的附图作简单地介绍。明显地,下面描述中的附图仅仅涉及本公开的一些实施例,而非对本公开的限制。
图1为本申请实施例提供的一种分布式数据库高速检索方法的流程示意图;
图2为本申请实施例提供的一种分布式数据库高速检索方法输出所述转换关键字的流程示意图;
图3为本申请实施例提供的一种分布式数据库高速检索方法获取第二检索结果的流程示意图;
图4为本申请实施例提供的一种分布式数据库高速检索方法的系统的结构示意图;
图5为本发明实施例提供的一种分布式数据库高速检索方法的系统电子设备的结构示意图。
附图标记说明:数据库类型获取模块11,多组数据库获取模块12,第一分布式数据库生成模块13,访问参数集配置模块14,第一检索指令获取模块15,检索关键字转换模块16,检索结果获取模块17,处理器31,存储器32,输入装置33,输出装置34。
具体实施方式
实施例一
为了使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请作进一步地详细描述,所描述的实施例不应视为对本申请的限制,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本申请保护的范围。
在以下的描述中,涉及到“一些实施例”,其描述了所有可能实施例的子集,但是可以理解,“一些实施例”可以是所有可能实施例的相同子集或不同子集,并且可以在不冲突的情况下相互结合。
在以下的描述中,所涉及的术语“第一\第二\第三”仅仅是区别类似的对象,不代表针对对象的特定排序,可以理解地,“第一\第二\第三”在允许的情况下可以互换特定的顺序或先后次序,以使这里描述的本申请实施例能够以除了在这里图示或描述的以外的顺序实施。
除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同。本文中所使用的术语只是为了描述本申请实施例的目的。
虽然本申请对根据本申请的实施例的系统中的某些模块做出了各种引用,然而,任何数量的不同模块可以被使用并运行在用户终端和/或服务器上,所述模块仅是说明性的,并且所述系统和方法的不同方面可以使用不同模块。
本申请中使用了流程图来说明根据本申请的实施例的系统所执行的操作。应当理解的是,前面或下面操作不一定按照顺序来精确地执行。相反,根据需要,可以按照倒序或同时处理各种步骤。同时,也可以将其他操作添加到这些过程中,或从这些过程移除某一步或数步操作。
如图1所示,本申请实施例提供了一种分布式数据库高速检索方法,所述方法应用于分布式数据库高速检索系统,所述系统与NLP同义处理器通信连接,所述方法包括:
S10:获取多个数据库对应的数据库类型;
S20:基于所述多个数据库对应的数据库类型进行数据库识别,获取多组数据库,其中,每组数据库的数据源格式相同;
S30:基于所述多组数据库进行分布式连接,生成第一分布式数据库;
具体的,获取多个数据库对应的数据库类型,其中数据库类型为数据库存储数据的类型,如图形数据库、文档型数据库、时序数据库等不同类别的数据库类型。随后,基于多个数据库对应的数据库类型进行数据库识别,根据数据库类型进行分组,将相同类型的数据库归为一组,获取多组数据库,其中,每组数据库的数据源格式相同。进一步,基于多组数据库进行分布式连接,每一组数据库作为一个分布区块完成分布式连接,完成对所有组别的数据库的连接,生成第一分布式数据库。
S40:对所述第一分布式数据库进行访问配置,得到分布式访问配置参数集;
S50:获取第一检索指令的请求信息,其中,所述第一检索指令的请求信息包括目标检索数据库和检索关键字,且所述目标检索数据库的数量至少为1;
S60:根据所述第一检索指令中的所述目标检索数据库的数据存储格式,采用NLP同义处理器对所述检索关键字进行对应转换,生成基于所述目标检索数据库分别对应的转换关键字;
S70:基于所述转换关键字对所述目标检索数据库进行检索,获取第一检索结果。
具体的,对第一分布式数据库进行访问配置,即对各数据库组别以及包含的数据库进行具体的访问配置,包括数据库名称、位置等其他进行数据库定位的信息配置,得到分布式访问配置参数集。随后,获取第一检索指令的请求信息,其中,所述第一检索指令的请求信息包括目标检索数据库和检索关键字,其中检索关键词为检索对象的描述特征,且所述目标检索数据库的数量至少为1。进一步,根据第一检索指令中的所述目标检索数据库的数据存储格式,采用NLP同义处理器对所述检索关键字进行对应转换,生成基于所述目标检索数据库分别对应的转换关键字。其中NLP为自然语言处理,将检索人员的语言转换程计算机可以直接利用的符号,将检索关键字转换为计算机可以进行检索的转换关键字。基于所述转换关键字对所述目标检索数据库进行文件的标签匹配检索,获取输出的所有检索结果得到第一检索结果。通过对检索人员的检索关键字进行处理,通过同义处理器对所述检索关键字进行转换,使得计算机可以直接在数据库中查找对应的转换关键字,提高了数据库的检索效率。
如图2所示,本申请实施例提供的方法S50还包括:
S51:当所述目标检索数据库的数量大于1时,基于所述第一分布式数据库,判断所述目标检索数据库中的数据库是否为同一组数据库;
S52:若所述目标检索数据库中的数据库为同一组数据库,以对应数据库组的数据存储格式获取第一转换模板;
S53:将所述检索关键字输入所述第一转换模板中进行关键字格式转换,输出所述转换关键字。
具体的,当目标检索数据库的数量大于1时,则基于第一分布式数据库,判断所述目标检索数据库中的数据库是否为同一组数据库。若所述目标检索数据库中的数据库为同一组数据库,此时检索关键字可以共同应用于相同类别文件的检索中。则以对应数据库组中的数据存储格式获取第一转换模板,其中第一转换模板用于对检索关键字进行NLP转换,获取转换后的关键字,并通过关键字在数据库中查找对应的数据。将所述检索关键字输入所述第一转换模板中进行关键字格式转换,输出所述转换关键字。其中,转换模板为预设的与数据库组别相对应的转换模板,以文档型数据库为例对应的转换模板则包括存储时间、名称、文档类型、文档大小等,以图片型数据库为例对应的转换模板则包括图片存储格式、时间、图片内容等此处的转换模板仅做示例,具体转换模板可以根据实际需求进行设置。通过将所述检索关键字输入所述第一转换模板中进行关键字格式转换,输出所述转换关键字。
本申请实施例提供的方法S50还包括:
S54:若所述目标检索数据库中的数据库为不同组数据库,获取基于所述目标检索数据库的分组结果;
S55:以所述目标检索数据库的分组结果,得到多组转换模板,将所述多组转换模板输入所述NLP同义处理器;
S56:基于所述NLP同义处理器,对所述检索关键字进行多组转换模板的关键字格式转换,输出所述转换关键字。
具体的,若目标检索数据库中的数据库为不同组数据库,则获取基于所述目标检索数据库的分组结果,即对目标检索数据库进行对应的数据库组获取。以所述目标检索数据库的分组结果,得到对应分组结果的多组转换模板,将所述多组转换模板输入所述NLP同义处理器。基于所述NLP同义处理器,对所述检索关键字进行多组转换模板的关键字格式转换,输出所述转换关键字。
如图3所示,本申请实施例提供的方法S70还包括:
S71:对所述第一检索结果进行评估,获取检索结果质量指数;
S72:判断所述检索结果质量指数是否满足预设检索结果质量指数,若所述检索结果质量指数不满足所述预设检索结果质量指数,激活二次检索指令;
S73:以所述二次检索指令,获取第二检索结果。
具体的,对第一检索结果进行评估,获取检索结果质量指数,其中检索质量指数通过将检索结果输入检索质量评估模型获取具体的检索质量指数。判断获取的检索结果质量指数是否满足预设检索结果质量指数,预设检索结果质量指数为技术人员预先设定的质量指数,当满足预设检索结果质量指数时则对应检索质量较高检索的匹配度较高,相应的检索的信任度高。当检索结果质量指数不满足所述预设检索结果质量指数时对应检索质量较低检索的匹配度较低,相应的检索的信任度低。当检索结果质量指数不满足所述预设检索结果质量指数时,则激活二次检索指令。通过二次检索指令,在数据库中进行二次检索,获取第二检索结果。避免检索的结果较差,保障用户的检索准确率。
本申请实施例提供的方法S70还包括:
S74:以所述二次检索指令,对所述检索关键字进行关键字特征分析,获取关键字特征集合;
S75:以所述关键字特征集合,获取同义检索关键字;
S76:采用所述NLP同义处理器对所述检索关键字和所述同义检索关键字进行转换,输出转换关键字和同义转换关键字;
S77:以所述转换关键字和所述同义转换关键字对所述目标检索数据库进行检索,获取第二检索结果。
具体的,以所述二次检索指令,获取第二检索结果具体包括,基于二次检索指令,对所述检索关键字进行关键字特征分析,提取其中的关键字,获取关键字特征集合。关键字提取通过现有技术中关键字提取方法进行提取。以关键字特征集合,获取关键字的同义字,得到同义关键字特征集合。基于获取的关键字特征集合,获取同义检索关键字。进一步,采用NLP同义处理器对所述检索关键字和所述同义检索关键字进行转换,输出转换关键字和同义转换关键字。最后,以所述转换关键字和所述同义转换关键字对所述目标检索数据库进行检索,获取第二检索结果。实现了当检索结果较差时,可以通过同义检索来对结果进行修正,保证检索结果获取的准确性。
本申请实施例提供的方法S71还包括:
S711:将所述第一检索结果输入检索质量评估模型中,其中,所述检索质量评估模型包括检索数据量化性、检索数据缺陷度以及检索数据有效率;
S712:基于所述检索数据量化性、所述检索数据缺陷度以及所述检索数据有效率对所述第一检索结果进行多指标评估,得到所述检索结果质量指数。
具体的,在对第一检索结果进行评估,获取检索结果质量指数时,通过将第一检索结果输入检索质量评估模型中,其中,所述检索质量评估模型包括检索数据量化性、检索数据缺陷度以及检索数据有效率。其中检索数据量化性为转换关键字的数量,检索数据缺陷度为转换关键字数量和转换模板中关键词数量的比值,由于转换关键字数量可能小于或等于转换模板中关键词数量,当小于转换模板中关键词数量时则转换关键字数量存在缺陷,获取转换关键字数量和转换模板中关键词数量的比值即为检索数据缺陷度。检索数据有效率为检索数据中的对应匹配标签数量与转换关键字数量的比值,其中匹配标签数量为文件中标签与转换关键字的匹配数量,由于在进行数据检索时采用标签与转换关键字数量进行匹配,当匹配标签数量与转换关键字数量的比值越高时则对应的检索数据有效率越高,对应的匹配标签数量越多。检索数据有效率体现检索文件中标签与转换关键字的匹配程度。最后,基于所述检索数据量化性、所述检索数据缺陷度以及所述检索数据有效率对所述第一检索结果进行多指标评估,在进行多指标评估时通过获取所述检索数据缺陷度以及所述检索数据有效率的乘积,得到所述检索结果质量指数。实现了对检索结果质量的综合评估,为后续选择检索结果提供了数据支持。
本申请实施例提供的方法S71还包括:
S713:获取所述同义检索关键字,得到同义检索结果;
S714:将所述同义检索结果输入所述检索质量评估模型,得到同义检索结果质量指数;
S715:通过比对所述检索结果质量指数与所述同义检索结果质量指数,得到第一同义优度,将所述第一同义优度添加至所述第二检索结果中。
具体的,获取同义检索关键字,得到同义检索结果,即利用同义检索关键字在数据库中进行同义检索,获取同义检索结果。随后,将同义检索结果输入所述检索质量评估模型,获取同义检索结果质量指数。通过比对所述检索结果质量指数与所述同义检索结果质量指数,得到第一同义优度,即比对检索结果质量指数与所述同义检索结果质量指数获取其中检索结果质量较高的指数,得到第一同义优度,在第一同义优度中包含检索结果质量较高指数对应的检索结果。最后,将第一同义优度添加至所述第二检索结果中。实现了对同义检索结果的扩充,保障了检索结果的丰富性以及准确性。
本发明实施例所提供的技术方案,通过获取多个数据库对应的数据库类型。基于所述多个数据库对应的数据库类型进行数据库识别,获取多组数据库,其中,每组数据库的数据源格式相同。基于所述多组数据库进行分布式连接,生成第一分布式数据库。对所述第一分布式数据库进行访问配置,得到分布式访问配置参数集。获取第一检索指令的请求信息,其中,所述第一检索指令的请求信息包括目标检索数据库和检索关键字,且所述目标检索数据库的数量至少为1。根据所述第一检索指令中的所述目标检索数据库的数据存储格式,采用NLP同义处理器对所述检索关键字进行对应转换,生成基于所述目标检索数据库分别对应的转换关键字。基于所述转换关键字对所述目标检索数据库进行检索,获取第一检索结果。通过对检索人员的检索关键字进行处理,通过同义处理器对所述检索关键字进行转换,使得计算机可以直接在数据库中查找对应的转换关键字,提高了数据库的检索效率。解决了现有技术中数据库检索存在检索速度低,检索进度缓慢的技术问题。
实施例二
基于与前述实施例中一种分布式数据库高速检索方法同样发明构思,本发明还提供了一种分布式数据库高速检索方法的系统,系统可以由硬件和/或软件的方式来实现,一般可集成于电子设备中,用于执行本发明任意实施例所提供的方法。如图4所示,所述系统与NLP同义处理器通信连接,所述系统包括:
数据库类型获取模块11,用于获取多个数据库对应的数据库类型;
多组数据库获取模块12,用于基于所述多个数据库对应的数据库类型进行数据库识别,获取多组数据库,其中,每组数据库的数据源格式相同;
第一分布式数据库生成模块13,用于基于所述多组数据库进行分布式连接,生成第一分布式数据库;
访问参数集配置模块14,用于对所述第一分布式数据库进行访问配置,得到分布式访问配置参数集;
第一检索指令获取模块15,用于获取第一检索指令的请求信息,其中,所述第一检索指令的请求信息包括目标检索数据库和检索关键字,且所述目标检索数据库的数量至少为1;
检索关键字转换模块16,用于根据所述第一检索指令中的所述目标检索数据库的数据存储格式,采用NLP同义处理器对所述检索关键字进行对应转换,生成基于所述目标检索数据库分别对应的转换关键字;
检索结果获取模块17,用于基于所述转换关键字对所述目标检索数据库进行检索,获取第一检索结果。
进一步地,所述第一检索指令获取模块15还用于:
当所述目标检索数据库的数量大于1时,基于所述第一分布式数据库,判断所述目标检索数据库中的数据库是否为同一组数据库;
若所述目标检索数据库中的数据库为同一组数据库,以对应数据库组的数据存储格式获取第一转换模板;
将所述检索关键字输入所述第一转换模板中进行关键字格式转换,输出所述转换关键字。
进一步地,所述第一检索指令获取模块15还用于:
若所述目标检索数据库中的数据库为不同组数据库,获取基于所述目标检索数据库的分组结果;
以所述目标检索数据库的分组结果,得到多组转换模板,将所述多组转换模板输入所述NLP同义处理器;
基于所述NLP同义处理器,对所述检索关键字进行多组转换模板的关键字格式转换,输出所述转换关键字。
进一步地,所述检索结果获取模块17还用于:
对所述第一检索结果进行评估,获取检索结果质量指数;
判断所述检索结果质量指数是否满足预设检索结果质量指数,若所述检索结果质量指数不满足所述预设检索结果质量指数,激活二次检索指令;
以所述二次检索指令,获取第二检索结果。
进一步地,所述检索结果获取模块17还用于:
以所述二次检索指令,对所述检索关键字进行关键字特征分析,获取关键字特征集合;
以所述关键字特征集合,获取同义检索关键字;
采用所述NLP同义处理器对所述检索关键字和所述同义检索关键字进行转换,输出转换关键字和同义转换关键字;
以所述转换关键字和所述同义转换关键字对所述目标检索数据库进行检索,获取第二检索结果。
进一步地,所述检索结果获取模块17还用于:
将所述第一检索结果输入检索质量评估模型中,其中,所述检索质量评估模型包括检索数据量化性、检索数据缺陷度以及检索数据有效率;
基于所述检索数据量化性、所述检索数据缺陷度以及所述检索数据有效率对所述第一检索结果进行多指标评估,得到所述检索结果质量指数。
进一步地,所述检索结果获取模块17还用于:
获取所述同义检索关键字,得到同义检索结果;
将所述同义检索结果输入所述检索质量评估模型,得到同义检索结果质量指数;
通过比对所述检索结果质量指数与所述同义检索结果质量指数,得到第一同义优度,将所述第一同义优度添加至所述第二检索结果中。
所包括的各个单元和模块只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。
实施例三
图5为本发明实施例三提供的电子设备的结构示意图,示出了适于用来实现本发明实施方式的示例性电子设备的框图。图5显示的电子设备仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。如图5所示,该电子设备包括处理器31、存储器32、输入装置33及输出装置34;电子设备中处理器31的数量可以是一个或多个,图5中以一个处理器31为例,电子设备中的处理器31、存储器32、输入装置33及输出装置34可以通过总线或其他方式连接,图5中以通过总线连接为例。
存储器32作为一种计算机可读存储介质,可用于存储软件程序、计算机可执行程序以及模块,如本发明实施例中的一种分布式数据库高速检索方法对应的程序指令/模块。处理器31通过运行存储在存储器32中的软件程序、指令以及模块,从而执行计算机设备的各种功能应用以及数据处理,即实现上述一种分布式数据库高速检索方法。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。
Claims (6)
1.一种分布式数据库高速检索方法,其特征在于,所述方法应用于分布式数据库高速检索系统,所述系统与NLP同义处理器通信连接,所述方法包括:
获取多个数据库对应的数据库类型;
基于所述多个数据库对应的数据库类型进行数据库识别,获取多组数据库,其中,每组数据库的数据源格式相同;
基于所述多组数据库进行分布式连接,生成第一分布式数据库;
对所述第一分布式数据库进行访问配置,得到分布式访问配置参数集;
获取第一检索指令的请求信息,其中,所述第一检索指令的请求信息包括目标检索数据库和检索关键字,且所述目标检索数据库的数量至少为1;
根据所述第一检索指令中的所述目标检索数据库的数据存储格式,采用NLP同义处理器对所述检索关键字进行对应转换,生成基于所述目标检索数据库分别对应的转换关键字;
基于所述转换关键字对所述目标检索数据库进行检索,获取第一检索结果;
其中,所述获取第一检索结果之后,方法还包括:
对所述第一检索结果进行评估,获取检索结果质量指数;
判断所述检索结果质量指数是否满足预设检索结果质量指数,若所述检索结果质量指数不满足所述预设检索结果质量指数,激活二次检索指令;
以所述二次检索指令,获取第二检索结果;
以所述二次检索指令,获取第二检索结果,方法还包括:
以所述二次检索指令,对所述检索关键字进行关键字特征分析,获取关键字特征集合;
以所述关键字特征集合,获取同义检索关键字;
采用所述NLP同义处理器对所述检索关键字和所述同义检索关键字进行转换,输出转换关键字和同义转换关键字;
以所述转换关键字和所述同义转换关键字对所述目标检索数据库进行检索,获取第二检索结果;
对所述第一检索结果进行评估,获取检索结果质量指数,方法还包括:
将所述第一检索结果输入检索质量评估模型中,其中,所述检索质量评估模型包括检索数据量化性、检索数据缺陷度以及检索数据有效率;
基于所述检索数据量化性、所述检索数据缺陷度以及所述检索数据有效率对所述第一检索结果进行多指标评估,得到所述检索结果质量指数;
其中,所述方法还包括:
获取所述同义检索关键字,得到同义检索结果;
将所述同义检索结果输入所述检索质量评估模型,得到同义检索结果质量指数;
通过比对所述检索结果质量指数与所述同义检索结果质量指数,得到第一同义优度,将所述第一同义优度添加至所述第二检索结果中。
2.如权利要求1所述的方法,其特征在于,所述方法还包括:
当所述目标检索数据库的数量大于1时,基于所述第一分布式数据库,判断所述目标检索数据库中的数据库是否为同一组数据库;
若所述目标检索数据库中的数据库为同一组数据库,以对应数据库组的数据存储格式获取第一转换模板;
将所述检索关键字输入所述第一转换模板中进行关键字格式转换,输出所述转换关键字。
3.如权利要求2所述的方法,其特征在于,判断所述目标检索数据库中的数据库是否为同一组数据库之后,方法还包括:
若所述目标检索数据库中的数据库为不同组数据库,获取基于所述目标检索数据库的分组结果;
以所述目标检索数据库的分组结果,得到多组转换模板,将所述多组转换模板输入所述NLP同义处理器;
基于所述NLP同义处理器,对所述检索关键字进行多组转换模板的关键字格式转换,输出所述转换关键字。
4.一种分布式数据库高速检索系统,其特征在于,所述系统与NLP同义处理器通信连接,所述系统包括:
数据库类型获取模块,用于获取多个数据库对应的数据库类型;
多组数据库获取模块,用于基于所述多个数据库对应的数据库类型进行数据库识别,获取多组数据库,其中,每组数据库的数据源格式相同;
第一分布式数据库生成模块,用于基于所述多组数据库进行分布式连接,生成第一分布式数据库;
访问参数集配置模块,用于对所述第一分布式数据库进行访问配置,得到分布式访问配置参数集;
第一检索指令获取模块,用于获取第一检索指令的请求信息,其中,所述第一检索指令的请求信息包括目标检索数据库和检索关键字,且所述目标检索数据库的数量至少为1;
检索关键字转换模块,用于根据所述第一检索指令中的所述目标检索数据库的数据存储格式,采用NLP同义处理器对所述检索关键字进行对应转换,生成基于所述目标检索数据库分别对应的转换关键字;
检索结果获取模块,用于基于所述转换关键字对所述目标检索数据库进行检索,获取第一检索结果;
所述检索结果获取模块还用于:
对所述第一检索结果进行评估,获取检索结果质量指数;
判断所述检索结果质量指数是否满足预设检索结果质量指数,若所述检索结果质量指数不满足所述预设检索结果质量指数,激活二次检索指令;
以所述二次检索指令,获取第二检索结果;
所述检索结果获取模块还用于:
以所述二次检索指令,对所述检索关键字进行关键字特征分析,获取关键字特征集合;
以所述关键字特征集合,获取同义检索关键字;
采用所述NLP同义处理器对所述检索关键字和所述同义检索关键字进行转换,输出转换关键字和同义转换关键字;
以所述转换关键字和所述同义转换关键字对所述目标检索数据库进行检索,获取第二检索结果;
所述检索结果获取模块还用于:
将所述第一检索结果输入检索质量评估模型中,其中,所述检索质量评估模型包括检索数据量化性、检索数据缺陷度以及检索数据有效率;
基于所述检索数据量化性、所述检索数据缺陷度以及所述检索数据有效率对所述第一检索结果进行多指标评估,得到所述检索结果质量指数;
所述检索结果获取模块还用于:
获取所述同义检索关键字,得到同义检索结果;
将所述同义检索结果输入所述检索质量评估模型,得到同义检索结果质量指数;
通过比对所述检索结果质量指数与所述同义检索结果质量指数,得到第一同义优度,将所述第一同义优度添加至所述第二检索结果中。
5.一种电子设备,其特征在于,所述电子设备包括:
存储器,用于存储可执行指令;
处理器,用于执行所述存储器中存储的可执行指令时,实现权利要求1至3任一项所述的一种分布式数据库高速检索方法。
6.一种计算机可读介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-3中任一所述的一种分布式数据库高速检索方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310291416.2A CN116383233B (zh) | 2023-03-23 | 2023-03-23 | 一种分布式数据库高速检索方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310291416.2A CN116383233B (zh) | 2023-03-23 | 2023-03-23 | 一种分布式数据库高速检索方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116383233A CN116383233A (zh) | 2023-07-04 |
CN116383233B true CN116383233B (zh) | 2024-01-19 |
Family
ID=86978074
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310291416.2A Active CN116383233B (zh) | 2023-03-23 | 2023-03-23 | 一种分布式数据库高速检索方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116383233B (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112632307A (zh) * | 2019-12-26 | 2021-04-09 | 珠海大横琴科技发展有限公司 | 一种检索精度评价方法 |
CN113297251A (zh) * | 2021-05-31 | 2021-08-24 | 深信服科技股份有限公司 | 多源数据检索方法、装置、设备及存储介质 |
CN113946594A (zh) * | 2021-12-22 | 2022-01-18 | 昆仑智汇数据科技(北京)有限公司 | 一种工业多源异构数据的集成查询方法、装置及设备 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10970326B2 (en) * | 2016-11-16 | 2021-04-06 | Fanuc Corporation | Retrieving device, retrieving method, and retrieving program |
-
2023
- 2023-03-23 CN CN202310291416.2A patent/CN116383233B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112632307A (zh) * | 2019-12-26 | 2021-04-09 | 珠海大横琴科技发展有限公司 | 一种检索精度评价方法 |
CN113297251A (zh) * | 2021-05-31 | 2021-08-24 | 深信服科技股份有限公司 | 多源数据检索方法、装置、设备及存储介质 |
CN113946594A (zh) * | 2021-12-22 | 2022-01-18 | 昆仑智汇数据科技(北京)有限公司 | 一种工业多源异构数据的集成查询方法、装置及设备 |
Non-Patent Citations (1)
Title |
---|
基于同义词扩展的文本检索改进研究;赵医娟 等;中国教育技术装备;95-96 * |
Also Published As
Publication number | Publication date |
---|---|
CN116383233A (zh) | 2023-07-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111159330B (zh) | 一种数据库查询语句的生成方法及装置 | |
EP3968245A1 (en) | Automatically generating a pipeline of a new machine learning project from pipelines of existing machine learning projects stored in a corpus | |
EP3968244A1 (en) | Automatically curating existing machine learning projects into a corpus adaptable for use in new machine learning projects | |
CN117112595A (zh) | 一种信息查询方法、装置、电子设备及存储介质 | |
CN112632264A (zh) | 智能问答方法、装置、电子设备及存储介质 | |
CN111984745A (zh) | 数据库字段动态扩展方法、装置、设备及存储介质 | |
CN111258905A (zh) | 缺陷定位方法、装置和电子设备及计算机可读存储介质 | |
CN115576983A (zh) | 一种语句生成方法、装置、电子设备及介质 | |
EP3965024A1 (en) | Automatically labeling functional blocks in pipelines of existing machine learning projects in a corpus adaptable for use in new machine learning projects | |
CN114995729A (zh) | 一种语音绘图方法、装置及计算机设备 | |
CN117573955A (zh) | 一种基于大语言能力的自动题解生成方法及装置 | |
CN114297535A (zh) | 查询条件的页面展示方法、装置、设备及存储介质 | |
CN116383233B (zh) | 一种分布式数据库高速检索方法及系统 | |
CN117371406A (zh) | 基于大型语言模型的注释生成方法、装置、设备及介质 | |
EP4254279A1 (en) | Machine learning pipeline augmented with explanation | |
CN116719950A (zh) | 基于知识图谱子图检索的智能问答方法及系统 | |
CN114625889A (zh) | 一种语义消歧方法、装置、电子设备及存储介质 | |
CN112214494B (zh) | 检索方法及装置 | |
CN114328844A (zh) | 一种文本数据集管理方法、装置、设备及存储介质 | |
CN114116779A (zh) | 基于深度学习的电网调控领域信息检索方法、系统和介质 | |
CN112612945B (zh) | 一种分类搜索的方法和装置 | |
US11392358B1 (en) | Machine learning pipeline skeleton instantiation | |
EP4050524A2 (en) | Machine learning pipeline skeleton instantiation | |
US20220269982A1 (en) | Machine learning pipeline skeleton instantiation | |
WO2023168659A1 (zh) | 一种横跨图数据与关系数据的实体对识别方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |