CN115809321B - 基于知识图谱的检索系统及方法 - Google Patents

基于知识图谱的检索系统及方法 Download PDF

Info

Publication number
CN115809321B
CN115809321B CN202211225675.7A CN202211225675A CN115809321B CN 115809321 B CN115809321 B CN 115809321B CN 202211225675 A CN202211225675 A CN 202211225675A CN 115809321 B CN115809321 B CN 115809321B
Authority
CN
China
Prior art keywords
search
expression
knowledge
retrieval
expressions
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202211225675.7A
Other languages
English (en)
Other versions
CN115809321A (zh
Inventor
刘霞
高冉
陈花竹
贺金满
陈莉
顾聪
孙旭明
罗林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhongyuan University of Technology
Original Assignee
Zhongyuan University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhongyuan University of Technology filed Critical Zhongyuan University of Technology
Priority to CN202211225675.7A priority Critical patent/CN115809321B/zh
Publication of CN115809321A publication Critical patent/CN115809321A/zh
Application granted granted Critical
Publication of CN115809321B publication Critical patent/CN115809321B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种基于知识图谱的检索系统及方法,其中,所述系统包括:获取模块,用于获取检索语句;转化模块,所述转化模块被配置成将所述检索语句转化成多个相近的检索表达式,并基于检索历史来配置每一检索表达式的被检索的频率权重;检索控制模块,按照每一检索表达式及其对应的所述频率权重形成检索控制指令,并设定每一检索控制指令在检索过程中终止指令;查询模块,与所述检索控制模块连接,基于所述检索控制指令来控制检索表达式在知识图谱库中的查询深度,并基于检索表达式在知识图谱库中查询与检索表达式相关联的知识结果;所述终止指令用于基于知识结果的可信度或知识结果的数量来判断是否终止查询。

Description

基于知识图谱的检索系统及方法
技术领域
本发明涉及信息技术技术领域,特别是涉及一种基于知识图谱的检索系统及方法。
背景技术
目前有很多学习库或者知识库都是按照多个维度来进行存储数据;比如在公开号为:“CN113190692A”公开了一种知识图谱的自适应检索方法、系统及装置;其中公开了将知识进行三维存储的方法,知识子集形成模块,用于获取多个知识单元,对知识单元进行预处理,获取知识单元所包含的至少一个知识子集、每一知识子集对应的特征码、每一特征码对应的关联码,以及每一特征码的权重值,第一存储模块,用于存储每一知识子集对应的特征码、每一特征码对应的关联码,以及每一特征码的权重值;分类模块,配置分类属性及分类属性对应的分类规则,将所述特征码写入分类属性,设置并使得待分类的知识子集具有相同的分类属性才能被分类规则分配到对应的分类单元中;知识集合形成模块,用于利用所述特征码的权重值将同一分类单元下的多个知识子集进行排列,并利用所述关联码将同一分类单元下经排列后的多个知识子集进行关联,形成一个知识集合;第二存储模块,用于存储知识集合;平面图谱形成模块,用于映射每一知识集合的所有权重值至平面图谱;三维图谱形成模块,用于将多个平面图谱按照权重值进行链接,形成三维图谱;第三存储模块,用于存储三维图谱以及三维图谱对应链接关系。
在比如公开号为:“CN108694177A”公开了一种知识图谱构建方法及系统,其中方法包括:获取待构建知识图谱的至少一个领域的语料信息;对语料信息包括的知识文本内容片段进行分词以及词性标注,获取其中的关键词;将关键词按照预设的规则与领域本体进行匹配,获取知识文本内容片段中的知识元实例、知识元实例的属性以及知识元实例之间的关联关系;领域本体包括:领域主题,领域主题包括的至少一个模型,模型的属性以及模型之间的关联关系;模型包括至少一个知识元实例;根据多个知识文本内容片段中的知识元实例、知识元实例的属性以及知识元实例之间的关联关系构建知识图谱。
与上述公开实例对应的,在进行检索时,按照关键词可以获取对应的关联关系。但是,这样的检索方式仅仅能实现对简单的词汇或者知识名词进行关联检索,在对于长语句、具有长语句的相同题型检索时,其仅能检索出一个或者2-3个相近的,不能对所有关联的进行全部检索或者在检索过程中,无法控制检索的精度。
发明内容
有鉴于此,本发明的主要目的在于提供一种基于知识图谱的检索系统及方法。
本发明采用的技术方案如下:
基于知识图谱的检索系统,包括:
获取模块,用于获取检索语句;
转化模块,所述转化模块被配置成将所述检索语句转化成多个相近的检索表达式,并基于检索历史来配置每一检索表达式的被检索的频率权重;
检索控制模块,按照每一检索表达式及其对应的所述频率权重形成检索控制指令,并设定每一检索控制指令在检索过程中终止指令;
查询模块,与所述检索控制模块连接,基于所述检索控制指令来控制检索表达式在知识图谱库中的查询深度,并基于检索表达式在知识图谱库中查询与检索表达式相关联的知识结果;所述终止指令用于基于知识结果的可信度或知识结果的数量来判断是否终止查询。
进一步地,所述转化模块包括:
拆分单元,用于将检索语句拆分成至少一个短句,标注每一短句;
提取单元,用于在每一短句中提取至少一个关键词;
组合单元,基于所述标注将所有关键词进行组合形成一个第一表达式;
混组单元,基于第一表达式,取第一表达式中的至少两个关键词进行任意组合,形成多个第二表达式;
记录单元,用于记录检索语句以及基于所述检索语句形成的第一表达式和多个第二表达式;
权重配置单元,将第一表达式和多个第二表达式逐一输入至配置库中,从所述配置库中获取与第一表达式相同的第一历史表达式,并获取第一历史表达式的第一数量,基于所述第一数量来配置第一表达式被检索的第一频率权重;和从所述配置库中获取与第二表达式相同的第二历史表达式,并获取第二历史表达式的第二数量,基于所述第二数量来配置第二表达式被检索的第二频率权重;
配置库,用于将检索语句以及基于所述检索语句形成的第一表达式和多个第二表达式存储在所述配置库中。
本发明还提供了一种基于知识图谱的检索方法,包括如下步骤:
步骤A:获取检索语句;
步骤B:将所述检索语句转化成多个相近的检索表达式,并基于检索历史来配置每一检索表达式的被检索的频率权重;
步骤C:按照每一检索表达式及其对应的所述频率权重形成检索控制指令,并设定每一检索控制指令在检索过程中终止指令;
步骤D:基于所述检索控制指令来控制检索表达式在知识图谱库中的查询深度,并基于检索表达式在知识图谱库中查询与检索表达式相关联的知识结果;所述终止指令用于基于知识结果的可信度或知识结果的数量来判断是否终止查询。
进一步地,在步骤B)中,将所述检索语句转化成多个相近的检索表达式,并基于检索历史来配置每一检索表达式的被检索的频率权重的方法如下:
将检索语句拆分成至少一个短句,标注每一短句,以记录拆分的顺序;
在每一短句中提取至少一个关键词;
基于所述标注将所有关键词进行组合形成一个第一表达式;
基于第一表达式,取第一表达式中的至少两个关键词进行任意组合,形成多个第二表达式;
将第一表达式和多个第二表达式逐一输入至配置库中,从所述配置库中获取与第一表达式相同的第一历史表达式,并获取第一历史表达式的第一数量,基于所述第一数量来配置第一表达式被检索的第一频率权重;和从所述配置库中获取与第二表达式相同的第二历史表达式,并获取第二历史表达式的第二数量,基于所述第二数量来配置第二表达式被检索的第二频率权重。
进一步地,基于所述检索控制指令来控制检索表达式在知识图谱库中的查询深度的方法为:
提取所述检索控制指令对应的所述检索表达式;
获取检索表达式对应的所述频率权重;
基于所述频率权重来确定在知识图谱库中的检索方式;
检索方式包括:
设置一检索接收端,用于接收检索表达式和检索表达式对应的所述频率权重;
设置一检索解析单元,所述检索解析单元连接检索接收端,用于基于频率权重来获取检索配置的标识符;
设置一配置单元,所述配置单元连接检索解析单元和检索接收端,用于基于对所示标识符的识别来设置检索表达式在知识图谱库中进行检索的循环周期,其中,所述配置单元还用于加载检索表达式并将检索表达式配置为以所述标识符为执行显示;
设置一执行控制单元,所述执行控制单元连接配置单元,基于所述循环周期来控制检索表达式在知识图谱库中的循环;其中,每执行一个循环周期,检索表达式在知识图谱库中进行一个存储区块的检索,并在该存储区块获取检索结果,以此来控制检索表达式在知识图谱库中的查询深度。
进一步地,所述频率权重与所述标识符一一对应。
进一步地,不同所述标识符表示为具有检索表达式在知识图谱库中进行检索的循环周期的执行显示属性。
本申请的有益效果为:
可以进行对具有长语句的句子、段落或者题型进行检索,在检索时,获取检索语句;将所述检索语句转化成多个相近的检索表达式,并基于检索历史来配置每一检索表达式的被检索的频率权重;按照每一检索表达式及其对应的所述频率权重形成检索控制指令,并设定每一检索控制指令在检索过程中终止指令;基于所述检索控制指令来控制检索表达式在知识图谱库中的查询深度,并基于检索表达式在知识图谱库中查询与检索表达式相关联的知识结果;所述终止指令用于基于知识结果的可信度或知识结果的数量来判断是否终止查询。
在上述中,本申请可以按照不同的检索表达式的被检索的频率权重来设定其在检索过程中的检索深度,以控制检索结果的精度。
同时,由于在检索过程中,将检索语句转化成多个相近的检索表达式,因此可以得到多个不同方向的检索结果。
附图说明
以下附图仅对本发明作示意性的说明和解释,并不用于限定本发明的范围,其中:
图1为本发明的框架原理图;
图2为本发明的方法流程图。
具体实施方式
为了使本发明的目的、技术方案、设计方法及优点更加清楚明了,以下结合附图通过具体实施例对本发明进一步详细说明。应当理解,此处所描述的具体实施例仅用于解释本发明,并不用于限定本发明。
本申请提供了一种基于知识图谱的检索系统及方法,该方法和系统适用于具有分类存储的结构数据库中,比如在背景技术中提及的公开号为:“CN113190692A”或者公开号为:“CN108694177A”的专利文献。同时,对以分类树为基础形成的知识图谱库也同样适用。简单的讲知识图谱库具有不同的存储区块;在每一存储区块中具有多个存储节点,每一存储节点用于具有相同表达式的数据的存储;且不同的存储节点之间,按照与存储数据的表达式的相近程度形成关联,并按照关联度来设置存储节点之间的维度。
实施例1:
基于上述所述,本申请提供了基于知识图谱的检索系统,包括:
获取模块,用于获取检索语句;
转化模块,所述转化模块被配置成将所述检索语句转化成多个相近的检索表达式,并基于检索历史来配置每一检索表达式的被检索的频率权重;
检索控制模块,按照每一检索表达式及其对应的所述频率权重形成检索控制指令,并设定每一检索控制指令在检索过程中终止指令;
查询模块,与所述检索控制模块连接,基于所述检索控制指令来控制检索表达式在知识图谱库中的查询深度,并基于检索表达式在知识图谱库中查询与检索表达式相关联的知识结果;所述终止指令用于基于知识结果的可信度或知识结果的数量来判断是否终止查询。
进一步地,所述转化模块包括:
拆分单元,用于将检索语句拆分成至少一个短句,标注每一短句;
提取单元,用于在每一短句中提取至少一个关键词;
组合单元,基于所述标注将所有关键词进行组合形成一个第一表达式;
混组单元,基于第一表达式,取第一表达式中的至少两个关键词进行任意组合,形成多个第二表达式;
记录单元,用于记录检索语句以及基于所述检索语句形成的第一表达式和多个第二表达式;
权重配置单元,将第一表达式和多个第二表达式逐一输入至配置库中,从所述配置库中获取与第一表达式相同的第一历史表达式,并获取第一历史表达式的第一数量,基于所述第一数量来配置第一表达式被检索的第一频率权重;和从所述配置库中获取与第二表达式相同的第二历史表达式,并获取第二历史表达式的第二数量,基于所述第二数量来配置第二表达式被检索的第二频率权重;
配置库,用于将检索语句以及基于所述检索语句形成的第一表达式和多个第二表达式存储在所述配置库中。
在上述中,所述查询模块具有:
检索接收端,用于接收检索表达式和检索表达式对应的所述频率权重;
检索解析单元,所述检索解析单元连接检索接收端,用于基于频率权重来获取检索配置的标识符;
配置单元,所述配置单元连接检索解析单元和检索接收端,用于基于对所示标识符的识别来设置检索表达式在知识图谱库中进行检索的循环周期,其中,所述配置单元还用于加载检索表达式并将检索表达式配置为以所述标识符为执行显示;
执行控制单元,所述执行控制单元连接配置单元,基于所述循环周期来控制检索表达式在知识图谱库中的循环;其中,每执行一个循环周期,检索表达式在知识图谱库中进行一个存储区块的检索,并在该存储区块获取检索结果,以此来控制检索表达式在知识图谱库中的查询深度。
本申请在进行检索时,按照如下的方式进行执行,获取检索语句;将检索语句拆分成至少一个短句,标注每一短句,以记录拆分的顺序;在每一短句中提取至少一个关键词;基于所述标注将所有关键词进行组合形成一个第一表达式;基于第一表达式,取第一表达式中的至少两个关键词进行任意组合,形成多个第二表达式;将第一表达式和多个第二表达式逐一输入至配置库中,从所述配置库中获取与第一表达式相同的第一历史表达式,并获取第一历史表达式的第一数量,基于所述第一数量来配置第一表达式被检索的第一频率权重;和从所述配置库中获取与第二表达式相同的第二历史表达式,并获取第二历史表达式的第二数量,基于所述第二数量来配置第二表达式被检索的第二频率权重。分别按照第一表达式和第二表达式及第一表达式和第二表达式对应的所述频率权重形成检索控制指令,并分别设定每一检索控制指令在检索过程中终止指令;提取所述检索控制指令对应的所述检索表达式;获取第一表达式和第二表达式及第一表达式和第二表达式对应的所述频率权重;基于所述频率权重来确定在知识图谱库中的检索方式;检索方式包括:
设置一检索接收端,用于第一表达式和第二表达式及第一表达式和第二表达式对应的所述频率权重对应的所述频率权重;设置一检索解析单元,所述检索解析单元连接检索接收端,用于基于频率权重来获取检索配置的标识符;
设置一配置单元,所述配置单元连接检索解析单元和检索接收端,用于基于对所示标识符的识别来设置检索表达式在知识图谱库中进行检索的循环周期,其中,所述配置单元还用于加载检索表达式并将检索表达式配置为以所述标识符为执行显示;设置一执行控制单元,所述执行控制单元连接配置单元,基于所述循环周期来控制检索表达式在知识图谱库中的循环;其中,每执行一个循环周期,检索表达式在知识图谱库中进行一个存储区块的检索,并在该存储区块获取检索结果,以此来控制检索表达式在知识图谱库中的查询深度。
本申请可以进行对具有长语句的句子、段落或者题型进行检索,在检索时,获取检索语句;将所述检索语句转化成多个相近的检索表达式,并基于检索历史来配置每一检索表达式的被检索的频率权重;按照每一检索表达式及其对应的所述频率权重形成检索控制指令,并设定每一检索控制指令在检索过程中终止指令;基于所述检索控制指令来控制检索表达式在知识图谱库中的查询深度,并基于检索表达式在知识图谱库中查询与检索表达式相关联的知识结果;所述终止指令用于基于知识结果的可信度或知识结果的数量来判断是否终止查询。在上述中,本申请可以按照不同的检索表达式的被检索的频率权重来设定其在检索过程中的检索深度,以控制检索结果的精度。同时,由于在检索过程中,将检索语句转化成多个相近的检索表达式,因此可以得到多个不同方向的检索结果。
实施例2
本发明还提供了一种基于知识图谱的检索方法,包括如下步骤:
步骤A:获取检索语句;
步骤B:将所述检索语句转化成多个相近的检索表达式,并基于检索历史来配置每一检索表达式的被检索的频率权重;
步骤C:按照每一检索表达式及其对应的所述频率权重形成检索控制指令,并设定每一检索控制指令在检索过程中终止指令;
步骤D:基于所述检索控制指令来控制检索表达式在知识图谱库中的查询深度,并基于检索表达式在知识图谱库中查询与检索表达式相关联的知识结果;所述终止指令用于基于知识结果的可信度或知识结果的数量来判断是否终止查询。
进一步地,在步骤B)中,将所述检索语句转化成多个相近的检索表达式,并基于检索历史来配置每一检索表达式的被检索的频率权重的方法如下:
将检索语句拆分成至少一个短句,标注每一短句,以记录拆分的顺序;
在每一短句中提取至少一个关键词;
基于所述标注将所有关键词进行组合形成一个第一表达式;
基于第一表达式,取第一表达式中的至少两个关键词进行任意组合,形成多个第二表达式;
将第一表达式和多个第二表达式逐一输入至配置库中,从所述配置库中获取与第一表达式相同的第一历史表达式,并获取第一历史表达式的第一数量,基于所述第一数量来配置第一表达式被检索的第一频率权重;和从所述配置库中获取与第二表达式相同的第二历史表达式,并获取第二历史表达式的第二数量,基于所述第二数量来配置第二表达式被检索的第二频率权重。
进一步地,基于所述检索控制指令来控制检索表达式在知识图谱库中的查询深度的方法为:
提取所述检索控制指令对应的所述检索表达式;
获取检索表达式对应的所述频率权重;
基于所述频率权重来确定在知识图谱库中的检索方式;
检索方式包括:
设置一检索接收端,用于接收检索表达式和检索表达式对应的所述频率权重;
设置一检索解析单元,所述检索解析单元连接检索接收端,用于基于频率权重来获取检索配置的标识符;
设置一配置单元,所述配置单元连接检索解析单元和检索接收端,用于基于对所示标识符的识别来设置检索表达式在知识图谱库中进行检索的循环周期,其中,所述配置单元还用于加载检索表达式并将检索表达式配置为以所述标识符为执行显示;
设置一执行控制单元,所述执行控制单元连接配置单元,基于所述循环周期来控制检索表达式在知识图谱库中的循环;其中,每执行一个循环周期,检索表达式在知识图谱库中进行一个存储区块的检索,并在该存储区块获取检索结果,以此来控制检索表达式在知识图谱库中的查询深度。
进一步地,所述频率权重与所述标识符一一对应。
进一步地,不同所述标识符表示为具有检索表达式在知识图谱库中进行检索的循环周期的执行显示属性。本申请在进行检索时,按照如下的方式进行执行,获取检索语句;将检索语句拆分成至少一个短句,标注每一短句,以记录拆分的顺序;在每一短句中提取至少一个关键词;基于所述标注将所有关键词进行组合形成一个第一表达式;基于第一表达式,取第一表达式中的至少两个关键词进行任意组合,形成多个第二表达式;将第一表达式和多个第二表达式逐一输入至配置库中,从所述配置库中获取与第一表达式相同的第一历史表达式,并获取第一历史表达式的第一数量,基于所述第一数量来配置第一表达式被检索的第一频率权重;和从所述配置库中获取与第二表达式相同的第二历史表达式,并获取第二历史表达式的第二数量,基于所述第二数量来配置第二表达式被检索的第二频率权重。分别按照第一表达式和第二表达式及第一表达式和第二表达式对应的所述频率权重形成检索控制指令,并分别设定每一检索控制指令在检索过程中终止指令;提取所述检索控制指令对应的所述检索表达式;
获取第一表达式和第二表达式及第一表达式和第二表达式对应的所述频率权重;基于所述频率权重来确定在知识图谱库中的检索方式;检索方式包括:
设置一检索接收端,用于第一表达式和第二表达式及第一表达式和第二表达式对应的所述频率权重对应的所述频率权重;设置一检索解析单元,所述检索解析单元连接检索接收端,用于基于频率权重来获取检索配置的标识符;
设置一配置单元,所述配置单元连接检索解析单元和检索接收端,用于基于对所示标识符的识别来设置检索表达式在知识图谱库中进行检索的循环周期,其中,所述配置单元还用于加载检索表达式并将检索表达式配置为以所述标识符为执行显示;设置一执行控制单元,所述执行控制单元连接配置单元,基于所述循环周期来控制检索表达式在知识图谱库中的循环;其中,每执行一个循环周期,检索表达式在知识图谱库中进行一个存储区块的检索,并在该存储区块获取检索结果,以此来控制检索表达式在知识图谱库中的查询深度。
本申请可以进行对具有长语句的句子、段落或者题型进行检索,在检索时,获取检索语句;将所述检索语句转化成多个相近的检索表达式,并基于检索历史来配置每一检索表达式的被检索的频率权重;按照每一检索表达式及其对应的所述频率权重形成检索控制指令,并设定每一检索控制指令在检索过程中终止指令;基于所述检索控制指令来控制检索表达式在知识图谱库中的查询深度,并基于检索表达式在知识图谱库中查询与检索表达式相关联的知识结果;所述终止指令用于基于知识结果的可信度或知识结果的数量来判断是否终止查询。在上述中,本申请可以按照不同的检索表达式的被检索的频率权重来设定其在检索过程中的检索深度,以控制检索结果的精度。同时,由于在检索过程中,将检索语句转化成多个相近的检索表达式,因此可以得到多个不同方向的检索结果。
以上已经描述了本发明的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施例的原理、实际应用或对市场中的技术改进,或者使本技术领域的其它普通技术人员能理解本文披露的各实施例。

Claims (3)

1.基于知识图谱的检索系统,其特征在于,包括:
获取模块,用于获取检索语句;
转化模块,所述转化模块被配置成将所述检索语句转化成多个相近的检索表达式,并基于检索历史来配置每一检索表达式的被检索的频率权重;
检索控制模块,按照每一检索表达式及其对应的所述频率权重形成检索控制指令,并设定每一检索控制指令在检索过程中终止指令;
查询模块,与所述检索控制模块连接,基于所述检索控制指令来控制检索表达式在知识图谱库中的查询深度,并基于检索表达式在知识图谱库中查询与检索表达式相关联的知识结果;所述终止指令用于基于知识结果的可信度或知识结果的数量来判断是否终止查询;
所述转化模块包括:
拆分单元,用于将检索语句拆分成至少一个短句,标注每一短句;
提取单元,用于在每一短句中提取至少一个关键词;
组合单元,基于所述标注将所有关键词进行组合形成一个第一表达式;
混组单元,基于第一表达式,取第一表达式中的至少两个关键词进行任意组合,形成多个第二表达式;
记录单元,用于记录检索语句以及基于所述检索语句形成的第一表达式和多个第二表达式;
权重配置单元,将第一表达式和多个第二表达式逐一输入至配置库中,从所述配置库中获取与第一表达式相同的第一历史表达式,并获取第一历史表达式的第一数量,基于所述第一数量来配置第一表达式被检索的第一频率权重;和从所述配置库中获取与第二表达式相同的第二历史表达式,并获取第二历史表达式的第二数量,基于所述第二数量来配置第二表达式被检索的第二频率权重;
配置库,用于将检索语句以及基于所述检索语句形成的第一表达式和多个第二表达式存储在所述配置库中。
2.基于知识图谱的检索方法,其特征在于,包括如下步骤:
步骤A:获取检索语句;
步骤B:将所述检索语句转化成多个相近的检索表达式,并基于检索历史来配置每一检索表达式的被检索的频率权重;
步骤C:按照每一检索表达式及其对应的所述频率权重形成检索控制指令,并设定每一检索控制指令在检索过程中终止指令;
步骤D:基于所述检索控制指令来控制检索表达式在知识图谱库中的查询深度,并基于检索表达式在知识图谱库中查询与检索表达式相关联的知识结果;所述终止指令用于基于知识结果的可信度或知识结果的数量来判断是否终止查询;
在步骤B)中,将所述检索语句转化成多个相近的检索表达式,并基于检索历史来配置每一检索表达式的被检索的频率权重的方法如下:
将检索语句拆分成至少一个短句,标注每一短句,以记录拆分的顺序;
在每一短句中提取至少一个关键词;
基于所述标注将所有关键词进行组合形成一个第一表达式;
基于第一表达式,取第一表达式中的至少两个关键词进行任意组合,形成多个第二表达式;
将第一表达式和多个第二表达式逐一输入至配置库中,从所述配置库中获取与第一表达式相同的第一历史表达式,并获取第一历史表达式的第一数量,基于所述第一数量来配置第一表达式被检索的第一频率权重;和从所述配置库中获取与第二表达式相同的第二历史表达式,并获取第二历史表达式的第二数量,基于所述第二数量来配置第二表达式被检索的第二频率权重。
3.根据权利要求2所述的基于知识图谱的检索方法,其特征在于,基于所述检索控制指令来控制检索表达式在知识图谱库中的查询深度的方法为:
提取所述检索控制指令对应的所述检索表达式;
获取检索表达式对应的所述频率权重;
基于所述频率权重来确定在知识图谱库中的检索方式;
检索方式包括:
设置一检索接收端,用于接收检索表达式和检索表达式对应的所述频率权重;
设置一检索解析单元,所述检索解析单元连接检索接收端,用于基于频率权重来获取检索配置的标识符;
设置一配置单元,所述配置单元连接检索解析单元和检索接收端,用于基于对所述标识符的识别来设置检索表达式在知识图谱库中进行检索的循环周期,其中,所述配置单元还用于加载检索表达式并将检索表达式配置为以所述标识符为执行显示;
设置一执行控制单元,所述执行控制单元连接配置单元,基于所述循环周期来控制检索表达式在知识图谱库中的循环;其中,每执行一个循环周期,检索表达式在知识图谱库中进行一个存储区块的检索,并在该存储区块获取检索结果,以此来控制检索表达式在知识图谱库中的查询深度。
CN202211225675.7A 2022-10-09 2022-10-09 基于知识图谱的检索系统及方法 Active CN115809321B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211225675.7A CN115809321B (zh) 2022-10-09 2022-10-09 基于知识图谱的检索系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211225675.7A CN115809321B (zh) 2022-10-09 2022-10-09 基于知识图谱的检索系统及方法

Publications (2)

Publication Number Publication Date
CN115809321A CN115809321A (zh) 2023-03-17
CN115809321B true CN115809321B (zh) 2023-08-04

Family

ID=85482718

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211225675.7A Active CN115809321B (zh) 2022-10-09 2022-10-09 基于知识图谱的检索系统及方法

Country Status (1)

Country Link
CN (1) CN115809321B (zh)

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107562831A (zh) * 2017-08-23 2018-01-09 中国软件与技术服务股份有限公司 一种基于全文检索的精确查找方法
CN109947952B (zh) * 2019-03-20 2021-03-02 武汉市软迅科技有限公司 基于英语知识图谱的检索方法、装置、设备及存储介质
CN111291156B (zh) * 2020-01-21 2024-01-12 同方知网(北京)技术有限公司 一种基于知识图谱的问答意图识别方法
CN113190692B (zh) * 2021-05-28 2022-06-24 山东顺势教育科技有限公司 一种知识图谱的自适应检索方法、系统及装置

Also Published As

Publication number Publication date
CN115809321A (zh) 2023-03-17

Similar Documents

Publication Publication Date Title
KR101027864B1 (ko) 대량의 전자 문서 검색을 위한 문서 관련성을 판정하기위한 기계-학습 접근법
CN110727779A (zh) 基于多模型融合的问答方法及系统
CN111353310A (zh) 基于人工智能的命名实体识别方法、装置及电子设备
CN109829104A (zh) 基于语义相似度的伪相关反馈模型信息检索方法及系统
US20100094835A1 (en) Automatic query concepts identification and drifting for web search
US20050102251A1 (en) Method of document searching
CN112527999A (zh) 引入农业领域知识的抽取式智能问答方法及系统
CN109947952B (zh) 基于英语知识图谱的检索方法、装置、设备及存储介质
CN110765277B (zh) 一种基于知识图谱的移动端的在线设备故障诊断方法
WO2001093102A1 (en) Method and apparatus for making predictions about entities represented in documents
CN111061828B (zh) 一种数字图书馆知识检索方法及装置
US20050138079A1 (en) Processing, browsing and classifying an electronic document
CN112328800A (zh) 自动生成编程规范问题答案的系统及方法
CN114238653B (zh) 一种编程教育知识图谱构建、补全与智能问答的方法
CN112328766A (zh) 一种基于路径搜索的知识图谱问答方法和装置
US20090234852A1 (en) Sub-linear approximate string match
CN111400449B (zh) 一种正则表达式抽取方法及装置
CN115563313A (zh) 基于知识图谱的文献书籍语义检索系统
CN115422372A (zh) 一种基于软件测试的知识图谱构建方法和系统
CN113190692B (zh) 一种知识图谱的自适应检索方法、系统及装置
CN114139560A (zh) 基于人工智能翻译系统
CN116049376B (zh) 一种信创知识检索回复的方法、装置和系统
CN115809321B (zh) 基于知识图谱的检索系统及方法
CN114676258B (zh) 一种基于症状描述文本的非诊断为目的的疾病分类方法
CN113468311B (zh) 一种基于知识图谱的复杂问句问答方法、装置及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant