基于知识图谱的搜索方法、装置、计算机设备和存储介质
技术领域
本申请涉及知识图谱技术领域,特别涉及一种基于知识图谱的搜索方法、装置、计算机设备和存储介质。
背景技术
目前的知识图谱的搜索只是针对搜索查询词(query)进行分词拆分,对拆分的词分别进行搜索结果召回,召回结果的质量不高,不能满足用户的查询需求。
发明内容
本申请的主要目的为提供一种基于知识图谱的搜索方法、装置、计算机设备和存储介质,旨在解决召回结果质量不高的问题。
为实现上述目的,本申请提供了一种基于知识图谱的搜索方法,包括以下步骤:
接收用户输入的第一查询语句;
对所述第一查询语句进行解析,解析出至少一个第一关键词以及获取所述第一关键词的属性;
在预设关键词-属性表中查找与所述第一关键词及所述第一关键词的属性相同的目标关键词,其中,所述预设关键词-属性表为依据预设属性维度设置的表;
若查找到所述目标关键词,则判断所述关键词-属性表中是否存在与所述目标关键词关联的第二关键词,
若存在,则从所述关键词-属性表中确定所述第二关键词以及所述第二关键词的属性;
依据所述目标关键词以及所述目标关键词的属性,和所述第二关键词以及所述第二关键词的属性分别在知识图谱中搜索。
进一步地,所述判断所述关键词-属性表中是否存在与所述目标关键词关联的第二关键词的步骤之后,包括:
若不存在,则依据所述目标关键词以及所述目标关键词的属性在所述知识图谱中搜索。
进一步地,所述依据所述目标关键词以及所述目标关键词的属性在所述知识图谱中搜索的步骤,包括:
获取所述目标关键词在所述知识图谱中的节点位置;
获取在所述节点位置中与所述目标关键词具有关联关系的第一查询词语;
将所述第一查询词语作为搜索引擎词语,在所述知识图谱中进行搜索查询。
进一步地,所述获取所述目标关键词在所述知识图谱中的节点位置的步骤之后包括:
获取所述目标关键词所在的所述节点位置所关联的下级节点,在所述下级节点中获取与所述目标关键词存在关联关系的第二查询词语。
进一步地,所述依据所述目标关键词以及所述目标关键词的属性,和所述第二关键词以及所述第二关键词的属性分别在知识图谱中搜索的步骤之后,包括:
搜索到所有对应的第一文档,以及读取所有所述第一文档的信息,其中,所述信息包括所述第一文档的标题、文字数量、与所述第一查询语句的关联度;
依据所述信息获取到转换成指定图表的转换格式代码,并将所述第一文档转换成所述指定图表;
将所述指定图表形式文件显示于展示平台上或者存储于存储库中。
本申请还提供了一种基于知识图谱的搜索装置,包括:
第一接收模块,用于接收用户输入的第一查询语句;
解析模块,用于对所述第一查询语句进行解析,解析出至少一个第一关键词以及获取所述第一关键词的属性;
查找模块,用于在预设关键词-属性表中查找与所述第一关键词及其对应的属性相同的目标关键词,其中,所述预设关键词-属性表为依据预设属性维度设置的表;
判断模块,用于若查找到所述目标关键词,则判断所述目标关键词是否存在与所述目标关键词关联的第二关键词;
第一获取模块,用于若存在,则从所述关键词-属性表中确定所述第二关键词以及所述第二关键词的属性;
第一搜索模块,用于依据所述目标关键词以及所述目标关键词的属性,和所述第二关键词以及所述第二关键词的属性分别在知识图谱中搜索。
进一步地,所述基于知识图谱的搜索装置,还包括
第二搜索模块,用于若不存在,则依据所述目标关键词以及所述目标关键词的属性在所述知识图谱中搜索。
进一步地,第一搜索模块包括:
第一获取单元,用于获取所述目标关键词在所述知识图谱中的节点位置;
第二获取单元,用于获取在所述节点位置中与所述目标关键词具有关联关系的第一查询词语;
第一搜索单元,用于将所述第一查询词语作为搜索引擎词语,在所述知识图谱中进行搜索查询。
本申请还提供一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器执行所述计算机程序时实现上述任一项所述方法的步骤。
本申请还提供一种计算机存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一项所述的方法的步骤。
本申请中提供的基于知识图谱的搜索方法、装置、计算机设备和存储介质,具有以下有益效果:
通过接收到用户输入的查询语句,对该查询语句解析出关键词以及关键词的属性,并查询是否有与上述关键词关联的其他词语,进而在知识图谱中搜索,以获取到对应的结果信息,搜索更加准确,也提高搜索的召回结果的质量。
附图说明
图1是本申请一实施例中基于知识图谱的搜索方法步骤示意图;
图2是本申请一实施例中基于知识图谱的搜索装置的结构框图;
图3是本申请一实施例的计算机设备的结构示意框图。
本申请目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
参照图1,为本申请一实施例中提供了一种基于知识图谱的搜索方法,包括以下步骤:
步骤S1,接收用户输入的第一查询语句;
步骤S2,对所述第一查询语句进行解析,解析出至少一个第一关键词以及获取所述第一关键词的属性;
步骤S3,在预设关键词-属性表中查找与所述第一关键词及所述第一关键词的属性相同的目标关键词,其中,所述关键词-属性表为依据预设属性维度设置的表;
步骤S4,若查找到所述目标关键词,则判断所述预设关键词-属性表中是否存在与所述目标关键词关联的第二关键词,
步骤S5,若存在,则从所述关键词-属性表中确定所述第二关键词以及所述第二关键词的属性;
步骤S6,依据所述目标关键词以及所述目标关键词的属性,和所述第二关键词以及所述第二关键词的属性分别在知识图谱中搜索。
以上步骤中,接收到用户输入的第一查询语句(query),对该第一查询语句进行解析,解析出至少一个第一关键词以及所述第一关键词的属性,在预设关键词-属性表中查找与所述第一关键词及第一关键词的属性相同的目标关键词,并判断在关键词-属性表中是否存在与所述目标关键词关联的第二关键词,其中,所述关键词-属性表为依据预设属性维度设置的表,每一关键词的属性是根据优先自定义领域的相关属性维度,如财政领域的相关属性维度包括产业、机构、企业、政策类别、专项监管、宏观数据指标、政府收支科目等,再根据每一属性维度抽取具体的实体节点以及关键词。若在关键词-属性表中不存在与所述目标关键词关联的第二关键词,则依据目标关键词以及目标关键词的属性在知识图谱中搜索,以获取到与目标关键对应的第一文档信息,若在关键词-属性表中存在与所述目标关键词关联的第二关键词,则从所述关键词-属性表中确定所述第二关键词以及所述第二关键词的属性,依据所述目标关键词以及所述目标关键词的属性,和所述第二关键词以及所述第二关键词的属性分别在知识图谱中搜索。
利用目标关键词的属性在ElasticSearch(基于Lucene的搜索服务器)搜索引擎系统中构建倒排索引,倒排索引源于实际应用中需要根据属性的值来查找记录,这种索引表中的每一项都包括一个属性值和具有该属性值的各记录的地址,由属性值来确定记录的位置。
当从上述查询语句中解析出至少一个第一关键词时,则在预设的关键词-属性表中获取到作为搜索查询的目标关键词。如在一具体实施例中,接收到的用户设置的属性为“机构”,其对应的目标关键词为“重庆市财政局”、“重庆市统计局”;再如接收到的属性为“专项监管”,其对应的目标关键词为“扶贫专项”、“PPP项目”,其他的目标关键词与目标关键词的属性提前预设好,根据获取到的目标关键词以及目标关键词的属性去预设的知识谱图中进行搜索查询,根据搜索查询的结果获取到对应的第一文档信息的结果。
在一具体实施例中,针对用户查询为:深圳企业所得税,解析出第一关键词为“深圳”和“企业所得税”,并获取到第一关键词对应的属性分别为地点和政策,依据上述在预设的关键词-属性表中获取到目标关键词,并获取到上述两个目标关键词的关联查询,根据目标关键词“深圳”获取到关联实体如“深圳市”、“经济开发区”、“广州”等关键词,根据目标关键词“企业所得税”获取到关联属性“政策”等,根据关联的词获取到更多的关键词,进一步补充召回结果,扩大检索范围,对召回的结果进行补充和优化,以便对所有获取到的结果进行排序,提高检索召回的结果质量。
在一实施例中,所述判断是否存在与所述目标关键词关联的第二关键词的步骤S4之后,包括:
步骤S41,若不存在,则依据所述目标关键词以及所述目标关键词的属性在所述知识图谱中搜索。
以上步骤中,若在关键词-属性表中不存在与所述目标关键词关联的第二关键词,则依据目标关键词以及目标关键词的属性在知识图谱中搜索,以获取到与目标关键对应的第一文档信息。
在本实施例中,以财政领域的知识图谱为例,预先接收到第三方设置的财政知识图谱,其中,财政知识图谱为垂直领域的知识图谱,基于财政行业数据预先构建的知识图谱,可以根据使用用户的需要或者使用需求等,对财政知识图谱中的每一节点位置处设置有指定属性对应的关键词,并对设置的关键词进行对应的关联关系,以便在接收到用户的查询语句时,获取到目标关键词的属性,根据获取到的目标关键词以及目标关键词的属性从财政知识图谱中进行关键词的检索。
由于根据用户的查询语句,预先设置好对应的属性以及目标关键词,所以在知识图谱中进行检索时,可以获取到查询query对应的目标关键词以及目标关键词的属性,根据预先设置的目标关键词的同义改写以及关联查询,进一步扩大了对查询的关键词的检索,进一步的补充了检索的召回结果。
在一实施例中,通过ansj分词原理对所述第一查询语句进行解析,预先获取到第三方设置的每一目标关键词对应的属性,目标关键词的属性是根据预设的属性维度进行定义,并根据定义的结果获取到对应具体的属性值,具体的属性值为预设属性对应的关键词。根据接收到用户输入的查询语句,通过ansj分词原理对查询语句进行分词,解析出至少一个第一关键词,并获取到每一第一关键词的属性,进而在关键词-属性表中查找到目标关键词,并根据目标关键词在知识图谱中进行搜索,其中该目标关键词与第一关键词为同一词语,以保证针对用户的查询query,无需对第一关键词做进一步的改写或者转换。
在一实施例中,所述依据所述目标关键词以及所述目标关键词的属性在所述知识图谱中搜索的步骤S5,包括:
步骤S51,获取所述目标关键词在所述知识图谱中的节点位置;
步骤S52,获取在所述节点位置中与所述目标关键词具有关联关系的第一查询词语;
步骤S53,将所述第一查询词语作为搜索引擎词语,在所述知识图谱中进行搜索查询。
以上步骤中,可以通过获取到的目标关键词,在知识图谱中搜索,包括该目标关键词节点的属性或者该关键词节点的关系关联到的下级节点,完成同义词或者下级重要关键词的召回,然后针对召回的词作查询,其中,属性/同义词或者关联关系等词语进行召回,达到了关联查询的目的,进一步的扩大查询的广度。
在本实施例,获取到关键词在知识图谱中的节点位置处,并获取到关键词在该节点位置处的属性或者该关键词所关联到的下级节点,根据节点位置处的属性或者所述关键词关联到的下级节点,获取到与关键词相似或者具有关联关系的查询词语,根据该查询词语在知识图谱中进行检索。
在一实施例中,所述获取所述目标关键词在所述知识图谱中的节点位置的步骤S51之后,包括:
步骤S511,获取所述目标关键词所在的所述节点位置所关联的下级节点,在所述下级节点中获取与所述目标关键词存在关联关系的第二查询词语。
以上步骤中,获取到目标关键词在知识图谱中的节点位置处,并获取到关键词在该节点位置处的属性或者该关键词所关联到的下级节点,根据节点位置处的属性或者所述关键词关联到的下级节点,获取到与关键词相似或者具有关联关系的查询词语,将该查询词语作为搜索引擎查询词语。
在一实施例中,所述依据所述目标关键词以及所述目标关键词的属性,和所述第二关键词以及所述第二关键词的属性分别在知识图谱中搜索的步骤S6之后,包括:
步骤S7,搜索到所有对应的第一文档,以及读取所有所述第一文档的信息,其中,所述信息包括所述第一文档的的标题、文字数量、与所述第一查询语句的关联度;
步骤S8,依据所述信息获取到转换成指定图表的转换格式代码,并将所述第一文档转换成所述指定图表;
步骤S9,将所述指定图表显示于展示平台上或者存储于存储库中。
以上步骤中,根据目标关键词在知识图谱中搜索,搜索到对应的第一文档,并根据搜索到的第一文档读取其中的信息,具体包括读取第一文档的标题、文字数量、与第一关键词语句的关联度,根据不同的字数以及关联度,获取适于该字数以及关联度的指定图标的转换格式代码,其中,预先预设好不同字数对应选择的图表,再根据与第一关键词语句的关联度获取第一文档内容的具体位置,进行进行对应的信息转化输出,以便可以显示出指定格式的文件进行展示,在一具体实施例中,可以根据第一文档的标题、文字的数量、与第一查询语句的关联度的比例等,获取到对应的转换格式代码,并依据转换格式代码将第一文档转换成指定的图标,其中指定图表形式可以是依据所述目标关键词查询结果为中心,与所述目标关键词存在关联关系的查询词语的查询结果围绕所述目标关键词查询结果的四周,如对搜索到的信息整理成表或者图,以便可以输出或导出对应格式的文件,或者显示给使用用户。
在一具体实施例中,根据使用用户的需求或者习惯,预先接收到转化结构化数据代码,该数据代码对从知识图谱中获取到的数据进行转换,以获取到指定格式的关联信息文本结构化数据,增强召回结果的可读性,以便展示的数据特征更加明了。
在其他实施例中,将获取到的结构化数据结果以及对应的文档链接进行排序,以便使用用户根据顺序进行查看,或者点击文档链接以便查看对应的文档或者下载链接所显示的信息,增强召回结果的可读性,展示的数据特征更加明了。
综上所述,为本申请实施例中提供的基于知识图谱的搜索方法,通过接收到用户输入的查询语句,对该查询语句解析出关键词以及关键词的属性,并查询是否有与上述关键词关联的其他词语,进而在知识图谱中搜索,以获取到对应的结果信息,搜索更加准确,也提高搜索的召回结果的质量。
参照图2,本申请一实施例中还提供了一种基于知识图谱的搜索装置,包括:
第一接收模块10,用于接收用户输入的第一查询语句;
解析模块20,用于对所述第一查询语句进行解析,解析出至少一个第一关键词以及获取所述第一关键词的属性;
查找模块30,用于在预设关键词-属性表中查找与所述第一关键词及其对应的属性相同的目标关键词,其中,所述预设关键词-属性表为依据预设属性维度设置的表;
判断模块40,用于若查找到所述目标关键词,则判断所述目标关键词是否存在与所述目标关键词关联的第二关键词,
第一获取模块50,用于若存在,则从所述关键词-属性表中确定所述第二关键词以及所述第二关键词的属性;
第一搜索模块60,用于依据所述目标关键词以及所述目标关键词的属性,和所述第二关键词以及所述第二关键词的属性分别在知识图谱中搜索。
本实施例中,第一接收模块10接收到用户输入的第一查询语句(query),解析模块20对该第一查询语句进行解析,解析出至少一个第一关键词以及所述第一关键词的属性,查找模块30在预设关键词-属性表中查找与所述第一关键词及第一关键词的属性相同的目标关键词,并通过判断模块40判断在关键词-属性表中是否存在与所述目标关键词关联的第二关键词,其中,所述关键词-属性表为依据预设属性维度设置的表,每一关键词的属性是根据优先自定义领域的相关属性维度,如财政领域的相关属性维度包括产业、机构、企业、政策类别、专项监管、宏观数据指标、政府收支科目等,再根据每一属性维度抽取具体的实体节点以及关键词。若在关键词-属性表中不存在与所述目标关键词关联的第二关键词,则依据目标关键词以及目标关键词的属性在知识图谱中搜索,以获取到与目标关键对应的第一文档信息,第一获取模块50若在关键词-属性表中存在与所述目标关键词关联的第二关键词,则从所述关键词-属性表中确定所述第二关键词以及所述第二关键词的属性,第一搜索模块60依据所述目标关键词以及所述目标关键词的属性,和所述第二关键词以及所述第二关键词的属性分别在知识图谱中搜索。
利用目标关键词的属性在ElasticSearch(基于Lucene的搜索服务器)搜索引擎系统中构建倒排索引,倒排索引源于实际应用中需要根据属性的值来查找记录,这种索引表中的每一项都包括一个属性值和具有该属性值的各记录的地址,由属性值来确定记录的位置。
当从上述查询语句中解析出至少一个第一关键词时,则在预设的关键词-属性表中获取到作为搜索查询的目标关键词。如在一具体实施例中,接收到的用户设置的属性为“机构”,其对应的目标关键词为“重庆市财政局”、“重庆市统计局”;再如接收到的属性为“专项监管”,其对应的目标关键词为“扶贫专项”、“PPP项目”,其他的目标关键词与目标关键词的属性提前预设好,根据获取到的目标关键词以及目标关键词的属性去预设的知识谱图中进行搜索查询,根据搜索查询的结果获取到对应的第一文档信息的结果。
在一具体实施例中,针对用户查询为:深圳企业所得税,解析出第一关键词为“深圳”和“企业所得税”,并获取到第一关键词对应的属性分别为地点和政策,依据上述在预设的关键词-属性表中获取到目标关键词,并获取到上述两个目标关键词的关联查询,根据目标关键词“深圳”获取到关联实体如“深圳市”、“经济开发区”、“广州”等关键词,根据目标关键词“企业所得税”获取到关联属性“政策”等,根据关联的词获取到更多的关键词,进一步补充召回结果,扩大检索范围,对召回的结果进行补充和优化,以便对所有获取到的结果进行排序,提高检索召回的结果质量。
在一实施例中,上述基于知识图谱的搜索装置,还包括:
第二搜索模块,用于若不存在,则依据所述目标关键词以及所述目标关键词的属性在所述知识图谱中搜索。
在本实施例中,第二搜索模块若在关键词-属性表中不存在与所述目标关键词关联的第二关键词,则依据目标关键词以及目标关键词的属性在知识图谱中搜索,以获取到与目标关键对应的第一文档信息。
在一实施例中,以财政领域的知识图谱为例,预先接收到第三方设置的财政知识图谱,其中,财政知识图谱为垂直领域的知识图谱,基于财政行业数据预先构建的知识图谱,可以根据使用用户的需要或者使用需求等,对财政知识图谱中的每一节点位置处设置有指定属性对应的关键词,并对设置的关键词进行对应的关联关系,以便在接收到用户的查询语句时,获取到目标关键词的属性,根据获取到的目标关键词以及目标关键词的属性从财政知识图谱中进行关键词的检索。
由于根据用户的查询语句,预先设置好对应的属性以及目标关键词,所以在知识图谱中进行检索时,可以获取到查询query对应的目标关键词以及目标关键词的属性,根据预先设置的目标关键词的同义改写以及关联查询,进一步扩大了对查询的关键词的检索,进一步的补充了检索的召回结果。
在一实施例中,通过ansj分词原理对所述第一查询语句进行解析,预先获取到第三方设置的每一目标关键词对应的属性,目标关键词的属性是根据预设的属性维度进行定义,并根据定义的结果获取到对应具体的属性值,具体的属性值为预设属性对应的关键词。根据接收到用户输入的查询语句,通过ansj分词原理对查询语句进行分词,解析出至少一个第一关键词,并获取到每一第一关键词的属性,进而在关键词-属性表中查找到目标关键词,并根据目标关键词在知识图谱中进行搜索,其中该目标关键词与第一关键词为同一词语,以保证针对用户的查询query,无需对第一关键词做进一步的改写或者转换。
在一实施例中,第一搜索模块包括:
第一获取单元,用于获取所述目标关键词在所述知识图谱中的节点位置;
第二获取单元,用于获取在所述节点位置中与所述目标关键词具有关联关系的第一查询词语;第一搜索单元,用于将所述第一查询词语作为搜索引擎词语,在所述知识图谱中进行搜索查询。
在本实施例中,可以通过获取到的目标关键词在知识图谱中搜索,其中,搜索包括该目标关键词节点的属性或者该关键词节点的关系关联到的下级节点,完成同义词或者下级重要关键词的召回,然后针对召回的词作查询,其中,属性/同义词或者关联关系等词语进行召回,达到了关联查询的目的,进一步的扩大查询的广度。
在本实施例,获取到关键词在知识图谱中的节点位置处,并获取到关键词在该节点位置处的属性或者该关键词所关联到的下级节点,根据节点位置处的属性或者所述关键词关联到的下级节点,获取到与关键词相似或者具有关联关系的查询词语,根据该查询词语在知识图谱中进行检索。
在一实施例中,第一搜索模块包括:
第三获取单元,用于获取所述目标关键词所在的所述节点位置所关联的下级节点,在所述下级节点中获取与所述目标关键词存在关联关系的第二查询词语。
在本实施例中,第三获取单元获取到目标关键词在知识图谱中的节点位置处,并获取到关键词在该节点位置处的属性或者该关键词所关联到的下级节点,根据节点位置处的属性或者所述关键词关联到的下级节点,获取到与关键词相似或者具有关联关系的查询词语,将该查询词语作为搜索引擎查询词语。
在一实施例中,基于知识图谱的搜索装置包括:
读取模块,用于搜索到所有对应的第一文档,以及读取所有所述第一文档的信息,其中,所述信息包括所述第一文档的的标题、文字数量、与所述第一查询语句的关联度;
转换模块,用于依据所述信息获取到转换成指定图表的转换格式代码,并将所述第一文档转换成所述指定图表;
执行模块,用于将所述指定图表显示于展示平台上或者存储于存储库中。
在本实施例中,根据目标关键词在知识图谱中搜索,读取模块搜索到对应的第一文档,并根据搜索到的第一文档读取其中的信息,具体包括读取第一文档的标题、文字数量、与第一关键词语句的关联度,根据不同的字数以及关联度,获取适于该字数以及关联度的指定图标的转换格式代码,其中,预先预设好不同字数对应选择的图表,再根据与第一关键词语句的关联度获取第一文档内容的具体位置,进行进行对应的信息转化输出,以便可以显示出指定格式的文件进行展示,在一具体实施例中,读取模块根据第一文档的标题、文字的数量、与第一查询语句的关联度的比例等,获取到对应的转换格式代码,并通过转换模块依据转换格式代码将第一文档转换成指定的图标,其中指定图表形式可以是依据所述目标关键词查询结果为中心,与所述目标关键词存在关联关系的查询词语的查询结果围绕所述目标关键词查询结果的四周,如通过转换模块对搜索到的信息整理成表或者图,以便执行模块可以输出或导出对应格式的文件,或者显示给使用用户。
在一具体实施例中,根据使用用户的需求或者习惯,预先接收到转化结构化数据代码,该数据代码对从知识图谱中获取到的数据进行转换,以获取到指定格式的关联信息文本结构化数据,增强召回结果的可读性,以便展示的数据特征更加明了。
在其他实施例中,将获取到的结构化数据结果以及对应的文档链接进行排序,以便使用用户根据顺序进行查看,或者点击文档链接以便查看对应的文档或者下载链接所显示的信息,增强召回结果的可读性,展示的数据特征更加明了。
综上所述,为本申请实施例中提供的基于知识图谱的搜索装置,通过接收到用户输入的查询语句,对该查询语句解析出关键词以及关键词的属性,并查询是否有与上述关键词关联的其他词语,进而在知识图谱中搜索,以获取到对应的结果信息,搜索更加准确,也提高搜索的召回结果的质量。
参照图3,本申请实施例中还提供一种计算机设备,该计算机设备可以是服务器,其内部结构可以如图3所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设计的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储关键词-属性表等数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种基于知识图谱的搜索方法。
上述处理器执行上述基于知识图谱的搜索方法的步骤:
接收用户输入的第一查询语句;
对所述第一查询语句进行解析,解析出至少一个第一关键词以及获取所述第一关键词的属性;
在预设关键词-属性表中查找与所述第一关键词及所述第一关键词的属性相同的目标关键词,其中,所述预设关键词-属性表为依据预设属性维度设置的表;
若查找到所述目标关键词,则判断所述关键词-属性表中是否存在与所述目标关键词关联的第二关键词,
若存在,则从所述关键词-属性表中确定所述第二关键词以及所述第二关键词的属性;
依据所述目标关键词以及所述目标关键词的属性,和所述第二关键词以及所述第二关键词的属性分别在知识图谱中搜索。
在一实施例中,所述处理器判断所述关键词-属性表中是否存在与所述目标关键词关联的第二关键词的步骤之后,包括:
若不存在,则依据所述目标关键词以及所述目标关键词的属性在所述知识图谱中搜索。
在一实施例中,所述处理器依据所述目标关键词以及所述目标关键词的属性在所述知识图谱中搜索的步骤,包括:
获取所述目标关键词在所述知识图谱中的节点位置;
获取在所述节点位置中与所述目标关键词具有关联关系的第一查询词语;
将所述第一查询词语作为搜索引擎词语,在所述知识图谱中进行搜索查询。
在一实施例中,所述处理器获取所述目标关键词在所述知识图谱中的节点位置的步骤之后包括:
获取所述目标关键词所在的所述节点位置所关联的下级节点,在所述下级节点中获取与所述目标关键词存在关联关系的第二查询词语。
在一实施例中,所述处理器依据所述目标关键词以及所述目标关键词的属性,和所述第二关键词以及所述第二关键词的属性分别在知识图谱中搜索的步骤之后,包括:
搜索到所有对应的第一文档,以及读取所有所述第一文档的信息,其中,所述信息包括所述第一文档的标题、文字数量、与所述第一查询语句的关联度;
依据所述信息获取到转换成指定图表的转换格式代码,并将所述第一文档转换成所述指定图表;
将所述指定图表形式文件显示于展示平台上或者存储于存储库中。
本领域技术人员可以理解,图3中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定。
本申请一实施例还提供一种计算机存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现一种基于知识图谱的搜索方法,具体为:
接收用户输入的第一查询语句;
对所述第一查询语句进行解析,解析出至少一个第一关键词以及获取所述第一关键词的属性;
在预设关键词-属性表中查找与所述第一关键词及所述第一关键词的属性相同的目标关键词,其中,所述预设关键词-属性表为依据预设属性维度设置的表;
若查找到所述目标关键词,则判断所述关键词-属性表中是否存在与所述目标关键词关联的第二关键词,
若存在,则从所述关键词-属性表中确定所述第二关键词以及所述第二关键词的属性;
依据所述目标关键词以及所述目标关键词的属性,和所述第二关键词以及所述第二关键词的属性分别在知识图谱中搜索。
在一实施例中,所述处理器判断所述关键词-属性表中是否存在与所述目标关键词关联的第二关键词的步骤之后,包括:
若不存在,则依据所述目标关键词以及所述目标关键词的属性在所述知识图谱中搜索。
在一实施例中,所述处理器依据所述目标关键词以及所述目标关键词的属性在所述知识图谱中搜索的步骤,包括:
获取所述目标关键词在所述知识图谱中的节点位置;
获取在所述节点位置中与所述目标关键词具有关联关系的第一查询词语;
将所述第一查询词语作为搜索引擎词语,在所述知识图谱中进行搜索查询。
在一实施例中,所述处理器获取所述目标关键词在所述知识图谱中的节点位置的步骤之后包括:
获取所述目标关键词所在的所述节点位置所关联的下级节点,在所述下级节点中获取与所述目标关键词存在关联关系的第二查询词语。
在一实施例中,所述处理器依据所述目标关键词以及所述目标关键词的属性,和所述第二关键词以及所述第二关键词的属性分别在知识图谱中搜索的步骤之后,包括:
搜索到所有对应的第一文档,以及读取所有所述第一文档的信息,其中,所述信息包括所述第一文档的标题、文字数量、与所述第一查询语句的关联度;
依据所述信息获取到转换成指定图表的转换格式代码,并将所述第一文档转换成所述指定图表;
将所述指定图表形式文件显示于展示平台上或者存储于存储库中。
综上所述,为本申请实施例中提供的基于知识图谱的搜索方法、装置、计算机设备和存储介质,通过接收到用户输入的查询语句,对该查询语句解析出关键词以及关键词的属性,并查询是否有与上述关键词关联的其他词语,进而在知识图谱中搜索,以获取到对应的结果信息,搜索更加准确,也提高搜索的召回结果的质量。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储与一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的和实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可以包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM通过多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双速据率SDRAM(SSRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其它变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素,而且还包括没有明确列出的其它要素,或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。
以上所述仅为本申请的优选实施例,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其它相关的技术领域,均同理包括在本申请的专利保护范围内。