CN113139389B - 基于动态优化的图模型语义查询扩展方法和装置 - Google Patents

基于动态优化的图模型语义查询扩展方法和装置 Download PDF

Info

Publication number
CN113139389B
CN113139389B CN202110474807.9A CN202110474807A CN113139389B CN 113139389 B CN113139389 B CN 113139389B CN 202110474807 A CN202110474807 A CN 202110474807A CN 113139389 B CN113139389 B CN 113139389B
Authority
CN
China
Prior art keywords
concept node
description information
dimension
compared
similarity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110474807.9A
Other languages
English (en)
Other versions
CN113139389A (zh
Inventor
潘颖
李雄
苏乾祥
王茗岩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanning Normal University
Original Assignee
Nanning Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanning Normal University filed Critical Nanning Normal University
Priority to CN202110474807.9A priority Critical patent/CN113139389B/zh
Publication of CN113139389A publication Critical patent/CN113139389A/zh
Application granted granted Critical
Publication of CN113139389B publication Critical patent/CN113139389B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • G06F16/9024Graphs; Linked lists
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/194Calculation of difference between files

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例公开了基于动态优化的图模型语义查询扩展方法和装置。该方法包括:根据用户的查询需求,构造初始查询图,初始查询图具有目标概念节点;获取待比较概念节点;目标概念节点和待比较概念节点均具有多个维度的描述信息;计算目标概念节点与待比较概念节点之间的第一语义相似度,当达到第一预设相似度,根据各维度的描述信息,分别计算各维度的第二语义相似度;当任一维度的第二语义相似度达到相应维度的第二预设相似度,将待比较概念节点的描述信息作为目标概念节点的扩展描述信息;在初始查询图上,基于目标概念节点在至少一个维度的扩展描述信息,生成扩展查询图。基于该方法和装置,可以实现基于图模型的语义查询的动态扩展。

Description

基于动态优化的图模型语义查询扩展方法和装置
技术领域
本发明实施例涉及语义信息检索技术领域,尤其涉及基于动态优化的图模型语义查询扩展方法、装置、电子设备和存储介质。
背景技术
传统的信息搜索通过用户提交的查询关键词进行查询,获得包含关键词的信息,由于搜索引擎和搜索过程缺乏语义的支持,难于获得不含关键词但和关键词语义相关的隐含信息。此外,由于认知及表述的不足,用户的查询需求往往是模糊、不明确的,需要从背景知识、搜索内容等相关语义层面对初始查询需求加以分析修正,以便获取合适的查询结果。
针对上述问题,通常采用语义查询扩展技术来解决。语义查询扩展是指将用户的初始查询词的同义词、近义词、层次关系等作为扩展词,组合成新的查询,最后搜索引擎对新查询进行处理,返回查询结果。特别的,在动态搜索场景中,系统通常会对一个初始查询进行改进,使用语义信息或约束条件对其进行修正和扩展,从而使初始请求更加精确,最终获取更全面、更准确的查询结果。例如,搜索数据库课程中的“关系模型”教学资源时,通过对“关系模型”的语义扩展,查询结果不仅包括该知识点的资源,也包括父类知识点“数据模型”,同类/同层次知识点“层次模型”、“网状模型”,子类知识点“字段”及其等价知识点“属性”等相关资源。
然而,对于高频率更新的数据,当前语义查询扩展方法还有较大的提升空间:1)现有的大多数研究缺乏支持动态数据搜索,难于及时优化和调整用户的查询需求,导致查询效果不佳;2)存在搜索语义歧义性大的问题,复杂语义的描述能力较低,通常需要耗费较高的成本对数据进行语义扩展后,才能提供有效的语义查询;3)目前存在大量采用图模型描述的数据,然而针对图模型的语义查询扩展方法较繁琐,扩展查询图的构造成本较高。
发明内容
本发明实施例的一个目的是解决至少上述问题和/或缺陷,并提供至少后面将说明的优点。
本发明实施例提供了基于动态优化的图模型语义查询扩展方法、装置、电子设备和存储介质,其可以实现基于图模型的语义查询的动态扩展,提高查询效率以及查询结果的准确度。
第一方面,提供了一种基于动态优化的图模型语义查询扩展方法,包括:
根据用户的查询需求,构造初始查询图,其中,所述初始查询图具有目标概念节点;
从已建立的知识库中获取待比较概念节点;其中,所述目标概念节点和所述待比较概念节点均具有多个维度的描述信息;
计算所述目标概念节点与所述待比较概念节点之间的第一语义相似度;
当所述第一语义相似度达到第一预设相似度,根据所述目标概念节点和所述待比较概念节点的各维度的描述信息,分别计算所述目标概念节点与所述待比较概念节点之间各维度的第二语义相似度;
当任一维度的第二语义相似度达到相应维度的第二预设相似度,将所述待比较概念节点在相应维度的描述信息作为所述目标概念节点在相应维度的扩展描述信息;
在所述初始查询图上,基于所述目标概念节点在至少一个维度的扩展描述信息,生成扩展查询图。
可选地,所述多个维度的描述信息包括节点名称维度、属性维度、属性值维度和/或属性-属性值对维度的描述信息。
可选地,各维度的描述信息由词语表示;
所述计算所述目标概念节点与所述待比较概念节点之间的第一语义相似度,包括:
根据所述目标概念节点与所述待比较概念节点的表示所述多个维度的描述信息的词语,计算所述目标概念节点与所述待比较概念节点之间的第一语义相似度。
可选地,所述在所述初始查询图上,基于所述目标概念节点在至少一个维度的扩展描述信息,生成扩展查询图,包括:
从所述目标概念节点在至少一个维度的扩展描述信息中,依次选取各维度的一个扩展描述信息,构造至少一个扩展描述信息组合;
在所述初始查询图上,根据各扩展描述信息组合,生成各扩展查询图。
可选地,所述初始查询图具有用于表示所述目标概念节点与其他概念节点之间的关系的边;所述方法还包括:
计算所述目标概念节点与所述待比较概念节点之间的关系相似度;
当所述关系相似度达到第三预设相似度,将所述待比较概念节点所连接的边作为所述目标概念节点的扩展边;
所述在所述初始查询图上,基于所述目标概念节点在至少一个维度的扩展描述信息,生成扩展查询图,包括:
在所述初始查询图上,基于所述目标概念节点在至少一个维度的扩展描述信息以及至少一个扩展边,生成扩展查询图。
可选地,所述计算所述目标概念节点与所述待比较概念节点之间的关系相似度,包括:
根据所述目标概念节点与所述待比较概念节点所连接的边的关系类型,以及所述目标概念节点的邻居概念节点与所述待比较概念节点的邻居概念节点之间的第三语义相似度,计算所述目标概念节点与所述待比较概念节点之间的关系相似度。
可选地,所述在所述初始查询图上,基于所述目标概念节点在至少一个维度的扩展描述信息以及至少一个扩展边,生成扩展查询图,包括:
从所述目标概念节点在至少一个维度的扩展描述信息以及所述至少一个扩展边中,依次选取各维度的一个扩展描述信息以及一个扩展边,构造至少一个扩展描述信息组合;
在所述初始查询图上,根据各扩展描述信息组合,生成各扩展查询图。
可选地,所述从所述目标概念节点在至少一个维度的扩展描述信息中,依次选取各维度的一个扩展描述信息,构造至少一个扩展描述信息组合,包括:
根据所述目标概念节点与所述待比较概念节点之间各维度的第二语义相似度以及所述目标概念节点与所述待比较概念节点之间的关系相似度,计算所述目标概念节点与所述待比较概念节点之间的总相似度;
当所述目标概念节点与所述待比较概念节点之间的总相似度达到第四预设相似度,从所述目标概念节点在至少一个维度的扩展描述信息以及所述至少一个扩展边中,依次选取各维度的一个扩展描述信息以及一个扩展边,构造至少一个扩展描述信息组合,所构造的所述至少一个扩展描述组合包含所述至少一个维度的全部扩展描述信息以及全部扩展边;
当所述目标概念节点与所述待比较概念节点之间的总相似度低于第四预设相似度,从所述目标概念节点在至少一个维度的扩展描述信息以及所述至少一个扩展边中,依次选取各维度的一个扩展描述信息以及一个扩展边,构造至少一个扩展描述信息组合,所构造的所述至少一个扩展描述组合包含所述至少一个维度的部分扩展描述信息以及部分扩展边。
第二方面,提供了一种基于动态优化的图模型语义查询扩展装置,包括:
初始查询图构造模块,用于根据用户的查询需求,构造初始查询图,其中,所述初始查询图具有目标概念节点;
待比较概念节点获取模块,用于从已建立的知识库中获取待比较概念节点;其中,所述目标概念节点和所述待比较概念节点均具有多个维度的描述信息;
第一语义相似度计算模块,用于计算所述目标概念节点与所述待比较概念节点之间的第一语义相似度;
第二语义相似度计算模块,用于当所述第一语义相似度达到第一预设相似度,根据所述目标概念节点和所述待比较概念节点的各维度的描述信息,分别计算所述目标概念节点与所述待比较概念节点之间各维度的第二语义相似度;
扩展描述信息选取模块,用于当任一维度的第二语义相似度达到相应维度的第二预设相似度,将所述待比较概念节点在相应维度的描述信息作为所述目标概念节点在相应维度的扩展描述信息;
扩展查询图生成模块,用于在所述初始查询图上,基于所述目标概念节点在至少一个维度的扩展描述信息,生成扩展查询图。
可选地,所述多个维度的描述信息包括节点名称维度、属性维度、属性值维度和/或属性-属性值对维度的描述信息。
可选地,各维度的描述信息由词语表示;
所述第一语义相似度计算模块,具体用于:
根据所述目标概念节点与所述待比较概念节点的表示所述多个维度的描述信息的词语,计算所述目标概念节点与所述待比较概念节点之间的第一语义相似度。
可选地,所述扩展查询图生成模块,包括:
从所述目标概念节点在至少一个维度的扩展描述信息中,依次选取各维度的一个扩展描述信息,构造至少一个扩展描述信息组合;
在所述初始查询图上,根据各扩展描述信息组合,生成各扩展查询图。
可选地,所述初始查询图具有用于表示所述目标概念节点与其他概念节点之间的关系的边;所述装置还包括:
关系相似度计算模块,用于计算所述目标概念节点与所述待比较概念节点之间的关系相似度;
扩展边选取模块,用于当所述关系相似度达到第三预设相似度,将所述待比较概念节点所连接的边作为所述目标概念节点的扩展边;
所述扩展查询图生成模块,具体用于:
在所述初始查询图上,基于所述目标概念节点在至少一个维度的扩展描述信息以及至少一个扩展边,生成扩展查询图。
可选地,所述关系相似度计算模块,具体用于:
根据所述目标概念节点与所述待比较概念节点所连接的边的关系类型,以及所述目标概念节点的邻居概念节点与所述待比较概念节点的邻居概念节点之间的第三语义相似度,计算所述目标概念节点与所述待比较概念节点之间的关系相似度。
可选地,所述扩展查询图生成模块,包括:
扩展描述信息组合子模块,用于从所述目标概念节点在至少一个维度的扩展描述信息以及所述至少一个扩展边中,依次选取各维度的一个扩展描述信息以及一个扩展边,构造至少一个扩展描述信息组合;
扩展查询图生成子模块,用于在所述初始查询图上,根据各扩展描述信息组合,生成各扩展查询图。
可选地,所述扩展描述信息组合子模块,包括:
总相似度计算单元,用于根据所述目标概念节点与所述待比较概念节点之间各维度的第二语义相似度以及所述目标概念节点与所述待比较概念节点之间的关系相似度,计算所述目标概念节点与所述待比较概念节点之间的总相似度;
扩展描述信息组合单元,用于当所述目标概念节点与所述待比较概念节点之间的总相似度达到第四预设相似度,从所述目标概念节点在至少一个维度的扩展描述信息以及所述至少一个扩展边中,依次选取各维度的一个扩展描述信息以及一个扩展边,构造至少一个扩展描述信息组合,所构造的所述至少一个扩展描述组合包含所述至少一个维度的全部扩展描述信息以及全部扩展边;当所述目标概念节点与所述待比较概念节点之间的总相似度低于第四预设相似度,从所述目标概念节点在至少一个维度的扩展描述信息以及所述至少一个扩展边中,依次选取各维度的一个扩展描述信息以及一个扩展边,构造至少一个扩展描述信息组合,所构造的所述至少一个扩展描述组合包含所述至少一个维度的部分扩展描述信息以及部分扩展边。
第三方面,提供了一种电子设备,包括:至少一个处理器,以及与所述至少一个处理器通信连接的存储器,其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器执行以上所述的方法。
第四方面,提供了一种存储介质,其上存储有计算机程序,该程序被处理器执行时,实现以上所述的方法。
本发明实施例至少包括以下有益效果:
本发明实施例提供的基于动态优化的图模型语义查询扩展方法和装置,首先根据用户的查询需求,构造初始查询图,其中,初始查询图具有目标概念节点,从已建立的知识库中获取待比较概念节点,其中,目标概念节点和待比较概念节点均具有多个维度的描述信息,然后计算目标概念节点与待比较概念节点之间的第一语义相似度,当第一语义相似度达到第一预设相似度,根据目标概念节点和待比较概念节点的各维度的描述信息,分别计算目标概念节点与待比较概念节点之间各维度的第二语义相似度,当任一维度的第二语义相似度达到相应维度的第二预设相似度,将待比较概念节点在相应维度的描述信息作为目标概念节点在相应维度的扩展描述信息,最后在初始查询图上,基于目标概念节点在至少一个维度的扩展描述信息,生成扩展查询图。基于该方法和装置,可以实现基于图模型的语义查询的动态扩展,提高查询效率以及查询结果的准确度。
本发明实施例的其它优点、目标和特征将部分通过下面的说明体现,部分还将通过对本发明实施例的研究和实践而为本领域的技术人员所理解。
附图说明
图1本发明一个实施例提供的基于动态优化的图模型语义查询扩展方法的流程图;
图2为本发明另一个实施例提供的基于动态优化的图模型语义查询扩展方法的流程图;
图3为本发明又一个实施例提供的基于动态优化的图模型语义查询扩展方法的流程图;
图4为本发明一个实施例提供的基于动态优化的图模型语义查询扩展装置的结构示意图;
图5为本发明一个实施例提供的电子设备的结构示意图。
具体实施方式
下面结合附图对本发明实施例做进一步的详细说明,以令本领域技术人员参照说明书文字能够据以实施。
实施例一
图1为本发明实施例提供的基于动态优化的图模型语义查询扩展方法的流程图,该方法由具有处理能力的系统、服务端设备或基于动态优化的图模型语义查询扩展装置执行。如图1所示,上述方法包括:
步骤110,根据用户的查询需求,构造初始查询图,其中,所述初始查询图具有目标概念节点。
根据用户的查询需求,可以提取与用户的查询需求相关的概念以及概念间关系。这里,在语义查询中,概念可以理解为对客观世界中事物属性的抽象概括,也可以用于表示具体事物。例如,当用户的查询需求为查询姓名为“张三”的信息,可以从该查询需求中提取出“张三”这一概念。当用户的查询需求为查询“张三”和“李四”之间的共同好友,则可以从该查询需求中提取出“张三”和“李四”两个概念,同时这两个概念之间的关系为好友关系。
根据从用户的查询需求中所提取的概念以及概念间关系,同时还从用户的查询需求中提取用于对概念进行描述的描述信息以及用于对概念间关系进行描述的描述信息,基于所提取的内容,可以构造出初始查询图。在初始查询图中,使用概念节点(也可以简称为“节点”)表示概念,使用边连接两个概念节点,用于表示两个概念节点所对应的概念间的关系,根据用于描述概念的描述信息设置概念节点不同维度的描述信息,例如节点名称以及属性-属性值对等,根据用于描述概念间关系的描述信息设置边的描述信息,例如边的标签、属性等。这里,从用户的查询需求中提取概念、概念间关系、用于对概念进行描述的描述信息以及用于对概念间关系进行描述的描述信息等内容的过程,可以是基于用户的查询词语、语句进行语义分析所获得的,本发明实施例对于语义分析的方法和过程不做具体限定。
本发明实施例中通用图模型G的定义可以为:图模型G由节点和边组成,记为G:=(N,E),其中N为节点集{N1,...,Nk},节点Ni由属性-属性值对组成,记为
Figure BDA0003046617990000081
设A为N的属性集合,V为N的属性值的集合,则有属性-属性值对
Figure BDA0003046617990000082
1≤k≤n。特别地,当节点
Figure BDA0003046617990000083
时,称Ni为空节点。当节点存在属性-属性值对(a,v),但a或v不确定时,可设为null值,记为(null,v)或(a,null)。E是带标签的边的集合,边记为(Ni,Nk,L),其中Ni,Nk∈N,分别表示边的引入节点和引出节点,i≠k,L表示边的标签,且L可为null值。标签用于表示边的关系类型,例如好友关系,父子关系,租售关系,买卖关系等等。采用由节点(属性-属性值对)和带标签的边一起组成的图模型,能够描述多粒度、异构的内容及其概念间关系,特别地,空节点和空标签增强了对不确定信息的描述能力,能方便描述模糊、不确定的信息。例如,用户在图模型G上的查询需求为查询姓名为“张三”的信息,则构造的初始查询图包含有属性-属性值对(姓名,′张三′)的一个节点,该节点的节点名称可以也设置为“张三”。
应该理解的是,当从未从查询需求中提取出概念间关系时,初始查询图可以只包含表示概念的节点;当从查询需求中同时提取出多个概念以及概念间关系,初始查询图可以既包括节点,还包括连接这些节点的边。
因此,当仅从用户的查询需求中提取出概念,而未提取概念间关系时,对于用户的查询需求的扩展过程,可以理解为对于用户的查询需求相关的概念的扩展过程,进而可以演化为在其他的知识库中查找与初始查询图中查询需求相关概念所对应的概念节点符合一定的相似性条件的概念节点的过程。当从用户的查询需求中提取出概念以及概念间关系,则对于用户的查询需求的扩展过程,可以理解为对于用户的查询需求相关的概念以及概念间关系的扩展过程,进而可以演化为在其他的知识库中查找与初始查询图中查询需求相关概念所对应的概念节点以及概念节点之间的边符合一定的相似性条件的概念节点以及概念节点之间的边的过程。
步骤120,从已建立的知识库中获取待比较概念节点;其中,所述目标概念节点和所述待比较概念节点均具有多个维度的描述信息。
这里,已建立的知识库用于基于图模型对知识进行存储和管理,即使用概念节点表示概念,使用边连接两个概念节点,用于表示两个概念节点所对应的概念间的关系。已建立的知识库可以是已建立的本体库、知识图谱、维基百科等,本发明实施例对此不做具体限定。
初始查询图中的概念节点和已建立的知识库中的概念节点均具有多个维度的描述信息。在一些实施例中,所述多个维度的描述信息包括节点名称维度、属性维度、属性值维度和/或属性-属性值对维度的描述信息。即,将初始查询图中的概念节点所具备的节点名称、属性、属性值、属性-属性值对等数据视为对于该节点的描述信息,换句话说,这些描述信息分别是从各自的维度对节点加以描述,使其区别于初始查询图中的其他节点。同样地,也可将已建立的知识库中的概念节点所具备的节点名称、属性、属性值、属性-属性值对等数据视为对于该节点的描述信息,这些描述信息分别是从各自的维度对节点加以描述,使其区别于知识库中的其他节点。
应该理解的是,在对初始查询图进行扩展的过程,将初始查询图中的概念节点称为目标概念节点,而将已建立的知识库中的概念节点称为待比较概念节点,以实现对于二者的区分。
步骤130,计算所述目标概念节点与所述待比较概念节点之间的第一语义相似度。
本步骤中,首先对目标概念节点与待比较概念节点进行粗粒度的语义相似度计算和判断。基于粗粒度的语义相似度的判断结果,可以先排除一部分在粗粒度的语义相似度较差的待比较概念节点,缩小在知识库中查找目标概念节点的相似节点的范围,进而提高扩展的效率。
在一些实施例中,各维度的描述信息由词语表示;所述计算所述目标概念节点与所述待比较概念节点之间的第一语义相似度,包括:根据所述目标概念节点与所述待比较概念节点的表示所述多个维度的描述信息的词语,计算所述目标概念节点与所述待比较概念节点之间的第一语义相似度。
由于目标概念节点具有多个维度的描述信息,而各维度的描述信息均是以词语表示的,可以理解成,目标概念节点实际对应有若干词语,这些词语用于从多个维度对目标概念节点加以描述。例如,存在一个目标概念节点,其节点名称为“张三”,具有属性-属性值对(姓名,′张三′),则该目标概念节点所对应的词语包括张三、姓名、张三这三个词语。同样地,待比较概念节点也对应有若干词语。基于此,可以基于目标概念节点和待比较概念节点所对应的全部词语,从整体上实现对目标概念节点和待比较概念节点之间的第一语义相似度的比较。
具体地,可以根据传统的距离算法、余弦相似度或者TF-IDF算法计算目标概念节点和待比较概念节点之间的第一语义相似度。例如,基于余弦相似度,可以根据以下公式对目标概念节点和待比较概念节点之间的第一语义相似度Tsim(Ni,Nj)进行计算:
Figure BDA0003046617990000111
其中,节点Ni和节点Nj分别表示与用户查询需求相关的目标概念节点和从已建立的知识库中获取的待比较概念节点,0<i≤n,0<j≤m,n、m分别表示与查询需求相关的目标概念节点的个数以及在已建立的知识库中待比较概念节点的个数;Ti和Tj分别表示节点Ni和Nj所对应词语的集合,形如{Ti1,Ti2,…}和{Tj1,Tj2,…};Tik和Tjk可以分别表示节点Ni和Nj所对应词语的词频,根据节点Ni和Nj所对应词语的词频,可以确定节点Ni和Nj的语义向量;h为节点Ni所对应词语的个数,当节点Ni所对应词语的个数与节点Ni所对应词语的个数不一致,则可以其中一个节点所不具有的词语的词频设置为0,从而保证两个节点所对应的词语个数是相同的。
步骤140,当所述第一语义相似度达到第一预设相似度,根据所述目标概念节点和所述待比较概念节点的各维度的描述信息,分别计算所述目标概念节点与所述待比较概念节点之间各维度的第二语义相似度。
当粗粒度的语义相似度达到第一预设相似度,进一步从多个维度对目标概念节点和待比较概念节点的相似性进行细粒度地分析,以提供更为精确的扩展结果,进而实现对于查询需求的动态扩展。相应地,如果某一个待比较概念节点,其与目标概念节点之间的第一语义相似度低于第一预设相似度,则放弃该待比较概念节点,不再进行细粒度的分析,以提高扩展效率。具体地,当粗粒度的第一语义相似度函数Tsim(Ni,Nj)≥t1阈值时,计算细粒度的第二语义相似度函数,否则比较目标概念节点与下一个待比较概念节点的第一语义相似度。应该理解的是,第一预设相似度可以根据需要进行设定,本发明实施例对此不做具体限定。
目标概念节点和待比较概念节点的各维度的描述信息均由词语表示,因此,可以基于各维度描述信息所对应的词语,计算目标概念节点和待比较概念节点在相应维度上的第二语义相似度。
在一些实施例中,可以基于节点名称维度、属性维度、属性值维度以及属性-属性值对维度的描述信息,对目标概念节点和待比较概念节点在各维度上的第二语义相似度进行计算。具体地,在各维度上的第二语义相似度的计算可以基于传统的距离算法、余弦相似度、TF-IDF算法实现。本发明实施例对此不做具体限定。
设,节点Ni和节点Nj分别表示与用户查询需求相关的目标概念节点和从已建立的知识库中获取的待比较概念节点,0<i≤n,0<j≤m,n、m分别表示与查询需求相关的目标概念节点的个数以及在已建立的知识库中待比较概念节点的个数;Msim(Ni.name,Nj.name)为节点名称相似度函数,Ni.name,Nj.name分别为节点Ni,Nj的节点名称;Asim(Ai,Aj)为属性相似度函数,Ai,Aj分别为节点Ni,Nj的属性集合,形如
Figure BDA0003046617990000121
Vsim(Vi,Vj)为属性值相似度函数,Vi,Vj分别为Ai,Aj属性的属性值集合,形如
Figure BDA0003046617990000122
Figure BDA0003046617990000123
AVsim((a,v)i,(a,v)j)为属性-属性值对相似度函数,(a,v)i,(a,v)j分别为节点Ni,Nj的属性-值对,形如
Figure BDA0003046617990000124
步骤150,当任一维度的第二语义相似度达到相应维度的第二预设相似度,将所述待比较概念节点在相应维度的描述信息作为所述目标概念节点在相应维度的扩展描述信息。
目标概念节点的某一维度的描述信息的实质是该目标概念节点所表示目标概念的描述信息,因此,经过计算所确定的目标概念节点在某一维度的扩展描述信息就是在相应维度上对目标概念的扩展描述信息,可以进一步理解成与用户查询需求相关的目标概念在相应维度上的扩展查询词。
可以利用集合组织目标概念节点所获得的扩展描述信息。并且针对不同的维度,单独设置各自的集合,用于收集相应维度下的扩展描述信息。因此,各维度的扩展描述信息可以称为相应集合的扩展元素。具体地,当Msim(Ni.name,Nj.name)≥t2阈值时,按该相似度值降序排序,将Nj.name存入Ni的节点名称扩展集SET1中;当Asim(Ai,Aj)≥t3阈值时,按该相似度值降序排序,将Aj存入Ai的属性扩展集SET2中;当Vsim(Vi,Vj)≥t4阈值时,按该相似度值降序排序,将Vj存入Vi的属性值扩展集SET3中;当AVsim((a,v)i,(a,v)j)≥t5阈值时,按该相似度值降序排序,将(a,v)j存入(a,v)i的属性-属性值对扩展集SET4。应该理解的是,不同维度的第二语义相似度可以设置有不同的第二预设相似度,各第二预设相似度的设定可以需要进行设定,本发明实施例对此不做具体限定。
需要说明的是,当目标概念节点在某一个维度上未获得扩展描述信息,则相应维度的集合为空,在后续的步骤中,仅针对非空集合中的扩展元素进行处理。
步骤160,在所述初始查询图上,基于所述目标概念节点在至少一个维度的扩展描述信息,生成扩展查询图。
目标概念节点在某一维度的扩展描述信息就是在相应维度上对目标概念的扩展描述信息,可以进一步理解成与用户查询需求相关的目标概念在相应维度上的扩展查询词。因此,基于目标概念节点在至少一个维度上的扩展描述信息生成的扩展查询图,可以用于描述用户的一种可能的查询需求。
具体地,对于目标概念节点在任一维度的扩展描述信息,可以使用该扩展描述信息替换在初始查询图中目标概念节点在相应维度的描述信息,从而生成扩展查询图。
在一些实施例中,所述在所述初始查询图上,基于所述目标概念节点在至少一个维度的扩展描述信息,生成扩展查询图,包括:
步骤(1)从所述目标概念节点在至少一个维度的扩展描述信息中,依次选取各维度的一个扩展描述信息,构造至少一个扩展描述信息组合。
具体地,从各非空扩展集中依次选取一个扩展元素,构造出一个扩展元素组合。换句话说,一个扩展元素组合中的全部扩展元素应该分别来自于各非空扩展集。对不同的非空扩展集的扩展元素进行组合,以使得所构造的扩展元素组合最终可以包含全部扩展集的全部扩展元素。例如,假定节点名称扩展集SET1、属性扩展集SET2、属性值扩展集SET3非空,且SET1={S11,S12},SET2={S21,S22},SET3={S31},依次选取所有扩展元素构造组合为:{S11,S21,S31},{S11,S22,S31},{S12,S21,S31},{S12,S22,S31}。
在一些示例中,在构造扩展元素组合的过程中,为了使所构造的扩展元素组合更精确地反应用户的查询需求,同时提高查询效率,可以先对目标概念节点和待比较概念节点之间的总相似度进行比较,在总相似度达到一定阈值度时,才基于全部扩展集的全部扩展元素构造扩展元素组合,否则仅基于全部扩展集的部分扩展元素构造扩展元素组合。
具体地,根据所述目标概念节点与所述待比较概念节点之间各维度的第二语义相似度,计算所述目标概念节点与所述待比较概念节点之间的总相似度;当所述目标概念节点与所述待比较概念节点之间的总相似度达到第五预设相似度,从所述目标概念节点在至少一个维度的扩展描述信息中,依次选取各维度的一个扩展描述信息,构造至少一个扩展描述信息组合,所构造的所述至少一个扩展描述组合包含所述至少一个维度的全部扩展描述信息;当所述目标概念节点与所述待比较概念节点之间的总相似度低于第五预设相似度,从所述目标概念节点在至少一个维度的扩展描述信息中,依次选取各维度的一个扩展描述信息,构造至少一个扩展描述信息组合,所构造的所述至少一个扩展描述组合包含所述至少一个维度的部分扩展描述信息。
以目标概念节点与待比较概念节点之间的总语义相似度T′sim(Ni,Nj)作为二者之间的总相似度。当总相似度T′sim(Ni,Nj)≥t8阈值时,依次选取非空SETk的所有元素进行组合;否则,依次选取非空SETk的部分元素进行组合。假定节点名称扩展集SET1、属性扩展集SET2、属性值扩展集SET3非空,且SET1={S11,S12},SET2={S21,S22},SET3={S31},当T′sim(Ni,Nj)≥t8时,依次选取所有元素构造组合为:{S11,S21,S31},{S11,S22,S31},{S12,S21,S31},{S12,S22,S31};当T′sim(Ni,Nj)<t8时,依次选取部分元素构造组合{S11,S21,S31},{S11,S22,S31}。这里,选取了SET1的第1个元素、SET2的前2个元素、SET3的第1个元素进行组合。实际应用中,可以依据非空SETk的重要性确定选取扩展元素的个数,SETk的重要性越大,从中选取的扩展元素个数越多。
在一些示例中,可以为各维度的第二语义相似度赋予权重,对各维度的第二语义相似度进行加权求和,得到目标概念节点与待比较概念节点之间的总语义相似度T′sim(Ni,Nj),其计算过程如下:
T′sim(Ni,Nj)
=s1×Msim(Ni.name,Nj.name)+s2×Asim(Ai,Aj)+s3×Vsim(Vi,Vj)+s4×AVsim((a,v)i,(a,v)j)
其中,si为权重,si∈[0,1],
Figure BDA0003046617990000141
步骤(2)在所述初始查询图上,根据各扩展描述信息组合,生成各扩展查询图。
在初始查询图上根据各扩展描述信息组合进行扩展,生成相应的扩展查询图。可以由以下过程具体实现:扩展元素组合中来自属性-属性值对扩展集SET4中的扩展元素(形如(a,v)),添加到初始查询图的节点Ni的属性-属性值对列表里;组合中来自SET1、SET2和SET3的扩展元素,分别转换为属性-属性值对的形式(Nodename,Nj.name)、(Aj,Ai.value)和(Vi.attribute,Vj),其中,Nodename属性描述节点名称,Ai.value表示Aj属性的属性值,Vi.attribute表示属性值Vi对应的属性,然后将这些属性-属性值对添加到节点Ni的属性-属性值对列表里。针对不同的扩展描述信息组合,可以生成不同的扩展查询图。
例如,用户的查询需求为查询价格在2000元的电脑,则在初始查询图中可以构建概念节点“电脑”,该节点的节点名称为“电脑”,属性-属性值对包括(价格,2000)。经过将该目标概念节点与一已建立的知识库中多个概念节点进行比较,选取出针对该目标概念节点在多个维度的扩展描述信息,包括:节点名称维度“计算机”,属性维度“单价”“金额”,属性值维度“2010”,属性-属性值对维度“金额,2010”,这些扩展描述信息可以构成四个扩展集,分别为:节点名称扩展集SET1={计算机},属性扩展集SET2={单价,金额},属性值扩展集SET3={2010},属性-属性值对扩展集SET4={(金额,2010)}。基于上述扩展集,可以构造出扩展元素组合{计算机,单价,2010,(金额,2010)},{计算机,金额,2010,(金额,2010)}。基于上述扩展元素组合,构造扩展查询图。对于第一个扩展元素组合{计算机,单价,2010,(金额,2010)},扩展元素(金额,2010)直接添加到初始查询图的节点的属性-属性值对列表里,其他扩展元素转换为属性-属性值对的形式,分别为(节点名称,计算机),(单价,2000),(价格,2010),然后将这些属性-属性值对添加到节点的属性-属性值对列表里,最终该节点的扩展属性-属性值对列表中包含(节点名称,计算机),(单价,2000),(价格,2010),(金额,2010)四个属性-属性值对。据此,可以生成扩展查询图。
进一步地,根据所生成的扩展查询图进行查询处理,返回查询结果。
另外,上述步骤涉及权重wi、si和阈值ti的选择,可以采用以往的实践经验来确定,也可以采用主成分分析法、因子分析法、回归分析法、平均数分析等方法来确定,本发明实施例对此不做具体限定。
综上所述,本发明实施例提供的基于动态优化的图模型语义查询扩展方法,首先根据用户的查询需求,构造初始查询图,其中,初始查询图具有目标概念节点,从已建立的知识库中获取待比较概念节点,其中,目标概念节点和待比较概念节点均具有多个维度的描述信息,然后计算目标概念节点与待比较概念节点之间的第一语义相似度,当第一语义相似度达到第一预设相似度,根据目标概念节点和待比较概念节点的各维度的描述信息,分别计算目标概念节点与待比较概念节点之间各维度的第二语义相似度,当任一维度的第二语义相似度达到相应维度的第二预设相似度,将待比较概念节点在相应维度的描述信息作为目标概念节点在相应维度的扩展描述信息,最后在初始查询图上,基于目标概念节点在至少一个维度的扩展描述信息,生成扩展查询图。基于该方法和装置,可以实现基于图模型的语义查询的动态扩展,提高查询效率以及查询结果的准确度。
实施例二
图2为本发明实施例提供的基于动态优化的图模型语义查询扩展方法的流程图,该方法由具有处理能力的系统、服务端设备或基于动态优化的图模型语义查询扩展装置执行。如图2所示,上述方法包括:
步骤210,根据用户的查询需求,构造初始查询图,其中,所述初始查询图具有目标概念节点以及用于表示所述目标概念节点与其他概念节点之间的关系的边。
步骤220,从已建立的知识库中获取待比较概念节点;其中,所述目标概念节点和所述待比较概念节点均具有多个维度的描述信息。
步骤230,计算所述目标概念节点与所述待比较概念节点之间的第一语义相似度。
步骤240,当所述第一语义相似度达到第一预设相似度,根据所述目标概念节点和所述待比较概念节点的各维度的描述信息,分别计算所述目标概念节点与所述待比较概念节点之间各维度的第二语义相似度。
步骤250,当任一维度的第二语义相似度达到相应维度的第二预设相似度,将所述待比较概念节点在相应维度的描述信息作为所述目标概念节点在相应维度的扩展描述信息。
步骤260,计算所述目标概念节点与所述待比较概念节点之间的关系相似度。
当粗粒度的语义相似度达到第一预设相似度,进一步从多个维度对目标概念节点和待比较概念节点的相似性进行细粒度地分析,以提供更为精确的扩展结果,进而实现对于查询需求的动态扩展。实际应用中,目标概念节点与待比较概念节点之间的相似性还体现在二者在各自网络中与其他概念节点之间的关系层面。因此,可以从关系相似度的角度,对目标概念节点与待比较概念节点的相似性进行评价,以提高对于用户查询需求的扩展的精确性,提高查询结果的准确度。
当目标概念节点和待比较概念节点所连接的边的关系类型越接近,以及当目标概念节点和待比较概念节点的邻居概念节点的语义相似度越高,意味着目标概念节点和待比较概念节点在关系层面的相似度越高。基于此,在一些实施例中,所述计算所述目标概念节点与所述待比较概念节点之间的关系相似度,包括:根据所述目标概念节点与所述待比较概念节点所连接的边的关系类型,以及所述目标概念节点的邻居概念节点与所述待比较概念节点的邻居概念节点之间的第三语义相似度,计算所述目标概念节点与所述待比较概念节点之间的关系相似度。
这里,边的关系类型可以是好友关系,父子关系,租售关系,买卖关系等等。边的关系类型可以从初始查询图中边的标签获得。目标概念节点的邻居概念节点与待比较概念节点的邻居概念节点之间的第三语义相似度可以根据这两个邻居概念节点所对应的词语计算,即采用与目标概念节点与待比较概念节点之间的第一语义相似度相同的计算方法。也可以基于两个邻居概念节点的节点名称实现计算,该计算方法相对简单,易于实现。本发明实施例对此不做具体限定。
具体地,目标概念节点与待比较概念节点之间的关系相似度Lsim(Ni,Nj)可以基于以下公式计算:
Figure BDA0003046617990000171
其中,节点Ni和节点Nj分别表示与用户查询需求相关的目标概念节点和从已建立的知识库中获取的待比较概念节点,0<i≤n,0<j≤m,n、m分别表示与查询需求相关的目标概念节点的个数以及在已建立的知识库中待比较概念节点的个数;β1为权重,LNi,LNj分别表示节点Ni和节点Nj的连边数量,LNi∩LNj表示Ni和Nj拥有的具有相同关系类型的边的数量,LNi∩′LNj表示Ni和Nj拥有的第三语义相似度达到第六预设相似度的邻居概念节点的数量。
步骤270,当所述关系相似度达到第三预设相似度,将所述待比较概念节点所连接的边作为所述目标概念节点的扩展边。
用户的查询需求通过概念以及概念间关系得以体现,在初始查询图中,目标概念节点与其他概念节点之间的关系通过目标概念节点的边表示。将关系相似度符合条件的待比较概念节点所连接的边作为目标概念节点的扩展边,即可以实现对于用户查询需求的扩展。
具体地,可以利用集合组织目标概念节点所获得的扩展边。当Lsim(Ni,Nj)≥t6阈值时,将Lj存入Li的边扩展集SET5。
步骤280,在所述初始查询图上,基于所述目标概念节点在至少一个维度的扩展描述信息以及至少一个扩展边,生成扩展查询图。
在一些实施例中,所述在所述初始查询图上,基于所述目标概念节点在至少一个维度的扩展描述信息以及至少一个扩展边,生成扩展查询图,包括:
步骤(1)从所述目标概念节点在至少一个维度的扩展描述信息以及所述至少一个扩展边中,依次选取各维度的一个扩展描述信息以及一个扩展边,构造至少一个扩展描述信息组合。
在一些示例中,在构造扩展元素组合的过程中,为了使所构造的扩展元素组合更精确地反应用户的查询需求,同时提高查询效率,可以先对目标概念节点和待比较概念节点之间的总相似度进行比较,在总相似度达到一定阈值度时,才基于全部扩展集的全部扩展元素构造扩展元素组合,否则仅基于全部扩展集的部分扩展元素构造扩展元素组合。
具体地,根据所述目标概念节点与所述待比较概念节点之间各维度的第二语义相似度以及所述目标概念节点与所述待比较概念节点之间的关系相似度,计算所述目标概念节点与所述待比较概念节点之间的总相似度;
当所述目标概念节点与所述待比较概念节点之间的总相似度达到第四预设相似度,从所述目标概念节点在至少一个维度的扩展描述信息以及所述至少一个扩展边中,依次选取各维度的一个扩展描述信息以及一个扩展边,构造至少一个扩展描述信息组合,所构造的所述至少一个扩展描述组合包含所述至少一个维度的全部扩展描述信息以及全部扩展边;当所述目标概念节点与所述待比较概念节点之间的总相似度低于第四预设相似度,从所述目标概念节点在至少一个维度的扩展描述信息以及所述至少一个扩展边中,依次选取各维度的一个扩展描述信息以及一个扩展边,构造至少一个扩展描述信息组合,所构造的所述至少一个扩展描述组合包含所述至少一个维度的部分扩展描述信息以及部分扩展边。
当总相似度Nsim(Ni,Nj)≥t7阈值时,依次选取非空SETk的所有元素进行组合;否则,依次选取非空SETk的部分元素进行组合。例如,假定节点名称扩展集SET1、属性扩展集SET2、属性值扩展集SET3、边扩展集SET5,非空,且SET1={S11,S12},SET2={S21,S22},SET3={S31},SET5={S51}当Nsim(Ni,Nj)≥t7时,依次选取所有元素构造组合为:{S11,S21,S31,S51},{S11,S22,S31,S51},{S12,S21,S31,S51},{S12,S22,S31,S51};当Nsim(Ni,Nj)<t7时,依次选取部分元素构造组合{S11,S21,S31,S51},{S11,S22,S31,S51}。
在一些示例中,可以根据目标概念节点与待比较概念节点之间的总语义相似度和关系相似度,计算目标概念节点与待比较概念节点之间的总相似度。
首先,可以为各维度的第二语义相似度赋予权重,对各维度的第二语义相似度进行加权求和,得到目标概念节点与待比较概念节点之间的总语义相似度T′sim(Ni,Nj),其计算过程如下:
T′sim(Ni,Nj)
=s1×Msim(Ni.name,Nj.name)+s2×Asim(Ai,Aj)+s3×Vsim(Vi,Vj)+s4×AVsim((a,v)i,(a,v)j)
其中,si为权重,si∈,0,1],
Figure BDA0003046617990000191
Msim(Ni.name,Nj.name)为节点名称相似度函数,Ni.name,Nj.name分别为节点Ni,Nj的节点名称;Asim(Ai,Aj)为属性相似度函数,Ai,Aj分别为节点Ni,Nj的属性集合,形如
Figure BDA0003046617990000192
Figure BDA0003046617990000193
Vsim(Vi,Vj)为属性值相似度函数,Vi,Vj分别为Ai,Aj属性的属性值集合,形如
Figure BDA0003046617990000194
AVsim((a,v)i,(a,v)j)为属性-属性值对相似度函数,(a,v)i,(a,v)j分别为节点Ni,Nj的属性-值对,形如
Figure BDA0003046617990000195
Figure BDA0003046617990000196
之后,再采用以下公式计算目标概念节点与待比较概念节点之间的总相似度Nsim(Ni,Nj):
Nsim(Ni,Nj)=w1×T′sim(Ni,Nj)+w2×Lsim(Ni,Nj)
其中,wi为权重,wi∈[0,1],
Figure BDA0003046617990000201
步骤(2)在所述初始查询图上,根据各扩展描述信息组合,生成各扩展查询图。
在初始查询图上根据各扩展描述信息组合进行扩展,生成相应的扩展查询图。可以由以下过程具体实现:扩展元素组合中来自属性-属性值对扩展集SET4中的扩展元素(形如(a,v)),添加到初始查询图的节点Ni的属性-属性值对列表里;组合中来自SET1、SET2和SET3的扩展元素,分别转换为属性-属性值对的形式(Nodename,Nj.name)、(Aj,Ai.value)和(Vi.attribute,Vj),其中,Nodename属性描述节点名称,Ai.value表示Aj属性的属性值,Vi.attribute表示属性值Vi对应的属性,然后将这些属性-属性值对添加到节点Ni的属性-属性值对列表里,组合中来自SET5的扩展边,添加至节点Ni和节点Ni的邻居节点之间,替换节点Ni所连接边与该扩展边具有相同标签的边。
例如,用户的查询需求为查询张三的好友,则在初始查询图中可以构建概念节点“张三”,该节点的节点名称为“张三”,属性-属性值对包括(姓名,张三),该节点连接有一条边,边的标签为好友,该节点通过该边连接至一空节点。经过将该目标概念节点与一已建立的知识库中多个概念节点进行比较,选取出针对该目标概念节点在多个维度的扩展描述信息和扩展边,包括:属性维度“人名”,扩展边标签“朋友”,可以构成两个扩展集,分别为:属性扩展集SET2={人名},边扩展集SET5={朋友}。基于上述扩展集,可以构造出扩展元素组合{人名,朋友}。基于上述扩展元素组合,构造扩展查询图。扩展元素(人名)转换为属性-属性值对(人名,张三),添加到节点的属性-属性值对列表里,最终该节点的扩展属性-属性值对列表中包含(人名,张三)属性-属性值对,扩展边添加至节点与其邻居节点之间,替换原标签为好友的边,并将标签设置为朋友。据此,可以生成扩展查询图。
进一步地,根据所生成的扩展查询图进行查询处理,返回查询结果。
另外,上述步骤涉及权重wi、si、β1和阈值ti的选择,可以采用以往的实践经验来确定,也可以采用主成分分析法、因子分析法、回归分析法、平均数分析等方法来确定,本发明实施例对此不做具体限定。
综上所述,本发明实施例提供的基于动态优化的图模型语义查询扩展方法,首先根据用户的查询需求,构造初始查询图,其中,初始查询图具有目标概念节点,从已建立的知识库中获取待比较概念节点,其中,目标概念节点和待比较概念节点均具有多个维度的描述信息,然后计算目标概念节点与待比较概念节点之间的第一语义相似度,当第一语义相似度达到第一预设相似度,根据目标概念节点和待比较概念节点的各维度的描述信息,分别计算目标概念节点与待比较概念节点之间各维度的第二语义相似度,当任一维度的第二语义相似度达到相应维度的第二预设相似度,将待比较概念节点在相应维度的描述信息作为目标概念节点在相应维度的扩展描述信息,接下来计算目标概念节点与待比较概念节点之间的关系相似度,当关系相似度达到第三预设相似度,将待比较概念节点所连接的边作为目标概念节点的扩展边,最后在初始查询图上,基于目标概念节点在至少一个维度的扩展描述信息以及至少一个扩展边,生成扩展查询图。基于该方法和装置,可以实现基于图模型的语义查询的动态扩展,提高查询效率以及查询结果的准确度。
实施例三
以下结合一个具体场景来描述本发明实施例提供的基于动态优化的图模型语义查询扩展方法的实施过程。
图3为本发明实施例提供的基于动态优化的图模型语义查询扩展方法的流程图。如图3所示,该方法包括:
步骤S1根据用户在图模型G上的查询需求的概念/概念间关系构造初始查询图。
给出通用图模型G定义如下:
定义1.图模型G由节点和边组成,记为G:=(N,E),其中N为节点集{N1,...,Nk},节点Ni由属性-属性值对组成,记为
Figure BDA0003046617990000211
设A为N的属性集合,V为N的属性值的集合,则有属性-属性值对
Figure BDA0003046617990000212
1≤k≤n。特别的,当节点
Figure BDA0003046617990000213
时,称Ni为空节点。当节点存在属性-属性值对(a,v),但a或v不确定时,可设为null值,记为(null,v)或(a,null)。E是带标签的边的集合,边记为(Ni,Nk,L),其中Ni,Nk∈N,i≠k,分别表示边的引入节点和引出节点,L表示边的标签,且L可为null值。
采用由节点(属性-属性值对)和带标签的边一起组成的图模型,能够描述多粒度、异构的内容及其概念间关系,特别的,空节点和空标签增强了对不确定信息的描述能力,能方便描述模糊、不确定的信息。
例如,用户在图模型G上的查询需求为查询姓名为张三的信息,则构造的初始查询图为含有属性-属性值对(姓名,′张三′)的一个节点。
步骤S2将查询需求的概念和现有的相关本体、知识图谱、维基百科等知识库中的概念相比较,计算两者之间粗粒度的语义相似度函数Tsim(Ni,Nj)。
节点词语主要包括节点名称和属性-属性值对形成的词语。Tsim(Ni,Nj)将节点名称和属性-属性值对形成的词语视为一个整体进行比较,是粗粒度的语义相似度比较,其计算如下:
Figure BDA0003046617990000221
其中,节点Ni和节点Nj分别表示与用户查询需求相关的目标概念节点和从已建立的知识库中获取的待比较概念节点,0<i≤n,0<j≤m,n、m分别表示与查询需求相关的目标概念节点的个数以及在已建立的知识库中待比较概念节点的个数;Ti和Tj分别表示节点Ni和Nj所对应词语的集合,形如{Ti1,Ti2,…}和{Tj1,Tj2,…};Tik和Tjk可以分别表示节点Ni和Nj所对应词语的词频,根据节点Ni和Nj所对应词语的词频,可以确定节点Ni和Nj的语义向量;h为节点Ni所对应词语的个数,当节点Ni所对应词语的个数与节点Ni所对应词语的个数不一致,则可以其中一个节点所不具有的词语的词频设置为0,从而保证两个节点所对应的词语个数是相同的。
步骤S3当粗粒度的语义相似度函数Tsim(Ni,Nj)≥t1阈值时,计算细粒度的语义相似度函数T′sim(Ni,Nj),否则返回步骤S2,比较下一个节点的相似度。
为了更精确、细粒度的判断节点的相似度,需要分别对节点名称相似度、属性相似度、属性值相似度和属性-属性值对相似度一一比较。
设Msim(Ni.name,Nj.name)为节点名称相似度函数,Ni.name,Nj.name分别为节点Ni,Nj的名称;Asim(Ai,Aj)为属性相似度函数,Ai,Aj分别为节点Ni,Nj的属性集合,形如
Figure BDA0003046617990000231
Vsim(Vi,Vj)为属性值相似度函数,Vi,Vj分别为Ai,Aj属性的属性值集合,形如
Figure BDA0003046617990000232
AVsim((a,v)i,(a,v)j)为属性-属性值对相似度函数,(a,v)i,(a,v)j分别为节点Ni,Nj的属性-属性值对,形如
Figure BDA0003046617990000233
重点关注属性相似度、属性值相似度高的对应属性-属性值对,重点比较这些属性-属性值对的相似度。
此外,还定义总语义相似度函数T′sim(Ni,Nj)如下:
T′sim(Ni,Nj)
=s1×Msim(Ni.name,Nj.name)+s2×Asim(Ai,Aj)+s3×Vsim(Vi,Vj)+s4×AVsim((a,v)i,(a,v)j)
其中,si为权重,si∈[0,1],
Figure BDA0003046617990000234
步骤S4当Msim(Ni.name,Nj.name)≥t2阈值时,按该相似度值降序排序,将Nj.name存入Ni的节点名称扩展集SET1中;当Asim(Ai,Aj)≥t3阈值时,按该相似度值降序排序,将Aj存入Ai的属性扩展集SET2中;当Vsim(Vi,Vj)≥t4阈值时,按该相似度值降序排序,将Vj存入Vi的属性值扩展集SET3中;当AVsim((a,v)i,(a,v)j)≥t5阈值时,按该相似度值降序排序,将(a,v)j存入(a,v)i的属性-属性值对扩展集SET4。
步骤S5计算节点关系相似度函数Lsim(Ni,Nj),当Lsim(Ni,Nj)≥t6阈值时,将Lj存入Li的边扩展集SET5。
节点连边是和节点直接相连的边。关系相似度函数Lsim(Ni,Nj)计算如下:
Figure BDA0003046617990000235
其中,β1为权重,LNi,LNj分别表示节点Ni和节点Nj的连边数量,LNi∩LNj表示Ni和Nj拥有的具有相同关系类型的边的数量,LNi∩′LNj表示Ni和Nj拥有的第三语义相似度达到第六预设相似度的邻居概念节点的数量。
步骤S6判断是否有i≥n且j≥m,即判断是否所有的节点比较完毕,是则返回SET1-SET5,否则返回步骤S2,继续比较下一个节点的相似度。
步骤S7当
Figure BDA0003046617990000236
时,即存在非空扩展集时,计算总相似度函数Nsim(Ni,Nj),否则对初始查询图进行查询处理,返回查询结果。
Nsim(Ni,Nj)考虑了概念节点的语义相似度和关系相似度,其计算如下:
Nsim(Ni,Nj)=w1×T′sim(Ni,Nj)+w2×Lsim(Ni,Nj)
其中,wi为权重,wi∈[0,1],
Figure BDA0003046617990000241
步骤S8当Nsim(Ni,Nj)≥t7阈值时,依次选取非空SETk的所有元素进行组合,在初始查询图上生成扩展查询图;否则,依次选取非空SETk的部分元素进行组合,在初始查询图上生成扩展查询图。每一个扩展查询图描述用户的一种可能的查询需求。
在初始查询图上根据组合进行扩展,生成相应的扩展查询图,具体方法如下:组合中来自属性-属性值对扩展集SET4中的元素(形如(a,v)),添加到初始查询图的节点Ni的属性-属性值对列表里;组合中来自SET1、SET2和SET3的元素,分别转换为属性-属性值对的形式(Nodename,Nj.name)、(Aj,Ai.value)和(Vi.attribute,Vj),其中,Nodename属性描述节点名称,Ai.value表示Ai属性的属性值,Vi.attribute表示属性值Vi对应的属性,然后将这些属性-属性值对添加到节点Ni的属性-属性值对列表里;组合中来自SET5的元素,作为边添加到节点Ni与其邻居节点之间。
步骤S9对扩展查询图进行查询处理,返回查询结果。
特别说明,上述步骤涉及权重wi、si、β1和阈值ti的选择,可以采用以往的实践经验来确定权重和阈值,也可以采用主成分分析法、因子分析法、回归分析法、平均数分析等方法来确定;语义相似度函数的计算方法可以采用我们给定的公式,也可以采用传统的距离算法与相似度算法(如余弦相似度、TF-IDF等)。
综上所述,本发明实施例提供的基于动态优化的图模型语义查询扩展方法,能及时依据与搜索需求语义相似度高的概念/关联对初始查询图进行动态优化和调整,可以通过定义不同粒度的相似度函数以及对扩展元素组合进行选取,对扩展查询图生成进行严格控制,减少相似度差的查询图的查询处理过程,进而提高查询效率和效果。
图4示出了本发明实施例提供的基于动态优化的图模型语义查询扩展装置的结构示意图。如图4所示,上述基于动态优化的图模型语义查询扩展装置400,包括:初始查询图构造模块410,用于根据用户的查询需求,构造初始查询图,其中,所述初始查询图具有目标概念节点;待比较概念节点获取模块420,用于从已建立的知识库中获取待比较概念节点;其中,所述目标概念节点和所述待比较概念节点均具有多个维度的描述信息;第一语义相似度计算模块430,用于计算所述目标概念节点与所述待比较概念节点之间的第一语义相似度;第二语义相似度计算模块440,用于当所述第一语义相似度达到第一预设相似度,根据所述目标概念节点和所述待比较概念节点的各维度的描述信息,分别计算所述目标概念节点与所述待比较概念节点之间各维度的第二语义相似度;扩展描述信息选取模块450,用于当任一维度的第二语义相似度达到相应维度的第二预设相似度,将所述待比较概念节点在相应维度的描述信息作为所述目标概念节点在相应维度的扩展描述信息;扩展查询图生成模块460,用于在所述初始查询图上,基于所述目标概念节点在至少一个维度的扩展描述信息,生成扩展查询图。
在一些实施例中,所述多个维度的描述信息包括节点名称维度、属性维度、属性值维度和/或属性-属性值对维度的描述信息。
在一些实施例中,各维度的描述信息由词语表示;所述第一语义相似度计算模块,具体用于:根据所述目标概念节点与所述待比较概念节点的表示所述多个维度的描述信息的词语,计算所述目标概念节点与所述待比较概念节点之间的第一语义相似度。
在一些实施例中,所述扩展查询图生成模块,包括:从所述目标概念节点在至少一个维度的扩展描述信息中,依次选取各维度的一个扩展描述信息,构造至少一个扩展描述信息组合;在所述初始查询图上,根据各扩展描述信息组合,生成各扩展查询图。
在一些实施例中,所述初始查询图具有用于表示所述目标概念节点与其他概念节点之间的关系的边;所述装置还包括:关系相似度计算模块,用于计算所述目标概念节点与所述待比较概念节点之间的关系相似度;扩展边选取模块,用于当所述关系相似度达到第三预设相似度,将所述待比较概念节点所连接的边作为所述目标概念节点的扩展边;所述扩展查询图生成模块,具体用于:在所述初始查询图上,基于所述目标概念节点在至少一个维度的扩展描述信息以及至少一个扩展边,生成扩展查询图。
在一些实施例中,所述关系相似度计算模块,具体用于:根据所述目标概念节点与所述待比较概念节点所连接的边的关系类型,以及所述目标概念节点的邻居概念节点与所述待比较概念节点的邻居概念节点之间的第三语义相似度,计算所述目标概念节点与所述待比较概念节点之间的关系相似度。
在一些实施例中,所述扩展查询图生成模块,包括:扩展描述信息组合子模块,用于从所述目标概念节点在至少一个维度的扩展描述信息以及所述至少一个扩展边中,依次选取各维度的一个扩展描述信息以及一个扩展边,构造至少一个扩展描述信息组合;扩展查询图生成子模块,用于在所述初始查询图上,根据各扩展描述信息组合,生成各扩展查询图。
在一些实施例中,所述扩展描述信息组合子模块,包括:总相似度计算单元,用于根据所述目标概念节点与所述待比较概念节点之间各维度的第二语义相似度以及所述目标概念节点与所述待比较概念节点之间的关系相似度,计算所述目标概念节点与所述待比较概念节点之间的总相似度;扩展描述信息组合单元,用于当所述目标概念节点与所述待比较概念节点之间的总相似度达到第四预设相似度,从所述目标概念节点在至少一个维度的扩展描述信息以及所述至少一个扩展边中,依次选取各维度的一个扩展描述信息以及一个扩展边,构造至少一个扩展描述信息组合,所构造的所述至少一个扩展描述组合包含所述至少一个维度的全部扩展描述信息以及全部扩展边;当所述目标概念节点与所述待比较概念节点之间的总相似度低于第四预设相似度,从所述目标概念节点在至少一个维度的扩展描述信息以及所述至少一个扩展边中,依次选取各维度的一个扩展描述信息以及一个扩展边,构造至少一个扩展描述信息组合,所构造的所述至少一个扩展描述组合包含所述至少一个维度的部分扩展描述信息以及部分扩展边。
图5示出了本发明实施例的电子设备。如图5所示,电子设备500包括:至少一个处理器510,以及与所述至少一个处理器510通信连接的存储器520,其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器执行所述的方法。
具体地,上述存储器520和处理器510经由总线530连接在一起,能够为通用的存储器和处理器,这里不做具体限定,当处理器510运行存储器520存储的计算机程序时,能够执行本发明实施例中结合图1至图4所描述的各项操作和功能。
本发明实施例还提供了一种存储介质,其上存储有计算机程序,该程序被处理器执行时,实现所述的方法。具体实现可参见方法实施例,在此不再赘述。
尽管本发明实施例的实施方案已公开如上,但其并不仅仅限于说明书和实施方式中所列运用。它完全可以被适用于各种适合本发明实施例的领域。对于熟悉本领域的人员而言,可容易地实现另外的修改。因此在不背离权利要求及等同范围所限定的一般概念下,本发明实施例并不限于特定的细节和这里示出与描述的图例。

Claims (11)

1.一种基于动态优化的图模型语义查询扩展方法,其特征在于,包括:
根据用户的查询需求,构造初始查询图,其中,所述初始查询图具有目标概念节点;
从已建立的知识库中获取待比较概念节点;其中,所述目标概念节点和所述待比较概念节点均具有多个维度的描述信息;
计算所述目标概念节点与所述待比较概念节点之间的第一语义相似度;
当所述第一语义相似度达到第一预设相似度,根据所述目标概念节点和所述待比较概念节点的各维度的描述信息,分别计算所述目标概念节点与所述待比较概念节点之间各维度的第二语义相似度;
当任一维度的第二语义相似度达到相应维度的第二预设相似度,将所述待比较概念节点在相应维度的描述信息作为所述目标概念节点在相应维度的扩展描述信息;
在所述初始查询图上,基于所述目标概念节点在至少一个维度的扩展描述信息,生成扩展查询图;
所述计算所述目标概念节点与所述待比较概念节点之间的第一语义相似度,包括:
根据所述目标概念节点与所述待比较概念节点的所述多个维度的描述信息,计算所述目标概念节点与所述待比较概念节点之间的第一语义相似度。
2.如权利要求1所述的基于动态优化的图模型语义查询扩展方法,其特征在于,所述多个维度的描述信息包括节点名称维度、属性维度、属性值维度和/或属性-属性值对维度的描述信息。
3.如权利要求1所述的基于动态优化的图模型语义查询扩展方法,其特征在于,各维度的描述信息由词语和/或数值表示。
4.如权利要求1所述的基于动态优化的图模型语义查询扩展方法,其特征在于,所述在所述初始查询图上,基于所述目标概念节点在至少一个维度的扩展描述信息,生成扩展查询图,包括:
从所述目标概念节点在至少一个维度的扩展描述信息中,依次选取各维度的一个扩展描述信息,构造至少一个扩展描述信息组合;
在所述初始查询图上,根据各扩展描述信息组合,生成各扩展查询图。
5.如权利要求1所述的基于动态优化的图模型语义查询扩展方法,其特征在于,所述初始查询图具有用于表示所述目标概念节点与其他概念节点之间的关系的边;所述方法还包括:
计算所述目标概念节点与所述待比较概念节点之间的关系相似度;
当所述关系相似度达到第三预设相似度,将所述待比较概念节点所连接的边作为所述目标概念节点的扩展边;
所述在所述初始查询图上,基于所述目标概念节点在至少一个维度的扩展描述信息,生成扩展查询图,包括:
在所述初始查询图上,基于所述目标概念节点在至少一个维度的扩展描述信息以及至少一个扩展边,生成扩展查询图。
6.如权利要求5所述的基于动态优化的图模型语义查询扩展方法,其特征在于,所述计算所述目标概念节点与所述待比较概念节点之间的关系相似度,包括:
根据所述目标概念节点与所述待比较概念节点所连接的边的关系类型,以及所述目标概念节点的邻居概念节点与所述待比较概念节点的邻居概念节点之间的第三语义相似度,计算所述目标概念节点与所述待比较概念节点之间的关系相似度。
7.如权利要求5所述的基于动态优化的图模型语义查询扩展方法,其特征在于,所述在所述初始查询图上,基于所述目标概念节点在至少一个维度的扩展描述信息以及至少一个扩展边,生成扩展查询图,包括:
从所述目标概念节点在至少一个维度的扩展描述信息以及所述至少一个扩展边中,依次选取各维度的一个扩展描述信息以及一个扩展边,构造至少一个扩展描述信息组合;
在所述初始查询图上,根据各扩展描述信息组合,生成各扩展查询图。
8.如权利要求7所述的基于动态优化的图模型语义查询扩展方法,其特征在于,所述从所述目标概念节点在至少一个维度的扩展描述信息中,依次选取各维度的一个扩展描述信息,构造至少一个扩展描述信息组合,包括:
根据所述目标概念节点与所述待比较概念节点之间各维度的第二语义相似度以及所述目标概念节点与所述待比较概念节点之间的关系相似度,计算所述目标概念节点与所述待比较概念节点之间的总相似度;
当所述目标概念节点与所述待比较概念节点之间的总相似度达到第四预设相似度,从所述目标概念节点在至少一个维度的扩展描述信息以及所述至少一个扩展边中,依次选取各维度的一个扩展描述信息以及一个扩展边,构造至少一个扩展描述信息组合,所构造的所述至少一个扩展描述组合包含所述至少一个维度的全部扩展描述信息以及全部扩展边;
当所述目标概念节点与所述待比较概念节点之间的总相似度低于第四预设相似度,从所述目标概念节点在至少一个维度的扩展描述信息以及所述至少一个扩展边中,依次选取各维度的一个扩展描述信息以及一个扩展边,构造至少一个扩展描述信息组合,所构造的所述至少一个扩展描述组合包含所述至少一个维度的部分扩展描述信息以及部分扩展边。
9.一种基于动态优化的图模型语义查询扩展装置,其特征在于,包括:
初始查询图构造模块,用于根据用户的查询需求,构造初始查询图,其中,所述初始查询图具有目标概念节点;
待比较概念节点获取模块,用于从已建立的知识库中获取待比较概念节点;其中,所述目标概念节点和所述待比较概念节点均具有多个维度的描述信息;
第一语义相似度计算模块,用于计算所述目标概念节点与所述待比较概念节点之间的第一语义相似度;
第二语义相似度计算模块,用于当所述第一语义相似度达到第一预设相似度,根据所述目标概念节点和所述待比较概念节点的各维度的描述信息,分别计算所述目标概念节点与所述待比较概念节点之间各维度的第二语义相似度;
扩展描述信息选取模块,用于当任一维度的第二语义相似度达到相应维度的第二预设相似度,将所述待比较概念节点在相应维度的描述信息作为所述目标概念节点在相应维度的扩展描述信息;
扩展查询图生成模块,用于在所述初始查询图上,基于所述目标概念节点在至少一个维度的扩展描述信息,生成扩展查询图;
所述第一语义相似度计算模块具体用于根据所述目标概念节点与所述待比较概念节点的所述多个维度的描述信息,计算所述目标概念节点与所述待比较概念节点之间的第一语义相似度。
10.一种电子设备,其特征在于,包括:至少一个处理器,以及与所述至少一个处理器通信连接的存储器,其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器执行权利要求1-8中任一项所述的方法。
11.一种存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时,实现权利要求1-8中任一项所述的方法。
CN202110474807.9A 2021-04-29 2021-04-29 基于动态优化的图模型语义查询扩展方法和装置 Active CN113139389B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110474807.9A CN113139389B (zh) 2021-04-29 2021-04-29 基于动态优化的图模型语义查询扩展方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110474807.9A CN113139389B (zh) 2021-04-29 2021-04-29 基于动态优化的图模型语义查询扩展方法和装置

Publications (2)

Publication Number Publication Date
CN113139389A CN113139389A (zh) 2021-07-20
CN113139389B true CN113139389B (zh) 2023-01-13

Family

ID=76816402

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110474807.9A Active CN113139389B (zh) 2021-04-29 2021-04-29 基于动态优化的图模型语义查询扩展方法和装置

Country Status (1)

Country Link
CN (1) CN113139389B (zh)

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101630314A (zh) * 2008-07-16 2010-01-20 中国科学院自动化研究所 一种基于领域知识的语义查询扩展方法
CN102760140A (zh) * 2011-04-29 2012-10-31 淮海工学院 一种基于事件本体的查询扩展方法
CN103617157A (zh) * 2013-12-10 2014-03-05 东北师范大学 基于语义的文本相似度计算方法
CN103927360A (zh) * 2014-04-18 2014-07-16 北京大学 基于图模型的软件项目语义信息表示及检索方法
CN105808525A (zh) * 2016-03-29 2016-07-27 国家计算机网络与信息安全管理中心 一种基于相似概念对的领域概念上下位关系抽取方法
CN111428031A (zh) * 2020-03-20 2020-07-17 电子科技大学 一种融合浅层语义信息的图模型过滤方法
CN111831911A (zh) * 2020-07-16 2020-10-27 北京奇艺世纪科技有限公司 查询信息的处理方法、装置、存储介质和电子装置
CN112115327A (zh) * 2020-03-04 2020-12-22 云南大学 一种基于主题模型的舆情新闻事件跟踪方法
CN112380352A (zh) * 2020-10-28 2021-02-19 中国商用飞机有限责任公司北京民用飞机技术研究中心 一种交互式检索方法、装置、计算机设备及存储介质

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7987491B2 (en) * 2002-05-10 2011-07-26 Richard Reisman Method and apparatus for browsing using alternative linkbases
US7403890B2 (en) * 2002-05-13 2008-07-22 Roushar Joseph C Multi-dimensional method and apparatus for automated language interpretation
CN102306182A (zh) * 2011-08-30 2012-01-04 西华大学 基于概念语义背景图挖掘用户兴趣的方法
US11080330B2 (en) * 2019-02-26 2021-08-03 Adobe Inc. Generation of digital content navigation data
CN110704743B (zh) * 2019-09-30 2022-02-18 北京科技大学 一种基于知识图谱的语义搜索方法及装置
CN111737413A (zh) * 2020-05-26 2020-10-02 湖北师范大学 基于概念网语义的反馈模型信息检索方法、系统及介质

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101630314A (zh) * 2008-07-16 2010-01-20 中国科学院自动化研究所 一种基于领域知识的语义查询扩展方法
CN102760140A (zh) * 2011-04-29 2012-10-31 淮海工学院 一种基于事件本体的查询扩展方法
CN103617157A (zh) * 2013-12-10 2014-03-05 东北师范大学 基于语义的文本相似度计算方法
CN103927360A (zh) * 2014-04-18 2014-07-16 北京大学 基于图模型的软件项目语义信息表示及检索方法
CN105808525A (zh) * 2016-03-29 2016-07-27 国家计算机网络与信息安全管理中心 一种基于相似概念对的领域概念上下位关系抽取方法
CN112115327A (zh) * 2020-03-04 2020-12-22 云南大学 一种基于主题模型的舆情新闻事件跟踪方法
CN111428031A (zh) * 2020-03-20 2020-07-17 电子科技大学 一种融合浅层语义信息的图模型过滤方法
CN111831911A (zh) * 2020-07-16 2020-10-27 北京奇艺世纪科技有限公司 查询信息的处理方法、装置、存储介质和电子装置
CN112380352A (zh) * 2020-10-28 2021-02-19 中国商用飞机有限责任公司北京民用飞机技术研究中心 一种交互式检索方法、装置、计算机设备及存储介质

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
Sequential Query Expansion using Concept Graph;Saeid Balaneshin-kordan等;《ResearchGate》;20161028;第1-10页 *
基于文本的语义标签提取方法研究;李雄;《中国优秀硕士学位论文全文数据库信息科技辑》;20190515(第5期);第I138-1782页 *
基于语义查询扩展的微博检索;唐晓波等;《信息技术》;20140325(第2期);第34页-38页 *
基于领域本体和Lucene的语义检索系统研究;王欢等;《计算机应用》;20100601;第30卷(第06期);第1655页-1660页 *
面向用户学习过程的查询扩展方法研究;张博;《中国博士学位论文全文数据库信息科技辑》;20180715;第I138-103页 *

Also Published As

Publication number Publication date
CN113139389A (zh) 2021-07-20

Similar Documents

Publication Publication Date Title
CN106484875B (zh) 基于molap的数据处理方法及装置
WO2020143326A1 (zh) 知识数据存储方法、装置、计算机设备和存储介质
CN106874426B (zh) 基于Storm的RDF流式数据关键词实时搜索方法
CN104239513A (zh) 一种面向领域数据的语义检索方法
US20140136468A1 (en) Quantitative assessment of similarity of categorized data
CN105335402B (zh) 基于静态Cache的搜索方法、索引数据生成方法以及装置
CN104866471B (zh) 一种基于局部敏感哈希策略的实例匹配方法
CN108681603B (zh) 数据库中快速搜索树形结构数据的方法、存储介质
CN101566988A (zh) 一种模糊语义搜索方法、系统及设备
Yeganeh et al. A framework for data quality aware query systems
CN113254630B (zh) 一种面向全球综合观测成果的领域知识图谱推荐方法
CN110633365A (zh) 一种基于词向量的层次多标签文本分类方法及系统
Taheriyan et al. A scalable approach to learn semantic models of structured sources
CN106528648A (zh) 结合Redis内存数据库的分布式RDF关键词近似搜索方法
CN109241278A (zh) 科研知识管理方法及系统
CN110851616A (zh) 一种基于领域子图的rdf知识图谱存储与管理方法
CN111274332A (zh) 一种基于知识图谱的专利智能检索方法及系统
CN115563313A (zh) 基于知识图谱的文献书籍语义检索系统
CN105159898A (zh) 一种搜索的方法和装置
CN113139389B (zh) 基于动态优化的图模型语义查询扩展方法和装置
Hamdi et al. A pattern growth-based approach for mining spatiotemporal co-occurrence patterns
CN117010373A (zh) 一种电力设备资产管理数据所属类别和组的推荐方法
CN116628303A (zh) 一种基于提示学习的半结构化网页属性值抽取方法和系统
CN105912649A (zh) 一种数据库模糊检索方法和系统
CN114461813A (zh) 一种基于知识图谱的数据推送方法、系统和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant