CN113254550B - 基于知识图谱的推荐方法、电子设备和计算机存储介质 - Google Patents

基于知识图谱的推荐方法、电子设备和计算机存储介质 Download PDF

Info

Publication number
CN113254550B
CN113254550B CN202110722492.5A CN202110722492A CN113254550B CN 113254550 B CN113254550 B CN 113254550B CN 202110722492 A CN202110722492 A CN 202110722492A CN 113254550 B CN113254550 B CN 113254550B
Authority
CN
China
Prior art keywords
entity
path
semantic
paths
vectors
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110722492.5A
Other languages
English (en)
Other versions
CN113254550A (zh
Inventor
郑燕玲
陈立力
周明伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Dahua Technology Co Ltd
Original Assignee
Zhejiang Dahua Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang Dahua Technology Co Ltd filed Critical Zhejiang Dahua Technology Co Ltd
Priority to CN202110722492.5A priority Critical patent/CN113254550B/zh
Publication of CN113254550A publication Critical patent/CN113254550A/zh
Application granted granted Critical
Publication of CN113254550B publication Critical patent/CN113254550B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/288Entity relationship models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/216Parsing using statistical methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Abstract

本申请公开了一种基于知识图谱的推荐方法、电子设备和计算机存储介质,该方法包括:获得知识图谱,在知识图谱中提取第一实体和第二实体之间第一长度阈值内的多个第一路径;基于每个第一路径上的所有实体,获取每个第一路径对应的特征向量;在特征向量中提取多种语义类型分别对应的语义向量并集成,以获得每个第一路径对应的路径向量;基于所有路径向量从多个第一路径中获得推荐路径,并给出推荐路径上第一实体和第二实体之间的相似特征。通过上述方式,本申请能够提高知识图谱中路径推荐的合理性,并给出相应的推荐理由提高可解释性。

Description

基于知识图谱的推荐方法、电子设备和计算机存储介质
技术领域
本申请涉及数据分析技术领域,特别是涉及一种基于知识图谱的推荐方法、电子设备和计算机存储介质。
背景技术
随着当前社会信息和人员交流逐渐频繁,为便于对不同的实体进行关系分析,能够反馈实体之间关系的知识图谱技术应运而生,其中,知识图谱由点和边组成,每个点代表一类实体,每条边代表两个实体之间的关系。
现有技术中,在知识图谱中获取两个实体之间的路径时会存在大量噪音数据,并且忽略了路径上实体对应的语义信息,以致基于知识图谱进行路径的推荐时不够合理且可解释性不足。有鉴于此,如何提高知识图谱中路径推荐的合理性并给出相应的推荐理由提高可解释性成为亟待解决的问题。
发明内容
本申请主要解决的技术问题是提供一种基于知识图谱的推荐方法、电子设备和计算机存储介质,能够提高知识图谱中路径推荐的合理性,并给出相应的推荐理由提高可解释性。
为解决上述技术问题,本申请第一方面提供一种基于知识图谱的推荐方法,该方法包括:获得知识图谱,在所述知识图谱中提取第一实体和第二实体之间第一长度阈值内的多个第一路径;基于每个所述第一路径上的所有实体,获取每个所述第一路径对应的特征向量;在所述特征向量中提取多种语义类型分别对应的语义向量并集成,以获得每个所述第一路径对应的路径向量;基于所有所述路径向量从多个所述第一路径中获得推荐路径,并给出所述推荐路径上所述第一实体和所述第二实体之间的相似特征。
为解决上述技术问题,本申请第二方面提供一种电子设备,该电子设备包括:相互耦接的存储器和处理器,其中,所述存储器存储有程序数据,所述处理器调用所述程序数据以执行上述第一方面所述的方法。
为解决上述技术问题,本申请第三方面提供一种计算机存储介质,其上存储有程序数据,所述程序数据被处理器执行时实现上述第一方面所述的方法。
本申请的有益效果是:本申请在获得知识图谱后,提取其中第一实体和第二实体之间第一长度阈值内的多个第一路径,从而滤除部分第一实体和第二实体之间的噪音数据,获取每个路径对应的特征向量,进而基于特征向量提取多种语义类型对应的语义向量,从而获取第一路径上实体对应的语义信息,将语义向量集成获得每个第一路径对应的路径向量,由于路径向量中包括多种语义类型的语义信息,基于所有路径向量从第一路径中选择出推荐路径,进而基于推荐路径对应的路径向量可给出推荐路径上第一实体和第二实体之间的相似特征,提高了知识图谱中路径推荐的合理性,并给出相应的推荐理由提高了可解释性。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。其中:
图1是本申请基于知识图谱的推荐方法一实施方式的流程示意图;
图2是本申请知识图谱一实施方式对应的拓扑结构图;
图3是本申请基于知识图谱的推荐方法另一实施方式的流程示意图;
图4是本申请电子设备一实施方式的结构示意图;
图5是本申请计算机存储介质一实施方式的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性的劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本文中术语“系统”和“网络”在本文中常被可互换使用。本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。此外,本文中的“多”表示两个或者多于两个。
请参阅图1,图1是本申请基于知识图谱的推荐方法一实施方式的流程示意图,该方法包括:
S101:获得知识图谱,在知识图谱中提取第一实体和第二实体之间第一长度阈值内的多个第一路径。
具体地,响应于获得知识图谱,知识图谱由点和边组成,每个点代表一类实体,每条边代表两个实体之间的关系,请参阅图2,图2是本申请知识图谱一实施方式对应的拓扑结构图,其中,图2所示的知识图谱体现了以吕退谁为中心的关于股份收购事件的知识图谱,每个点中对应有实体的名称,每个实体之间对应有实体之间的关系,并通过线来连接。
进一步地,在获得知识图谱后,从知识图谱中获取第一实体与第二实体之间第一长度阈值内的多条第一路径,从而实现第一实体和第二实体之间的导通关系。其中,第一长度阈值与第一实体和第二实体之间的实体的个数相关,第一实体和第二实体之间的实体的个数越多,则第一长度阈值越长。
在一应用场景中,以图2为例,光佩文为第一实体,股份收购为第二实体,当第一长度阈值为5时,则从光佩文至股份收购可获得:光佩文→吕退谁→事件→股份收购、光佩文→女→吕退谁→事件→股份收购以及光佩文→公务员→王继光→吕退谁→事件→股份收购共3条第一路径,当第一阈值长度为3时,则光佩文→公务员→王继光→吕退谁→事件→股份收购该路径被滤除,从而减少第一路径中的噪音数据。
S102:基于每个第一路径上的所有实体,获取每个第一路径对应的特征向量。
具体地,分别提取第一路径上的所有实体,获取实体所对应的特征信息,基于实体所对应的特征信息从而生成每个第一路径所对应的特征向量。
在一应用方式中,提取实体对应的特征信息,进而将特征信息作为第一路径上每个实体在向量中对应的元素,生成每个第一路径所对应的特征向量。
在一具体应用场景中,以图2为例,实体可是人或者事件,比如人实体存在性别籍贯等相关的特征信息,事件实体存在事件类型和事件描述等相关特征信息,将特征信息转换为预设维度的向量,以获得每个第一路径对应的特征向量。
S103:在特征向量中提取多种语义类型分别对应的语义向量并集成,以获得每个第一路径对应的路径向量。
具体地,将特征向量中不同语义类型下对应的语义向量提取出来并集成为一个向量,以获得第一路径对应的路径向量。其中,语义类型可以是血缘关系、工作关系、位置关系和时间关系中的一种或几种。
在一应用方式中,将特征向量输入预先训练过的语义模型,其中语义模型对应有多种语义类型的语义提取模块,经过语义模型后输出特征向量对应的多种语义类型的语义向量,进而将语义向量集成后作为第一路径对应的路径向量。
S104:基于所有路径向量从多个第一路径中获得推荐路径,并给出推荐路径上第一实体和第二实体之间的相似特征。
具体地,在所有路径向量中选择至少一个第一路径向量,将第一路径向量对应的第一路径作为推荐路径,由于每个路径向量中集成有多种语义类型的语义向量,结合推荐路径对应的路径向量集成的语义向量包含的语义信息,以及推荐路径上的实体所对应的特征信息,给出推荐路径上第一实体和第二实体之间的相似特征,将该相似特征作为推荐理由,提高推荐路径的可解释性。
在一应用方式中,将所有路径向量线性处理,进而将线性处理后的路径向量归一化,以获得路径向量在0-1之间的一个路径数值,其中,路径数值越高表示路径向量中的语义特征越突出,进而将最大的路径数值所对应的第一路径作为推荐路径,提取推荐路径对应的路径向量中的语义向量,获取语义向量对应的语义信息,基于推荐路径上实体对应的语义信息给出推荐路径上第一实体和第二实体之间的相似特征。
上述方案,在获得知识图谱后,提取其中第一实体和第二实体之间第一长度阈值内的多个第一路径,从而滤除部分第一实体和第二实体之间的噪音数据,获取每个路径对应的特征向量,进而基于特征向量提取多种语义类型对应的语义向量,从而获取第一路径上实体对应的语义信息,将语义向量集成获得每个第一路径对应的路径向量,由于路径向量中包括多种语义类型的语义信息,基于所有路径向量从第一路径中选择出推荐路径,进而基于推荐路径对应的路径向量可给出推荐路径上第一实体和第二实体之间的相似特征,提高了知识图谱中路径推荐的合理性,并给出相应的推荐理由提高了可解释性。
请参阅图3,图3是本申请基于知识图谱的推荐方法另一实施方式的流程示意图,该方法包括:
S201:获得知识图谱,在知识图谱中提取第一实体和第二实体之间第一长度阈值内的多个第一路径。
具体地,在获取到知识图谱后,在知识图谱中以第一实体为起点经过至少一个第三实体到达第二实体,从而获得多个路径,提取其中第一长度阈值内的路径作为第一路径。
在一应用方式中,在知识图谱中以第一实体为起点,利用随机游走算法生成从第一实体出发至第二实体的多个路径;在多个路径中提取第一长度阈值之内的所有路径作为第一路径。
具体地,基于随机游走算法可以在知识图谱中生成从任一实体至其他任一实体的多条路径,对于多条路径仅仅考虑第一实体和第二实体之间的路径,这些路径对于后续推荐最有帮助,其余路径则为干扰路径,属于噪音数据,将第一实体和第二实体之外的其他路径滤除,减少噪音数据的影响。
进一步地,筛选出第一实体和第二实体之间的路径中在第一长度阈值之内的路径,通过第一长度阈值筛选第一实体和第二实体之间的路径,引入较短的路径能够很好的建立实体之间的关系,较长的路径可能会引入关联意义较远的实体,从而失去语义意义,进而引入大量噪音。通过限定在第一实体和第二实体之间且符合第一长度阈值的条件,从而筛选出第一路径,以便滤除大量的噪音数据,提高数据处理的效率。
在一具体应用场景中,利用随机游走算法生成从第一实体出发至第二实体的多个路径的步骤之前,还包括:为第一实体和第二实体之间的任一第三实体设置对应的游走权重;利用随机游走算法生成从第一实体出发至第二实体的多个路径的步骤,包括:响应于游走至第一实体和第二实体之间的任一第三实体,基于第三实体对应的游走权重,向侧重游走权重的方向游走至其他第三实体,直至游走至第二实体。
具体地,随机游走算法的基本思想是从一个或一系列顶点开始进行遍历,在任意一个顶点,遍历者将以概率1-a游走到这个顶点的相邻顶点,以概率a随机跳跃到图中的任何一个顶点,每次游走后得出一个概率分布,该概率分布刻画了每一个顶点被访问到的概率,用这个概率分布作为下一次游走的输入并反复迭代这一过程。当满足一定前提条件时,这个概率分布会趋于收敛,进而可以得到一个平稳的概率分布。
其中,利用随机游走算法从任一第三实体跳转至其他第三实体时设有对应的游走权重,基于第三实体对应的类型,为第三实体设置对应的游走权重,以使利用随机游走算法游走至第一实体和第二实体之间的任一第三实体时,能够基于第三实体对应的游走权重,向侧重游走权重的方向游走至其他类型相近的第三实体,以使最终获取的第一路径能够分别侧重于不同的类型,提高第一路径的可解释性。
在一应用场景中,第一实体和第二实体对应两起突发事件,在知识图谱中利用随机游走算法进行游走时,则为中间的第三实体设置对应的权重时,根据第三实体的类型,为第三实体设置对应的游走权重,对于时间实体和人实体这两种类型的实体,为人实体设置更高的权重,因为同一个人发生的案件关联度高于同一个时间发生的关联度。
S202:基于每个第一路径上的实体对应的特征信息,获取每个第一路径对应的第一特征向量。
具体地,每条第一路径上的每个实体都存在有用的特征信息,例如实体的类型是人或车或事件,人实体存在性别籍贯等相关的信息,事件实体也存在事件类型,事件描述等相关信息,同时实体在路径上的顺序也是一类有用的特种信息。通过启发式规则对这些特征信息进行提取,获得路径上每个实体对应的特征信息,将特征信息转换为第一特征向量。
S203:基于每个第一路径上的实体对应的潜在语义,获取每个第一路径对应的第二特征向量。
具体地,每条第一路径上的每个实体都存在有用的潜在语义,例如第一人实体对应的职业是公务员,其潜在语义则表示该第一人实体为公职人员,当第一人实体还对应有亲属关系的第二人实体,则第二人实体涉及的事件,在潜在语义上与第一人实体存在可能的关联性。通过启发式规则对这些潜在语义进行提取,获得路径上每个实体对应的潜在语义,将潜在语义转换为第二特征向量。
在一应用方式中,将每个第一路径上的所有实体分别映射到维度低于第一阈值的稠密向量中,以获得实体对应的潜在语义;将稠密向量中的元素组成每个第一路径对应的第二特征向量。
具体地,将第一路径中的每个实体输入到嵌入层中,嵌入层利用分布式表示第一路径中的实体,将第一路径中的实体映射到一个维度低于第一阈值的稠密向量中,也就是将第一路径中的实体映射到一个低维的稠密向量中,该低维的稠密向量中的元素则表示该实体的潜在语义,通过提取第一路径中每个实体的潜在语义,以便于后续对语义信息进行挖掘并给出推荐路径的推荐理由,提高推荐路径的合理性。
S204:将第一特征向量与第二特征向量对应拼接,以获得每个第一路径对应的特征向量。
具体地,将同一第一路径所对应的第一特征向量和第二特征向量进行拼接,以将实体的特征信息所对应的第一特征向量和实体的潜在语义对应的第二特征向量均集成到特征向量中,以使特征向量中包含实体对应的特征信息和潜在语义,从而充分挖掘第一路径中的实体所包含的有效信息和潜在信息。
在一应用场景中,当获取到的第一特征向量为N维向量,第二特征向量为M维向量,进而将第一特征向量与第二特征向量对应拼接后获得的特征向量为N+M维向量。
S205:将同一特征向量分别送入多种语义类型对应的语义模型,以获得多种语义模型分别输出的语义向量。
具体地,每种语义类型对应有一个语义模型,将同一特征向量分别送入多种语义类型所对应的语义模型中,从而获得多个语义模型分别输出的语义向量,进而将特征向量中不同侧重点的语义信息被充分提取出来,且不同的语义模型在提取语义信息时互不干扰。
S206:将同一特征向量对应的所有语义向量集成,以获得路径对应的路径向量。
具体地,将同一特征向量所对应的所有语义向量进行集成,采用stacking的集成思想,通过不同的模型提取特征向量的语义信息所对应的语义向量,经过集成后获得的路径向量中,多种语义类型所对应的语义向量之间能取长补短,更充分地提取出第一路径中的实体所对应的隐含的语义信息,从中挖掘出相比潜在语义更加深层次的语义信息,更充分地获得第一实体和第二实体之间的关联性。
在一应用方式中,语义模型为循环神经网络模型,将同一特征向量分别送入多种语义类型对应的语义模型,以获得多种语义模型分别输出的语义向量的步骤,包括:将同一特征向量分别送入多种语义类型对应的循环神经网络模型中,以使所有循环神经网络模型分别提取每个语义类型对应的语义信息,进而基于语义信息生成语义向量。
具体地,循环神经网络是一类以序列数据为输入,在序列的演进方向进行递归且所有节点按链式连接的递归神经网络,因此,循环神经网络对具有序列特性的数据非常有效,它能挖掘数据中的时序信息以及语义信息,而特征向量作为多维向量具有序列特性,藉由循环神经网络对特征向量进行挖掘,能够充分获取特征向量中隐含的语义信息。
进一步地,预先训练语义类型对应的循环神经网络模型,且每种语义类型对应有一个循环神经网络模型,将同一特征向量分别送入多种语义类型对应的循环神经网络模型中,从而利用多种语义类型对应的循环神经网络模型来提取隐含的语义信息,将提取出来的语义信息转换为语义向量。其中,语义类型可以包括对词性、意图、标签的提取,在其他实施例中还可以包括其他预先训练过的语义类型所对应的循环神经网络模型。
S207:基于所有路径向量从多个第一路径中获得推荐路径,并给出推荐路径上第一实体和第二实体之间的相似特征。
具体地,对所有第一路径对应的路径向量进行最大池化,以获得至少一第一路径及其对应的第一路径向量。其中,对路径向量进行最大池化后,可获得第一实体和第二实体之间的最显著的特征,当第二实体的数目为1时,假设获取到第一实体和第二实体之间S条第一路径,对S条第一路径进行最大池化,以输出一个第一路径及其对应的第一路径向量,当第二实体的数目为大于1的整数N时,重复上述过程,可获得N个第一路径及其对应的第一路径向量。
进一步地,对第一路径向量进行线性处理并经二分类模型后,获得推荐路径对应的第一实体和第二实体之间的相似度。
在一应用方式中,将第一路径向量输入到一个线性层后经过一个sigmoid函数,得到两个案件的介于0-1之间相似度值。其中,sigmoid函数的值域为(0,1),通过sigmoid函数的输出结果来表示第一实体和第二实体之间的相似度,数值越大则相似度越高。
进一步地,基于相似度从多个第一路径中获得推荐路径,进而给出推荐路径上第一实体和第二实体之间的相似特征。
在一应用方式中,基于相似度的数值进行排序,进而按照当前的排序找出相似度最高的第一路径作为推荐路径,给出对应的推荐理由,这类理由可通过启发式规则获取,基于第一路径向量中集成的语义向量对应的语义信息以及实体对应的特征信息,给出推荐路径上第一实体和第二实体之间的相似特征。
在一应用场景中,基于用户当前浏览的事件,获取该事件与其他事件的第一路径若干,对第一路径对应的第一路径进行最大池化后,计算当前事件与其他事件的相似程度从而排序展示。对于推荐路径的推荐理由,如果有相同的事件人,则推荐理由为“相同事件人”;如果有相同的发生地址,则推荐理由为“相同地点”;如果有相似的事件类型或事件描述,则推荐理由为“同类事件”。
在本实施例中,利用随机游走算法获取路径时,通过限定在第一实体和第二实体之间且第一长度阈值内的路径来提高路径获取的效率,并且通过设置游走权重来选择关联性更突出的路径,降低了噪声数据的比例,通过充分挖掘第一路径上实体对应的特征信息和潜在语义来生成特征向量,并基于特征向量利用循环神经网络模型来充分挖掘多种语义类型的语义向量,从而提高第一实体与第二实体之间相似度的准确性,基于第一实体和第二实体之间的相似度获取推荐路径,并给出相应的推荐理由,提高推荐的合理性和可解释性。
请参阅图4,图4是本申请电子设备一实施方式的结构示意图,该电子设备40包括相互耦接的存储器401和处理器402,其中,存储器401存储有程序数据(图未示),处理器402调用程序数据以实现上述任一实施例中的方法,相关内容的说明请参见上述方法实施例的详细描述,在此不再赘叙。
请参阅图5,图5是本申请计算机存储介质一实施方式的结构示意图,该计算机存储介质50存储有程序数据500,该程序数据500被处理器执行时实现上述任一实施例中的方法,相关内容的说明请参见上述方法实施例的详细描述,在此不再赘叙。
需要说明的是,作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施方式方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本申请各个实施方式方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅为本申请的实施方式,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利保护范围内。

Claims (7)

1.一种基于知识图谱的推荐方法,其特征在于,所述方法包括:
获得知识图谱,在所述知识图谱中提取第一实体和第二实体之间第一长度阈值内的多个第一路径;
基于每个所述第一路径上的所有实体,获取每个所述第一路径对应的特征向量;所述特征向量基于所述第一路径上的所有实体对应的特征信息生成;
在所述特征向量中提取多种语义类型分别对应的语义向量并集成,以获得每个所述第一路径对应的路径向量;
基于所有所述路径向量从多个所述第一路径中获得推荐路径,并给出所述推荐路径上所述第一实体和所述第二实体之间的相似特征;所述相似特征基于所述推荐路径对应的路径向量集成的语义向量给出;
其中,所述在所述特征向量中提取多种语义类型分别对应的语义向量并集成,以获得每个所述第一路径对应的路径向量的步骤,包括:
将同一所述特征向量分别送入多种语义类型对应的语义模型,以获得多种所述语义模型分别输出的语义向量;所述语义类型包括血缘关系、工作关系、位置关系和时间关系中的一种或几种;
将同一所述特征向量对应的所有所述语义向量集成,以获得每个所述第一路径对应的路径向量;每个所述路径向量中集成有多种语义类型的语义向量;
其中,所述在所述知识图谱中提取第一实体和第二实体之间第一长度阈值内的多个第一路径的步骤,包括:
在所述知识图谱中以所述第一实体为起点,利用随机游走算法生成从所述第一实体出发至所述第二实体的多个路径;
在所述多个路径中提取第一长度阈值之内的所有路径作为所述第一路径;
所述利用随机游走算法生成从所述第一实体出发至所述第二实体的多个路径的步骤之前,还包括:
为所述第一实体和所述第二实体之间的任一第三实体,基于所述第三实体对应的类型,为所述第三实体设置对应的游走权重;所述第三实体的类型为人或时间或车或事件;
所述利用随机游走算法生成从所述第一实体出发至所述第二实体的多个路径的步骤,包括:
响应于游走至所述第一实体和所述第二实体之间的任一第三实体,基于所述第三实体对应的游走权重,向侧重所述游走权重的方向游走至其他所述第三实体,直至游走至所述第二实体。
2.根据权利要求1所述的基于知识图谱的推荐方法,其特征在于,所述基于每个所述第一路径上的所有实体,获取每个所述第一路径对应的特征向量的步骤,包括:
基于每个所述第一路径上的实体对应的特征信息,获取每个所述第一路径对应的第一特征向量;
基于每个所述第一路径上的实体对应的潜在语义,获取每个所述第一路径对应的第二特征向量;
将所述第一特征向量与所述第二特征向量对应拼接,以获得每个所述第一路径对应的所述特征向量。
3.根据权利要求2所述的基于知识图谱的推荐方法,其特征在于,所述基于每个所述第一路径上的实体对应的潜在语义,获取每个所述第一路径对应的第二特征向量的步骤,包括:
将每个所述第一路径上的所有实体分别映射到维度低于第一阈值的稠密向量中,以获得所述实体对应的潜在语义;
将所述稠密向量中的元素组成每个所述第一路径对应的所述第二特征向量。
4.根据权利要求1所述的基于知识图谱的推荐方法,其特征在于,所述语义模型为循环神经网络模型,所述将同一所述特征向量分别送入多种语义类型对应的语义模型,以获得多种所述语义模型分别输出的语义向量的步骤,包括:
将同一所述特征向量分别送入多种语义类型对应的所述循环神经网络模型中,以使所有所述循环神经网络模型分别提取每个所述语义类型对应的语义信息,进而基于所述语义信息生成所述语义向量。
5.根据权利要求1所述的基于知识图谱的推荐方法,其特征在于,所述基于所有所述路径向量从多个所述第一路径中获得推荐路径,并给出所述推荐路径上所述第一实体和所述第二实体之间的相似特征的步骤,包括:
对所有所述第一路径对应的所述路径向量进行最大池化,以获得至少一所述第一路径及其对应的第一路径向量;
对所述第一路径向量进行线性处理并经二分类模型后,获得所述第一路径对应的所述第一实体和所述第二实体之间的相似度;
基于所述相似度从多个所述第一路径中获得所述推荐路径,进而给出所述推荐路径上所述第一实体和所述第二实体之间的相似特征。
6.一种电子设备,其特征在于,包括:相互耦接的存储器和处理器,其中,所述存储器存储有程序数据,所述处理器调用所述程序数据以执行如权利要求1-5中任一项所述的方法。
7.一种计算机存储介质,其上存储有程序数据,其特征在于,所述程序数据被处理器执行时实现如权利要求1-5中任一项所述的方法。
CN202110722492.5A 2021-06-29 2021-06-29 基于知识图谱的推荐方法、电子设备和计算机存储介质 Active CN113254550B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110722492.5A CN113254550B (zh) 2021-06-29 2021-06-29 基于知识图谱的推荐方法、电子设备和计算机存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110722492.5A CN113254550B (zh) 2021-06-29 2021-06-29 基于知识图谱的推荐方法、电子设备和计算机存储介质

Publications (2)

Publication Number Publication Date
CN113254550A CN113254550A (zh) 2021-08-13
CN113254550B true CN113254550B (zh) 2022-04-19

Family

ID=77190095

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110722492.5A Active CN113254550B (zh) 2021-06-29 2021-06-29 基于知识图谱的推荐方法、电子设备和计算机存储介质

Country Status (1)

Country Link
CN (1) CN113254550B (zh)

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8433670B2 (en) * 2011-03-03 2013-04-30 Xerox Corporation System and method for recommending items in multi-relational environments
US9547823B2 (en) * 2014-12-31 2017-01-17 Verizon Patent And Licensing Inc. Systems and methods of using a knowledge graph to provide a media content recommendation
CN107391542B (zh) * 2017-05-16 2021-01-01 浙江工业大学 一种基于文件知识图谱的开源软件社区专家推荐方法
CN108920527A (zh) * 2018-06-07 2018-11-30 桂林电子科技大学 一种基于知识图谱的个性化推荐方法
CN110309281A (zh) * 2019-05-28 2019-10-08 平安科技(深圳)有限公司 基于知识图谱的问答方法、装置、计算机设备及存储介质
CN110334221B (zh) * 2019-07-18 2022-12-09 桂林电子科技大学 一种基于知识图谱路径的可解释性推荐方法
CN110837892A (zh) * 2019-11-12 2020-02-25 广东外语外贸大学 基于带类型关系路径嵌入的事实溯因推理方法
CN110929046B (zh) * 2019-12-10 2022-09-30 华中师范大学 一种基于异质网络嵌入的知识实体推荐方法及系统
CN111507796A (zh) * 2020-04-07 2020-08-07 桂林电子科技大学 一种基于知识图谱的网上商城商品推荐方法
CN112069408B (zh) * 2020-06-15 2023-06-09 北京理工大学 一种融合关系抽取的推荐系统及方法
CN112417306B (zh) * 2020-12-10 2024-02-02 北京工业大学 基于知识图谱的推荐算法性能优化的方法
CN112699246B (zh) * 2020-12-21 2022-09-27 南京理工大学 基于知识图谱的领域知识推送方法
CN112770013B (zh) * 2021-01-15 2022-05-20 电子科技大学 一种基于边采样的异质信息网络嵌入方法
CN112836120B (zh) * 2021-01-27 2024-03-22 深圳大学 一种基于多模态知识图谱的电影推荐方法、系统及终端

Also Published As

Publication number Publication date
CN113254550A (zh) 2021-08-13

Similar Documents

Publication Publication Date Title
Khan et al. Multi-gcn: Graph convolutional networks for multi-view networks, with applications to global poverty
CN110765117B (zh) 欺诈识别方法、装置、电子设备及计算机可读存储介质
CN110472154B (zh) 一种资源推送方法、装置、电子设备及可读存储介质
CN111222305A (zh) 一种信息结构化方法和装置
CN107807968B (zh) 基于贝叶斯网络的问答装置、方法及存储介质
CN111143178B (zh) 用户行为分析方法、装置及设备
CN113011889A (zh) 账号异常识别方法、系统、装置、设备及介质
CN110704692A (zh) 基于图嵌入的员工离职行为预测方法及装置
Song et al. Local-to-global mesh saliency
CN113392179A (zh) 文本标注方法及装置、电子设备、存储介质
CN113705596A (zh) 图像识别方法、装置、计算机设备和存储介质
CN113761192A (zh) 文本处理方法、文本处理装置及文本处理设备
CN113244627B (zh) 识别外挂的方法、装置、电子设备以及存储介质
Illig et al. A comparison of content-based tag recommendations in folksonomy systems
CN113254550B (zh) 基于知识图谱的推荐方法、电子设备和计算机存储介质
CN111553167A (zh) 文本类型识别方法和装置及存储介质
CN114491084B (zh) 基于自编码器的关系网络信息挖掘方法、装置及设备
CN109033078B (zh) 语句类别识别方法及装置、存储介质、处理器
CN115099344A (zh) 模型训练方法和装置、用户画像生成方法和装置、设备
CN113254788B (zh) 一种基于大数据的推荐方法、系统及可读存储介质
CN112784008B (zh) 案件相似度确定方法及装置、存储介质、终端
Tripathi et al. Facial expression recognition using data mining algorithm
CN113762423A (zh) 数据处理和模型训练方法、装置、电子设备及存储介质
CN113392312A (zh) 信息处理方法、系统及电子设备
CN112214556B (zh) 标签生成方法、装置、电子设备及计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant