CN112836126A - 基于知识图谱的推荐方法、装置、电子设备及存储介质 - Google Patents

基于知识图谱的推荐方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN112836126A
CN112836126A CN202110172199.6A CN202110172199A CN112836126A CN 112836126 A CN112836126 A CN 112836126A CN 202110172199 A CN202110172199 A CN 202110172199A CN 112836126 A CN112836126 A CN 112836126A
Authority
CN
China
Prior art keywords
entity
attribute
node
neighboring
knowledge
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110172199.6A
Other languages
English (en)
Inventor
李明杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Gree Electric Appliances Inc of Zhuhai
Zhuhai Lianyun Technology Co Ltd
Original Assignee
Gree Electric Appliances Inc of Zhuhai
Zhuhai Lianyun Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Gree Electric Appliances Inc of Zhuhai, Zhuhai Lianyun Technology Co Ltd filed Critical Gree Electric Appliances Inc of Zhuhai
Priority to CN202110172199.6A priority Critical patent/CN112836126A/zh
Publication of CN112836126A publication Critical patent/CN112836126A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/374Thesaurus
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/906Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例提供了一种基于知识图谱的推荐方法、装置、电子设备及存储介质,所述方法包括:获取目标文本信息,在预先构建的知识图谱中查找所述目标文本信息相匹配的实体节点;确定所述知识图谱中所述实体节点的近邻实体节点,以及确定所述知识图谱中所述近邻实体节点的关联实体节点;查找所述近邻实体节点对应的近邻实体,以及查找所述关联实体节点对应的关联实体;推荐所述近邻实体以及所述关联实体。本发明实施例引入知识图谱,通过知识图谱进行推荐,可以避免使用少量用户之间或物品之间较少的共性数据预测大量未知信息,避免数据过拟合的可能性,提高推荐精准度。

Description

基于知识图谱的推荐方法、装置、电子设备及存储介质
技术领域
本发明实施例涉及推荐技术领域,尤其涉及一种基于知识图谱的推荐方法、装置、电子设备及存储介质。
背景技术
在互联网时代,网络成为人们生活必不可少的一部分,是人们获得信息资源的重要途径。随着互联网的发展,网络上的资源也爆炸式的呈指数增长,导致信息过载的问题,如何呈现用户感兴趣的信息成为研究的热点与难点。个性化推荐系统面向用户,实现信息过滤,解决信息过载的问题,精准定位用户喜好信息。
相关技术中,传统的个性化推荐系统基于用户之间的共性数据协同过滤,或者基于物品之间的共性数据协同过滤,精准定位用户喜好信息。例如,用户M喜欢电影A,用户N与用户M年龄均为16岁,那么可以将电影A推荐给用户N。又例如,用户M喜欢电影A,电影A与电影B电影类型均为科幻类,那么可以将电影B推荐给用户M。
然而在实际应用场景中,少量用户之间或物品之间的共性数据较少,例如数据库中只有10个用户,并且用户N与用户M之间只有1个共性数据:年龄,但实际电影数量有10000个,容易出现使用少量用户之间或物品之间较少的共性数据预测大量未知信息,增大数据过拟合的可能性,降低推荐精准度。
发明内容
为了解决上述在实际应用场景中,少量用户之间或物品之间的共性数据较少,容易出现使用少量用户之间或物品之间较少的共性数据预测大量未知信息,增大数据过拟合的可能性,降低推荐精准度的技术问题,本发明实施例提供了一种基于知识图谱的推荐方法、装置、电子设备及存储介质。
在本发明实施例的第一方面,首先提供了一种基于知识图谱的推荐方法,所述方法包括:
获取目标文本信息,在预先构建的知识图谱中查找所述目标文本信息相匹配的实体节点;
确定所述知识图谱中所述实体节点的近邻实体节点,以及确定所述知识图谱中所述近邻实体节点的关联实体节点;
查找所述近邻实体节点对应的近邻实体,以及查找所述关联实体节点对应的关联实体;
推荐所述近邻实体以及所述关联实体。
在一个可选的实施方式中,所述推荐所述近邻实体以及所述关联实体,包括:
在所述目标文本信息中包括实体与属性关系的情况下,推荐所述近邻实体以及所述关联实体。
在一个可选的实施方式中,所述推荐所述近邻实体以及所述关联实体,包括:
在所述目标文本信息中包括实体的情况下,推荐所述实体节点与所述近邻实体节点之间的属性关系、所述近邻实体以及所述关联实体。
在一个可选的实施方式中,所述查找所述关联实体节点对应的关联实体,包括:
从所述关联实体节点中筛选与所述近邻实体节点之间的属性关系数量超过N的目标关联实体节点,其中,所述N为正整数;
查找所述目标关联实体节点对应的目标关联实体;
所述推荐所述近邻实体以及所述关联实体,包括:
推荐所述近邻实体以及所述目标关联实体。
在一个可选的实施方式中,所述方法还包括:
查找所述近邻实体的属性,以及查找所述关联实体的属性;
推荐所述近邻实体的属性以及所述关联实体的属性。
在一个可选的实施方式中,所述方法还包括:
在预先构建的知识图谱中,若未查找到所述目标文本信息相匹配的实体节点,将所述知识图谱中节点、节点之间属性关系进行组合;
确定所述目标文本信息与组合结果的相似度,基于所述相似度推荐所述知识图谱中节点对应的实体、节点之间属性关系。
在一个可选的实施方式中,所述知识图谱具体通过以下方式构建:
获取目标数据集,其中,所述目标数据集至少包括对象属性与物品属性;
提取所述对象属性与所述物品属性之间的属性关系,以及提取所述对象属性与所述物品属性对应的实体;
基于所述对象属性、所述物品属性、所述属性关系以及所述实体构建知识图谱。
在一个可选的实施方式中,所述提取所述对象属性与所述物品属性之间的属性关系,包括:
获取预设的数据字典,其中,所述数据字典中包括属性文本信息与第一属性关系;
从所述数据字典中查找所述对象属性与所述物品属性相匹配的所述属性文本信息,确定所述属性文本信息对应的所述第一属性关系;
将所述对象属性与所述物品属性输入至预设的分类模型,获取所述分类模型输出的第二属性关系;
确定所述第一属性关系与所述第二属性关系为所述对象属性与所述物品属性之间的属性关系。
在一个可选的实施方式中,所述提取所述对象属性与所述物品属性对应的实体,包括:
获取预设的实体列表,其中,所述实体列表包括实体文本信息与第一实体;
从所述实体列表中查找所述对象属性与所述物品属性相匹配的所述实体文本信息,确定所述实体文本信息对应的第一实体;
将所述对象属性与所述物品属性输入至预设的实体提取模型,获取所述实体提取模型输出的第二实体;
确定所述第一实体与所述第二实体为所述对象属性与所述物品属性对应的实体。
在一个可选的实施方式中,所述基于所述对象属性、所述物品属性、所述属性关系以及所述实体构建知识图谱,包括:
由所述对象属性、所述物品属性、所述属性关系以及所述实体建立二/三元组;
基于所述二/三元组构建知识图谱,其中,所述知识图谱中节点对应于所述实体,所述知识图谱中节点之间对应于所述属性关系。
在本发明实施例的第二方面,提供了一种基于知识图谱的推荐装置,所述装置包括:
节点查找模块,用于获取目标文本信息,在预先构建的知识图谱中查找所述目标文本信息相匹配的实体节点;
节点确定模块,用于确定所述知识图谱中所述实体节点的近邻实体节点,以及确定所述知识图谱中所述近邻实体节点的关联实体节点;
实体查找模块,用于查找所述近邻实体节点对应的近邻实体,以及查找所述关联实体节点对应的关联实体;
实体推荐模块,用于推荐所述近邻实体以及所述关联实体。
在本发明实施例的第三方面,还提供了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现上述第一方面中所述的基于知识图谱的推荐方法。
在本发明实施例的第四方面,还提供了一种存储介质,所述存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述第一方面中所述的基于知识图谱的推荐方法。
在本发明实施例的第五方面,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述第一方面中所述的基于知识图谱的推荐方法。
本发明实施例提供的技术方案,获取目标文本信息,在预先构建的知识图谱中查找目标文本信息相匹配的实体节点,确定知识图谱中实体节点的近邻实体节点,以及确定知识图谱中近邻实体节点的关联实体节点,查找近邻实体节点对应的近邻实体,以及查找关联实体节点对应的关联实体,推荐近邻实体以及关联实体。本发明实施例引入知识图谱,通过知识图谱进行推荐,可以避免使用少量用户之间或物品之间较少的共性数据预测大量未知信息,避免数据过拟合的可能性,提高推荐精准度。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例中示出的一种基于知识图谱的推荐方法的实施流程示意图;
图2为本发明实施例中示出的另一种基于知识图谱的推荐方法的实施流程示意图;
图3为本发明实施例中示出的一种知识图谱构建方法的实施流程示意图;
图4为本发明实施例中示出的一种知识图谱构建流程效果示意图;
图5为本发明实施例中示出的一种知识图谱效果示意图;
图6为本发明实施例中示出的一种基于知识图谱的推荐装置的结构示意图;
图7为本发明实施例中示出的一种电子设备的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
如图1所示,为本发明实施例提供的一种基于知识图谱的推荐方法的实施流程示意图,该方法具体可以包括以下步骤:
S101,获取目标文本信息,在预先构建的知识图谱中查找所述目标文本信息相匹配的实体节点。
在本发明实施例中,用户可以输入目标文本信息,从而获取用户输入的目标文本信息。对于目标文本信息,其中可以包括实体,或者可以包括实体和属性关系。
对于目标文本信息,在预先构建的知识图谱中查找该目标文本信息相匹配的实体节点,即在预先构建的知识图谱中查找该目标文本信息中实体相匹配的实体节点。
例如,用户输入目标文本信息:电影A,本发明实施例获取用户输入的目标文本信息,在预先构建的知识图谱中查找该目标文本信息相匹配的实体节点,即电影A相匹配的实体节点A。
需要说明的是,对于实体,例如可以是电影A、电影B、科幻类等,对于属性关系,例如可以是类型、购买、喜欢等,对于实体节点,例如可以是电影A、电影B、科幻类各自对应的节点,本发明实施例对此不作限定。
S102,确定所述知识图谱中所述实体节点的近邻实体节点,以及确定所述知识图谱中所述近邻实体节点的关联实体节点。
对于知识图谱中实体节点,本发明实施例确定知识图谱中实体节点的近邻实体节点,以及确定知识图谱中近邻实体节点的关联实体节点。其中,近邻实体节点与实体节点存在连接关系,关联实体节点与近邻实体节点存在连接关系。
例如,对于知识图谱中实体节点A,本发明实施例确定知识图谱中实体节点A的近邻实体节点B,近邻实体节点B与实体节点A存在连接关系,以及确定知识图谱中近邻实体节点B的关联实体节点C,关联实体节点C与近邻实体节点B存在连接关系。
S103,查找所述近邻实体节点对应的近邻实体,以及查找所述关联实体节点对应的关联实体。
对于知识图谱中近邻实体节点,本发明实施例可以查找知识图谱中近邻实体节点对应的近邻实体,对于知识图谱中关联实体节点,本发明实施例同样查找知识图谱中关联实体节点对应的关联实体。
例如,对于知识图谱中近邻实体节点B,本发明实施例可以查找知识图谱中近邻实体节点B对应的近邻实体:科幻类,对于知识图谱中关联实体节点C,本发明实施例可以查找知识图谱中关联实体节点C对应的关联实体:电影C。
需要说明的是,对于近邻实体,可以存储于知识图谱中近邻实体节点,对于关联实体,可以存储于知识图谱中关联实体节点,本发明实施例对此不作限定。
S104,推荐所述近邻实体以及所述关联实体。
对于近邻实体以及关联实体,本发明实施例可以推荐该近邻实体以及关联实体给用户。例如,对于近邻实体:科幻类,以及关联实体:电影C,本发明实施例可以推荐该近邻实体以及关联实体,具体可以通过以下方式组合推荐给用户:……科幻类电影C,本发明实施例对此不作限定。
需要说明的是,本发明实施例因目标文本信息的不同而推荐的内容不同,即在目标文本信息中包括实体与属性关系的情况下,推荐该近邻实体以及关联实体给用户,在目标文本信息中包括实体的情况下,推荐该实体节点与近邻实体节点之间的属性关系、该近邻实体以及关联实体给用户。
例如,在目标文本信息中包括实体(电影A)与属性关系(类型)的情况下,推荐该近邻实体(科幻类)以及关联实体(电影C),具体可以通过以下方式组合推荐给用户:……科幻类电影C。
又例如,在目标文本信息中包括实体(电影A)的情况下,推荐该实体节点A与近邻实体节点B之间的属性关系(类型)、该近邻实体(科幻类)以及关联实体(电影C),具体可以通过以下方式推荐给用户:……类型:科幻类电影C。
通过上述对本发明实施例提供的技术方案的描述,获取目标文本信息,在预先构建的知识图谱中查找目标文本信息相匹配的实体节点,确定知识图谱中实体节点的近邻实体节点,以及确定知识图谱中近邻实体节点的关联实体节点,查找近邻实体节点对应的近邻实体,以及查找关联实体节点对应的关联实体,推荐近邻实体以及关联实体。
本发明实施例引入知识图谱,通过知识图谱进行推荐,可以避免使用少量用户之间或物品之间较少的共性数据预测大量未知信息,避免数据过拟合的可能性,提高推荐精准度。
如图2所示,为本发明实施例提供的另一种基于知识图谱的推荐方法的实施流程示意图,该方法具体可以包括以下步骤:
S201,获取目标文本信息,在预先构建的知识图谱中查找所述目标文本信息相匹配的实体节点。
在本发明实施例中,本步骤与上述步骤S101类似,本发明实施例在此不再一一赘述。
S202,确定所述知识图谱中所述实体节点的近邻实体节点,以及确定所述知识图谱中所述近邻实体节点的关联实体节点。
在本发明实施例中,本步骤与上述步骤S102类似,本发明实施例在此不再一一赘述。
S203,查找所述近邻实体节点对应的近邻实体,以及查找所述关联实体节点对应的关联实体。
对于知识图谱中近邻实体节点,本发明实施例可以查找知识图谱中近邻实体节点对应的近邻实体,对于知识图谱中关联实体节点,本发明实施例同样查找知识图谱中关联实体节点对应的关联实体。
此外,对于知识图谱中关联实体节点,本发明实施例可以从关联实体节点中筛选与近邻实体节点之间的属性关系数量超过N的目标关联实体节点,其中,N为正整数,查找目标关联实体节点对应的目标关联实体。
例如,对于知识图谱中关联实体节点:关联实体节点C、关联实体节点D、关联实体节点E,与近邻实体节点B之间的属性关系数量如下表1所示。
Figure BDA0002939081020000091
表1
从关联实体节点中筛选与近邻实体节点B之间的属性关系数量超过1的目标关联实体节点,即上述表1所示的关联实体节点C、关联实体节点D、关联实体节点E。
对于关联实体节点C,查找关联实体节点C对应的目标关联实体:电影C,对于关联实体节点D,查找关联实体节点D对应的目标关联实体:电影D,对于关联实体节点E,查找关联实体节点E对应的目标关联实体:电影E。
S204,查找所述近邻实体的属性,以及查找所述关联实体的属性。
对于近邻实体,本发明实施例可以查找近邻实体的属性,对于关联实体,本发明实施例同样可以查找关联实体的属性。
例如,对于近邻实体(科幻类),本发明实施例可以查找该近邻实体的属性:宇宙飞船、机甲等,对于关联实体(电影C),本发明实施例可以查找该关联实体的属性:上映时间、评分等。
需要说明的是,对于近邻实体的属性,描述的是近邻实体的一些特征。例如科幻类的属性:宇宙飞船、机甲等,描述的是科幻类(电影)涉及宇宙飞船、机甲等,本发明实施例对此不作限定。
对于关联实体的属性,描述的是关联实体的一些特征。例如电影C的属性:上映时间、评分等,描述的是电影C的上映时间,以及人们对电影C的评分,本发明实施例对此不作限定。
此外,本发明实施例中可以查找目标关联实体节点对应的属性。例如,对于电影C、电影D、电影E,本发明实施例中可以查找电影C、电影D、电影E等各自对应的属性:上映时间、评分等。
S205,推荐所述近邻实体、所述关联实体、所述近邻实体的属性以及所述关联实体的属性。
在本发明实施例中,对于近邻实体、关联实体、近邻实体的属性以及关联实体的属性,可以推荐近邻实体、关联实体、近邻实体的属性以及关联实体的属性给用户。
例如,对于近邻实体(科幻类)、关联实体(电影C、电影D、电影E)、近邻实体(科幻类)的属性(宇宙飞船、机甲)、关联实体(电影C、电影D、电影E)的属性(上映时间、评分),可以推荐给用户。
其中,可以通过以下方式组合推荐给用户:……科幻类(宇宙飞船、机甲)电影C:上映时间、评分;……科幻类(宇宙飞船、机甲)电影D:上映时间、评分;……科幻类(宇宙飞船、机甲)电影E:上映时间、评分。
需要说明的是,在本发明实施例中,推荐近邻实体的属性以及关联实体的属性,用于提供推荐理由,以此来解释为何这样推荐,从而可以有利于深度挖掘用户需求。
此外,在本发明实施例中,对于关联实体具体可以是目标关联实体,即对于近邻实体、目标关联实体、近邻实体的属性以及目标关联实体的属性,可以推荐给用户。
例如,对于近邻实体(科幻类)、目标关联实体(电影C、电影D、电影E)、近邻实体(科幻类)的属性(宇宙飞船、机甲)、目标关联实体(电影C、电影D、电影E)的属性(上映时间、评分),可以推荐给用户。
此外,在预先构建的知识图谱中,若未查找到目标文本信息相匹配的实体节点,将知识图谱中节点、节点之间属性关系进行组合,确定目标文本信息与组合结果的相似度,基于相似度推荐知识图谱中节点对应的实体、节点之间属性关系。
例如,在预先构建的知识图谱中,若未查找到目标文本信息(电影X)相匹配的实体节点,将知识图谱中节点、节点之间属性关系进行组合,确定目标文本信息与组合结果的相似度,选取相似度最高的知识图谱中节点对应的实体(电影C、科幻类)、节点之间属性关系(类型)进行推荐。
需要说明的是,对于知识图谱中节点、节点之间属性关系进行组合,确定目标文本信息与组合结果的相似度,具体是将知识图谱中节点、节点之间属性关系进行组合得到组合语义,确定目标文本信息与该组合语义的相似度,本发明实施例对此不作限定。
如图3所示,为本发明实施例提供的一种知识图谱构建方法的实施流程示意图,该方法具体可以包括以下步骤:
S301,获取目标数据集,其中,所述目标数据集至少包括对象属性与物品属性。
在本发明实施例中,可以获取目标数据集,其中,目标数据集至少包括对象属性与物品属性,除此之外,还可以包括物品购买或浏览记录等,本发明实施例对此不作限定。
例如,本发明实施例获取目标数据集,其中,目标数据集中包括用户A属性、用户B属性、用户C属性……,以及电影A属性、电影C属性、电影D属性……。
需要说明的是,对于对象属性,可以是用户属性,一般指的是用户年龄、学历等,对于物品属性,可以是任意物品属性,例如电影属性,一般指的是上映时间、评分等,本发明实施例对此不作限定。
S302,提取所述对象属性与所述物品属性之间的属性关系,以及提取所述对象属性与所述物品属性对应的实体。
对于对象属性、物品属性,本发明实施例可以提取对象属性与物品属性之间的属性关系,以及提取对象属性与物品属性各自对应的实体,如图4所示。其中,本发明实施例中通过数据字典,分类模型提取对象属性与物品属性之间的属性关系,通过实体列表、实体提取模型提取对象属性与物品属性各自对应的实体。
具体地,获取预设的数据字典,其中,数据字典中包括属性文本信息与第一属性关系,从数据字典中查找对象属性与物品属性相匹配的属性文本信息,确定属性文本信息对应的第一属性关系,将对象属性与物品属性输入至预设的分类模型,获取分类模型输出的第二属性关系,确定第一属性关系与第二属性关系为对象属性与物品属性之间的属性关系。
例如,对于用户属性:用户A属性、用户B属性、用户C属性……,以及电影属性:电影A属性、电影C属性、电影D属性……,数据字典中记录属性文本信息与第一属性关系的映射关系,如下表2所示。
Figure BDA0002939081020000121
Figure BDA0002939081020000131
表2
基于上述表2所示,从数据字典中查找用户属性、电影属性相匹配的属性文本信息,可以确定属性文本信息各自对应的第一属性关系。除此之外,单独使用数据字典进行属性关系提取,只能实现基于关键字的属性关系提取,且数据字典有限。
为此进一步,将用户属性、电影属性输入至预设的分类模型,获取分类模型输出的第二属性关系,确定第一属性关系与第二属性关系为用户属性、电影属性之间的属性关系。其中,分类模型是深度学习网络,主要由CNN和全连接层组成。
此外,获取预设的实体列表,其中,实体列表中包括实体文本信息与第一实体,从实体列表中查找对象属性与物品属性相匹配的实体文本信息,确定实体文本信息对应的第一实体,将对象属性与物品属性输入至预设的实体提取模型,获取实体提取模型输出的第二实体,确定第一实体与第二实体为对象属性与物品属性对应的实体。
例如,对于用户属性:用户A属性、用户B属性、用户C属性……,以及电影属性:电影A属性、电影C属性、电影D属性……,实体列表中记录用户属性、电影属性与第一实体的映射关系,如下表3所示。
Figure BDA0002939081020000132
Figure BDA0002939081020000141
表3
基于上述表2所示,从实体列表中查找用户属性、电影属性相匹配的实体文本信息,确定实体文本信息各自对应的第一实体。除此之外,单独使用实体列表进行实体提取,实体列表有限。
为此进一步,将用户属性、电影属性输入至预设的实体提取模型,获取实体提取模型输出的第二实体(例如科幻类),确定第一实体与第二实体为用户属性、电影属性各自对应的实体。
S303,基于所述对象属性、所述物品属性、所述属性关系以及所述实体构建知识图谱。
在本发明实施例中,可以基于对象属性、物品属性、属性关系以及实体构建知识图谱,这里实体对应于知识图谱中节点。
具体地,由对象属性、物品属性、属性关系以及实体建立二/三元组,基于二/三元组构建知识图谱,其中,知识图谱中节点对应于实体,知识图谱中节点之间对应于属性关系。
具体地,可以建立如下二/三元组:(实体,对象属性),(实体,物品属性),(实体,属性关系,实体),(属性关系,对象属性),(属性关系,物品属性)等,基于这些二/三元组构建知识图谱,如图5所示(对象属性、物品属性未示出)。
与上述方法实施例相对应,本发明实施例还提供了一种基于知识图谱的推荐装置,如图6所示,该装置可以包括:节点查找模块610、节点确定模块620、实体查找模块630、实体推荐模块640。
节点查找模块610,用于获取目标文本信息,在预先构建的知识图谱中查找所述目标文本信息相匹配的实体节点;
节点确定模块620,用于确定所述知识图谱中所述实体节点的近邻实体节点,以及确定所述知识图谱中所述近邻实体节点的关联实体节点;
实体查找模块630,用于查找所述近邻实体节点对应的近邻实体,以及查找所述关联实体节点对应的关联实体;
实体推荐模块640,用于推荐所述近邻实体以及所述关联实体。
本发明实施例还提供了一种电子设备,如图7所示,包括处理器71、通信接口72、存储器73和通信总线74,其中,处理器71,通信接口72,存储器73通过通信总线74完成相互间的通信,
存储器73,用于存放计算机程序;
处理器71,用于执行存储器73上所存放的程序时,实现如下步骤:
获取目标文本信息,在预先构建的知识图谱中查找所述目标文本信息相匹配的实体节点;确定所述知识图谱中所述实体节点的近邻实体节点,以及确定所述知识图谱中所述近邻实体节点的关联实体节点;查找所述近邻实体节点对应的近邻实体,以及查找所述关联实体节点对应的关联实体;推荐所述近邻实体以及所述关联实体。
上述电子设备提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect,简称PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,简称EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
通信接口用于上述电子设备与其他设备之间的通信。
存储器可以包括随机存取存储器(Random Access Memory,简称RAM),也可以包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(Digital Signal Processing,简称DSP)、专用集成电路(Application SpecificIntegrated Circuit,简称ASIC)、现场可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
在本发明提供的又一实施例中,还提供了一种存储介质,该存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述实施例中任一所述的基于知识图谱的推荐方法。
在本发明提供的又一实施例中,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述实施例中任一所述的基于知识图谱的推荐方法。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在存储介质中,或者从一个存储介质向另一个存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

Claims (13)

1.一种基于知识图谱的推荐方法,其特征在于,所述方法包括:
获取目标文本信息,在预先构建的知识图谱中查找所述目标文本信息相匹配的实体节点;
确定所述知识图谱中所述实体节点的近邻实体节点,以及确定所述知识图谱中所述近邻实体节点的关联实体节点;
查找所述近邻实体节点对应的近邻实体,以及查找所述关联实体节点对应的关联实体;
推荐所述近邻实体以及所述关联实体。
2.根据权利要求1所述的方法,其特征在于,所述推荐所述近邻实体以及所述关联实体,包括:
在所述目标文本信息中包括实体与属性关系的情况下,推荐所述近邻实体以及所述关联实体。
3.根据权利要求1所述的方法,其特征在于,所述推荐所述近邻实体以及所述关联实体,包括:
在所述目标文本信息中包括实体的情况下,推荐所述实体节点与所述近邻实体节点之间的属性关系、所述近邻实体以及所述关联实体。
4.根据权利要求1所述的方法,其特征在于,所述查找所述关联实体节点对应的关联实体,包括:
从所述关联实体节点中筛选与所述近邻实体节点之间的属性关系数量超过N的目标关联实体节点,其中,所述N为正整数;
查找所述目标关联实体节点对应的目标关联实体;
所述推荐所述近邻实体以及所述关联实体,包括:
推荐所述近邻实体以及所述目标关联实体。
5.根据权利要求1所述的方法,其特征在于,所述方法还包括:
查找所述近邻实体的属性,以及查找所述关联实体的属性;
推荐所述近邻实体的属性以及所述关联实体的属性。
6.根据权利要求1所述的方法,其特征在于,所述方法还包括:
在预先构建的知识图谱中,若未查找到所述目标文本信息相匹配的实体节点,将所述知识图谱中节点、节点之间属性关系进行组合;
确定所述目标文本信息与组合结果的相似度,基于所述相似度推荐所述知识图谱中节点对应的实体、节点之间属性关系。
7.根据权利要求1至6中任一项所述的方法,其特征在于,所述知识图谱具体通过以下方式构建:
获取目标数据集,其中,所述目标数据集至少包括对象属性与物品属性;
提取所述对象属性与所述物品属性之间的属性关系,以及提取所述对象属性与所述物品属性对应的实体;
基于所述对象属性、所述物品属性、所述属性关系以及所述实体构建知识图谱。
8.根据权利要求7所述的方法,其特征在于,所述提取所述对象属性与所述物品属性之间的属性关系,包括:
获取预设的数据字典,其中,所述数据字典中包括属性文本信息与第一属性关系;
从所述数据字典中查找所述对象属性与所述物品属性相匹配的所述属性文本信息,确定所述属性文本信息对应的所述第一属性关系;
将所述对象属性与所述物品属性输入至预设的分类模型,获取所述分类模型输出的第二属性关系;
确定所述第一属性关系与所述第二属性关系为所述对象属性与所述物品属性之间的属性关系。
9.根据权利要求7所述的方法,其特征在于,所述提取所述对象属性与所述物品属性对应的实体,包括:
获取预设的实体列表,其中,所述实体列表包括实体文本信息与第一实体;
从所述实体列表中查找所述对象属性与所述物品属性相匹配的所述实体文本信息,确定所述实体文本信息对应的第一实体;
将所述对象属性与所述物品属性输入至预设的实体提取模型,获取所述实体提取模型输出的第二实体;
确定所述第一实体与所述第二实体为所述对象属性与所述物品属性对应的实体。
10.根据权利要求7所述的方法,其特征在于,所述基于所述对象属性、所述物品属性、所述属性关系以及所述实体构建知识图谱,包括:
由所述对象属性、所述物品属性、所述属性关系以及所述实体建立二/三元组;
基于所述二/三元组构建知识图谱,其中,所述知识图谱中节点对应于所述实体,所述知识图谱中节点之间对应于所述属性关系。
11.一种基于知识图谱的推荐装置,其特征在于,所述装置包括:
节点查找模块,用于获取目标文本信息,在预先构建的知识图谱中查找所述目标文本信息相匹配的实体节点;
节点确定模块,用于确定所述知识图谱中所述实体节点的近邻实体节点,以及确定所述知识图谱中所述近邻实体节点的关联实体节点;
实体查找模块,用于查找所述近邻实体节点对应的近邻实体,以及查找所述关联实体节点对应的关联实体;
实体推荐模块,用于推荐所述近邻实体以及所述关联实体。
12.一种电子设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现权利要求1至10中任一项所述的方法步骤。
13.一种存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1至10中任一项所述的方法。
CN202110172199.6A 2021-02-08 2021-02-08 基于知识图谱的推荐方法、装置、电子设备及存储介质 Pending CN112836126A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110172199.6A CN112836126A (zh) 2021-02-08 2021-02-08 基于知识图谱的推荐方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110172199.6A CN112836126A (zh) 2021-02-08 2021-02-08 基于知识图谱的推荐方法、装置、电子设备及存储介质

Publications (1)

Publication Number Publication Date
CN112836126A true CN112836126A (zh) 2021-05-25

Family

ID=75932812

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110172199.6A Pending CN112836126A (zh) 2021-02-08 2021-02-08 基于知识图谱的推荐方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN112836126A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113609378A (zh) * 2021-07-02 2021-11-05 清华大学 信息推荐方法、装置、电子设备及存储介质
CN114064930A (zh) * 2021-11-29 2022-02-18 北京字节跳动网络技术有限公司 一种数据展示方法、装置、计算机设备以及存储介质
CN118051672A (zh) * 2024-03-15 2024-05-17 广州凡拓数字创意科技股份有限公司 一种基于知识图谱的多目标动态推荐方法及装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110263248A (zh) * 2019-05-21 2019-09-20 平安科技(深圳)有限公司 一种信息推送方法、装置、存储介质和服务器
CN111753198A (zh) * 2020-06-22 2020-10-09 北京百度网讯科技有限公司 信息推荐方法和装置、以及电子设备和可读存储介质

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110263248A (zh) * 2019-05-21 2019-09-20 平安科技(深圳)有限公司 一种信息推送方法、装置、存储介质和服务器
CN111753198A (zh) * 2020-06-22 2020-10-09 北京百度网讯科技有限公司 信息推荐方法和装置、以及电子设备和可读存储介质

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113609378A (zh) * 2021-07-02 2021-11-05 清华大学 信息推荐方法、装置、电子设备及存储介质
CN113609378B (zh) * 2021-07-02 2022-11-22 清华大学 信息推荐方法、装置、电子设备及存储介质
CN114064930A (zh) * 2021-11-29 2022-02-18 北京字节跳动网络技术有限公司 一种数据展示方法、装置、计算机设备以及存储介质
CN118051672A (zh) * 2024-03-15 2024-05-17 广州凡拓数字创意科技股份有限公司 一种基于知识图谱的多目标动态推荐方法及装置

Similar Documents

Publication Publication Date Title
US11816170B2 (en) Dynamic search set creation in a search engine
US9418128B2 (en) Linking documents with entities, actions and applications
WO2020207074A1 (zh) 一种信息推送的方法及设备
CN110569496B (zh) 实体链接方法、装置及存储介质
CN107784092A (zh) 一种推荐热词的方法、服务器及计算机可读介质
US20160034514A1 (en) Providing search results based on an identified user interest and relevance matching
US11836778B2 (en) Product and content association
CN112836126A (zh) 基于知识图谱的推荐方法、装置、电子设备及存储介质
US9660947B1 (en) Method and apparatus for filtering undesirable content based on anti-tags
US11281737B2 (en) Unbiasing search results
US9720979B2 (en) Method and system of identifying relevant content snippets that include additional information
US20130036121A1 (en) System and method for recommending blog
KR20160075739A (ko) 소셜 데이터 네트워크에 있어서의 인플루언서들을 결정하기 위한 시스템 및 방법
CN111008321A (zh) 基于逻辑回归推荐方法、装置、计算设备、可读存储介质
US11416907B2 (en) Unbiased search and user feedback analytics
CN108153909B (zh) 关键词投放拓词方法、装置及电子设备、存储介质
Wang et al. Connecting users with similar interests via tag network inference
CN113609308B (zh) 知识图谱构建方法、装置、存储介质及电子设备
US8572239B2 (en) Node clustering
Sun et al. A hybrid approach for article recommendation in research social networks
CN112818195B (zh) 数据获取方法、装置、系统及计算机存储介质
CN112989118B (zh) 视频召回方法及装置
Hashemzadeh et al. Using a data mining tool and fp-growth algorithm application for extraction of the rules in two different dataset
CN114416733A (zh) 数据检索的处理方法、装置、电子设备及存储介质
US10339559B2 (en) Associating social comments with individual assets used in a campaign

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination