CN114265982B - 一种基于知识图谱的智能推荐方法 - Google Patents

一种基于知识图谱的智能推荐方法 Download PDF

Info

Publication number
CN114265982B
CN114265982B CN202111583634.0A CN202111583634A CN114265982B CN 114265982 B CN114265982 B CN 114265982B CN 202111583634 A CN202111583634 A CN 202111583634A CN 114265982 B CN114265982 B CN 114265982B
Authority
CN
China
Prior art keywords
entity
user
information
target user
recommendation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111583634.0A
Other languages
English (en)
Other versions
CN114265982A (zh
Inventor
王宇琪
张佳旭
郭建彬
郝保
王璋盛
曹家
罗引
王磊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Zhongke Wenge Technology Co ltd
Original Assignee
Beijing Zhongke Wenge Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Zhongke Wenge Technology Co ltd filed Critical Beijing Zhongke Wenge Technology Co ltd
Priority to CN202111583634.0A priority Critical patent/CN114265982B/zh
Publication of CN114265982A publication Critical patent/CN114265982A/zh
Application granted granted Critical
Publication of CN114265982B publication Critical patent/CN114265982B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种基于知识图谱的智能推荐方法,包括:A1、针对指定领域内待推荐信息的目标用户,获取目标用户的类型;A2、若目标用户的类型为活跃用户,则根据目标用户在第一预设时间段内的交互行为数据,基于知识图谱推荐内容方式和基于用户协同过滤推荐方式获取个性化的推荐结果;其中,知识图谱是预先构建的存储有指定领域内知识和实体之间关系的结构化的图谱信息;个性化的推荐结果包括:目标用户的最近邻用户对应的信息项和与目标用户的偏好实体匹配的信息项,本发明的方法可以有效解决现有推荐方法中存在的数据稀疏且关联性弱的问题,同时实现了快速精准推送文本信息,并做到千人千面的个性化推送。

Description

一种基于知识图谱的智能推荐方法
技术领域
本发明涉及计算机技术领域,尤其涉及一种基于知识图谱的智能推荐方法。
背景技术
推荐系统通过分析用户行为、兴趣等信息,在海量的数据中挖掘用户感兴趣的信息作出个性化的推荐,广泛应用于众多Web场景之中,处理海量信息数据所导致的信息过载问题,以此提升用户体验。知识图谱作为混合推荐系统中一类有效的辅助信息,有效地解决推荐系统中存在的一系列关键问题,例如冷启动、推荐多样性等。
然而,现有技术中基于知识图谱的推荐方法不能满足精准推荐的需求,其存在推荐数据的稀疏问题,同时推荐数据的关联性弱。
发明内容
鉴于现有技术的上述缺点、不足,本发明提供一种基于知识图谱的智能推荐方法,该方法可以有效解决现有推荐方法中存在的数据稀疏且关联性弱的问题。
为了达到上述目的,本发明采用的主要技术方案包括:
第一方面,本发明实施例提供一种基于知识图谱的智能推荐方法,其包括:
A1、针对指定领域内待推荐信息的目标用户,获取目标用户的类型以及获取待推荐项;
A2、若所述目标用户的类型为活跃用户,则根据目标用户在第一预设时间段内的交互行为数据,并基于用户协同过滤推荐方式获取个性化的推荐结果;和,根据目标用户在第一预设时间段内的交互行为数据和所述待推荐项,基于知识图谱推荐内容方式获取个性化的推荐结果;
其中,所述知识图谱是预先构建的存储有指定领域内知识和实体之间关系的结构化的图谱信息;
所述个性化的推荐结果包括:所述目标用户的最近邻用户对应的文本信息和与所述目标用户的偏好实体匹配的文本信息。
可选地,所述A2中的根据目标用户在第一预设时间段内的交互行为数据和所述待推荐项,基于知识图谱推荐内容方式获取个性化的推荐结果,包括:
A21、针对目标用户在第一预设时间段内的交互行为数据,获取交互行为数据中所有信息项,以及所有信息项的实体集;
针对待推荐项中的所有文本信息,获取每一文本信息的实体集;
特别说明,所有信息项的实体集中每一信息项的实体集是预先根据重要程度(如TF-IDF值)进行筛选后的实体集。相应地,所有信息项的实体集是经过筛选后的实体集。
A22、针对所有信息项的实体集和每一文本信息的实体集,基于所述知识图谱获取各实体集中每一实体的关联实体,得到所有信息项的关联实体集;以及获取每一文本信息的关联实体集;
其中,每一实体的关联实体包括:所述知识图谱中的一跳关联实体,与一跳关联实体属于同类型的二跳关联实体,以及一跳关联实体的别称实体,选中的二跳关联实体的别称实体;
该步骤主要是实现实体集的全面覆盖,且保证后续匹配过程的精确性;
A23、对所有信息项的关联实体集进行过滤,获得所述目标用户的所有信息项的偏好实体集;
对每一文本信息的关联实体集进行过滤,获得待推荐的每一文本信息的待匹配实体集;
A24、将所述偏好实体集和每一文本信息的待匹配实体集进行匹配,获得用于作为个性化的推荐结果的文本信息。
可选地,所述A21包括:
根据所述目标用户的交互行为数据,获取所述交互行为数据中的所有信息项;
采用BiLSTM-CRF模型,从每一信息项中抽取实体,并计算抽取的每一实体的TF-IDF值,根据所述TF-IDF值从每一信息项抽取的所有实体中筛选,得到每一信息项的实体集,获得所有信息项的实体集;
所述A22包括:
针对所有信息项的实体集中每一个实体,从知识图谱中查找该实体的一跳关联实体,二跳关联实体;以及
从二跳关联实体中选择与一跳关联实体属于同类型的二跳关联实体,作为选择后的二跳关联实体;
以及,基于知识图谱,查找一跳关联实体的别称实体,选中的二跳关联实体的别称实体;
将所有信息项中所有实体的一跳关联实体、选择后的二跳关联实体、一跳关联实体的别称实体,选中的二跳关联实体的别称实体融合,得到所有信息项的关联实体集。
可选地,所述A23包括:
去除所有信息项的关联实体集中重复的实体,并对表示同一实体的多个别称进行映射,得到所述目标用户的所有信息项的偏好实体集;
去除每一文本信息的关联实体集进行过滤,并对表示同一实体的多个别称进行映射,得到待推荐的每一文本信息的待匹配实体集;
所述A24包括:
采用公式(1)计算A,B两实体集相似度Jaccard(A,B);
Figure BDA0003427681250000041
A表示所有信息项的偏好实体集,B表示待推荐的每一文本信息的待匹配实体集;
若相似度Jaccard(A,B)大于第一指定阈值,则将相似度Jaccard(A,B)对应的文本信息作为选择的个性化的推荐结果。
可选地,所述A2中的基于用户协同过滤推荐方式获取个性化的推荐结果,包括:
A2-1、根据目标用户的交互行为数据,获取所述目标用户的最近邻用户;
A2-2、根据所述最近邻用户中各用户的交互行为数据,筛选用作个性化的推荐结果的文本信息;所述文本信息为最近邻用户中一用户浏览过的且满足指定时效性的文本信息。
可选地,所述A2-1、根据目标用户的交互行为数据,获取所述目标用户的最近邻用户,包括:
A2-1-1、根据所述交互行为数据,构建用户-信息项、信息项-用户分别所属的评分矩阵,并根据所述评分矩阵,获取用户之间的相似度,并基于所述相似度筛选所述目标用户的最近邻用户。
可选地,所述A2-1-1包括:
根据所述目标用户的交互行为数据,获取交互行为数据中对应的所有信息项;以及获取所有信息项中每一信息项所属的所有用户;每一信息项所属的所有用户是指,对该信息项具有操作行为的用户的集合;
构建第一用户-所有信息项的第一评分矩阵、所有信息项-第一用户的第二评分矩阵;第一用户包括:每一信息项所属的所有用户;
针对任一两个用户是否都对某一信息项进行评分的信息,遍历第一评分矩阵和第二评分矩阵,获取第一用户中每一用户相似性矩阵;
基于每一用户的相似度矩阵,采用皮尔逊相关系数计算第一用户中任意两个用户相似度并归一化处理,得到目标用户的候选近邻列表,选取与目标用户最为相似的N个用户作为最近邻用户,N取大于1的自然数;
A2-2包括:
筛选这N个用户浏览过且目标用户未浏览过的文本信息,并在筛选的文本信息中获取在指定时效期内的文本信息作为个性化的推荐结果。
可选地,所述交互行为数据包括下述的一项或多项:用户在第一预设时间段内的浏览数据,点赞数据、收藏数据。
可选地,所述方法还包括:
若所述目标用户的类型为非活跃用户,则基于所述待推荐项采用指定规则的推荐方式生成基本推荐结果;
若所述目标用户的类型为新注册用户,则采用冷启动的方式生成基本推荐结果;
所述基本推荐结果包括:热点推荐信息、时效性推荐信息和/或随机推荐信息的推荐结果。
第二方面,本发明实施例还提供一种电子设备,包括:存储器和处理器;所述处理器用于执行所述存储器中存储的计算机程序,以实现执行上述第一方面任一所述的基于知识图谱的智能推荐方法的步骤。
(三)有益效果
在本发明实施例中,基于包含实体及实体间关系的知识图谱,并根据目标用户的交互行为数据对文本信息进行挖掘分析,获取个性化的推荐结果,有效解决现有推荐方法中存在的数据稀疏的问题,有效实现推荐相关性强且多样的推荐结果的技术效果。
在推荐信息的筛选过程中,本发明实施例基于用户协同过滤推荐方式以及基于知识图谱推荐内容方式进行文本信息推荐,获取兼顾最近邻用户的信息,同时兼顾目标用户偏好实体的信息的推荐结果,进而推荐结果更准确且多样化,即实现了快速精准推送文本信息,还做到了千人千面的个性化推送。
特别地,在基于知识图谱推荐内容方式获取推荐结果过程中,利用知识图谱中实体的连通性模式进行推荐,有效兼顾实体词在图谱中的关联路径链接到的其他实体词,从而获得准确性更高的相似文章的推荐,提升推荐效果,实现推荐结果的精确性。
附图说明
图1为本发明一实施例提供的基于知识图谱的智能推荐方法的流程示意图;
图2为基于知识图谱推荐内容方式获取个性化推荐结果的示意图;
图3为基于用户协同过滤推荐方式获取个性化推荐结果的示意图;
图4为知识图谱中关联实体的示意图;
图5为本发明一实施例提供的电子设备的结构示意图。
具体实施方式
为了更好的解释本发明,以便于理解,下面结合附图,通过具体实施方式,对本发明作详细描述。
本发明实施例中使用的知识图谱可为通过现有方式构建的知识图谱,知识图谱代表一种知识库,其属于一个存储知识与实体之间关系的结构化网络,知识图谱包括:节点和有向边;节点代表实体,有向边代表有向边的关系。
在本发明实施例中,对指定领域内蕴含物品的背景信息、物品之间的关系、与用户行为数据构成的用户与物品/文本信息/文章/信息项之间的网络关联进行图谱化,形成知识图谱,从而在智能推荐过程中可有效挖掘用户与信息项之间存在的隐藏的关联关系,扩展用户与物品之间的交互数据,从而可以更进一步地提升推荐精准度。
实施例一
如图1所示,本实施例提供一种基于知识图谱的智能推荐方法,本实施例的方法可在任一电子设备上实现,其属于对指定领域的精准化推荐,本实施例的方法可包括下述的步骤:
A1、针对指定领域内待推荐信息的目标用户,获取目标用户的类型及获取待推荐项。
举例来说,本实施例中目标用户的类型包括:活跃用户、非活跃用户和新注册用户。
其中,非活跃用户是指在某时间范围内没有用户交互行为数据的用户,活跃用户则是至在某时间范围内有用户行为数据的用户。
本实施例的指定领域可以包括:商业舆情领域、航海领域、北极探究领域、知识产权领域等,本实施例的指定领域可根据实际需要限定。
上述的待推荐项是预先选择的文本信息,如从当前时间点到三个月前的所有指定领域内的文本信息等,其便于在下述的筛选过程中基于待推荐项中的文本信息进行匹配,以有效减少匹配的量,同时提高精准匹配结果。
A2、若所述目标用户的类型为活跃用户,则根据目标用户在第一预设时间段内的交互行为数据,并基于用户协同过滤推荐方式获取个性化的推荐结果;以及,根据目标用户在第一预设时间段内的交互行为数据和所述待推荐项,基于知识图谱推荐内容方式获取个性化的推荐结果;
其中,所述知识图谱是预先构建的存储有指定领域内知识和实体之间关系的结构化的图谱信息;本实施例中知识图谱的构建为采用现有方式构建的,其对应活跃用户所属的指定领域的知识图谱。例如指定领域为航空领域时,对应的活跃用户也是指某一航空APP中存在较多交互行为数据的用户,此时的知识图谱可为该航空领域的知识图谱。
所述个性化的推荐结果包括:所述目标用户的最近邻用户对应的文本信息和与所述目标用户的偏好实体匹配的文本信息。
本实施例中的目标用户的交互行为数据可包括下述的一项或多项:用户在第一预设时间段内的浏览数据,点赞数据、收藏数据等,本实施例不限定交互行为数据的内容。
A3、若所述目标用户的类型为非活跃用户,则采用指定规则的推荐方式从待推荐项中选取基本推荐结果;
A4、若所述目标用户的类型为新注册用户,则可采用冷启动的方式生成基本推荐结果。
所述基本推荐信息包括:热点推荐信息、时效性推荐信息和/或随机推荐信息的推荐结果等,本实施例不对基本推荐结果进行限定,根据实际需要选择待推荐项中的一项或多项。
在本实施例中,针对非活跃用户和新注册用户可执行指定规则的推荐方式推荐,针对活跃用户可实现个性化推荐,且实现了推荐结果的精确性和多样性。
下述实施例为更清楚的描述,部分描述中使用信息项,部分描述中使用文本信息,其信息项代表一种文本信息如文章、新闻信息、娱乐信息、航空论文等,本实施例的信息项和文本信息等同。
举例来说,在上述的步骤A3和A4中,可采用基于热点推荐方式获取基本推荐结果。
当前,指定领域的用户数量和内容的规模未达到一定量级规模时,基于热点的推荐方式更能够覆盖到大部分用户的内容需求。例如,通过为信息项定义一个热度值Score来表示信息热度评分,公式如下:
Score=S0+S(Users)-S(Time)
其中,S0代表赋予信息项的初始热度值,该信息项就进入了推荐列表进行排序;S(Users)代表存在用户行为数据的所有用户帮助信息项提升热度的行为值。用户行为数据包括浏览、点赞、收藏等形式的交互行为;例如,可预先对浏览、点赞、收藏赋予基本的分数和权重,统计交互行为的数量,并按照数量*分数*权重的方式得到各行为的结果并相互累加得到行为值。S(Time)则代表信息项的热度随着时间而衰减,并且由于信息项较强的时效性,其衰减程度趋势呈越来越快的趋势,直至趋近于零热度。最后按热度值排序获取前N个热点作为推荐结果。
在另一可能的实现方式中,在上述的步骤A3和A4中,可采用基于时效推荐方式获取推荐结果。
例如,将当日录入的最新信息(如文章)增加一定权重,在当日进行优先推荐。当没有新文章入库时,会针对文章列表按时间倒排获取前N个最新推荐结果。
在第三种可能的实现方式中,在上述的步骤A3和A4中,可采用基于随机推荐方式获取推荐结果。
举例来说,随机选取小部分的文本信息作为推荐结果,用于辅助挖掘目标用户潜在的兴趣。也就是说,针对待推荐项中的所有文章列表,获取某段时间范围内随机文章得到N个随机推荐结果。
在实际应用中,上述随机推荐方式、时效推荐方式和热点推荐方式均可单独或同时使用,本实施例不对其限定,根据实际需要进行选择。
实施例二
本实施例中基于知识图谱内容推荐方法相较于现有技术的文本内容相似度对比方法,其结合了关键实体在知识图谱中的关联关系,合理实现了文本内容相似度的推荐,且提升了推荐结果的精准性。
为了更好的说明上述实施例一种步骤A2中基于知识图谱推荐内容方式获取个性化推荐结果的过程,以下结合图2进行详细说明。
A21、针对目标用户在第一预设时间段内的交互行为数据,获取交互行为数据中所有信息项,以及所有信息项的实体集;
针对待推荐项中的所有文本信息,获取每一文本信息的实体集。
举例来说,可通过获取所述交互行为数据中的信息项对应的信息项集合(即目标用户-历史文本的信息项集合),并采用BiLSTM-CRF模型从信息项集合的每一信息项中抽取实体,并计算抽取的每一实体的重要程度的TF-IDF值,根据所述TF-IDF值筛选,得到每一信息项的实体集,进而组合得到所有信息项的实体集。
同时,针对待推荐项的所有文本信息中的每一文本信息,可采用BiLSTM-CRF模型抽取待推荐的每一文本信息的实体,并计算抽取的每一实体的TF-IDF值,根据所述TF-IDF值从每一文本信息抽取的所有实体中筛选,得到待推荐的每一文本信息的实体集,即得到单篇文章对应的实体集。
A22、针对所有信息项的实体集,基于所述知识图谱获取所述实体集中每一实体的关联实体,得到所有信息项的关联实体集;以及获取每一文本信息的关联实体集。
举例来说,该步骤A22可包括下述的子步骤:
针对所有信息项的实体集中每一个实体,从知识图谱中查找该实体的一跳关联实体,二跳关联实体;以及
从二跳关联实体中选择与一跳关联实体属于同类型的二跳关联实体,作为选择后的二跳关联实体;
以及,基于知识图谱,查找一跳关联实体的别称实体,选中的二跳关联实体的别称实体;
将每一信息项中所有实体的一跳关联实体、选择后的二跳关联实体、一跳关联实体的别称实体,选中的二跳关联实体的别称实体融合,得到所有信息项的关联实体集。
A23、对所有信息项的关联实体集进行过滤,获得所述目标用户的所有信息项的偏好实体集;
对每一文本信息的关联实体集进行过滤,获得待推荐的每一文本信息的待匹配实体集。
例如,去除所有信息项的关联实体集中重复的实体,并对表示同一实体的多个别称进行映射(如映射到一个以上的标准化的实体以用于进行下述的相似度计算),得到所述目标用户的所有信息项的偏好实体集;
A24、将所述目标用户的所有信息项的偏好实体集和每一文本信息的待匹配实体集进行匹配,获得用于作为个性化的推荐结果的文本信息。
在本实施例中,可采用公式(1)计算A,B两实体集相似度Jaccard(A,B);即采用Jaccard相似度计算A,B两实体集相似度。
Figure BDA0003427681250000111
A表示所述偏好实体集,B表示待推荐的每一文本信息的待匹配实体集;
若相似度Jaccard(A,B)大于第一指定阈值,则将相似度Jaccard(A,B)对应的文本信息作为选择的个性化的推荐结果。即上述相似度结果在达到一定阈值时,可判定该用户偏好与待推荐的文本信息相似,此时目标用户可能对该文本信息感兴趣,反之,则认为用户对该文本信息不感兴趣。实际应用中,可选相似度高的文本信息作为个性化的推荐结果。
本实施例中关于获取每一实体的关联实体,说明如下:
本实施例中,可采用基于知识图谱的关联路径信息确定一跳和二跳的实体,具体包括:第一:当前节点的实体,第二:当前节点的一跳即第一跳关联的直接实体,第三:当前节点的二跳中与一跳同类型的实体;
将当前节点的实体、一跳的直接实体、二跳中与一跳同类型的实体及该些实体的别称属性中的别称组合,形成每一实体的关联实体。
上述一跳关联的直接实体,是指知识图谱中某实体节点直接可以链接到的其他节点,即查询通过找到独立的三元组完成,而没有涉及多个有关联的三元组,获得一跳的实体候选词;
上述二跳中与一跳同类型的实体,是指知识图谱中某节点路径两步到达的节点,且需要满足与一跳节点属于同类型的节点,获得二跳的实体候选词;该处的同类型可理解为,同为人物、同为设备或者同为机构。
图4示出了商业运营的知识图谱的示意图,如图4所示,口罩-20作为实体词节点,口罩-20关联一条所包含的所有实体及属性信息,得到关联实体的结果如下:
Figure BDA0003427681250000121
口罩-20一跳关联:北京XX科技公司、MM(研发者);
Figure BDA0003427681250000122
口罩-20二跳关联:口罩-10;
Figure BDA0003427681250000123
口罩-20关联实体别称:K-20、KP-20、K-10、KP-10、K-10B、KP-10K-10A。
上述步骤中将实体的别称统一映射为标准的实体后再进行Jaccard相似度计算,保证不会因为别称不同在计算交集时产生误差。
实施例三
为了更好的说明上述实施例一种步骤A2中基于用户协同过滤推荐方式获取个性化推荐结果的过程,以下结合图3进行详细说明。
在本实施例中,首先,基于某时间范围内的用户交互行为数据,挖掘用户相似度,构建用户-信息项、信息项-用户的偏好矩阵(如下的第一评分矩阵和第二评分矩阵),然后由矩阵计算用户之间的相似度,通过相似度得到目标用户的最近邻用户,将目标用户未浏览过的且满足时效性的文本信息推荐给目标用户。由此实现了向推荐结果的多样性,且实现了千人千面的推荐结果,提高了推荐结果的精准度。
A2-1、根据目标用户的交互行为数据,获取所述目标用户的最近邻用户。
举例来说,将不同行为反映为目标用户对文章的评分,构建用户-信息项的第一评分矩阵、信息项-用户的第二评分矩阵;
判断针对任意两个用户是否都对某一信息项进行评分(如预先定义有点赞的分值、收藏的分值等),若是,则匹配到两个用户同时对该信息项评过分的数据放入到这两个用户向量中,遍历第一评分矩阵和第二评分矩阵,得到用户相似性矩阵;
基于用户相似性矩阵,采用皮尔逊相关系数计算任意两个用户相似度并归一化处理,得到每个用户的候选近邻列表,选取与目标用户最为相似的N个用户作为最近邻用户,N为大于1的自然数。
本实施例中采用了皮尔逊相关系数计算用户相似度,相比其他相似度计算方式,皮尔逊相关系数能够使用用户平均分对各独立评分进行修正,减小了评分偏置的影响。例如,有两个用户偏好一致,但是甲对所有文章的评分偏低,而乙对所有文章评分偏高,该系数就能够消除这一情况的影响。其皮尔逊相关系数计算用户相似度的计算公式如下:
Figure BDA0003427681250000131
Iij代表用户i和用户j共同评价过的文章,R(i,x)代表用户i对文章x的评分,R(j,x)代表用户j对文章x的评分,
Figure BDA0003427681250000132
代表用户i评分的平均值,
Figure BDA0003427681250000133
代表用户j评分的平均值,通过减去平均值实现归一化操作,避免用户评分标准差异造成的影响,sim(i,j)为用户i和用户j的相似度。
A2-2、根据所述最近邻用户中各用户的交互行为数据,筛选用作个性化的推荐结果的文本信息;所述文本信息为最近邻用户中一用户浏览过的且满足指定时效性的文本信息。
例如,筛选这N个用户浏览过且目标用户未浏览过的信息项/文章,并在筛选的文章中获取在指定时效期内的文章作为个性化的推荐结果。通常,指定时效内的文章可为待推荐项内的文本信息。
本实施例中考虑了用户的最近邻相似性,同时考虑信息项的时效性,由此可以获取多样性的且满足时效的个性化推荐结果。
实施例四
本实施例还提供一种电子设备,包括:存储器和处理器;所述处理器用于执行所述存储器中存储的计算机程序,以实现执行上述实施例一和实施例二任意所述的基于知识图谱的智能推荐方法的步骤。
具体地,如图5所示,本实施例的电子设备可包括:至少一个处理器51、至少一个存储器52、至少一个网络接口54和/或其他的用户接口53。电子设备中的各个组件通过总线系统55耦合在一起。可理解,总线系统55用于实现这些组件之间的连接通信。总线系统55除包括数据总线之外,还包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见,在图5中将各种总线都标为总线系统55。
本实施例的电子设备可以执行图1至图4任意所示的方法,其中,用户接口53可以包括显示器、键盘或者点击设备(例如,鼠标或者触感板等)。
可以理解,本实施例中的存储器52可以是易失性存储器或非易失性存储器,或可包括易失性和非易失性存储器两者。本文描述的存储器52包括任意其它适合类型的存储器。
在一些实施方式中,存储器52存储了如下的元素,可执行单元或者数据结构,或者他们的子集,或者他们的扩展集:操作系统521和应用程序522。
其中,操作系统521,包含各种系统程序,例如框架层、核心库层、驱动层等,用于实现各种基础业务以及处理基于硬件的任务。应用程序522,包含各种应用程序,例如媒体播放器(MediaPlayer)、浏览器(Browser)等,用于实现各种应用业务。实现本发明实施例方法的程序可以包含在应用程序522中。
在本发明实施例中,处理器51通过调用存储器52存储的程序或指令,具体的,可以是应用程序522中存储的程序或指令,处理器51用于执行第一方面所提供的方法步骤。
上述本发明实施例揭示的方法可以应用于处理器51中,或者由处理器51实现。处理器51可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器51中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器51可以是通用处理器、数字信号处理器(DigitalSignalProcessor,DSP)、专用集成电路(ApplicationSpecific IntegratedCircuit,ASIC)、现成可编程门阵列(FieldProgrammableGateArray,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本发明实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件单元组合执行完成。软件单元可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器52,处理器51读取存储器52中的信息,结合其硬件完成上述方法的步骤。
另一方面,本发明实施例还提供一种计算机可读存储介质,其用于存储有计算机程序,所述计算机程序被处理器执行时实现上述任意实施例的智能推荐方法的步骤。
本实施例的电子设备可为后台服务器,例如各种客户端连接的后台服务器,其可采用定时任务调度的方式对群体性的目标用户进行推荐,即定时判断数据库中是否有新的目标用户,进行默认项的基本推荐结果;定时判断群体性用户有无活跃行为,活跃用户进行个性化推荐结果,以便在客户端展示供用户查看。
应当注意的是,在权利要求中,不应将位于括号之间的任何附图标记理解成对权利要求的限制。词语“包含”不排除存在未列在权利要求中的部件或步骤。位于部件之前的词语“一”或“一个”不排除存在多个这样的部件。本发明可以借助于包括有若干不同部件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的权利要求中,这些装置中的若干个可以是通过同一个硬件来具体体现。词语第一、第二、第三等的使用,仅是为了表述方便,而不表示任何顺序。可将这些词语理解为部件名称的一部分。
此外,需要说明的是,在本说明书的描述中,术语“一个实施例”、“一些实施例”、“实施例”、“示例”、“具体示例”或“一些示例”等的描述,是指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
尽管已描述了本发明的优选实施例,但本领域的技术人员在得知了基本创造性概念后,则可对这些实施例作出另外的变更和修改。所以,权利要求应该解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种修改和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也应该包含这些修改和变型在内。

Claims (8)

1.一种基于知识图谱的智能推荐方法,其特征在于,包括:
A1、针对指定领域内待推荐信息的目标用户,获取目标用户的类型以及获取待推荐项;所述待推荐项为预先选择的文本信息;
A2、若所述目标用户的类型为活跃用户,则根据目标用户在第一预设时间段内的交互行为数据,并基于用户协同过滤推荐方式获取个性化的推荐结果;以及,根据目标用户在第一预设时间段内的交互行为数据和所述待推荐项,基于知识图谱推荐内容方式获取个性化的推荐结果;
其中,所述知识图谱是预先构建的存储有指定领域内知识和实体之间关系的结构化的图谱信息,所述知识图谱为对应活跃用户所属的指定领域的知识图谱;
所述个性化的推荐结果包括:所述目标用户的最近邻用户对应的文本信息和与所述目标用户的偏好实体匹配的文本信息;
所述A2中的根据目标用户在第一预设时间段内的交互行为数据和所述待推荐项,基于知识图谱推荐内容方式获取个性化的推荐结果,包括:
A21、针对目标用户在第一预设时间段内的交互行为数据,获取交互行为数据中所有信息项,以及所有信息项的实体集;
针对待推荐项中的所有文本信息,获取每一文本信息的实体集;
A22、针对所有信息项的实体集和每一文本信息的实体集,基于所述知识图谱获取各实体集中每一实体的关联实体,得到所有信息项的关联实体集;以及获取每一文本信息的关联实体集;
其中,每一实体的关联实体包括:所述知识图谱中的一跳关联实体,与一跳关联实体属于同类型的二跳关联实体,以及一跳关联实体的别称实体,选中的二跳关联实体的别称实体;
A23、对所有信息项的关联实体集进行过滤,获得所述目标用户的所有信息项的偏好实体集;
对每一文本信息的关联实体集进行过滤,获得待推荐的每一文本信息的待匹配实体集;
其中,对所有信息项的关联实体集进行过滤包括:
去除所有信息项的关联实体集中重复的实体,并对表示同一实体的多个别称进行映射,且映射到一个以上的标准化的实体,得到所述目标用户的所有信息项的偏好实体集;
A24、将所述偏好实体集和每一文本信息的待匹配实体集进行匹配,获得用于作为个性化的推荐结果的文本信息;
所述A2中的基于用户协同过滤推荐方式获取个性化的推荐结果,包括:
A2-1、根据目标用户的交互行为数据,获取所述目标用户的最近邻用户;
A2-2、根据所述最近邻用户中各用户的交互行为数据,筛选用作个性化的推荐结果的文本信息;所述文本信息为最近邻用户中一用户浏览过的且满足指定时效性的文本信息。
2.根据权利要求1所述的智能推荐方法,其特征在于,所述A21包括:
根据所述目标用户的交互行为数据,获取所述交互行为数据中的所有信息项;
采用BiLSTM-CRF模型,从每一信息项中抽取实体,并计算抽取的每一实体的TF-IDF值,根据所述TF-IDF值从每一信息项抽取的所有实体中筛选,得到每一信息项的实体集,获得所有信息项的实体集;
所述A22包括:
针对所有信息项的实体集中每一个实体,从知识图谱中查找该实体的一跳关联实体,二跳关联实体;以及
从二跳关联实体中选择与一跳关联实体属于同类型的二跳关联实体,作为选择后的二跳关联实体;
以及,基于知识图谱,查找一跳关联实体的别称实体,选中的二跳关联实体的别称实体;
将所有信息项中所有实体的一跳关联实体、选择后的二跳关联实体、一跳关联实体的别称实体,选中的二跳关联实体的别称实体融合,得到所有信息项的关联实体集。
3.根据权利要求1或2所述的智能推荐方法,其特征在于,所述A23包括:
去除所有信息项的关联实体集中重复的实体,并对表示同一实体的多个别称进行映射,得到所述目标用户的所有信息项的偏好实体集;
去除每一文本信息的关联实体集进行过滤,并对表示同一实体的多个别称进行映射,得到待推荐的每一文本信息的待匹配实体集;
所述A24包括:
采用公式(1)计算A,B两实体集相似度Jaccard(A,B);
Figure FDA0003726524430000031
A表示所有信息项的偏好实体集,B表示待推荐的每一文本信息的待匹配实体集;
若相似度Jaccard(A,B)大于第一指定阈值,则将相似度Jaccard(A,B)对应的文本信息作为选择的个性化的推荐结果。
4.根据权利要求1所述的智能推荐方法,其特征在于,所述A2-1、根据目标用户的交互行为数据,获取所述目标用户的最近邻用户,包括:
A2-1-1、根据所述交互行为数据,构建用户-信息项、信息项-用户分别所属的评分矩阵,并根据所述评分矩阵,获取用户之间的相似度,并基于所述相似度筛选所述目标用户的最近邻用户。
5.根据权利要求1所述的智能推荐方法,其特征在于,所述A2-1-1包括:
根据所述目标用户的交互行为数据,获取交互行为数据中对应的所有信息项;以及获取所有信息项中每一信息项所属的所有用户;每一信息项所属的所有用户是指,对该信息项具有操作行为的用户的集合;
构建第一用户-所有信息项的第一评分矩阵、所有信息项-第一用户的第二评分矩阵;第一用户包括:每一信息项所属的所有用户;
针对任一两个用户是否都对某一信息项进行评分的信息,遍历第一评分矩阵和第二评分矩阵,获取第一用户中每一用户相似性矩阵;
基于每一用户的相似度矩阵,采用皮尔逊相关系数计算第一用户中任意两个用户相似度并归一化处理,得到目标用户的候选近邻列表,选取与目标用户最为相似的N个用户作为最近邻用户,N取大于1的自然数;
A2-2包括:
筛选这N个用户浏览过且目标用户未浏览过的文本信息,并在筛选的文本信息中获取在指定时效期内的文本信息作为个性化的推荐结果。
6.根据权利要求1所述的智能推荐方法,其特征在于,所述交互行为数据包括下述的一项或多项:用户在第一预设时间段内的浏览数据,点赞数据、收藏数据。
7.根据权利要求1所述的智能推荐方法,其特征在于,所述方法还包括:
若所述目标用户的类型为非活跃用户,则采用指定规则的推荐方式从待推荐项中选取基本推荐结果;
若所述目标用户的类型为新注册用户,则采用冷启动的方式生成基本推荐结果;
所述基本推荐结果包括:热点推荐信息、时效性推荐信息和/或随机推荐信息的推荐结果。
8.一种电子设备,其特征在于,包括:存储器和处理器;所述处理器用于执行所述存储器中存储的计算机程序,以实现执行上述权利要求1至7任一所述的基于知识图谱的智能推荐方法的步骤。
CN202111583634.0A 2021-12-22 2021-12-22 一种基于知识图谱的智能推荐方法 Active CN114265982B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111583634.0A CN114265982B (zh) 2021-12-22 2021-12-22 一种基于知识图谱的智能推荐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111583634.0A CN114265982B (zh) 2021-12-22 2021-12-22 一种基于知识图谱的智能推荐方法

Publications (2)

Publication Number Publication Date
CN114265982A CN114265982A (zh) 2022-04-01
CN114265982B true CN114265982B (zh) 2022-08-26

Family

ID=80829652

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111583634.0A Active CN114265982B (zh) 2021-12-22 2021-12-22 一种基于知识图谱的智能推荐方法

Country Status (1)

Country Link
CN (1) CN114265982B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116992960B (zh) * 2023-09-25 2023-12-05 成都市智慧蓉城研究院有限公司 一种知识图谱可视化交互方法及系统
CN117034094B (zh) * 2023-10-10 2024-03-12 连连银通电子支付有限公司 一种账户类型预测方法及账户类型预测装置

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109241405A (zh) * 2018-08-13 2019-01-18 华中师范大学 一种基于知识关联的学习资源协同过滤推荐方法及系统
CN109862013A (zh) * 2019-01-31 2019-06-07 武汉斗鱼网络科技有限公司 一种直播间推荐方法、存储介质、电子设备及系统
CN110321482A (zh) * 2019-06-11 2019-10-11 阿里巴巴集团控股有限公司 一种信息的推荐方法、装置及设备
CN110955834A (zh) * 2019-11-27 2020-04-03 西北工业大学 一种知识图谱驱动的个性化精准推荐方法
CN111538846A (zh) * 2020-04-16 2020-08-14 武汉大学 基于混合协同过滤的第三方库推荐方法
CN113656684A (zh) * 2021-07-13 2021-11-16 天津大学 一种基于知识图谱的推荐方法
CN113704495A (zh) * 2021-08-30 2021-11-26 合肥智能语音创新发展有限公司 实体对齐方法、装置、电子设备和存储介质

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9461876B2 (en) * 2012-08-29 2016-10-04 Loci System and method for fuzzy concept mapping, voting ontology crowd sourcing, and technology prediction
CN108596412A (zh) * 2017-03-14 2018-09-28 华为软件技术有限公司 基于用户相似度的跨领域评分方法以及评分设备
US11651043B2 (en) * 2018-07-24 2023-05-16 MachEye, Inc. Leveraging analytics across disparate computing devices
CN111598645A (zh) * 2020-04-02 2020-08-28 浙江工业大学 一种融合随机森林与协同过滤二手房推荐方法
CN113127754A (zh) * 2021-04-16 2021-07-16 天津大学 一种基于知识图谱的供应商推荐方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109241405A (zh) * 2018-08-13 2019-01-18 华中师范大学 一种基于知识关联的学习资源协同过滤推荐方法及系统
CN109862013A (zh) * 2019-01-31 2019-06-07 武汉斗鱼网络科技有限公司 一种直播间推荐方法、存储介质、电子设备及系统
CN110321482A (zh) * 2019-06-11 2019-10-11 阿里巴巴集团控股有限公司 一种信息的推荐方法、装置及设备
CN110955834A (zh) * 2019-11-27 2020-04-03 西北工业大学 一种知识图谱驱动的个性化精准推荐方法
CN111538846A (zh) * 2020-04-16 2020-08-14 武汉大学 基于混合协同过滤的第三方库推荐方法
CN113656684A (zh) * 2021-07-13 2021-11-16 天津大学 一种基于知识图谱的推荐方法
CN113704495A (zh) * 2021-08-30 2021-11-26 合肥智能语音创新发展有限公司 实体对齐方法、装置、电子设备和存储介质

Also Published As

Publication number Publication date
CN114265982A (zh) 2022-04-01

Similar Documents

Publication Publication Date Title
Adamic et al. Friends and neighbors on the web
Seo et al. An enhanced aggregation method considering deviations for a group recommendation
WO2018041168A1 (zh) 信息推送方法、存储介质和服务器
US8775354B2 (en) Evaluating an item based on user reputation information
Yin et al. Spatio-temporal recommendation in social media
CN114265982B (zh) 一种基于知识图谱的智能推荐方法
US8271495B1 (en) System and method for automating categorization and aggregation of content from network sites
CN109255586B (zh) 一种面向电子政务办事的在线个性化推荐方法
US20060095430A1 (en) Web page ranking with hierarchical considerations
CN103886090A (zh) 基于用户喜好的内容推荐方法及装置
US20210160653A1 (en) System and method for accurately and efficiently generating ambient point-of-interest recommendations
Rasolofo et al. Result merging strategies for a current news metasearcher
CN103294692B (zh) 一种信息推荐方法及系统
CN110119478B (zh) 一种结合多种用户反馈数据的基于相似度的物品推荐方法
CN104641371A (zh) 社交网络系统中基于上下文的对象检索
CN113010255B (zh) 基于捆绑会话组的交互方法、装置和计算机设备
CN111738785A (zh) 选品方法、系统及存储介质
Zhang et al. Proposing a new friend recommendation method, FRUTAI, to enhance social media providers' performance
CN112825089A (zh) 文章推荐方法、装置、设备及存储介质
Tian et al. Geek talents: Who are the top experts on github and stack overflow?
Hong et al. Context-aware recommendation using role-based trust network
Gharibshah et al. Connectedness of users–items networks and recommender systems
CN114511085A (zh) 实体属性值的识别方法、装置、设备、介质及程序产品
CN112202889B (zh) 信息的推送方法、装置和存储介质
CN114491296B (zh) 提案联名人推荐方法、系统、计算机设备及可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant