CN114491247A - 一种基于知识图谱和用户长短期兴趣的推荐方法 - Google Patents

一种基于知识图谱和用户长短期兴趣的推荐方法 Download PDF

Info

Publication number
CN114491247A
CN114491247A CN202210051109.2A CN202210051109A CN114491247A CN 114491247 A CN114491247 A CN 114491247A CN 202210051109 A CN202210051109 A CN 202210051109A CN 114491247 A CN114491247 A CN 114491247A
Authority
CN
China
Prior art keywords
user
item
vector representation
entity
term
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210051109.2A
Other languages
English (en)
Inventor
苗立志
汤恒
余定育
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University of Posts and Telecommunications
Original Assignee
Nanjing University of Posts and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University of Posts and Telecommunications filed Critical Nanjing University of Posts and Telecommunications
Priority to CN202210051109.2A priority Critical patent/CN114491247A/zh
Publication of CN114491247A publication Critical patent/CN114491247A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • G06F16/9024Graphs; Linked lists

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于知识图谱和用户长短期兴趣的推荐方法,包括:获取项目集并映射到通用知识图谱,获取用户‑项目交互信息;基于知识图卷积网络采用实体邻域聚合方式对邻域实体聚合获取待推荐项目的项目特征向量表示;通过偏好传播的方法学习用户长期偏好向量表示;将用户历史偏好集合中感兴趣的项目按时间顺序输入门控循环单元训练,获得用户短期偏好向量表示;将用户长短期偏好向量表示按列叠加融合,经过全连接层处理得到最终用户偏好向量表示,并同待推荐项目的项目特征向量表示经过内积计算对应特征维度的相似度后输入多层感知机,预测用户对待推荐项目感兴趣的概率。本发明方法提升了推荐效果,具有可解释性高、适应性强、高精度的特点。

Description

一种基于知识图谱和用户长短期兴趣的推荐方法
技术领域
本发明涉及一种基于知识图谱和用户长短期兴趣的推荐方法,属于推荐系统的技术领域。
背景技术
随着互联网上的信息越来越多,人们发现从海量的互联网信息中找适合自己、有用的信息变得越来越难。海量信息的背景下,出现了“信息过载”的问题,庞大的数据信息反而降低了人们对信息的利用效率。
为了应对爆炸式的信息增长、互联网公司业务需求发展和人们的日常网络应用需求,在购物、新闻、餐饮领域出现了商品的个性化推荐。常用的推荐算法主要有基于内容的推荐方法和基于协同过滤的推荐方法。前者利用用户历史交互信息和项目特征,基于用户历史偏好推荐相似项目;后者利用用户访问行为的相似性来互相推荐用户可能感兴趣的项目。以上算法在一些应用场景下能取得很好的推荐效果,但是也有不足,如基于内容的推荐过于依赖项目的特征信息,基于协同过滤的推荐存在冷启动问题等。此外,仅仅利用数据集中简单的项目信息不能对用户偏好进行细粒度的建模,忽略了用户兴趣随时间的变化,难以给出推荐结果的可解释性。
发明内容
本发明所要解决的技术问题在于克服现有技术的不足,提供一种基于知识图谱和用户长短期兴趣的推荐方法,引入了知识图谱作为辅助信息,知识图谱中包含了大量的项目属性信息和项目间结构化的关系,根据不同的属性关系更加深入地提取项目特征,能有效缓解冷启动问题,为推荐结果提供可解释性,同时在不同时间维度上采用两种不同的兴趣提取方法分别对用户长期偏好和短期偏好进行建模,更加细粒度地提取用户兴趣,提高了推荐效果,解决了传统算法上用户兴趣建模方法单一、推荐结果可解释性差的问题。
本发明具体采用以下技术方案解决上述技术问题:
一种基于知识图谱和用户长短期兴趣的推荐方法,包括以下步骤:
(1)获取用于测试的项目集,将其映射到所测试领域的通用知识图谱;获取用户-项目评分表,通过用户-项目评分表中的项目评分与设定阈值比较大小,获取用户-项目交互信息。
(2)将待推荐项目在通用知识图谱中对应的项目实体、待推荐项目实体的邻域实体以及构成连接的关系进行Embedding嵌入向量表示后,输入到知识图卷积网络中,计算用户对于待推荐项目实体所连接不同关系的偏好权值,然后根据归一化后的偏好权值的分布,对通用知识图谱中与待推荐项目实体所连接的邻域实体进行加权聚合,获取待推荐项目的项目特征向量表示;
(3)根据用户-项目交互信息获取具有时间序列信息的用户历史偏好集合,通过偏好传播的方法对用户长期偏好进行建模,学习用户长期偏好向量表示;并且,通过将用户历史偏好集合中用户感兴趣的项目,按时间序列顺序依次输入门控循环单元进行模型训练,对用户感兴趣的项目的时间特征信息和兴趣特征信息进行处理,获得用户短期偏好向量表示;
(4)将用户长期偏好向量表示与用户短期偏好向量表示按列进行叠加融合,并经过一层全连接层处理后,得到最终用户偏好向量表示;
(5)将最终用户偏好向量表示与待推荐项目的项目特征向量表示经过内积计算对应特征维度的相似度后输入多层感知机,预测得到用户对待推荐项目感兴趣的概率。
进一步地,作为本发明的一种优选技术方案,所述步骤(1)中获取用户-项目交互信息,具体为:
从开源知识图谱库中获取由三元组表示的所测试领域的通用知识图谱,并将用于测试的项目集与通用知识图谱中的实体进行对齐;
获取按照不同等级划分的用户-项目评分表,设定一个阈值,根据用户-项目评分表获取项目评分,比较项目评分与设定阈值的大小,将项目评分大于等于设定阈值的项目划分为用户感兴趣的项目,且在用户-项目交互信息中用1表示;将项目评分小于设定阈值的项目划分为用户不感兴趣的项目,且在用户-项目交互信息中用0表示,以构建得到用户-项目交互信息。
进一步地,作为本发明的一种优选技术方案,所述步骤(2)中获取待推荐项目的项目特征向量表示,具体为:
首先将用户ID、项目ID、通用知识图谱中待推荐项目实体的邻域实体的连接关系进行Embedding嵌入向量表示,得到用户嵌入向量表示u、待推荐项目实体的嵌入向量表示v和关系向量表示r并输入到知识图卷积网络中,计算用户对于待推荐项目实体所连接的关系的偏好权值kj=uTrj,归一化偏好权值
Figure BDA0003473425500000031
其中
Figure BDA0003473425500000032
为各关系的d维向量表示;
获取待推荐项目实体v的邻域实体向量表示
Figure BDA0003473425500000033
所述e∈N(v)中e是与待推荐项目实体v所连接的邻域实体集合中的一个邻域实体,N(v)为与待推荐项目实体v所连接的邻域实体集合;e是邻域实体e的向量表示;
将待推荐项目实体的嵌入向量表示v和其邻域实体向量表示vN(v)进行加权聚合,得到待推荐项目的项目特征向量表示:Vfinal=σ(W·(v+vN(v))+b),其中σ为sigmoid激活函数;W为sigmoid激活函数的训练权值矩阵,b为偏置项。
进一步地,作为本发明的一种优选技术方案,所述步骤(3)中通过偏好传播的方法对用户长期偏好建模,学习用户长期偏好向量表示,具体为:
以用户历史偏好集合V={V1,V2,…,Vn}中的项目在通用知识图谱上对应的实体X为中心,获取与中心实体直接或间接连接的其他相关实体Xi,计算待推荐项目实体与每一层连接的头实体hi和关系ri的相似度,通过softmax函数输出pi,pi为用户的不同历史偏好与待推荐项目的相关性概率;
在获取用户的不同历史偏好与待推荐项目的相关性概率pi后,取当前层连接的三元组的尾实体的嵌入向量表示ti的加权和,得到与中心实体连接的第一层全部实体的向量表示
Figure BDA0003473425500000034
重复偏好传播过程,得到第二层全部实体的向量表示
Figure BDA0003473425500000035
将第一层全部实体的向量表示
Figure BDA0003473425500000036
和第二层全部实体的向量表示
Figure BDA0003473425500000037
组合相加,得到用户长期偏好向量表示:
Figure BDA0003473425500000038
进一步地,作为本发明的一种优选技术方案,所述步骤(3)中计算用户的不同历史偏好与待推荐项目的相关性概率pi采用公式:
Figure BDA0003473425500000039
所述与中心实体连接的第一层全部实体的向量表示
Figure BDA00034734255000000310
的计算公式为:
Figure BDA00034734255000000311
其中,v是待推荐项目实体的嵌入向量表示;所述
Figure BDA0003473425500000041
中,h、r、t分别是当前层三元组中的头实体、关系、尾实体,
Figure BDA0003473425500000042
是与用户的历史偏好集合连接的第一层实体与关系的集合;hi、ri、ti是其中一种历史偏好中的一组头实体、关系和尾实体;
Figure BDA0003473425500000043
Figure BDA0003473425500000044
分别是关系ri和头实体hi的d维嵌入向量表示;R是当前层的所有关系嵌入向量表示;h是当前层的所有头实体嵌入向量表示。
进一步地,作为本发明的一种优选技术方案,所述步骤(3)中获得用户短期偏好向量表示,具体为:
将具有时间序列信息的用户历史偏好集合V={V1,V2,...,Vn}进行Embedding嵌入向量表示,得到用户历史偏好集合的嵌入向量表示V={V1,V2,...,Vt},并经过平均池化层处理后,按时间序列顺序依次输入到门控循环单元中,计算经过对用户访问感兴趣的项目的时间特征信息和兴趣特征信息进行处理的用户短期偏好向量表示;
所述门控循环单元采用GRU神经网络,其每个交互的隐藏状态输出ht由当前t时刻状态和当前t时刻的前一时刻t-1的隐藏状态输出ht-1更新:
rt=σ(Wr·[ht-1,xt])
zt=σ(Wz·[ht-1,xt])
Figure BDA0003473425500000045
ht=(1-zt)*ht-1+zt*yt
其中,rt,zt表示当前t时刻的重置门和更新门的输出,yt表示当前t时刻的隐藏层的输出,xt表示当前t时刻的用户交互行为的向量输入,xt=Vt,Vt表示当前t时刻的用户历史偏好集合中项目的嵌入向量表示;Wr、Wz
Figure BDA0003473425500000046
分别表示重置门、更新门、当前t时刻状态输出的训练权值矩阵;σ表示sigmod激活函数;使用最终的隐藏状态输出ht作为用户短期偏好向量表示,即Ushort=ht
进一步地,作为本发明的一种优选技术方案,所述步骤(4)中得到的最终用户偏好向量表示Ufinal为:
Ufinal=concat(Ulong+Ushort)。
其中,Ulong为用户长期偏好向量表示,Ushort为用户短期偏好向量表示。
进一步地,作为本发明的一种优选技术方案,所述步骤(5)中多层感知机采用三层的全连接层和激活函数层的组合结构,其中使用sigmoid激活函数层作为输出层,其实现公式为:
Z1=ReLU(W1(Ufinal⊙Vfinal)+b1)
Z2=ReLU(W2Z2+b2)
Z3=ReLU(W3Z3+b3)
Y=σ(Z3)
其中,Z1、Z2、Z3为各层ReLU激活函数的输出;Ufinal为最终用户偏好向量表示;Vfinal为待推荐项目的项目特征向量表示;W1、W2、W3分别为第一层、第二层、第三层全连接层的训练权值矩阵,b1、b2、b3分别为第一层、第二层、第三层全连接层的训练偏置项;σ表示sigmoid激活函数,⊙表示内积操作计算;预测值Y表示用户对待推荐项目感兴趣的概率。
本发明采用上述技术方案,能产生如下技术效果:
(1)本发明的方法,利用知识图谱结构化的知识对项目信息进行表示,通用知识图谱中包含了大量的项目属性信息和项目间结构化的关系,根据不同的属性关系更加深入地提取项目特征,利用知识图谱作为辅助信息,可充分挖掘项目间的语义关系,能有效缓解冷启动问题,为推荐结果提供可解释性;
(2)同时,本发明方法考虑到用户偏好变化的情况,在不同时间维度上采用两种不同的兴趣提取方法,分别对用户长期偏好和短期偏好进行建模;用户长期兴趣采用偏好传播的方式学习,用户短期兴趣通过门控循环单元学习,是一种新颖的用户长短期偏好结合的推荐方式,具有较高的适应性,可以更精准的捕捉动态的用户兴趣变化,解决了由于环境等因素变化导致用户兴趣变化的问题。
(3)以及,本发明中预测层采用多层感知机处理用户偏好向量表示和项目特征向量表示,预测用户对待推荐项目感兴趣的概率,具有高精度的效果。
因此,本发明的方法提升了推荐效果,可以实现个性化推荐,具有可解释性高,适应性强、高精度的特点,能够对基于知识图谱的多领域用户进行项目推荐。
附图说明
图1为本发明基于知识图谱和用户长短期兴趣的推荐方法的流程示意图。
具体实施方式
下面结合说明书附图对本发明的实施方式进行描述。
如图1所示,本发明涉及一种基于知识图谱和用户长短期兴趣的推荐方法,该方法具体包括以下步骤:
(1)获取用于测试的项目集,将其映射到所测试领域的通用知识图谱;获取用户-项目评分表,通过用户-项目评分表中的项目评分与设定阈值比较大小,获取用户-项目交互信息,具体如下:
从开源知识图谱库中获取由三元组(头实体h、关系r、尾实体t)表示的通用知识图谱,并将所要推荐领域的项目集与通用知识图谱中的实体进行对齐;
获取按等级分为0-5分不同等级的用户-项目评分表,并设定一个阈值;根据用户-项目评分表获取项目评分,再将项目评分与设定阈值大小比较,将项目分为用户感兴趣的项目和不感兴趣的项目,本实施例中评分阈值取4,将项目评分大于等于4的项目划分为用户感兴趣的项目,并在用户-项目交互信息中表示为1,说明用户喜好该项目;将项目评分小于4的项目划分为用户不感兴趣的项目,并在用户-项目交互信息中表示为0,说明用户不喜好该项目,从而建立用户-项目的交互信息。其中,用户-项目的交互信息的表述形式是:用户ID-项目ID-交互参数,所述交互参数表示为0或1,即感兴趣为1,不感兴趣为0。
(2)将待推荐项目在通用知识图谱中对应的项目实体、待推荐项目实体的邻域实体以及构成连接的关系进行Embedding嵌入向量表示后,输入到知识图卷积网络中,知识图卷积网络计算用户对于待推荐项目实体所连接不同关系的偏好权值,然后根据归一化后的偏好权值的分布,对通用知识图谱中与待推荐项目实体所连接的邻域实体进行加权聚合,获取待推荐项目的项目特征向量表示,即知识图卷积网络采用实体邻域聚合的方式,对通用知识图谱中与待推荐项目实体连接的邻域实体进行聚合,将与待推荐的项目实体在知识图谱上连接的高阶特征向量聚合在项目特征向量中,获取待推荐项目的项目特征向量表示,具体如下:
首先将用户ID、项目ID、通用知识图谱中待推荐项目实体的邻域实体的连接关系进行Embedding嵌入向量表示,得到用户嵌入向量表示u、待推荐项目实体的嵌入向量表示v和关系向量表示r,并以实体-关系-实体这种三元组的形式输入至知识图卷积网络中,知识图卷积网络计算用户对于待推荐项目实体所连接的关系的偏好权值kj=uTrj,归一化偏好权值
Figure BDA0003473425500000071
其中
Figure BDA0003473425500000072
为各关系的d维向量表示。
获取待推荐项目实体v的邻域实体向量表示为
Figure BDA0003473425500000073
所述e∈N(v)中e是与待推荐项目实体v所连接的邻域实体集合中的一个邻域实体,N(v)为与待推荐项目实体v所连接的邻域实体集合;e是邻域实体e的向量表示;所述待推荐项目实体v的邻域实体向量表示vN(v)则表示与待推荐项目实体v相连接的所有邻域实体的加权和结果。
最后,将待推荐项目实体的嵌入向量表示v和其邻域实体向量表示vN(v)进行加权聚合,得到待推荐项目的项目特征向量表示Vfinal=σ(W·(v+vN(v))+b),其中σ为sigmoid激活函数;W为sigmoid激活函数的训练权值矩阵,b为偏置项。
(3)根据用户-项目交互信息获取具有时间序列信息的用户历史偏好集合,通过偏好传播的方法对用户长期偏好进行建模,学习用户长期偏好向量表示;并且,通过将用户历史偏好集合中感兴趣的项目,按时间序列顺序依次输入门控循环单元进行模型训练,对用户访问感兴趣的项目的时间特征信息和兴趣特征信息进行处理,获得用户短期偏好向量表示,具体如下:
首先,利用偏好传播模型,将用户长期偏好采用偏好传播的方式建模:
根据用户-项目交互信息获取具有时间序列信息的用户历史偏好集合,其过程为:用户-项目交互信息是针对所有用户而言的,此处的用户历史偏好集合是针对当前需要预测的用户,同时按互动行为(如用户购买、消费、观看等)的时间先后顺序进行排列,得到具有时间序列信息的用户历史偏好集合。
以用户历史偏好集合V={V1,V2,...,Vn}中的项目在通用知识图谱上对应的实体X为中心,获取与中心实体直接或间接连接的其他相关实体Xi,其中i用于区分不同的关系和实体,直接连接的实体和关系的i相同,计算待推荐项目与每一层连接的头实体hi和关系ri的相似度,通过softmax函数输出pi,pi为用户的不同历史偏好与待推荐项目的相关性概率:
Figure BDA0003473425500000074
其中,v表示待推荐项目实体的嵌入向量表示,所述
Figure BDA0003473425500000075
中,h、r、t分别是当前层三元组中的头实体、关系、尾实体,
Figure BDA0003473425500000081
是与用户的历史偏好集合连接的第一层实体与关系的集合;hi、ri、ti是其中一种历史偏好中的一组头实体、关系和尾实体;
Figure BDA0003473425500000082
Figure BDA0003473425500000083
分别是关系ri和头实体hi的d维嵌入向量表示。R表示当前层的所有关系嵌入向量表示;h表示当前层的所有头实体嵌入向量表示。
在获取用户的不同历史偏好与待推荐项目的相关性概率后,取当前层连接的三元组的尾实体的嵌入向量表示ti的加权和:
Figure BDA0003473425500000084
其中
Figure BDA0003473425500000085
为与中心实体连接的第一层全部实体的向量表示,此时用户的兴趣就从历史偏好传播到与之相连的第一层实体上,重复偏好传播过程,得到第二层全部实体向量表示
Figure BDA0003473425500000086
再将第一层全部实体的向量表示
Figure BDA0003473425500000087
和第二层全部实体的向量
Figure BDA0003473425500000088
组合相加,得到用户长期偏好向量表示:
Figure BDA0003473425500000089
此处传播层数依据所用领域知识图谱结构选择。
然后,用户短期偏好采用门控循环单元对用户历史时间序列信息进行建模,所述门控循环单元采用GRU神经网络。首先获取具有时间序列信息的用户历史偏好集合V={V1,V2,...,Vn},其中,Vn表示第n个用户历史偏好集合,一共有n个用户历史偏好集合,再将用户历史偏好集合V={V1,V2,...,Vn}进行Embedding嵌入表示,得到用户历史偏好集合的嵌入向量表示V={V1,V2,...,Vt},并经过平均池化层处理后,按时间先后顺序输入到GRU神经网络中,计算经过对用户感兴趣项目的时间特征信息和兴趣特征信息处理的用户短期偏好向量表示。所述GRU神经网络结构如下式所示,在初始化之后,第t个交互步骤如下,每个交互的隐状态ht由当前t时刻状态和当前t时刻的前一时刻t-1的隐藏状态输出ht-1更新:
rt=σ(Wr·[ht-1,xt])
zt=σ(Wz·[ht-1,xt])
Figure BDA00034734255000000811
ht=(1-zt)*ht-1+zt*yt
其中rt,zt表示当前t时刻的重置门和更新门的输出,yt表示当前t时刻的隐藏层的输出,xt表示当前t时刻的用户交互行为的向量输入,xt=Vt,Vt表示当前t时刻的用户历史偏好集合中项目的嵌入向量表示。Wr,Wz
Figure BDA00034734255000000810
分别表示重置门、更新门、当前t时刻状态输出的训练权值矩阵;σ表示sigmoid激活函数;使用最终的隐藏状态输出ht作为用户的短期偏好表示,即Ushort=ht
(4)将用户长期偏好向量表示Ulong与用户短期偏好向量表示Ushort按列进行叠加融合,并经过一层全连接层处理后,得到最终用户偏好向量表示,具体如下:
将用户长期偏好向量表示与用户短期偏好向量表示按列进行拼接,再经过全连接层后,得到最终用户偏好向量表示:Ufinal=concat(Ulong+Ushort)。
(5)将最终用户偏好向量表示Ufinal与待推荐项目的项目特征向量表示Vfinal经过内积计算对应特征维度的相似度后输入多层感知机,预测得到用户对待推荐项目感兴趣的概率,具体如下:
将最终用户偏好向量表示Ufinal与待推荐项目的项目特征向量表示Vfinal经过内积计算对应特征维度的相似度后输入多层感知机中,所述多层感知机的网络结构采用三层的全连接层和激活函数层的组合结构,最后用sigmoid激活函数层作为输出层,具体实现公式如下:
Z1=ReLU(W1(Ufinal⊙Vfinal)+b1)
Z2=ReLU(W2Z2+b2)
Z3=ReLU(W3Z3+b3)
Y=σ(Z3)
其中,多层感知机的神经网络中除输入层、输出层以外的中间的特征处理层为隐藏层,所述隐藏层采用ReLU作为激活函数,采用sigmoid作为激活函数输出预测值。上述公式中,Z1、Z2、Z3为各层ReLU激活函数的输出,Ufinal为最终用户偏好向量表示,Vfinal为待推荐项目的项目特征向量表示,W1、W2、W3分别为第一层、第二层、第三层全连接层的训练权值矩阵,b1、b2、b3分别为第一层、第二层、第三层全连接层的训练偏置项。σ表示sigmoid激活函数,⊙预表示内积操作计算。预测值Y表示用户对待推荐项目感兴趣的概率,取值范围为[0,1]。
为了验证本发明的方法的有效性,采用AUC和ACC指标衡量模型效果,将本发明方法和各种基线方法MovieLens-1M数据集上的实验对比结果如下述表1所示。
表1实验结果对比
算法模型 AUC ACC
CKE 0.796 0.739
LibFM 0.892 0.812
Wide&Deep 0.903 0.822
KGCN 0.904 0.828
RippleNet 0.918 0.843
本方法模型 0.925 0.850
根据上述表1中的数据对比可得,本方法相比于基线方法在AUC指标上最高提升了16.2%,在ACC指标上最高提升了15.1%。
综上,本发明的方法,利用知识图谱作为辅助信息,可充分挖掘项目间的语义关系,能有效缓解冷启动问题,为推荐结果提供可解释性;在不同时间维度上,采用两种不同的兴趣提取方法,分别对用户长期偏好和短期偏好进行建模,具有较高的适应性,可以更精准的捕捉动态的用户兴趣变化,解决了由于环境等因素变化导致用户兴趣变化的问题。因此,本发明的方法提升了推荐效果,可以实现个性化推荐,具有可解释性高,适应性强、高精度的特点,能够对基于知识图谱的多领域用户进行项目推荐。
上面结合附图对本发明的实施方式作了详细说明,但是本发明并不限于上述实施方式,在本领域普通技术人员所具备的知识范围内,还可以在不脱离本发明宗旨的前提下做出各种变化。

Claims (8)

1.一种基于知识图谱和用户长短期兴趣的推荐方法,其特征在于,包括以下步骤:
(1)获取用于测试的项目集,将其映射到所测试领域的通用知识图谱;获取用户-项目评分表,通过用户-项目评分表中的项目评分与设定阈值比较大小,获取用户-项目交互信息;
(2)将待推荐项目在通用知识图谱中对应的项目实体、待推荐项目实体的邻域实体以及构成连接的关系进行Embedding嵌入向量表示后,输入到知识图卷积网络中,计算用户对于待推荐项目实体所连接不同关系的偏好权值,然后根据归一化后的偏好权值的分布,对通用知识图谱中与待推荐项目实体所连接的邻域实体进行加权聚合,获取待推荐项目的项目特征向量表示;
(3)根据用户-项目交互信息获取具有时间序列信息的用户历史偏好集合,通过偏好传播的方法对用户长期偏好进行建模,学习用户长期偏好向量表示;并且将用户历史偏好集合中用户感兴趣的项目,按时间序列顺序依次输入门控循环单元进行训练,对用户感兴趣项目的时间特征信息和兴趣特征信息进行处理,获得用户短期偏好向量表示;
(4)将用户长期偏好向量表示与用户短期偏好向量表示按列进行叠加融合,并经过一层全连接层处理后,得到最终用户偏好向量表示;
(5)将最终用户偏好向量表示与待推荐项目的项目特征向量表示,经过内积计算对应特征维度的相似度后输入多层感知机,预测得到用户对待推荐项目感兴趣的概率。
2.根据权利要求1所述基于知识图谱和用户长短期兴趣的推荐方法,其特征在于,所述步骤(1)中获取用户-项目交互信息,具体为:
从开源知识图谱库中获取由三元组表示的所测试领域的通用知识图谱,并将用于测试的项目集与通用知识图谱中的实体进行对齐;
获取按照不同等级划分的用户-项目评分表,设定一个阈值,根据用户-项目评分表获取项目评分,比较项目评分与设定阈值的大小,将项目评分大于等于设定阈值的项目划分为用户感兴趣的项目,且在用户-项目交互信息中用1表示;将项目评分小于设定阈值的项目划分为用户不感兴趣的项目,且在用户-项目交互信息中用0表示,以构建得到用户-项目交互信息。
3.根据权利要求1所述基于知识图谱和用户长短期兴趣的推荐方法,其特征在于,所述步骤(2)中获取待推荐项目的项目特征向量表示,具体为:
首先将用户ID、项目ID、通用知识图谱中待推荐项目实体的邻域实体的连接关系进行Embedding嵌入向量表示,得到用户嵌入向量表示u、待推荐项目实体的嵌入向量表示v和关系向量表示r,并输入到知识图卷积网络中,计算用户对于待推荐项目实体所连接的关系的偏好权值kj=uTrj,归一化偏好权值
Figure FDA0003473425490000021
其中
Figure FDA0003473425490000022
为各关系的d维向量表示;
获取待推荐项目实体v的邻域实体向量表示
Figure FDA0003473425490000023
所述e∈N(v)中e是与待推荐项目实体v所连接的邻域实体集合中的一个邻域实体,N(v)是与待推荐项目实体v所连接的邻域实体集合;e是邻域实体e的向量表示;
将待推荐项目实体的嵌入向量表示v和其邻域实体向量表示vN(v)进行加权聚合,得到待推荐项目的项目特征向量表示:Vfinal=σ(W·(v+vN(v))+b),其中σ为sigmoid激活函数;W为sigmoid激活函数的训练权值矩阵,b为偏置项。
4.根据权利要求1所述基于知识图谱和用户长短期兴趣的推荐方法,其特征在于,所述步骤(3)中通过偏好传播的方法对用户长期偏好进行建模,学习用户长期偏好向量表示,具体为:
以用户历史偏好集合V={V1,V2,...,Vn}中的项目在通用知识图谱上对应的实体X为中心,获取与中心实体直接或间接连接的其他相关实体Xi,计算待推荐项目实体与每一层连接的头实体hi和关系ri的相似度,通过softmax函数输出pi,pi为用户的不同历史偏好与待推荐项目的相关性概率;
在获取用户的不同历史偏好与待推荐项目的相关性概率pi后,取当前层连接的三元组的尾实体的嵌入向量表示ti的加权和,得到与中心实体连接的第一层全部实体的向量表示
Figure FDA0003473425490000024
重复偏好传播过程,得到第二层全部实体的向量表示
Figure FDA0003473425490000025
将第一层全部实体的向量表示
Figure FDA0003473425490000026
和第二层全部实体的向量表示
Figure FDA0003473425490000027
组合相加,得到用户长期偏好向量表示:
Figure FDA0003473425490000028
5.根据权利要求4所述基于知识图谱和用户长短期兴趣的推荐方法,其特征在于,所述步骤(3)中计算用户的不同历史偏好与待推荐项目的相关性概率pi采用公式:
Figure FDA0003473425490000029
所述与中心实体连接的第一层全部实体的向量表示
Figure FDA00034734254900000210
的计算公式为:
Figure FDA00034734254900000211
其中,v是待推荐项目实体的嵌入向量表示;所述
Figure FDA0003473425490000031
中,h、r、t分别是当前层三元组中的头实体、关系、尾实体,
Figure FDA0003473425490000032
是与用户的历史偏好集合连接的第一层实体与关系的集合;hi、ri、ti是其中一种历史偏好中的一组头实体、关系和尾实体;
Figure FDA0003473425490000033
Figure FDA0003473425490000034
分别是关系ri和头实体hi的d维嵌入向量表示;R是当前层的所有关系嵌入向量表示;h是当前层的所有头实体嵌入向量表示。
6.根据权利要求1所述基于知识图谱和用户长短期兴趣的推荐方法,其特征在于,所述步骤(3)中获得用户短期偏好向量表示,具体为:
将具有时间序列信息的用户历史偏好集合V={V1,V2,…,Vn}进行Embedding嵌入向量表示,得到用户历史偏好集合的嵌入向量表示V={V1,V2,...,Vt},并经过平均池化层处理后,按时间序列顺序依次输入到门控循环单元中,对用户感兴趣项目的时间特征信息和兴趣特征信息进行处理,获得用户短期偏好向量表示;
所述门控循环单元采用GRU神经网络,其每个交互的隐藏状态输出ht由当前t时刻状态和当前t时刻的前一时刻t-1的隐藏状态输出ht-1更新:
rt=σ(Wr·[ht-1,xt])
zt=σ(Wz·[ht-1,xt])
Figure FDA0003473425490000035
ht=(1-zt)*ht-1+zt*yt
其中,rt,zt表示当前t时刻的重置门和更新门的输出,yt表示当前t时刻的隐藏层的输出,xt表示当前t时刻的用户交互行为的向量输入,xt=Vt,Vt表示当前t时刻的用户历史偏好集合中项目的嵌入向量表示;Wr、Wz
Figure FDA0003473425490000036
分别表示重置门、更新门、当前t时刻状态输出的训练权值矩阵;σ表示sigmoid激活函数;使用最终的隐藏状态输出ht作为用户短期偏好向量表示,即Ushort=ht
7.根据权利要求1所述基于知识图谱和用户长短期兴趣的推荐方法,其特征在于,所述步骤(4)中得到的最终用户偏好向量表示Ufinal为:
Ufinal=concat(Ulong+Ushort)。
其中,Ulong为用户长期偏好向量表示,Ushort为用户短期偏好向量表示。
8.根据权利要求1所述基于知识图谱和用户长短期兴趣的推荐方法,其特征在于,所述步骤(5)中多层感知机采用三层的全连接层和激活函数层的组合结构,其中使用sigmoid激活函数层作为输出层,其实现公式为:
Z1=ReLU(W1(Ufinal⊙Vfinal)+b1)
Z2=ReLU(W2Z2+b2)
Z3=ReLU(W3Z3+b3)
Y=σ(Z3)
其中,Z1、Z2、Z3为各层ReLU激活函数的输出;Ufinal为最终用户偏好向量表示;Vfinal为待推荐项目的项目特征向量表示;W1、W2、W3分别为第一层、第二层、第三层全连接层的训练权值矩阵,b1、b2、b3分别为第一层、第二层、第三层全连接层的训练偏置项;σ表示sigmoid激活函数,⊙表示内积操作计算;预测值Y表示用户对待推荐项目感兴趣的概率。
CN202210051109.2A 2022-01-17 2022-01-17 一种基于知识图谱和用户长短期兴趣的推荐方法 Pending CN114491247A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210051109.2A CN114491247A (zh) 2022-01-17 2022-01-17 一种基于知识图谱和用户长短期兴趣的推荐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210051109.2A CN114491247A (zh) 2022-01-17 2022-01-17 一种基于知识图谱和用户长短期兴趣的推荐方法

Publications (1)

Publication Number Publication Date
CN114491247A true CN114491247A (zh) 2022-05-13

Family

ID=81511217

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210051109.2A Pending CN114491247A (zh) 2022-01-17 2022-01-17 一种基于知识图谱和用户长短期兴趣的推荐方法

Country Status (1)

Country Link
CN (1) CN114491247A (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114756694A (zh) * 2022-06-16 2022-07-15 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院) 基于知识图谱的推荐系统、推荐方法和相关设备
CN115438259A (zh) * 2022-09-05 2022-12-06 淮阴工学院 基于动态兴趣和知识图谱的冷链物流车源推荐方法及装置
CN115618098A (zh) * 2022-09-08 2023-01-17 淮阴工学院 基于知识增强与空洞卷积的冷链物流推荐方法及装置
CN116108687A (zh) * 2023-03-03 2023-05-12 桂林电子科技大学 一种利用多属性多行为信息的序列推荐方法
CN116383521A (zh) * 2023-05-19 2023-07-04 苏州浪潮智能科技有限公司 主题词挖掘方法及装置、计算机设备及存储介质
CN117786217A (zh) * 2023-12-27 2024-03-29 烟台新旧动能转换研究院暨烟台科技成果转移转化示范基地 一种基于Mamba架构的高可信度时序数据预测方法
CN118377979A (zh) * 2024-06-24 2024-07-23 杭州电子科技大学 基于时序知识图谱的兴趣点推荐方法、介质及电子设备
CN118377979B (zh) * 2024-06-24 2024-09-27 杭州电子科技大学 基于时序知识图谱的兴趣点推荐方法、介质及电子设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110287335A (zh) * 2019-06-17 2019-09-27 桂林电子科技大学 基于知识图谱和用户长短期偏好的个性化景点推荐方法及装置
US20210027178A1 (en) * 2019-07-26 2021-01-28 Ricoh Company, Ltd. Recommendation method and recommendation apparatus based on deep reinforcement learning, and non-transitory computer-readable recording medium
CN113158033A (zh) * 2021-03-19 2021-07-23 浙江工业大学 一种基于知识图谱偏好传播的协同推荐模型构建方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110287335A (zh) * 2019-06-17 2019-09-27 桂林电子科技大学 基于知识图谱和用户长短期偏好的个性化景点推荐方法及装置
US20210027178A1 (en) * 2019-07-26 2021-01-28 Ricoh Company, Ltd. Recommendation method and recommendation apparatus based on deep reinforcement learning, and non-transitory computer-readable recording medium
CN113158033A (zh) * 2021-03-19 2021-07-23 浙江工业大学 一种基于知识图谱偏好传播的协同推荐模型构建方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
YUXIA WU 等: "Long- and Short-term Preference Learning for Next POI Recommendation", SHORT - URBANISM AND MOBILITY, 7 November 2019 (2019-11-07), pages 1 - 4 *
顾军华 等: "基于用户长短期兴趣与知识图卷积网络的推荐", 计算机工程与科学, vol. 43, no. 3, 31 March 2021 (2021-03-31), pages 1 - 7 *

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114756694A (zh) * 2022-06-16 2022-07-15 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院) 基于知识图谱的推荐系统、推荐方法和相关设备
CN115438259A (zh) * 2022-09-05 2022-12-06 淮阴工学院 基于动态兴趣和知识图谱的冷链物流车源推荐方法及装置
CN115618098A (zh) * 2022-09-08 2023-01-17 淮阴工学院 基于知识增强与空洞卷积的冷链物流推荐方法及装置
CN115618098B (zh) * 2022-09-08 2023-07-04 淮阴工学院 基于知识增强与空洞卷积的冷链物流推荐方法及装置
CN116108687A (zh) * 2023-03-03 2023-05-12 桂林电子科技大学 一种利用多属性多行为信息的序列推荐方法
CN116383521A (zh) * 2023-05-19 2023-07-04 苏州浪潮智能科技有限公司 主题词挖掘方法及装置、计算机设备及存储介质
CN116383521B (zh) * 2023-05-19 2023-08-29 苏州浪潮智能科技有限公司 主题词挖掘方法及装置、计算机设备及存储介质
CN117786217A (zh) * 2023-12-27 2024-03-29 烟台新旧动能转换研究院暨烟台科技成果转移转化示范基地 一种基于Mamba架构的高可信度时序数据预测方法
CN117786217B (zh) * 2023-12-27 2024-06-11 烟台新旧动能转换研究院暨烟台科技成果转移转化示范基地 一种基于Mamba架构的高可信度时序数据预测方法
CN118377979A (zh) * 2024-06-24 2024-07-23 杭州电子科技大学 基于时序知识图谱的兴趣点推荐方法、介质及电子设备
CN118377979B (zh) * 2024-06-24 2024-09-27 杭州电子科技大学 基于时序知识图谱的兴趣点推荐方法、介质及电子设备

Similar Documents

Publication Publication Date Title
CN114491247A (zh) 一种基于知识图谱和用户长短期兴趣的推荐方法
Zhou Product advertising recommendation in e-commerce based on deep learning and distributed expression
CN110275964B (zh) 基于知识图谱与循环神经网络的推荐模型
CN112529168B (zh) 一种基于gcn的属性多层网络表示学习方法
Luo et al. Personalized recommendation by matrix co-factorization with tags and time information
CN110362738B (zh) 一种基于深度学习的结合信任和影响力的个性化推荐方法
CN111881363B (zh) 一种基于图交互网络的推荐方法
CN114048331A (zh) 一种基于改进型kgat模型的知识图谱推荐方法及系统
CN110930219B (zh) 一种基于多特征融合的个性化电商推荐方法
Jia et al. Label distribution learning by maintaining label ranking relation
Ding et al. Product color emotional design based on a convolutional neural network and search neural network
CN109933720B (zh) 一种基于用户兴趣自适应演化的动态推荐方法
CN107545471A (zh) 一种基于高斯混合的大数据智能推荐方法
CN112417313A (zh) 一种基于知识图卷积网络的模型混合推荐方法
Li et al. Understanding and predicting users’ rating behavior: A cognitive perspective
CN113918834B (zh) 融合社交关系的图卷积协同过滤推荐方法
Behera et al. Handling data sparsity via item metadata embedding into deep collaborative recommender system
CN112131261A (zh) 基于社区网络的社区查询方法、装置和计算机设备
CN113221003B (zh) 一种基于对偶理论的混合过滤推荐方法及系统
CN108984551A (zh) 一种基于多类别联合软聚类的推荐方法及系统
Nazari et al. Scalable and data-independent multi-agent recommender system using social networks analysis
CN118071400A (zh) 基于图计算技术在信息消费领域的应用方法及系统
Lv et al. DSMN: An improved recommendation model for capturing the multiplicity and dynamics of consumer interests
CN116561443A (zh) 基于属性扩展的双消息传播图的项目推荐方法、装置
CN115310004A (zh) 融合项目时序关系的图神经协同过滤推荐方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination