CN114491267A - 一种物品的推荐方法、装置以及存储介质 - Google Patents
一种物品的推荐方法、装置以及存储介质 Download PDFInfo
- Publication number
- CN114491267A CN114491267A CN202210110849.9A CN202210110849A CN114491267A CN 114491267 A CN114491267 A CN 114491267A CN 202210110849 A CN202210110849 A CN 202210110849A CN 114491267 A CN114491267 A CN 114491267A
- Authority
- CN
- China
- Prior art keywords
- term
- long
- short
- target user
- target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供一种物品的推荐方法、装置以及存储介质,属于数据分析技术领域,方法包括:S1:从预设数据库中导入所有目标用户的历史长期兴趣数据集以及与每个目标用户一一对应的历史短期兴趣数据集;S2:对历史长期兴趣数据集进行数据预处理得到长期兴趣数据训练集;S3:根据长期兴趣数据训练集和所有的历史短期兴趣数据集对训练模型进行训练得到目标推荐模型;S4:将长期兴趣数据验证集和短期兴趣数据验证集一并输入至目标推荐模型中得到物品的推荐结果。本发明能够挖掘用户自身长期稳定的一般爱好和短期的动态偏好,并捕获了社交好友兴趣偏好对用户产生的影响,可以实现具备社交属性的个性化推荐,并且提升了推荐准确率以及可解释性。
Description
技术领域
本发明主要涉及数据分析技术领域,具体涉及一种物品的推荐方法、装置以及存储介质。
背景技术
推荐系统作为一种信息过滤系统,不仅可以有效解决信息过载问题,而且对于促进生产和提高生活质量具有一定的现实意义。而如何利用深度学习技术从各种复杂多维数据中学习用户和物品的内在本质特征,构建更加符合用户兴趣需求的模型,以提高推荐算法的性能和用户满意度,一直是学术界和工业界共同关注的方向。
但要充分准确地捕获用户对潜在项目的兴趣是一项具有挑战的任务。首先用户的兴趣特征可分为长期稳定的个人爱好和短期动态变化的当下偏好,它们反映的内容不同,对用户的影响也不同。并且用户还可能会受社交网络中的好友的影响,比如用户对于自己不熟悉的项目会咨询好友的建议或跟风好友的交互行为。因此,如何在推荐模型中同时考虑用户的长期和短期兴趣以及社交好友的影响是迫切需要解决的问题。
发明内容
本发明所要解决的技术问题是针对现有技术的不足,提供一种物品的推荐方法、装置以及存储介质。
本发明解决上述技术问题的技术方案如下:一种物品的推荐方法,包括如下步骤:
S1:从预设数据库中导入所有目标用户的历史长期兴趣数据集以及与每个目标用户一一对应的历史短期兴趣数据集;
S2:对所述历史长期兴趣数据集进行数据预处理,得到长期兴趣数据训练集;
S3:构建训练模型,根据所述长期兴趣数据训练集和所有的历史短期兴趣数据集对所述训练模型进行训练,得到目标推荐模型;
S4:导入长期兴趣数据验证集和短期兴趣数据验证集,并将所述长期兴趣数据验证集和所述短期兴趣数据验证集一并输入至所述目标推荐模型中,并根据所述目标推荐模型得到物品的推荐结果。
本发明解决上述技术问题的另一技术方案如下:一种物品的推荐装置,包括:
数据集获取模块,用于从预设数据库中导入所有目标用户的历史长期兴趣数据集以及与每个目标用户一一对应的历史短期兴趣数据集;
数据集预处理模块,用于对所述历史长期兴趣数据集进行数据预处理,得到长期兴趣数据训练集;
模型训练模块,用于构建训练模型,根据所述长期兴趣数据训练集和所有的历史短期兴趣数据集对所述训练模型进行训练,得到目标推荐模型;
推荐结果获得模块,用于导入长期兴趣数据验证集和短期兴趣数据验证集,并将所述长期兴趣数据验证集和所述短期兴趣数据验证集一并输入至所述目标推荐模型中,并根据所述目标推荐模型得到物品的推荐结果。
本发明解决上述技术问题的另一技术方案如下:一种物品的推荐装置,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,当所述处理器执行所述计算机程序时,实现如上所述的物品的推荐方法。
本发明解决上述技术问题的另一技术方案如下:一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,当所述计算机程序被处理器执行时,实现如上所述的物品的推荐方法。
本发明的有益效果是:通过对历史长期兴趣数据集得数据预处理得到长期兴趣数据训练集,构建训练模型,根据长期兴趣数据训练集和所有的历史短期兴趣数据集对训练模型的训练得到目标推荐模型,将长期兴趣数据验证集和短期兴趣数据验证集一并输入至目标推荐模型中,并根据目标推荐模型得到物品的推荐结果,能够挖掘用户自身长期稳定的一般爱好和短期的动态偏好,并捕获了社交好友兴趣偏好对用户产生的影响,可以实现具备社交属性的个性化推荐,并且提升了推荐准确率以及可解释性。
附图说明
图1为本发明实施例提供的一种物品的推荐方法的流程示意图;
图2为本发明实施例提供的一种物品的推荐装置的模块框图。
具体实施方式
以下结合附图对本发明的原理和特征进行描述,所举实例只用于解释本发明,并非用于限定本发明的范围。
图1为本发明实施例提供的一种物品的推荐方法的流程示意图。
如图1所示,一种物品的推荐方法,包括如下步骤:
S1:从预设数据库中导入所有目标用户的历史长期兴趣数据集以及与每个目标用户一一对应的历史短期兴趣数据集;
S2:对所述历史长期兴趣数据集进行数据预处理,得到长期兴趣数据训练集;
S3:构建训练模型,根据所述长期兴趣数据训练集和所有的历史短期兴趣数据集对所述训练模型进行训练,得到目标推荐模型;
S4:导入长期兴趣数据验证集和短期兴趣数据验证集,并将所述长期兴趣数据验证集和所述短期兴趣数据验证集一并输入至所述目标推荐模型中,并根据所述目标推荐模型得到物品的推荐结果。
应理解地,所述数据预处理即为对数据进行数据清洗和预处理工作。
上述实施例中,通过对历史长期兴趣数据集得数据预处理得到长期兴趣数据训练集,构建训练模型,根据长期兴趣数据训练集和所有的历史短期兴趣数据集对训练模型的训练得到目标推荐模型,将长期兴趣数据验证集和短期兴趣数据验证集一并输入至目标推荐模型中,并根据目标推荐模型得到物品的推荐结果,能够挖掘用户自身长期稳定的一般爱好和短期的动态偏好,并捕获了社交好友兴趣偏好对用户产生的影响,可以实现具备社交属性的个性化推荐,并且提升了推荐准确率以及可解释性。
可选地,作为本发明的一个实施例,所述长期兴趣数据训练集包括多个长期交互记录数据、多个标签数据和多个关系数据,所述步骤S3的过程包括:
通过所有的长期交互记录数据、所有的标签数据以及所有的关系数据构建得到知识图谱,所述知识图谱包括多个与所述目标用户对应的目标用户节点、与各个所述目标用户节点对应的待处理目标用户特征向量、与各个所述目标用户节点对应的多个目标用户有向边、与各个所述目标用户对应的多个长期项目节点、与各个所述长期项目节点对应的待处理长期项目特征向量以及与各个所述长期项目节点对应的多个长期项目有向边;
分别对各个所述目标用户节点、与各个所述目标用户节点对应的待处理目标用户特征向量以及与各个所述目标用户节点对应的多个目标用户有向边进行长期兴趣特征向量的分析,得到与各个所述目标用户对应的长期兴趣特征向量;
分别对各个所述长期项目节点、与各个所述长期项目节点对应的待处理长期项目特征向量以及与各个所述长期项目节点对应的多个长期项目有向边进行长期项目特征向量的分析,得到与各个所述长期项目节点对应的长期项目特征向量;
分别对各个所述历史短期兴趣数据集进行短期兴趣特征向量的分析,得到与各个所述目标用户对应的短期兴趣特征向量;
分别对各个所述长期兴趣特征向量以及与各个所述目标用户对应的短期兴趣特征向量进行特征融合分析,得到与各个所述目标用户对应的全局特征向量;
分别对各个所述全局特征向量以及与各个所述目标用户对应的多个所述长期项目特征向量进行目标概率的分析,得到与各个所述目标用户对应的目标概率;
导入与各个所述目标用户对应的真实标签,分别对各个所述目标概率以及各个与所述目标用户对应的真实标签进行损失值计算,得到与各个所述目标用户对应的损失值;
根据多个所述损失值对所述训练模型进行参数更新,并返回步骤S1,直至达到预设迭代次数,则将更新后的训练模型作为目标推荐模型。
应理解地,通过反向传播和梯度下降算法不断迭代地更新步骤S1至S4中的参数使所述损失值最小,从而完成整个模型的训练。
应理解地,利用相关数据构造一个包含目标用户与社交好友、目标用户与交互项目、项目与所属类别三类关系的知识图谱。
应理解地,从数据库(即所述预设数据库)中导出较长时间周期范围内所有用户与项目的所述长期交互记录数据、每个项目所属类别的所述标签数据、每个用户与社交对象的所述关系数据,这里的“交互”、“项目”、“关系”在不同的应用场景下的含义可以不同:其中“交互”可以是购买/浏览/收藏等行为;“项目”可以是商品/视频/音乐/新闻/美食等内容;“关系”可以是单向或双向关注。
应理解地,将所述知识图谱通过异构图神经网络进行特征学习,得到包含用户社交影响的所述长期兴趣特征向量和包含丰富语义的项目特征向量(即所述长期项目特征向量)。
假设1:在知识图谱中,有三种类型节点和三种类型边。节点有用户节点集合U、项目节点集合I、类别节点集合A;边集合分别有Εdge(U,U)、Edge(I,U)、Edge(A,I)。并且第u个用户节点表示为u∈U,第i个项目节点表示为i∈I,第a个类别表示为a∈A;
假设3:若用户u关注用户v,且v未关注用户u则构造单向边,表示为edge(v→u);若用户u和v互关则构造双向边,表示为边的权重计算为u和v两个节点对应特征向量之间的相似度,表示两个用户的兴趣相似性;
假设5:若项目i属于类别a,则构造单向边,表示为edge(a→i),边的权重为1。
上述实施例中,通过长期兴趣数据训练集和所有的历史短期兴趣数据集对训练模型的训练得到目标推荐模型,能够挖掘用户自身长期稳定的一般爱好和短期的动态偏好,并捕获了社交好友兴趣偏好对用户产生的影响,实现了具备社交属性的个性化推荐。
可选地,作为本发明的一个实施例,所述分别对各个所述目标用户节点、与各个所述目标用户节点对应的待处理目标用户特征向量以及与各个所述目标用户节点对应的多个目标用户有向边进行长期兴趣特征向量的分析,得到与各个所述目标用户对应的长期兴趣特征向量的过程包括:
分别对各个所述待处理目标用户特征向量进行随机初始化处理,得到与各个所述目标用户对应的目标用户初始特征向量;
通过第一式分别对各个所述目标用户节点、与各个所述目标用户对应的目标用户初始特征向量以及与各个所述目标用户节点对应的多个目标用户有向边进行长期兴趣特征向量的特征聚合,得到与各个所述目标用户对应的长期兴趣特征向量,所述第一式为:
其中,S(n1,u)=softmax(q1 Tσ'(W11H[n1]+W12H[u]+b1)),M(n1,u)=Wn1uH[n1]+bn1u,
其中,u为目标用户节点,为长期兴趣特征向量,σ为ReLU激活函数,q1、W11、W12、b1、W3、b3、Wn1u、bn1u均为可学习的参数,H[u]为目标用户节点u的目标用户初始特征向量,N[u]为目标用户邻居特征向量,n1为目标用户节点u的邻居节点,edge(n1,u)为目标用户有向边,Ein(u)为方向指向目标用户节点u的有向边的集合,S(n1,u)为邻居节点n1传递给目标用户节点u的重要性分数,M(n1,u)为沿有向边edge(n1,u)方向从邻居节点n1传递给目标用户节点u的消息,σ'为sigmoid激活函数,softmax为softmax函数,H[n1]为邻居节点n1的目标用户初始特征向量。
应理解地,对知识图谱中的各类节点的特征向量的值(即所述待处理目标用户特征向量)进行随机初始化,分别得到初始特征向量H[u](即所述目标用户初始特征向量)、H[i](即所述长期项目初始特征向量)、H[a]。然后利用一个异构图神经网络(简称HGNN)根据消息传递和聚合机制对图中的目标用户节点和项目节点进行特征学习。
具体地,对于所述目标用户节点,先聚合目标节点(即所述目标用户节点)的邻居节点的特征,得到包含其多个邻居特征信息的邻居特征向量N[u],如下式:
S(n1,u)=softmax(q1 Tσ'(W11 H[n1]+W12H[u]+b1))
其中,n1表示用户节点的邻居节点,H[n1]为邻居节点的初始特征向量(即所述目标用户初始特征向量)。Ein(u)表示方向指向用户节点u的边的集合,M(n,u)表示沿边edge(n,u)方向从邻居n1传递给u的消息。S(n,u)表示邻居n1传递给的消息的重要性分数(数值范围为0至1),q1、W11、W12、Wn1u、bn1u、b1都是可学习的参数,σ'为sigmoid激活函数,softmax为softmax函数。
其中,σ为ReLU激活函数,W3、b3都是可学习的参数。
上述实施例中,通过分别对各个目标用户节点、待处理目标用户特征向量以及多个目标用户有向边的长期兴趣特征向量分析得到长期兴趣特征向量,挖掘了来自用户与好友、用户与项目、项目与类别之间丰富的潜在关联和语义内容,学习到了包含用户社交影响的长期兴趣特征,捕获了目标用户长期稳定的一般爱好。
可选地,作为本发明的一个实施例,所述分别对各个所述长期项目节点、与各个所述长期项目节点对应的待处理长期项目特征向量以及与各个所述长期项目节点对应的多个长期项目有向边进行长期项目特征向量的分析,得到与各个所述长期项目节点对应的长期项目特征向量的过程包括:
分别对各个所述待处理长期项目特征向量进行随机初始化处理,得到与各个所述长期项目节点对应的长期项目初始特征向量;
通过第二式分别对各个所述长期项目节点、与各个所述长期项目节点对应的长期项目初始特征向量以及与各个所述长期项目节点对应的多个长期项目有向边进行长期项目特征向量的特征聚合,得到与各个所述长期项目节点对应的长期项目特征向量,所述第二式为:
其中,S(n2,i)=softmax(q2 Tσ′(W21H[n2]+W22H[i]+b2)),M(n2,i)=Wn2iH[n2]+bn2i,
其中,i为长期项目节点,为长期项目节点i的长期项目特征向量,σ为ReLU激活函数,q2、W21、W22、b2、W4、b4、Wn2i、bn2i均为可学习的参数,H[i]为长期项目节点i的长期项目初始特征向量,N[i]为长期项目邻居特征向量,n2为长期项目节点i的邻居节点,edge(n2,i)为长期项目有向边,Ein(i)为方向指向长期项目节点i的边的集合,S(n2,i)为邻居节点n2传递给长期项目节点i的重要性分数,M(n2,i)为沿有向边edge(n2,i)方向从邻居节点n2传递给长期项目节点i的消息,σ'为sigmoid激活函数,softmax为softmax函数,H[n2]为邻居节点n2的长期项目初始特征向量。
应理解地,对知识图谱中的各类节点的特征向量的值(即所述待处理长期项目特征向量)进行随机初始化,分别得到初始特征向量H[u](即所述目标用户初始特征向量)、H[i](即所述长期项目初始特征向量)、H[a]。然后利用一个异构图神经网络(简称HGNN)根据消息传递和聚合机制对图中的目标用户节点和项目节点进行特征学习。
应理解地,所述随机初始化处理指的是与所述目标用户初始特征向量的随机初始化处理具有相同的数据处理步骤,但仅仅是分别将所述待处理长期项目特征向量或者所述目标用户初始特征向量输入至随机初始化的数据处理步骤中。
具体地,对于项目节点(即所述长期项目节点),先聚合目标节点(即所述长期项目节点)的邻居节点的特征,得到包含其多个邻居特征信息的邻居特征向量N[i],如下式:
S(n2,i)=softmax(q2 Tσ'(W21H[n2]+W22H[i]+b2))
其中,n2表示长期项目节点的邻居节点,H[n2]为各自邻居节点的初始特征向量(即所述长期项目初始特征向量)。Ein(i)表示方向指向长期项目节点i的边的集合,M(n,i)表示沿边edge(n,i)方向从邻居n2传递给i的消息。S(n,i)表示邻居n2传递给i的消息的重要性分数(数值范围为0至1),q2、W21、Wn2i、bn2i、W22、b2都是可学习的参数,σ'为sigmoid激活函数,softmax为softmax函数。
其中,σ为ReLU激活函数,W4、b4都是可学习的参数。
应理解地,对于项目节点i(即所述长期项目节点),其更新后的特征向量(即所述长期项目特征向量)捕获了目标用户与物品的交互行为和项目的类别属性等语义特征。令可得到包含丰富语义的项目特征向量Ii∈IRich,IRich为所有包含丰富语义的项目特征向量的集合。
上述实施例中,通过分别对各个长期项目节点、待处理长期项目特征向量以及多个长期项目有向边的长期项目特征向量分析得到长期项目特征向量,挖掘了来自用户与好友、用户与项目、项目与类别之间丰富的潜在关联和语义内容,学习到了具有丰富语义的项目特征,提高了推荐准确率和可解释性。
可选地,作为本发明的一个实施例,所述历史短期兴趣数据集包括多个短期交互记录数据和多个与各个所述短期交互记录数据对应的交互时间,所述分别对各个所述历史短期兴趣数据集进行短期兴趣特征向量的分析,得到与各个所述目标用户对应的短期兴趣特征向量的过程包括:
分别对各个所述短期交互记录数据进行数据清洗,得到与各个所述短期交互记录数据对应的清洗后短期交互记录数据;
按照所述交互时间分别通过与各个所述目标用户对应的多个清洗后短期交互记录数据进行会话序列的构建,得到与各个所述目标用户对应的会话序列;
通过各个所述会话序列分别构建得到与各个所述目标用户对应的会话图,所述会话图包括短期项目初始特征向量集合;
基于图神经网络模型分别对各个所述短期项目初始特征向量集合进行特征学习,得到与各个所述目标用户对应的更新后短期项目特征向量集合,具体为:
通过第三式分别对各个所述短期项目初始特征向量集合进行更新后短期项目特征向量集合的计算,得到与各个所述目标用户对应的更新后短期项目特征向量集合,所述第三式为:
通过第四式分别对各个所述更新后短期项目特征向量集合中的更新后短期项目特征向量进行图注意力聚合的计算,得到与各个所述目标用户对应的短期兴趣特征向量,所述第四式为:
应理解地,将用户近期交互过的项目(即所述短期交互记录数据)转换成会话图,并利用图神经网络模型对图中内容进行特征学习,得到包含用户当前动态兴趣的短期兴趣特征向量。
应理解地,所述图神经网络模型可以是任意的图神经网络及其变体,如GCN、GAT等先进模型,可拓展性强。
应理解地,将用户的交互项目(即所述清洗后短期交互记录数据)按发生的时间顺序(即所述交互时间)构造为会话序列的形式(即所述会话序列),形式化为Su=(i1 u,i2 u,...,iT u)。其中Su表示第u个用户(即所述目标用户)的当前会话序列,表示序列中的第t个交互项目(即所述清洗后短期交互记录数据),会话序列长度为T。
具体地,根据所述会话序列Su构造出一种包含多个节点和边的会话图Gu=(Vu,Eu)。其中Vu表示用户u的会话图Gu中的节点集合,每个节点一一对应序列Su中的项目(it u∈Vu);节点的初始特征即为所述长期项目特征向量且满足关系,Iu为Vu对应的特征向量集合;Eu则表示Gu中边的集合,边根据两个节点的交互时间是否发生在相邻时刻进行构造,如i1 u和i2 u发生在相邻时刻,则两者之间存在边edge(i1 u,i2 u)的关系,而i1 u和i3 u之间不存在边的关系。
应理解地,利用图神经网络模型(如GCN、GAT等)通过消息传递和聚合机制对用户u的会话图Gu中的节点(即所述短期项目初始特征向量集合)进行特征学习,得到更新后的特征向量集合(即所述更新后短期项目特征向量集合)。
应理解地,所述第四式中,UShort表示所有用户短期兴趣特征向量集合;表示会话图Gu中第t个项目的特征向量(即所述更新后短期项目特征向量)对总特征向量(即所述短期兴趣特征向量)的贡献程度(取值0至1);对应所述会话序列中最后一个项目的特征向量(即所述更新后短期项目特征向量);q3、W31、W32、b3都是可学习的参数,σ'为sigmoid激活函数。
上述实施例中,通过分别对各个历史短期兴趣数据集的短期兴趣特征向量分析得到短期兴趣特征向量,捕获了用户短期的动态偏好,可应用于多种领域的个性化推荐任务,提高了推荐准确率和可解释性。
可选地,作为本发明的一个实施例,所述分别对各个所述长期兴趣特征向量以及与各个所述目标用户对应的短期兴趣特征向量进行特征融合分析,得到与各个所述目标用户对应的全局特征向量的过程包括:
通过第五式分别对各个所述长期兴趣特征向量进行映射,得到与各个所述目标用户对应的映射后长期兴趣特征向量,所述第五式为:
通过第六式分别对各个所述短期兴趣特征向量进行映射,得到与各个所述目标用户对应的映射后短期兴趣特征向量,所述第六式为:
通过第七式分别对各个所述映射后长期兴趣特征向量以及与各个所述目标用户对应的映射后短期兴趣特征向量进行特征融合,得到与各个所述目标用户对应的全局特征向量,所述第七式为:
应理解地,对经变换后的用户的长期兴趣特征(即所述映射后长期兴趣特征向量)和短期兴趣特征(即所述映射后短期兴趣特征向量)进行特征融合,得到最终表示用户全局偏好的特征向量UGlobal(即所述全局特征向量)。
上述实施例中,分别对各个长期兴趣特征向量以及短期兴趣特征向量的特征融合分析得到全局特征向量,结合了用户自身长期稳定的一般爱好和短期的动态偏好,实现了具备社交属性的个性化推荐。
可选地,作为本发明的一个实施例,所述分别对各个所述全局特征向量以及与各个所述目标用户对应的多个长期项目特征向量进行目标概率的分析,得到与各个所述目标用户对应的目标概率的过程包括:
通过第八式分别对各个所述全局特征向量以及与各个所述目标用户对应的各个长期项目特征向量进行概率分数的计算,得到与各个所述目标用户对应的多个概率分数,并分别集合与各个所述目标用户对应的多个概率分数,从而得到与各个所述目标用户对应的概率分数集合,所述第八式为:
分别对各个所述概率分数集合进行归一化处理,得到与各个所述目标用户对应的目标概率。
应理解地,为了预测用户的下一步将交互的项目,需要计算每个项目被交互的概率。对于每个项目i(即所述长期项目节点),其特征向量为项目特征向量irich∈IRich(即所述长期项目特征向量),然后通过所述第八式与目标用户u(即所述目标用户)的全局特征表示uglobal∈UGlobal(即所述全局特征向量)进行点积得到用户u(即所述目标用户)下一次交互内容为项目i(即所述长期项目节点)的概率得分pui∈PUI(即所述概率分数)。
上述实施例中,通过第八式分别对各个全局特征向量以及各个长期项目特征向量的概率分数计算得到概率分数集合,分别对各个概率分数集合的归一化处理得到目标概率,提高了推荐准确率和可解释性。
可选地,作为本发明的一个实施例,所述分别对各个所述目标概率以及各个与所述目标用户对应的真实标签进行损失值计算,得到与各个所述目标用户对应的损失值的过程包括:
通过第九式分别对各个所述目标概率以及各个与所述目标用户对应的真实标签进行损失值计算,得到与各个所述目标用户对应的损失值,所述第九式为:
应理解地,所述第九式中,y的内容是一个one-hot向量。
上述实施例中,通过第九式分别对各个目标概率以及各个真实标签的损失值计算得到损失值,可以实现具备社交属性的个性化推荐,并且提升了推荐准确率以及可解释性。
可选地,作为本发明的一个实施例,还包括根据所述目标概率将具有top-K概率的项目将作为下一个交互项目的候选项推荐给所述目标用户。
可选地,作为本发明的另一个实施例,本发明通过利用长期历史数据构建知识图谱和短期交互数据构造会话图,分别捕获了包含社交影响的用户长期稳定的一般爱好和短期的动态偏好,可应用于多种领域的个性化推荐任务,并且由于考虑了多种影响因素,因此推荐准确率和可解释性也具备优势。
图2为本发明实施例提供的一种物品的推荐装置的模块框图。
可选地,作为本发明的另一个实施例,如图2所示,一种物品的推荐装置,包括:
数据集获取模块,用于从预设数据库中导入所有目标用户的历史长期兴趣数据集以及与每个目标用户一一对应的历史短期兴趣数据集;
数据集预处理模块,用于对所述历史长期兴趣数据集进行数据预处理,得到长期兴趣数据训练集;
模型训练模块,用于构建训练模型,根据所述长期兴趣数据训练集和所有的历史短期兴趣数据集对所述训练模型进行训练,得到目标推荐模型;
推荐结果获得模块,用于导入长期兴趣数据验证集和短期兴趣数据验证集,并将所述长期兴趣数据验证集和所述短期兴趣数据验证集一并输入至所述目标推荐模型中,并根据所述目标推荐模型得到物品的推荐结果。
可选地,本发明的另一个实施例提供一种物品的推荐装置,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,当所述处理器执行所述计算机程序时,实现如上所述的物品的推荐方法。该装置可为计算机等装置。
可选地,本发明的另一个实施例提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,当所述计算机程序被处理器执行时,实现如上所述的物品的推荐方法。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本发明实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以是两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种物品的推荐方法,其特征在于,包括如下步骤:
S1:从预设数据库中导入所有目标用户的历史长期兴趣数据集以及与每个目标用户一一对应的历史短期兴趣数据集;
S2:对所述历史长期兴趣数据集进行数据预处理,得到长期兴趣数据训练集;
S3:构建训练模型,根据所述长期兴趣数据训练集和所有的历史短期兴趣数据集对所述训练模型进行训练,得到目标推荐模型;
S4:导入长期兴趣数据验证集和短期兴趣数据验证集,并将所述长期兴趣数据验证集和所述短期兴趣数据验证集一并输入至所述目标推荐模型中,并根据所述目标推荐模型得到物品的推荐结果。
2.根据权利要求1所述的物品的推荐方法,其特征在于,所述长期兴趣数据训练集包括多个长期交互记录数据、多个标签数据和多个关系数据,所述步骤S3的过程包括:
通过所有的长期交互记录数据、所有的标签数据以及所有的关系数据构建得到知识图谱,所述知识图谱包括多个与所述目标用户对应的目标用户节点、与各个所述目标用户节点对应的待处理目标用户特征向量、与各个所述目标用户节点对应的多个目标用户有向边、与各个所述目标用户对应的多个长期项目节点、与各个所述长期项目节点对应的待处理长期项目特征向量以及与各个所述长期项目节点对应的多个长期项目有向边;
分别对各个所述目标用户节点、与各个所述目标用户节点对应的待处理目标用户特征向量以及与各个所述目标用户节点对应的多个目标用户有向边进行长期兴趣特征向量的分析,得到与各个所述目标用户对应的长期兴趣特征向量;
分别对各个所述长期项目节点、与各个所述长期项目节点对应的待处理长期项目特征向量以及与各个所述长期项目节点对应的多个长期项目有向边进行长期项目特征向量的分析,得到与各个所述长期项目节点对应的长期项目特征向量;
分别对各个所述历史短期兴趣数据集进行短期兴趣特征向量的分析,得到与各个所述目标用户对应的短期兴趣特征向量;
分别对各个所述长期兴趣特征向量以及与各个所述目标用户对应的短期兴趣特征向量进行特征融合分析,得到与各个所述目标用户对应的全局特征向量;
分别对各个所述全局特征向量以及与各个所述目标用户对应的多个所述长期项目特征向量进行目标概率的分析,得到与各个所述目标用户对应的目标概率;
导入与各个所述目标用户对应的真实标签,分别对各个所述目标概率以及各个与所述目标用户对应的真实标签进行损失值计算,得到与各个所述目标用户对应的损失值;
根据多个所述损失值对所述训练模型进行参数更新,并返回步骤S1,直至达到预设迭代次数,则将更新后的训练模型作为目标推荐模型。
3.根据权利要求2所述的物品的推荐方法,其特征在于,所述分别对各个所述目标用户节点、与各个所述目标用户节点对应的待处理目标用户特征向量以及与各个所述目标用户节点对应的多个目标用户有向边进行长期兴趣特征向量的分析,得到与各个所述目标用户对应的长期兴趣特征向量的过程包括:
分别对各个所述待处理目标用户特征向量进行随机初始化处理,得到与各个所述目标用户对应的目标用户初始特征向量;
通过第一式分别对各个所述目标用户节点、与各个所述目标用户对应的目标用户初始特征向量以及与各个所述目标用户节点对应的多个目标用户有向边进行长期兴趣特征向量的特征聚合,得到与各个所述目标用户对应的长期兴趣特征向量,所述第一式为:
其中,S(n1,u)=softmax(q1 Tσ'(W11H[n1]+W12H[u]+b1)),M(n1,u)=Wn1uH[n1]+bn1u,
其中,u为目标用户节点,为长期兴趣特征向量,σ为ReLU激活函数,q1、W11、W12、b1、W3、b3、Wn1u、bn1u均为可学习的参数,H[u]为目标用户节点u的目标用户初始特征向量,N[u]为目标用户邻居特征向量,n1为目标用户节点u的邻居节点,edge(n1,u)为目标用户有向边,Ein(u)为方向指向目标用户节点u的有向边的集合,S(n1,u)为邻居节点n1传递给目标用户节点u的重要性分数,M(n1,u)为沿有向边edge(n1,u)方向从邻居节点n1传递给目标用户节点u的消息,σ'为sigmoid激活函数,softmax为softmax函数,H[n1]为邻居节点n1的目标用户初始特征向量。
4.根据权利要求2所述的物品的推荐方法,其特征在于,所述分别对各个所述长期项目节点、与各个所述长期项目节点对应的待处理长期项目特征向量以及与各个所述长期项目节点对应的多个长期项目有向边进行长期项目特征向量的分析,得到与各个所述长期项目节点对应的长期项目特征向量的过程包括:
分别对各个所述待处理长期项目特征向量进行随机初始化处理,得到与各个所述长期项目节点对应的长期项目初始特征向量;
通过第二式分别对各个所述长期项目节点、与各个所述长期项目节点对应的长期项目初始特征向量以及与各个所述长期项目节点对应的多个长期项目有向边进行长期项目特征向量的特征聚合,得到与各个所述长期项目节点对应的长期项目特征向量,所述第二式为:
其中,S(n2,i)=softmax(q2 Tσ′(W21H[n2]+W22H[i]+b2)),M(n2,i)=Wn2iH[n2]+bn2i,
其中,i为长期项目节点,为长期项目节点i的长期项目特征向量,σ为ReLU激活函数,q2、W21、W22、b2、W4、b4、Wn2i、bn2i均为可学习的参数,H[i]为长期项目节点i的长期项目初始特征向量,N[i]为长期项目邻居特征向量,n2为长期项目节点i的邻居节点,edge(n2,i)为长期项目有向边,Ein(i)为方向指向长期项目节点i的边的集合,S(n2,i)为邻居节点n2传递给长期项目节点i的重要性分数,M(n2,i)为沿有向边edge(n2,i)方向从邻居节点n2传递给长期项目节点i的消息,σ'为sigmoid激活函数,softmax为softmax函数,H[n2]为邻居节点n2的长期项目初始特征向量。
5.根据权利要求2所述的物品的推荐方法,其特征在于,所述历史短期兴趣数据集包括多个短期交互记录数据和多个与各个所述短期交互记录数据对应的交互时间,所述分别对各个所述历史短期兴趣数据集进行短期兴趣特征向量的分析,得到与各个所述目标用户对应的短期兴趣特征向量的过程包括:
分别对各个所述短期交互记录数据进行数据清洗,得到与各个所述短期交互记录数据对应的清洗后短期交互记录数据;
按照所述交互时间分别通过与各个所述目标用户对应的多个清洗后短期交互记录数据进行会话序列的构建,得到与各个所述目标用户对应的会话序列;
通过各个所述会话序列分别构建得到与各个所述目标用户对应的会话图,所述会话图包括短期项目初始特征向量集合;
基于图神经网络模型分别对各个所述短期项目初始特征向量集合进行特征学习,得到与各个所述目标用户对应的更新后短期项目特征向量集合,具体为:
通过第三式分别对各个所述短期项目初始特征向量集合进行更新后短期项目特征向量集合的计算,得到与各个所述目标用户对应的更新后短期项目特征向量集合,所述第三式为:
通过第四式分别对各个所述更新后短期项目特征向量集合中的更新后短期项目特征向量进行图注意力聚合的计算,得到与各个所述目标用户对应的短期兴趣特征向量,所述第四式为:
6.根据权利要求2所述的物品的推荐方法,其特征在于,所述分别对各个所述长期兴趣特征向量以及与各个所述目标用户对应的短期兴趣特征向量进行特征融合分析,得到与各个所述目标用户对应的全局特征向量的过程包括:
通过第五式分别对各个所述长期兴趣特征向量进行映射,得到与各个所述目标用户对应的映射后长期兴趣特征向量,所述第五式为:
通过第六式分别对各个所述短期兴趣特征向量进行映射,得到与各个所述目标用户对应的映射后短期兴趣特征向量,所述第六式为:
通过第七式分别对各个所述映射后长期兴趣特征向量以及与各个所述目标用户对应的映射后短期兴趣特征向量进行特征融合,得到与各个所述目标用户对应的全局特征向量,所述第七式为:
7.根据权利要求3或4所述的物品的推荐方法,其特征在于,所述分别对各个所述全局特征向量以及与各个所述目标用户对应的多个长期项目特征向量进行目标概率的分析,得到与各个所述目标用户对应的目标概率的过程包括:
通过第八式分别对各个所述全局特征向量以及与各个所述目标用户对应的各个长期项目特征向量进行概率分数的计算,得到与各个所述目标用户对应的多个概率分数,并分别集合与各个所述目标用户对应的多个概率分数,从而得到与各个所述目标用户对应的概率分数集合,所述第八式为:
分别对各个所述概率分数集合进行归一化处理,得到与各个所述目标用户对应的目标概率。
9.一种物品的推荐装置,其特征在于,包括:
数据集获取模块,用于从预设数据库中导入所有目标用户的历史长期兴趣数据集以及与每个目标用户一一对应的历史短期兴趣数据集;
数据集预处理模块,用于对所述历史长期兴趣数据集进行数据预处理,得到长期兴趣数据训练集;
模型训练模块,用于构建训练模型,根据所述长期兴趣数据训练集和所有的历史短期兴趣数据集对所述训练模型进行训练,得到目标推荐模型;
推荐结果获得模块,用于导入长期兴趣数据验证集和短期兴趣数据验证集,并将所述长期兴趣数据验证集和所述短期兴趣数据验证集一并输入至所述目标推荐模型中,并根据所述目标推荐模型得到物品的推荐结果。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,当所述计算机程序被处理器执行时,实现如权利要求1至8任一项所述的物品的推荐方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210110849.9A CN114491267A (zh) | 2022-01-29 | 2022-01-29 | 一种物品的推荐方法、装置以及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210110849.9A CN114491267A (zh) | 2022-01-29 | 2022-01-29 | 一种物品的推荐方法、装置以及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114491267A true CN114491267A (zh) | 2022-05-13 |
Family
ID=81478169
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210110849.9A Pending CN114491267A (zh) | 2022-01-29 | 2022-01-29 | 一种物品的推荐方法、装置以及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114491267A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115062230A (zh) * | 2022-08-16 | 2022-09-16 | 深圳市海清视讯科技有限公司 | 数据处理方法、装置、设备、介质和程序产品 |
CN116775937A (zh) * | 2023-05-19 | 2023-09-19 | 江西财经大学 | 一种基于微博大数据的视频推荐方法、装置及存储介质 |
-
2022
- 2022-01-29 CN CN202210110849.9A patent/CN114491267A/zh active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115062230A (zh) * | 2022-08-16 | 2022-09-16 | 深圳市海清视讯科技有限公司 | 数据处理方法、装置、设备、介质和程序产品 |
CN115062230B (zh) * | 2022-08-16 | 2023-01-06 | 深圳市海清视讯科技有限公司 | 数据处理方法、装置、设备、介质和程序产品 |
CN116775937A (zh) * | 2023-05-19 | 2023-09-19 | 江西财经大学 | 一种基于微博大数据的视频推荐方法、装置及存储介质 |
CN116775937B (zh) * | 2023-05-19 | 2024-04-26 | 厦门市美亚柏科信息股份有限公司 | 一种基于微博大数据的视频推荐方法、装置及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Pan et al. | Study on convolutional neural network and its application in data mining and sales forecasting for E-commerce | |
Hair Jr et al. | Data, measurement, and causal inferences in machine learning: opportunities and challenges for marketing | |
Zhu et al. | Online purchase decisions for tourism e-commerce | |
Ma et al. | Combining tag correlation and user social relation for microblog recommendation | |
Wu et al. | Collaborative topic regression with social trust ensemble for recommendation in social media systems | |
CN111784455A (zh) | 一种物品推荐方法及推荐设备 | |
Ma et al. | App2vec: Vector modeling of mobile apps and applications | |
CN111242729A (zh) | 一种基于长短期兴趣的序列化推荐方法 | |
Chen et al. | Behavior-aware user response modeling in social media: Learning from diverse heterogeneous data | |
CN114491267A (zh) | 一种物品的推荐方法、装置以及存储介质 | |
CN116703485B (zh) | 基于大数据的广告精准营销方法及系统 | |
Arora et al. | Business competitive analysis using promoted post detection on social media | |
Khodabakhsh et al. | Predicting future personal life events on twitter via recurrent neural networks | |
Dhillon et al. | Modeling dynamic user interests: A neural matrix factorization approach | |
CN111429161B (zh) | 特征提取方法、特征提取装置、存储介质及电子设备 | |
CN108389113B (zh) | 一种协同过滤推荐方法和系统 | |
Wang et al. | Webpage depth viewability prediction using deep sequential neural networks | |
Wang et al. | Jointly modeling intra-and inter-session dependencies with graph neural networks for session-based recommendations | |
Khan et al. | Comparative analysis on Facebook post interaction using DNN, ELM and LSTM | |
CN115329215A (zh) | 异构网络中基于自适应动态知识图谱的推荐方法及系统 | |
Wang et al. | Research on CTR prediction based on stacked autoencoder | |
Zeng et al. | Collaborative filtering via heterogeneous neural networks | |
Sohafi-Bonab et al. | DCARS: Deep context-aware recommendation system based on session latent context | |
Kanakaris et al. | Making personnel selection smarter through word embeddings: A graph-based approach | |
Jiang et al. | A fusion recommendation model based on mutual information and attention learning in heterogeneous social networks |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |