CN115858919A - 基于项目领域知识和用户评论的学习资源推荐方法及系统 - Google Patents

基于项目领域知识和用户评论的学习资源推荐方法及系统 Download PDF

Info

Publication number
CN115858919A
CN115858919A CN202211457604.XA CN202211457604A CN115858919A CN 115858919 A CN115858919 A CN 115858919A CN 202211457604 A CN202211457604 A CN 202211457604A CN 115858919 A CN115858919 A CN 115858919A
Authority
CN
China
Prior art keywords
user
project
matrix
domain
different
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211457604.XA
Other languages
English (en)
Inventor
黄昭
程靖
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shaanxi Normal University
Original Assignee
Shaanxi Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shaanxi Normal University filed Critical Shaanxi Normal University
Priority to CN202211457604.XA priority Critical patent/CN115858919A/zh
Publication of CN115858919A publication Critical patent/CN115858919A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于项目领域知识和用户评论的学习资源推荐方法及系统,方法包括:收集学习者信息、学习资源特征信息、教师信息,指学习者描述信息、学习者与学习资源的交互信息,学习资源特征信息包括学习资源描述信息、学习资源特征信息;根据学习者信息,寻找与学习者最高相似度的教师,通过卷积神经网络,根据教师特征得到目标学习资源的匹配分数;建立学习者短期偏好模型和长期偏好模型,融合两个模型得到学习者个人偏好模型;建立学习者群体偏好模型,融合学习者个人与群体模型得到学习者偏好模型;根据学习资源特征信息,使用学习资源的多种信息特征建立学习资源特征信息模型和领域知识模型,从而提高学习资源推荐的准确性。

Description

基于项目领域知识和用户评论的学习资源推荐方法及系统
技术领域
本发明涉及计算机技术中的推荐系统领域,具体涉及一种基于项目领域知识和用户评论的学习资源推荐方法及系统。
背景技术
项目推荐过程中,对项目进行深刻有效的建模是提高推荐质量的关键。现有项目推荐方法中,重点关注用户的模型设计,忽略了对项目模型的特征描述与提取,且因为用户在进行项目的使用中,通常对项目的所属领域和类型有独特的偏好。传统的项目推荐方法只粗浅地将项目的特征排列,与用户模型进行匹配,在用户关注的领域和类型方面精细度不够,如何获取项目的领域特征,并完整地将用户的特征描述出来,是提高现有方法的关键之处,同时在匹配过程中,如何将项目和用户的构造模型连接起来,使方法轻量化也成为值得思考的问题。
发明内容
为了解决上述问题,本发明提供一种基于项目领域知识和用户评论的学习资源推荐方法及系统,通过对项目进行领域特征的提取,与用户模型进行匹配,推荐更加适合用户的项目,最终实现提高用户在推荐过程中的体验的目的。
为了达到上述目的,本发明所采用的技术方案为:一种基于项目领域知识和用户评论的学习资源推荐方法,包括以下步骤:
步骤1,获取项目领域特征信息、用户历史交互信息矩阵Y、用户的评论集合信息、查询嵌入矩阵Q、用户特征信息;
步骤2,根据用户的历史交互信息矩阵Y,构建用户—项目路径图SG;
步骤3,通过项目领域特征信息,使用基于领域分组的图卷积神经网络,构建项目领域特征模型;
步骤4,通过多通道注意力机制,计算用户—项目路径图中不同实体的注意力分数,然后,将不同通道计算得出的注意力分数相加后,作为图中不同实体的注意力权重;整合用户—项目路径图中所有实体的特征,将不同实体的特征连接得到项目全局模型Gl
步骤5,基于注意力机制,为项目领域特征模型Si与项目全局模型Gl分配不同的权重,将两者融合,得到最终的项目模型I:
步骤6,对用户的评论集进行预处理,即将评论集中的单词转换d维嵌入,通过给定一个查询嵌入矩阵Q,从嵌入矩阵中查找用户的评论集中的单词,并将其转换为对应的嵌入向量,得到用户对应的评论矩阵RC,将步骤3得到的项目领域特征转换为矩阵形式,得到项目特征矩阵IC;得到用户评论矩阵RC后,通过狄利克雷概率聚类算法,计算用户所属的领域类型,然后,将用户所属的领域类型也转换为领域类型矩阵SC;
步骤7,将用户的评论矩阵RC与项目特征矩阵IC相乘的到用户—项目领域矩阵UIS,用户评论矩阵RC与用户所属类型矩阵SC相乘得到用户—项目类型矩阵UIT,使用卷积神经网络分别从用户—项目领域矩阵UIS和用户—项目类型矩阵UIT提取用户领域特征Ut和用户类型特征Uc
基于注意力机制,计算用户领域特征Ut和用户类型特征Uc所占权重,将两者进行连接融合,得到用户特征模型U;
步骤8,将项目模型I与用户特征模型U连接,将连接后的模型作为多层深度神经网络的输入,得到目标项目和与用户的的交互特征,将交互特征作为候选项目的初始推荐分数ps;
步骤9,将步骤7得到的用户所属的领域类型直接添加到项目模型I与用户特征模型U的交互特征中,作为候选项目的最终推荐分数f's;
步骤10,按照推荐分数f's高低将其排序,将分数最高的前N个候选项目依次推荐给用户。
步骤1中,所述项目领域特征信息指项目所包含知识点、种类以及发布时间的详细描述信息;所述用户评论集合信息包括用户对所有项目的评论集合;所述用户历史交互信息矩阵Y指用户和项目的隐式交互矩阵,若用户和项目有历史上有所交互将Yij设置为1,否则为0;所述查询嵌入矩阵Q指矩阵中包括现有单词信息,学习者的评论集合中的任意一个单词都可以从Q中找到。
步骤2中,构造用户—项目路径图的具体过程如下:
步骤2.1,通过用户和项目的历史交互信息,对用户与项目之间的路径进行采样,采样完成后,选择K条路径,将每条路径的长度限制为6,在具体采样过程中,以目标用户起始点,项目为终点,进行路径为6的随机游走,最后,得到k条用户到目标项目之间的路径;
步骤2.2,得到k条路径后,对路径进行拼接,形成起点为目标用户、终点为候选项目、k条最大路径长度为6的用户—项目路径图,所述用户—项目路径图包含多种实体。
步骤3具体如下:项目领域特征模型构建分为两部分:分组传播和知识分组聚合;项目包含的领域知识点作为一个种子集沿着项目领域知识图中的路径进行扩展,并递归地访问每个传播的集合;
步骤3.1,在分组传播,项目特征反映在其包含的领域知识点中,通过挖掘知识点特征,并使用领域知识点表示项目将项目的特征表示出来,定义如下:
Figure BDA0003953724300000031
其中,c代表项目,e代表领域知识点;
项目集合的初始表示是领域知识点实体的整合,在项目领域知识图中传播之后,遍历集合中所有不同类型的实体,所有实体都能有效地扩展项目的潜在特征,项目的多层传播实体递归地定义为如下公式:
Figure BDA0003953724300000041
其中,l表示实体集合与项目领域知识点种子之间的层次结构距离;
步骤3.2,知识分组聚合,将项目的领域特征传播分为两个阶段:第一阶段是使用具有实体粒度的组内注意网络确定不同路径上实体的注意力权重,第二阶段是基于关系链接的组间聚合网络表示项目的领域特征,通过这两个阶段对项目的领域特征进行更详细的模型构建;
步骤3.2.1,在组内注意网络阶段,尾部实体通过关系不同的连接和头部实体来表示,在特征传播过程中,到达尾部实体的不同路径含义不同,通过一个注意力网络来确定不同路径上的权重占比;
首先,选定项目领域知识图中的一个候选项目实体
Figure BDA0003953724300000047
再给定候选项目实体/>
Figure BDA0003953724300000048
尾部领域知识实体e,计算得出尾部领域知识实体相对于项目的注意力权重,其中/>
Figure BDA0003953724300000042
为尾部实体ti的表示,如下所示:
Figure BDA0003953724300000043
其中
Figure BDA0003953724300000044
为尾部实体ti的表示;
在获得同一层中各不同组中所有实体的注意权重后,将各组中所有加权实体嵌入相加,作为这些关系链接的表示,最终,得到k个不同领域分组的加权表示:
Figure BDA0003953724300000045
其中,pi代表尾部领域知识实体的注意力权重,
Figure BDA0003953724300000046
代表与候选项目连接的所有尾部实体;
步骤3.2.2,在组间聚合网络阶段,通过头部实体和关系链接获得了每个传播层中不同关系链接的表示,直接利用项目领域知识图中的关系信息;将每个组都认为是项目领域特征在一定的某个知识方向上的延伸,使用组间聚合网络继续表示项目的领域特征,进而得到领域特征模型。
步骤4具体为:通过多通道注意力机制为用户-项目路径图中的不同实体和关系计算注意力得分,将整个用户-项目路径图中所包含的实体信息纳入项目中,然后,将注意力得分作为不同实体的权重,用以区分不同实体的重要性,最终将所有实体整合到目标项目的特征中;在领域知识模型中,得到用户-项目路径图中实体的向量嵌入,将实体嵌入组合到一起形成用户-项目路径图的实体嵌入矩阵;
得到用户-项目路径图的整体嵌入矩阵后,使用多通道注意力机制为用户-项目路径图中的实体分配不同的权重,多通道注意机制由三个通道组成,分别是交互通道、时间通道和领域通道;
在交互通道,通过向量内积捕捉领域知识点对目标项目的重要程度,根据交互的用户的知识水平对其分配不同的注意力分数,注意力分数表达式如下所示,
Figure BDA0003953724300000051
其中,vj表示目标候选项目的嵌入,en表示每个知识点在用户-项目路径图中的嵌入,
Figure BDA0003953724300000052
表示知识点对目标项目的交互权重;
最后,将目标项目的所有直接交互知识点根据其交互权重的向量的加权和,如下所示,
Figure BDA0003953724300000053
在时间通道中,根据领域知识点与候选项目的交互时间,使用一个多层感知器获取直接交互的知识点的注意力分数,公式如下所示:
timei=UTtanh(Wlen+bl)
Figure BDA0003953724300000054
Figure BDA0003953724300000055
其中,Wi∈Rd×d、Ui∈Rd代表的是权重矩阵,bl代表偏差,
在领域通道中,使用在项目领域特征建模中得到的项目领域特征模型,得到用户-项目路径图中知识点实体的领域注意力分数,领域通道部分的注意力分数如下所示:
Figure BDA0003953724300000061
其中,si是项目领域特征模型的输出,
最后,结合这三个通道的注意力分数,对每个实体计算其三通道注意力分数,将三通道分数相连接,得到项目全局模型Gl,其中,
Figure BDA0003953724300000062
表示连接操作,
Figure BDA0003953724300000063
步骤6聚类过程具体如下:
用户集合U={u1,u2,...,un},领域集合T={t1,t2,...,tk},用户集合U中的每个用户u看作一个单词序列
Figure BDA0003953724300000064
wi表示第i个单词,设u有n个单词,U中涉及的所有不同单词组成一个大集合S,S={s1,s2,...,sj};
用户集合U作为聚类算法的输入,聚类成k个类型,T中共包含j个单词:
①对每个U中的用户un,对应到不同群体的概率
Figure BDA0003953724300000065
其中/>
Figure BDA0003953724300000066
表示un对应T中第k个类型的概率,计算过程如下所示:
Figure BDA0003953724300000067
其中
Figure BDA0003953724300000068
表示un中对应T中第Tk个类型的词的数目,n是un中所有词的总数;
②对每个T中的群体Tk,生成不同单词的概率
Figure BDA0003953724300000069
其中,/>
Figure BDA00039537243000000610
表示Tk生成T中第j个单词的概率,如下所示:
Figure BDA00039537243000000611
其中
Figure BDA00039537243000000612
表示群体Tk含有T中第j个单词的数目,N表示Tk中的所有单词在T中的数目,LDA的核心公式如下所示:
Figure BDA0003953724300000071
通过当前的θu和φt给出了用户u中出现单词w的概率,其中p(t|u)利用θu计算得到,p(w|t)利用
Figure BDA0003953724300000072
计算得到。通过当前的θu和φt,可计算用户u描述中的一个单词对应任意一个类型Ti时的p(t|u),然后根据这些结果来更新这个词应该对应的topic,同时,如果更新改变了单词所对应的类型Ti,也会反过来影响θu和φt;
通过上述的狄利克雷聚类算法得到用户un包含的用户类别,如下:
Figure BDA0003953724300000073
其中,
Figure BDA0003953724300000074
是用户包含的不同的用户类别,pi指所属不同类别的概率权重,i=1,2,3...,pnTk代表目标用户对于某种类型学资源偏好的权重。/>
步骤7具体如下:
①多类型的CNN:通过聚类得到用户的不同类型后,将每个类型通过一个矩阵表达,将用户的评论矩阵RCi与用户所属类型矩阵SC相乘,得到不同的用户的评论类型矩阵;
一个用户属于多个不同的类型,将目标用户的评论矩阵看作一个张量,在卷积过程中,滤波器的数量与用户所属的类型数量一致,通过滤波器在用户的多个评论类型矩阵中滑动,提取不同评论评论类型中的特征信息,最终将所有特征信息整合到一起,得到评论类型k的特征结果;
②最大池化操作:卷积操作结束后,每个评论类型包含多个滤波器生成的特征矩阵,使用一个最大池化操作来获取其中显著特征。
步骤9具体如下:
首先,通过LDA聚类算法得到学习者所属的多种类别,通过对学习者的所属类别以及所属类别的概率进行点积运算,计算过程如下:
Figure BDA0003953724300000075
Figure BDA0003953724300000081
其中,
Figure BDA0003953724300000082
指的是用户所属领域,ru,t指的是用户对某个领域的偏好,Tk指的是用户所包含的领域,将/>
Figure BDA0003953724300000083
标准化在0到1的范围内,候选项目的预测分数如下:
Figure BDA0003953724300000084
其中,ps为初始推荐分数。
另外,本发明同时提供一种计算机设备,包括处理器和存储器,存储器中存储可执行程序,处理器执行所述可执行程序时,能执行本发明所述的基于项目领域知识和用户评论的学习资源推荐方法。
还提供一种计算机可读存储介质,计算机可读存储介质中存储有计算机程序,所述计算机程序被处理器执行时,能实现本发明所述的基于项目领域知识和用户评论的学习资源推荐方法。
与现有学习资源推荐方法相比,本发明至少具有以下优点:
本发明在项目推荐上,以项目领域特征模型为基础建模,实现了个性化推荐;将类型偏好融入推荐方法中,提高领域特征推荐的细粒度精度;在项目建模中,考虑了领域特征对于项目的重要程度,同时考虑项目的全局模型,实现项目的精准建模;在用户建模过程中,通过知识图谱,融合项目的领域特征模型和聚类类型特征,实现用户在领域方面的精准建模;在用户模型以及学习模型的融合过程中,将聚类得到用户模型直接添加到预测的分中,实现了用户的细粒度领域偏好,提高了方法对于用户领域偏好敏感程度。
附图说明
图1是基于项目领域知识和用户评论的学习资源推荐方法流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本发明的描述中,需要理解的是,术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
图1是基于领域特征偏好推荐流程图,现对本发明的实施方式进行详细说明。
步骤1,获取项目领域特征信息,用户历史交互信息矩阵Y、用户的评论集合信息、查询嵌入矩阵Q。所述项目领域特征信息指项目所包含知识点、种类、发布时间等项目详细描述信息;所述用户评论集合信息包括用户对所有项目的评论集合;所述用户历史交互信息矩阵Y指用户和项目的隐式交互矩阵,若用户和项目有历史上有所交互将Yij设置为1,否则为0;所述查询嵌入矩阵Q指矩阵中包括现有单词信息,学习者的评论集合中的任意一个单词都可以从Q中找到。
步骤2,根据用户的历史交互信息,构建用户—项目路径图SG。具体如下:
步骤2.1,通过用户和项目的历史交互信息,对用户与项目之间的路径进行采样,采样完成后,选择K条路径,将每条路径的长度限制为6,避免过于长的路径附带较多的噪声邻居。在具体采样过程中,以目标用户起始点,项目为终点,进行路径为6的随机游走,最后,得到k条用户到目标项目之间的路径。
步骤2.2,得到k条路径后,对路径进行拼接,形成起点为目标用户、终点为候选项目、k条最大路径长度为6的用户—项目路径图,该用户—项目路径图包含多种实体,如项目的领域知识和特征属性等实体。
步骤3,通过项目领域特征信息,使用基于领域分组的的图卷积神经网络,构建项目领域特征模型Si。具体如下:
项目领域特征模型Si构建分为两部分:分组传播和知识分组聚合。项目包含的领域知识点作为一个种子集沿着项目领域知识图中的路径进行扩展,并递归地访问每个传播的集合。
步骤3.1,在分组传播,项目特征一般反映在其包含的领域知识点中,通过挖掘知识点特征,并使用领域知识点表示项目,精确完整地将项目的特征表示出来,定义如下:
Figure BDA0003953724300000101
其中,c代表项目,e代表领域知识点。
项目集合的初始表示是领域知识点实体的整合,在项目领域知识图中传播之后,再遍历集合中所有不同类型的实体,所有这些实体都可以有效地扩展项目的潜在特征,项目的多层传播实体将递归地定义为如下公式:
Figure BDA0003953724300000102
其中,I表示图卷积层的层数,将实体集合扩展为包含头实体、关系和尾部实体的传播三元组,定义项目的第I层传播如下:
Figure BDA0003953724300000103
项目领域知识图中所包含丰富的相关领域知识,对知识点进行分类并连接原始的传播层,以更好地探索项目的领域知识偏好。由于项目领域知识图的链接本身具有分类的特性,所以根据关系链接对遍历中的实体进行排序:
Figure BDA0003953724300000104
其中,r表示在项目领域知识图中该实体所属的链接,类似地,项目的重新连接传播三重联体定义如下:
Figure BDA0003953724300000105
步骤3.2,在知识分组聚合模块,将项目的领域特征传播分为两个阶段:具有实体粒度的组内注意网络和基于关系链接的组间聚合网络,通过这两个阶段对项目的领域特征进行更详细的模型构建。
在组内注意网络阶段,尾部实体可以通过关系不同的连接和头部实体来表示;在特征传播过程中,到达尾部实体的不同路径含义不同。通过一个注意力网络来确定不同路径上的权重占比。
首先,选定项目领域知识图中的一个候选项目实体
Figure BDA0003953724300000116
再给定候选项目实体/>
Figure BDA0003953724300000117
尾部领域知识实体e,计算得出尾部领域知识实体相对于项目的注意力权重,其中/>
Figure BDA0003953724300000111
为尾部实体ti的表示,如下所示:
Figure BDA0003953724300000112
其中
Figure BDA0003953724300000113
为尾部实体ti的表示。
在获得同一层中各不同组中所有实体的注意权重后,将各组中所有加权实体嵌入相加,作为这些关系链接的表示。最终,得到k个不同领域分组的加权表示:
Figure BDA0003953724300000114
其中,pi代表尾部领域知识实体的注意力权重,
Figure BDA0003953724300000115
代表与候选项目连接的所有尾部实体。
步骤3.2,在组间聚合网络阶段,通过头部实体和关系链接获得了每个传播层中不同关系链接的表示,直接利用了项目领域知识图中的关系信息。每个组都被认为是项目领域特征在一定的某个知识方向上的延伸,使用一个组间聚合网络继续表示项目的领域特征。
在I层有k个不同的组关系,因此,构建关系链接聚合嵌入如下,其中,(ok,rk)控制每个组嵌入的注意权重,表明项目领域的特征ak,如下所示:
ak=ξ(ok,rk)ok
然后,通过一个类似于注意机制的神经网络来实现函数功能,公式如下:ξ(ok,rk)=Relu(W2(Relu(W1(ok||rk)+b1))+b2)
其中,ReLU为非线性激活函数,W和b是可训练的权重矩阵和偏差,||表示连接操作。接着使用softmax函数对整个关系链接的系数进行归一化,如下所示:
Figure BDA0003953724300000121
最后,将项目在第l层的表示,作为项目的领域特征模型,表示如下:
Figure BDA0003953724300000122
步骤4,通过多通道(时间、领域、交互)注意力机制,通过多通道(时间、领域、交互)注意力机制为用户-项目路径图中的不同实体和关系计算注意力得分,将整个用户-项目路径图中所包含的实体信息纳入项目中,然后,将注意力得分作为不同实体的权重,用以区分不同实体的重要性,结合这三个通道的注意力分数,对每个实体计算其三通道注意力分数,将三通道分数相连接,得到每个实体的权重。最终,将所有实体特征连接到一起,作为目标项目的特征,建立项目全局模型G1。在领域知识模型中,得到了用户-项目路径图中实体的向量嵌入,将实体嵌入组合到一起形成用户-项目路径图的实体嵌入矩阵,如下所示:
SG(u,i)=[e1,e2,...en]
其中,en代表用户-项目路径图中的实体,n是用户-项目路径图中的实体的数量,SG(u,i)便代表用户-项目路径图的整体嵌入矩阵。
得到用户-项目路径图的整体嵌入后,使用多通道注意力机制为用户-项目路径图中的实体分配不同的权重,多通道注意机制由三个通道组成,分别是交互通道、时间通道、领域通道。
在交互通道,需要通过向量内积捕捉领域知识点对目标项目的重要程度,根据交互的用户的知识水平对其分配不同的权重,注意力权重表达式如下所示,
Figure BDA0003953724300000131
其中,vj表示目标候选项目的嵌入。en表示每个知识点在用户-项目路径图中的嵌入,
Figure BDA0003953724300000132
表示知识点对目标项目的交互权重;
最后,将目标项目的所有直接交互知识点根据其交互权重的向量的加权和,如下所示,
Figure BDA0003953724300000133
在时间通道中,根据领域知识点与候选项目的交互时间,使用一个多层感知器获取直接交互的知识点的内在权重,公式如下所示,其中,Wi∈Rd×d、ui∈Rd和b1是权重矩阵和偏差。
timei=UTtanh(W1en+bl)
Figure BDA0003953724300000134
Figure BDA0003953724300000135
其中,Wi∈Rd×d、Ui∈Rd和bl是权重矩阵和偏差。
在领域通道中,使用在项目领域特征建模中得到的项目领域特征模型,得到用户-项目路径图中知识点实体的领域注意力分数。因此,领域通道部分的注意力分数如下所示:
Figure BDA0003953724300000136
其中,si是项目领域特征模型的输出。
然后,结合这三个通道的注意力分数,得到项目全局模型,其中,
Figure BDA0003953724300000137
表示连接操作。
Figure BDA0003953724300000138
最后,整合用户-项目路径图中的所有实体特征,将不同实体的特征连接得到项目全局模型Gl
步骤5,基于注意力机制,为项目领域特征模型Si与项目全局模型Gl分配不同的权重,将两者融合,得到最终的项目模型I:
I=Wttanh(W[Si,Mi])
其中,tanh为激活函数,Wt、W为偏执矩阵;
步骤6,首先,对用户的评论集进行预处理,即将评论集中的单词转换d维嵌入,通过给定一个查询嵌入矩阵Q,从嵌入矩阵中查找用户的评论集中的单词,并将其转换为对应的嵌入向量,最终得到用户对应的评论矩阵RC,其中,第k行表示单词k及其对应的d维嵌入,同时,将步骤3得到的项目领域特征转换为矩阵形式,得到项目特征矩阵IC,得到用户评论矩阵RC后,通过狄利克雷概率聚类算法,计算用户所属的领域类型,然后,将用户所属的领域类型也转换为领域类型矩阵SC。
用户集合U={u1,u2,...,un},领域集合T={t1,t2,...,tk},用户集合U中的每个用户u看作一个单词序列
Figure BDA0003953724300000141
wi表示第i个单词,设u有n个单词,U中涉及的所有不同单词组成一个大集合S,S={s1,s2,...,si};
用户集合U作为聚类算法的输入(假设聚类成k个类型,T中共包含j个单词):
①对每个U中的用户un,对应到不同群体的概率
Figure BDA0003953724300000142
其中/>
Figure BDA0003953724300000143
表示un对应T中第k个类型的概率,计算过程如下所示:
Figure BDA0003953724300000144
其中
Figure BDA0003953724300000145
表示un中对应T中第Tk个类型的词的数目,n是un中所有词的总数;
②对每个T中的群体Tk,生成不同单词的概率
Figure BDA0003953724300000146
其中,/>
Figure BDA0003953724300000147
表示Tk生成T中第j个单词的概率,如下所示:
Figure BDA0003953724300000148
其中
Figure BDA0003953724300000151
表示群体Tk含有T中第j个单词的数目,N表示Tk中的所有单词在T中的数目。LDA的核心公式如下所示:
Figure BDA0003953724300000152
通过当前的θu和φt给出了用户u中出现单词w的概率。其中p(t|u)利用θu计算得到,p(w|t)利用φt计算得到。通过当前的θu和φt,可计算用户u描述中的一个单词对应任意一个类型Ti时的p(t|u),然后根据这些结果来更新这个词应该对应的topic。同时,如果更新改变了单词所对应的类型Ti,也会反过来影响θu和φt。
通过上述的狄利克雷聚类算法得到用户un包含的用户类别,如下所示:
Figure BDA0003953724300000153
其中,
Figure BDA0003953724300000154
是用户包含的不同的用户类别,pi指所属不同类别的概率权重,i=1,2,3...,pnTk代表目标用户对于某种类型学资源偏好的权重。
步骤7,将步骤7得到用户的评论矩阵RC与项目特征矩阵IC相乘的到用户-项目领域矩阵UIS,用户评论矩阵RC与用户所属类型矩阵SC相乘得到用户-项目类型矩阵UIT。然后,使用卷积神经网络分别从用户-项目领域矩阵UIS和用户-项目类型矩阵UIT提取用户领域特征Ut和用户类型特征Uc。具体如下:
①多类型的CNN:通过聚类得到用户的不同类型后,将每个类型通过一个矩阵表达,将用户的评论矩阵RCi与用户所属类型矩阵SC相乘,得到不同的用户的评论类型矩阵,具体过程如下所示:
Figure BDA0003953724300000155
一个用户属于多个不同的类型,将目标用户的评论矩阵可以看作一个张量,即评论特征张量由多个评论类型矩阵组成。在卷积过程中,滤波器的数量与用户所属的类型数量一致,通过滤波器在用户的多个评论类型矩阵中滑动这一过程,提取不同评论评论类型中的特征信息,最终将所有特征信息整合到一起,评论类型k的特征结果为公式如下所示:
Figure BDA0003953724300000161
其中,
Figure BDA0003953724300000162
是类型矩阵,/>
Figure BDA0003953724300000163
是Relu激活函数,[i:i+h-1]为感受野,Fk为滤波器,最终卷积结果记为下述公式:
Figure BDA0003953724300000164
②最大池化操作:卷积操作结束后,每个评论类型包含多个滤波器生成的特征矩阵,此时,无法从中得到目标用户的显著特征,于是使用一个最大池化操作来获取其中显著特征,用户类型特征模型表示如下所示:
Uc={max(c1),max(c2),...,max(cn)}
用户领域特征模型建模过程与用户类型特征模型相同。
基于注意力机制,计算用户领域特征Ut和用户类型特征Uc所占权重,将两者进行连接融合,得到用户特征模型U:
U=Wttanh(W[Ut,Uc])
其中,tanh为激活函数,Wt、W为偏执矩阵;
步骤8,将项目模型I与用户特征模型U连接,将连接后的模型作为多层深度神经网络的输入,得到目标项目和与用户的交互特征,将交互特征作为候选项目的初始推荐分数ps,计算过程如下:
Figure BDA0003953724300000165
其中,
Figure BDA0003953724300000166
为权重矩阵,bl是神经网络第l层的偏差,[U,I]为用户特征模型U和项目模型I的连接,l为神经网络模型的层数;
步骤9,将步骤7得到的用户类型直接添加到项目模型I与用户特征模型U的交互特征中,作为候选项目的最终推荐分数f′s。添加过程如下:
首先,通过LDA聚类算法得到学习者所属的多种类别,通过对学习者的所属类别以及所属类别的概率进行点积运算,计算过程如下所示:
Figure BDA0003953724300000171
Figure BDA0003953724300000172
其中,
Figure BDA0003953724300000173
指的是用户所属领域,ru,t指的是用户对某个领域的偏好,Tk指的是用户所包含的领域;同时,将/>
Figure BDA0003953724300000174
标准化在0到1的范围内。候选项目的预测分数可以根据如下等式来定义:
Figure BDA0003953724300000175
步骤10,按照推荐分数f′s高低将其排序,将分数最高的前N个候选项目依次推荐给用户。
另外,本发明还可以提供一种计算机设备,包括处理器以及存储器,存储器用于存储计算机可执行程序,处理器从存储器中读取部分或全部所述计算机可执行程序并执行,处理器执行部分或全部计算可执行程序时能实现本发明所述基于项目领域知识和用户评论特征的学习资源推荐方法。
另一方面,本发明提供一种计算机可读存储介质,计算机可读存储介质中存储有计算机程序,所述计算机程序被处理器执行时,能实现本发明所述的基于项目领域知识和用户评论特征的学习资源推荐方法。
所述计算机设备可以采用笔记本电脑、桌面型计算机或工作站。
处理器可以是中央处理器(CPU)、图形处理器(GPU)、数字信号处理器(DSP)、专用集成电路(ASIC)或现成可编程门阵列(FPGA)。
对于本发明所述存储器,可以是笔记本电脑、桌面型计算机或工作站的内部存储单元,如内存、硬盘;也可以采用外部存储单元,如移动硬盘、闪存卡。
计算机可读存储介质可以包括计算机存储介质和通信介质。计算机存储介质包括以用于存储诸如计算机可读指令、数据结构、程序模块或其他数据等信息的任何方法或技术实现的易失性和非易失性、可移动和不可移动介质。计算机可读存储介质可以包括:只读存储器(ROM,Read Only Memory)、随机存取记忆体(RAM,RandomAccess Memory)、固态硬盘(SSD,Solid State Drives)或光盘等。其中,随机存取记忆体可以包括电阻式随机存取记忆体(ReRAM,Resistance Random Access Memory)和动态随机存取存储器(DRAM,DynamicRandom Access Memory)。
以上所述,仅为本发明创造较佳的具体实施方式,但本发明创造的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明创造披露的技术范围内,根据本发明创造的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明创造的保护范围之内。

Claims (10)

1.一种基于项目领域知识和用户评论的学习资源推荐方法,其特征在于,包括以下步骤:
步骤1,获取项目领域特征信息、用户历史交互信息矩阵Y、用户的评论集合信息、查询嵌入矩阵Q、用户特征信息;
步骤2,根据用户的历史交互信息矩阵Y,构建用户—项目路径图SG;
步骤3,通过项目领域特征信息,使用基于领域分组的图卷积神经网络,构建项目领域特征模型;
步骤4,通过多通道注意力机制,计算用户—项目路径图中不同实体的注意力分数,然后,将不同通道计算得出的注意力分数相加后,作为图中不同实体的注意力权重;整合用户—项目路径图中所有实体的特征,将不同实体的特征连接得到项目全局模型Gl
步骤5,基于注意力机制,为项目领域特征模型Si与项目全局模型Gl分配不同的权重,将两者融合,得到最终的项目模型I:
步骤6,对用户的评论集进行预处理,即将评论集中的单词转换d维嵌入,通过给定一个查询嵌入矩阵Q,从嵌入矩阵中查找用户的评论集中的单词,并将其转换为对应的嵌入向量,得到用户对应的评论矩阵RC,将步骤3得到的项目领域特征转换为矩阵形式,得到项目特征矩阵IC;得到用户评论矩阵RC后,通过狄利克雷概率聚类算法,计算用户所属的领域类型,然后,将用户所属的领域类型也转换为领域类型矩阵SC;
步骤7,将用户的评论矩阵RC与项目特征矩阵IC相乘的到用户—项目领域矩阵UIS,用户评论矩阵RC与用户所属类型矩阵SC相乘得到用户—项目类型矩阵UIT,使用卷积神经网络分别从用户—项目领域矩阵UIS和用户—项目类型矩阵UIT提取用户领域特征Ut和用户类型特征Uc
基于注意力机制,计算用户领域特征Ut和用户类型特征Uc所占权重,将两者进行连接融合,得到用户特征模型U;
步骤8,将项目模型I与用户特征模型U连接,将连接后的模型作为多层深度神经网络的输入,得到目标项目和与用户的的交互特征,将交互特征作为候选项目的初始推荐分数ps;
步骤9,将步骤7得到的用户所属的领域类型直接添加到项目模型I与用户特征模型U的交互特征中,作为候选项目的最终推荐分数f's;
步骤10,按照推荐分数f's高低将其排序,将分数最高的前N个候选项目依次推荐给用户。
2.根据权利要求1所述的基于项目领域知识和用户评论的学习资源推荐方法,其特征在于,步骤1中,所述项目领域特征信息指项目所包含知识点、种类以及发布时间的详细描述信息;所述用户评论集合信息包括用户对所有项目的评论集合;所述用户历史交互信息矩阵Y指用户和项目的隐式交互矩阵,若用户和项目有历史上有所交互将Yij设置为1,否则为0;所述查询嵌入矩阵Q指矩阵中包括现有单词信息,学习者的评论集合中的任意一个单词都可以从Q中找到。
3.根据权利要求1所述的基于项目领域知识和用户评论的学习资源推荐方法,其特征在于,步骤2中,构造用户—项目路径图的具体过程如下:
步骤2.1,通过用户和项目的历史交互信息,对用户与项目之间的路径进行采样,采样完成后,选择K条路径,将每条路径的长度限制为6,在具体采样过程中,以目标用户起始点,项目为终点,进行路径为6的随机游走,最后,得到k条用户到目标项目之间的路径;
步骤2.2,得到k条路径后,对路径进行拼接,形成起点为目标用户、终点为候选项目、k条最大路径长度为6的用户—项目路径图,所述用户—项目路径图包含多种实体。
4.根据权利要求1所述的基于项目领域知识和用户评论的学习资源推荐方法,其特征在于,步骤3具体如下:
项目领域特征模型构建分为两部分:分组传播和知识分组聚合;项目包含的领域知识点作为一个种子集沿着项目领域知识图中的路径进行扩展,并递归地访问每个传播的集合;
步骤3.1,在分组传播,项目特征反映在其包含的领域知识点中,通过挖掘知识点特征,并使用领域知识点表示项目将项目的特征表示出来,定义如下:
Figure FDA0003953724290000031
其中,c代表项目,e代表领域知识点;
项目集合的初始表示是领域知识点实体的整合,在项目领域知识图中传播之后,遍历集合中所有不同类型的实体,所有实体都能有效地扩展项目的潜在特征,项目的多层传播实体递归地定义为如下公式:
Figure FDA0003953724290000032
其中,l表示实体集合与项目领域知识点种子之间的层次结构距离;
步骤3.2,知识分组聚合,将项目的领域特征传播分为两个阶段:第一阶段是使用具有实体粒度的组内注意网络确定不同路径上实体的注意力权重,第二阶段是基于关系链接的组间聚合网络表示项目的领域特征,通过这两个阶段对项目的领域特征进行更详细的模型构建;
步骤3.2.1,在组内注意网络阶段,尾部实体通过关系不同的连接和头部实体来表示,在特征传播过程中,到达尾部实体的不同路径含义不同,通过一个注意力网络来确定不同路径上的权重占比;
首先,选定项目领域知识图中的一个候选项目实体
Figure FDA0003953724290000036
再给定候选项目实体/>
Figure FDA0003953724290000037
尾部领域知识实体e,计算得出尾部领域知识实体相对于项目的注意力权重,其中/>
Figure FDA0003953724290000033
为尾部实体ti的表示,如下所示:
Figure FDA0003953724290000034
其中
Figure FDA0003953724290000035
为尾部实体ti的表示;
在获得同一层中各不同组中所有实体的注意权重后,将各组中所有加权实体嵌入相加,作为这些关系链接的表示,最终,得到k个不同领域分组的加权表示:
Figure FDA0003953724290000041
其中,pi代表尾部领域知识实体的注意力权重,
Figure FDA0003953724290000042
代表与候选项目连接的所有尾部实体;
步骤3.2.2,在组间聚合网络阶段,通过头部实体和关系链接获得了每个传播层中不同关系链接的表示,直接利用项目领域知识图中的关系信息;将每个组都认为是项目领域特征在一定的某个知识方向上的延伸,使用组间聚合网络继续表示项目的领域特征,进而得到领域特征模型。
5.根据权利要求1所述的基于项目领域知识和用户评论的学习资源推荐方法,其特征在于,步骤4具体为:
通过多通道注意力机制为用户—项目路径图中的不同实体和关系计算注意力得分,将整个用户—项目路径图中所包含的实体信息纳入项目中,然后,将注意力得分作为不同实体的权重,用以区分不同实体的重要性,最终将所有实体整合到目标项目的特征中;在领域知识模型中,得到用户—项目路径图中实体的向量嵌入,将实体嵌入组合到一起形成用户—项目路径图的实体嵌入矩阵;
得到用户—项目路径图的整体嵌入矩阵后,使用多通道注意力机制为用户—项目路径图中的实体分配不同的权重,多通道注意机制由三个通道组成,分别是交互通道、时间通道和领域通道;
在交互通道,通过向量内积捕捉领域知识点对目标项目的重要程度,根据交互的用户的知识水平对其分配不同的注意力分数,注意力分数表达式如下所示,
Figure FDA0003953724290000043
其中,vj表示目标候选项目的嵌入,en表示每个知识点在用户—项目路径图中的嵌入,
Figure FDA0003953724290000044
表示知识点对目标项目的交互权重;
最后,将目标项目的所有直接交互知识点根据其交互权重的向量的加权和,如下所示,
Figure FDA0003953724290000051
在时间通道中,根据领域知识点与候选项目的交互时间,使用一个多层感知器获取直接交互的知识点的注意力分数,公式如下所示:
timei=UTtanh(Wlen+bl)
Figure FDA0003953724290000052
Figure FDA0003953724290000053
其中,Wi∈Rd×d、Ui∈Rd代表的是权重矩阵,bl代表偏差,
在领域通道中,使用在项目领域特征建模中得到的项目领域特征模型,得到用户—项目路径图中知识点实体的领域注意力分数,领域通道部分的注意力分数如下所示:
Figure FDA0003953724290000054
其中,si是项目领域特征模型的输出,
最后,结合这三个通道的注意力分数,对每个实体计算其三通道注意力分数,将三通道分数相连接,得到项目全局模型Gl,其中,⊕表示连接操作,
Figure FDA0003953724290000055
6.根据权利要求1所述的基于项目领域知识和用户评论的学习资源推荐方法,其特征在于,步骤6聚类过程具体如下:
用户集合U={u1,u2,...,un},领域集合T={t1,t2,...,tk},用户集合U中的每个用户u看作一个单词序列
Figure FDA0003953724290000056
wi表示第i个单词,设u有n个单词,U中涉及的所有不同单词组成一个大集合S,S={s1,s2,...,sj};
用户集合U作为聚类算法的输入,聚类成k个类型,T中共包含j个单词:
①对每个U中的用户un,对应到不同群体的概率
Figure FDA0003953724290000061
其中/>
Figure FDA0003953724290000062
表示un对应T中第k个类型的概率,计算过程如下所示:
Figure FDA0003953724290000063
其中
Figure FDA0003953724290000064
表示un中对应T中第Tk个类型的词的数目,n是un中所有词的总数;
②对每个T中的群体Tk,生成不同单词的概率
Figure FDA0003953724290000065
其中,/>
Figure FDA0003953724290000066
表示Tk生成T中第j个单词的概率,如下所示:
Figure FDA0003953724290000067
其中
Figure FDA0003953724290000068
表示群体Tk含有T中第j个单词的数目,N表示Tk中的所有单词在T中的数目,LDA的核心公式如下所示:
Figure FDA0003953724290000069
通过当前的θu和φt给出了用户u中出现单词w的概率,其中p(t|u)利用θu计算得到,p(w|t)利用
Figure FDA00039537242900000610
计算得到,通过当前的θu和φt,可计算用户u描述中的一个单词对应任意一个类型Ti时的p(t|u),然后根据结果来更新该词应该对应的topic,
通过上述的狄利克雷聚类算法得到用户un包含的用户类别,如下:
Figure FDA00039537242900000611
其中,
Figure FDA00039537242900000612
是用户包含的不同的用户类别,pi指所属不同类别的概率权重,i=1,2,3…,pnTk代表目标用户对于某种类型学资源偏好的权重。
7.根据权利要求1所述的基于项目领域知识和用户评论的学习资源推荐方法,其特征在于,步骤7具体如下:
①多类型的CNN:通过聚类得到用户的不同类型后,将每个类型通过一个矩阵表达,将用户的评论矩阵RCi与用户所属类型矩阵SC相乘,得到不同的用户的评论类型矩阵;
一个用户属于多个不同的类型,将目标用户的评论矩阵看作一个张量,在卷积过程中,滤波器的数量与用户所属的类型数量一致,通过滤波器在用户的多个评论类型矩阵中滑动,提取不同评论评论类型中的特征信息,最终将所有特征信息整合到一起,得到评论类型k的特征结果;
②最大池化操作:卷积操作结束后,每个评论类型包含多个滤波器生成的特征矩阵,使用一个最大池化操作来获取其中显著特征。
8.根据权利要求1所述的基于项目领域知识和用户评论的学习资源推荐方法,其特征在于,步骤9具体如下:
首先,通过LDA聚类算法得到学习者所属的多种类别,通过对学习者的所属类别以及所属类别的概率进行点积运算,计算过程如下:
Figure FDA0003953724290000071
Figure FDA0003953724290000072
其中,
Figure FDA0003953724290000073
指的是用户所属领域,ru,t指的是用户对某个领域的偏好,Tk指的是用户所包含的领域,将/>
Figure FDA0003953724290000074
标准化在0到1的范围内,候选项目的预测分数如下:
Figure FDA0003953724290000075
其中,ps为初始推荐分数。
9.一种计算机设备,其特征在于,包括处理器和存储器,存储器中存储可执行程序,处理器执行所述可执行程序时,能执行权利要求1至7中任一项所述的基于项目领域知识和用户评论的学习资源推荐方法。
10.一种计算机可读存储介质,其特征在于,计算机可读存储介质中存储有计算机程序,所述计算机程序被处理器执行时,能实现如权利要求1至7中任一项所述的基于项目领域知识和用户评论的学习资源推荐方法。
CN202211457604.XA 2022-11-21 2022-11-21 基于项目领域知识和用户评论的学习资源推荐方法及系统 Pending CN115858919A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211457604.XA CN115858919A (zh) 2022-11-21 2022-11-21 基于项目领域知识和用户评论的学习资源推荐方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211457604.XA CN115858919A (zh) 2022-11-21 2022-11-21 基于项目领域知识和用户评论的学习资源推荐方法及系统

Publications (1)

Publication Number Publication Date
CN115858919A true CN115858919A (zh) 2023-03-28

Family

ID=85664468

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211457604.XA Pending CN115858919A (zh) 2022-11-21 2022-11-21 基于项目领域知识和用户评论的学习资源推荐方法及系统

Country Status (1)

Country Link
CN (1) CN115858919A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116415047A (zh) * 2023-06-09 2023-07-11 湖南师范大学 一种基于国家形象资源推荐的资源筛选方法及系统
CN116680481A (zh) * 2023-08-03 2023-09-01 腾讯科技(深圳)有限公司 搜索排序方法、装置、设备、存储介质及计算机程序产品

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116415047A (zh) * 2023-06-09 2023-07-11 湖南师范大学 一种基于国家形象资源推荐的资源筛选方法及系统
CN116415047B (zh) * 2023-06-09 2023-08-18 湖南师范大学 一种基于国家形象资源推荐的资源筛选方法及系统
CN116680481A (zh) * 2023-08-03 2023-09-01 腾讯科技(深圳)有限公司 搜索排序方法、装置、设备、存储介质及计算机程序产品
CN116680481B (zh) * 2023-08-03 2024-01-12 腾讯科技(深圳)有限公司 搜索排序方法、装置、设备、存储介质及计算机程序产品

Similar Documents

Publication Publication Date Title
CN109299396B (zh) 融合注意力模型的卷积神经网络协同过滤推荐方法及系统
CN111061856B (zh) 一种基于知识感知的新闻推荐方法
CN110717098B (zh) 基于元路径的上下文感知用户建模方法、序列推荐方法
CN107562812A (zh) 一种基于特定模态语义空间建模的跨模态相似性学习方法
CN107992531A (zh) 基于深度学习的新闻个性化智能推荐方法与系统
CN115858919A (zh) 基于项目领域知识和用户评论的学习资源推荐方法及系统
CN113919441A (zh) 一种基于超图变换网络的分类方法
CN112308115B (zh) 一种多标签图像深度学习分类方法及设备
CN111931505A (zh) 一种基于子图嵌入的跨语言实体对齐方法
CN114036406A (zh) 一种基于图对比学习和社交网络增强的推荐方法及系统
CN111814842A (zh) 基于多通路图卷积神经网络的对象分类方法及装置
CN112257841A (zh) 图神经网络中的数据处理方法、装置、设备及存储介质
CN112632296B (zh) 基于知识图谱具有可解释性的论文推荐方法及系统、终端
JP7393060B2 (ja) 注意メカニズムを融合したパーソナライズド検索方法及び検索システム
CN114896512A (zh) 基于学习者偏好与群体偏好的学习资源推荐方法及系统
CN111949885A (zh) 一种面向旅游景点的个性化推荐方法
CN115982467A (zh) 一种去偏化用户多兴趣推荐方法、装置及存储介质
CN115577283A (zh) 一种实体分类方法、装置、电子设备及存储介质
CN111552796A (zh) 组卷方法、电子设备及计算机可读介质
CN108304568A (zh) 一种房地产公众预期大数据处理方法及系统
CN113535949A (zh) 基于图片和句子的多模态联合事件检测方法
CN112257959A (zh) 用户风险预测方法、装置、电子设备及存储介质
CN116089708A (zh) 农业知识推荐方法及装置
CN115408605A (zh) 基于边信息和注意力机制的神经网络推荐方法及系统
CN113159976B (zh) 一种微博网络重要用户的识别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination