CN116541593B

CN116541593B - 一种基于超图神经网络的课程推荐方法

Info

Publication number: CN116541593B
Application number: CN202310481997.6A
Authority: CN
Inventors: 粟柱; 李亚峰; 刘三女牙; 杨宗凯
Original assignee: Central China Normal University
Current assignee: Central China Normal University
Priority date: 2023-04-28
Filing date: 2023-04-28
Publication date: 2024-05-31
Anticipated expiration: 2043-04-28
Also published as: CN116541593A

Abstract

本发明属于教育数字化领域，提供一种基于学习者与课程资源交互数据的超图神经网络的课程推荐方法，包括：处理得到的学习者与课程的交互数据，得到蕴含课程之间高阶关系的课程超图，对课程超图使用超图卷积神经网络表征课程之间的高阶关系；对学习者隐式社交关系网络使用图卷积神经网络进行节点编码，将每层得到的嵌入向量加权平均得到学习者最终的嵌入向量；训练超图卷积神经网络和图卷积神经网络；通过超图卷积神经网络和图卷积神经网络分别获得学习者嵌入向量和课程嵌入向量，通过向量点积操作得到学习者对于每门课程的预测得分。本发明能够很好的挖掘复杂图中非成对的高阶关系，以生成更加高效的嵌入向量，同时能够有效缓解数据稀疏性问题。

Description

一种基于超图神经网络的课程推荐方法

技术领域

本发明属于教育数字化领域，具体涉及一种基于学习者与课程资源交互数据的超图神经网络的课程推荐方法。

背景技术

近年来，随着互联网技术与教育领域的深度融合发展，以MOOC为代表的大规模在线开放课程为学习者提供了海量的学习资源，充分满足了学习者的不同需求。与此同时，海量的学习资源也带来了信息过载、信息迷航等问题，学习者在选择资源时往往会感到无所适从，导致学习效率不能有效提高。因此，如何高效精准地为学习者推荐所需的学习资源，对于推进教育信息化发展是十分必要的。

推荐系统是解决信息过载、信息迷航等问题的有效方法，精准的推荐效果能够避免学习者在选择课程时浪费太多的时间，从而提高学习效率。近年来，由于图神经网络在图结构数据上有着强大的表示能力，使得基于图神经网络的推荐算法迅速发展。但是，这些算法也面临交互信息稀疏、长尾等问题。另外，基于图神经网络的推荐算法仅考虑图结构数据节点之间的成对关系，而对于非成对关系较少涉及，忽略了节点之间复杂的高阶关系。

发明内容

针对现有技术的以上缺陷或改进需求，本发明提供一种基于超图神经网络的在线课程推荐方法，借助复杂网络中超图的概念，运用超图神经网络技术，充分提取课程之间的高阶关系，同时考虑学习者之间的社交关系，以解决当前基于图神经网络的推荐模型存在的交互信息稀疏、长尾等问题，从而使推荐结果更加精准。

本发明的目的是通过如下技术措施来实现的。

一种基于超图神经网络的课程推荐方法，包括以下步骤：

(1)从在线教育平台数据库中下载学习者与课程的交互数据D₀，包括学习者id、课程id和交互记录。

(2)预处理步骤(1)中的数据D₀，包括：数据筛选和id重映射等，得到学习者与课程交互数据D₁，数据样式为{“student id”:[“course1 id”,“course2 id”…]}。

(3)处理步骤(2)得到的交互数据D₁，得到蕴含课程之间高阶关系的课程超图G(V,E)，记作G_c，其中V,E分别表示超图节点集和超边集，同时构造学习者之间隐式社交关系网络G_u。

课程超图G_c，数据样式为{[“course1 id”,“course2 id”…“course m”,weight]}，weight是m门课程所构成的超边的权重，记作w_c；

隐式社交关系网络G_u，数据样式为{[“student1 id”,“student2 id”,weight]}，weight是两个学习者之间的隐式社交关系权重，记作w_u。

(4)对课程超图G_c使用超图卷积神经网络表征课程之间的高阶关系，以生成课程的嵌入向量，其超图卷积层矩阵表示如下：

其中X_c为课程的嵌入向量，H为超图的关联矩阵，D和B分别为超图节点的度和超边的度，W为超边的权重，l为超图卷积层数，σ为激活函数，Θ为可训练参数。

(5)对学习者隐式社交关系网络G_u使用图卷积神经网络进行节点编码，最后将每层得到的嵌入向量加权平均得到学习者最终的嵌入向量。图卷积公式如下：

其中X_u为学习者的嵌入向量，为由学习者u的邻居节点聚合信息得到的嵌入向量，l为图卷积层数，σ为激活函数，Θ为可训练参数。

(6)通过步骤(4)和步骤(5)得到学习者的嵌入向量X_u和课程的嵌入向量X_c，将预测得分表示为X_u和X_c的点积，公式如下：

(7)利用BPR(Bayesian Personalized Ranking)损失函数和梯度下降算法训练步骤(4)、(5)中的超图卷积神经网络和图卷积神经网络。

(8)通过超图卷积神经网络和图卷积神经网络分别获得学习者嵌入向量和课程嵌入向量，然后通过向量点积操作得到学习者对于每门课程的预测得分，按照预测得分的降序排列方式选取前K门课程作为实际推荐课程推送给相关学习者，其中K可为5、10、20等。

本发明在基于图的课程推荐模型中引入复杂网络中超图的概念，利用超图卷积网络表征课程之间的高阶关联关系，能够很好的挖掘复杂图中非成对的高阶关系，以生成更加高效的嵌入向量；同时考虑学习者之间的隐式社交关系，能够有效缓解数据稀疏性问题；此推荐模型仅利用学习者与课程的交互数据，不涉及学习者、课程的基本属性等特征，适用的课程推荐平台范围较为广泛。

附图说明

图1是本发明课程推荐方法流程框架图。

具体实施方式

下面将结合附图及实施例，对本发明中的技术方案进行具体描述。显然所描述的实施例是本发明部分实施例，而不是全部实施例。基于本发明的实施例，本领域普通技术人员在没有付出创造性劳动的前提下所获得的所有其他实施例，都属于本发明的保护范围。

下面结合图1，具体介绍本发明的实现步骤。

一种基于超图神经网络的课程推荐方法，包括以下步骤：

S1，以数据日志的方式获取学习者与课程交互数据D₀，包括学习者id、课程id和交互记录。

S2，对原始数据进行预处理操作：去除重复数据；筛选交互记录数大于T的学习者和课程；将学习者id和课程id分别映射为简单的自然数值，得到交互数据D₁，数据样式为{“student id”:[“course1id”,“course2 id”…]}。

S3，借助交互数据D₁，在同一名学习者交互过的一组课程中添加一条超边，从而形成课程超图G_c，用关联矩阵表示如下：

对于每一个节点和超边，它们的度D_ii和B_∈∈表示如下：

同时构造学习者之间隐式社交关系网络G_u，数据样式为{[“student1 id”,“student2 id”,weight]}，weight是两个学习者之间的隐式社交关系权重，记作w_u，计算公式如下：

其中，是学习者u₁所交互的课程集合，/>是学习者u₂所交互的课程集合，/>与/>均可从交互数据D₁得到。

S4，在课程超图G_c上构建超图卷积神经网络模型，充分提取课程之间的高阶关系，以生成蕴含丰富语义的课程嵌入向量。超图卷积层表示如下：

矩阵表达形式如下：

其中，X_c为课程的嵌入向量，H为超图的关联矩阵，D和B分别为超图节点的度和超边的度，W为超边的权重，l为超图卷积层数，ο为激活函数，Θ为可训练参数。

超图卷积层可以看作是对超图结构进行“节点-超边-节点”特征变换两个阶段的细化。可以看作是从节点到超边的信息聚合，然后左乘H以聚合从超边到节点的信息。通过迭代多个超图卷积层即可得到课程最终的嵌入向量X_c。

S5，在学习者隐式社交关系网络G_u上构建图卷积神经网络模型，以获取学习者的嵌入向量。图卷积层公式如下：

其中，为拉普拉斯矩阵，W为权重矩阵，σ为激活函数，l为图卷积层数。学习者的初始嵌入向量由所交互的课程嵌入向量取平均得到，如对于学习者u₁，其交互课程序列为[c₁,c₂,c₃,c₄]，则/>通过迭代L个图卷积层，最后将每层得到的嵌入向量加权平均得到学习者最终的嵌入向量，即/>

S6，得到学习者的嵌入向量X_u和课程的嵌入向量X_c后，将预测得分表示为X_u和X_c的点积，公式如下：

S7，利用BPR损失函数和梯度下降算法训练S4、S5中的超图卷积神经网络和图卷积神经网络，损失函数公式表示如下：

其中，u表示学习者，i表示学习者交互过的课程，j表示学习者未交互过的课程，表示正样本得分，/>表示负样本的得分，贝叶斯个性化排名损失L_BPR的目标是让交互过的课程的得分高于未交互过的课程。

S8，通过超图卷积神经网络和图卷积神经网络分别获得学习者嵌入向量和课程嵌入向量，然后通过向量点积操作得到学习者对于每门课程的预测得分，按照预测得分的降序排列方式选取前K门课程作为实际推荐课程推送给相关学习者，其中K可为5、10、20等。

针对以上步骤中出现向量提取以及模型实现、训练等涉及的具体代码实现方式均可以通过深度学习框架Pytorch实现。

本说明书未作详细描述的内容，属于本专业技术人员公知的现有技术。

应当说明的是，以上包含的本发明实例内容说明，是为了详细解释本发明的技术特征。在不脱离本发明的前提下，所做出的若干改进和修饰也受本发明的保护，因此本发明的保护范围应当以本申请的权利要求所界定的内容为标准。

Claims

1.一种基于超图神经网络的课程推荐方法，其特征在于该课程推荐方法包括以下步骤：

(1)从在线教育平台数据库中下载学习者与课程的交互数据D₀，包括学习者id、课程id和交互记录；

(2)预处理步骤(1)中的数据D₀，包括：数据筛选和id重映射，得到学习者与课程交互数据D₁，数据样式为{“student id”:[“course1id”,“course2 id”…]}；

(3)处理步骤(2)得到的交互数据D₁，得到蕴含课程之间高阶关系的课程超图G(V,E)，记作G_c，其中V,E分别表示超图节点集和超边集，同时构造学习者之间隐式社交关系网络G_u；

课程超图G_c，数据样式为{[“course1id”,“course2 id”…“course m”,weight]}，weight是m门课程所构成的超边的权重，记作w_c；

隐式社交关系网络G_u，数据样式为{[“student1id”,“student2 id”,weight]}，weight是两个学习者之间的隐式社交关系权重，记作w_u，公式如下：

其中，是学习者u₁所交互的课程集合，/>是学习者u₂所交互的课程集合，/>与均可从交互数据D₁得到；

其中，X_c为课程的嵌入向量，H为超图的关联矩阵，D和B分别为超图节点的度和超边的度，W为超边的权重，l为超图卷积层数，σ为激活函数，Θ为可训练参数；

(5)对学习者隐式社交关系网络G_u使用图卷积神经网络进行节点编码，最后将每层得到的嵌入向量加权平均得到学习者最终的嵌入向量；图卷积公式如下：

其中，X_u为学习者的嵌入向量，为由学习者u的邻居节点聚合信息得到的嵌入向量，l为图卷积层数，σ为激活函数，Θ为可训练参数；

(7)利用BPR损失函数和梯度下降算法训练步骤(4)、(5)中的超图卷积神经网络和图卷积神经网络，损失函数公式表示如下：

其中，u表示学习者，i表示学习者交互过的课程，j表示学习者未交互过的课程，表示正样本得分，/>表示负样本的得分，贝叶斯个性化排名损失L_BPR的目标是让交互过的课程的得分高于未交互过的课程；

(8)通过超图卷积神经网络和图卷积神经网络分别获得学习者的嵌入向量和课程的嵌入向量，然后通过向量点积操作得到学习者对于每门课程的预测得分，按照预测得分的降序排列方式选取前K门课程作为实际推荐课程推送给相关学习者。

2.根据权利要求1所述的基于超图神经网络的课程推荐方法，其特征在于：步骤(8)中的K为5、或10或20。