CN116541593B - 一种基于超图神经网络的课程推荐方法 - Google Patents

一种基于超图神经网络的课程推荐方法 Download PDF

Info

Publication number
CN116541593B
CN116541593B CN202310481997.6A CN202310481997A CN116541593B CN 116541593 B CN116541593 B CN 116541593B CN 202310481997 A CN202310481997 A CN 202310481997A CN 116541593 B CN116541593 B CN 116541593B
Authority
CN
China
Prior art keywords
course
learner
hypergraph
neural network
embedded vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310481997.6A
Other languages
English (en)
Other versions
CN116541593A (zh
Inventor
粟柱
李亚峰
刘三女牙
杨宗凯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Central China Normal University
Original Assignee
Central China Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Central China Normal University filed Critical Central China Normal University
Priority to CN202310481997.6A priority Critical patent/CN116541593B/zh
Publication of CN116541593A publication Critical patent/CN116541593A/zh
Application granted granted Critical
Publication of CN116541593B publication Critical patent/CN116541593B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/042Knowledge-based neural networks; Logical representations of neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/20Education
    • G06Q50/205Education administration or guidance
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Tourism & Hospitality (AREA)
  • Strategic Management (AREA)
  • Educational Technology (AREA)
  • Educational Administration (AREA)
  • Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Biomedical Technology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • General Business, Economics & Management (AREA)
  • Electrically Operated Instructional Devices (AREA)

Abstract

本发明属于教育数字化领域,提供一种基于学习者与课程资源交互数据的超图神经网络的课程推荐方法,包括:处理得到的学习者与课程的交互数据,得到蕴含课程之间高阶关系的课程超图,对课程超图使用超图卷积神经网络表征课程之间的高阶关系;对学习者隐式社交关系网络使用图卷积神经网络进行节点编码,将每层得到的嵌入向量加权平均得到学习者最终的嵌入向量;训练超图卷积神经网络和图卷积神经网络;通过超图卷积神经网络和图卷积神经网络分别获得学习者嵌入向量和课程嵌入向量,通过向量点积操作得到学习者对于每门课程的预测得分。本发明能够很好的挖掘复杂图中非成对的高阶关系,以生成更加高效的嵌入向量,同时能够有效缓解数据稀疏性问题。

Description

一种基于超图神经网络的课程推荐方法
技术领域
本发明属于教育数字化领域,具体涉及一种基于学习者与课程资源交互数据的超图神经网络的课程推荐方法。
背景技术
近年来,随着互联网技术与教育领域的深度融合发展,以MOOC为代表的大规模在线开放课程为学习者提供了海量的学习资源,充分满足了学习者的不同需求。与此同时,海量的学习资源也带来了信息过载、信息迷航等问题,学习者在选择资源时往往会感到无所适从,导致学习效率不能有效提高。因此,如何高效精准地为学习者推荐所需的学习资源,对于推进教育信息化发展是十分必要的。
推荐系统是解决信息过载、信息迷航等问题的有效方法,精准的推荐效果能够避免学习者在选择课程时浪费太多的时间,从而提高学习效率。近年来,由于图神经网络在图结构数据上有着强大的表示能力,使得基于图神经网络的推荐算法迅速发展。但是,这些算法也面临交互信息稀疏、长尾等问题。另外,基于图神经网络的推荐算法仅考虑图结构数据节点之间的成对关系,而对于非成对关系较少涉及,忽略了节点之间复杂的高阶关系。
发明内容
针对现有技术的以上缺陷或改进需求,本发明提供一种基于超图神经网络的在线课程推荐方法,借助复杂网络中超图的概念,运用超图神经网络技术,充分提取课程之间的高阶关系,同时考虑学习者之间的社交关系,以解决当前基于图神经网络的推荐模型存在的交互信息稀疏、长尾等问题,从而使推荐结果更加精准。
本发明的目的是通过如下技术措施来实现的。
一种基于超图神经网络的课程推荐方法,包括以下步骤:
(1)从在线教育平台数据库中下载学习者与课程的交互数据D0,包括学习者id、课程id和交互记录。
(2)预处理步骤(1)中的数据D0,包括:数据筛选和id重映射等,得到学习者与课程交互数据D1,数据样式为{“student id”:[“course1 id”,“course2 id”…]}。
(3)处理步骤(2)得到的交互数据D1,得到蕴含课程之间高阶关系的课程超图G(V,E),记作Gc,其中V,E分别表示超图节点集和超边集,同时构造学习者之间隐式社交关系网络Gu
课程超图Gc,数据样式为{[“course1 id”,“course2 id”…“course m”,weight]},weight是m门课程所构成的超边的权重,记作wc
隐式社交关系网络Gu,数据样式为{[“student1 id”,“student2 id”,weight]},weight是两个学习者之间的隐式社交关系权重,记作wu
(4)对课程超图Gc使用超图卷积神经网络表征课程之间的高阶关系,以生成课程的嵌入向量,其超图卷积层矩阵表示如下:
其中Xc为课程的嵌入向量,H为超图的关联矩阵,D和B分别为超图节点的度和超边的度,W为超边的权重,l为超图卷积层数,σ为激活函数,Θ为可训练参数。
(5)对学习者隐式社交关系网络Gu使用图卷积神经网络进行节点编码,最后将每层得到的嵌入向量加权平均得到学习者最终的嵌入向量。图卷积公式如下:
其中Xu为学习者的嵌入向量,为由学习者u的邻居节点聚合信息得到的嵌入向量,l为图卷积层数,σ为激活函数,Θ为可训练参数。
(6)通过步骤(4)和步骤(5)得到学习者的嵌入向量Xu和课程的嵌入向量Xc,将预测得分表示为Xu和Xc的点积,公式如下:
(7)利用BPR(Bayesian Personalized Ranking)损失函数和梯度下降算法训练步骤(4)、(5)中的超图卷积神经网络和图卷积神经网络。
(8)通过超图卷积神经网络和图卷积神经网络分别获得学习者嵌入向量和课程嵌入向量,然后通过向量点积操作得到学习者对于每门课程的预测得分,按照预测得分的降序排列方式选取前K门课程作为实际推荐课程推送给相关学习者,其中K可为5、10、20等。
本发明在基于图的课程推荐模型中引入复杂网络中超图的概念,利用超图卷积网络表征课程之间的高阶关联关系,能够很好的挖掘复杂图中非成对的高阶关系,以生成更加高效的嵌入向量;同时考虑学习者之间的隐式社交关系,能够有效缓解数据稀疏性问题;此推荐模型仅利用学习者与课程的交互数据,不涉及学习者、课程的基本属性等特征,适用的课程推荐平台范围较为广泛。
附图说明
图1是本发明课程推荐方法流程框架图。
具体实施方式
下面将结合附图及实施例,对本发明中的技术方案进行具体描述。显然所描述的实施例是本发明部分实施例,而不是全部实施例。基于本发明的实施例,本领域普通技术人员在没有付出创造性劳动的前提下所获得的所有其他实施例,都属于本发明的保护范围。
下面结合图1,具体介绍本发明的实现步骤。
一种基于超图神经网络的课程推荐方法,包括以下步骤:
S1,以数据日志的方式获取学习者与课程交互数据D0,包括学习者id、课程id和交互记录。
S2,对原始数据进行预处理操作:去除重复数据;筛选交互记录数大于T的学习者和课程;将学习者id和课程id分别映射为简单的自然数值,得到交互数据D1,数据样式为{“student id”:[“course1id”,“course2 id”…]}。
S3,借助交互数据D1,在同一名学习者交互过的一组课程中添加一条超边,从而形成课程超图Gc,用关联矩阵表示如下:
对于每一个节点和超边,它们的度Dii和B∈∈表示如下:
同时构造学习者之间隐式社交关系网络Gu,数据样式为{[“student1 id”,“student2 id”,weight]},weight是两个学习者之间的隐式社交关系权重,记作wu,计算公式如下:
其中,是学习者u1所交互的课程集合,/>是学习者u2所交互的课程集合,/>与/>均可从交互数据D1得到。
S4,在课程超图Gc上构建超图卷积神经网络模型,充分提取课程之间的高阶关系,以生成蕴含丰富语义的课程嵌入向量。超图卷积层表示如下:
矩阵表达形式如下:
其中,Xc为课程的嵌入向量,H为超图的关联矩阵,D和B分别为超图节点的度和超边的度,W为超边的权重,l为超图卷积层数,ο为激活函数,Θ为可训练参数。
超图卷积层可以看作是对超图结构进行“节点-超边-节点”特征变换两个阶段的细化。可以看作是从节点到超边的信息聚合,然后左乘H以聚合从超边到节点的信息。通过迭代多个超图卷积层即可得到课程最终的嵌入向量Xc
S5,在学习者隐式社交关系网络Gu上构建图卷积神经网络模型,以获取学习者的嵌入向量。图卷积层公式如下:
其中,为拉普拉斯矩阵,W为权重矩阵,σ为激活函数,l为图卷积层数。学习者的初始嵌入向量由所交互的课程嵌入向量取平均得到,如对于学习者u1,其交互课程序列为[c1,c2,c3,c4],则/>通过迭代L个图卷积层,最后将每层得到的嵌入向量加权平均得到学习者最终的嵌入向量,即/>
S6,得到学习者的嵌入向量Xu和课程的嵌入向量Xc后,将预测得分表示为Xu和Xc的点积,公式如下:
S7,利用BPR损失函数和梯度下降算法训练S4、S5中的超图卷积神经网络和图卷积神经网络,损失函数公式表示如下:
其中,u表示学习者,i表示学习者交互过的课程,j表示学习者未交互过的课程,表示正样本得分,/>表示负样本的得分,贝叶斯个性化排名损失LBPR的目标是让交互过的课程的得分高于未交互过的课程。
S8,通过超图卷积神经网络和图卷积神经网络分别获得学习者嵌入向量和课程嵌入向量,然后通过向量点积操作得到学习者对于每门课程的预测得分,按照预测得分的降序排列方式选取前K门课程作为实际推荐课程推送给相关学习者,其中K可为5、10、20等。
针对以上步骤中出现向量提取以及模型实现、训练等涉及的具体代码实现方式均可以通过深度学习框架Pytorch实现。
本说明书未作详细描述的内容,属于本专业技术人员公知的现有技术。
应当说明的是,以上包含的本发明实例内容说明,是为了详细解释本发明的技术特征。在不脱离本发明的前提下,所做出的若干改进和修饰也受本发明的保护,因此本发明的保护范围应当以本申请的权利要求所界定的内容为标准。

Claims (2)

1.一种基于超图神经网络的课程推荐方法,其特征在于该课程推荐方法包括以下步骤:
(1)从在线教育平台数据库中下载学习者与课程的交互数据D0,包括学习者id、课程id和交互记录;
(2)预处理步骤(1)中的数据D0,包括:数据筛选和id重映射,得到学习者与课程交互数据D1,数据样式为{“student id”:[“course1id”,“course2 id”…]};
(3)处理步骤(2)得到的交互数据D1,得到蕴含课程之间高阶关系的课程超图G(V,E),记作Gc,其中V,E分别表示超图节点集和超边集,同时构造学习者之间隐式社交关系网络Gu
课程超图Gc,数据样式为{[“course1id”,“course2 id”…“course m”,weight]},weight是m门课程所构成的超边的权重,记作wc
隐式社交关系网络Gu,数据样式为{[“student1id”,“student2 id”,weight]},weight是两个学习者之间的隐式社交关系权重,记作wu,公式如下:
其中,是学习者u1所交互的课程集合,/>是学习者u2所交互的课程集合,/>均可从交互数据D1得到;
(4)对课程超图Gc使用超图卷积神经网络表征课程之间的高阶关系,以生成课程的嵌入向量,其超图卷积层矩阵表示如下:
其中,Xc为课程的嵌入向量,H为超图的关联矩阵,D和B分别为超图节点的度和超边的度,W为超边的权重,l为超图卷积层数,σ为激活函数,Θ为可训练参数;
(5)对学习者隐式社交关系网络Gu使用图卷积神经网络进行节点编码,最后将每层得到的嵌入向量加权平均得到学习者最终的嵌入向量;图卷积公式如下:
其中,Xu为学习者的嵌入向量,为由学习者u的邻居节点聚合信息得到的嵌入向量,l为图卷积层数,σ为激活函数,Θ为可训练参数;
(6)通过步骤(4)和步骤(5)得到学习者的嵌入向量Xu和课程的嵌入向量Xc,将预测得分表示为Xu和Xc的点积,公式如下:
(7)利用BPR损失函数和梯度下降算法训练步骤(4)、(5)中的超图卷积神经网络和图卷积神经网络,损失函数公式表示如下:
其中,u表示学习者,i表示学习者交互过的课程,j表示学习者未交互过的课程,表示正样本得分,/>表示负样本的得分,贝叶斯个性化排名损失LBPR的目标是让交互过的课程的得分高于未交互过的课程;
(8)通过超图卷积神经网络和图卷积神经网络分别获得学习者的嵌入向量和课程的嵌入向量,然后通过向量点积操作得到学习者对于每门课程的预测得分,按照预测得分的降序排列方式选取前K门课程作为实际推荐课程推送给相关学习者。
2.根据权利要求1所述的基于超图神经网络的课程推荐方法,其特征在于:步骤(8)中的K为5、或10或20。
CN202310481997.6A 2023-04-28 2023-04-28 一种基于超图神经网络的课程推荐方法 Active CN116541593B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310481997.6A CN116541593B (zh) 2023-04-28 2023-04-28 一种基于超图神经网络的课程推荐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310481997.6A CN116541593B (zh) 2023-04-28 2023-04-28 一种基于超图神经网络的课程推荐方法

Publications (2)

Publication Number Publication Date
CN116541593A CN116541593A (zh) 2023-08-04
CN116541593B true CN116541593B (zh) 2024-05-31

Family

ID=87448101

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310481997.6A Active CN116541593B (zh) 2023-04-28 2023-04-28 一种基于超图神经网络的课程推荐方法

Country Status (1)

Country Link
CN (1) CN116541593B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118037003B (zh) * 2024-04-10 2024-06-28 禾辰纵横信息技术有限公司 一种在线学习课程优化排序方法和系统

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112070277A (zh) * 2020-08-17 2020-12-11 杭州电子科技大学 基于超图神经网络的药物-标靶相互作用预测方法
CN113672811A (zh) * 2021-08-24 2021-11-19 广东工业大学 一种基于拓扑信息嵌入的超图卷积协同过滤推荐方法、系统及计算机可读存储介质
CN114372573A (zh) * 2022-01-07 2022-04-19 中国人民解放军国防科技大学 用户画像信息识别方法、装置、计算机设备和存储介质
CN114547325A (zh) * 2022-01-14 2022-05-27 北京帝测科技股份有限公司 一种概率超图驱动的地学知识图谱推理优化系统和方法
CN114817663A (zh) * 2022-05-05 2022-07-29 杭州电子科技大学 一种基于类别感知图神经网络的服务建模与推荐方法
CN115082147A (zh) * 2022-06-14 2022-09-20 华南理工大学 一种基于超图神经网络的序列推荐方法及装置
CN115630153A (zh) * 2022-11-11 2023-01-20 华南理工大学 一种基于大数据技术的研究生文献资源推荐方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112070277A (zh) * 2020-08-17 2020-12-11 杭州电子科技大学 基于超图神经网络的药物-标靶相互作用预测方法
CN113672811A (zh) * 2021-08-24 2021-11-19 广东工业大学 一种基于拓扑信息嵌入的超图卷积协同过滤推荐方法、系统及计算机可读存储介质
CN114372573A (zh) * 2022-01-07 2022-04-19 中国人民解放军国防科技大学 用户画像信息识别方法、装置、计算机设备和存储介质
CN114547325A (zh) * 2022-01-14 2022-05-27 北京帝测科技股份有限公司 一种概率超图驱动的地学知识图谱推理优化系统和方法
CN114817663A (zh) * 2022-05-05 2022-07-29 杭州电子科技大学 一种基于类别感知图神经网络的服务建模与推荐方法
CN115082147A (zh) * 2022-06-14 2022-09-20 华南理工大学 一种基于超图神经网络的序列推荐方法及装置
CN115630153A (zh) * 2022-11-11 2023-01-20 华南理工大学 一种基于大数据技术的研究生文献资源推荐方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
A Course Teacher Recommendation Method Based on Hypergraph Model;Dunhong Yao 等;《2021 International Conference on Electronic Information Technology and Smart Agriculture (ICEITSA)》;20220216;135-141 *
Improving Hypergraph Attention and Hypergraph Convolution Networks;Mustafa Mohammadi Garasuie 等;《2020 11th International Conference on Information and Knowledge Technology (IKT)》;20210210;67-72 *
基于慕课的在线开放课程推荐算法研究;马文蕴;《中国优秀硕士学位论文全文数据库 社会科学Ⅱ辑》;20230215(第2期);H127-193 *
基于超图的多模态特征选择及分类方法研究;彭瑶;《中国优秀硕士学位论文全文数据库医药卫生科技辑》;20200215(第2期);E060-18 *

Also Published As

Publication number Publication date
CN116541593A (zh) 2023-08-04

Similar Documents

Publication Publication Date Title
CN105512289B (zh) 基于深度学习和哈希的图像检索方法
CN112418292B (zh) 一种图像质量评价的方法、装置、计算机设备及存储介质
CN112084331A (zh) 文本处理、模型训练方法、装置、计算机设备和存储介质
CN109947912A (zh) 一种基于段落内部推理和联合问题答案匹配的模型方法
CN110728541A (zh) 信息流媒体广告创意推荐方法及装置
CN111611488B (zh) 基于人工智能的信息推荐方法、装置、电子设备
CN116664719B (zh) 一种图像重绘模型训练方法、图像重绘方法及装置
CN108197294A (zh) 一种基于深度学习的文本自动生成方法
CN111125530A (zh) 一种基于多类型特征深度学习的信息流推荐方法
CN110189291A (zh) 一种基于多任务卷积神经网络的通用无参考图像质量评价方法
CN112417289A (zh) 一种基于深度聚类的资讯信息智能推荐方法
CN108765512B (zh) 一种基于多层级特征的对抗图像生成方法
CN112115967A (zh) 一种基于数据保护的图像增量学习方法
CN111753207A (zh) 一种基于评论的神经图协同过滤模型
CN116541593B (zh) 一种基于超图神经网络的课程推荐方法
CN112463989B (zh) 一种基于知识图谱的信息获取方法及系统
CN113254652B (zh) 一种基于超图注意力网络的社交媒体贴文真实性检测方法
CN112017255A (zh) 一种根据食谱生成食物图像的方法
CN110704510A (zh) 一种结合用户画像的题目推荐方法及系统
CN112446489A (zh) 基于变分自编码器的动态网络嵌入链接预测方法
CN112148891A (zh) 一种基于图感知张量分解的知识图谱补全方法
CN114282059A (zh) 视频检索的方法、装置、设备及存储介质
CN114723037A (zh) 一种聚合高阶邻居节点的异构图神经网络计算方法
CN114065769B (zh) 情感原因对抽取模型的训练方法、装置、设备及介质
CN112100486A (zh) 一种基于图模型的深度学习推荐系统及其方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant