CN113065342B - 一种基于关联关系分析的课程推荐方法 - Google Patents
一种基于关联关系分析的课程推荐方法 Download PDFInfo
- Publication number
- CN113065342B CN113065342B CN202110301297.5A CN202110301297A CN113065342B CN 113065342 B CN113065342 B CN 113065342B CN 202110301297 A CN202110301297 A CN 202110301297A CN 113065342 B CN113065342 B CN 113065342B
- Authority
- CN
- China
- Prior art keywords
- entity
- user
- matrix
- path
- entities
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 40
- 238000004458 analytical method Methods 0.000 title claims abstract description 8
- 239000011159 matrix material Substances 0.000 claims abstract description 156
- 238000000354 decomposition reaction Methods 0.000 claims abstract description 16
- 238000000605 extraction Methods 0.000 claims abstract description 11
- 230000006870 function Effects 0.000 claims description 27
- 230000004913 activation Effects 0.000 claims description 13
- 238000012098 association analyses Methods 0.000 claims description 11
- 239000013598 vector Substances 0.000 claims description 11
- 238000004364 calculation method Methods 0.000 claims description 6
- 230000003993 interaction Effects 0.000 claims description 6
- 230000002452 interceptive effect Effects 0.000 claims description 6
- 230000003416 augmentation Effects 0.000 claims description 3
- 239000000203 mixture Substances 0.000 claims description 3
- 238000005457 optimization Methods 0.000 claims description 3
- 238000010586 diagram Methods 0.000 abstract description 3
- 239000002243 precursor Substances 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/16—Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/20—Education
- G06Q50/205—Education administration or guidance
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- Mathematical Physics (AREA)
- Mathematical Analysis (AREA)
- Artificial Intelligence (AREA)
- Tourism & Hospitality (AREA)
- Computational Linguistics (AREA)
- Mathematical Optimization (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Pure & Applied Mathematics (AREA)
- Strategic Management (AREA)
- Educational Technology (AREA)
- Computational Mathematics (AREA)
- Educational Administration (AREA)
- Software Systems (AREA)
- Algebra (AREA)
- Computing Systems (AREA)
- Economics (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- General Business, Economics & Management (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种基于关联关系分析的课程推荐方法,从中提取出知识概念以及用户与其他实体之间的关联矩阵如用户与其他实体的关联矩阵,通过元路径得到知识概念和用户对应的邻接矩阵,通过对用户的元路径邻接矩阵构建实体的关联关系图,并经过关联关系特征提取模块得到用户的关联关系特征,将知识概念与用户在不同元路径下的实体表示进行加权合并,得到最终的用户实体表示与课程知识概念实体表示,最后通过矩阵分解的方式获取最终的用户与知识概念的评分矩阵,根据评分矩阵对用户进行课程推荐,提高了推荐的准确性。
Description
技术领域
本发明属于教育课程推荐领域,尤其涉及了一种基于关联关系分析的在线课程推荐方法。
背景技术
近年来,大规模在线开放课程(Massive Open Online Courses,简称MOOCs)逐渐成为了一种全球行的替代教育的一种模式,并通过面向全球开放在线资源提供新的教育机会,从而彻底改变了整个教育领域。现在已经出现了非常多的MOOC平台,例如,Coursera,edX和Udacity是三位先驱,其次是来自其他国家的许多先驱,例如中国的XuetangX,北美的Khan Academy,西班牙的Miriada,德语的Iversity,英格兰的FutureLearn,澳大利亚的Open2Study,Fun in法国,巴西的Veduca和日本的Schoo(Qiu等人,2016)。
但是据数据统计分析,学生在线课程的完成率极低,而学生对于某一门课程所覆盖的课程知识概念并不会完全感兴趣,这也会导致学生在某一门课程的学习过程中中途辍学。无法吸引学生在平台上持续高效的学习,导致平台上整体的课程完成率低于5%,为了吸引学生的兴趣,MOOC提供商使用推荐系统向学生推荐课程。同时,由于一门课程通常包含许多视频讲座,每个讲座都涵盖一些特定的知识概念,因此直接推荐课程会忽略学生对某些特定知识概念的兴趣。因此课程知识概念推荐的研究也显得格外重要。
公布号为CN112328752A的专利申请记载了基于文本相似性的基于搜索内容的课程推荐方法、装置、计算机设备及介质,根据搜索内容提取出多个热词;针对每个热词,获取包含热词的目标搜索内容并提取目标搜索内容的搜索文本向量;对同一热词对应的多个搜索文本向量进行聚类并确定每类的核心搜索内容;根据搜索内容引发的点击次数从多类的核心搜索内容中识别出用户满意的核心搜索内容和用户不满意的核心搜索内容;根据搜索内容引发的点击内容过滤出用户满意的核心搜索内容中的假性满意的核心搜索内容;根据用户不满意的核心搜索内容及假性满意的核心搜索内容进行课程推荐。
公布号为CN112347147A的专利申请记载了基于文本相似性的基于用户关联关系的信息推送方法、装置、电子设备及计算机可读介质。该方法包括:获取目标用户的用户标识;确定关联关系层级和关联关系类别;基于所述目标用户的用户标识、所述关联关系层级和所述关联关系类别在图形数据库中进行检索,获取多个关联用户和其对应的关联关系类别;基于所述关联关系类别为所述多个关联用户分别生成推广信息;将所述推广信息发送至其对应的关联用户。本公开涉及的基于用户关联关系的信息推送方法、装置、电子设备及计算机可读介质,能够快速有效的提取用户之间的关联关系,并基于关联关系生成个性化的推广信息进行推广,提升用户满意度。
然而传统的推荐技术面临着数据的稀疏性问题,无法获得异构信息网络上的多种关系信息,以及无法捕获高阶的邻域关联信息,存在推荐准确性不够等问题。
发明内容
本申请的目的是提出一种基于关联关系分析的课程推荐方法,用于减轻推荐系统数据的稀疏性问题,并且利用关联关系的分析来接受给定异构信息网络上高阶邻接信息和用户的潜在长途兴趣,有效利用了不同实体之间丰富的关系,避免了上述信息浪费的情况,提高了课程推荐的准确性。
为了实现上述目的,本申请技术方案如下:
一种基于关联关系分析的课程推荐方法,包括:
步骤1、根据在线课程平台的用户应用历史记录获取实体,所述实体包括课程、用户、知识概念、教师、视频;
步骤2、对知识概念实体提取语义特征Sk;
步骤3、获取知识概念与其他实体的关联矩阵,并通过预设的元路径集合进行重构,获取对应的元路径邻接矩阵集合/>n是知识概念实体与其他实体的元路径的个数;
步骤4、获取用户实体与其他实体的关联矩阵,并通过预设的元路径集合进行重构,获取对应的元路径邻接矩阵集合/>m是用户实体与其他实体的元路径的个数;
步骤5、将用户实体的元路径邻接矩阵集合输入到关联关系特征提取模块中,得到用户实体的关联关系特征Xu;
步骤6、将知识概念实体的语义特征Sk以及元路径邻接矩阵集合输入至实体表示模块中,得到知识概念实体在各条元路径下的实体表示集合/>
步骤7、将用户实体的关联关系特征Xu以及元路径邻接矩阵集合输入至实体表示模块中,得到用户实体在各条元路径下的实体表示集合/>
步骤8、将知识概念实体在各条元路径下的实体表示集合进行加权合并,得到知识概念的最终实体表示ek;
步骤9、将用户实体在各条元路径下的实体表示集合进行加权合并,得到用户的最终实体表示eu;
步骤10、通过对知识概念与用户的最终实体表示进行计算,得到用户对课程概念的评分矩阵,根据此评分矩阵,对用户进行课程推荐。
进一步的,所述对知识概念实体提取语义特征Sk,包括:
步骤2.1、通过词嵌入的方式获取知识概念实体的语义信息,对于每个具体的知识概念ki都生成一个特征向量其中dk为每个特征向量的维度;
步骤2.2、将所有知识概念对应的特征向量合并为一个语义特征矩阵其中ck为知识概念实体的数量。
进一步的,所述获取知识概念与其他实体的关联矩阵,并通过预设的元路径集合进行重构,获取对应的元路径邻接矩阵集合/>包括:
步骤3.1、构建知识概念与其他实体的关联矩阵集合,对于每个关联矩阵,若具体的一个知识概念与具体的一个其他实体存在交互关系,则在所述关联矩阵中设置对应的元素为1,否则设置为0;
步骤3.2、在实体关系的基础上设计所需要的元路径,并得到一个元路径集合再将步骤3.1中得到的关联矩阵通过预设的元路径按照以下公式进行重构:
其中I为单位矩阵,ck为知识概念实体的数量,为知识概念与其他实体ei的关联矩阵,/>为知识概念与其他实体ei的关联矩阵的转置,得到知识概念实体在每条元路径下的邻接矩阵集合/>row表示矩阵的行数。
进一步的,所述获取用户与其他实体的关联矩阵,并通过预设的元路径集合进行重构,获取对应的元路径邻接矩阵集合/>包括:
步骤4.1、构建用户实体与其他实体的关联矩阵集合,对于每个关联矩阵,若具体的一个用户与具体的一个其他实体存在交互关系,则在所述关联矩阵中设置对应的元素为1,否则设置为0;
步骤4.2、在实体关系的基础上设计所需要的元路径,并得到一个元路径集合再将步骤4.1中得到的关联矩阵通过预设的元路径按照以下公式进行重构:
其中I为单位矩阵,cu为用户实体的数量,为用户与其他实体ei的关联矩阵,/>为用户与其他实体ei的关联矩阵的转置,得到用户实体在每条元路径下的邻接矩阵集合row表示矩阵的行数。
进一步的,所述将用户实体的元路径邻接矩阵集合输入到关联关系特征提取模块中,得到用户实体的关联关系特征Xu,包括:
步骤5.1、如果用户实体ui,uj在邻接矩阵中对应的关联关系值大于所设定的阈值,则将ui,uj的关联关系信息(ui,r,uj)写入关联关系三元组G={(ui,r,uj)}中,其中r为ui,uj对应的元路径;
步骤5.2、构建一个图Graph(V,R,E,X,Z),其中V为实体的节点集合,R为实体的关系集合,E为增广后的关联关系三元组集合,X为节点的初始化值,Z为初始化的关系特征,其中,由G构建V,R,E。对于每条关联关系(ui,r,uj)∈G,都有ui,uj∈V;R由G中的关联关系得到,R=R'∪R'inv∪{Se},,其中R'={r|(ui,r,uj)∈G},R′inv={r-1|(ui,r,uj)∈G},Se表示自环关,E由G增广生成并得到最终的关联关系三元组集合:
E={(ui,r,uj)|(ui,r,uj)∈G}∪{(uj,r-1,ui)|(ui,r,uj)∈G}∪{(u,Se,u)|u∈V)};
步骤5.3、构建关联关系特征提取模块:
其中N(uj)是uj的连接的直接邻居集合,表示一个合成算子,λ(r)表示关系类型,/>为节点ui初始化的实体特征,zr为初始化的关系特征,/>为节点uj在第一层生成的关联关系表示,/>为第一层生成的关系表示,Xu为最终生成的关联关系特征,特别的Wλ(r)是特定的关系型参数;
步骤5.4、最后通过步骤5.3中构建的关联关系生成公式的计算,输出得到用户实体的关联关系特征矩阵其中cu为用户实体的数量,du是特征矩阵的维度。
进一步的,所述将知识概念实体的语义特征Sk以及元路径邻接矩阵集合输入至实体表示模块中,得到知识概念在各条元路径下的实体表示集合/>包括:
步骤6.1、构建实体表示模块,通过三层的生成计算得到最终的实体表示,具体结构如下:
其中X为实体的节点特征矩阵,为元路径/>下的邻接矩阵,/>分别为三层的实体输出,/>分别代表三层实体表示模块的三组可训练的参数矩阵,ReLU()为激活函数,最终得到的该条元路径上的实体表示就是第三层的输出,即/>
步骤6.2、将知识概念的语义特征Sk作为节点特征矩阵,与元路径邻接矩阵集合输入至实体表示模块中,得到不同原路径下知识概念实体的表示集合/>
进一步的,所述将用户实体的关联关系特征Xu以及元路径邻接矩阵集合输入至实体表示模块中,得到用户在各条元路径下的实体表示集合/>包括:
步骤7.1、构建实体表示模块,通过三层的生成计算得到最终的实体表示,具体结构如下:
其中X为实体的节点特征矩阵,为元路径/>下的邻接矩阵,/>分别为三层的实体输出,/>分别代表三层实体表示模块的三组可训练的参数矩阵,ReLU()为激活函数,最终得到的该条元路径上的实体表示就是第三层的输出,即/>
步骤7.2、将用户的关联关系特征Xu作为节点特征矩阵,与元路径邻接矩阵集合输入至实体表示模块中,得到用户实体在各条元路径下的实体表示集合/>
进一步的,所述将知识概念实体在各条元路径下的实体表示集合进行加权合并,得到知识概念的最终实体表示ek,包括:
步骤8.1、设计加权合并的权重生成函数如下:
其中,为元路径/>的第二个关注对象,v,w1,w2,b为可训练的参数,p为一个属于(0,1)的比例参数,soft max(),tanh()为两个激活函数,/>为元路径mpi的合并权重;
步骤8.2、遍历知识概念实体的所有元路径得到每条原路径的合并权重;
步骤8.3、遍历知识概念实体的所有元路径将所有实体加权合并,得到最终的实体表示ek。
进一步的,所述将用户实体在各条元路径下的实体表示集合进行加权合并,得到用户的最终实体表示eu,包括:
步骤9.1、设计用户实体的权重生成函数:
其中,为元路径/>的第二个关注对象,v,w1,w2,b为可训练的参数,p为一个属于(0,1)的比例参数,soft max(),tanh()为两个激活函数,/>为元路径mpi的合并权重;
步骤9.2、遍历用户的所有元路径得到每条原路径的合并权重;
步骤9.3、遍历用户的所有元路径将所有实体加权合并,得到最终的实体表示eu。
进一步的,所述通过对知识概念与用户的最终实体表示进行计算,得到用户对知识概念的评分矩阵,包括:
步骤10.1、设计最终的目标优化函数如下所示:
其中ru,k为目标评分矩阵,为通过矩阵分解所得到的评分矩阵,cu,ck分别为用户实体与知识概念实体的数量,tu,tk为矩阵分解中为确保实体在同一纬度空间的训练参数,λ为正则化项参数,最终通过梯度下降算法优化最终目标的函数的局部最小值;
步骤10.2、通过矩阵分解的方法得到用户点击知识概念的评分矩阵如下:
其中xu,yk是在矩阵分解中随机初始化的用户实体与知识概念实体的潜在因子,βk,βu为调整参数;
步骤10.3、得到最终的用户对课程知识概念的评分矩阵,并根据评分大小向用户推荐课程。
本申请提出的一种基于关联关系分析的课程推荐方法,不同于传统的图卷积神经网络只能捕捉单一实体关系之间的信息,该方法通过元路径的方式获取异构信息网络上丰富信息。同时考虑到不同元路径之间的关系相对独立,通过关联关系提取模块来捕捉关联关系之间的信息,并作为节点的特征信息输入到实体表示模块中,使得获得实体的表示的特征信息更加完整全面。接着通过一种关联多个对象的注意力机制将不同元路径下的实体进行合并,得到包含信息丰富的最终实体表示。最后通过所得到的实体表示进行矩阵分解,得到用户对于知识概念较为准确的评分矩阵,并进行知识概念推荐。最后通过矩阵分解得到最后的评分矩阵,根据评分大小向用户推荐课程,提高了推荐的准确性。
附图说明
图1是本申请基于关联关系分析的在线课程推荐方法流程图;
图2是本申请关联关系特征提取模块示意图;
图3是本申请实体表示模块示意图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅用以解释本申请,并不用于限定本申请。
在一个实施例中,如图1所示,一种基于关联关系分析的在线课程推荐方法,包括:
步骤1、根据在线课程平台的用户应用历史记录获取实体,所述实体包括课程、用户、知识概念、教师、视频。
本申请实体包括但不限于课程、用户、知识概念、教师、视频。
步骤2、对知识概念实体提取语义特征Sk。
具体的,所述对知识概念实体提取语义特征Sk,包括:
步骤2.1、通过词嵌入的方式获取知识概念实体的语义信息,对于每个具体的知识概念ki都生成一个特征向量其中dk为每个特征向量的维度。
本申请基于在线平台的数据集,对于知识概念中能够提取丰富的语义信息,如“JAVA”,“快速排序”,“平衡树”等这些本身就具有语义信息的知识概念关键词,将其转换为知识概念的语义特征,并作为实体表示模块的节点特征矩阵输入。
步骤2.2、将所有知识概念对应的特征向量合并为一个语义特征矩阵其中ck为知识概念实体的数量。
步骤3、获取知识概念与其他实体的关联矩阵,并通过预设的元路径集合进行重构,获取对应的元路径邻接矩阵集合n是知识概念实体与其他实体的元路径的个数。
具体的,包括:
步骤3.1、构建知识概念与其他实体的关联矩阵集合,对于每个关联矩阵,若具体的一个知识概念与具体的一个其他实体存在交互关系,则在所述关联矩阵中设置对应的元素为1,否则设置为0。
例如,本申请获取在线教学平台上的数据{c(course),u(user),v(video),t(teacher),k(knowledge concept)},并通过不同实体间的交互信息,生成一组关联矩阵集合其中/>为知识概念与课程的关系,/>为用户与知识概念的关系。
对于知识概念与课程的关系,若课程cj包含知识概念ki,则在关系矩阵中设置对应的元素li,j=1,并由此构建知识概念与课程的关联矩阵。
对于知识概念与用户的关系,若用户ui点击过课程知识概念kj,则在关系矩阵中设置li,j=1,并由此构建知识概念与用户的关联矩阵。
步骤3.2、在实体关系的基础上设计所需要的元路径,并得到一个元路径集合再将步骤3.1中得到的关联矩阵通过预设的元路径按照以下公式进行重构:
其中I为单位矩阵,ck为知识概念实体的数量,为知识概念与其他实体ei的关联矩阵,/>为知识概念与其他实体ei的关联矩阵的转置,得到知识概念实体在每条元路径下的邻接矩阵集合/>row表示矩阵的行数。
本申请在知识概念实体上构建多条元路径,用于表示知识概念实体与不同的实体对象在某种关系下可能存在的各种联系信息。
如用户与知识概念的元路径k→u→-1k,记为kuk,该条元路径的语义信息为:两个不同的知识概念被同一个用户点击过。
本申请基于所涉及的元路径集合,遍历知识概念实体所有类似的关联信息,最终得到知识概念实体的所有元路径的邻接矩阵集合
步骤4、获取用户实体与其他实体的关联矩阵,并通过预设的元路径集合进行重构,获取对应的元路径邻接矩阵集合m是用户实体与其他实体的元路径的个数;
具体的,包括:
步骤4.1、构建用户实体与其他实体的关联矩阵集合,对于每个关联矩阵,若具体的一个用户与具体的一个其他实体存在交互关系,则在所述关联矩阵中设置对应的元素li,j=1,否则设置为0。
生成一组关联矩阵集合其中/>为用户与课程的关系,/>为用户与课程知识概念的关系,/>为用户与视频的关系,/>为用户与教师之间的关系。
对于用户与课程的关系,若用户ui学习过课程cj,则在关系矩阵中设置li,j=1,并由此构建用户与课程的关系矩阵。
对于用户与课程知识概念的关系,若用户ui点击过课程知识概念kj,则在关系矩阵中设置li,j=1,并由此构建用户与知识概念的关系矩阵。
对于用户与视频的关系,若用户ui学观看过视频vj,则在关系矩阵中设置li,j=1,并由此构建用户与视频的关系矩阵。
对于用户与课程的关系,若用户ui上过教师tj教的课,则在关系矩阵中设置li,j=1,并由此构建用户与课程的关系矩阵。
步骤4.2、在实体关系的基础上设计所需要的元路径,并得到一个元路径集合再将步骤4.1中得到的关联矩阵通过预设的元路径按照以下公式进行重构:
其中I为单位矩阵,cu为用户实体的数量,为用户与其他实体ei的关联矩阵,/>为用户与其他实体ei的关联矩阵的转置,得到用户实体在每条元路径下的邻接矩阵集合row表示矩阵的行数。
本申请在用户实体上构建多条元路径,用于表示用户实体与不同的实体对象在某种关系下可能存在的各种联系信息。
如用户与课程概念的元路径u→k→-1u,记为uku,该条元路径的语义信息为:两个不同的用户接触过同一种课程知识概念。
如用户与视频的元路径u→v→-1u,记为uvu,该条元路径的语义信息为:两个不同的用户观看过同一个在线教学视频。
最终得到用户实体的所有元路径的邻接矩阵集合
本申请为用户实体和课程知识概念实体设计了不同的元路径类型如表1所示,在其他实施例中,元路径可以自由设计和组合。
表1-元路径语义信息说明
步骤5、将用户实体的元路径邻接矩阵集合输入到关联关系特征提取模块中,得到用户实体的关联关系特征Xu。
具体的,包括:
步骤5.1、如果用户实体ui,uj在邻接矩阵中对应的关联关系值大于所设定的阈值,则将ui,uj的关联关系信息(ui,r,uj)写入关联关系三元组G={(ui,r,uj)}中,其中r为ui,uj对应的元路径。
步骤5.2、构建一个图Graph(V,R,E,X,Z),其中V为实体的节点集合,R为实体的关系集合,E为增广后的关联关系三元组集合,X为节点的初始化值,Z为初始化的关系特征,其中,由G构建V,R,E。对于每条关联关系(ui,r,uj)∈G,都有ui,uj∈V;R由G中的关联关系得到,R=R'∪R'inv∪{Se},,其中R'={r|(ui,r,uj)∈G},R′inv={r-1|(ui,r,uj)∈G},Se表示自环关,E由G增广生成并得到最终的关联关系三元组集合:
E={(ui,r,uj)|(ui,r,uj)∈G}∪{(uj,r-1,ui)|(ui,r,uj)∈G}∪{(u,Se,u)|u∈V)}。
步骤5.3、构建关联关系特征提取模块:
其中N(uj)是uj的连接的直接邻居集合,表示一个合成算子,λ(r)表示关系类型,/>为节点ui初始化的实体特征,zr为初始化的关系特征,/>为节点uj在第一层生成的关联关系表示,/>为第一层生成的关系表示,Xu为最终生成的关联关系特征,特别的Wλ(r)是特定的关系型参数。
步骤5.4、最后通过步骤5.3中构建的关联关系生成公式的计算,输出得到用户实体的关联关系特征矩阵其中cu为用户实体的数量,du是特征矩阵的维度。
本申请基于用户得到的元路径邻接集合构建关联关系的三元组G。如果用户ui与用户uj上过同一门课程的关联程度达到阈值,则将其关联关系的三元组(ui,ucu,uj)写入G之中;如果用户ui与用户uj点击过的同一门课程知识概念的关联程度达到阈值,则将其关联关系的三元组(ui,uku,uj)写入G之中。
如图2所示,本申请将构建好的关联关系三元组进行增广,并构建多关系图Graph(V,R,E,X,Z),输入到关联关系特征提取模块中,并通过关联关系生成层输出用户的关联关系特征。
步骤6、将知识概念实体的语义特征Sk以及元路径邻接矩阵集合输入至实体表示模块中,得到知识概念实体在各条元路径下的实体表示集合/>
具体的,包括:
步骤6.1、构建实体表示模块,通过三层的生成计算得到最终的实体表示,具体结构如下:
/>
其中X为实体的节点特征矩阵,为元路径/>下的邻接矩阵,/>分别为三层的实体输出,/>分别代表三层实体表示模块的三组可训练的参数矩阵,ReLU()为激活函数,最终得到的该条元路径上的实体表示就是第三层的输出,即/>
步骤6.2、将知识概念的语义特征Sk作为节点特征矩阵,与元路径邻接矩阵集合输入至实体表示模块中,得到不同原路径下知识概念实体的表示集合
步骤7、将用户实体的关联关系特征Xu以及元路径邻接矩阵集合输入至实体表示模块中,得到用户实体在各条元路径下的实体表示集合/>
具体的,包括:
构建实体表示模块,通过三层的生成计算得到最终的实体表示,具体结构如下:
其中X为实体的节点特征矩阵,为元路径/>下的邻接矩阵,/>分别为三层的实体输出,/>分别代表三层实体表示模块的三组可训练的参数矩阵,ReLU()为激活函数,最终得到的该条元路径上的实体表示就是第三层的输出,即/>
步骤7.2、将用户的关联关系特征Xu作为节点特征矩阵,与元路径邻接矩阵集合输入至实体表示模块中,得到不同原路径下知识概念实体的表示集合/>
本申请如图3所示对于用户实体与课程知识概念实体通过实体表示模块训练计算,并通过ReLU()激活函数激活后输出。
本申请中对于用户实体,将元路径得到的邻接矩阵集合和关联关系特征作为实体表示模块的输入;对于知识概念实体,将元路径得到的邻接矩阵集合和知识概念实体的语义特征作为实体表示模块的输入。
步骤8、将知识概念实体在各条元路径下的实体表示集合进行加权合并,得到知识概念的最终实体表示ek。
具体的,包括:
步骤8.1、设计加权合并的权重生成函数如下:
/>
其中,为元路径/>的第二个关注对象,v,w1,w2,b为可训练的参数,p为一个属于(0,1)的比例参数,soft max(),tanh()为两个激活函数,/>为元路径mpi的合并权重;
步骤8.2、遍历知识概念实体的所有元路径得到每条原路径的合并权重;
步骤8.3、遍历知识概念实体的所有元路径将所有实体加权合并,得到最终的实体表示ek。
步骤9、将用户实体在各条元路径下的实体表示集合进行加权合并,得到用户的最终实体表示eu。
具体的,包括:
步骤9.1、设计用户实体的权重生成函数:
其中,为元路径/>的第二个关注对象,v,w1,w2,b为可训练的参数,p为一个属于(0,1)的比例参数,soft max(),tanh()为两个激活函数,/>为元路径mpi的合并权重;
步骤9.2、遍历用户的所有元路径得到每条原路径的合并权重;
步骤9.3、遍历用户的所有元路径将所有实体加权合并,得到最终的实体表示eu。
本申请的所用到的实体表示融合的权重生成函数需要生成第二个关注对象,由此生成具体的加权合并权重。其中第二个关注对象代表着除当前元路径外所有元路径实体特征矩阵的均值,最终通过权重生成函数获得每条元路径的合并权重,再通过加权合并得到用户和知识概念最终的实体表示。
步骤10、通过对课程概念与用户的最终实体表示进行计算,得到用户对课程概念的评分矩阵。
具体的,包括:
步骤10.1、设计最终的目标优化函数如下所示:
其中ru,k为目标评分矩阵,为通过矩阵分解所得到的评分矩阵,cu,ck分别为用户实体与知识概念实体的数量,tu,tk为矩阵分解中为确保实体在同一纬度空间的训练参数,λ为正则化项参数,最终通过梯度下降算法优化最终目标的函数的局部最小值;
步骤10.2、通过矩阵分解的方法得到用户点击知识概念的评分矩阵如下:
其中xu,yk是在矩阵分解中随机初始化的用户实体与知识概念实体的潜在因子,βk,βu为调整参数;
步骤10.3、得到最终的用户对课程知识概念的评分矩阵,并根据评分大小向用户推荐课程。
本申请通过矩阵分解,生成用户实体与知识概念的低维潜在因子,加之最后得到的用户与知识概念的实体,最终得到了用户对于知识概念的评分矩阵,并根据评分大小向用户推荐课程,提高了推荐的准确性。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (8)
1.一种基于关联关系分析的课程推荐方法,其特征在于,所述基于关联关系分析的课程推荐方法,包括:
步骤1、根据在线课程平台的用户应用历史记录获取实体,所述实体包括课程、用户、知识概念、教师、视频;
步骤2、对知识概念实体提取语义特征Sk;
步骤3、获取知识概念与其他实体的关联矩阵,并通过预设的元路径集合进行重构,获取对应的元路径邻接矩阵集合/>n是知识概念实体与其他实体的元路径的个数;
步骤4、获取用户实体与其他实体的关联矩阵,并通过预设的元路径集合进行重构,获取对应的元路径邻接矩阵集合/>m是用户实体与其他实体的元路径的个数;
步骤5、将用户实体的元路径邻接矩阵集合输入到关联关系特征提取模块中,得到用户实体的关联关系特征Xu;
步骤6、将知识概念实体的语义特征Sk以及元路径邻接矩阵集合输入至实体表示模块中,得到知识概念实体在各条元路径下的实体表示集合/>
步骤7、将用户实体的关联关系特征Xu以及元路径邻接矩阵集合输入至实体表示模块中,得到用户实体在各条元路径下的实体表示集合/>
步骤8、将知识概念实体在各条元路径下的实体表示集合进行加权合并,得到知识概念的最终实体表示ek;
步骤9、将用户实体在各条元路径下的实体表示集合进行加权合并,得到用户的最终实体表示eu;
步骤10、通过对知识概念与用户的最终实体表示进行计算,得到用户对课程概念的评分矩阵,根据此评分矩阵,对用户进行课程推荐;
其中,所述获取用户与其他实体的关联矩阵,并通过预设的元路径集合进行重构,获取对应的元路径邻接矩阵集合/>包括:
步骤4.1、构建用户实体与其他实体的关联矩阵集合,对于每个关联矩阵,若具体的一个用户与具体的一个其他实体存在交互关系,则在所述关联矩阵中设置对应的元素为1,否则设置为0;
步骤4.2、在实体关系的基础上设计所需要的元路径,并得到一个元路径集合再将步骤4.1中得到的关联矩阵通过预设的元路径按照以下公式进行重构:
其中I为单位矩阵,cu为用户实体的数量,为用户与其他实体ei的关联矩阵,/>为用户与其他实体ei的关联矩阵的转置,得到用户实体在每条元路径下的邻接矩阵集合row表示矩阵的行数;
所述将用户实体的元路径邻接矩阵集合输入到关联关系特征提取模块中,得到用户实体的关联关系特征Xu,包括:
步骤5.1、如果用户实体ui,uj在邻接矩阵中对应的关联关系值大于所设定的阈值,则将ui,uj的关联关系信息(ui,r,uj)写入关联关系三元组G={(ui,r,uj)}中,其中r为ui,uj对应的元路径;
步骤5.2、构建一个图Graph(V,R,E,X,Z),其中V为实体的节点集合,R为实体的关系集合,E为增广后的关联关系三元组集合,X为节点的初始化值,Z为初始化的关系特征,其中,由G构建V,R,E,对于每条关联关系(ui,r,uj)∈G,都有ui,uj∈V;R由G中的关联关系得到,R=R'∪R'inv∪{Se},其中R'={r|(ui,r,uj)∈G},Ri'nv={r-1|(ui,r,uj)∈G},Se表示自环关,E由G增广生成并得到最终的关联关系三元组集合:
E={(ui,r,uj)|(ui,r,uj)∈G}∪{(uj,r-1,ui)|(ui,r,uj)∈G}∪{(u,Se,u)|u∈V)};
步骤5.3、构建关联关系特征提取模块:
其中N(uj)是uj的连接的直接邻居集合,表示一个合成算子,λ(r)表示关系类型,/>为节点ui初始化的实体特征,zr为初始化的关系特征,/>为节点uj在第一层生成的关联关系表示,/>为第一层生成的关系表示,Xu为最终生成的关联关系特征,特别的Wλ(r)是特定的关系型参数;
步骤5.4、最后通过步骤5.3中构建的关联关系生成公式的计算,输出得到用户实体的关联关系特征矩阵其中cu为用户实体的数量,du是特征矩阵的维度。
2.根据权利要求1所述的基于关联关系分析的课程推荐方法,其特征在于,所述对知识概念实体提取语义特征Sk,包括:
步骤2.1、通过词嵌入的方式获取知识概念实体的语义信息,对于每个具体的知识概念ki都生成一个特征向量其中dk为每个特征向量的维度;
步骤2.2、将所有知识概念对应的特征向量合并为一个语义特征矩阵其中ck为知识概念实体的数量。
3.根据权利要求1所述的基于关联关系分析的课程推荐方法,其特征在于,所述获取知识概念与其他实体的关联矩阵,并通过预设的元路径集合进行重构,获取对应的元路径邻接矩阵集合/>包括:
步骤3.1、构建知识概念与其他实体的关联矩阵集合,对于每个关联矩阵,若具体的一个知识概念与具体的一个其他实体存在交互关系,则在所述关联矩阵中设置对应的元素为1,否则设置为0;
步骤3.2、在实体关系的基础上设计所需要的元路径,并得到一个元路径集合再将步骤3.1中得到的关联矩阵通过预设的元路径按照以下公式进行重构:
其中I为单位矩阵,ck为知识概念实体的数量,为知识概念与其他实体ei的关联矩阵,为知识概念与其他实体ei的关联矩阵的转置,得到知识概念实体在每条元路径下的邻接矩阵集合/>row表示矩阵的行数。
4.根据权利要求1所述的基于关联关系分析的课程推荐方法,其特征在于,所述将知识概念实体的语义特征Sk以及元路径邻接矩阵集合输入至实体表示模块中,得到知识概念在各条元路径下的实体表示集合/>包括:
步骤6.1、构建实体表示模块,通过三层的生成计算得到最终的实体表示,具体结构如下:
其中X为实体的节点特征矩阵,为元路径/>下的邻接矩阵,/>分别为三层的实体输出,/>分别代表三层实体表示模块的三组可训练的参数矩阵,ReLU()为激活函数,最终得到的该条元路径上的实体表示就是第三层的输出,即/>
步骤6.2、将知识概念的语义特征Sk作为节点特征矩阵,与元路径邻接矩阵集合输入至实体表示模块中,得到不同原路径下知识概念实体的表示集合/>
5.根据权利要求1所述的基于关联关系分析的课程推荐方法,其特征在于,所述将用户实体的关联关系特征Xu以及元路径邻接矩阵集合输入至实体表示模块中,得到用户在各条元路径下的实体表示集合/>包括:
步骤7.1、构建实体表示模块,通过三层的生成计算得到最终的实体表示,具体结构如下:
其中X为实体的节点特征矩阵,为元路径/>下的邻接矩阵,/>分别为三层的实体输出,/>分别代表三层实体表示模块的三组可训练的参数矩阵,ReLU()为激活函数,最终得到的该条元路径上的实体表示就是第三层的输出,即/>
步骤7.2、将用户的关联关系特征Xu作为节点特征矩阵,与元路径邻接矩阵集合输入至实体表示模块中,得到用户实体在各条元路径下的实体表示集合/>
6.根据权利要求1所述的基于关联关系分析的课程推荐方法,其特征在于,所述将知识概念实体在各条元路径下的实体表示集合进行加权合并,得到知识概念的最终实体表示ek,包括:
步骤8.1、设计加权合并的权重生成函数如下:
其中,为元路径/>的第二个关注对象,v,w1,w2,b为可训练的参数,p为一个属于(0,1)的比例参数,soft max(),tanh()为两个激活函数,/>为元路径mpi的合并权重,为元路径/>上知识概念实体的表示,/>为元路径/>上知识概念实体的表示;
步骤8.2、遍历知识概念实体的所有元路径得到每条原路径的合并权重;
步骤8.3、遍历知识概念实体的所有元路径将所有实体加权合并,得到最终的实体表示ek。
7.根据权利要求1所述的基于关联关系分析的课程推荐方法,其特征在于,所述将用户实体在各条元路径下的实体表示集合进行加权合并,得到用户的最终实体表示eu,包括:
步骤9.1、设计用户实体的权重生成函数:
其中,为元路径/>的第二个关注对象,v,w1,w2,b为可训练的参数,p为一个属于(0,1)的比例参数,soft max(),tanh()为两个激活函数,/>为元路径mpi的合并权重,/>为元路径/>上用户实体的表示,/>为元路径/>上用户实体的表示;
步骤9.2、遍历用户的所有元路径得到每条原路径的合并权重;
步骤9.3、遍历用户的所有元路径将所有实体加权合并,得到最终的实体表示eu。
8.根据权利要求1所述的基于关联关系分析的课程推荐方法,其特征在于,所述通过对知识概念与用户的最终实体表示进行计算,得到用户对知识概念的评分矩阵,包括:
步骤10.1、设计最终的目标优化函数如下所示:
其中ru,k为目标评分矩阵,为通过矩阵分解所得到的评分矩阵,cu,ck分别为用户实体与知识概念实体的数量,tu,tk为矩阵分解中为确保实体在同一纬度空间的训练参数,λ为正则化项参数,最终通过梯度下降算法优化最终目标的函数的局部最小值;
步骤10.2、通过矩阵分解的方法得到用户点击知识概念的评分矩阵如下:
其中xu,yk是在矩阵分解中随机初始化的用户实体与知识概念实体的潜在因子,βk,βu为调整参数;
步骤10.3、得到最终的用户对课程知识概念的评分矩阵,并根据评分大小向用户推荐课程。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110301297.5A CN113065342B (zh) | 2021-03-22 | 2021-03-22 | 一种基于关联关系分析的课程推荐方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110301297.5A CN113065342B (zh) | 2021-03-22 | 2021-03-22 | 一种基于关联关系分析的课程推荐方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113065342A CN113065342A (zh) | 2021-07-02 |
CN113065342B true CN113065342B (zh) | 2024-03-22 |
Family
ID=76562889
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110301297.5A Active CN113065342B (zh) | 2021-03-22 | 2021-03-22 | 一种基于关联关系分析的课程推荐方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113065342B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113743645B (zh) * | 2021-07-16 | 2024-02-02 | 广东财经大学 | 基于路径因素融合的在线教育课程推荐方法 |
CN118037003B (zh) * | 2024-04-10 | 2024-06-28 | 禾辰纵横信息技术有限公司 | 一种在线学习课程优化排序方法和系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106023015A (zh) * | 2016-05-18 | 2016-10-12 | 腾讯科技(深圳)有限公司 | 课程学习路径推荐方法及装置 |
CN109376269A (zh) * | 2018-12-05 | 2019-02-22 | 西安交通大学 | 一种基于图谱关联的跨课程视频子图推荐方法 |
CN109977264A (zh) * | 2019-02-19 | 2019-07-05 | 武汉斗鱼鱼乐网络科技有限公司 | 一种基于元路径相似度的用户推荐方法、系统、服务器及存储介质 |
EP3761289A1 (en) * | 2019-07-03 | 2021-01-06 | Obrizum Group Ltd. | Educational and content recommendation management system |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150170536A1 (en) * | 2013-12-18 | 2015-06-18 | William Marsh Rice University | Time-Varying Learning and Content Analytics Via Sparse Factor Analysis |
-
2021
- 2021-03-22 CN CN202110301297.5A patent/CN113065342B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106023015A (zh) * | 2016-05-18 | 2016-10-12 | 腾讯科技(深圳)有限公司 | 课程学习路径推荐方法及装置 |
CN109376269A (zh) * | 2018-12-05 | 2019-02-22 | 西安交通大学 | 一种基于图谱关联的跨课程视频子图推荐方法 |
CN109977264A (zh) * | 2019-02-19 | 2019-07-05 | 武汉斗鱼鱼乐网络科技有限公司 | 一种基于元路径相似度的用户推荐方法、系统、服务器及存储介质 |
EP3761289A1 (en) * | 2019-07-03 | 2021-01-06 | Obrizum Group Ltd. | Educational and content recommendation management system |
Non-Patent Citations (4)
Title |
---|
Attentional Graph Convolutional Networks for Knowledge Concept Recommendation in MOOCs in a Heterogeneous View;Jibing Gong等;SIGIR ’20;全文 * |
Social Recommendation Based on Implicit Friends Discovering via Meta-Path;Song yuqi等;IEEE 30th International Conference on Tools with Artificial Intelligence;全文 * |
基于类别偏好和表示学习的推荐算法的研究;曹淑燕;中国硕士学位论文全文数据库(第02期);全文 * |
融合多元异构信息的矩阵分解推荐算法;王根生等;小型微型计算机系统;第41卷(第07期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN113065342A (zh) | 2021-07-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Wang et al. | Urban2vec: Incorporating street view imagery and pois for multi-modal urban neighborhood embedding | |
Arabadzhyan et al. | Measuring destination image: a novel approach based on visual data mining. A methodological proposal and an application to European islands | |
Zhu et al. | Building a large-scale multimodal knowledge base system for answering visual queries | |
CN113065342B (zh) | 一种基于关联关系分析的课程推荐方法 | |
CN113806630B (zh) | 基于注意力的多视角特征融合跨域推荐方法及装置 | |
CN111858972B (zh) | 一种基于家庭知识图谱的电影推荐方法 | |
CN108806355B (zh) | 一种书画艺术互动教育系统 | |
CN110490686A (zh) | 一种基于时间感知的商品评分模型构建、推荐方法及系统 | |
CN111737427A (zh) | 融合论坛互动行为与用户阅读偏好的慕课论坛帖推荐方法 | |
CN113095948A (zh) | 一种基于图神经网络的多源异构网络用户对齐方法 | |
CN113239159A (zh) | 基于关系推理网络的视频和文本的跨模态检索方法 | |
CN112231579B (zh) | 基于隐式社群发现的社会化视频推荐系统与方法 | |
Li et al. | Learning from weakly-labeled web videos via exploring sub-concepts | |
CN111949894B (zh) | 一种基于多空间交互的协同过滤个性化推荐方法 | |
Yu et al. | SCIDA: Self-correction integrated domain adaptation from single-to multi-label aerial images | |
Chen et al. | Exploiting aesthetic features in visual contents for movie recommendation | |
CN116955846A (zh) | 融合主题特征和交叉注意力的级联信息传播预测方法 | |
CN116187852A (zh) | 一种基于社区关联和行为特征学习的在线课程推荐方法 | |
Sun et al. | Urban region function mining service based on social media text analysis | |
CN114357306A (zh) | 一种基于元关系的课程推荐方法 | |
Fang et al. | Multi-modal sarcasm detection based on Multi-Channel Enhanced Fusion model | |
CN114357290A (zh) | 一种多视角社交媒体用户立场检测方法与装置 | |
Bai et al. | A WeChat official account reading quantity prediction model based on text and image feature extraction | |
Niu et al. | Tourism event knowledge graph for attractions recommendation | |
Ghozia et al. | Intelligence Is beyond Learning: A Context‐Aware Artificial Intelligent System for Video Understanding |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |