CN112749805B - 一种基于多种实体关系的在线课程推荐方法 - Google Patents
一种基于多种实体关系的在线课程推荐方法 Download PDFInfo
- Publication number
- CN112749805B CN112749805B CN202110053692.6A CN202110053692A CN112749805B CN 112749805 B CN112749805 B CN 112749805B CN 202110053692 A CN202110053692 A CN 202110053692A CN 112749805 B CN112749805 B CN 112749805B
- Authority
- CN
- China
- Prior art keywords
- entity
- user
- course
- matrix
- graph
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 51
- 239000011159 matrix material Substances 0.000 claims abstract description 113
- 238000007781 pre-processing Methods 0.000 claims abstract description 5
- 238000012163 sequencing technique Methods 0.000 claims abstract description 4
- 230000006870 function Effects 0.000 claims description 48
- 238000013528 artificial neural network Methods 0.000 claims description 23
- 230000004927 fusion Effects 0.000 claims description 14
- 230000009467 reduction Effects 0.000 claims description 10
- 238000010586 diagram Methods 0.000 claims description 9
- 230000008569 process Effects 0.000 claims description 9
- 238000000354 decomposition reaction Methods 0.000 claims description 8
- 238000005457 optimization Methods 0.000 claims description 6
- 230000004913 activation Effects 0.000 claims description 4
- 238000005096 rolling process Methods 0.000 claims description 3
- 239000013598 vector Substances 0.000 description 6
- 238000003475 lamination Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/02—Knowledge representation; Symbolic representation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/20—Education
- G06Q50/205—Education administration or guidance
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- Biomedical Technology (AREA)
- Educational Technology (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- Educational Administration (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- Databases & Information Systems (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- General Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Economics (AREA)
- Animal Behavior & Ethology (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种基于多种实体关系的在线课程推荐方法,获取在线课程平台中各实体的数据,从各实体的数据中提取各实体关系,采用标准化来预处理各实体关系得到各实体关系权重,从各实体的数据中获得用户实体和课程概念实体的内容特征,得到不同元路径下的实体表示,最后结合用户实体表示和课程概念实体表示,最终输出用户对每个课程的评分矩阵,然后根据评分矩阵,从大到小排序,向用户推荐课程。本发明有效利用了不同实体关系之间丰富的信息,降低了数据稀疏性的问题,提高了预测的准确率。
Description
技术领域
本发明属于教育课程推荐领域,尤其涉及了一种基于不同实体关系的 在线课程推荐方法。
背景技术
自2008年以来,大规模在线开放课程(Massive Open Online Courses, 简称MOOCs)在学生中大受欢迎,并通过面向全球开放在线资源提供新 的教育机会,从而彻底改变了整个教育领域。《纽约时报》杂志宣布2012 年为“MOOC年”,原因是MOOC从教育理念转变为全球教育变革。数百 所大学在不同的平台上提供数千门课程,如流行的Cousera、edX、Udacity、FutureLearn和XeutangX;还有以西班牙语提供MOOCs的MirindaX等。 特别地,在疫情严重的2020年,在线课程教育在教育领域起到关键作用, 几乎所有的中国高校以及大部分海外高校都采用了线上教育的方式,因此 可以预测在接下来几年时间,MOOCs对各个领域的学习将具有重要的意 义。
虽然MOOCs的规模不断增大,学生人数在不断增加,但MOOCs仍 然存在一些困境。一、MOOCs上的课程数量和种类繁多,学生不能够很 好的选择他感兴趣课程。二、MOOCs的课程视频中,往往存在大量的需 要先修课程的知识概念,学生听不懂,却又不知道学习哪些先修课程。三、 MOOCs上同一种类的课程存在内容侧重点不同的问题,比如高等数学, 有些课程侧重几何方面,有些课程侧重微积分方面。这对一个学生来选择 是比较困难的。
这些种种的问题,无法吸引学生在平台上持续高效的学习,平台上整 体的课程完成率低于5%,因此MOOCs需要更好的理解和捕捉学生的兴 趣,推荐更合适学生的课程,而课程推荐的研究也显得尤为重要。
公开号为CN111639485A的专利申请记载了基于文本相似性的课程推 荐装置、计算机装置及存储介质。该方法根据内容特征构建课程内容语料 库,分别调用TF-IDF模型,主题模型,word2vec模型识别语料库得到一、 二、三向量,确定三个向量对应的最优权值,根据这三个最优权值构建课 程的最终向量,根据最终向量计算任意两个课程的相似度由此得到相似度 矩阵。最后根据历史观看课程,调用相似度矩阵,向用户推荐课程列表。
然而现技术无法克服数据的稀疏性问题,只用了单一的实体关系,忽 略了不同实体关系之间的丰富信息,存在推荐准确性不够等问题。
发明内容
本申请的目的是提出一种基于多种实体关系的在线课程推荐方法,用 于克服数据的稀疏性问题,有效利用了不同实体之间丰富的关系,避免了 上述信息浪费的情况,提高了课程推荐的准确性。
为了实现上述目的,本申请技术方案如下:
一种基于多种实体关系的在线课程推荐方法,包括:
步骤1、获取在线课程平台中各实体的数据,所述各实体包括课程、用 户、课程视频、教师、课程概念,从各实体的数据中提取各实体关系,采 用标准化来预处理各实体关系得到各实体关系权重;
步骤2、将各实体及各实体关系权重构成一个实体关系图,根据预设的 元路径来得到实体关系图的子图,将子图的邻接矩阵作为元路径邻接矩阵;
步骤3、从各实体的数据中获得用户实体和课程概念实体的内容特征;
步骤4、将所述用户实体和课程概念实体的内容特征和相应的元路径邻 接矩阵,分别输入到所构建的基于社区结构的图卷积神经网络中学习潜在 的实体表示,得到不同元路径下的实体表示;
步骤5、将用户和课程概念在不同元路径下的实体表示,分别输入到所 构建的特征融合函数,然后得到用户和课程概念最终实体表示;
步骤6、结合用户最终实体表示和课程概念最终实体表示,最终输出用 户对每个课程的评分矩阵,然后根据评分矩阵,从大到小排序,向用户推 荐课程。
进一步的,所述从各实体的数据中获得用户实体和课程概念实体的内 容特征,包括:
将不同的课程概念组成一个语料库,语料库的大小为n1,用one-hot编 码的形式构建二维矩阵,每一行代表一个课程概念,每列的数值为0或1, 课程概念语料库所构成的二维矩阵大小为n1×n1,n1表示语料库中课程概 念的数量,再通过维度为n1×d1的神经网络进行降维操作,d1表示降维的 维度,d1<n1,得到课程概念的内容特征
同理对用户实体进行上述操作,得到用户实体的内容特征 n2表示用户的个数,d2表示降维的维度,d2<n2。
进一步的,所述将各实体及各实体关系权重构成一个实体关系图,根 据预设的元路径来得到实体关系图的子图,将子图的邻接矩阵作为元路径 邻接矩阵,包括:
步骤2.1、将各实体及各实体关系权重构成一个实体关系图,所述实体 关系图表示为G={V,E},其中V是各实体的集合,E是各实体关系权重 的集合,其中/>为用户与课程的关系,/>为 用户与课程视频的关系,/>为用户与教师的关系,/>为用户与课程概念 的关系;
步骤2.2、从实体关系图中设计所需要的元路径,得到元路径的集合 MP={MP1,MP2,MP3......,MPl},l表示元路径的个数;
步骤2.3、根据所得到的元路径,在实体关系图上连接所有相关的实体, 得到子图,根据子图形成元路径的邻接矩阵,矩阵中的值为两个实体之间 边对应的实体关系权重,重复进行上述操作,直到得到所有元路径所对应 的邻接矩阵
进一步的,所述将所述用户实体和课程概念实体的内容特征和相应的 元路径邻接矩阵,分别输入到所构建的基于社区结构的图卷积神经网络中 学习潜在的实体表示,得到不同元路径下的实体表示,包括:
步骤3.1、所构建的基于社区结构的图卷积神经网络的结构如下:
其中,是第m个元路径的邻接矩阵,Feneity是实体entity的内容特 征,经过三层图卷积层后得到实体entity在第m个元路径下的实体表示 />其中h1,h2,h3为每一层图卷积的输出;
通过损失函数优化参数W0,W1,W2,所述损失函数如下:
其中B为模块化矩阵,其公式为:
其中ki、kj表示第i、j个实体的边的个数;
步骤3.2、将元路径集合MP中的第一个元路径所构成的邻接矩阵和用户实体的内容特征Fn输入至图卷积神经网络中,/>表示元路径所构 成的邻接矩阵,Wl表示第l层上的权重矩阵,σ(·)表示激活函数,在这里 使用ReLU(·)函数,其中ReLU(·)为ReLU(a)=max{0,a},将内容 特征和邻接矩阵输入至图卷积网络中,经过三层:
其中
其中
其中
其中,C1,C2,C3用于控制每一层图卷积的输出h1,h2,h3的维度,经过三 层图卷积层后得到用户实体在第一个元路径下的实体表示通过损失 函数优化参数W0,W1,W2,损失函数如下:
其中B为模块化矩阵,其公式为:
其中kikj表示第i、j个实体的边的个数;
重复上述过程,依次使用元路径集合MP中剩余的元路径,最终得到 用户实体所有元路径下的实体表示
步骤3.3、对课程概念实体进行步骤3.2的操作,可以得到课程概念实 体所有元路径下的实体表示
进一步的,所述将用户和课程概念在不同元路径下的实体表示,分别 输入到所构建的特征融合函数,然后得到用户和课程概念最终实体表示, 包括:
步骤4.1、通过特征融合函数学习不同元路径下实体所占的权重,并得 到用户实体最终的实体表示,公式如下:
Eu指用户实体最终的实体表示,是相应元路径下的实体表示,其中/>表示权重函数, 它的值也就是不同元路径下实体所占的权重,/>等于如下:
其中为相应元路径下的实体表示,/>表示可训练的参数。 最终/>可以表示为:
步骤4.2、重复上述过程,得到课程概念最终实体表示Ek。
进一步的,所述结合用户最终实体表示和课程概念最终实体表示,最 终输出用户对每个课程的评分矩阵,然后根据评分矩阵,从大到小排序, 向用户推荐课程,包括:
步骤5.1、从各实体的数据中,把用户点击课程概念的次数当作评分矩 阵,根据矩阵分解的方法,将评分矩阵分解为两个低阶矩阵,即用户和课 程概念低维特征的潜在因子与/>其中D为潜在因子 xu和yk的维度,D<n1,且D<n2;
表示的就是评分矩阵,即每个用户在每个课程概念上的 得分;
步骤5.2、将用户实体Eu和课程概念实体Ek投入预测评分矩阵的函 数中,得到如下预测评分矩阵函数;
其中可训练的参数tk,tu被用来确保Eu,Ek在相同的维度空间, βu,βk是调优参数;
步骤5.3、最小化矩阵分解的优化函数来调整用户和课程概念低维特征 的潜在因子xu与yk,最终得到评分矩阵优化函数为:
步骤5.4、根据评分矩阵,对每个用户的课程概念进行从大到小排序, 向用户推荐排在前面的N个课程。
本申请提出的一种基于多种实体关系的在线课程推荐方法,不同于传 统的图卷积神经网络只能捕捉单一实体关系之间的信息,该方法利用了元 路径作为指引,帮助图卷积神经网络捕捉不同实体关系之间丰富的信息。 此外考虑到传统的图卷积神经网络忽略了社区结构这一图的重要特征,该 方法把社区结构纳入图卷积神经网络中,让实体的表示更加全面和完善。 此外,考虑到不同的学生可能有不同的兴趣,该方法进一步提出了一个注 意机制,以适应多个元路径在最终实体表示下所占的权重。最后,通过扩 展矩阵分解对所建模型的参数进行优化,得到最终的推荐列表。有效利用 了不同实体关系之间丰富的信息,降低了数据稀疏性的问题,提高了预测 的准确率。
附图说明
图1是本申请基于多种实体关系的在线课程推荐方法流程图;
图2是本申请基于社区结构的图卷积神经网络结构示意图;
图3是本申请特征融合函数结构示意图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图 及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实 施例仅用以解释本申请,并不用于限定本申请。
在一个实施例中,如图1所示,一种基于多种实体关系的在线课程推 荐方法,包括:
步骤1、获取在线课程平台中各实体的数据,所述各实体包括课程、用 户、课程视频、教师、课程概念,从各实体的数据中提取各实体关系,采 用标准化来预处理各实体关系得到各实体关系权重。
在线课程平台中存在各种实体,例如课程、用户、课程视频、教师、 课程概念等。课程概念是如“C++”,“二叉树”,“冒泡排序”等这些本身 包含丰富语义信息的课程关键词。
本申请获取在线课程平台中不同实体的数据Data={C(course),U(user), V(video),T(teacher),K(course concept)},从Data中提取各实体关系权重其中/>为用户与课程的关系,/>为用户 与课程视频的关系,/>为用户与教师的关系,/>为用户与课程概念的关 系。
对用户和课程概念的关系,采用min-max标准化来处理它们的关系权 重,公式为其中ruk表示用户u与课程概念k之间的权重, ruk_min和ruk_max表示用户u与所有课程概念的关系权重中最小权重和最 大权重,对每一行的每个值进行上述标准化,最后得到二维权重矩阵 />n1,n2分别表示为课程概念的数量和用户的数量。
对于用户与课程的关系,采用min-max标准化来处理它们的关系权重, 公式为其中ruc表示用户u与课程c之间的权重,ruc_min和 ruc_max表示用户u与所有课程的关系权重中最小权重和最大权重,对每一 行的每个值进行上述标准化,最后得到二维权重矩阵 />n3,n2分别表示为课程的数量和用户的数量。。
对于用户与视频的关系,采用min-max标准化来处理它们的关系权重, 公式为其中ruv表示用户u与视频v之间的权重,ruv_min和 ruv_max表示用户u与所有视频的关系权重中最小权重和最大权重,对每一 行的每个值进行上述标准化,最后得到二维权重矩阵 />n4,n2分别表示为视频的数量和用户的数量。
对于用户与教师的关系,采用min-max标准化来处理它们的关系权重, 公式为其中rut表示用户u与教师t之间的权重,rut_min和 rut_max表示用户u与所有教师的关系权重中最小权重和最大权重,对每一 行的每个值进行上述标准化,最后得到二维权重矩阵 />n5,n2分别表示为教师的数量和用户的数量。
需要说明的是,本申请的预处理操作也可以是使用z-score标准化,这 里不再赘述。
步骤2、将各实体及各实体关系权重构成一个实体关系图,根据预设的 元路径来得到实体关系图的子图,将子图的邻接矩阵作为元路径邻接矩阵。
具体的,包括:
步骤2.1、将各实体及各实体关系权重构成一个实体关系图,所述实体 关系图表示为G={V,E},其中V是各实体的集合,E是各实体关系权重 的集合,其中/>为用户与课程的关系,/>为 用户与课程视频的关系,/>为用户与教师的关系,/>为用户与课程概念 的关系;
步骤2.2、从实体关系图中设计所需要的元路径,得到元路径的集合 MP={MP1,MP2,MP3……,MPl},l表示元路径的个数;
步骤2.3、根据所得到的元路径,在实体关系图上连接所有相关的实体, 得到子图,根据子图形成元路径的邻接矩阵,矩阵中的值为两个实体之间 边对应的实体关系权重,重复进行上述操作,直到得到所有元路径所对应的邻接矩阵
本申请R中的多种实体关系构成一个图(Graph),并设计多个元路径 (meta-path)MP={MP1,MP2,MP3......,MPl},其中l表示元路径的个数, 然后根据元路径得到对应的邻接矩阵
本申请所述将实体关系权重R中的多种实体关系构成一个图(Graph), 并设计多个元路径(meta-path)MP={MP1,MP2,MP3……,MPl},其中 l表示元路径的个数,然后根据元路径得到对应的邻接矩阵
如用户与课程概念的元路径R4表示R中的第四个 关系,其语义信息为:两个不同的用户通过点击相同的知识概念关联。如 用户,课程和教师的元路径为/>其语义信息为:两个 用户通过包含同一教师讲授的不同课程的路径关联。以此得到元路径的集 合MP={MP1,MP2,MP3......,MPl},l表示元路径的个数。
在图上连接所有相关的实体,得到子图,根据子图形成子图的邻接矩 阵,矩阵中的值为两个实体之间边的权重。重复进行上述操作,直到得到 所有元路径所对应的邻接矩阵
如表1所示,本申请所设计的元路径及其语义信息。在其他实施例中, 元路径可以自由设计和组合。
表1
本申请利用了元路径作为指引,有助于接下来的图卷积神经网络捕捉 不同实体关系之间丰富的信息。
步骤3、步骤3、从各实体的数据中获得用户实体和课程概念实体的内 容特征。
本申请将不同的课程概念组成一个语料库,语料库的大小为n1,用 one-hot编码的形式构建二维矩阵,每一行代表一个课程概念,每列的数 值为0或1,课程概念语料库所构成的二维矩阵大小为n1×n1,n1表示语 料库中课程概念的数量,再通过维度为n1×d1的神经网络进行降维操作, d1表示降维的维度,d1<n1,得到课程概念的内容特征
同理对用户实体进行上述操作,得到用户实体的内容特征 n2表示用户的个数,d2表示降维的维度,d2<n2。
例如,本实施例二维矩阵每一行代表一个课程概念,每列的数值为0 或1,如三个课程概念(C++,JAVA,Python)那么one-hot编码的形式 所构成二维矩阵为所以课程概念语料库所构成的二维矩阵大小 为n1×n1,再通过维度为n1×d1的神经网络(d1<n1)进行降维操作, 得到课程概念的内容特征/>
同理对用户实体进行上述操作,得到用户实体的内容特征此外内容特征也可以是用户与课程的内容特征。
步骤4、将所述用户实体和课程概念实体的内容特征和相应的元路径邻 接矩阵,分别输入到所构建的基于社区结构的图卷积神经网络中学习潜在 的实体表示,得到不同元路径下的实体表示。
将用户实体和课程概念实体的内容特征Fu、Fk和相应的元路径MP,分 别输入到所构建的基于社区结构的图卷积神经网络中学习潜在的实体表 示,得到不同元路径下的实体表示和 />
具体包括:
步骤3.1、所构建的基于社区结构的图卷积神经网络的结构如下:
其中,是第m个元路径的邻接矩阵,Feneity是实体entity的内容特 征,经过三层图卷积层后得到实体entity在第m个元路径下的实体表示 />其中h1,h2,h3为每一层图卷积的输出;
通过损失函数优化参数W0,W1,W2,所述损失函数如下:
其中B为模块化矩阵,其公式为:
其中ki、kj表示第i、j个实体的边的个数;
步骤3.2、将元路径集合MP中的第一个元路径所构成的邻接矩阵和用户实体的内容特征Fu输入至图卷积神经网络中,/>表示元路径所构 成的邻接矩阵,Wl表示第l层上的权重矩阵,σ(·)表示激活函数,在这里 使用ReLU(·)函数,其中ReLU(·)为ReLU(a)=max{0,a},将内容 特征和邻接矩阵输入至图卷积网络中,经过三层:
其中
其中
其中
其中,C1,C2,C3用于控制每一层图卷积的输出h1,h2,h3的维度,经过三 层图卷积层后得到用户实体在第一个元路径下的实体表示通过损失 函数优化参数W0,W1,W2,损失函数如下:
其中B为模块化矩阵,其公式为:
其中kikj表示第i、j个实体的边的个数;
重复上述过程,依次使用元路径集合MP中剩余的元路径,最终得到 用户实体所有元路径下的实体表示
步骤3.3、对课程概念实体进行步骤3.2的操作,可以得到课程概念实 体所有元路径下的实体表示
如图2所示,本申请基于社区结构的图卷积神经网络如图所示,首先 图卷积层对输入进行运算,然后进入ReLU激活层处理,连续经过三个图 卷积层,最后得到输出。
需要说明的是,图卷积层可以不止三个,根据需要可以设置为1,2,4 个图卷积层。
步骤5、将用户和课程概念在不同元路径下的实体表示,分别输入到所 构建的特征融合函数,然后得到用户和课程概念最终实体表示。
本申请所述将用户和课程概念在不同元路径下的实体表示和/>分别输入到所构建的特征融合函数,然后得到用户和课程概念最终实体表 示Eu,Ek,包括:
步骤4.1、通过特征融合函数学习不同元路径下实体所占的权重,并得 到用户实体最终的实体表示,公式如下:
Eu指用户实体最终的实体表示,是相应元路径下的实体表示,其中/>表示权重函数, 它的值也就是不同元路径下实体所占的权重,/>等于如下:
其中为相应元路径下的实体表示,/>表示可训练的参数。 最终/>可以表示为:
步骤4.2、重复上述过程,得到课程概念最终实体表示Ek。
如图3所示,本申请特征融合函数结构包括,多元路径下的实体表 示,权重函数,特征融合,最后得到一个由多条元路径融合下的最终实体 表示。
步骤6、结合用户最终实体表示和课程概念最终实体表示,最终输出用 户对每个课程的评分矩阵,然后根据评分矩阵,从大到小排序,向用户推 荐课程。
本申请对于结合用户实体表示Eu和课程概念实体表示Ek,最终输出用 户对每个课程的评分矩阵。然后根据评分矩阵,从大到小排序,向用户推 荐Top-N课程,包括:
步骤5.1、从各实体的数据中,把用户点击课程概念的次数当作评分矩 阵,根据矩阵分解的方法,将评分矩阵分解为两个低阶矩阵,即用户和课 程概念低维特征的潜在因子与/>其中D为潜在因子 xu和yk的维度,D<n1,且D<n2;
表示的就是评分矩阵,即每个用户在每个课程概念上的 得分;
步骤5.2、将用户实体Eu和课程概念实体Ek投入预测评分矩阵的函 数中,得到如下预测评分矩阵函数;
其中可训练的参数tk,tu被用来确保Eu,Ek在相同的维度空间, βu,βk是调优参数;
步骤5.3、最小化矩阵分解的优化函数来调整用户和课程概念低维特征 的潜在因子xu与yk,最终得到评分矩阵优化函数为:
步骤5.4、根据评分矩阵,对每个用户的课程概念进行从大到小排序, 向用户推荐排在前面的N个课程。
本申请通过矩阵分解,生成用户和课程概念的低维潜在因子,解决评 分矩阵稀疏性的问题,加入信息融合后的用户实体和课程概念实体,输出 的评分矩阵能够加准确。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和 详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对 于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做 出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的 保护范围应以所附权利要求为准。
Claims (5)
1.一种基于多种实体关系的在线课程推荐方法,其特征在于,所述基于不同实体关系的在线课程推荐方法系统,包括:
步骤1、获取在线课程平台中各实体的数据,所述各实体包括课程、用户、课程视频、教师、课程概念,从各实体的数据中提取各实体关系,采用标准化来预处理各实体关系得到各实体关系权重;
步骤2、将各实体及各实体关系权重构成一个实体关系图,根据预设的元路径来得到实体关系图的子图,将子图的邻接矩阵作为元路径邻接矩阵;
步骤3、从各实体的数据中获得用户实体和课程概念实体的内容特征;
步骤4、将所述用户实体和课程概念实体的内容特征和相应的元路径邻接矩阵,分别输入到所构建的基于社区结构的图卷积神经网络中学习潜在的实体表示,得到不同元路径下的实体表示;
步骤5、将用户和课程概念在不同元路径下的实体表示,分别输入到所构建的特征融合函数,然后得到用户和课程概念最终实体表示;
步骤6、结合用户最终实体表示和课程概念最终实体表示,最终输出用户对每个课程的评分矩阵,然后根据评分矩阵,从大到小排序,向用户推荐课程;
其中,所述将所述用户实体和课程概念实体的内容特征和相应的元路径邻接矩阵,分别输入到所构建的基于社区结构的图卷积神经网络中学习潜在的实体表示,得到不同元路径下的实体表示,包括:
步骤3.1、所构建的基于社区结构的图卷积神经网络的结构如下:
其中,是第m个元路径的邻接矩阵,Feneity是实体entity的内容特征,经过三层图卷积层后得到实体entity在第m个元路径下的实体表示/>其中h1,h2,h3为每一层图卷积的输出;
通过损失函数优化参数W0,W1,W2,所述损失函数如下:
其中B为模块化矩阵,其公式为:
其中ki、kj表示第i、j个实体的边的个数;
步骤3.2、将元路径集合MP中的第一个元路径所构成的邻接矩阵和用户实体的内容特征Fu输入至图卷积神经网络中,/>表示元路径所构成的邻接矩阵,Wl表示第l层上的权重矩阵,σ(·)表示激活函数,在这里使用ReLU(·)函数,其中ReLU(·)为ReLU(a)=max{0,a},将内容特征和邻接矩阵输入至图卷积网络中,经过三层:
其中
其中
其中
其中,C1,C2,C3用于控制每一层图卷积的输出h1,h2,h3的维度,经过三层图卷积层后得到用户实体在第一个元路径下的实体表示通过损失函数优化参数W0,W1,W2,损失函数如下:
其中B为模块化矩阵,其公式为:
其中kikj表示第i、j个实体的边的个数;
重复上述过程,依次使用元路径集合MP中剩余的元路径,最终得到用户实体所有元路径下的实体表示
步骤3.3、对课程概念实体进行步骤3.2的操作,可以得到课程概念实体所有元路径下的实体表示
2.根据权利要求1所述的基于多种实体关系的在线课程推荐方法,其特征在于,所述从各实体的数据中获得用户实体和课程概念实体的内容特征,包括:
将不同的课程概念组成一个语料库,语料库的大小为n1,用one-hot编码的形式构建二维矩阵,每一行代表一个课程概念,每列的数值为0或1,课程概念语料库所构成的二维矩阵大小为n1×n1,n1表示语料库中课程概念的数量,再通过维度为n1×d1的神经网络进行降维操作,d1表示降维的维度,d1<n1,得到课程概念的内容特征
同理对用户实体进行上述操作,得到用户实体的内容特征n2表示用户的个数,d2表示降维的维度,d2<n2。
3.根据权利要求1所述的基于多种实体关系的在线课程推荐方法,其特征在于,所述将各实体及各实体关系权重构成一个实体关系图,根据预设的元路径来得到实体关系图的子图,将子图的邻接矩阵作为元路径邻接矩阵,包括:
步骤2.1、将各实体及各实体关系权重构成一个实体关系图,所述实体关系图表示为G={V,E},其中V是各实体的集合,E是各实体关系权重的集合,其中/>为用户与课程的关系,/>为用户与课程视频的关系,/>为用户与教师的关系,/>为用户与课程概念的关系;
步骤2.2、从实体关系图中设计所需要的元路径,得到元路径的集合MP={MP1,MP2,MP3......,MPl},l表示元路径的个数;
步骤2.3、根据所得到的元路径,在实体关系图上连接所有相关的实体,得到子图,根据子图形成元路径的邻接矩阵,矩阵中的值为两个实体之间边对应的实体关系权重,重复进行上述操作,直到得到所有元路径所对应的邻接矩阵
4.根据权利要求1所述的基于多种实体关系的在线课程推荐方法,其特征在于,所述将用户和课程概念在不同元路径下的实体表示,分别输入到所构建的特征融合函数,然后得到用户和课程概念最终实体表示,包括:
步骤4.1、通过特征融合函数学习不同元路径下实体所占的权重,并得到用户实体最终的实体表示,公式如下:
Eu指用户实体最终的实体表示,是相应元路径下的实体表示,其中/>表示权重函数,它的值也就是不同元路径下实体所占的权重,/>等于如下:
其中为相应元路径下的实体表示,/>表示可训练的参数,最终/>可以表示为:
步骤4.2、重复上述过程,得到课程概念最终实体表示Ek。
5.根据权利要求1所述的基于多种实体关系的在线课程推荐方法,其特征在于,所述结合用户最终实体表示和课程概念最终实体表示,最终输出用户对每个课程的评分矩阵,然后根据评分矩阵,从大到小排序,向用户推荐课程,包括:
步骤5.1、从各实体的数据中,把用户点击课程概念的次数当作评分矩阵,根据矩阵分解的方法,将评分矩阵分解为两个低阶矩阵,即用户和课程概念低维特征的潜在因子与/>其中D为潜在因子xu和yk的维度,D<n1,且D<n2;
表示的就是评分矩阵,即每个用户在每个课程概念上的得分;
步骤5.2、将用户实体Eu和课程概念实体Ek投入预测评分矩阵的函数中,得到如下预测评分矩阵函数;
其中可训练的参数tk,tu被用来确保Eu,Ek在相同的维度空间,βu,βk是调优参数;
步骤5.3、最小化矩阵分解的优化函数来调整用户和课程概念低维特征的潜在因子xu与yk,最终得到评分矩阵优化函数为:
步骤5.4、根据评分矩阵,对每个用户的课程概念进行从大到小排序,向用户推荐排在前面的N个课程。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110053692.6A CN112749805B (zh) | 2021-01-15 | 2021-01-15 | 一种基于多种实体关系的在线课程推荐方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110053692.6A CN112749805B (zh) | 2021-01-15 | 2021-01-15 | 一种基于多种实体关系的在线课程推荐方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112749805A CN112749805A (zh) | 2021-05-04 |
CN112749805B true CN112749805B (zh) | 2024-02-13 |
Family
ID=75652043
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110053692.6A Active CN112749805B (zh) | 2021-01-15 | 2021-01-15 | 一种基于多种实体关系的在线课程推荐方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112749805B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113743645B (zh) * | 2021-07-16 | 2024-02-02 | 广东财经大学 | 基于路径因素融合的在线教育课程推荐方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107577710A (zh) * | 2017-08-01 | 2018-01-12 | 广州市香港科大霍英东研究院 | 基于异构信息网络的推荐方法及装置 |
CN108874960A (zh) * | 2018-06-06 | 2018-11-23 | 电子科技大学 | 一种在线学习中基于降噪自编码器混合模型的课程视频推荐算法 |
CN109582864A (zh) * | 2018-11-19 | 2019-04-05 | 华南师范大学 | 基于大数据科学和动态权重调整的课程推荐方法及系统 |
CN109919810A (zh) * | 2019-01-22 | 2019-06-21 | 山东科技大学 | 在线学习系统中的学生建模与个性化课程推荐方法 |
-
2021
- 2021-01-15 CN CN202110053692.6A patent/CN112749805B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107577710A (zh) * | 2017-08-01 | 2018-01-12 | 广州市香港科大霍英东研究院 | 基于异构信息网络的推荐方法及装置 |
CN108874960A (zh) * | 2018-06-06 | 2018-11-23 | 电子科技大学 | 一种在线学习中基于降噪自编码器混合模型的课程视频推荐算法 |
CN109582864A (zh) * | 2018-11-19 | 2019-04-05 | 华南师范大学 | 基于大数据科学和动态权重调整的课程推荐方法及系统 |
CN109919810A (zh) * | 2019-01-22 | 2019-06-21 | 山东科技大学 | 在线学习系统中的学生建模与个性化课程推荐方法 |
Also Published As
Publication number | Publication date |
---|---|
CN112749805A (zh) | 2021-05-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108021616B (zh) | 一种基于循环神经网络的社区问答专家推荐方法 | |
CN107944027B (zh) | 创建语义键索引的方法及系统 | |
CN108363743A (zh) | 一种智能问题生成方法、装置和计算机可读存储介质 | |
Wang et al. | Attention-based CNN for personalized course recommendations for MOOC learners | |
Zhu et al. | Automatic short-answer grading via BERT-based deep neural networks | |
CN111582975B (zh) | 基于用户、产品和广告相结合的人工智能推荐方法及系统 | |
CN116596347B (zh) | 基于云平台的多学科交互教学系统及教学方法 | |
CN115510814B (zh) | 一种基于双重规划的篇章级复杂问题生成方法 | |
CN110825850A (zh) | 一种自然语言主题分类方法及装置 | |
Gutierrez et al. | Indigenous student literacy outcomes in Australia: A systematic review of literacy programmes | |
CN112749805B (zh) | 一种基于多种实体关系的在线课程推荐方法 | |
Mrhar et al. | Toward a deep recommender system for moocs platforms | |
CN113239678B (zh) | 一种面向答案选择的多角度注意力特征匹配方法及系统 | |
Lee et al. | Sentiment classification with word attention based on weakly supervised learning with a convolutional neural network | |
CN110162777B (zh) | 一种看图写作型作文自动评分方法和系统 | |
CN116186199A (zh) | 一种基于多特征融合的短答案自动评分方法 | |
Xia | An e-learning support middleware with MOOC course recommendation | |
Zhao et al. | Investigating the Validity and Reliability of a Comprehensive Essay Evaluation Model of Integrating Manual Feedback and Intelligent Assistance. | |
Zhao et al. | A study on the innovative model of foreign language teaching in universities using big data corpus | |
Wu | Automatic English essay scoring algorithm based on machine learning | |
CN112434152B (zh) | 基于多通道卷积神经网络的教育类选择题解答方法和装置 | |
Yamada et al. | Onomatopoeia Search System Focused on Attributes Based on Sensibility and Various Sounds | |
Yan et al. | Images2Poem in different contexts with Dual‐CharRNN | |
Chu et al. | A method for online course evaluation based on continuous bag-of-words model and semantic analysis—a case study of statistics | |
Svetlov et al. | Digital Transformation in the Russian Federation: Thematic Landscape of Online Communities |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |