CN109582864A - 基于大数据科学和动态权重调整的课程推荐方法及系统 - Google Patents

基于大数据科学和动态权重调整的课程推荐方法及系统 Download PDF

Info

Publication number
CN109582864A
CN109582864A CN201811376466.6A CN201811376466A CN109582864A CN 109582864 A CN109582864 A CN 109582864A CN 201811376466 A CN201811376466 A CN 201811376466A CN 109582864 A CN109582864 A CN 109582864A
Authority
CN
China
Prior art keywords
course
matrix
user
model
sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811376466.6A
Other languages
English (en)
Other versions
CN109582864B (zh
Inventor
黄昌勤
张捷
朱佳
赵美华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
South China Normal University
Original Assignee
South China Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by South China Normal University filed Critical South China Normal University
Priority to CN201811376466.6A priority Critical patent/CN109582864B/zh
Publication of CN109582864A publication Critical patent/CN109582864A/zh
Application granted granted Critical
Publication of CN109582864B publication Critical patent/CN109582864B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了基于大数据科学和动态权重调整的课程推荐方法及系统,方法包括:根据用户对课程的评分,生成用户课程矩阵;根据用户课程矩阵,生成学生的偏好信息;根据用户课程矩阵和学生的偏好信息,构建约束模型和独立评分模型;根据约束模型和独立评分模型,基于动态权重调整方法生成课程评分预测值;根据课程评分预测值进行课程推荐。本发明通过约束模型和独立评分模型来预测课程的评分,能够同时考虑全局信息和局部信息,且可以对预测的结果根据实际情况进行调整,效果稳定;另外,本发明在预测课程评分的时候,还采用了动态权重调整方法,大大提高了预测结果的准确性,可广泛应用于深度学习技术领域。

Description

基于大数据科学和动态权重调整的课程推荐方法及系统
技术领域
本发明涉及深度学习技术领域,尤其是基于大数据科学和动态权重调整的课程推荐方法及系统。
背景技术
当今社会,信息与通讯技术的进步以及普及,对教育环境产生了巨大的影响和发展,在线教育系统作为其中发展最迅猛、扩散速度最快之一的领域,广泛地影响着我们的生活。随着在线教育系统变得普及,系统上的学生和课程的数量正在快速增长,那么如何让学生更好地挑选更感兴趣的、更适应学生特点的、知识量足、知识面全面的课程,已成为当今广受争议的问题:课程推荐问题、课程路径推荐问题。为了解决该问题,一个设计合理、效率保证且能够从大量的数据中根据学生的具体情况来推荐课程和课程路径的系统是必不可少的。
在此大前提下,各种课程和课程路径推荐系统层次不穷。这些系统使用的方法大致可以这么分为两类:基于历史数据的推荐方法、基于内容的推荐方法。其中,基于历史数据的推荐方法:通过对历史数据进行过滤、处理来直接对用户进行课程的推荐,但同时缺少了对实际情况的考虑,对数据量的要求也比较大;基于内容的推荐方法:通过对用户的观察、测试、收集数据等方法把具体某个用户的特征保存在一个对应的数据集中,然后通过领域的方法和建模的方法来对用户进行课程的推荐,但其忽略了历史数据的价值,同时对噪声比较敏感;有一小部分的推荐系统同时考虑了基于历史数据的方法和基于内容的方法,但是其多数采用统计的方法或者只是把其中一者作为参考来设计系统,难以在数据量庞大时达到较好的效果,同时对数据的处理也相当困难;还有一部分系统使用了大数据的方法来实现,但是其使用的方法和模型过于传统、简单,细节上存在着漏洞和不足,没有充分地利用大数据科学的优势,效果只能说是差强人意,因此也并不被广泛认可。此外,上述推荐系统还面临两个困境:难以同时考虑全局信息和局部信息、难以对预测的结果根据实际情况进行调整。目前基于大数据技术的模型主要包括:BP神经网络模型(Back PropagationNeural Networks)和决策树模型(Decision Tree),决策树模型运用概率的思想来净现值的期望值大于等于零的概率,但其难以解决系统的课程和用户的数量和性质会动态变化且变化速度大导致模型不精准的问题;BP神经网络运用深度学习的思想来实现目标值的预测,但其学习速度慢且输入的参数没有一个系统的理论方法,预测效果不稳定。
发明内容
为解决上述技术问题,本发明的目的在于:提供一种准确度高且效果稳定的,基于大数据科学和动态权重调整的课程推荐方法及系统。
本发明一方面所采取的技术方案为:
基于大数据科学和动态权重调整的课程推荐方法,包括以下步骤:
根据用户对课程的评分,生成用户课程矩阵;
根据用户课程矩阵,生成学生的偏好信息;
根据用户课程矩阵和学生的偏好信息,构建约束模型和独立评分模型;
根据约束模型和独立评分模型,基于动态权重调整方法生成课程评分预测值;
根据课程评分预测值进行课程推荐。
进一步,所述根据用户课程矩阵,生成学生的偏好信息这一步骤,包括以下步骤:
对用户课程矩阵进行运算,生成第一结果,所述第一结果包括课程共存矩阵和用户共存矩阵;
通过web日志对用户课程矩阵的运算结果进行信息提取,得到学生的偏好信息。
进一步,所述根据用户课程矩阵和学生的偏好信息,构建约束模型和独立评分模型这一步骤,包括以下步骤:
通过矩阵分解法对第一结果进行求解,得到第二结果;
通过正则化奇异值对第二结果进行求解,得到第三结果;
根据第三结果,构建得到约束模型和独立评分模型。
进一步,所述根据用户课程矩阵和学生的偏好信息,构建约束模型和独立评分模型这一步骤,还包括以下步骤:
通过约束模型和独立评分模型,建立多视图神经网络。
进一步,所述通过约束模型和独立评分模型,建立多视图神经网络这一步骤,包括以下步骤:
将约束模型的实时解输入全连接层进行第一训练;
将独立评分模型的实时解输入卷积层进行第二训练;
将约束模型的历史解输入全连接层进行第三训练;
将独立评分模型的历史解输入卷积层进行第四训练;
根据第一训练、第二训练、第三训练和第四训练的结果,建立多视图神经网络。
进一步,所述根据约束模型和独立评分模型,基于动态权重调整方法生成课程评分预测值这一步骤,包括以下步骤:
通过多视图神经网络生成第一预测分量;
通过学生偏好信息生成第二预测分量;
通过最近邻分类算法生成第三预测分量;
基于动态调整权重机制,分别对第一预测分量、第二预测分量和第三预测分量的权重进行配置;
根据权重配置结果,通过第一预测分量、第二预测分量和第三预测分量生成课程评分预测值。
进一步,所述根据课程评分预测值进行课程推荐这一步骤,包括以下步骤:
根据用户课程矩阵生成课程序列集合;
计算课程序列集合中每个课程序列的支持度,并获取支持度大于第一阈值的第一课程序列;
将第一课程序列作为当前课程序列,并根据第一课程序列和当前课程序列,生成课程序列矩阵;
计算课程序列矩阵中每个课程序列的支持度;
判断课程序列矩阵中是否存在课程序列的支持度大于第一阈值,若是,则将大于第一阈值的所有课程序列作为当前课程序列,并返回执行根据第一课程序列和当前课程序列,生成课程序列矩阵的步骤;反之,则执行下一步骤;
筛选课程矩阵中支持度大于第二阈值的课程序列,并将该课程序列作为课程推荐结果。
本发明另一方面所采取的技术方案是:
基于大数据科学和动态权重调整的课程推荐系统,包括:
第一生成模块,用于根据用户对课程的评分,生成用户课程矩阵;
第二生成模块,用于根据用户课程矩阵,生成学生的偏好信息;
模型构建模块,用于根据用户课程矩阵和学生的偏好信息,构建约束模型和独立评分模型;
预测模块,用于根据约束模型和独立评分模型,基于动态权重调整方法生成课程评分预测值;
推荐模块,用于根据课程评分预测值进行课程推荐。
本发明另一方面所采取的技术方案是:
基于大数据科学和动态权重调整的课程推荐系统,包括:
至少一个处理器;
至少一个存储器,用于存储至少一个程序;
当所述至少一个程序被所述至少一个处理器执行,使得所述至少一个处理器实现所述的基于大数据科学和动态权重调整的课程推荐方法。
本发明的有益效果是:本发明通过约束模型和独立评分模型来预测课程的评分,相较于现有BP神经网络模型和决策树模型,本发明能够同时考虑全局信息和局部信息,且可以对预测的结果根据实际情况进行调整,效果稳定;另外,本发明在预测课程评分的时候,还采用了动态权重调整方法,大大提高了预测结果的准确性。
附图说明
图1为本发明实施例的步骤流程图;
图2为本发明实施例的多视图神经网络模型的结构示意图。
具体实施方式
下面结合说明书附图和具体实施例对本发明作进一步解释和说明。对于本发明实施例中的步骤编号,其仅为了便于阐述说明而设置,对步骤之间的顺序不做任何限定,实施例中的各步骤的执行顺序均可根据本领域技术人员的理解来进行适应性调整。
多视图神经网络(Multi-view Neural Networks),作为一种深度学习方法,同时具有全连接层和卷积层的特点,且预测速度比BP神经网络较快的优势,能有效克服考虑局部信息和全局信息之间的矛盾的推荐技术障碍。
本发明为了规避现有技术的种种缺陷,运用了大数据科学的特点,有针对性地对数据进行预处理,引入多视图神经网络,该网络包括由两种模型支撑,即:约束模型(Constraint Model,CM)、独立评分模型(Rating Independent Model,RIM)来同时考虑全局信息和局部信息,再使用基于历史数据和基于内容的方法参与建模,之后使用动态调整权重的方法来对模型预测的结果进行调整,配合数据挖掘科学来实现对学生推荐课程和课程路径。
参照图1,本发明实施例提供了一种基于大数据科学和动态权重调整的课程推荐方法,包括以下步骤:
S1、根据用户对课程的评分,生成用户课程矩阵;
具体地,本发明根据在线教育系统的数据库得到某一个课程分类下的每一个用户对每一个课程的评分值,这里假定最低0分,最高5分,若用户没有上过某一门课程,则记为空值,并将这一些数据填入到用户-课程矩阵当中。
S2、根据用户课程矩阵,生成学生的偏好信息;
进一步作为步骤S2的优选实施方式,所述步骤S2包括以下步骤:
S21、对用户课程矩阵进行运算,生成第一结果,所述第一结果包括课程共存矩阵和用户共存矩阵;
S22、通过web日志对用户课程矩阵的运算结果进行信息提取,得到学生的偏好信息。
具体地,本实施例对用户课程矩阵进行运算之后,得到的所有第一结果如表1所示:
表1
另外,本发明通过通过web日志对用户课程矩阵的运算结果进行信息提取后,得到学生的偏好信息的内容如表2所示:
表2
参数 描述
A(t) 学生在选择课程t所属分类的课程占其所选择的总课程的百分比
B(t) 若学生把课程t放入书签、收藏,该值为1,否则该值为0
C(t) e<sup>-o</sup>,其中o个学生完成t课程所属分类课程的平均时间
S3、根据用户课程矩阵和学生的偏好信息,构建约束模型和独立评分模型;
进一步作为步骤S3的优选实施方式,所述步骤S3包括以下步骤:
S31、通过矩阵分解法对第一结果进行求解,得到第二结果;
S32、通过正则化奇异值对第二结果进行求解,得到第三结果;
S33、根据第三结果,构建得到约束模型和独立评分模型。
S34、通过约束模型和独立评分模型,建立多视图神经网络。
具体地,所述第一结果是指步骤S2中表1的结果,所述步骤S31中,对于约束模型的构建过程为:本实施例对表1中的课程共存矩阵和用户共存矩阵做矩阵分解,本实施例用log替代用log替代则有:
其中,代表给第i个课程和第j个课程打相同分数的用户数量;代表第i个和第j个用户打相同分数的课程数量;
因此,矩阵A和B的求解过程转化成求解di=[d1i,d2i]和ei=[e1i,e2i]。
对于独立评分模型的构建过程为:本实施例对表1中的Ak进行矩阵分解,即:
公式转换后得到:
其中,代表给第i个课程打k1分和给第j个课程打k2分的用户数量;代表第i个用户打k1分和给第j个用户打k2分的课程数量;
因此,Ak的最终解转化为:
上述对矩阵A、B以及Ak的求解转化过程,得到的结果即为第二结果。
所述步骤S32中,通过正则化奇异值对第二结果进行求解,得到第三结果:
具体地,由于以此为依据构建逼近方程来求解d1i、d2j:设d1i Td2jij+μ=rij1,其中β为课程偏差值,μ为全局评分均值,则预测公式为:rij1=rij2,
设目标函数为:当该函数取得最小值时,则此时的rij1为所求的值。
其中Oij不为0值为1,否则值为0,设置的目的是使得当两个课程没有人打过相同分数时不参与计算,以免影响结果精度。
其中f的定义为:
则各个参数的梯度如下所示:
其中,
代表μ的学习率;代表μ的一阶导数;代表f的一阶导数;代表βi的学习率;代表βi的代表βj的一阶导数;
с2代表正则化参数;代表代表d1i的学习率;代表代表d2j的学习率;代表d1i的一阶代表正则化参数;
则参数公式更新为:
其中ε为学习率。
设各种参数通过以下公式进行初始化,使得函数一开始时候的变量具有初始值,并令其
处于求解难度不过大的初始状态:
d1i,k=(rand-0.5)*0.01,k=1,2,…,dim,其中dim为d1i,的维度。
d2i,k=(rand-0.5)*0.01,k=1,2,…,dim,其中dim为d2i,的维度。
其中rand为服从均匀分布[0,1]之间的随机值。
最终求解得到第三结果,并根据第三结果的值,生成约束模型和独立评分模型。
进一步作为步骤S34的优选实施方式,所述步骤S34包括以下步骤:
S341、将约束模型的实时解输入全连接层进行第一训练;
S342、将独立评分模型的实时解输入卷积层进行第二训练;
S343、将约束模型的历史解输入全连接层进行第三训练;
S344、将独立评分模型的历史解输入卷积层进行第四训练;
S345、根据第一训练、第二训练、第三训练和第四训练的结果,建立多视图神经网络。
如图2所示,CM模型(约束模型)得到的是整体的一个学生与课程的低维度嵌入向量,因此适合使用全连接层;而RIM模型(独立评分模型)则得到每一个评分的低维度嵌入向量,因此适合把结果放到卷积层当中。
具体地,所述第一训练过程中,本实施例所述约束模型的实时解,是指步骤S31中约束模型的解,即di=[d1i,d2i]和ei=[e1i,e2i],其与历史数据的解形成对应。
对于dj=[d1j,d2j]、ei=[e1i,e2i],
设Wd、We分别为dj、ei的权重矩阵,Bd、Be分别为dj、ei的偏差值矩阵,则全连接层可以表示如下:
Out(ui)=g(Weei+Be)
Out(tj)=g(Wddj+Bd),
其中,g代表神经网络层的核函数;权重矩阵用于对输入采取一定程度的接受;偏差值矩阵用于防止过拟合;
接着,所述第二训练过程中,使用实时数据的RIM模型的解作为卷积层的输入:
对于步骤S31中独立评分模型的解:
设Le、Le为dj k、ei k的权重矩阵,Jd、Je分别为dj k、ei k的偏差值矩阵,由于卷积神经网络共享权值,于是全连接层可以表示如下:
Out(ui,k)=g(Leei k+Je),
Out(tj,k)=g(Lddj k+Jd)。
然后,所述第三训练过程中,使用历史数据的CM模型的解作为全连接层的输入:
假设是历史数据中被学生i打过分课程集合,是历史数据中为课程j打过分的学生集合,
其中,h(ui)作为神经网络的用户历史数据的输入;h(tj)作为神经网络的课程历史数据的输入;
设Whu、Wht分别为h(ui)、h(tj)的权重矩阵,Bhu、Bht分别为h(ui)、h(tj)的偏差值矩阵,则全连接层可以表示如下:
Out(ui)=g(Whuh(ui)+Bhu),
Out(tj)=g(Whth(tj)+Bht)。
最后,所述第四训练过程中,使用历史数据的RIM模型的解作为卷积层的输入:
假设Ti k his是历史数据中被学生i打k分的课程集合,Uj k his是历史数据中为课程j打k分的学生集合,
设Lhu、Lht为hk(ui)、hk(tj)的权重矩阵,Jhu、Jht分别为hk(ui)、hk(tj)的偏差值矩阵,由于卷积神经网络共享权值,于是全连接层可以表示如下:
Out(ui)=g(Lhuhk(ui)+Jhu),
Out(tj)=g(Lhthk(tj)+Jht)。
S4、根据约束模型和独立评分模型,基于动态权重调整方法生成课程评分预测值;
进一步作为优选的实施方式,所述步骤S4包括以下步骤:
S41、通过多视图神经网络生成第一预测分量;
具体地,本实施例在训练得到多视图神经网络后,找到具体一个课程分类下所有用户对应的没有学过的课程,逐一使用多视图神经网络进行预测,将用户u对课程j的评分预测值记为所述第一预测分量反应的是整体上用户和课程之间的潜在关系和主要关系。
S42、通过学生偏好信息生成第二预测分量;
具体地,本实施例计算第二预测分量的计算公式为:所述第二预测分量反应的是用户的偏好与课程之间的关系。
S43、通过最近邻分类算法生成第三预测分量;
具体地,本实施例提出五种相似度计算方法:
1)、计算皮尔逊相关系数,所述皮尔逊相关系数Sim1(u,v)的计算公式为:
2)、计算余弦相似度,所述余弦相似度Sim2(u,v)的计算公式为:
3)、计算Jaccard系数,所述Jaccard系数Sim3(u,v)的计算公式为:
4)、计算学习风格相似度,所述学习风格相似度Sim4(u,v)的计算公式为:
5)、计算知识水平相似度,所述知识水平相似度Sim5(u,v)的计算公式为:
最终,根据上述5个相似度的计算结果,计算本实施例的总相似度,所述总相似度Sim(u,v)的计算公式为:
根据上式,由KNN(最近邻分类算法)得到与学生u最接近的k个学生stui
本实施例的第三预测分量反映的是学生与学生之间相似度和课程的关系。
S44、基于动态调整权重机制,分别对第一预测分量、第二预测分量和第三预测分量的权重进行配置;
具体地,由于课程的适应人群、难度、偏重点等各方面因素不一致,用户的偏好、个人学习水平、学习能力、关注点有所差别,因此各个预测分量的权重的值应该是动态调整的,才能更好的适应动态变化的整个学习系统环境。
本实施例并不改变Wi的值,以免引起整个系统的混乱,本实施例采用Wi*hi作为的权重,通过改变hi的值来调整权重。
具体地,对应于本实施例分别设置了h1、h2和h3
1)、h1的计算:
首先,对于第j门课程的评分方差s(j):
则:h1=1-0.01*s(j)。
2)、h2的计算:
首先,对于第j门课程的偏好预测评分方差:
则:
3)、h3的计算:
首先,对于第u个用户的评分方差:
则:h3=1-0.01*s(u)。
S45、根据权重配置结果,通过第一预测分量、第二预测分量和第三预测分量生成课程评分预测值。
具体地,计算规范化预测结果的过程如下:
首先,设本发明通过设置权重之和WH,能够把预测结果规范在[0,5]的区间内;
则最终预测结果为:
S5、根据课程评分预测值进行课程推荐。
进一步作为步骤S5的优选实施方式,所述步骤S5包括以下步骤:
S51、根据用户课程矩阵生成课程序列集合;
S52、计算课程序列集合中每个课程序列的支持度,并获取支持度大于第一阈值的第一课程序列;
S53、将第一课程序列作为当前课程序列,并根据第一课程序列和当前课程序列,生成课程序列矩阵;
S54、计算课程序列矩阵中每个课程序列的支持度;
S55、判断课程序列矩阵中是否存在课程序列的支持度大于第一阈值,若是,则将大于第一阈值的所有课程序列作为第一课程序列,并返回执行步骤S53;反之,则执行步骤S56;
S56、筛选课程矩阵中支持度大于第二阈值的课程序列,并将该课程序列作为课程推荐结果。
具体地,本实施例首先从用户课程矩阵中找出学生u没有选过的,且预测值大于3.5分的课程放进集合T中,在学生中寻找除了u以外且对集合T中的课程评过分的学生作为序列,序列的元素是其学过的按照时间顺序学的且属于T的课程,将全部序列整合到一个表中,如表3所示。
表3
序列号 序列元素
1 abcde
2 acd
3 bacd
4 bcd
5 cabde
然后,将每一节课作为候选序列的一部分,并通过计算候选序列支持度,让支持度大于50%的候选序列作为第一轮的可选序列,计算结果如表4所示。
表4
候选序列 支持度
a 0.8
b 0.8
c 1
d 0.8
e 0.4
其中,支持度的计算方法是:候选序列在总序列表中按序列元素顺序出现的次数占总序列表中序列数量的百分比。由表4可知,当前可选序列为:a、b、c、d。
接着,生成下一轮的候选序列:本实施例以第一轮可选序列作为行标,上一轮的可选序列作为列表,生成一个矩阵,在第i行j列处填入由i作为j的前缀和后缀合并生成元素,并除去相同元素,具体如表5所示。
表5
a b c d
a ab,ba ac,ca ad,da
b ba,ab bc,cb bd,db
c ca,ac cb,bc cd,dc
d da,ad db,bd dc,cd
再接着,生成下一轮的可选序列,本实施例通过计算候选序列的支持度,让支持度大于50%的候选序列作为下一轮的可选序列,如表6所示:
表6
候选序列 支持度
ab 0.4
ac 0.6
ad 0.6
ba 0.2
bc 0.4
bd 0.8
ca 0.2
cb 0.2
cd 1
da 0
db 0
dc 0
由表6可知,当前可选序列为:ac、ad、bd、cd。
然后判断上一步骤是否生成的可选序列,若是,则继续执行生成下一轮的候选序列的步骤;反之,则执行下一步骤。
例如,当前候选序列为表7所示,当前候选序列的支持度为表8所示时,
表7
表8
由表7和表8可知,当前可选序列为:acd、bcd,因此,本实施例返回执行生成下一轮的候选序列的步骤。
而当前候选序列为表9所示,当前候选序列的支持度为表10所示时,
表9
表10
候选序列 支持度
abcd 0.2
bcda 0
acdb 0
bacd 0.2
由表9和表10可知,各个序列的支持度均小于0.5,因此不能生成可选序列,于是本实施例执行下一步骤,即:
对生成的候选序列中,筛选其支持度大于0的序列作为最终序列。
例如:在如表10所示的候选序列中,本实施例的最终序列为:abcd和bacd,则该序列即为最佳的可推荐的课程路径。
综上所述,由于现有技术中的大部分课程推荐系统都具有以下局限性:
单一地考虑局部或全局的信息,具体表现为:只考虑对两个课程之间评分值一样的用户集合、两个用户评过一样分的课程集合(全局信息),或是只考虑对于某一个评分值再分别求对两个课程之间评分值一样的用户集合、两个用户评过一样分的课程集合(局部信息)。
其中,对于只考虑全局信息的缺陷,其对于整个系统中相同偏好的用户、相同类型的课程有很好的表现性,易于捕获全局的倾向,但其忽略了具体用户的评分风格和课程之间的独特性,且容易陷入过拟合;
对于只考虑局部信息的缺陷,其能够很好地看出用户评分一致的课程具有的相同性、不同评分数量之间的差异,评分用户的评分风格等,但是难以从全局去做一个用户和课程相似度的考虑,预测的结果也不稳定。
其次,大部分推荐系统使用传统的MF(Matrix Factorization)方法,直接使用用户-课程评分表作为输入数据进行建模,考虑的维度过于简单,预测的效果并不理想。
因此,本发明提出两种新的模型:约束模型(Constraint Model,CM)、独立评分模型(Rating Independent Model,RIM)来改善以上的问题,CM模型善于捕获全局的总体分布,而RIM模型则善于捕获局部的分布。本发明将该两个模型都将用户-课程评分表作为输入,并各输出一个低维嵌入向量,再将该两种低维嵌入向量作为输入,和历史数据一同输入到训练好的多视图神经网络中,并完成对具体某一个用户对某一门课程的评分预测。
另外,在预测用户对课程评分的过程中,本发明从三个角度(k近邻方法、多视图神经网络方法、用户潜在倾向)预测了用户对课程的评分,而在一个在线教育系统中,用户对课程的评分并不一直遵循某一种规律进行,往往是动态的、变化的,因此本发明通过引入一种机制:动态调整这三个角度对整个评分的权重,来实现适应这种动态变化,使得预测值更加接近真实值。
本发明实施例还提供了一种基于大数据科学和动态权重调整的课程推荐系统,包括:
第一生成模块,用于根据用户对课程的评分,生成用户课程矩阵;
第二生成模块,用于根据用户课程矩阵,生成学生的偏好信息;
模型构建模块,用于根据用户课程矩阵和学生的偏好信息,构建约束模型和独立评分模型;
预测模块,用于根据约束模型和独立评分模型,基于动态权重调整方法生成课程评分预测值;
推荐模块,用于根据课程评分预测值进行课程推荐。
本发明实施例还提供了一种基于大数据科学和动态权重调整的课程推荐系统,包括:
至少一个处理器;
至少一个存储器,用于存储至少一个程序;
当所述至少一个程序被所述至少一个处理器执行,使得所述至少一个处理器实现所述的基于大数据科学和动态权重调整的课程推荐方法。
上述方法实施例中的内容均适用于本系统实施例中,本系统实施例所具体实现的功能与上述方法实施例相同,并且达到的有益效果与上述方法实施例所达到的有益效果也相同。
以上是对本发明的较佳实施进行了具体说明,但本发明并不限于所述实施例,熟悉本领域的技术人员在不违背本发明精神的前提下还可做作出种种的等同变形或替换,这些等同的变形或替换均包含在本申请权利要求所限定的范围内。

Claims (9)

1.基于大数据科学和动态权重调整的课程推荐方法,其特征在于:包括以下步骤:
根据用户对课程的评分,生成用户课程矩阵;
根据用户课程矩阵,生成学生的偏好信息;
根据用户课程矩阵和学生的偏好信息,构建约束模型和独立评分模型;
根据约束模型和独立评分模型,基于动态权重调整方法生成课程评分预测值;
根据课程评分预测值进行课程推荐。
2.根据权利要求1所述的基于大数据科学和动态权重调整的课程推荐方法,其特征在于:所述根据用户课程矩阵,生成学生的偏好信息这一步骤,包括以下步骤:
对用户课程矩阵进行运算,生成第一结果,所述第一结果包括课程共存矩阵和用户共存矩阵;
通过web日志对用户课程矩阵的运算结果进行信息提取,得到学生的偏好信息。
3.根据权利要求2所述的基于大数据科学和动态权重调整的课程推荐方法,其特征在于:所述根据用户课程矩阵和学生的偏好信息,构建约束模型和独立评分模型这一步骤,包括以下步骤:
通过矩阵分解法对第一结果进行求解,得到第二结果;
通过正则化奇异值对第二结果进行求解,得到第三结果;
根据第三结果,构建得到约束模型和独立评分模型。
4.根据权利要求3所述的基于大数据科学和动态权重调整的课程推荐方法,其特征在于:所述根据用户课程矩阵和学生的偏好信息,构建约束模型和独立评分模型这一步骤,还包括以下步骤:
通过约束模型和独立评分模型,建立多视图神经网络。
5.根据权利要求4所述的基于大数据科学和动态权重调整的课程推荐方法,其特征在于:所述通过约束模型和独立评分模型,建立多视图神经网络这一步骤,包括以下步骤:
将约束模型的实时解输入全连接层进行第一训练;
将独立评分模型的实时解输入卷积层进行第二训练;
将约束模型的历史解输入全连接层进行第三训练;
将独立评分模型的历史解输入卷积层进行第四训练;
根据第一训练、第二训练、第三训练和第四训练的结果,建立多视图神经网络。
6.根据权利要求4所述的基于大数据科学和动态权重调整的课程推荐方法,其特征在于:所述根据约束模型和独立评分模型,基于动态权重调整方法生成课程评分预测值这一步骤,包括以下步骤:
通过多视图神经网络生成第一预测分量;
通过学生偏好信息生成第二预测分量;
通过最近邻分类算法生成第三预测分量;
基于动态调整权重机制,分别对第一预测分量、第二预测分量和第三预测分量的权重进行配置;
根据权重配置结果,通过第一预测分量、第二预测分量和第三预测分量生成课程评分预测值。
7.根据权利要求1所述的基于大数据科学和动态权重调整的课程推荐方法,其特征在于:所述根据课程评分预测值进行课程推荐这一步骤,包括以下步骤:
根据用户课程矩阵生成课程序列集合;
计算课程序列集合中每个课程序列的支持度,并获取支持度大于第一阈值的第一课程序列;
将第一课程序列作为当前课程序列,并根据第一课程序列和当前课程序列,生成课程序列矩阵;
计算课程序列矩阵中每个课程序列的支持度;
判断课程序列矩阵中是否存在课程序列的支持度大于第一阈值,若是,则将大于第一阈值的所有课程序列作为当前课程序列,并返回执行根据第一课程序列和当前课程序列,生成课程序列矩阵的步骤;反之,则执行下一步骤;
筛选课程矩阵中支持度大于第二阈值的课程序列,并将该课程序列作为课程推荐结果。
8.基于大数据科学和动态权重调整的课程推荐系统,其特征在于:包括:
第一生成模块,用于根据用户对课程的评分,生成用户课程矩阵;
第二生成模块,用于根据用户课程矩阵,生成学生的偏好信息;
模型构建模块,用于根据用户课程矩阵和学生的偏好信息,构建约束模型和独立评分模型;
预测模块,用于根据约束模型和独立评分模型,基于动态权重调整方法生成课程评分预测值;
推荐模块,用于根据课程评分预测值进行课程推荐。
9.基于大数据科学和动态权重调整的课程推荐系统,其特征在于:包括:
至少一个处理器;
至少一个存储器,用于存储至少一个程序;
当所述至少一个程序被所述至少一个处理器执行,使得所述至少一个处理器实现如权利要求1-7中任一项所述的基于大数据科学和动态权重调整的课程推荐方法。
CN201811376466.6A 2018-11-19 2018-11-19 基于大数据科学和动态权重调整的课程推荐方法及系统 Active CN109582864B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811376466.6A CN109582864B (zh) 2018-11-19 2018-11-19 基于大数据科学和动态权重调整的课程推荐方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811376466.6A CN109582864B (zh) 2018-11-19 2018-11-19 基于大数据科学和动态权重调整的课程推荐方法及系统

Publications (2)

Publication Number Publication Date
CN109582864A true CN109582864A (zh) 2019-04-05
CN109582864B CN109582864B (zh) 2020-11-10

Family

ID=65923118

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811376466.6A Active CN109582864B (zh) 2018-11-19 2018-11-19 基于大数据科学和动态权重调整的课程推荐方法及系统

Country Status (1)

Country Link
CN (1) CN109582864B (zh)

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110490786A (zh) * 2019-07-10 2019-11-22 广东工业大学 一种基于分布式智能图书站的图书更新方法
CN110533971A (zh) * 2019-07-19 2019-12-03 山东至信信息科技有限公司 一种深入互动的智能教学系统
CN110580314A (zh) * 2019-07-16 2019-12-17 华南师范大学 基于图卷积神经网络和动态权重的课程推荐方法和系统
CN110929163A (zh) * 2019-12-09 2020-03-27 上海复深蓝软件股份有限公司 课程推荐方法、装置、计算机设备及存储介质
CN111062449A (zh) * 2019-12-26 2020-04-24 成都终身成长科技有限公司 预测模型的训练方法、兴趣度预测方法、装置和存储介质
CN111079002A (zh) * 2019-11-27 2020-04-28 北京大生在线科技有限公司 一种基于隐式反馈数据的偏好计算方法及数据生成装置
CN111488400A (zh) * 2019-04-28 2020-08-04 北京京东尚科信息技术有限公司 数据分类方法、装置和计算机可读存储介质
CN112614029A (zh) * 2020-12-24 2021-04-06 江苏知途教育科技有限公司 一种选修课程推荐的方法和装置
CN112657117A (zh) * 2020-12-23 2021-04-16 浙江好习惯科技有限公司 跳绳课程推荐方法及装置
CN112749805A (zh) * 2021-01-15 2021-05-04 浙江工业大学 一种基于多种实体关系的在线课程推荐方法
CN112925924A (zh) * 2019-12-05 2021-06-08 北京达佳互联信息技术有限公司 多媒体文件的推荐方法、装置、电子设备及存储介质
CN112948710A (zh) * 2021-03-22 2021-06-11 华南师范大学 基于图神经网络的朋辈教育推荐方法、系统和存储介质
EP3902314A1 (en) * 2020-04-21 2021-10-27 Rohde & Schwarz GmbH & Co. KG Method of training a test system for mobile network testing, test system as well as method of mobile testing
CN113643781A (zh) * 2021-06-25 2021-11-12 合肥工业大学 基于时序预警信号的健康干预方案个性化推荐方法及系统
CN113887852A (zh) * 2021-05-21 2022-01-04 东北大学 一种基于异构图神经的人员推荐方法
CN117290398A (zh) * 2023-09-27 2023-12-26 广东科学技术职业学院 一种基于大数据的课程推荐方法及装置

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105824897A (zh) * 2016-03-14 2016-08-03 湖南大学 基于卡尔曼滤波的混合推荐系统及方法
CN107341204A (zh) * 2017-06-22 2017-11-10 电子科技大学 一种融合物品标签信息的协同过滤推荐方法及系统
US20170344556A1 (en) * 2016-05-31 2017-11-30 Linkedin Corporation Dynamic alteration of weights of ideal candidate search ranking model
CN108268934A (zh) * 2018-01-10 2018-07-10 北京市商汤科技开发有限公司 基于深度学习的推荐方法和装置、电子设备、介质、程序
CN108573411A (zh) * 2018-04-17 2018-09-25 重庆理工大学 基于用户评论的深度情感分析和多源推荐视图融合的混合推荐方法
CN108647996A (zh) * 2018-04-11 2018-10-12 中山大学 一种基于Spark的个性化推荐方法及系统
US20180330232A1 (en) * 2017-05-10 2018-11-15 Fmr Llc Identification and classification of training needs from unstructured computer text using a neural network

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105824897A (zh) * 2016-03-14 2016-08-03 湖南大学 基于卡尔曼滤波的混合推荐系统及方法
US20170344556A1 (en) * 2016-05-31 2017-11-30 Linkedin Corporation Dynamic alteration of weights of ideal candidate search ranking model
US20180330232A1 (en) * 2017-05-10 2018-11-15 Fmr Llc Identification and classification of training needs from unstructured computer text using a neural network
CN107341204A (zh) * 2017-06-22 2017-11-10 电子科技大学 一种融合物品标签信息的协同过滤推荐方法及系统
CN108268934A (zh) * 2018-01-10 2018-07-10 北京市商汤科技开发有限公司 基于深度学习的推荐方法和装置、电子设备、介质、程序
CN108647996A (zh) * 2018-04-11 2018-10-12 中山大学 一种基于Spark的个性化推荐方法及系统
CN108573411A (zh) * 2018-04-17 2018-09-25 重庆理工大学 基于用户评论的深度情感分析和多源推荐视图融合的混合推荐方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
刘沛文: "基于用户行为特征的动态权重混合推荐算法", 《计算机应用与软件》 *
黄立威 等: "基于深度学习的推荐系统研究综述", 《计算机学报》 *

Cited By (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111488400A (zh) * 2019-04-28 2020-08-04 北京京东尚科信息技术有限公司 数据分类方法、装置和计算机可读存储介质
CN110490786A (zh) * 2019-07-10 2019-11-22 广东工业大学 一种基于分布式智能图书站的图书更新方法
CN110490786B (zh) * 2019-07-10 2024-01-05 广东工业大学 一种基于分布式智能图书站的图书更新方法
CN110580314A (zh) * 2019-07-16 2019-12-17 华南师范大学 基于图卷积神经网络和动态权重的课程推荐方法和系统
CN110533971A (zh) * 2019-07-19 2019-12-03 山东至信信息科技有限公司 一种深入互动的智能教学系统
CN111079002B (zh) * 2019-11-27 2023-09-22 北京哈沃在线科技有限公司 一种基于隐式反馈数据的偏好计算方法及数据生成装置
CN111079002A (zh) * 2019-11-27 2020-04-28 北京大生在线科技有限公司 一种基于隐式反馈数据的偏好计算方法及数据生成装置
CN112925924A (zh) * 2019-12-05 2021-06-08 北京达佳互联信息技术有限公司 多媒体文件的推荐方法、装置、电子设备及存储介质
CN110929163A (zh) * 2019-12-09 2020-03-27 上海复深蓝软件股份有限公司 课程推荐方法、装置、计算机设备及存储介质
CN111062449A (zh) * 2019-12-26 2020-04-24 成都终身成长科技有限公司 预测模型的训练方法、兴趣度预测方法、装置和存储介质
EP3902314A1 (en) * 2020-04-21 2021-10-27 Rohde & Schwarz GmbH & Co. KG Method of training a test system for mobile network testing, test system as well as method of mobile testing
CN112657117A (zh) * 2020-12-23 2021-04-16 浙江好习惯科技有限公司 跳绳课程推荐方法及装置
CN112657117B (zh) * 2020-12-23 2022-02-11 浙江好习惯科技有限公司 跳绳课程推荐方法及装置
CN112614029A (zh) * 2020-12-24 2021-04-06 江苏知途教育科技有限公司 一种选修课程推荐的方法和装置
CN112614029B (zh) * 2020-12-24 2024-04-12 江苏知途教育科技有限公司 一种选修课程推荐的方法和装置
CN112749805A (zh) * 2021-01-15 2021-05-04 浙江工业大学 一种基于多种实体关系的在线课程推荐方法
CN112749805B (zh) * 2021-01-15 2024-02-13 浙江工业大学 一种基于多种实体关系的在线课程推荐方法
CN112948710A (zh) * 2021-03-22 2021-06-11 华南师范大学 基于图神经网络的朋辈教育推荐方法、系统和存储介质
CN113887852A (zh) * 2021-05-21 2022-01-04 东北大学 一种基于异构图神经的人员推荐方法
CN113887852B (zh) * 2021-05-21 2024-04-16 东北大学 一种基于异构图神经的人员推荐方法
CN113643781B (zh) * 2021-06-25 2023-07-04 合肥工业大学 基于时序预警信号的健康干预方案个性化推荐方法及系统
CN113643781A (zh) * 2021-06-25 2021-11-12 合肥工业大学 基于时序预警信号的健康干预方案个性化推荐方法及系统
CN117290398A (zh) * 2023-09-27 2023-12-26 广东科学技术职业学院 一种基于大数据的课程推荐方法及装置

Also Published As

Publication number Publication date
CN109582864B (zh) 2020-11-10

Similar Documents

Publication Publication Date Title
CN109582864A (zh) 基于大数据科学和动态权重调整的课程推荐方法及系统
CN106779084B (zh) 机器学习系统及方法
CN110443364A (zh) 一种深度神经网络多任务超参数优化方法及装置
CN107862970B (zh) 一种用于翻转课堂的教学质量评价模型
CN108172047B (zh) 一种网络在线学习资源个性化实时推荐方法
CN108509517B (zh) 一种面向实时新闻内容的流式话题演化跟踪方法
CN111061959B (zh) 一种基于开发者特征的群智化软件任务推荐方法
CN106202377B (zh) 一种基于随机梯度下降的在线协同排序方法
CN106649540A (zh) 一种视频推荐方法及系统
GB2608540A (en) Personalized automated machine learning
CN109871504A (zh) 一种基于异构信息网络与深度学习的课程推荐系统
CN110807509A (zh) 一种基于贝叶斯神经网络的深度知识追踪方法
CN115186097A (zh) 一种基于知识图谱和强化学习的交互式推荐方法
CN111723973A (zh) 基于mooc日志数据中用户行为因果关系的学习效果优化方法
CN106156844A (zh) 用于构建时空神经网络和利用其进行预测的方法和设备
CN111062511B (zh) 基于决策树与神经网络的水产养殖病害预测方法及系统
Song et al. Pluggable reputation systems for peer review: A web-service approach
CN113449182A (zh) 一种知识信息个性化推荐方法及系统
CN111311997B (zh) 一种基于网络教育资源的互动方法
CN112380429A (zh) 一种习题推荐方法及装置
CN109740743A (zh) 一种分层神经网络查询推荐方法及装置
CN115827968A (zh) 一种基于知识图谱推荐的个性化知识追踪方法
CN113742586B (zh) 一种基于知识图谱嵌入的学习资源推荐方法及系统
CN106991432A (zh) 基于评分机制的森林优化算法的特征选择方法
CN113095361A (zh) 一种基于图匹配网络的可对比学习对象生成方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant