在线教育平台中基于多维特征的习题个性化推荐方法
技术领域
本发明涉及大数据分析领域,具体涉及一种在线教育平台中基于多维特征的习题个性化推荐方法。
背景技术
特殊定制,就是根据教学和实际需要进行专门特殊的服务。随着时代的发展,所需要的数据的不同,针对不同的学习者推荐不一样的学习题库,增加了学习者学习效率和学习热情。
在现有的在线学习平台中,一方面学习者往往需要花费大量的时间和精力去寻找自己感兴趣的习题;另一方面,学习者一旦长时间找不到自己感兴趣的习题或者平台推荐的习题不合学习者的风格,学习者对学习平台的满意度就此降低,即可能出现人员流失现象。因此,如果不能恰当的引导学习者,实现习题与学习者的匹配,整个在线学习平台的良性发展必定受到影响。
每个人的知识结构、知识能力和学习能力千差万别,使用的却是同一张卷子。当习题电子化后,机器将根据使用的数据向用户推荐个性化的题目,提高学习效率。所以,一个好的算法,可以极大的帮助精准推荐,提升学习者的学习成绩和学习效率。
近年来,在线学习发展迅速,学习者对学习资源的个性化和实用性的要求越来越高。无论是传统教育还是在线教育,学习资源的质量对教学效果都起着决定性的作用,在在线教育中更是如此。因此,在线教育研究者开始关注在线教育资源的建设,并利用大数据和学习分析技术为学习者提供适合的学习资源推送服务,进而更好的满足在线学习的需求,以实现人性化、个性化的学习。
发明内容
本发明的目的在于针对现有技术的不足,提供一种在线教育平台中基于多维特征的习题个性化推荐方法。
本发明的目的是通过以下技术方案来实现的:一种在线教育平台中基于多维特征的习题个性化推荐方法,该方法包括如下步骤:
1)基于在线教育平台上学习者的学习数据,获得学习者的学习特征;
2)对在线教育平台上的习题进行数据分析,获得习题热度的排名,记录到平台的题库中;
3)根据习题间的知识相关度构建一个习题相关网络;所述习题相关网络中,一个节点表示一个习题,节点之间的边表示两个习题之间的关联性,边的权重表示习题间知识相关度的高低,利用余弦相似度算法计算知识相关度;在习题相关网络的基础上,利用某学习者的学习数据构建一个习题相关子网络;所述习题相关子网络中,以该学习者为中心,与该学习者直接连接的是其正在学习和曾经学习过的习题,与这些习题相连接的是所有与这些习题存在较高知识相关度的候选推荐习题;在习题相关子网络的基础上,通过学习者正在学习和曾经学习过的习题与候选推荐习题之间的余弦相似度计算学习者与候选推荐习题之间的知识相关度;
4)通过多维特征算法,将三个维度的因素进行线性综合,得到学习者与候选推荐习题之间的整体相关度,对所有候选推荐习题的整体相关度进行排名,推荐给学习者个性化的习题。
进一步地,所述在线教育平台,是经过特殊定制的能搜集所需的特定信息的在线教育平台,从平台上获得的特殊数据从而进行个性化推荐习题。
进一步地,所述步骤1)具体为:学习者登录在线教学平台后,首先进行学习前的自我评价和学习风格量表测试,对学习者进行感知、认知和人格三维度的测量,然后通过felder_silverman学习风格模型建模,将学习者的学习特征分为强、中、弱,用公式表示为:
其中Ls(S)表示学习特征的量化数据,SO(S)表示偏弱,MO(S)表示适中,St(S)表示强烈。
进一步地,所述步骤2),对习题热度进行分析,即对现有的题库,通过对学习者的数据分析,主要包括评论、收藏和记录的数据记录来对题库进行从新编排,按照热度进行排序,具体为:
在线教育平台具有收藏、评价及记录功能;学习者如果对某个习题感兴趣,可以利用在线教育平台收藏该习题,这体现了学习者对该习题的兴趣,方便学习者下次学习和查找。个人记录体现了个人的学习记录,综合所有用户的记录则反映了某习题的被选择次数;评论数体现了重点或难点题目的热度,评论数越高,通常热度越高。因此,本发明基于某习题的被收藏数、被评论数、被记录数来度量习题的热度。
收藏数:学习者通过点击习题的收藏按钮,可以收藏自己感兴趣的习题;因此,习题的被收藏数反映学习者对习题的喜欢程度;
记录数:数据库中的记录,记录了学习者在平台中的学习记录;综合所有学习者的学习记录,可以获得每个习题被学习的次数;因此,一个习题被学习的次数越多,则表明该习题越受欢迎;
评论数:学习者通过点击习题的评论按钮,可以对某习题进行评论;通常重点或难点题评论次数高,表明热度高;
基于上述三个指标,本发明设计如下公式来计算一个习题的热度:
PoP(S)=collect(S)+comment(S)+record(S)
其中,Pop(S)表示习题S的热度,collect(S)、comment(S)和record(S)分别表示习题S的收藏数、评论数和记录数。
进一步地,所述步骤3)中:对知识相关度的数据分析,主要是根据知识点的连接性,将题库进行分类编排,编排好后利用余弦相似公式具体量化各个知识点的相关度。
进一步地,所述步骤3)中:学习者L与候选推荐习题S之间的知识相关度的计算公式为:
其中Si表示曾经学习的习题与候选推荐习题之间的知识相关度,Sj表示正在学习的习题与候选推荐习题之间的知识相关度,Sij表示曾经学习和正在学习的习题之间的知识相关度,K表示候选推荐习题的数量。
进一步地,所述步骤4)中:将学习者的学习特征、习题热度和学习者与候选推荐习题之间的知识相关度这三个维度的因素进行线性综合,得出学习者L与候选推荐习题S之间的整体相关度Cor(L,S)的公式如下:
Cor(L,S)=a*nor(PoP(S))+b*nor(Ls(S))+c*nor(Kr(L,S))
其中,nor(x)=x/max(x),表示对某一维度进行归一化;对三个维度的值进行归一化处理,然后加权求和,通过反馈结果调整参数,使参数达到最优;对所有候选推荐习题进行排名,将Top-N的候选习题推荐给学习者。
本发明的有益效果是:由于学习者拥有各种各样的学习特征、不同的教育背景和参差不齐的知识水平,数量庞大的习题类型多样、难度不一,个性化推荐习题面临的最大挑战在于确定学习者的学习风格,准确度量学习者的兴趣以及与习题之间的关系,从而实现为学习者推荐适合的习题。本发明提供了一种在线教育平台中基于多维特征分析的习题个性化推荐方法,该方法根据在线学习者自我评价的文本信息、学习风格量表的前测等隐性学习特征分析和学习行为的显性学习特征分析相结合的方式来确定学习者的学习特征,从习题本身热度、习题间知识相关度以及学习者之间的社交关联度等3个方面量化潜在学习者和习题之间的关联关系,完成习题和学习者的匹配,为学习者提供个性化的习题推荐服务,从而提升学习者的学习效率,也避免了现有的个性化推荐模型量化不足的缺点。
附图说明
图1是本发明基于多维特征的习题个性化推荐方法的框架图;
图2是习题相关子网络示意图;
图3是C语言知识图谱示意图;
图4是C语言平台MySQL题库。
具体实施方式
以下结合附图和具体实施例对本发明作进一步详细说明。
如图1所示,本发明提供了一种在线教育平台中基于多维特征的习题个性化推荐方法,该方法主要是建立新的个性化推荐模型,再将新模型的数据传给在线教育平台进行反馈,从而建立更为精准的推荐数据;该方法具体包括如下步骤:
1)基于在线教育平台上学习者的学习数据,获得学习者的学习特征;
所述在线教育平台,是经过特殊定制的能搜集所需的特定信息的在线教育平台,从平台上获得的特殊数据从而进行个性化推荐习题;
学习者登录在线教学平台后,首先进行学习前的自我评价和学习风格量表测试,对学习者进行感知、认知和人格三维度的测量,然后通过felder_silverman学习风格模型建模,将学习者的学习特征分为强、中、弱,用公式表示为:
其中Ls(S)表示学习特征的量化数据,So(S)表示偏弱,Mo(S)表示适中,St(S)表示强烈。
2)对在线教育平台上的习题进行数据分析,获得习题热度的排名,记录到平台的题库中;
在线教育平台具有收藏、评价及记录功能;学习者如果对某个习题感兴趣,可以利用在线教育平台收藏该习题,这体现了学习者对该习题的兴趣,方便学习者下次学习和查找。个人记录体现了个人的学习记录,综合所有用户的记录则反映了某习题的被选择次数;评论数体现了重点或难点题目的热度,评论数越高,通常热度越高。因此,本发明基于某习题的被收藏数、被评论数、被记录数来度量习题的热度。
收藏数:学习者通过点击习题的收藏按钮,可以收藏自己感兴趣的习题;因此,习题的被收藏数反映学习者对习题的喜欢程度;
记录数:数据库中的记录,记录了学习者在平台中的学习记录;综合所有学习者的学习记录,可以获得每个习题被学习的次数;因此,一个习题被学习的次数越多,则表明该习题越受欢迎;
评论数:学习者通过点击习题的评论按钮,可以对某习题进行评论;通常重点或难点题评论次数高,表明热度高;
基于上述三个指标,本发明设计如下公式来计算一个习题的热度:
PoP(S)=collect(S)+comment(S)+record(S)
其中,Pop(S)表示习题S的热度,collect(S)、comment(S)和record(S)分别表示习题S的收藏数、评论数和记录数。
3)根据习题间的知识相关度构建一个习题相关网络;所述习题相关网络中,一个节点表示一个习题,节点之间的边表示两个习题之间的关联性,边的权重表示习题间知识相关度的高低,利用余弦相似度算法计算知识相关度;在习题相关网络的基础上,利用某学习者的学习数据构建一个习题相关子网络;所述习题相关子网络中,以该学习者为中心,与该学习者直接连接的是其正在学习和曾经学习过的习题,与这些习题相连接的是所有与这些习题存在较高知识相关度(自己设定)的候选推荐习题;如图2所示:Learner1曾经学习过Item1和Item2,且正在学习Item3和Item4,通过习题相关网络可以发现,Item5与Item2和Item3之间存在着一定的相关度,分别是2和3;Item7与Item4和Item1之间存在着较高的相关度,分别是6和5;
在习题相关子网络的基础上,通过学习者正在学习和曾经学习过的习题与候选推荐习题之间的余弦相似度计算学习者L与候选推荐习题S之间的知识相关度,计算公式如下:
其中Si表示曾经学习的习题与候选推荐习题之间的知识相关度,Sj表示正在学习的习题与候选推荐习题之间的知识相关度,Sij表示曾经学习和正在学习的习题之间的知识相关度,K表示候选推荐习题的数量。
4)通过多维特征算法,将学习者的学习特征、习题热度和学习者与候选推荐习题之间的知识相关度这三个维度的因素进行线性综合,得到学习者与候选推荐习题之间的整体相关度,对所有候选推荐习题的整体相关度进行排名,将Top-N的候选习题推荐给学习者;学习者L与候选推荐习题S之间的整体相关度Cor(L,S)的公式如下:
Cor(L,S)=a*nor(PoP(S))+b*nor(Ls(S))+c*nor(Kr(L,S))
其中,nor(x)=x/max(x),表示对某一维度进行归一化;对三个维度的值进行归一化处理,然后加权求和,通过反馈结果调整参数,使参数达到最优。
实施例
在线教育平台教学平台为C语言教学平台,教学平台中通过felder_silverman学习者风格模型建模得到学习者的学习风格特征为nor(Ls(S))=Mo(S)=60,从图4中可以得知,MySQL数据库中已经有了编排好的题库,根据其中的某个习题的习题热度,题目被收藏、记录、评论数推导出习题的热度nor(PoP(S))=130;根据图3中的C语言知识图谱,假设已经做了两百道题,还需要做的习题数量为一百题,取练习题库内容进行推荐,练习题库的题库量设为K=1000,根据公式,对题库中所有的习题进行相关度计算,假设得到某个题目的知识相关值度为nor(Kr(L,S))=125。设定权重值a=0.5,b=0.3,c=0.2,规定Cor数值在八十到一百五十之间为可推荐习题区间,则根据多维算法公式,可以得到:
Cor(L,S)=a*nor(PoP(S))+b*nor(Ls(S))+c*nor(Kr(L,Sj))=108
因80<Cor(L,S)<150,故该习题可作为学习者的推荐习题。
对题库中的每个习题都进行上述计算,可得到一个候选习题排名,抽取一百个题目,即可满足当前的推荐需求。