CN113673773B - 一种融合知识背景和学习时间预测的学习路径推荐方法 - Google Patents

一种融合知识背景和学习时间预测的学习路径推荐方法 Download PDF

Info

Publication number
CN113673773B
CN113673773B CN202110978648.6A CN202110978648A CN113673773B CN 113673773 B CN113673773 B CN 113673773B CN 202110978648 A CN202110978648 A CN 202110978648A CN 113673773 B CN113673773 B CN 113673773B
Authority
CN
China
Prior art keywords
learning
time
resources
score
resource
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110978648.6A
Other languages
English (en)
Other versions
CN113673773A (zh
Inventor
刁秀丽
曾庆田
倪维健
王卓凡
宋正国
鲁法明
温彦
赵华
周长红
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong University of Science and Technology
Original Assignee
Shandong University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong University of Science and Technology filed Critical Shandong University of Science and Technology
Priority to CN202110978648.6A priority Critical patent/CN113673773B/zh
Publication of CN113673773A publication Critical patent/CN113673773A/zh
Application granted granted Critical
Publication of CN113673773B publication Critical patent/CN113673773B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/20Education
    • G06Q50/205Education administration or guidance
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • General Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Mathematical Physics (AREA)
  • General Business, Economics & Management (AREA)
  • Biomedical Technology (AREA)
  • Marketing (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biophysics (AREA)
  • Software Systems (AREA)
  • Educational Administration (AREA)
  • Educational Technology (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Primary Health Care (AREA)
  • Probability & Statistics with Applications (AREA)
  • Development Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种融合知识背景和学习时间预测的学习路径推荐方法,属于学习路径推荐技术领域,该研究同时满足学生有限时间约束和学习得分最大化,具体包括:(1)基于学生历史学习数据,利用关联规则算法挖掘概念图,生成包含概念层和学习资源层的两层概念图;(2)根据新学生知识背景,基于概念图利用深度优先搜索遍历得到所有可能的概念学习路径,并为每一个概念分配一组学习资源,继而针对每条学习路径预测所需学习时间、估算学习得分;(3)推荐满足学生有限学习时间且得分最高的学习路径。本发明能够根据学生的有限学习时间和知识背景推荐个性化的学习路径,满足了学生在时间限制下个性化学习的需要,有利于提高学生的学习效率和效果。

Description

一种融合知识背景和学习时间预测的学习路径推荐方法
技术领域
本发明属于学习路径推荐技术领域,具体涉及一种融合知识背景和学习时间预测的学习路径推荐方法。
背景技术
随着大数据时代的到来,在线教育平台和系统如雨后春笋一般蓬勃涌现,层出不穷。在线学习系统简化了学习任务,使学习者根据自己的学习速度和舒适度进行自主学习。但却面临一些挑战,比如提供符合用户要求和时间限制的学习资源,尤其是当学习者剩余学习时间减少时,学习者是否可以按时完成学习资源的学习,这就需要结合学习者的知识背景进行资源学习时间的预测,进而推荐满足学生有限学习时间的最优学习路径。
由于学习者的时间管理不当、年龄和知识背景等原因,学习者不一定有足够的时间完成所有资源和课程的学习。现已有技术方案的研究目的是为新学习者推荐一条在限制时间内的学习路径,同时最大限度地提高学习者分数。但是,在已有方案中所推荐学习路径的时间是估算的,具体做法是通过取历史学习者的时间和得分均值、中值等方法为新用户计算学习路径的总学习时间和得分。
现有的技术方法虽然也是基于概念图,通过计算根据学习者知识背景生成的学习路径的时间和分数,在限定时间内或预期分数内推荐学习路径,但是其概念图由专家手工创建,不能很好地体现概念之间的隐性关联关系,而且该方法耗时且计算代价昂贵。在有向图中加入学习资源可以成倍地增加路径数,这使得路径生成耗时且计算量大,由于需要估计所有路径的时间和分数,这使得问题更加困难,难以满足大数据环境下复杂计算的需要。
发明内容
为了解决上述问题,本发明提出了一种融合知识背景和学习时间预测的学习路径推荐方法,采用数据挖掘等技术,在学生学习过程中自动收集学习者的学习过程数据和学习需要,并随时调整学习路径,为不同知识背景的学生找到符合自己需求的个性化学习路径,提升学习效果。
本发明的技术方案如下:
一种融合知识背景和学习时间预测的学习路径推荐方法,包括如下步骤:
S1.基于历史学生学习数据,利用关联规则算法构建包含概念层和资源层的两层概念图;
S2.结合新学生的知识背景,基于两层概念图利用深度优先搜索遍历得到所有可能的概念学习路径;
S3.基于历史学生访问资源所获得的得分来估计未访问资源的学习得分;
S4.构建基于注意力机制的双向循环神经网络学习时间预测模型,并对资源所需学习时间进行预测;
S5.为概念学习路径中每个概念分配资源,并结合资源所需学习时间与估计得分推荐满足学生有限学习时间且得分最高的个性化学习路径。
优选地,步骤S1的具体过程如下:
S101.根据历史学生访问学习资源的记录,计算任意两个学习资源间访问情况的一致性;
S102.统计资源访问情况的频繁一项集和频繁二项集;
S103.计算学习资源间关联规则的置信度;
S104.计算概念间的关联度,得到概念矩阵;
S105.根据概念矩阵构造概念图。
优选地,步骤S2中,以新学生知识背景为深度优先搜索方式的起点,以学习最终概念为目的生成所有概念学习路径。
优选地,步骤S3中,估计学习得分的方法包括:平均值和中值法、用户调整法、矩阵分解法、K均值聚类法;其中,用户调整法又包括用户调整平均值方法和用户调整中值方法。
优选地,步骤S4中,采用双向循环神经网络对学习过程数据进行建模,同时引入注意力机制自动学习学习过程中不同学习行为的权重,具体过程如下:
S401.针对每个学生的历史学习过程轨迹σ,对整个轨迹进行不同长度的截取,将得到的不同长度的轨迹前缀σ(k)和其对应的学习时间remain(σj,k)(1≤k≤|σ|),当作训练数据集traink
S402.基于获得的训练数据集traink,利用注意力双向循环网络构建学习时间预测模型;
S403.运用迁移学习训练学习时间预测模型。
优选地,步骤S402中,包括学习行为表示、基于双向RNN的上下文编码、基于注意力机制的学习过程轨迹编码和学习时间预测四个模块;其中,
学习行为表示:基于步骤S401获得的训练集,σ(k)表示学生学习过程轨迹σ的前k个学习行为,将其中的各个学习行为表示为向量rt(1≤t≤k),一个学习行为由学习资源和学习时间两个属性组成,对于学习资源这种离散属性,采用one-hot编码表示为0/1向量,对于学习时间这种连续属性,首先进行离散化处理,然后进行one-hot编码;最后学习行为向量由学习资源向量和学习时间向量拼接而成;
基于双向RNN的上下文编码:从正向和反向两个角度对输入轨迹进行建模,t时刻正向RNN和反向RNN得到的隐向量分别表示为和/>隐向量表示各个学习行为间的关联性,其中/> 每个时刻的上下文编码由正向和反向编码连接得到,即/>
基于注意力机制的学习过程轨迹编码:得到轨迹前缀每个时刻的上下文编码后,便能够得到学生整个学习轨迹的编码,如公式(3)所示,公式中,e为整个学习轨迹的编码,ht为t时刻输出向量上下文编码,αt为第t时刻输出向量上下文编码的权重,能够反映出学生学习第t个学习资源对整个学习时间预测模型的影响度的大小;
使用注意力网络计算不同时刻的上下文权重αt,见公式(4),公式(5);
αt′=softmax(gattT·tanh(watt·ht+batt)) (4)
其中,gatt、watt、batt均为注意力网络的参数;
学习时间预测:根据以上学习轨迹编码,使用全连接网络构建学习时间预测模型,具体计算方式如公式(6)所示,
remain_time(σ(k))=gT·ReLU(w·e+b)) (6)
其中w、b、g是全连接网络的模型参数,使用线性整流函数(ReLU)作为激活函数。
优选地,一个概念包含多组学习资源,每组学习资源包括描述性资源和评价性资源两大类;描述性资源包括文本、视频,评价性资源包括习题、作业;一个概念的学习需先访问一个描述性资源,再访问一个与之配套的评价性资源。
优选地,步骤S5中,每个概念分配一个描述性资源和一个与之对应的评价性资源,若学习描述性资源后剩余学习时间不足以学习评价性资源,则该描述性资源学习得分无效;每组资源的分配需满足时间限制内,针对每一个概念的分配累加其得分并取最大值作为推荐。
优选地,步骤S5中,采用个性化路径推荐算法推荐个性化学习路径,算法具体过程为:
(1)输入所有概念序列paths、学生u、时间上限t;
(2)取得paths中的一条概念路径newpath;
(3)取得newpath上的一个概念concept;
(4)取得concept上的一组学习资源Rm和Rn
(5)若学生u学习Rm时间Time(u,Rm)和学习Rn时间Time(u,Rn)之和不大于剩余学习时间t,添加资源Rm和Rn,Queue.append[Rm],Queue.append[Rn];
(6)剩余学习时间t变为t=t-Time(u,Rm)-Time(u,Rn);
(7)总得分变为score=score+score(u,Rm)+score(u,Rn);
(8)重复过程(3)-(7),直至不满足过程(5);
(9)若score>scoremax,则scoremax=score;
(10)重复过程(2)-(9)直至每条newpath均访问过,最终返回分数最高的路径newpathmax及最高得分scoremax
本发明所带来的有益技术效果:
(1)通过基于数据挖掘技术的概念图自动构建方法得到概念间有向图,根据得到的两层概念图生成所有概念学习序列,与拓扑序列不同,算法遍历的节点不需经过其所有的前驱节点;
(2)基于学生知识背景,利用基于注意力的双向循环神经网络构建模型来预测资源所需的学习时间,而且模型运用了基于迁移学习的训练方法,充分考虑不同长度学习轨迹前缀之间蕴藏的隐性关系,从而提高资源学习时间预测的准确性以及大数据环境下复杂计算的需要;
(3)在学习过程中,能够自动收集学习者的学习过程数据和学习需要,并随时调整学习路径,使得不同知识背景的学生都能够找到符合自己特点的学习路径,能够对学生学习效果起到提升和促进作用,本发明更适合大数据环境下推荐个性化学习路径的计算需要。
附图说明
图1是本发明融合知识背景和学习时间预测个性化学习路径推荐方法的整体框架图;
图2是本发明两层概念图;
图3是本发明基于Attention机制的双向循环神经网络学习时间预测模型的示意图;
图4是本发明个性化学习路径推荐举例的示意图;
图5是本发明Enki数据集的概念图。
具体实施方式
下面结合附图以及具体实施方式对本发明作进一步详细说明:
本发明研究同时满足学生有限时间约束和学习得分最大化,其中涉及的学生学习行为数据包括学生看视频和做题两个方面,通过分析两个学习过程中的学习行为,推动学生个性化学习的开展,研究在时间约束下尽可能获得高分的个性化学习路径,进而进行推荐。
本发明首先针对学生看视频或做题的得分情况以及视频、题目所属概念情况,采用数据挖掘技术构建概念图,并通过深度优先搜索基于概念图构建学习路径;其次,为了对不同的学生进行个性化行为分析,依据学生学习时间和学习频度对学生进行分类,预测学生学习资源所需要的学习时间;最后为每个概念分配一组学习资源,并基于学生知识背景和剩余学习时间,推荐时间约束内得分最高的学习资源路径。
具体来说,本发明突破原有推荐方法的局限性,首先基于学生访问资源情况和资源与概念对应关系,基于数据挖掘技术自动构建得到两层概念图,对得到的两层概念图通过深度优先搜索得到所有的概念学习序列,由于每个概念含有不同的多组学习资源,基于概念学习序列可细化成多条资源序列。然后,在学习者基于概念图指定知识背景之后,重点对学习路径中资源的用时和得分分别进行预测与估计,推荐一条既满足学习者时间限制又能最大化期望分数的路径。其中,时间预测基于历史学生学习轨迹使用基于注意力双向循环神经网络模型的方法,通过训练集生成和模型学习及训练进行预测,然后基于学习者的知识背景和剩余可用时间,在满足学习者需求同时学习分数也最高的情况下,为学习者推荐个性化学习路径。再者,本发明在学习过程中,能够自动收集学习者的学习过程数据和学习需要,并随时调整学习路径。使得不同知识背景的学生都能够找到符合自己特点的学习路径,能够对学生学习效果起到提升和促进作用。本发明更适合大数据环境下推荐个性化学习路径的复杂计算需要。
本发明的整体框架如图1所示,通过历史学生学习数据中获取的学生学习数据记录得到概念图和估计的时间与得分,依据概念图生成概念序列,并结合估计的时间与得分进行学习资源的分配,所有概念分配完成后统计总得分,重复以上过程,针对满足学生学习时间限制内且总得分最高的学习路径进行推荐。概括来说,核心技术为以下三部分:
一、基于关联规则的概念图自动构建和基于概念图的学习路径生成。
采用一种基于数据挖掘技术的概念图自动构建的方法,计算两个学习资源间访问情况的一致性,统计资源访问情况的频繁一项集和频繁二项集,并通过学习资源间关联规则的置信度得到概念间的关联度从而构造概念图。而概念序列的生成基于两层概念图,一个概念包含多个学习资源,学生学习概念的过程就是学习资源的过程。根据得到的两层概念图生成所有概念学习序列,与拓扑序列不同,算法遍历的节点不需经过其所有的前驱节点,以深度优先搜索方式从起点到目标终点,以学习最终概念为目的生成所有学习路径。
二、构建基于Attention机制的双向循环神经网络学习时间预测模型。
个性化学习路径推荐考虑的因素无非是学习资源的时间与得分,因此推荐效果的好坏很大程度取决于学习时间与得分估计的准确性。基于学生知识背景,利用基于注意力双向循环神经网络预测学习资源所需要的学习时间,该方法使用双向循环神经网络对学习过程数据进行建模,同时引入注意力机制自动学习学习过程中不同学习行为的权重。
该过程可分析为回归预测问题,而且模型运用了基于迁移学习的训练方法,充分考虑不同长度学习轨迹前缀之间蕴藏的隐性关系,从而提高资源学习时间预测的准确性以及大数据环境下复杂计算的需要。
三、为概念序列中每个概念分配资源并结合资源学习时间与得分推荐个性化学习路径。
基于生成的概念学习路径和各学生对各学习资源的时间与得分估计进行学习资源分配,每个概念分配一个描述性资源和一个与之对应的评价性资源,若学习描述性资源后剩余学习时间不足以学习评价性资源,则该描述性资源学习得分无效。每组资源的分配需满足时间限制内,针对每一个概念的分配累加其得分并取最大值作为推荐。
为此,根据深度优先搜索算法生成概念序列,然后为每条路径的每一个概念分配学习资源得到资源序列。计算学生在有效的时间内可学完的资源序列,并分别计算每条路径的总得分,其中的最高分路径即是最终可推荐的个性化学习路径。
简单来说,本发明首先基于关联规则的概念图自动构建方法构建概念图并生成概念序列,其次构建基于Attention机制的双向循环神经网络学习时间预测模型,再者对学生访问资源得分进行估计,最后为概念序列中每个概念分配资源并结合时间与得分推荐学习路径。
下面结合一简单示例对本发明技术方案进行详细阐述。
1.基于关联规则的概念图自动构建及概念序列生成。
根据学生访问学习资源的记录,计算两个学习资源间访问情况的一致性,统计资源访问情况的频繁一项集和频繁二项集,并通过学习资源间关联规则的置信度得到概念间的关联度从而构造概念图。基于得到的概念图运用深度优先搜索得到所有的概念学习序列。如下给出一个简单示例,学生资源R-学生S矩阵第一行第二列为1表示资源1被学生2访问过。学习资源R-概念C矩阵/>第一行第二列为0表示资源1不属于概念2。
接下来将针对两个矩阵进行分析并最终得到概念图。具体步骤如下:
1.1分析学习资源访问情况
1)统计两个学习资源的访问情况一致性:对所有学生对R1,R2两个资源访问情况(0为未访问,1为访问)作异或非运算并相加,若值小于学生总数*40%,则无需考虑R1和R2之间的关联规则。如例中支持度count(R1,R2)=count([0,1],[0,0])=(0⊕0)+(1⊕0)=1。
2)统计频繁一项集:统计得到访问过的学习资源的1项集的支持度和未访问过的学习资源的1项集的支持度。如例中R1,R2正确的支持度分别为1,0;R1,R2错误的支持度分别为1,2。
3)统计频繁二项集:统计得到访问过的学习资源的2项集的支持度和未访问过的学习资源的2项集的支持度。如例中R1,R2均访问的2项集支持度为0,0;R1,R2均未访问的支持度为1。
1.2计算关联规则的置信度
计算学习资源关联规则的置信度:例如统计得到“如果学习者访问/未访问过资源Rx,那么他/她在资源Ry中也访问/未访问概率”和“如果学习者访问/未访问过资源Ry,那么他/她在资源Rx中也访问/未访问概率”,最终删掉所有置信度小于0.75的关联规则。如例中首先算出R1访问过情况下R2也访问过的条件概率Confidence(R1->R2)=0,同理Confidence(R2->R1)=0;再计算R1未访问过情况下R2也未访问过的条件概率Confidence(R1’->R2’)=1,同理,Confidence(R2’->R1’)=0.5。
1.3计算概念关联度
1)计算基于资源x—>y下概念i与概念j间关联度rev(Ci,Cj)Rx->Ry,计算方法见公式(1)。如例中rev(C1,C2)R1->R2=RC11*RC22*Confidence(R1->R2)=1*1*0=0,rev(C1,C2)R1’->R2’=RC11*RC22*Confidence(R1’->R2’)=1*1*1=1,同理算出rev(C2->C1)R1->R2与rev(C2->C1)R1’->R2’均为0。
rev(Ci,Cj)Rx->Ry=RCxi*RCyj*Confidence(Rx-> Ry) (1)
2)舍弃关联度小于0.5的概念关系,大值对应关系可覆盖小值对应关系,如例中rev(C1,C2)最大值为1,而rev(C2->C1)最大值为0,所以C1->C2可覆盖C2->C1,最终可确定一条C1指向C2的有向弧。
1.4概念图与概念序列生成
1)根据1.3得到的概念矩阵得到概念图,而概念序列的生成基于两层概念图,如图2所示。一个概念包含多个学习资源,学生学习概念的过程就是学习资源的过程。资源有两大类:描述性资源(如文本,视频),评价性资源(如习题,作业)。两类学习资源需搭配,先学习描述类,再学习评价类。一个概念的学习仅需访问一个描述性资源和一个与之配套的评价性资源。
2)根据得到的两层概念图生成所有概念学习序列,与拓扑序列不同,算法遍历的节点不需经过其所有的前驱节点,以深度优先搜索方式从起点(由学习者确定)到目标终点,以学习最终概念为目的生成所有学习路径。
深度优先搜索算法的具体过程为:
(1)输入起始源点initialnode、概念图G、终止汇点endnode;
(2)从G中起点initialnode出发搜索新节点node;
(3)如果node不在newpath中则添加node;
(4)重复过程(3)直到新节点为终止汇点endnode结束并返回一条路径newpath,将newpath添加进paths;
(5)重复过程(2)-(4),直至paths中不再有新的newpath;
(6)输出所有概念序列paths。
2.构建基于Attention机制的双向循环神经网络学习时间预测模型
个性化学习路径推荐考虑的关键因素包括学习资源的学习时间与得分,因此推荐效果的好坏很大程度取决于资源学习时间与得分估计的准确性。利用基于注意力双向循环神经网络预测学习资源所需要的学习时间,该方法使用双向循环神经网络对学习过程数据进行建模,同时引入注意力机制自动学习学习过程中不同学习行为(学习行为指学完某个学习资源的行为)的权重。该模型训练可分为三个步骤:训练集生成、学习时间预测模型构建及基于迁移学习的模型训练。
2.1训练集生成
该阶段的目标是将学生的学习过程数据转换成算法可以使用的训练数据。具体做法是针对每个学生的历史学习过程轨迹σ,对整个轨迹进行不同长度的截取,将得到的不同长度的轨迹前缀σ(k)和其对应的学习时间remain(σj,k)(1≤k≤|σ|),当作训练数据集traink
训练数据集生成算法的具体过程为:
(1)输入数据为学生学习过程日志记录Data以及学生学习轨迹最小前缀长度lmin,最大前缀长度lmax。首先对每个学生学习过程日志中的历史学习轨迹σ(每个学生有且仅有一条σ)在指定长度[lmin,lmax]之内对其进行截取,即所有学生的长度为k的轨迹前缀所包含的{(σk,remain(σ,k))}集合并在一起作为长度为k的训练数据集;
(2)从长度为min到长度为max的max-min+1条不同长度的轨迹前缀σ(k)及其对应的时间remain(σ,k)作为长度为k的训练数据集traink的训练样本(初始traink为空);
(3)所有学生的长度为k的轨迹前缀所包含的{(σk,remain(σ,k))}集合并在一起作为长度为k的训练数据集,traink=traink∪(σk,remain(σ,k));
(4)输出最终训练数据集traink,包括trainmin、trainmin+1、…、trainmax
基于以上获得的训练集traink,可进行学习时间预测模型的训练,该过程可分析为回归预测问题,见公式(2)中,前一项为训练集上的预测误差,使用均方误差计算;后项Ω(f)为正则项,克服模型学习过程中的过拟合问题;
2.2学习时间预测模型构建
如图3所示,该部分利用注意力双向循环网络构建学习时间预测模型,包括学习行为表示、基于双向RNN的上下文编码、基于注意力机制的学习过程轨迹编码和学习时间预测4个模块。
(1)学习行为表示
基于步骤2.1获得的训练集,σ(k)表示学生学习过程轨迹σ的前k个学习行为,将其中的各个学习行为表示为向量rt(1≤t≤k),一个学习行为由学习资源和学习时间两个属性组成,对于学习资源这种离散属性,采用one-hot编码表示为0/1向量,对于学习时间这种连续属性,首先进行离散化处理,然后进行one-hot编码。最后学习行为向量由学习资源向量和学习时间向量拼接而成。
(2)基于双向RNN的上下文编码
从正向和反向两个角度对输入轨迹进行建模,t时刻正向RNN和反向RNN得到的隐向量分别表示为和/>隐向量能表示各个学习行为间的关联性,其中/> 每个时刻的上下文编码由正向和反向编码连接得到,即
(3)基于注意力机制的学习过程轨迹编码
根据(2)得到轨迹前缀每个时刻的上下文编码后,便能够得到学生整个学习轨迹的编码,如公式(3)所示,公式中,e为整个学习轨迹的编码,ht为t时刻输出向量上下文编码,αt为第t时刻输出向量上下文编码的权重,能够反映出学生学习第t个学习资源对整个学习时间预测模型的影响度的大小。
关键所在便是求解每个αt的值,使用Attention网络计算不同时刻的上下文权重,见公式(4),公式(5)。
αt′=softmax(gattT·tanh(watt·ht+batt)) (4)
其中,gatt、watt、batt均为注意力网络的参数。
(4)学习时间预测
根据以上学习轨迹编码,使用全连接网络构建时间预测模型,具体计算方式如公式(6)所示。
remain_time(σ(k))=gT·ReLU(w·e+b)) (6)
其中w、b、g是全连接网络的模型参数,使用线性整流函数(ReLU)作为激活函数。
2.3基于迁移学习的模型训练
该研究运用迁移学习训练学习时间预测模型,充分考虑不同长度的学习轨迹前缀之间蕴藏的隐性关系,从而提高预测的准确性。
其中,迁移学习的模型训练算法的具体过程为:
(1)输入训练集trainmin、trainmin+1、…、trainmax,即以长度为min的训练数据集到长度为max的训练数据集作为输入;
(2)根据基于注意力机制的双向循环神经网络下以一定的初始参数训练长度为min的训练数据集trainmin得到长度为min的训练模型fmin
(3)紧接着将fmin的模型参数作为训练长度为min+1的训练数据集的模型初始值,推进直到得到fmax
(4)fmax的模型参数又可作为训练长度为min的训练数据集的模型初始值,迭代整个过程直到收敛(模型的预测效果达到稳定);
(5)输出不同长度预测效果较好的预测模型fmin、fmin+1、…、fmax
学习时间预测模型预测资源所需的学习时间,进而预测学生学完某个资源后的剩余学习时间,而学习路径推荐需要得到的是访问某个资源的执行时间,因此还需做如下分析:首先得到学习过程轨迹前缀lmax-1所需要的学习时间,即当作该轨迹(学生)访问最后一个资源的执行时间tmax,其次得到的轨迹前缀lmax-2所需要的学习时间减去tmax,即为该轨迹(学生)访问倒数第二个资源的执行时间tmax-1,依此方法可得到学生访问所有资源的执行时间。
3.对学生访问资源得分进行估计
在我们的数据集中,学习者的得分以二分类表示(0:没学完某个资源和1:学完某个资源),因此学习得分意味着学习者完成学习资源的能力。
基于历史学生访问资源所获得的得分来估计未访问资源的学习得分,有以下几种方法。
方法1:平均值和中值法
针对学生未访问学习过的资源,其得分可由所有访问过该资源学生的学习得分的平均值或中值作为估计的标准。若存在学习资源冷启动问题(某资源未被任何学生学习过),则以学生已访问过所有资源获得得分的平均值代替。
方法2:用户调整法
包括用户调整平均值方法(UA-Mean)(见公式7和8)和用户调整中值方法(UA-Median)(见公式9,10)。针对于UA-Mean,公式(7)中,Au为学生能力指数,代表学生获得得分多少的能力,分子为学生u学习资源i(u已经访问过)的得分,分母/>为所有学过资源i的学生学习i获得的平均得分,n值为学生u访问过的学习资源的个数。公式(8)中,能力指数Au乘以学生u未访问过但其他人访问过的资源x的平均获得得分,即可得到学生u对资源x的得分估计Sx。同理,公式(9)中,/>为所有学过资源i的学生学习i获得得分的中值;公式(10)中,/>为学生u未访问过但其他人访问过的资源x的获得得分中值。
方法3:矩阵分解法
将学生-资源矩阵分解为学生-k矩阵和资源-k的转置矩阵,k为学生反馈的学习到的潜在特征的总数目,使用交叉验证的方法获得最佳的k值,先随机初始化矩阵p、q,用平方项损失作为损失函数,再使用梯度下降法获得修正的p和q分量,最后不停迭代直到算法最终收敛,损失函数如公式(11)所示。
方法4:K均值聚类法
采用K-means方法依据学生学习资源的时间与访问资源的频数进行分类,将学生分为三个簇,以同一个集群中学生在目标资源上获得的平均得分作为估计得分(该集群中所有学生均未学习过资源x,则根据能力指数估算);若存在学习资源冷启动问题(资源x未被该集群任何学生学习过,则使用Mean方法估计)。
4.为概念序列中每个概念分配资源并结合时间与得分推荐学习路径。
4.1基于概念的学习资源分配
基于生成的概念学习路径和各学生对各学习资源的学习时间进行预测与得分估计进行学习资源分配,每个概念分配一个描述性资源和一个与之对应的评价性资源,若学习描述性资源后剩余学习时间不足以学习评价性资源,则该描述性资源学习得分无效。每组资源的分配需满足时间限制内,针对每一个概念的分配累加其得分并取最大值。
个性化路径推荐算法的具体过程如下:
(1)输入所有概念序列paths、学生u、时间上限t;
(2)取得paths中的一条概念路径newpath;
(3)取得newpath上的一个概念concept;
(4)取得concept上的一组学习资源Rm和Rn
(5)若学生u学习Rm时间Time(u,Rm)和学习Rn时间Time(u,Rn)之和不大于剩余学习时间t,添加资源Rm和Rn,Queue.append[Rm],Queue.append[Rn];
(6)剩余学习时间t变为t=t-Time(u,Rm)-Time(u,Rn);
(7)总得分变为score=score+score(u,Rm)+score(u,Rn);
(8)重复过程(3)-(7),直至不满足过程(5);
(9)若score>scoremax,则scoremax=score;
(10)重复过程(2)-(9)直至每条newpath均访问过,最终返回分数最高的路径newpathmax及最高得分scoremax
4.2融合知识背景和学习时间预测的学习路径推荐
图4展示了本发明的一个实例,如图所示,假设某学生知识背景为A概念,我们首先根据深度优先搜索(DFS)算法得出了概念序列有A->E->C->D,A->E->F->D,A->G->F->D,然后为每条路径的每一个概念分配学习资源得到资源序列。例如,A->E->C->D路径中,A,E,C均仅有一个描述性资源和一个评价性资源,而D有两组资源可供选择,因此生成两种资源序列。图中黑色实线代表用时间截止线,本例时间限制为50分钟,黑色虚线代表有效资源学习线,两线之间的学习资源因未能配套完整地学习而舍弃。例如,本例中,A,E,F,D路径3中,学生在有效的时间内学完了资源1,2,3,6,13,14,7,但资源7需搭配资源8使用,因未能访问资源8,导致资源7访问无效,将被舍弃忽略。最终分别计算每条路径总得分,最高分路径作为个性化学习路径推荐。
为了充分证明本发明的可行性和优越性,还进行了一定的对比实验和分析研究。
常规线下学习遵循的是循序渐进,由专家规定的静态的资源学习序列,而融合知识背景和时间约束的个性化学习路径推荐能够综合学生的行为特征,进行有方向性地调整学习路径策略,以在一定时间限制内尽可能提高学习成绩,增强学习效果。图5为Enki数据集概念图,专家根据自己教授风格规定一条学习概念7的深度优先搜索路径,表1为某一学生在550min时间限制内的个性化学习路径与专家规定路径4->2->5->3->6->7推荐效果比较,可以看出在一定时间限制下,个性化学习路径能够提高学生得分。
同时,本发明针对Enki数据集,将个性化学习路径推荐预测的学习时间和利用UA_Median方法计算的资源总得分与专家推荐的得分进行比较,资源的个性化推荐相比专家规定总分较高,可知该推荐方法提高了学习成绩,表明个性化学习路径推荐确实具有提高教学质量的积极实践意义。
表1推荐效果对比
当然,上述说明并非是对本发明的限制,本发明也并不仅限于上述举例,本技术领域的技术人员在本发明的实质范围内所做出的变化、改型、添加或替换,也应属于本发明的保护范围。

Claims (6)

1.一种融合知识背景和学习时间预测的学习路径推荐方法,其特征在于,包括如下步骤:
S1.基于历史学生学习数据,利用关联规则算法构建包含概念层和资源层的两层概念图;
S2.结合新学生的知识背景,基于两层概念图利用深度优先搜索遍历得到所有可能的概念学习路径;
S3.基于历史学生访问资源所获得的得分来估计未访问资源的学习得分;
S4.构建基于注意力机制的双向循环神经网络学习时间预测模型,并对资源所需学习时间进行预测;
所述步骤S4中,采用双向循环神经网络对学习过程数据进行建模,同时引入注意力机制自动学习学习过程中不同学习行为的权重,具体过程如下:
S401.针对每个学生的历史学习过程轨迹σ,对整个轨迹进行不同长度的截取,将得到的不同长度的轨迹前缀σ(k)和其对应的学习时间remain(σj,k)(1≤k≤|σ|),当作训练数据集traink
S402.基于获得的训练数据集traink,利用注意力双向循环网络构建学习时间预测模型;
所述步骤S402中,包括学习行为表示、基于双向RNN的上下文编码、基于注意力机制的学习过程轨迹编码和学习时间预测四个模块;其中,
学习行为表示:基于步骤S401获得的训练集,σ(k)表示学生学习过程轨迹σ的前k个学习行为,将其中的各个学习行为表示为向量rt(1≤t≤k),一个学习行为由学习资源和学习时间两个属性组成,对于学习资源这种离散属性,采用one-hot编码表示为0/1向量,对于学习时间这种连续属性,首先进行离散化处理,然后进行one-hot编码;最后学习行为向量由学习资源向量和学习时间向量拼接而成;
基于双向RNN的上下文编码:从正向和反向两个角度对输入轨迹进行建模,t时刻正向RNN和反向RNN得到的隐向量分别表示为和/>隐向量表示各个学习行为间的关联性,其中/>每个时刻的上下文编码由正向和反向编码连接得到,即/>
基于注意力机制的学习过程轨迹编码:得到轨迹前缀每个时刻的上下文编码后,便能够得到学生整个学习轨迹的编码,如公式(3)所示,公式中,e为整个学习轨迹的编码,ht为t时刻输出向量上下文编码,αt为第t时刻输出向量上下文编码的权重,能够反映出学生学习第t个学习资源对整个学习时间预测模型的影响度的大小;
使用注意力网络计算不同时刻的上下文权重αt,见公式(4),公式(5);
αt′=softmax(gattT·tanh(watt·ht+batt)) (4)
其中,gatt、watt、batt均为注意力网络的参数;
学习时间预测:根据以上学习轨迹编码,使用全连接网络构建学习时间预测模型,具体计算方式如公式(6)所示,
remain_time(σ(k))=gT·ReLU(w·e+b)) (6)
其中w、b、g是全连接网络的模型参数,使用线性整流函数(ReLU)作为激活函数;
S403.运用迁移学习训练学习时间预测模型;迁移学习的模型训练算法的具体过程为:
(1)输入训练集trainmin、trainmin+1、…、trainmax,即以长度为min的训练数据集到长度为max的训练数据集作为输入;
(2)根据基于注意力机制的双向循环神经网络下以一定的初始参数训练长度为min的训练数据集trainmin得到长度为min的训练模型fmin
(3)紧接着将fmin的模型参数作为训练长度为min+1的训练数据集的模型初始值,推进直到得到fmax
(4)fmax的模型参数又可作为训练长度为min的训练数据集的模型初始值,迭代整个过程直到收敛(模型的预测效果达到稳定);
(5)输出不同长度预测效果较好的预测模型fmin、fmin+1、…、fmax
S5.为概念学习路径中每个概念分配资源,并结合资源所需学习时间与估计得分推荐满足学生有限学习时间且得分最高的个性化学习路径;
所述步骤S5中,采用个性化路径推荐算法推荐个性化学习路径,算法具体过程为:
(1)输入所有概念序列paths、学生u、时间上限t;
(2)取得paths中的一条概念路径newpath;
(3)取得newpath上的一个概念concept;
(4)取得concept上的一组学习资源Rm和Rn
(5)若学生u学习Rm时间Time(u,Rm)和学习Rn时间Time(u,Rn)之和不大于剩余学习时间t,添加资源Rm和Rn,Queue.append[Rm],Queue.append[Rn];
(6)剩余学习时间t变为t=t-Time(u,Rm)-Time(u,Rn);
(7)总得分变为score=score+score(u,Rm)+score(u,Rn);
(8)重复过程(3)-(7),直至不满足过程(5);
(9)若score>scoremax,则scoremax=score;
(10)重复过程(2)-(9)直至每条newpath均访问过,最终返回分数最高的路径newpathmax及最高得分scoremax
2.根据权利要求1所述一种融合知识背景和学习时间预测的学习路径推荐方法,其特征在于,所述步骤S1的具体过程如下:
S101.根据历史学生访问学习资源的记录,计算任意两个学习资源间访问情况的一致性;
S102.统计资源访问情况的频繁一项集和频繁二项集;
S103.计算学习资源间关联规则的置信度;
S104.计算概念间的关联度,得到概念矩阵;
S105.根据概念矩阵构造概念图。
3.根据权利要求1所述一种融合知识背景和学习时间预测的学习路径推荐方法,其特征在于,所述步骤S2中,以新学生知识背景为深度优先搜索方式的起点,以学习最终概念为目的生成所有概念学习路径。
4.根据权利要求1所述一种融合知识背景和学习时间预测的学习路径推荐方法,其特征在于,所述步骤S3中,估计学习得分的方法包括:平均值和中值法、用户调整法、矩阵分解法、K均值聚类法;其中,用户调整法又包括用户调整平均值方法和用户调整中值方法。
5.根据权利要求1所述一种融合知识背景和学习时间预测的学习路径推荐方法,其特征在于,一个概念包含多组学习资源,每组学习资源包括描述性资源和评价性资源两大类;描述性资源包括文本、视频,评价性资源包括习题、作业;一个概念的学习需先访问一个描述性资源,再访问一个与之配套的评价性资源。
6.根据权利要求5所述一种融合知识背景和学习时间预测的学习路径推荐方法,其特征在于,所述步骤S5中,每个概念分配一个描述性资源和一个与之对应的评价性资源,若学习描述性资源后剩余学习时间不足以学习评价性资源,则该描述性资源学习得分无效;每组资源的分配需满足时间限制内,针对每一个概念的分配累加其得分并取最大值作为推荐。
CN202110978648.6A 2021-08-25 2021-08-25 一种融合知识背景和学习时间预测的学习路径推荐方法 Active CN113673773B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110978648.6A CN113673773B (zh) 2021-08-25 2021-08-25 一种融合知识背景和学习时间预测的学习路径推荐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110978648.6A CN113673773B (zh) 2021-08-25 2021-08-25 一种融合知识背景和学习时间预测的学习路径推荐方法

Publications (2)

Publication Number Publication Date
CN113673773A CN113673773A (zh) 2021-11-19
CN113673773B true CN113673773B (zh) 2024-01-23

Family

ID=78546216

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110978648.6A Active CN113673773B (zh) 2021-08-25 2021-08-25 一种融合知识背景和学习时间预测的学习路径推荐方法

Country Status (1)

Country Link
CN (1) CN113673773B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114998071B (zh) * 2022-08-04 2022-10-25 中国电子科技集团公司第十五研究所 一种航空管制模拟训练智能教学方法和系统

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110275964A (zh) * 2019-06-26 2019-09-24 程淑玉 基于知识图谱与循环神经网络的推荐模型
CN110930274A (zh) * 2019-12-02 2020-03-27 中山大学 一种基于认知诊断的实践效果评估及学习路径推荐系统和方法
CN111915395A (zh) * 2020-07-07 2020-11-10 云境商务智能研究院南京有限公司 一种基于多视图注意力机制的旅游包推荐方法
CN111949306A (zh) * 2020-07-06 2020-11-17 北京大学 一种支持开源项目碎片化学习的推送方法和系统
CN112100439A (zh) * 2020-07-14 2020-12-18 山东科技大学 基于依赖关系嵌入与神经注意力网络的推荐方法
CN112613736A (zh) * 2020-12-23 2021-04-06 贵州树精英教育科技有限责任公司 一种基于大数据的学习行为分析系统
CN113190751A (zh) * 2021-05-10 2021-07-30 南京理工大学 一种融合关键词生成的推荐算法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150170536A1 (en) * 2013-12-18 2015-06-18 William Marsh Rice University Time-Varying Learning and Content Analytics Via Sparse Factor Analysis
US11074829B2 (en) * 2018-04-12 2021-07-27 Baidu Usa Llc Systems and methods for interactive language acquisition with one-shot visual concept learning through a conversational game

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110275964A (zh) * 2019-06-26 2019-09-24 程淑玉 基于知识图谱与循环神经网络的推荐模型
CN110930274A (zh) * 2019-12-02 2020-03-27 中山大学 一种基于认知诊断的实践效果评估及学习路径推荐系统和方法
CN111949306A (zh) * 2020-07-06 2020-11-17 北京大学 一种支持开源项目碎片化学习的推送方法和系统
CN111915395A (zh) * 2020-07-07 2020-11-10 云境商务智能研究院南京有限公司 一种基于多视图注意力机制的旅游包推荐方法
CN112100439A (zh) * 2020-07-14 2020-12-18 山东科技大学 基于依赖关系嵌入与神经注意力网络的推荐方法
CN112613736A (zh) * 2020-12-23 2021-04-06 贵州树精英教育科技有限责任公司 一种基于大数据的学习行为分析系统
CN113190751A (zh) * 2021-05-10 2021-07-30 南京理工大学 一种融合关键词生成的推荐算法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
一种基于本体和循环神经网络的在线学习资源推荐技术;《情报理论与实践》;《情报理论与实践》;第42卷(第12期);第151页右栏、第152页、第153页左栏 *
基于多维度推荐的智慧在线学习系统;吴冉等;《计算机系统应用》;第24卷(第12期);第88-92页 *
基于词共现的概念图自动构建研究;张会平等;《情报理论与实践》;第31卷(第06期);第928-930、903页 *

Also Published As

Publication number Publication date
CN113673773A (zh) 2021-11-19

Similar Documents

Publication Publication Date Title
CN111460249B (zh) 一种基于学习者偏好建模的个性化学习资源推荐方法
Li et al. A consensus model for large-scale linguistic group decision making with a feedback recommendation based on clustered personalized individual semantics and opposing consensus groups
Esteban et al. Helping university students to choose elective courses by using a hybrid multi-criteria recommendation system with genetic optimization
CN110930274B (zh) 一种基于认知诊断的实践效果评估及学习路径推荐系统和方法
Liu et al. Automated feature selection: A reinforcement learning perspective
Bucos et al. Predicting student success using data generated in traditional educational environments
CN109840833B (zh) 贝叶斯协同过滤推荐方法
Wenmackers et al. Probability of inconsistencies in theory revision: a multi-agent model for updating logically interconnected beliefs under bounded confidence
Falcó et al. Allowing agents to be imprecise: A proposal using multiple linguistic terms
CN110889450A (zh) 超参数调优、模型构建方法和装置
CN108921342A (zh) 一种物流客户流失预测方法、介质和系统
CN113673773B (zh) 一种融合知识背景和学习时间预测的学习路径推荐方法
CN113449182B (zh) 一种知识信息个性化推荐方法及系统
CN112988851B (zh) 反事实预测模型数据处理方法、装置、设备及存储介质
Hagedoorn et al. Massive open online courses temporal profiling for dropout prediction
CN112395494A (zh) 一种基于生成对抗网络的双向动态推荐系统
Simpson Combined decision making with multiple agents
CN109919219A (zh) 一种基于粒计算ML-kNN的Xgboost多视角画像构建方法
CN115221955A (zh) 基于样本差异分析的多深度神经网络参数融合系统及方法
Protasov et al. How to reduce the probability of erroneous decisions in the systems of collective intelligence
Liang et al. Incremental deep forest for multi-label data streams learning
Zhao et al. Hybrid fuzzy rule-based classification system for MOODLE LMS system
CN111079003A (zh) 一种社交圈为关键支撑的潜在偏好关联预测模型的技术方案
CN112200474A (zh) 教学质量评价方法、终端设备及计算机可读存储介质
CN111612572A (zh) 一种基于推荐系统的自适应局部低秩矩阵近似建模方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant