发明内容
本发明的目的是提供一种基于遗传算法的个性化试卷推送方法,利用学习者在学习平台的行为数据,并针对学习者在学习过程中涉及到的知识点和对应知识点的学习强度,在试题库中选择试题,组成最适合于该学习者当前的个性化试卷进行推送。
本发明所采用的技术方案是,一种基于遗传算法的个性化试卷推送方法,具体按照如下步骤实施:
步骤1,对学习者在学习平台学习积极性的量化
通过对学习者在学习平台的行为数据的统计,包括系统登录次数、系统登陆时长、累计在线时长、在线时间间隔、离开平台的时长、离开平台的次数和登录时间离线时间,计算学习者在学习平台上的学习积极性;
步骤2,对学习者在学习平台学习交互度的量化
通过对学习者在学习平台中的论坛参与数据的计算,包括论坛浏览次数浏览时长、帖子的浏览量和点赞量与评论量,学习者的发帖量与被点赞和被评论量的计算,计算计算学习者在学习平台学习交互度;
步骤3,对学习者在学习平台学习投入的量化;
步骤4,对学习者在学习平台学习强度的量化;
根据步骤1-3中对学习者学习积极性、学习交互度和学习投入的量化数据,对学习者的知识点学习强度进行量化;
步骤5,试卷评价指标的建立
分别从试卷完成度、试卷知识点覆盖度、试卷信度和试卷效度四个方面建立试卷评价指标;
步骤6,通过试卷的四个评价指标建立组卷目标函数;
步骤7,采用遗传算法模型对组卷目标函数进行优化,输出适应度值最高的个体,即就是最适合的试卷,推送给学习者。
本发明的特征还在于,
步骤1具体为:
步骤1.1,在自适应学习平台的学习者行为数据库中取到学习者在学习阶段每次登录系统与登出系统的信息,包括登录系统的时间和登出系统的时间,通过公式(1)分别计算学习者每次系统登录停留的时长:
tdi=tend(i)-tstart(i) (1)
其中,tdi为学习者第i次登录系统停留的时长,tend(i)为学习者第i次登出系统的时间,tstart(i)为学习者第i次登录系统的时间,单位为分钟;
步骤1.2,通过对步骤1.1中学习者每次登录系统停留时长的求和计算,通过公式(2)计算出学习者在学习系统的累计在线时长:
其中,T为学习者在系统累计在线时长,tdi为学习者第i次登录系统停留的时长,系统累计登陆次数为m,单位为分钟;
步骤1.3,在自适应学习平台的学习者行为数据库中取到学习者在学习阶段每次登录系统与登出系统的信息,其中包括登录系统的时间和登出系统的时间,通过公式(3)计算学习者每次系统登录时间间隔:
tgap(i)=tstart(i)-tend(i-1)(i>1) (3)
其中,tstart(i)为学习者第i次登录系统的时间,tend(i-1)为学习者第i-1次离开系统的时间,tgap(i)为系统登录时间间隔,即就是第i次登录时间和第i-1次退出登录时间的间隔,单位为分钟;
步骤1.4,对步骤1.3中学习者每次系统登录时间间隔进行求和计算,通过公式(4)计算学习者的系统累计登录间隔:
其中,Tgap为系统累计登陆间隔,m为系统累计登陆次数,tgap(i)为学习者第i次登录系统的时间间隔,单位为分钟;
步骤1.5,在自适应学习平台的学习者行为数据库中取到学习者在单次登录中离开系统和回到系统的时间,通过公式(5)计算学习者每次登录系统中累计离开系统的时长:
其中,pi为第i次登录中累计离开系统的时长,n为第i次登录中离开系统的次数,tback(ij)为第i次登录中第j次回到系统的时间,tleave(ij)为第i次登录中第j次离开系统的时间,单位为分钟;
步骤1.6,利用步骤1.1中对学习者每次系统登录停留的时长的计算和步骤1.5中对学习者每次登录系统中累计离开系统的时长的计算,通过公式(6)计算学习者单次登录中的专注度:
其中,qi为学习者第i次登录系统中的专注度,tdi学习者第i次系统登录停留的时长,pi为第i次登录中累计离开系统的时长;
步骤1.7,利用步骤1.5中对学习者每次登录系统中累计离开系统的时长进行求和计算,通过公式(7)计算学习者累计离开系统的时长:
其中,P为累计离开系统的时长,m为系统累计登陆次数,pi为学习者第i次登录中累计离开系统的时长,单位为分钟;
步骤1.8,利用步骤1.2中对学习者在学习系统的累计在线时长的计算和步骤1.7中对学习者累计离开系统的时长的计算,通过公式(8)计算学习者的系统累计专注度:
其中,R为系统累计专注度,T为学习者在系统累计在线时长,P为累计离开系统的时长;
步骤1.9,利用步骤1.2中对学习者在学习系统的累计在线时长的计算和步骤1.4中对学习者的系统累计登录间隔的计算,通过公式(9)计算学习者活跃度:
其中,S为学习者的系统活跃度,T为学习者在系统累计在线时长,Tgap为系统累计登陆间隔;
步骤1.10,利用步骤1.8中对学习者的系统累计专注度和步骤1.9中对学习者活跃度的计算,通过公式(10)计算学习者的学习积极性A:
A=α1*R+α2*S (10)
其中,α为权重参数
α
1取值为0.6,α
2取值为0.4,R为系统累计专注度,S为学习者活跃度。
步骤2具体为:
步骤2.1,在自适应学习平台的学习者行为数据库中取到学习者在学习阶段中的论坛浏览记录,将论坛浏览集合记为
通过公式(11)计算学习者浏览帖子的帖子点赞率:
其中,qapprove为帖子点赞量,|Pforum|为帖子浏览量,|Pforum|=n_browser;
通过公式(12)计算学习者浏览帖子的帖子评论率:
其中,rcomment为帖子评论量,|Pforum|为帖子浏览量,|Pforum|=n_browser;
步骤2.2,在自适应学习平台的学习者行为数据库中取到学习者在学习阶段中的论坛发帖记录,将论坛发帖集合记为
论坛发帖量为|S
forum|,|S
forum|=m_send;
通过公式(13)计算学习者发布帖子收到的点赞量Usend:
其中,ui为发布第i个帖子收到的点赞量;
通过公式(14)计算学习者发布帖子收到的评论量Vsend:
其中,vi为发布第i个帖子收到的评论量;
利用公式(13)对学习者发帖收到点赞量的计算,通过公式(15)计算学习者发帖的平均被点赞量Cforum:
利用公式(14)对学习者发帖收到评论量的计算,通过公式(16)计算学习者发帖的平均被评论量Dforum:
步骤2.3:利用步骤2.1和步骤2.2中对学习者论坛发帖量和读帖量,帖子点赞量和帖子评论率以及学习者发帖的平均被点赞量和被评论量的计算,通过公式(17)计算学习者的学习交互度:
B=0.7*[|Pforum|+(0.7*E+0.3*F)]+0.3*[|Sforum|+(0.8*Cforum+0.2*Dforum)] (17)
其中,Pforum为论坛浏览集合,E为帖子点赞率,F为帖子评论率,Sforum为发帖集合,Cforum是帖子评价被点赞量,Dforum为帖子的评价被评论量。
步骤3具体为:
步骤3.1,在自适应学习平台的学习者行为数据库中取到学习者在学习阶段中的视频学习记录,通过公式(18)计算学习者视频观看的平均完成率
其中,Ci为单个视频的完成率,Ci=lvi÷tvi,其中,lvi为单个视频的观看时长,tvi为单个视频的时长,m_video为学习者的视频观看总数;
通过公式(19)计算学习者的视频观看有效率:
其中,T
video_effect为学习者视频观看有效率,T
e为学习者有限观看视频总时长,T
a为学习者观看视频总时长,Flag
i=0if lv
i÷tv
i<0.7,Flag
i=1if lv
i÷tv
i≥0.7,视频观看时间大于该视频时长的70%,则记录该视频为有效视频,定义学习者的有效总观看时长为:
为学习者对视频的观看总时长;
通过公式(20)计算学习者观看视频的平均重复率:
其中,
为学习者观看视频的平均重复率,D
i为单个视频重复播放率,D
i=d
i÷l
i,m_video为学习者的视频观看总数,d
i为单个视频的重复观看时长;
通过公式(21)计算学习者的视频投入:
其中,
为视频观看的平均完成率,
为学习者观看视频的平均重复率,T
video_effect为学习者视频观看有效率。
在自适应学习平台的学习者行为数据库中取到学习者在学习阶段中的文档学习记录,文档资源类型有课件类型、学案类型和教案类型;
课件浏览次数:d1,重复浏览次数为rep1,rep1≤d1,学案浏览次数:d2,重复浏览次数为rep2,rep2≤d2,教案浏览次数:d3,重复浏览次数为rep3,rep3≤d3,若一个文档资源被重复浏览了多次,记为1次,文档浏览总次数:D=d1+d2+d3;
利用公式(22)计算学习者的文档浏览重复率:
课件浏览资源集合:Od={o
1,o
2,...,o
i},学案浏览资源集合:Pd={p
1,p
2,...,p
j},教案浏览资源集合:Qd={q
1,q
2,,q
k},课件在线浏览时长:
其中t
1m表示第m个课件的浏览时长,i为课件浏览量,学案在线浏览时长:t
2,
其中t
1m表示第m个学案的浏览时长,j为学案浏览量,教案在线浏览时长:
其中t
3m表示第m个教案的浏览时长,k为教案浏览量;
通过上述定义,利用公式(23)计算学习者的文档浏览总时长:
Tbrowse=t1+t2+t3 (23)
利用公式(24)计算学习者的文档在线浏览平均进度:
其中,课件在线浏览平均进度:r
1,
r
1m为课件浏览集合中第m个课件的浏览进度,学案在线浏览平均进度:r
2,
r
2m为学案浏览集合中第m个学案的浏览进度;教案在线浏览平均进度:r
3,
r
3m为教案浏览集合中第m个教案的浏览进度;
通过公式(25)计算学习者的文档学习投入:
V=(β1*Du+β2*R)+T (25)
其中,V为学习者文档学习投入,Du为文档重复浏览率,R
browse为文档在线浏览的平均进度,T
browse为学习者文档在线浏览的总时长,β为权重参数
β
1取值为0.6,β
2取值为0.4;
通过公式(26)计算学习者的行为投入:
D=U+V (26)
其中,D为学习者行为投入,U为学习者视频学习投入,V为学习者文档学习投入;
步骤3.2,通过公式(27)计算学习者认知投入:
其中,课后作业完成率:
s为课后作业完成率,u为提交作业总次数,w为总作业量;课后作业正确率:
p为课后作业正确率,v为正确作答作业数,u为提交作业总次数;
ν
1为0.5,ν
2为0.5;
步骤3.3,根据步骤3.1计算出的学习者行为投入和步骤3.2计算出的学习者认知投入,通过公式(28)计算学习者的学习投入:
C=0.5*D+0.5*Ecognize (28)。
步骤4具体为:
根据步骤1.10中公式(10)对学习者积极性的计算和步骤2.3中公式(17)对学习者学习交互度指标的计算和步骤3.3公式(28)中对学习者学习投入的计算,通过公式(29)计算学习者的学习强度。
Z=ψ1*A+ψ2*B+ψ3*C (29)
其中,
ψ
1为0.3,ψ
2为0.3,ψ
3为0.4,A为学习积极性,B为学习交互度,C为学习投入。
步骤5具体为:
步骤5.1,计算试卷完成度E1:
其中,ttest_i为题目i的平均作答时间,Ttest为完成试卷的限定时间;
步骤5.2,计算试卷知识点覆盖率:
其中,|K|为学习者在学习过程中涉及到的所有知识点个数,K为学习者在学习过程中涉及到的所有知识点集合,|J|为试卷中考察所有已学知识点的个数,J为试卷中所有考察的已学知识集集合;
步骤5.3,计算试卷信度:
其中,k为试卷题目总数,
为测试平均总分的方差,
为每道试题平均得分的方差;
步骤5.4,计算试卷效度E4:
其中,X
strength为学习者知识点学习强度向量,
Y
diff为试卷中对应知识点考察难度,
步骤6中的目标函数为:
f(Xtest_i)=ζ1*E1+ζ2*E2+ζ3*E3+ζ4*E4 (34)
其中,
E
1、E
2、E
3、E
4分别代表试卷完成度、知识点覆盖度、试卷信度和试卷效度四个约束条件,X
test_i为试卷向量,
步骤7具体为:
步骤7.1,初始化:设置题库题目的个数questionBank;设置组卷题目的个数questionNum;设置组卷初始种群数量popSize,作为初始群体P(0);设置基因位数geneSize;设置每份试卷的基因位数testPaperGenePlace;设置基因变异的概率mutationRate;设置当前遗传代数currentGeneration=1;
步骤7.2,个体评价:对当前试卷群体P(i)组成的中每个试卷个体的适应度值进行计算;定义试卷种群中的每个个体试卷向量为
其中i的取值范围为[1,questionNum],分别代表试卷种群中的questionNum个试卷个体,m=questionNum,代表组成一份试卷的questionNum道题目,设定试卷个体适应度F(x
test_i)等于步骤六中的组卷目标函数值f(X
test_i),对P(i)种群中的每个试卷个体进行适应度值的计算;
步骤7.3,选择运算:先计算出步骤7.2中试卷种群中所有试卷个体的适应度之和∑f
i,其中,f
i为试卷个体i的适应度值,计算出每个试卷个体的相对适应度大小
作为试卷个体被遗传到下一代种群中的概率,将概率值小于0.7的试卷个体抛弃,将其余试卷个体选择遗传到下一代;
步骤7.4,交叉运算:在步骤7.3中的试卷群体中两两随机选择试卷个体,将两份试卷的二进制编码串作为配对染色体,在二进制编码串中随机选择配对基因的交叉位置Genset,其中Genset大于等于1小于等于testPaperGenePlace,在该交叉位置相互交换两个配对试卷个体的部分染色体,形成一份新的试卷个体,试卷种群中原有试卷个体数量与新形成试卷个体数量总数为questionNum;
步骤7.5,变异运算:对步骤7.4中的试卷群体中的试卷个体串的某些基因座上的基因值作变动:首先随机选取各个试卷个体基因序列变异的位置,对于每份试卷,都生成[0,1]之间的随机数,若该随机数小于等于基因变异的概率mutationRate,则将变异点的原有基因值取反,作为新的基因序列,若该随机数大于基因变异的概率mutationRate则不进行操作;
步骤7.6,终止条件判断:若currentGeneration<maxIterNum,则将当前遗传代数currentGeneration+1,继续进行步骤7.2对下一代进行个体评价、选择交叉和变异操作;若currentGeneration=maxIterNum,则停止迭代,将最终种群中的个体进行适应度计算,将个体适应度从大到小进行排序,输出适应度值最高的试卷个体,将该个体的testPaperGenePlace个基因位的每七位进行二进制到十进制的转化,共生成questionNum个不同的试题编号,根据试题编号在题库中选择questionNum道题目组成试卷,作为个性化试卷进行推送。
本发明的有益效果是:
(1)本发明的方法有效利用了学习者在学习平台的各种行为数据。其中包括系统行为数据、论坛参与行为,视频学习记录和文档学习记录,还有课后作业的完成情况,通过对以上行为的分析,将从学习积极性,学习交互度,学习投入三个角度分别进行考虑,其中学习投入又分为行为投入和认知投入,最后对学习者在知识点的学习强度进行计算。
(2)本发明针对试题库中已有试题进行标注,标注试题考察知识点信息,作为试题推荐的备用,丰富了试题的信息,为个性化组卷提供了基础。
(3)本发明针对个性化组卷建立组卷评价体系,从试卷完成度,知识点覆盖度,试卷信度和试卷效度四个方面进行考虑。对学习者的个性化信息进行有效融合,为个性化组卷提供理论依据。
(4)本发明通过建立组卷目标函数,通过对目标函数的优化处理,从海量试题库中选择出适合的试题组成个性化试卷,满足试卷完成度,知识点覆盖度,试卷信度和试卷效度各项评价体系。
具体实施方式
下面结合附图和具体实施方式对本发明进行详细说明。
本发明一种基于遗传算法的个性化试卷推送方法,其流程如图1所示,具体按照如下步骤实施:
步骤1,对学习者在学习平台学习积极性的量化
通过对学习者在学习平台的行为数据的统计,包括系统登录次数、系统登陆时长、累计在线时长、在线时间间隔、离开平台的时长、离开平台的次数和登录时间离线时间,计算学习者在学习平台上的学习积极性;
具体为:
步骤1.1,在自适应学习平台的学习者行为数据库中取到学习者在学习阶段每次登录系统与登出系统的信息,包括登录系统的时间和登出系统的时间,通过公式(1)分别计算学习者每次系统登录停留的时长:
tdi=tend(i)-tstart(i) (1)
其中,tdi为学习者第i次登录系统停留的时长,tend(i)为学习者第i次登出系统的时间,tstart(i)为学习者第i次登录系统的时间,单位为分钟;
步骤1.2,通过对步骤1.1中学习者每次登录系统停留时长的求和计算,通过公式(2)计算出学习者在学习系统的累计在线时长:
其中,T为学习者在系统累计在线时长,tdi为学习者第i次登录系统停留的时长,系统累计登陆次数为m,单位为分钟;
步骤1.3,在自适应学习平台的学习者行为数据库中取到学习者在学习阶段每次登录系统与登出系统的信息,其中包括登录系统的时间和登出系统的时间,通过公式(3)计算学习者每次系统登录时间间隔:
tgap(i)=tstart(i)-tend(i-1)(i>1) (3)
其中,tstart(i)为学习者第i次登录系统的时间,tend(i-1)为学习者第i-1次离开系统的时间,tgap(i)为系统登录时间间隔,即就是第i次登录时间和第i-1次退出登录时间的间隔,单位为分钟;
步骤1.4,对步骤1.3中学习者每次系统登录时间间隔进行求和计算,通过公式(4)计算学习者的系统累计登录间隔:
其中,Tgap为系统累计登陆间隔,m为系统累计登陆次数,tgap(i)为学习者第i次登录系统的时间间隔,单位为分钟;
步骤1.5,在自适应学习平台的学习者行为数据库中取到学习者在单次登录中离开系统和回到系统的时间,通过公式(5)计算学习者每次登录系统中累计离开系统的时长:
其中,pi为第i次登录中累计离开系统的时长,n为第i次登录中离开系统的次数,tback(ij)为第i次登录中第j次回到系统的时间,tleave(ij)为第i次登录中第j次离开系统的时间,单位为分钟;
步骤1.6,利用步骤1.1中对学习者每次系统登录停留的时长的计算和步骤1.5中对学习者每次登录系统中累计离开系统的时长的计算,通过公式(6)计算学习者单次登录中的专注度:
其中,qi为学习者第i次登录系统中的专注度,tdi学习者第i次系统登录停留的时长,pi为第i次登录中累计离开系统的时长;
步骤1.7,利用步骤1.5中对学习者每次登录系统中累计离开系统的时长进行求和计算,通过公式(7)计算学习者累计离开系统的时长:
其中,P为累计离开系统的时长,m为系统累计登陆次数,pi为学习者第i次登录中累计离开系统的时长,单位为分钟;
步骤1.8,利用步骤1.2中对学习者在学习系统的累计在线时长的计算和步骤1.7中对学习者累计离开系统的时长的计算,通过公式(8)计算学习者的系统累计专注度:
其中,R为系统累计专注度,T为学习者在系统累计在线时长,P为累计离开系统的时长;
步骤1.9,利用步骤1.2中对学习者在学习系统的累计在线时长的计算和步骤1.4中对学习者的系统累计登录间隔的计算,通过公式(9)计算学习者活跃度:
其中,S为学习者的系统活跃度,T为学习者在系统累计在线时长,Tgap为系统累计登陆间隔;
步骤1.10,利用步骤1.8中对学习者的系统累计专注度和步骤1.9中对学习者活跃度的计算,通过公式(10)计算学习者的学习积极性A:
A=α1*R+α2*S (10)
其中,α为权重参数
α
1取值为0.6,α
2取值为0.4,R为系统累计专注度,S为学习者活跃度;
步骤2,对学习者在学习平台学习交互度的量化
通过对学习者在学习平台中的论坛参与数据的计算,包括论坛浏览次数浏览时长、帖子的浏览量和点赞量与评论量,学习者的发帖量与被点赞和被评论量的计算,计算计算学习者在学习平台学习交互度;
具体为:
步骤2.1,在自适应学习平台的学习者行为数据库中取到学习者在学习阶段中的论坛浏览记录,将论坛浏览集合记为
通过公式(11)计算学习者浏览帖子的帖子点赞率:
其中,qapprove为帖子点赞量,|Pforum|为帖子浏览量,|Pforum|=n_browser;
通过公式(12)计算学习者浏览帖子的帖子评论率:
其中,rcomment为帖子评论量,|Pforum|为帖子浏览量,|Pforum|=n_browser;
步骤2.2,在自适应学习平台的学习者行为数据库中取到学习者在学习阶段中的论坛发帖记录,将论坛发帖集合记为
论坛发帖量为|S
forum|,|S
forum|=m_send;
通过公式(13)计算学习者发布帖子收到的点赞量Usend:
其中,ui为发布第i个帖子收到的点赞量;
通过公式(14)计算学习者发布帖子收到的评论量Vsend:
其中,vi为发布第i个帖子收到的评论量;
利用公式(13)对学习者发帖收到点赞量的计算,通过公式(15)计算学习者发帖的平均被点赞量Cforum:
利用公式(14)对学习者发帖收到评论量的计算,通过公式(16)计算学习者发帖的平均被评论量Dforum:
步骤2.3:利用步骤2.1和步骤2.2中对学习者论坛发帖量和读帖量,帖子点赞量和帖子评论率以及学习者发帖的平均被点赞量和被评论量的计算,通过公式(17)计算学习者的学习交互度:
B=0.7*[|Pforum|+(0.7*E+0.3*F)]+0.3*[|Sforum|+(0.8*Cforum+0.2*Dforum)] (17)
其中,Pforum为论坛浏览集合,E为帖子点赞率,F为帖子评论率,Sforum为发帖集合,Cforum是帖子评价被点赞量,Dforum为帖子的评价被评论量。
步骤3,对学习者在学习平台学习投入的量化;
具体为:
步骤3.1,在自适应学习平台的学习者行为数据库中取到学习者在学习阶段中的视频学习记录,通过公式(18)计算学习者视频观看的平均完成率
其中,Ci为单个视频的完成率,Ci=lvi÷tvi,其中,lvi为单个视频的观看时长,tvi为单个视频的时长,m_video为学习者的视频观看总数;
通过公式(19)计算学习者的视频观看有效率:
其中,T
video_effect为学习者视频观看有效率,T
e为学习者有限观看视频总时长,T
a为学习者观看视频总时长,Flag
i=0if lv
i÷tv
i<0.7,Flag
i=1if lv
i÷tv
i≥0.7,视频观看时间大于该视频时长的70%,则记录该视频为有效视频,定义学习者的有效总观看时长为:
为学习者对视频的观看总时长;
通过公式(20)计算学习者观看视频的平均重复率:
其中,
为学习者观看视频的平均重复率,D
i为单个视频重复播放率,D
i=d
i÷l
i,m_video为学习者的视频观看总数,d
i为单个视频的重复观看时长;
通过公式(21)计算学习者的视频投入:
其中,
为视频观看的平均完成率,
为学习者观看视频的平均重复率,T
video_effect为学习者视频观看有效率。
在自适应学习平台的学习者行为数据库中取到学习者在学习阶段中的文档学习记录,文档资源类型有课件类型、学案类型和教案类型;
课件浏览次数:d1,重复浏览次数为rep1,rep1≤d1,学案浏览次数:d2,重复浏览次数为rep2,rep2≤d2,教案浏览次数:d3,重复浏览次数为rep3,rep3≤d3,若一个文档资源被重复浏览了多次,记为1次,文档浏览总次数:D=d1+d2+d3;
利用公式(22)计算学习者的文档浏览重复率:
课件浏览资源集合:Od={o
1,o
2,...,o
i},学案浏览资源集合:Pd={p
1,p
2,...,p
j},教案浏览资源集合:Qd={q
1,q
2,,q
k},课件在线浏览时长:t
1,
其中t
1m表示第m个课件的浏览时长,i为课件浏览量,学案在线浏览时长:t
2,
其中t
1m表示第m个学案的浏览时长,j为学案浏览量,教案在线浏览时长:t
3,
其中t
3m表示第m个教案的浏览时长,k为教案浏览量;
通过上述定义,利用公式(23)计算学习者的文档浏览总时长:
Tbrowse=t1+t2+t3 (23)
利用公式(24)计算学习者的文档在线浏览平均进度:
其中,课件在线浏览平均进度:r
1,
r
1m为课件浏览集合中第m个课件的浏览进度,学案在线浏览平均进度:r
2,
r
2m为学案浏览集合中第m个学案的浏览进度;教案在线浏览平均进度:r
3,
r
3m为教案浏览集合中第m个教案的浏览进度;
通过公式(25)计算学习者的文档学习投入:
V=(β1*Du+β2*R)+T (25)
其中,V为学习者文档学习投入,Du为文档重复浏览率,R
browse为文档在线浏览的平均进度,T
browse为学习者文档在线浏览的总时长,β为权重参数
β
1取值为0.6,β
2取值为0.4;
通过公式(26)计算学习者的行为投入:
D=U+V (26)
其中,D为学习者行为投入,U为学习者视频学习投入,V为学习者文档学习投入;
步骤3.2,通过公式(27)计算学习者认知投入:
其中,课后作业完成率:
s为课后作业完成率,u为提交作业总次数,w为总作业量;课后作业正确率:
p为课后作业正确率,v为正确作答作业数,u为提交作业总次数;
ν
1为0.5,ν
2为0.5;
步骤3.3,根据步骤3.1计算出的学习者行为投入和步骤3.2计算出的学习者认知投入,通过公式(28)计算学习者的学习投入:
C=0.5*D+0.5*Ecognize (28);
步骤4,对学习者在学习平台学习强度的量化;
根据步骤1-3中对学习者学习积极性、学习交互度和学习投入的量化数据,对学习者的知识点学习强度进行量化;
具体为:
根据步骤1.10中公式(10)对学习者积极性的计算和步骤2.3中公式(17)对学习者学习交互度指标的计算和步骤3.3公式(28)中对学习者学习投入的计算,通过公式(29)计算学习者的学习强度。
Z=ψ1*A+ψ2*B+ψ3*C (29)
其中,
ψ
1为0.3,ψ
2为0.3,ψ
3为0.4,A为学习积极性,B为学习交互度,C为学习投入;
步骤5,试卷评价指标的建立
分别从试卷完成度、试卷知识点覆盖度、试卷信度和试卷效度四个方面建立试卷评价指标;具体为:
步骤5.1,计算试卷完成度E1:
其中,ttest_i为题目i的平均作答时间,Ttest为完成试卷的限定时间;
评价标准:E1在[0.6~0.9)范围内最佳。
完成度 |
评价 |
[0,0.3) |
学习者可以很快完成试卷作答。 |
[0.3,0.6) |
学习者比较容易完成试卷作答。 |
[0.6,0.9) |
学习者在正常情况下可以完成作答。 |
[0.9,1] |
学习者在限定时间内很难完成作答。 |
步骤5.2,计算试卷知识点覆盖率:
其中,|K|为学习者在学习过程中涉及到的所有知识点个数,K为学习者在学习过程中涉及到的所有知识点集合,|J|为试卷中考察所有已学知识点的个数,J为试卷中所有考察的已学知识集集合;
E2试卷知识点覆盖率的评价指标0≤E2≤1,若学习者在学习过程中学习的所有知识点在试卷中都有涉及,那么该试卷的知识点覆盖率为1,若都没有在试卷中涉及,那么该试卷的知识点覆盖率为0;
步骤5.3,计算试卷信度:
其中,k为试卷题目总数,
为测试平均总分的方差,
为每道试题平均得分的方差;
信度 |
评价 |
(0,0.5) |
信度很低,考试基本无效。 |
[0.5,0.8) |
信度低,建议对试卷进行修改。 |
[0.8,1) |
信度较高,达到标准化考试水平。 |
步骤5.4,计算试卷效度E4:
其中,X
strength为学习者知识点学习强度向量,
Y
diff为试卷中对应知识点考察难度,
效度 |
评价 |
[0,0.3) |
试卷对知识点的考察不具有准确性。 |
[0.3,0.7) |
试卷效度较低,不能完全符合考察预期。 |
[0.7,1] |
试卷对知识点的考察基本符合考察预期。 |
步骤6,通过试卷的四个评价指标建立组卷目标函数;其中,目标函数为:
f(Xtest_i)=ζ1*E1+ζ2*E2+ζ3*E3+ζ4*E4 (34)
其中,
E
1、E
2、E
3、E
4分别代表试卷完成度、知识点覆盖度、试卷信度和试卷效度四个约束条件,ζ
1为0.3,ζ
2为0.3,ζ
3为0.2,ζ
4为0.2,X
test_i为试卷向量,
步骤7,采用遗传算法模型对组卷目标函数进行优化,输出适应度值最高的个体,即就是最适合的试卷,推送给学习者,如图2所示,具体为:
步骤7.1,初始化:设置题库题目的个数questionBank=128,即组成试卷可供选择的不重复的题目一共有128道;设置组卷题目的个数questionNum=20,即一份试卷需要由20道不重复的题目组成;设置组卷初始种群数量popSize=20,即初始化20份不同的试卷,作为初始群体P(0),每份试卷都由20道不重复的题目组成;设置基因位数geneSize=7,即每道题目的基因编码由7位二进制的数字来表示题目编号,比如[1011101]表示编号为93号的题目;设置每份试卷的基因位数testPaperGenePlace=140,即用140位二进制来表示一份试卷,每七位表示一道题目编号,一份试卷中断的20道题目占用140个基因位;设置基因变异的概率mutationRate=0.005,设置当前遗传代数currentGeneration=1;
步骤7.2,个体评价:对当前试卷群体P(i)组成的中每个试卷个体的适应度值进行计算;定义试卷种群中的每个个体试卷向量为
其中i的取值范围为[1,20],分别代表试卷种群中的20个试卷个体,m=20,代表组成一份试卷的二十道题目,设定试卷个体适应度F(x
test_i)等于步骤六中的组卷目标函数值f(X
test_i),对P(i)种群中的每个试卷个体进行适应度值的计算;
步骤7.3,选择运算:先计算出步骤7.2中试卷种群中所有试卷个体的适应度之和∑f
i,其中,f
i为试卷个体i的适应度值,计算出每个试卷个体的相对适应度大小
作为试卷个体被遗传到下一代种群中的概率,将概率值小于0.7的试卷个体抛弃,将其余试卷个体选择遗传到下一代;
步骤7.4,交叉运算:在步骤7.3中的试卷群体中两两随机选择试卷个体,将两份试卷的二进制编码串作为配对染色体,在二进制编码串中随机选择配对基因的交叉位置Genset,其中Genset大于等于1小于等于140,在该交叉位置相互交换两个配对试卷个体的部分染色体,形成一份新的试卷个体。试卷种群中原有试卷个体数量与新形成试卷个体数量总数为20。
步骤7.5,变异运算:对步骤7.4中的试卷群体中的试卷个体串的某些基因座上的基因值作变动。首先随机选取各个试卷个体基因序列变异的位置,对于每份试卷,都生成[0,1]之间的随机数,若该随机数小于等于基因变异的概率mutationRate,则将变异点的原有基因值取反,作为新的基因序列,若该随机数大于基因变异的概率mutationRate则不进行操作;
步骤7.6,终止条件判断:若currentGeneration<maxIterNum,则将当前遗传代数currentGeneration+1,继续进行步骤7.2对下一代进行个体评价、选择交叉和变异操作;若currentGeneration=maxIterNum,则停止迭代,将最终种群中的个体进行适应度计算,将个体适应度从大到小进行排序,输出适应度值最高的试卷个体,将该个体的140个基因位的每七位进行二进制到十进制的转化,共生成20个不同的试题编号,根据试题编号在题库中选择20道题目组成试卷,作为个性化试卷进行推送。