CN114021722A - 一种融合认知刻画的注意力知识追踪方法 - Google Patents

一种融合认知刻画的注意力知识追踪方法 Download PDF

Info

Publication number
CN114021722A
CN114021722A CN202111278587.9A CN202111278587A CN114021722A CN 114021722 A CN114021722 A CN 114021722A CN 202111278587 A CN202111278587 A CN 202111278587A CN 114021722 A CN114021722 A CN 114021722A
Authority
CN
China
Prior art keywords
embedding
question
concept
student
sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111278587.9A
Other languages
English (en)
Inventor
黄涛
杨华利
喻涛
胡盛泽
张�浩
陈彬
刘三女牙
杨宗凯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Central China Normal University
Original Assignee
Central China Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Central China Normal University filed Critical Central China Normal University
Priority to CN202111278587.9A priority Critical patent/CN114021722A/zh
Publication of CN114021722A publication Critical patent/CN114021722A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/022Knowledge engineering; Knowledge acquisition

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Computational Linguistics (AREA)
  • Computing Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明属于教育数据挖掘领域,提供一种融合认知刻画的注意力知识追踪方法,包括:(1)数据预处理;(2)特征融合;(3)表现预测;(4)模型训练。本发明提出了一套基于学习者认知画像的注意力知识追踪框架,此框架分别对学习者的记忆、实践和语言三方面特征进行建模,最终根据上述所得三方面特征进行联合建模,综合考虑学习者多方面的信息,以此来提升模型对于学习者知识掌握情况和未来表现预测的表现。

Description

一种融合认知刻画的注意力知识追踪方法
技术领域
本发明属于教育数据挖掘领域,具体涉及一种融合认知刻画的注意力知识追踪方法。
技术背景
随着在线教育的兴起,智能导学系统和大规模开放在线课程等平台逐渐得到发展,活跃在线上的学习者基数越来越大,导致教育者无法根据每位学生的知识掌握情况针对性地提出个性化的学习指导;为了构建出更智能的在线教育自适应系统,解决个性化教与学的一系列问题:习题路径规划、个性化推荐以及知识图谱构建等,知识追踪则成了其中的关键。通过知识追踪技术,系统可以自动追踪学习者的知识点掌握情况。
具体而言,知识追踪的主要任务是根据学生过去的作答记录X={x1,x2,…xt-1},对该生随着时间推移的知识状态变化情况(h1,h2,…ht-1)进行动态建模,从而评估学生当前的知识点掌握程度ht并预测学习者在下一时刻的反应rt;其中学生的一条做题记录表示为xt=(qt,at),qt为学习者在t时刻回答的问题,而at表示学生在qt上的回答情况,回答正确则值为1,反之则为0。
与此同时,在探索和解释学习者学习规律的过程中,教育学者们又分别提出了以下教育理论:桑代克三大学习定律中的练习率表明,当学习者反复练习某一知识点下的试题时,会使学生不断学习和巩固现有的知识;艾宾浩斯遗忘曲线理论表明,学习者在不进行复习的情况下,其知识掌握程度会随着时间的不断推移而呈指数衰减趋势,即时间愈长,忘却的知识愈多;随着心理学的发展,项目反应理论被提出并构建了一整套数学模型来描述学习者能力、题目特性与学习者作答之间的关系。此外,试题文本以及学习者对于相应试题的概念或技能的掌握情况等信息对于学生学习和作答过程有一定程度的影响。此外,基于教育心理学、医学等领域通常将认知刻画分为记忆、实践和语言三部分,本技术方案对应地将学习、遗忘曲线划归为记忆特征一块,学习者做题记录归为实践特征,试题的文本语义则归为语言特征,系统构建学习者的认知画像。如何从学生的历史交互信息中挖掘出上述这些有效信息并对其建模以预测学习者的未来表现存在巨大的挑战;另一方面,如何全面而有效地将学生学习与遗忘、概念或技能掌握情况等认知信息以及试题之间的关系引入到知识追踪任务中去,在技术和领域上同样具有很大的难度。
然而,传统的知识追踪方法主要根据学习者的历史答题记录来动态评估其知识状态变化,却忽视了学生的学习与遗忘行为、知识掌握水平、学生能力、试题困难度以及试题文本信息。目前,有一些研究学者尝试使用长短期记忆网络、记忆增强网络以及多头注意力机制等结构来进行知识追踪任务,但由于学习者学习过程的复杂性和学习资源的多样性,大多研究只考虑到一部分特征,没能关注多维度的信息,导致难以全面地对试题和学习者进行刻画和建模。
具体来说,基于长短期记忆网络的深度知识追踪模型(Deep Knowledge Tracing,DKT)将学习者对于所有知识点的掌握情况用一个隐藏状态向量表示,这使得它难以准确地记忆超过数百个时间步长的序列并且无法解释学生对于每个知识点的掌握水平;而基于记忆增强网络的动态键值记忆网络知识追踪模型(Dynamic Key-Value Memory Networksfor Knowledge Tracing,DKVMN)通过允许网络保留多个隐藏状态向量,并分别对这些向量进行读写来解决上述问题,但没有考虑到不同学生掌握知识点的速度是具有差异的;而基于多头注意力机制的知识追踪模型,如自注意力知识追踪模型(ASelf-Attentive modelfor Knowledge Tracing,SAKT)以及关系感知自注意知识追踪模型(Relation-AwareSelf-Attention for Knowledge Tracing,RKT)得益于自注意力机制的优越性,在结果的可解释性和表现预测上要明显优于先前的研究工作,但学生的学习过程往往是复杂多变的且学习资源也是丰富多样的,目前基于注意力机制的知识追踪研究大多未能全面考虑反映、刻画学生与试题的特征信息,如学生能力、遗忘与学习行为、概念或技能掌握情况、试题困难度以及试题之间关系等。
因此,探索一种深度融合认知刻画的注意力知识追踪方法,运用时下热门的大数据挖掘、多头注意力机制以及深度学习技术对学习者的线上历史学习轨迹进行综合分析,准确评估学习者当前的知识状态并预测其未来的表现,具有重要的研究意义和应用价值。
发明内容
本发明的目的是针对现有学习者知识诊断方法所存在的不足,提供一种深度融合认知刻画的注意力知识追踪方法,综合利用大数据挖掘技术、自然语言处理以及深度学习方法,综合考虑试题关系、试题难度、学生能力、学习与遗忘行为以及学习者技能掌握情况信息来对学习者的知识状态进行联合建模,利用多头注意力机制来学习上述所说的特征信息,科学、全面地对学习者随时间推移地知识点掌握变化情况进行动态诊断和评估并对预测学习者的未来表现,从而对学习成绩不够理想的学生进行个性化教学和资源推荐,进行针对性提升。
为达到发明目的,本发明采用下述技术方案。
一种融合认知刻画的注意力知识追踪方法,包括:(1)数据预处理;(2)特征融合;(3)表现预测;(4)模型训练。
所述步骤(1)数据预处理具体为:采集到相应的数据记录,在此基础上处理成知识追踪模型所需的数据格式,即构建数据模型,为后面的特征融合提供数据准备。
(1-1)数据采集:采集“学习大数据”平台上小学数学科目的学习者历史学习记录,包括用户名、学生作答的题号、回答情况、知识点、时间信息以及试题文本等原始数据;
(1-2)构建数据模型:首先,考虑到保护学生隐私的需求,对原始数据中学生的用户名用数字id进行映射;其次按照学生id对原始数据进行分组并建立按时间升序排列的学习者做题序列集;然后对数据进行清洗,删除少于3个学习者练习的试题以及做题记录数少于3的学生数据;再对清洗后的数据做进一步特征提取,包括统计出学习者所做系列练习属于相应的同一知识点的重复练习次数、基于Rasch模型获取学习者能力和试题难度以及使用Bert模型提取试题文本的文本特征向量并基于这些向量构建试题关系邻接矩阵;最后将上述处理好的数据保存到相应的数据集文件中。
所述步骤(2)特征融合具体为:从记忆维度、实践维度、语言维度这三个方面提取并构建关于学生认知刻画的综合、系统的特征,深入挖掘学习者的学习行为模式及其知识点掌握程度的动态变化过程。
(2-1)问题定义。假设数据集中有H个学生,N个概念以及M个不同问题,N<<M,将学习者回答的问题、该问题所属的概念、作答反应表示为一个元组
Figure BDA0003330458270000041
其中
Figure BDA0003330458270000042
表示学生h在t时刻尝试的问题,
Figure BDA0003330458270000043
为概念索引,
Figure BDA0003330458270000044
表示答案,然后给定学生h从1到t-1时刻的历史学习记录
Figure BDA0003330458270000051
Figure BDA0003330458270000052
目标是预测学生h在下一时刻t正确回答属于概念
Figure BDA0003330458270000053
的问题
Figure BDA0003330458270000054
的概率,即
Figure BDA0003330458270000055
(2-2)问题、概念和交互嵌入。在步骤(2-1)的设定下,嵌入层的输入为试题序列Q={q1,q2,…,qt}、概念序列C={c1,c2,…,ct}、反应序列R={r1,r2,…,rt},输出为问题嵌入、概念嵌入、问题-反应交互嵌入以及概念-反应交互嵌入;问题嵌入:利用问题嵌入矩阵EQ∈RM×d,使得问题集SetQ中的每一道练习题qi嵌入到第i行,即
Figure BDA0003330458270000056
其中d表示嵌入到高维空间的维数;概念嵌入:定义一个概念嵌入矩阵EC∈RN×d,用于获取概念集合SetC中每一个概念ci的嵌入表示
Figure BDA0003330458270000057
问题-反应交互嵌入:通过综合考虑试题的困难度、学生的作答反应信息和交互的发生时间先后顺序,将回答情况rt扩展为d维的向量rt=[rt,rt,…,rt]∈Rd,得到单个问题-反应交互嵌入
Figure BDA0003330458270000058
具体表示为:
Figure BDA0003330458270000059
Figure BDA00033304582700000510
其中,δqt表示问题困难度,P∈Rl×d为包含交互位置信息的位置嵌入矩阵,
Figure BDA00033304582700000511
表示拼接;
概念-反应交互嵌入:训练一个概念变化嵌入矩阵ED∈RN×d,用于感知、获取同一概念下不同问题的上下文表示。得到单个概念-反应交互嵌入
Figure BDA00033304582700000512
如下所示:
Figure BDA00033304582700000513
Figure BDA00033304582700000514
练习-反应交互嵌入序列表示为
Figure BDA00033304582700000515
其中
Figure BDA00033304582700000516
概念-反应交互嵌入序列则表示为
Figure BDA00033304582700000517
其中
Figure BDA0003330458270000061
(2-3)认知刻画特征表示。在模型中对应构造了三个特征融合器来获取学生的记忆、实践和语言特征。记忆特征融合器采用问题嵌入序列
Figure BDA0003330458270000062
问题-反应交互嵌入序列
Figure BDA0003330458270000063
练习次数N={n1,n2,…,nt-1}以及做题时间间隔ΔT={Δt1,Δt2,…,Δtt-1}作为输入,并输出使用修改后的记忆感知注意力机制获取的学生记忆相关特征M={m1,m2,…,mt}。实践特征融合器则利用概念嵌入
Figure BDA0003330458270000064
以及概念-反应嵌入
Figure BDA0003330458270000065
作为输入,并输出由一般注意力机制获取的学生实践特征P={p1,p2,…,pt}。语言特征融合器则以问题嵌入序列
Figure BDA0003330458270000066
问题-反应交互嵌入序列
Figure BDA0003330458270000067
以及试题关系邻接矩阵R={Rt,1,Rt,2,…,Rt,t-1}作为输入,并输出使用修改后的练习关系感知的注意力机制获取的学生语言特征L={l1,l2,…,lt};
在上述步骤(2-3)中获取学生记忆相关特征M、获取学生实践相关特征P、获取学生语言相关特征L的具体方式为
设αij是使用一般的缩放点积注意力机制学习到的注意力权重:
Figure BDA0003330458270000068
再根据所得权重系数对value进行加权求和,得到第i个元素的最终表示,oi∈Rd
Figure BDA0003330458270000069
其中,qi、kj和vj分别表示query、key和value,WQ∈Rd×d、WK∈R2d×d和WV∈R2d×d分别是用于query、key和value的投影矩阵;
其中,实践特征融合器采用概念嵌入
Figure BDA0003330458270000071
以及概念-反应交互嵌入
Figure BDA0003330458270000072
作为输入,其中概念嵌入序列
Figure BDA0003330458270000073
作为注意力机制中query,概念-反应交互嵌入序列
Figure BDA0003330458270000074
则作为key和value矩阵,仅利用一般注意力机制来获取并输出学生的实践相关特征,反映了学生的知识掌握情况;
Figure BDA0003330458270000075
最终实践相关特征融合器获取并输出学生实践相关特征P={p1,p2,…,pt};
通过纳入学生的能力、学习行为以及遗忘规律,记忆特征融合器利用修改后的记忆感知注意力机制,采用问题嵌入序列
Figure BDA0003330458270000076
Figure BDA0003330458270000077
问题-反应交互嵌入序列
Figure BDA0003330458270000078
作为输入,其中问题嵌入序列
Figure BDA0003330458270000079
作为注意力机制中query,问题-反应交互嵌入序列
Figure BDA00033304582700000710
则作为key和value矩阵,以lg(N)函数来建模学生的学习行为,以指数衰减函数e-ΔT来建模学生遗忘规律,通过调整注意力权重分数得到的记忆相关注意力权重分数为:
Figure BDA00033304582700000711
其中,θh表示第h个学生的能力,这种能力一定程度反映了学生的学习能力,另一方面也反映了学生的遗忘速率;λ1表示该模型的一个可训练参数。再根据所得权重分数βi对问题-反应交互嵌入进行加权求和,得到记忆相关特征的最终表示,mi∈Rd
Figure BDA00033304582700000712
最终记忆相关特征融合器获取并输出学生记忆相关特征M={m1,m2,…,mt};
语言特征融合器利用修改后的练习关系感知注意力机制,采用问题嵌入序列
Figure BDA0003330458270000081
问题-反应交互嵌入序列
Figure BDA0003330458270000082
Figure BDA0003330458270000083
作为输入,其中问题嵌入序列
Figure BDA0003330458270000084
作为注意力机制中query,问题-反应交互嵌入序列
Figure BDA0003330458270000085
则作为key和value;通过基于Bert模型提取的试题文本向量所构建的练习关系邻接矩阵R来修改注意力权重,得到所需的语言相关注意力权重分数:
γi=λ2*Softmax(Ri)+(1-λ2i
其中,λ2同样为该模型的一个可训练参数;再基于权重分数γi对问题-反应交互嵌入进行加权求和,得到语言相关特征的最终表示,li∈Rd
Figure BDA0003330458270000086
最终语言相关特征融合器获取并输出学生语言相关特征L={l1,l2,…,lt}。
所述步骤(3)表现预测具体包括:特征融合,利用相对位置注意力机制来构建预测模型,对学生知识掌握情况进行诊断和学习者表现进行预测。
(3-1)特征融合:预测阶段采用相对位置注意力机制进行预测,因此将练习嵌入序列和概念嵌入序列进行拼接和线性变化,将其作为预测模型的query矩阵。同样将对前面所提到的记忆、实践和语言特征融合器所输出学生记忆、实践和语言相关特征进行拼接并进行线性变化,得到最终的嵌入表示,并将其作为key和value矩阵。具体计算如下:
Figure BDA0003330458270000087
Figure BDA0003330458270000091
Figure BDA0003330458270000092
Figure BDA0003330458270000093
Figure BDA0003330458270000094
Figure BDA0003330458270000095
clip(x,k)=max(-k,min(k,x))
其中,qi,ki,vi∈Rd
Figure BDA0003330458270000096
表示元素之间相对位置信息的向量,k为设定的元素之间的最大距离;
然后将模型的输出o传递到前馈层中,具体计算如下:
F=ReLU(oW(1)+b(1))W(2)+b(2)
其中,W(1),W(2)∈Rd×d为权重矩阵,b(1),b(2)∈Rd为偏置向量;除了上述建模结构外,在自注意层和前馈层之后都加入残差连接、层归一化和随机失活;
(3-2)对于学习者的知识点掌握的诊断结果ht即为上述前馈层所输出的最终结果F。
(3-3)学习者表现预测:学习者正确回答t时刻的试题概率
Figure BDA0003330458270000097
为:
Figure BDA0003330458270000098
所述步骤(4)模型训练,训练的目标是最小化学生反应序列的负对数似然。通过最小化预测学习者正确回答问题的概率
Figure BDA0003330458270000099
和学习者反应的真实标签rt之间的交叉熵损失来学习参数。
Figure BDA00033304582700000910
本发明与现有技术相比,具有如下有益效果:
1、本发明提出了一套基于学习者认知画像的注意力知识追踪框架,此框架分别对学习者的记忆、实践和语言三方面特征进行建模,最终根据上述所得三方面特征进行联合建模,综合考虑学习者多方面的信息,以此来提升模型对于学习者知识掌握情况和未来表现预测的表现。
2、基于认知刻画注意力知识追踪框架,提出了一种建模学习者记忆相关特征的方法。对于学习者的学习行为以lg(x)进行建模,认为10次练习之前提升明显,超过10次练习之后则默认学生掌握该练习;对于学习者的遗忘规律则以e-ΔT进行建模,其知识掌握程度会随着时间的不断推移而呈指数衰减趋势,即时间愈长,忘却的知识愈多,并考虑到不同学生的能力不同,通过修改后的能够感知记忆的注意力机制对学习者记忆相关特征进行建模。
3、基于认知刻画注意力知识追踪框架,提出了一种建模学习者实践特征的方法,利用项目反应理论测量出的相应试题困难度以及学生的作答序列,基于注意力机制进行联合建模,得到学习者的实践相关特征。
4、基于认知刻画注意力知识追踪,提出了一种建模学习者语言特征的方法,通过构建出文本语义高度相关的试题关系邻接矩阵,利用基于自定义的关系感知注意力机制来挖掘出学习者语言相关特征。
附图说明
图1为本发明融合认知刻画的注意力知识追踪方法框架示意图。
图2本发明融合认知刻画的注意力知识追踪方法模型图。
图3多维特征体系对比图。
具体实施方式
本发明实施例公开了一种基于认知刻画的注意力知识追踪方法(CognitiveProfiles Attentive Knowledge Tracing,CPKT)。具体来说,首先从“学习大数据”平台收集小学数学科目的学习者历史练习记录,然后对上述得到的原始数据进行一定的数据清洗和处理,利用处理后的数据来建模学习者知识状态随着时间推移的一个动态变化过程,设计三个特征融合器,包括记忆特征融合器、实践特征融合器、语言特征融合器来分别获取学习者的记忆、实践以及语言特征,接着在训练过程中利用相对位置注意力机制对学习者的知识状态进行更新并预测学习者下一时刻正确回答问题的概率大小。
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。
如图1所示,一种融合认知刻画的注意力知识追踪方法,可以有效地评估出学习者知识状态随着不断学习的具体变化和预测学习者的未来表现,其主要包括以下步骤:
(1)数据预处理
(1-1)数据采集:从“学习大数据”平台收集学习者在数学科目上的历史学习记录(至少一个学期的),如表1、表2所示,具体包括用户名、学生作答的题号、回答情况、知识点、时间信息以及试题文本等原始数据。
表1学生做题记录关键字段说明
Figure BDA0003330458270000111
Figure BDA0003330458270000121
表2练习文本关键字段说明
Figure BDA0003330458270000122
(1-2)构建数据模型:首先,考虑到保护学生隐私的需求,对原始数据中学生的用户名用数字id进行映射,同时也须对问题和知识点进行数值映射;其次按照学生id对原始数据进行分组并建立按时间升序排列的学习者做题序列集;然后对数据进行清洗,删除少于3个学习者练习的试题以及做题记录数少于3的学生数据;再对清洗后的数据做进一步的数据预处理,包括统计出学习者做相应题目的时长、所做系列练习属于相应的同一知识点的重复练习次数,具体计算方式如表3所示、基于Rasch这一简单且可解释的模型获取学习者能力和试题难度以及使用Bert模型提取试题文本的文本特征向量并基于这些向量构建试题关系邻接矩阵;接着考虑到计算机的存储大小以及模型的计算效率,分别将处理后的问题、概念、反应、作答时间以及重复练习次数序列划分成固定长度的子序列S={s1,s2,…,sl},其中l是模型可以处理的最大长度,一般设置为200;当序列长度t小于l时,在问题、概念序列的后面重复填充0,在反应序列后面重复添加-1;当t大于l时,将序列划分为t//n+1个子序列,如果最后一个子序列长度小于3,则为t//n,所有这些子序列都用作模型的输入;最后将上述处理好的数据保存到相应的数据集文件当中。
表3记忆特征的计算方法
Figure BDA0003330458270000131
(2)特征融合
从记忆、实践、语言这三个维度来提取并构建关于学生认知的系统、综合特征体系。
(2-1)问题定义
假设数据集中有H个学生,N个概念以及M个不同问题,N<<M,将学习者回答的问题、该问题所属的概念、作答反应表示为一个元组
Figure BDA0003330458270000132
其中
Figure BDA0003330458270000133
表示学生h在t时刻尝试的问题,
Figure BDA0003330458270000134
为概念索引,
Figure BDA0003330458270000135
表示答案,然后给定学生h从1到t-1时刻的历史学习记录
Figure BDA0003330458270000136
目标是预测学生h在下一时刻t正确回答属于概念
Figure BDA0003330458270000137
的问题
Figure BDA0003330458270000138
的概率,即
Figure BDA0003330458270000139
(2-2)问题、概念和交互嵌入
在步骤(2-1)设定下,本实施例嵌入层的输入为问题序列Q={q1,q2,…,qt}、概念序列C={c1,c2,…,ct}、反应序列R={r1,r2,…,rt},输出为问题嵌入、概念嵌入、问题-反应交互嵌入以及概念-反应交互嵌入。问题嵌入:利用问题嵌入矩阵EQ∈RM×d将问题集SetQ中的每一道练习题qi嵌入到第i行,即
Figure BDA0003330458270000141
其中d表示嵌入到高维空间的维数;概念嵌入:定义一个概念嵌入矩阵EC∈RN×d获取概念集SetC中每一个概念ci的嵌入表示
Figure BDA0003330458270000142
问题-反应交互嵌入:将回答情况rt扩展为d维的向量rt=[rt,rt,…,rt]∈Rd,得到单个问题-反应交互嵌入
Figure BDA0003330458270000143
如下所示:
Figure BDA0003330458270000144
Figure BDA0003330458270000145
其中,δqt表示学习到的问题困难度,P∈Rl×d为包含交互位置信息的位置嵌入矩阵。
概念-反应交互嵌入:利用概念变化嵌入矩阵ED∈RN×d感知、获取同一概念下不同问题的上下文表示,然后得到单个概念-反应嵌入
Figure BDA0003330458270000146
具体表示为:
Figure BDA0003330458270000147
Figure BDA0003330458270000148
练习-反应交互嵌入序列表示为
Figure BDA0003330458270000149
其中
Figure BDA00033304582700001410
概念-反应交互嵌入序列则表示为
Figure BDA00033304582700001411
其中
Figure BDA00033304582700001412
(2-3)认知刻画特征表示
如图2所示,CPKT模型中分别对应构造了三个特征融合器来获取学生的记忆、实践和语言特征。
(2-3-1)记忆特征融合器模块
该模块主要基于学生的学习行为和遗忘规律来对学习者知识状态进行动态评估,并考虑到不同学生能力不同以实现个性化建模。
首先,提取学习特征,即重复练习次数n:序列中交互对应知识点的重复次数;举例:如表3所示,知识点重复次数则是从序列开端开始计数,遇到和T2包含一样的知识点的试题就累加1。
其次,提取遗忘特征,即序列时间间隔Δt:序列中直接相邻的两次交互的时间间隔;举例:如表3所示,第一个交互时间间隔默认为0,后续每一次练习的间隔时间计算为:Δtn=Tn-Tn-1(如,T4-T3)。
最终,记忆特征融合器的输入为问题嵌入序列
Figure BDA0003330458270000151
问题-反应交互嵌入序列
Figure BDA0003330458270000152
练习次数N={n1,n2,…,nt-1}以及做题时间间隔ΔT={Δt1,Δt2,…,Δtt-1},其中问题嵌入序列
Figure BDA0003330458270000153
作为多头注意力机制中query,问题-反应交互嵌入序列
Figure BDA0003330458270000154
则作为key和value矩阵,并输出使用修改后的记忆感知注意力机制获取的学生记忆相关特征。
具体来说,首先记忆特征融合器计算过去问题j对未来问题i的不同影响程度,即权重分数αij
Figure BDA0003330458270000155
其中,d为嵌入大小,
Figure BDA0003330458270000156
分别是用于query、key的投影矩阵。
然后基于练习次数N={n1,n2,…,nt-1}以及做题时间间隔ΔT={Δt1,Δt2,…,Δtt-1},以对数函数lg(N)来建模学生的学习行为,以指数衰减函数e-ΔT来建模学生遗忘规律来修改影响权重
Figure BDA0003330458270000157
最终得到学生h的记忆相关注意力权重分数为:
Figure BDA0003330458270000161
其中,θh表示第h个学生的能力,这种能力一定程度反映了学生的学习能力,另一方面也反映了学生的遗忘速率;λ1表示该模型的一个可训练参数;再根据所得权重分数
Figure BDA0003330458270000162
对value矩阵进行加权求和,得到记忆相关特征的最终表示,mi∈Rd
Figure BDA0003330458270000163
其中,
Figure BDA0003330458270000164
是用于value的投影矩阵。最终记忆相关特征融合器获取并输出学生记忆相关特征M={m1,m2,…,mt}。
(2-3-2)实践特征融合器模块
实践相关特征融合器则采用概念嵌入
Figure BDA0003330458270000165
以及概念-反应交互嵌入
Figure BDA0003330458270000166
作为输入,其中概念嵌入序列
Figure BDA0003330458270000167
作为多头注意力机制中query,概念-反应交互嵌入序列
Figure BDA0003330458270000168
则作为key和value矩阵,再利用一般注意力机制来获取并输出学生的实践相关特征,该特征主要反映学生当前的知识掌握水平。具体计算如下:
Figure BDA0003330458270000169
Figure BDA00033304582700001610
Figure BDA00033304582700001611
其中
Figure BDA00033304582700001612
Figure BDA00033304582700001613
分别是用于query、key和value的线性投影矩阵,为模型的训练参数。最终实践相关特征融合器获取并输出学生实践相关特征P={p1,p2,…,pt}。
(2-3-3)语言特征融合器模块
在提取学习者语言特征过程中,该模块利用Bert模型得到相应试题的文本嵌入向量Et-1,Et,然后使用余弦相似度公式计算练习之间的相似度并构建试题关系邻接矩阵R。练习关系邻接矩阵R构建过程具体如下:
Figure BDA0003330458270000171
Figure BDA0003330458270000172
其中,K表示试题是否相关的阈值,大小设为0.1*M。
最终,语言特征融合器以问题嵌入序列
Figure BDA0003330458270000173
问题-反应交互嵌入序列
Figure BDA0003330458270000174
以及试题关系邻接矩阵R={Rt,1,Rt,2,…,Rt,t-1}作为输入,其中问题嵌入序列
Figure BDA0003330458270000175
作为注意力机制中query,问题-反应交互嵌入序列
Figure BDA0003330458270000176
则作为key和value矩阵,利用修改后的关系感知的注意力机制获取并输出学生的语言特征。
同记忆融合器一样,首先计算一般注意力权重分数
Figure BDA0003330458270000177
再利用练习关系Ri调整权重,得到该模块所需的学生语言相关注意力分数γi:
Figure BDA0003330458270000178
Figure BDA0003330458270000179
其中,λ2为该模型的一个可调整参数。再基于权重分数
Figure BDA00033304582700001710
对value矩阵进行加权求和,得到语言相关特征的最终表示,li∈Rd
Figure BDA00033304582700001711
同样地,
Figure BDA00033304582700001712
为模型要训练的参数,最终语言相关特征融合器获取并输出学生的语言相关特征L={l1,l2,…,lt}。
最后,对比先前的研究工作,并总结一下CPKT模型所构建的多维特征体系,如图3所示。
(3)表现预测
本实施例的预测和应用具体包括:特征融合,利用相对位置注意力机制来构建预测模型,对学生知识掌握情况进行诊断以及对学习者表现进行预测。
(3-1)特征融合
预测阶段采用相对位置注意力机制进行预测,将练习嵌入序列和概念嵌入序列进行拼接和线性变化,作为预测模块的query矩阵。将记忆、实践和语言特征融合器所输出学生记忆、实践和语言相关特征进行拼接并进行线性变化,得到最终的嵌入表示Fpred,然后取其中1到t-1时刻的特征
Figure BDA0003330458270000181
将其作为key和value矩阵:
Figure BDA0003330458270000182
Figure BDA0003330458270000183
Figure BDA0003330458270000184
其中,
Figure BDA0003330458270000185
Figure BDA0003330458270000186
为模型的训练参数,0∈Rd为零向量,
Figure BDA0003330458270000187
表示拼接。
(3-2)预测模型构建
将输入数据传到相对位置注意力层进行预测:
Figure BDA0003330458270000188
Figure BDA0003330458270000189
Figure BDA00033304582700001810
Figure BDA0003330458270000191
Figure BDA0003330458270000192
clip(x,k)=max(-k,min(k,x))
其中,
Figure BDA0003330458270000193
表示元素之间相对位置信息的向量,k为设定的元素之间的最大距离。
然后将相对位置注意力层的输出馈送至前馈层中,最终输出:
Figure BDA0003330458270000194
其中,
Figure BDA0003330458270000195
为权重矩阵,
Figure BDA0003330458270000196
Figure BDA0003330458270000197
为偏置向量。除了上述建模结构外,自注意层和前馈层之后都加入残差连接、层归一化和随机失活。
(3-3)知识状态诊断和表现预测
(3-3-1)知识状态诊断:对于学习者的知识点掌握的诊断结果ht即为上述前馈层所输出的最终结果F。
(3-3-2)学习者表现预测:在诊断学习者的知识掌握情况后,对学习者在未来表现进行预测,即学习者正确回答t时刻的试题概率
Figure BDA0003330458270000198
为:
Figure BDA0003330458270000199
(4)模型训练:训练的目标是最小化学生反应序列的负对数似然。
(4-1)损失函数:通过最小化预测学习者正确回答问题的概率
Figure BDA00033304582700001910
和学习者反应的真实标签rt之间的交叉熵损失来学习参数。
Figure BDA00033304582700001911
(4-2)优化函数:通过使用Adam优化算法来更新模型中的参数。
本发明未详细阐述的部分属于本领域公知技术。
应当说明的是,以上包含的本发明实例内容说明,是为了详解释本发明的技术特征。在不脱离本发明的前提下,所做出的若干改进和修饰也受本发明的保护,因此本发明的保护范围应当以本申请的权利要求所界定的内容为标准。

Claims (2)

1.一种融合认知刻画的注意力知识追踪方法,其特征在于该方法包括以下步骤:
(1)数据预处理;采集相应的数据记录,处理成知识追踪模型所需的数据格式,即构建数据模型,为后面的特征融合提供数据准备;
(1-1)数据采集:采集“学习大数据”平台上学习者的数学科目历史学习记录,至少一个学期的,包括用户名、学生作答的题号、回答情况、知识点、时间信息以及问题文本原始数据;
(1-2)构建数据模型:首先,对原始数据中学生的用户名用数字id进行映射;其次按照学生id对原始数据进行分组并建立按时间升序排列的学习者做题序列集;然后对数据进行清洗,删除少于3个学习者练习的问题以及做题记录数少于3的学生数据;
(2)特征融合;从记忆维度、实践维度、语言维度这三个方面提取并构建关于学生认知刻画的综合、系统的特征,深入挖掘学习者的学习行为模式及其知识点掌握程度的动态变化过程;
(2-1)问题定义:假设数据集中有H个学生,N个概念以及M个不同问题,N<<M,将学习者回答的问题、该问题所属的概念、作答反应表示为一个元组
Figure FDA0003330458260000011
其中
Figure FDA0003330458260000012
表示学生h在t时刻尝试的问题,
Figure FDA0003330458260000013
为概念索引,
Figure FDA0003330458260000014
表示答案,然后给定学生h从1到t-1时刻的历史学习记录
Figure FDA0003330458260000015
Figure FDA0003330458260000016
目标是预测学生h在下一时刻t正确回答属于概念
Figure FDA0003330458260000017
的问题
Figure FDA0003330458260000018
的概率,即
Figure FDA0003330458260000019
(2-2)问题、概念和交互嵌入:在步骤(2-1)的设定下,嵌入层的输入为问题序列Q={q1,q2,…,qt}、概念序列C={c1,c2,…,ct}、反应序列R={r1,r2,…,rt},输出为问题嵌入、概念嵌入、问题-反应交互嵌入以及概念-反应交互嵌入;问题嵌入:利用问题嵌入矩阵EQ∈RM×d将问题集SetQ中的每一道练习题qi嵌入到第i行,即
Figure FDA0003330458260000021
其中d表示嵌入到高维空间的维数;概念嵌入:利用概念嵌入矩阵EC∈RN×d获取概念集SetC中每一个概念ci的嵌入表示
Figure FDA0003330458260000022
问题-反应交互嵌入:将回答情况rt扩展为d维的向量rt=[rt,rt,…,rt]∈Rd,得到单个问题-反应交互嵌入
Figure FDA0003330458260000023
如下所示:
Figure FDA0003330458260000024
Figure FDA0003330458260000025
其中,δqt表示问题困难度,P∈Rl×d为包含交互位置信息的位置嵌入矩阵,
Figure FDA0003330458260000026
表示拼接;
概念-反应交互嵌入:利用概念变化嵌入矩阵ED∈RN×d感知、获取同一概念下不同问题的上下文表示,得到单个概念-反应嵌入
Figure FDA0003330458260000027
具体表示为:
Figure FDA0003330458260000028
Figure FDA0003330458260000029
练习-反应交互嵌入序列表示为
Figure FDA00033304582600000210
其中
Figure FDA00033304582600000211
概念-反应交互嵌入序列则表示为
Figure FDA00033304582600000212
其中
Figure FDA00033304582600000213
(2-3)认知刻画特征表示:在模型中对应构造三个特征融合器来获取学生的记忆、实践和语言特征,记忆特征融合器采用问题嵌入序列
Figure FDA0003330458260000031
问题-反应交互嵌入序列
Figure FDA0003330458260000032
练习次数N={n1,n2,…,nt-1}以及做题时间间隔ΔT={Δt1,Δt2,…,Δtt-1}作为输入,并输出使用修改后的记忆感知注意力机制获取的学生记忆相关特征M={m1,m2,…,mt},实践特征融合器利用概念嵌入
Figure FDA0003330458260000033
以及概念-反应嵌入
Figure FDA0003330458260000034
作为输入,并输出使用一般注意力机制获取的学生实践相关特征P={p1,p2,…,pt},语言特征融合器以问题嵌入序列
Figure FDA0003330458260000035
问题-反应交互嵌入序列
Figure FDA0003330458260000036
以及问题关系邻接矩阵R={Rt,1,Rt,2,…,Rt,t-1}作为输入,并输出使用修改后的练习关系感知注意力机制获取的学生语言相关特征L={l1,l2,…,lt};
(3)表现预测;特征融合,利用相对位置注意力机制来构建预测模型,对学生知识掌握情况进行诊断和学习者表现进行预测;
(3-1)特征融合:预测阶段采用相对位置注意力机制进行预测,将练习嵌入序列和概念嵌入序列进行拼接和线性变化操作,将其作为预测模型的query矩阵,同样对记忆、实践和语言特征融合器所输出学生记忆、实践和语言相关特征进行拼接并进行线性变化,得到最终的嵌入表示,并将其作为key和value矩阵,具体计算如下:
Figure FDA0003330458260000037
Figure FDA0003330458260000041
Figure FDA0003330458260000042
Figure FDA0003330458260000043
Figure FDA0003330458260000044
Figure FDA0003330458260000045
clip(x,k)=max(-k,min(k,x))
其中,qi,ki,vi∈Rd
Figure FDA0003330458260000046
表示元素之间相对位置信息的向量,k为设定的元素之间的最大距离;
最后,将模型的输出o传递到前馈层中,具体计算如下:
F=ReLU(oW(1)+b(1))W(2)+b(2)
其中,W(1),W(2)∈Rd×d为权重矩阵,b(1),b(2)∈Rd为偏置向量;除了上述建模结构外,在自注意层和前馈层之后都加入残差连接、层归一化和随机失活;
(3-2)对于学习者的知识点掌握的诊断结果ht即为上述前馈层所输出的最终结果F;
(3-3)学习者表现预测:学习者正确回答t时刻的问题概率
Figure FDA0003330458260000047
为:
Figure FDA0003330458260000048
(4)模型训练;训练的目标是最小化学生反应序列的负对数似然,通过最小化预测学习者正确回答问题的概率
Figure FDA0003330458260000049
和学习者反应的真实标签rt之间的交叉熵损失来学习参数,
Figure FDA00033304582600000410
2.根据权利要求1所述的融合认知刻画的注意力知识追踪方法,其特征在于:步骤(2-3)中获取学生记忆相关特征M、获取学生实践相关特征P、获取学生语言相关特征L的具体方式为
设αij是使用一般的缩放点积注意力机制学习到的注意力权重:
Figure FDA0003330458260000051
再根据所得权重分数对value矩阵进行加权求和,得到第i个元素的最终表示,o∈Rd
Figure FDA0003330458260000052
其中,qi、kj和vj分别表示query、key和value,WQ∈Rd×d、WK∈R2d×d和WV∈R2d×d分别是用于query、key和value的投影矩阵;
实践特征融合器采用概念嵌入
Figure FDA0003330458260000053
以及概念-反应交互嵌入
Figure FDA0003330458260000054
作为输入,其中概念嵌入序列
Figure FDA0003330458260000055
作为注意力机制中query,概念-反应交互嵌入序列
Figure FDA0003330458260000056
则作为key和value矩阵,仅利用一般注意力机制来获取并输出学生的实践相关特征;
Figure FDA0003330458260000057
最终实践相关特征融合器获取并输出学生实践相关特征P={p1,p2,…,pt};
记忆特征融合器利用修改后的记忆感知注意力机制,采用问题嵌入序列
Figure FDA0003330458260000058
问题-反应交互嵌入序列
Figure FDA0003330458260000059
Figure FDA00033304582600000510
作为输入,其中问题嵌入序列
Figure FDA00033304582600000511
作为注意力机制中query,问题-反应交互嵌入序列
Figure FDA0003330458260000061
则作为key和value矩阵,以对数函数lg(N)来建模学生的学习行为,以指数衰减函数e-ΔT来建模学生遗忘规律,通过调整注意力权重分数得到的记忆相关注意力权重分数为:
Figure FDA0003330458260000062
其中,θh表示第h个学生的能力,λ1表示该模型的一个可训练参数;再根据所得权重分数βi对问题-反应交互嵌入进行加权求和,得到记忆相关特征的最终表示,mi∈Rd
Figure FDA0003330458260000063
最终记忆相关特征融合器获取并输出学生记忆相关特征M={m1,m2,…,mt};
语言特征融合器利用修改后的练习关系感知注意力机制,采用问题嵌入序列
Figure FDA0003330458260000064
问题-反应交互嵌入序列
Figure FDA0003330458260000065
作为输入,其中问题嵌入序列
Figure FDA0003330458260000066
作为注意力机制中query,问题-反应交互嵌入序列
Figure FDA0003330458260000067
则作为key和value矩阵;通过基于Bert模型提取的试题文本向量所构建的练习关系邻接矩阵R来修改注意力权重,得到所需的语言相关注意力权重分数:
γi=λ2*Softmax(Ri)+(1-λ2i
其中,λ2同样为该模型的一个可训练参数;再基于权重分数γi对问题-反应交互嵌入进行加权求和,得到语言相关特征的最终表示,li∈Rd
Figure FDA0003330458260000071
最终语言相关特征融合器获取并输出学生语言相关特征L={l1,l2,…,lt}。
CN202111278587.9A 2021-10-30 2021-10-30 一种融合认知刻画的注意力知识追踪方法 Pending CN114021722A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111278587.9A CN114021722A (zh) 2021-10-30 2021-10-30 一种融合认知刻画的注意力知识追踪方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111278587.9A CN114021722A (zh) 2021-10-30 2021-10-30 一种融合认知刻画的注意力知识追踪方法

Publications (1)

Publication Number Publication Date
CN114021722A true CN114021722A (zh) 2022-02-08

Family

ID=80059099

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111278587.9A Pending CN114021722A (zh) 2021-10-30 2021-10-30 一种融合认知刻画的注意力知识追踪方法

Country Status (1)

Country Link
CN (1) CN114021722A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114861916A (zh) * 2022-06-13 2022-08-05 合肥工业大学 一种融合知识联想路径的认知跟踪方法
CN114911975A (zh) * 2022-05-05 2022-08-16 金华航大北斗应用技术有限公司 一种基于图注意力网络的知识追踪方法
CN115391563A (zh) * 2022-09-01 2022-11-25 广东工业大学 一种基于多源异构数据融合的知识图谱链路预测方法
CN117474094A (zh) * 2023-12-22 2024-01-30 云南师范大学 基于Transformer的融合领域特征的知识追踪方法

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114911975A (zh) * 2022-05-05 2022-08-16 金华航大北斗应用技术有限公司 一种基于图注意力网络的知识追踪方法
CN114911975B (zh) * 2022-05-05 2024-04-05 金华航大北斗应用技术有限公司 一种基于图注意力网络的知识追踪方法
CN114861916A (zh) * 2022-06-13 2022-08-05 合肥工业大学 一种融合知识联想路径的认知跟踪方法
CN114861916B (zh) * 2022-06-13 2024-03-05 合肥工业大学 一种融合知识联想路径的认知跟踪方法
CN115391563A (zh) * 2022-09-01 2022-11-25 广东工业大学 一种基于多源异构数据融合的知识图谱链路预测方法
CN115391563B (zh) * 2022-09-01 2024-02-06 广东工业大学 一种基于多源异构数据融合的知识图谱链路预测方法
CN117474094A (zh) * 2023-12-22 2024-01-30 云南师范大学 基于Transformer的融合领域特征的知识追踪方法
CN117474094B (zh) * 2023-12-22 2024-04-09 云南师范大学 基于Transformer的融合领域特征的知识追踪方法

Similar Documents

Publication Publication Date Title
CN111460249B (zh) 一种基于学习者偏好建模的个性化学习资源推荐方法
CN108647233B (zh) 一种用于问答系统的答案排序方法
Martin et al. A Bayesian approach to cognitive assessment
CN111695779B (zh) 一种知识追踪方法、装置及存储介质
CN114021722A (zh) 一种融合认知刻画的注意力知识追踪方法
US10290221B2 (en) Systems and methods to customize student instruction
CN112116092B (zh) 可解释性知识水平追踪方法、系统和存储介质
US11631338B2 (en) Deep knowledge tracing with transformers
CN111159419B (zh) 基于图卷积的知识追踪数据处理方法、系统和存储介质
CN107544960A (zh) 一种基于变量绑定和关系激活的推理方法
CN112257966A (zh) 模型处理方法、装置、电子设备及存储介质
Lu et al. CMKT: Concept map driven knowledge tracing
CN114429212A (zh) 智能学习知识能力跟踪方法、电子设备及存储介质
CN115455186A (zh) 一种基于多模型的学情分析方法
CN115238036A (zh) 一种基于图注意力网络和文本信息的认知诊断方法及装置
CN113283488B (zh) 一种基于学习行为的认知诊断方法及系统
Malik et al. Generative grading: near human-level accuracy for automated feedback on richly structured problems
Saini Artificial intelligence empowered domain modelling bot
Ma et al. Dtkt: An improved deep temporal convolutional network for knowledge tracing
CN116521872A (zh) 一种认知和情感的联合识别方法、系统及电子设备
CN112785039B (zh) 一种试题作答得分率的预测方法及相关装置
Zhou Research on teaching resource recommendation algorithm based on deep learning and cognitive diagnosis
Pu et al. EAKT: Embedding Cognitive Framework with Attention for Interpretable Knowledge Tracing
CN117743699B (zh) 一种基于dkt与汤普森采样算法的习题推荐方法及系统
Smith et al. Mathematical psychology.

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination