CN117911206A

CN117911206A - 基于双注意力机制的动态评估学生知识水平方法

Info

Publication number: CN117911206A
Application number: CN202311651860.7A
Authority: CN
Inventors: 池俊椿; 杨青; 张敬伟; 陈俊宇; 袁峰; 申治璋; 蒋林成
Original assignee: Guilin University of Electronic Technology
Current assignee: Guilin University of Electronic Technology
Priority date: 2023-12-05
Filing date: 2023-12-05
Publication date: 2024-04-19

Abstract

本发明涉及知识追踪技术领域，涉及一种基于双注意力机制的动态评估学生知识水平方法，包括如下步骤：S1.获取学生学习过程的交互信息，将交互信息组成序列；S2.将交互序列划分成动态问题级别序列，平均技能级别序列，额外特征序列三个部分；S3.将不同序列输入对应模块进行训练，通过长短期记忆网络和多个注意力机制得到学生的知识状态；S4.将知识状态输入可解释性模块评估其知识水平；S5.记录训练模型评价指标，通过参数更新后的模型验证学生的交互序列，评估其知识水平。本发明充分挖掘学生交互信息，以不同角度评估学生的知识状态，提高了预测学生未来表现的准确率。

Description

基于双注意力机制的动态评估学生知识水平方法

技术领域

本发明涉及知识追踪技术领域，具体地说，涉及一种基于双注意力机制的动态评估学生知识水平方法。

背景技术

知识追踪(Knowledge Tracing)是一项关键技术，它通过观察学生历史上的学习过程来预测他们未来的学习表现。深度学习在解决知识追踪问题上具有很大的潜力，因为深度神经网络可以更好地表达和处理复杂数据。当与高质量的学习资料和指导相结合时，这种预测能力可以帮助学生更好、更快地学习。因此，知识追踪模型已被广泛应用于智能辅导系统。但是，目前的知识追踪模型挖掘学生交互信息不充分，准确率和公平性难以满足要求。

发明内容

本发明的内容是提供一种基于双注意力机制的动态评估学生知识水平方法，其充分挖掘学生交互信息，以不同角度评估学生的知识状态，提高了预测学生未来表现的准确率。

根据本发明的基于双注意力机制的动态评估学生知识水平方法，其包括以下步骤：

S1.从在线教育平台获取学生学习过程的交互信息，筛选出有效值并组成交互序列；

S2.将交互序列划分成动态问题级别序列、平均技能级别序列、额外特征序列三个部分，其中动态问题级别序列是以动态知识水平划分，平均技能级别序列是以问题所对应知识点的平均贡献划分，额外特征序列包括问题所花时间、问题所用提示率、问题难度；

S3.将不同序列输入对应模块进行训练，通过长短期记忆网络和多个注意力机制得到学生的知识状态，即获取各部分交互序列所隐藏的信息；

S4.将知识状态输入可解释性模块评估其知识水平，即预测学生未来表现；

S5.记录训练模型评价指标，通过参数更新后的模型验证学生的交互序列，评估其知识水平。

作为优选，S1中，在线教育平台获取学生学习过程的交互信息，包括问题ID、回答、所花时间、所用提示数、题目设置提示数；将交互信息组成序列，对序列清洗，剔除各个特征无效数据。

作为优选，动态问题级别序列包括问题ID、回答、学生分类。

作为优选，学生分类是根据学生所属段的做题表现，基于学生知识水平动态聚类。

作为优选，学生知识水平动态聚类是将一段时间内的交互切分成数条固定段长的交互，根据学生段中答题正确率、做题所花时间计算出该段的知识水平；采用如下公式计算：

R(s_j)_1:z＝Correct(s_j)_1:z-Incorrect(s_j)_1:z

学生i的知识水平向量：

其中，s_j为技能j，1:z为时间间隔1到z，N_jt为时间间隔t之前技能s_j的练习总数；为答对问题的正确率，/>为所花费时间/总时间；R表示学习能力；令qs_col问题q对应的技能列表、qs_dict为问题-技能联系字典，其中len(qs_col)为列表长度，qs_col_x为技能列表下标为x的元素，Correct(s_j)_1:z为表示学生i在时间间隔1到z内对技能s_j的正确表现，/>为表示从时间间隔1到z内，学生i在每种技能上的学习能力概况的向量。

作为优选，平均技能是指问题所属技能，将所属技能取平均贡献，平均技能是通过对问题关联的知识点嵌入求平均得到的，具体而言，对于每个问题，将其相关的知识点嵌入进行平均操作，从而获得一个代表该问题技能水平的向量。

作为优选，问题难度是由学生所答问题正确率、所用提示率计算得来，其中若问题交互次数少于三次，代表问题交互次数不足以计算难度，则分配一半难度。

作为优选，S3中，将分割完成的序列输入模型，模型采用深度学习方式，并在Pytorch框架上进行模型训练；平均技能序列通过注意力机制获取问题间的隐藏信息，以平均技能序列计算问题间相似度，与动态问题序列通过多头注意力机制获取学生的知识状态。

作为优选，S4中，将额外特征输入到多层感知机MLP中进行计算；通过MLP的多个隐藏层的非线性变换，额外特征被映射为一个新的高级表示；然后，将经过MLP处理后的额外特征与原始的知识状态进行拼接操作，得到一个综合的知识状态向量；最后，将这个综合的知识状态向量输入到预测层，用于预测学生未来的表现。

作为优选，S5中，记录训练过程的所有AUC和ACC，选取AUC最好的一次，保存训练模型；使用最佳批次的模型参数更新模型，并用该模型对测试集中的学生进行知识水平评估和表现预测；通过将测试集的数据输入到更新后的模型中，获得学生的知识水平评估结果和未来表现的预测。

本发明通过观察学生的学习表现，将问题和技能之间一对多的关系进行挖掘，从而计算出每个问题对应的平均知识点贡献。这个过程利用自注意力机制来捕捉问题之间的隐含关系，并根据问题的重要程度来确定各个问题的权重。通过计算学生与问题的交互重要程度，可以得到更加聚焦于重点问题的知识状态，可以得到学生更加真实的知识状态。本发明在准确率和公平性方面取得较好效果。

附图说明

图1为实施例中一种基于双注意力机制的动态评估学生知识水平方法的流程图。

具体实施方式

为进一步了解本发明的内容，结合附图和实施例对本发明作详细描述。应当理解的是，实施例仅仅是对本发明进行解释而并非限定。

实施例

如图1所示，本实施例提供了一种基于双注意力机制的动态评估学生知识水平方法，其包括以下步骤：

S1中，在线教育平台获取学生学习过程的交互信息，包括问题ID、回答、所花时间、所用提示数、题目设置提示数；将交互信息组成序列，对序列清洗，剔除各个特征无效数据。

动态问题级别序列包括问题ID、回答、学生分类。学生分类是根据学生所属段的做题表现，基于学生知识水平动态聚类。学生知识水平动态聚类是将一段时间内的交互切分成数条固定段长的交互，根据学生段中答题正确率、做题所花时间计算出该段的知识水平；采用如下公式计算：

R(s_j)_1:z＝Correct(s_j)_1:z-Incorrect(s_j)_1:z

学生i的知识水平向量：

在现实教育背景中，一个问题应对应多个知识点，即学生回答一道题，应对多个知识点掌握均有影响；平均技能是指问题所属技能，将所属技能取平均贡献，平均技能是通过对问题关联的知识点嵌入求平均得到的，具体而言，对于每个问题，将其相关的知识点嵌入进行平均操作，从而获得一个代表该问题技能水平的向量。

问题难度是由学生所答问题正确率、所用提示率计算得来，其中若问题交互次数少于三次，代表问题交互次数不足以计算难度，则分配一半难度。

S3中，将分割完成的序列输入模型，模型采用深度学习方式，并在Pytorch框架上进行模型训练；平均技能序列通过注意力机制获取问题间的隐藏信息，以平均技能序列计算问题间相似度，与动态问题序列通过多头注意力机制获取学生的知识状态。

S3的具体步骤如下：

1)根据问题与技能一对多的关系，挖掘出问题对应的平均技能贡献，并计算出问题间的重要关系。计算过程如下公式所示：

其中，上式的Embedding是torch中一种编码方式，k_q为问题q对应的技能k，表示问题q对应的平均技能。问题q对应的多技能，包括暴露在数据集的直接技能和隐式技能，通过超参数调整他们之间的权重比，N为技能k的总数量；/>为问题q的平均技能贡献，Q是查询矩阵，K是关键字矩阵，V是值矩阵，d_k是查询矩阵和关键字矩阵的维度，LSTM为长短期记忆递归神经网络，使用LSTM可以有效的传递和表达长时间序列中的信息并且不会导致长时间前的有用信息被忽略；Attention为自注意力机制，计算出各问题的重要程度。代码如下：

2)根据步骤1)算出问题的权重，使用自注意机制计算出学生问题交互的重要性，即，根据学生做题时间、正确率、提示率计算学生个人能力，并且根据问题的权重，计算出学生问题交互的重要性；并且问题交互是以学生个人能力划分成多段等长的交互序列。计算过程如下公式所示：

q_ic＝Embedding(q,a,c)

Q,K＝LSTM(q_ic)V＝q_i

其中，上式Embedding、LSTM、Attention与步骤1)网络结构一样，具有相同效果。其中a为问题回答，q_ic为动态问题交互，q_a为问题权重，c是基于学生个人能力聚类而来类别，用于标识具有相似个人能力的学生，因此在不同段贡献不同。q_i为步骤1)计算得出，根据问题的权重，计算出学生问题交互的重要性。代码如下：

S4中，将额外特征输入到多层感知机MLP中进行计算；通过MLP的多个隐藏层的非线性变换，额外特征被映射为一个新的高级表示；然后，将经过MLP处理后的额外特征与原始的知识状态进行拼接操作，即，将步骤2)计算出的带权的问题交互特征与额外特征聚合，得到一个综合的知识状态向量；最后，将这个综合的知识状态向量输入到预测层，用于预测学生未来的表现。

S5中，记录训练过程的所有AUC和ACC，选取AUC最好的一次，保存训练模型；使用最佳批次的模型参数更新模型，并用该模型对测试集中的学生进行知识水平评估和表现预测；通过将测试集的数据输入到更新后的模型中，获得学生的知识水平评估结果和未来表现的预测。

本实施例获取学生知识状态的评分，设计出损失函数计算损失。训练完成后，通过测试数据验证模型在准确率与公平性指标上能否达到要求，事实证明在多个数据集上模型取得较好成果。

本实施例基于学生的个人能力对学生进行聚类，并通过获取具有相似个人能力的学生群组来优化学习效果。在这种情况下，即使两个学生接受相同的学习序列，由于他们在领悟新知识方面的能力不同，他们所获得的知识可能会有所差异。以领悟新知识能力为例，如果两个学生在领悟新知识方面的能力不同，即使他们接受相同的学习内容，他们在理解和吸收知识方面的表现可能会有所不同。一个学生可能能够更快地理解和应用新知识，而另一个学生可能需要更多的时间和指导才能达到相同的程度。

本实施例巧妙运用自注意力机制获取各问题的重要程度，从而得到学生问题交互的重要程度。比如学生对某个知识点掌握比较差，学生自主选择多练习对应的题目，学生将注意力聚集在知识点薄弱的地方，从而能得出学生真实的知识状态。

本实施例处理数据集剔除了无效数据，如做题时间为负数、无效回答。并且计算问题难度时，剔除了交互次数小于3的问题，赋予默认难度，增加了问题难度的合理性。

实验所使用数据集为ASSIST2009与ASSIST2017，它们是两个广泛用于研究和发展智能辅助教育系统的数据集。这些数据集是由卡内基梅隆大学(Carnegie MellonUniversity)的Ryan Baker等人组织收集的。其中ASSIST2009交互丰富，该数据集有552535个交互、17751个问题、123个技能、4163个用户，用作训练模型。

总而言之，本实施例在教育领域中，在准确率和公平性方面取得较好效果。

以上示意性的对本发明及其实施方式进行了描述，该描述没有限制性，附图中所示的也只是本发明的实施方式之一，实际的结构并不局限于此。所以，如果本领域的普通技术人员受其启示，在不脱离本发明创造宗旨的情况下，不经创造性的设计出与该技术方案相似的结构方式及实施例，均应属于本发明的保护范围。

Claims

1.基于双注意力机制的动态评估学生知识水平方法，其特征在于：包括以下步骤：

2.根据权利要求1所述的基于双注意力机制的动态评估学生知识水平方法，其特征在于：S1中，在线教育平台获取学生学习过程的交互信息，包括问题ID、回答、所花时间、所用提示数、题目设置提示数；将交互信息组成序列，对序列清洗，剔除各个特征无效数据。

3.根据权利要求2所述的基于双注意力机制的动态评估学生知识水平方法，其特征在于：动态问题级别序列包括问题ID、回答、学生分类。

4.根据权利要求3所述的基于双注意力机制的动态评估学生知识水平方法，其特征在于：学生分类是根据学生所属段的做题表现，基于学生知识水平动态聚类。

5.根据权利要求4所述的基于双注意力机制的动态评估学生知识水平方法，其特征在于：学生知识水平动态聚类是将一段时间内的交互切分成数条固定段长的交互，根据学生段中答题正确率、做题所花时间计算出该段的知识水平；采用如下公式计算：

R(s_j)_1:z＝Correct(s_j)_1:z-Incorrect(s_j)_1:z

学生i的知识水平向量：

6.根据权利要求5所述的基于双注意力机制的动态评估学生知识水平方法，其特征在于：平均技能是指问题所属技能，将所属技能取平均贡献，平均技能是通过对问题关联的知识点嵌入求平均得到的，具体而言，对于每个问题，将其相关的知识点嵌入进行平均操作，从而获得一个代表该问题技能水平的向量。

7.根据权利要求6所述的基于双注意力机制的动态评估学生知识水平方法，其特征在于：问题难度是由学生所答问题正确率、所用提示率计算得来，其中若问题交互次数少于三次，代表问题交互次数不足以计算难度，则分配一半难度。

8.根据权利要求7所述的基于双注意力机制的动态评估学生知识水平方法，其特征在于：S3中，将分割完成的序列输入模型，模型采用深度学习方式，并在Pytorch框架上进行模型训练；平均技能序列通过注意力机制获取问题间的隐藏信息，以平均技能序列计算问题间相似度，与动态问题序列通过多头注意力机制获取学生的知识状态。

9.根据权利要求8所述的基于双注意力机制的动态评估学生知识水平方法，其特征在于：S4中，将额外特征输入到多层感知机MLP中进行计算；通过MLP的多个隐藏层的非线性变换，额外特征被映射为一个新的高级表示；然后，将经过MLP处理后的额外特征与原始的知识状态进行拼接操作，得到一个综合的知识状态向量；最后，将这个综合的知识状态向量输入到预测层，用于预测学生未来的表现。

10.根据权利要求9所述的基于双注意力机制的动态评估学生知识水平方法，其特征在于：S5中，记录训练过程的所有AUC和ACC，选取AUC最好的一次，保存训练模型；使用最佳批次的模型参数更新模型，并用该模型对测试集中的学生进行知识水平评估和表现预测；通过将测试集的数据输入到更新后的模型中，获得学生的知识水平评估结果和未来表现的预测。