CN115795015A

CN115795015A - 一种试题难度增强的综合知识追踪方法

Info

Publication number: CN115795015A
Application number: CN202211720753.0A
Authority: CN
Inventors: 侯晨煜; 尤澳晨; 曹斌; 范菁
Original assignee: Zhejiang University of Technology ZJUT
Current assignee: Zhejiang University of Technology ZJUT
Priority date: 2022-12-30
Filing date: 2022-12-30
Publication date: 2023-03-14

Abstract

本发明公开了一种试题难度增强的综合知识追踪方法，包括：由学生的历史答题记录数据与相应的试题数据构成的数据集，初始化定义学生的答题过程心理能力，经过数据处理后进行评估获得学生的答题能力以及试题和知识点难度，对数据进行嵌入处理，最后使用深度学习方法训练知识追踪模型，得到每个学生的知识状态和优化后的心理能力数据并通过学生的知识状态预测和心理能力数据学生在未来试题上的表现。本发明综合考虑试题的难易情况、学生的做题能力和心理能力等因素贴近真实教育背景下的学习过程以获得合理的知识状态，最终根据学生的知识状态对学生的答题表现进行精准的预测。

Description

一种试题难度增强的综合知识追踪方法

技术领域

本发明属于人工智能和教育数据领域，尤其涉及一种试题难度增强的综合知识追踪方法。

技术背景

知识追踪的任务是利用学生的历史学习过程交互数据，对学生的知识状态，即知识的掌握程度随时间的变化过程进行追踪和建模，以能更为准确的预测学生在未来学习中的答题表现以及知识掌握水平。近年来，知识追踪因其在教育中的重要意义而备受关注，在智能辅导系统、在线教育平台以及个性化习题推荐系统中都得到了广泛的应用。

知识追踪有许多解决方法，例如概率图模型和贝叶斯模型，而随着深度神经网络的快速发展，基于深度知识追踪的相关模型取得了出色的效果，例如最先将深度学习引入知识追踪问题并用隐层状态代表知识状态的DKT模型，通过注意力机制捕捉学生在相似题目上的相似表现的AKT模型，通过图神经网络对知识状态进行建模的GKT模型。但目前只有少部分方法考虑了试题难度对学生知识掌握的影响，它们仅仅把答对题目的人数比例作为试题难度，这样粗糙的处理方式对一些长尾试题不合理。其次，不同的方法在建模知识追踪过程时考虑的因素都不同，目前尚没有一个统一的模型综合考虑了学习过程中的多种因素，如知识更新、遗忘、试题相关性、学生心理能力等。

发明内容

本发明的目的是提供一种试题难度增强的综合知识追踪方法，其目的通过对学生的做题能力和试题及知识点难度的充分分析作为输入的重要部分并通过注意力机制累积回答与当前试题相关的历史试题时的知识状态，在考虑学生的答题过程心理能力的场景下通过对学生学习过程的学习收获和遗忘机制进行建模，较为准确的预测学生表现，追踪学生知识掌握水平的变化。

一种试题难度增强的综合知识追踪方法，其特征在于，包括：

由学生的历史答题记录数据与相应的试题数据构成的数据集，初始化定义学生的答题过程心理能力数据，经过数据处理后进行评估获得学生的答题能力以及试题和知识点难度，对数据进行嵌入处理，最后使用深度学习方法训练知识追踪模型，得到每个学生的知识状态和优化后的心理能力数据并通过学生的知识状态和心理能力数据预测学生在未来试题上的表现。

历史答题记录信息包括：试题号、试题得分情况以及每道试题所涉及的知识点；

对于一个学生历史答题记录数据集D，包含了I名学生的集合S＝{s₁，s₂，…，s_i，…，s_I}，包含了J道试题集合E＝{e₁，e₂，…，e_j，…，e_J}以及知识点集合K＝{k₁，k₂，…，k_m，…，k_M}，每一道试题都被预先标注了所涉及的知识点，试题与知识点的联系通过Q矩阵来进行表示，Q∈R^J×M，矩阵由0和1组成，Q_jm＝1表示试题e_j涉及知识点k_m反之则不涉及。其中学生的答题交互序列定义为x＝{(e₁，C₁，r₁)，(e₂，C₂，r₂)，…，(e_t，C_t，r_t)}。其中一个元组(e_t，C_t，r_t)代表一个学习单元，其中e_t代表试题，C_t代表与试题e_t相关的知识点集合，r_t代表回答正确与否即r_t∈{0，1}，l代表回答正确，0代表回答错误。

学生的答题过程心理能力数据包括；

初始化一个矩阵

的矩阵，其中每一行就代表了一个学生的答题心理能力即学生s_t的心理能力可以用向量

来表示。

学生做题能力以及试题和知识点难度计算包括；

学生s_i做题能力g_i的计算公式如下：

其中E_i是学生s_i在学习过程中的试题序列，e_j代表E_i中的第j题，|E_i|代表试题序列的长度，J代表试题数量，r_ij∈{0，1}代表学生s_i回答试题序列中试题e_j正确与否。公式背后的直觉是答题数量越多并且正确率越高的学生的做题能力高。

试题e_j难度ed_j的计算公式如下：

其中S_j代表回答过试题e_j的学生集合，g_i代表S_j中的学生s_i的做题能力其中|S_j|代表学生集合的长度，I代表总学生数量，r_ij∈{0，1}代表学生s_i回答试题e_j正确与否。公式背后的直觉是对于试题e_j，回答错误的学生的做题能力越高，回答试题的人数越少，则试题的难度越大。

知识点k_m难度kd_m的计算公式如下：

其中E_m代表涉及该知识点的试题的集合，|E_m|代表集合长度，ed_j代表E_m中第j题的试题难度，即知识点难度通过对涉及到该知识点的所有试题的难度求平均值计算得到。

对数据进行嵌入处理包括：

对试题集合E进行one-hot编码，随后使用嵌入矩阵

对试题向量进行Embedding操作，其中J代表试题的数量，d_e代表Embedding后的试题向量维度，随后每个学习单元的试题e_t就可以用向量

来表示。

对知识点集合K进行one-hot编码，随后使用嵌入矩阵

对试题向量进行Embedding操作，其中M代表知识点的数量，d_k代表Embedding后的知识点向量维度。随后每个知识点k_m可以用向量k_m表示，并且每个交互单元的试题e_t所涉及的知识点集合C_t就可以用集合中的知识点向量相加后表示，即知识点集合C_t可以用向量

来表示，公式如下：

对试题难度按照最大最小值区间划分为n个档次，使得试题难度从标量转化为类别。对难度类别进行one-hot编码后得到试题难度向量，使用嵌入矩阵

对试题难度向量进行Embedding操作，其中d_l表示Embedding后的试题难度向量维度，即试题e_t的难度可以用向量

来表示。试题难度类别划分公式如下：

其中

代表所有试题中的难度最大值，

代表所有试题中的难度最小值，ed_j代表试题e_j难度，

代表试题e_j难度转化成类别类型后的值；

对知识点难度按照最大最小值区间划分为n个档次，使得知识点难度从标量转化为类别。对知识点难度类别进行one-hot编码后得到知识点难度向量，使用嵌入矩阵

对试题难度向量进行Embedding操作，其中d_l表示Embedding后的试题难度向量维度，即知识点k_m的难度可以用向量

来表示。试题难度类别划分公式如下：

其中

代表所有知识点中的难度最大值，

代表所有知识点中的难度最小值,kd_m代表知识点k_m的难度，kl_m代表知识点k_m难度转化成类别类型后的值；

每个交互单元的试题e_t所涉及的知识点集合C_t的难度就可以用知识点难度向量相加后求平均值计算得到,即知识点集合C_t的难度可以用向量

来表示。计算知识点集合难度的公式如下：

其中|c_t|代表知识点集合的长度，kl_m代表c_t中知识点k_m的难度向量；

随后通过将试题向量e_t、试题相关知识点集合向量c_t、试题难度向量el_t、试题相关知识点集合难度向量cl_t连接在一起并使用多层感知机进行深度融合得到随后得到完整的试题信息嵌入

其中

代表拼接操作，

是权重矩阵，

是偏置项。

将试题回答进行one-hot编码后，使用嵌入矩阵

对试题向量进行Embedding操作，其中d_a表示Embedding后的回答向量维度，随后每个学习单元的回答r_t就可以用向量

来表示。

知识追踪模型包括：

注意力机制模块：将当前学习单元的试题信息嵌入E_t乘以矩阵

得到query向量

将包含当前学习单元前的试题信息嵌入向量集合{E₁,E₂,…,E_t-1}内的向量分别乘以矩阵

到key向量集合{K₁,K₂,…,K_t-1}将key向量集合中的向量分别与q_t进行点乘后除以

得到集合α_t＝{α_t,1,α_t,2,…,α_t,t-1},对α集合做softmax操作得到注意力分数集合α′_t＝{α′_t,1,α′_t,2,…,α′_t,t-1}将α′_t中的注意力分数分别乘以知识状态集合{h₁,h₂,…,h_t-1}中的向量得到累积知识状态

计算公式如下所示：

学习模块：试题信息嵌入E_t、回答嵌入a_t以及知识点掌握状态

可以通过一个全连接层对学习增益进行建模得到学习增益lg_t：

其中

代表拼接操作，

是权重矩阵，

是偏置项。

考虑到学习增益并非能完全转换为学生知识的增长，所以设计了一个学习门

来控制学生转化能力：

其中

代表拼接操作，

是权重矩阵，

是偏置项。

随后将

乘以lg_t得到真正的学习增益LG_t：

遗忘机制模块：在学习的过程中会有遗忘现象影响到知识的掌握程度，因此使用一个遗忘门

来模拟遗忘效应：

其中

代表拼接操作，

是权重矩阵，

是偏置项。

随后我们可以通过将遗忘门

乘以上一次的知识点掌握状态h_t-1加上LG_t得到当前的知识点掌握状态h_t：

预测模块：在预测模块，我们通过下一道试题的信息嵌入、学生的当前知识点掌握状态以及学生的心理能力通过一个全连接层来投射到输出层得到输出向量y_t+1：

其中

代表拼接操作，

是权重矩阵，

是偏置项。

使用一个全连接层作为输出层输出最终对试题回答正确性的预测，取值为0到1之间并设置一个阈值，若数值大于阈值则判断回答正确，反之不正确。

其中

是权重向量，b₆∈R¹是偏置项。

在模型训练时使用二元交叉熵损失函数计算题目回答是否正确的预测的损失值：

loss＝BCEloss(y_t+1,r_t+1)

其中r_t+1∈{0,1}代表试题e_t+1的回答正确与否的真实值。

与现有技术相比，本发明具有如下优点：

本发明实施例提供的上述方案，提出了一种综合考虑学生做题能力以及试题和知识点难度计算的公式，通过注意力模块累积回答历史答题序列中与当前试题相关联的试题时的知识状态，在考虑心理能力的场景下对学生在学习过程中的学习收益和知识遗忘机制进行建模，得到与学习过程相符合的学生变化的知识状态。

本发明运用深度知识追踪模型，对学生答题中的学习过程进行建模，追踪学生在学习过程中不断变化的知识状态。本发明综合考虑试题的难易情况、学生的做题能力和心理能力等因素贴近真实教育背景下的学习过程以获得合理的知识状态，最终根据学生的知识状态对学生的答题表现进行精准的预测。

附图说明

图1是本发明提出方法的流程图；

图2是本发明设计的模型架构图；

具体实施方式

下面结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明的保护范围。

本发明的目的是通过以下技术方案来实现的：

一种试题难度增强的综合知识追踪方法，包含以下内容：

获取学生的历史答题交互数据与相应的试题信息数据构成的数据集并进行预处理。

通过公式计算学生的做题能力和试题及知识点的难度，初始化生成学生的心理能力矩阵并对数据进行嵌入。

利用注意力机制计算与当前试题相关的历史试题的累积知识点状态。

通过累积知识点状态、当前试题信息嵌入、试题回答嵌入、心理能力计算知识增益。

通过累积知识点状态、当前试题嵌入、回答嵌入、心理能力计算经过知识遗忘的知识状态并与知识增益组合成新的知识状态。

通过学生的当前知识状态、下一道试题信息嵌入、心理能力对试题的回答进行预测。

上述方法中计算学生的做题能力和试题及知识点的难度的公式如下：

学生s_i做题能力g_i的计算公式：

其中E_i是学生s_i在学习过程中的试题序列，|E_i|代表试题序列的长度，r_ij代表序列中的试题e_j回答正确与否，J代表所有的试题数量，r_ij∈{0，1}代表学生s_i回答试题序列中试题e_j正确与否。

试题e_j难度ed_j的计算公式如下：

其中S_j代表回答过试题e_j的学生集合，|S_j|代表学生集合的长度，g_i代表S_j中学生s_i的做题能力，I代表总学生数量，r_ij∈{0，1}代表学生s_i回答试题e_j正确与否。

知识点k_m难度kd_m的计算公式如下：

其中E_m代表涉及该知识点的试题的集合，|E_m|代表试题集合的长度，ed_j代表E_m中试题e_j的难度，即知识点难度通过对涉及到该知识点的所有试题的难度求平均值计算得到。

上述方法中利用注意力机制计算与当前试题相关的历史试题的累积知识点状态的方法和公式如下：

通过计算当前试题于历史交互序列中的试题信息的相似度获取注意力分数，并将注意力分数与先前的知识点状态相乘，获得累积当前知识点状态。

计算公式如下所示：

其中，{h₁,h₂,…,h_t-1}代表知识状态集合，{α′_t,1,α′_t,2,…,α′_t,t-1}代表注意力分数集合，

代表通过计算得到的累积知识点状态。

上述方法中通过累积知识点状态、当前试题信息嵌入、试题回答嵌入、心理能力计算知识增益的方法和公式如下：

其中W₂是权重矩阵，b₂是偏置项。

考虑到学习增益并非能完全转换为学生知识的增长，通过学习门

来控制学生转化能力：

其中W₃是权重矩阵，b₃是偏置项。

将

乘以lg_t得到真正的学习增益LG_t：

上述方法中通过累积知识点状态、当前试题嵌入、回答嵌入、心理能力计算经过知识遗忘的知识状态并与知识增益组合成新的知识状态的方法和公式如下：

在学习的过程中会有遗忘现象影响到知识的掌握程度，使用一个遗忘门

来模拟遗忘效应：

其中W₄是权重矩阵，b₄是偏置项。

通过将遗忘门

上述方法中通过学生的当前知识状态、下一道试题信息嵌入、心理能力对试题的回答进行预测的方法和公式如下：

我们通过该试题的信息嵌入、学生的当前知识点掌握状态以及学生的心理能力通过一个全连接层来投射到输出层得到输出向量y_t+1：

其中W₅是权重矩阵，b₅是偏置项。

使用一个全连接层作为输出层输出最终对试题回答正确性的预测y_t+1，取值为0到1之间并设置一个阈值，若数值大于阈值则判断回答正确，反之不正确。

其中W₆是权重向量，b₆是偏置项。

上述公式中的E_t代表试题信息嵌入、E_t+1代表下一题试题信息嵌入、α_t代表回答嵌入、p_t代表心理能力向量、

代表累积的知识点掌握状态、h_t-1代表前一时刻知识点掌握状态、h_t代表当前知识点掌握状态、σ代表激活函数sigmoid、

代表拼接操作。

具体地，本发明实施例提供一种试题难度增强的综合知识追踪方法，如图1所示，主要包括：

步骤1、获取学生的历史答题交互数据与相应的试题信息数据构成的数据集并进行预处理。历史答题交互数据包括每个学生学习过程中试题的答题情况，试题信息数据包括每一道试题所涉及的知识点。

预处理操作包括数据清洗并对数据集中的数据使用统一的数学形式进行表示：对于一个学生历史答题记录数据集D，包含了I名学生的集合S＝{s₁,s₂,…,s_i,…,s_I}，包含了J道试题集合E＝{e₁,e₂,…,e_j,…,e_J}以及知识点集合K＝{k₁,k₂,…,k_m,…,k_M}，每一道试题都被预先标注了所涉及的知识点，试题与知识点的联系通过Q矩阵来进行表示，Q∈R^J×M,矩阵由0和1组成，Q_jm＝1表示试题e_j涉及知识点k_m反之则不涉及。其中学生的答题交互序列定义为x＝{(e₁,C₁,r₁),(e₂,C₂,r₂),…,(e_t,C_t,r_t)}。其中一个元组(e_t,C_t,r_t)代表一个学习单元，其中e_t代表试题，C_t代表与试题e_t相关的知识点集合，r_t代表回答正确与否即r_t∈{0,1},1代表回答正确，0代表回答错误。

步骤2、通过公式计算学生的做题能力和试题及知识点的难度，生成学生的心理能力矩阵并对数据进行嵌入。

学生s_i做题能力的计算公式如下：

其中E_i是学生s_i在学习过程中的试题序列，e_j代表E_i中的第j题，|E_i|代表试题序列的长度，J代表试题数量，r_ij∈{0,1}代表学生s_i回答试题序列中试题e_j正确与否；

试题e_j难度ed_j的计算公式如下：

其中S_j代表回答过试题e_j的学生集合，g_i代表S_j中的学生s_i的做题能力其中|S_j|代表学生集合的长度，I代表总学生数量，r_ij∈{0,1}代表学生s_i回答试题e_j正确与否；知识点k_m难度kd_m的计算公式如下：

其中E_m代表涉及该知识点的试题的集合，|E_m|代表集合长度，ed_j代表E_m中第j题的试题难度,即知识点难度通过对涉及到该知识点的所有试题的难度求平均值计算得到；

生成学生的心理能力矩阵并对数据的嵌入包括：初始化一个矩阵

来表示。

对试题集合E进行one-hot编码，随后使用嵌入矩阵

来表示。

对知识点集合K进行one-hot编码，随后使用嵌入矩阵

来表示，公式如下：

来表示。试题难度类别划分公式如下：

其中

代表所有试题中的难度最大值，

代表所有试题中的难度最小值，ed_j代表试题e_j难度，

代表试题e_j难度转化成类别类型后的值；对知识点难度按照最大最小值区间划分为n个档次，使得知识点难度从标量转化为类别。对知识点难度类别进行one-hot编码后得到知识点难度向量，使用嵌入矩阵

来表示。试题难度类别划分公式如下：

其中

代表所有知识点中的难度最大值，

来表示。计算知识点集合难度的公式如下：

其中

代表拼接操作，

是权重矩阵，

是偏置项。

将试题回答进行one-hot编码后，使用嵌入矩阵

来表示。

步骤3、利用注意力机制计算与当前试题相关的历史试题的累积知识点状态，具体模块如图2所示。

得到query向量

计算公式如下所示：

步骤4、通过累积知识点状态、当前试题信息嵌入、试题回答嵌入、心理能力计算知识增益，具体模块如图2所示。

可以通过一个全连接层对学习增益进行建模得到学习增益：

其中

代表拼接操作，

是权重矩阵，

是偏置项。

来控制学生转化能力：

其中

代表拼接操作，

是权重矩阵，

是偏置项。

随后将

乘以lg_t得到真正的学习增益LG_t：

步骤5、通过累积知识点状态、当前试题嵌入、回答嵌入、心理能力计算经过知识遗忘的知识状态并与知识增益组合成新的知识状态，具体模块如图2所示。

来模拟遗忘效应：

其中

代表拼接操作，

是权重矩阵，

是偏置项。

随后我们可以通过将遗忘门

步骤6、通过学生的当前知识状态、下一道试题信息嵌入、心理能力对试题的回答进行预测，具体模块如图2所示。

其中

代表拼接操作，

是权重矩阵，

是偏置项。

其中

是权重向量，b₆∈R¹是偏置项。

在模型训练时使用二元交叉熵损失函数计算题目回答对错的预测的损失值：

loss＝BCEloss(y_t+1,r_t+1)

其中r_t+1∈{0,1}代表试题e_t+1的回答正确与否的真实值。

Claims

1.一种试题难度增强的综合知识追踪方法，其特征在于，包括：

2.根据权利要求1所述的一种试题难度增强的综合知识追踪方法，其特征在于，由学生的历史答题记录数据与相应的试题数据构成的数据集包括：试题号、试题得分情况以及每道试题所涉及的知识点；

对于一个学生历史答题记录数据集D，包含了I名学生的集合S＝{s₁，s₂，…，s_i，…，s_I}，包含了J道试题集合E＝{e₁，e₂，…，e_j，…，e_J}以及知识点集合K＝{k₁，k₂，…，k_m，…，k_M}，每一道试题都被预先标注了所涉及的知识点，试题与知识点的联系通过Q矩阵来进行表示，Q∈R^J×M，矩阵由0和1组成，Q_jm＝1表示试题e_j涉及知识点k_m反之则不涉及，其中学生的答题交互序列定义为x＝{(e₁，C₁，r₁)，(e₂，C₂，r₂)，…，(e_t，C_t，r_t)}，其中一个元组(e_t，C_t，r_t)代表一个学习单元，其中e_t代表试题，C_t代表与试题e_t相关的知识点集合，r_t代表回答正确与否即r_t∈{0，1}，1代表回答正确，0代表回答错误。

3.根据权利要求1所述的一种试题难度增强的综合知识追踪方法，其特征在于，初始化定义学生的答题过程心理能力数据包括；

初始化一个矩阵