CN112288145A

CN112288145A - 基于多视角认知诊断的学生成绩预测方法

Info

Publication number: CN112288145A
Application number: CN202011103050.4A
Authority: CN
Inventors: 刘凡; 陈智斌; 崔闰杰; 许峰
Original assignee: Hohai University HHU
Current assignee: Hohai University HHU
Priority date: 2020-10-15
Filing date: 2020-10-15
Publication date: 2021-01-29
Anticipated expiration: 2040-10-15
Also published as: CN112288145B

Abstract

本发明公开了一种基于多视角认知诊断的学生成绩预测方法，对给定考试成绩进行分析确定学生‑试题反应函数，将第一词向量预训练模型作为一个视角对第一试题文本信息进行训练，将第二词向量预训练模型作为另一视角对第二试题文本信息进行训练，在每一步迭代过程中，每一个视角验证集的试题文本数据进行标记，标记得到的预测参数加入另一视角下一迭代步骤的训练集中，反复迭代，以确定预测用模型，提取待考试试题文本的各个预测试题参数，将各个预测试题参数与给定试题参数进行对比，确定目标试题参数，将目标试题参数代入学生‑试题反应函数，得到目标学生参数相对于待考试试题文本的考试成绩，以实现学生成绩预测，提升了预测得到的结果的准确性。

Description

基于多视角认知诊断的学生成绩预测方法

技术领域

本发明涉及认知诊断技术领域，尤其涉及一种基于多视角认知诊断的学生成绩预测方法。

背景技术

认知诊断与传统的大规模考试不同，传统的考试只能提供学生每道题的答题情况。然而由单一的分数，既不能获得学生的潜在知识状态与认知水平，也不能对学生近阶段的学习情况给予精确的分析，以调整学生下一阶段的学习。

学生是在线教育系统服务的主要对象，准确分析学生的认知水平，对帮助了解学生状态、构建适当的教学计划都具有极大的帮助。为此，教育心理学的研究者提出认知诊断评价(Cognitive Diagnosis Assessment，CDA)，进行学生认知水平的全面分析。CDA是一个基于认知心理学、统计学和计算机科学的评价体系，通过对学生的答题数据进行建模分析，对学生的认知状态进行诊断，定量考察学生的个体差异和认知水平。

认知诊断模型在不同的场景下有不同的应用，根据模型设计的不同，可以分析学生的知识掌握状态，猜测率与失误率等。根据分析结果的维度，认知诊断模型可以分为单维人资诊断模型与多维认知诊断模型。单维即分析结果使用单个的标量表示，例如项目反应理论(ItemResponse Theory,IRT)。这样的模型对于复杂的学生隐藏属性较难分析。因此自然的就有多维的认知诊断模型，例如多维项目反应理论(Multidimensional ItemResponse Theory,MIRT)。MIRT中有多种模型，例如双参数逻辑模型的多维扩展(Multidimensional extension of Two-Parameter Logisticmodel,M2PL)(Reckase,M.:Multidimensional Item Response Theory,vol.150.Springer,New York(2009))，M2PL中包含了两组试题的相关参数：试题的区别参数与试题的难度参数。

普通的认知诊断模型难以对试题文本这种异构信息分析建模，而试题文本是考试成绩评估中的重要信息。仅仅通过离散的题目序号与答题记录丢失了大量信息。Zhu(ZhuT,Liu Q,Huang Z,et al.MT-MCD:A Multi-task Cognitive Diagnosis Framework forStudent Assessment[C]//International Conference on Database Systems forAdvanced Applications.Springer,Cham,2018:318-335.)提出对试题文本提取信息并使用映射矩阵获得其参数，矩阵用于多任务学习以使各个不同的任务之间具有更强的可比较性。Wang(Wang F,Liu Q,Chen E,et al.Neural Cognitive Diagnostic for IntelligentEducation Systems,The 34^th AAAI Conference on Artificial Intelligence,NewYork,USA.)提出使用神经网络自动学习反应函数，并将试题文本和知识点-试题关联信息嵌入神经网络。

近年来，大量的从多视角的数据来学习的方法被提出。多视角的数据来源可以是不同的数据源或不同的特征子集。例如一个人可以通过指纹，面部，书写字迹来区别；一张图片可以通过像素信息或用语言描述。多视角分为三个方向：联合训练，多核学习与子空间学习。其中联合训练通过交替训练来达到不同视角的共识最大化。多核学习利用通常对应不同视角的核，通过线性或非线性的方法将其结合起来。子空间学习假设所有的视角都共享同一个隐藏子空间，子空间学习则试图找到这个共享空间。

传统的方法是将不同视角的数据源简单相加，但这样既没有实际意义，又容易导致过拟合。联合训练提出，在每一个迭代过程中，一个视角的模型对验证集进行标注并将其加入另一视角的模型的下一迭代过程的训练集中。通过交替训练最终达到两个数据源的融合。

近年来，虽然随着NLP的发展，利用试题文本信息来进一步挖掘学生与试题间的关系的难度一步步降低，但是现在的自然语言处理方法还是不能很好的获取与评估试题的参数。同时教育数据是隐私数据，大规模且具有丰富信息的教育数据往往难以获取，对于小样本的数据，由于试题文本量小，难以通过认知诊断模型结合自然语言处理方法，使模型学会很好的获得试题的信息，容易导致过拟合。可见传统挖掘学生与试题间的关系的方案往往容易出现过拟合等问题，导致所得到的结果准确性低。

发明内容

针对以上问题，本发明提出一种基于多视角认知诊断的学生成绩预测方法。

为实现本发明的目的，提供一种基于多视角认知诊断的学生成绩预测方法，包括如下步骤：

S10，使用认知诊断模型对目标学生的给定考试成绩进行分析，得到目标学生参数与给定试题参数，根据目标学生参数与给定试题参数得到学生-试题反应函数；

S20，对于给定试题文本，使用第一词向量预训练模型提取第一试题文本信息，使用第二词向量预训练模型提取第二试题文本信息；所述给定试题文本为目标学生获得给定考试成绩的试题文本；

S40，将第一词向量预训练模型作为一个视角对所述第一试题文本信息进行训练，将第二词向量预训练模型作为另一视角对所述第二试题文本信息进行训练，在每一步迭代过程中，每一个视角验证集的试题文本数据进行标记，标记得到的预测参数加入另一视角下一迭代步骤的训练集中，反复迭代，直到第一词向量预训练模型和第二词向量预训练模型收敛，在收敛后的第一词向量预训练模型和第二词向量预训练模型中选取一个模型作为预测用模型；

S50，采用预测用模型提取待考试试题文本的多个试题文本信息，得到各个预测试题参数，将各个预测试题参数与给定试题参数进行对比，计算各个预测试题参数分别与给定试题参数余弦相似度，根据余弦相似度最高的K个预测试题参数确定目标试题参数；

S60，将所述目标试题参数代入所述学生-试题反应函数，得到所述目标学生参数相对于所述待考试试题文本的考试成绩。

在一个实施例中，根据目标学生参数与给定试题参数得到学生-试题反应函数包括：

选取认知诊断模型对目标学生参数与给定试题参数进行机器学习，得到学生-试题反应函数；所述学生-试题反应函数拗口：

P(Y_uv＝1|θ_u,ξ_v)≡f(θ_u,ξ_v)，

其中，Y_uv为学生u回答给定试题文本试题v的情况，θ_u为学生u的隐藏属性，ξ_v为试题的参数，P(Y_uv＝1|θ_u,ξ_v)学生u答对试题v的概率，f(θ_u,ξ_v)为认知诊断模型的学生-试题反应函数，符号≡表示概率P可以表示为函数f。。

在一个实施例中，所述第一词向量预训练模型为fasttext；所述第二词向量预训练模型为ernie。

具体地，对于给定试题文本，使用第一词向量预训练模型提取第一试题文本信息，使用第二词向量预训练模型提取第二试题文本信息包括：

将给定试题文本中的文本划分为词，将每个词对应得到fasttext的预训练词向量，以确定第一试题文本信息；使用ernie直接对给定试题文本提取文本信息，得到每个词的向量表示，以确定第二试题文本信息。

具体地，第一词向量预训练模型作为一个视角对所述第一试题文本信息进行训练，将第二词向量预训练模型作为另一视角对所述第二试题文本信息进行训练，在每一步迭代过程中，每一个视角验证集的试题文本数据进行标记，标记得到的预测参数加入另一视角下一迭代步骤的训练集中，反复迭代，直到第一词向量预训练模型和第二词向量预训练模型收敛，在收敛后的第一词向量预训练模型和第二词向量预训练模型中选取一个模型作为预测用模型包括：

S41，根据所述目标学生参数与给定试题参数确定训练集T和验证集Z；计算第一词向量预训练模型在验证集Z上的预测试题参数Z_A；

S42，计算第二词向量预训练模型在验证集Z上的预测试题参数Z_B；

S43，将Z_A加入训练集T，得到新训练集T_B＝T∪Z_A；将Z_B加入训练集T，得到新训练集T_A＝T∪Z_B，将T_A，T_B分别确定为第一词向量预训练模型和第二词向量预训练模型在下一迭代过程中的训练集；

S44，反复迭代，直到第一词向量预训练模型和第二词向量预训练模型收敛，得到利用第一词向量预训练模型提取的文本信息预测试题参数的模型

利用第二试题文本信息提取的文本信息预测试题参数的模型

在模型

和模型

中选取一个模型作为预测用模型。

具体地，采用预测用模型提取待考试试题文本的多个试题文本信息，得到各个预测试题参数，将各个预测试题参数与给定试题参数进行对比，计算各个预测试题参数分别与给定试题参数余弦相似度，根据余弦相似度最高的K个预测试题参数确定目标试题参数；包括：

S51，对于待考试试题文本，采用预测用模型预测每一道试题的参数

S52，计算已有的试题文本中每道题的参数

S53，计算

与

中每道试题的参数

的余弦相似度a_ij；

S54，选择余弦相似度a_ij最高的K个预测试题参数，将相似度作为权重对K个预测试题参数进行加权求和得到目标试题参数。

在一个实施例中，将所述目标试题参数代入所述学生-试题反应函数，得到所述目标学生参数相对于所述待考试试题文本的考试成绩包括：

以目标试题参数为依据使用学生-试题反应函数估计目标学生答对待考试试题文本中各个考题的概率，若概率大于等于设定阈值，则判定目标学生能答对该题，若概率小于设定阈值，则判定目标学生不能答对该题；根据目标学生针对各个考题能否答对的结果确定目标学生参数相对于待考试试题文本的考试成绩。

上述基于多视角认知诊断的学生成绩预测方法，通过使用认知诊断模型对目标学生的给定考试成绩进行分析，得到目标学生参数与给定试题参数，确定学生-试题反应函数，对于给定试题文本，使用第一词向量预训练模型提取第一试题文本信息，使用第二词向量预训练模型提取第二试题文本信息，将第一词向量预训练模型作为一个视角对所述第一试题文本信息进行训练，将第二词向量预训练模型作为另一视角对所述第二试题文本信息进行训练，在每一步迭代过程中，每一个视角验证集的试题文本数据进行标记，标记得到的预测参数加入另一视角下一迭代步骤的训练集中，反复迭代，直到第一词向量预训练模型和第二词向量预训练模型收敛，在收敛后的第一词向量预训练模型和第二词向量预训练模型中选取一个模型作为预测用模型，采用预测用模型提取待考试试题文本的多个试题文本信息，得到各个预测试题参数，将各个预测试题参数与给定试题参数进行对比，计算各个预测试题参数分别与给定试题参数余弦相似度，根据余弦相似度最高的K个预测试题参数确定目标试题参数，将目标试题参数代入所述学生-试题反应函数，得到目标学生参数相对于待考试试题文本的考试成绩，整个预测过程中准确性高，可以有效避免出现过拟合等问题，提升了预测得到的结果的准确性。

附图说明

图1是一个实施例的基于多视角认知诊断的学生成绩预测方法流程图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行进一步详细说明。应当理解，此处描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。

在本文中提及“实施例”意味着，结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例，也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是，本文所描述的实施例可以与其它实施例相结合。

参考图1所示，图1为一个实施例的基于多视角认知诊断的学生成绩预测方法流程图，包括如下步骤：

S10，使用认知诊断模型对目标学生的给定考试成绩进行分析，得到目标学生参数与给定试题参数，根据目标学生参数与给定试题参数得到学生-试题反应函数。

上述给定试题参数包括给定试题文本中各个试题的参数。

S20，对于给定试题文本，使用第一词向量预训练模型提取第一试题文本信息，使用第二词向量预训练模型提取第二试题文本信息；所述给定试题文本为目标学生获得给定考试成绩的试题文本，即目标学生针对给定试题文本考试，获得给定考试成绩。

上述第一词向量预训练模型和第二词向量预训练模型可以为不同的向量预训练模型，比如第一词向量预训练模型可以为fasttext(facebook提出的词向量预训练模型)，第二词向量预训练模型可以为ernie(百度提出的词向量预训练模型)。

S40，将第一词向量预训练模型作为一个视角对所述第一试题文本信息进行训练，将第二词向量预训练模型作为另一视角对所述第二试题文本信息进行训练，在每一步迭代过程中，每一个视角验证集的试题文本数据进行标记，标记得到的预测参数加入另一视角下一迭代步骤的训练集中，反复迭代，直到第一词向量预训练模型和第二词向量预训练模型收敛，在收敛后的第一词向量预训练模型和第二词向量预训练模型中选取一个模型作为预测用模型。

S50，采用预测用模型提取待考试试题文本的多个试题文本信息，得到各个预测试题参数，将各个预测试题参数分别与给定试题参数进行对比，计算各个预测试题参数分别与给定试题参数余弦相似度，根据余弦相似度最高的K个预测试题参数确定目标试题参数。

上述K为正整数，具体可以取预测试题参数的总数的80％等值。预测试题参数包括待考试试题文本中各个考题的试题参数。余弦相似度最高的K个预测试题参数包括待考试试题文本中与给定试题文本中试题最相似又能够充分表征待考试试题文本的各个考题的试题参数。

具体地，上述步骤可以对K个预测试题参数进行加权求和，以得到目标试题参数。

上述学生-试题反应函数为记载试题参数和目标学生考试成绩之间对应关系的参数。

P(Y_uv＝1|θ_u,ξ_v)≡f(θ_u,ξ_v)，

其中，Y_uv为学生u回答给定试题文本试题v的情况，θ_u为学生u的隐藏属性，ξ_v为试题的参数，P(Y_uv＝1|θ_u,ξ_v)学生u答对试题v的概率，f(θ_u,ξ_v)为认知诊断模型的学生-试题反应函数，符号≡表示概率P可以表示为函数f。

在一个示例中，还可以计算所有学生对给定试题文本中所有试题的极大似然函数，使用优化方法对极大似然函数迭代使其达到最大，上述极大似然函数为：

L＝∏_U∏_V(Y_uv)P(Y_uv＝1|θ_u,ξ_v)+(1-Y_uv)(1-P(Y_uv＝1|θ_u,ξ_v))＝∏_U∏_V(Y_uv)f(θ_u,ξ_v)+(1-(Y_uv))(1-f(θ_u,ξ_v))，

其中，Y_uv为学生u回答试题v的情况，θ_u为学生的隐藏属性，ξ_v为试题的参数，P(Y_uv＝1|θ_u,ξ_v)学生u答对试题v的概率，f(θ_u,ξ_v)为认知诊断模型的学生-试题反应函数。

进一步地，本实施例可以对试题文本，使用jieba分词工具将文本划分为词，每个词对应得到fasttext的预训练词向量；使用ernie直接提取相应文本信息，得到每个字的向量表示。

S41，根据所述目标学生参数与给定试题参数确定训练集T和验证集Z；计算第一词向量预训练模型在验证集Z上的预测试题参数Z_A；预测试题参数包括相应文本中各个试题的参数；

利用第二试题文本信息提取的文本信息预测试题参数的模型

在模型

和模型

中选取一个模型作为预测用模型。

在一个示例中，以第一词向量预训练模型为fasttext，第二词向量预训练模型为ernie为例。记利用fasttext提取的文本信息预测试题参数的模型为A，利用ernie提取的文本信息预测试题参数的模型为B。在每一步的迭代过程中可以包括：

4.1计算A在验证集Z上的预测试题参数Z_A。

4.2计算B在验证集Z上的预测试题参数Z_B。

4.3将Z_A加入训练集T，得到新训练集T_B＝T∪Z_A；将Z_B加入训练集T，得到新训练集T_A＝T∪Z_B。T_A，T_B分别为A，B在下一迭代过程中的训练集。

4.4反复迭代，最终得到利用fasttext提取的文本信息预测试题参数的模型

利用ernie提取的文本信息预测试题参数的模型

S52，计算已有的试题文本中每道题的参数

S53，计算

与

中每道试题的参数

的余弦相似度a_ij；

S54，选择余弦相似度a_ij最高的K个预测试题参数，将相似度作为权重对K个预测试题参数进行加权求和得到目标试题参数(最终试题的预测参数)。

上述加权求和的过程可以包括：

ξ_i表示最终试题的预测参数。

以目标试题参数为依据使用学生-试题反应函数f(θ_u,ξ_v)估计目标学生答对待考试试题文本中各个考题的概率P(Y_uv＝1|θ_u,ξ_v)，若概率大于等于设定阈值，则判定目标学生能答对该题，若概率小于设定阈值，则判定目标学生不能答对该题；根据目标学生针对各个考题能否答对的结果确定目标学生参数相对于待考试试题文本的考试成绩。

上述设定阈值可以设置为0.5等值。

在一个实施例中，上述步骤S40之前，还包括：

S30，构建预测试题参数的神经网络，用于拟合S10分析得到的试题参数(给定试题参数)。

具体地，步骤S30的具体过程包括：

定义F_v为步骤S30对试题v提取的信息(给定试题参数)。

接下来以ernie为例进行说明，fasttext类似。

3.1首先对所有F_v，F_v为n×D的矩阵，其中n为试题v的字或词向量数，D在fasettext中默认为300，在ernie中默认为768。F′_v＝F_v×W，W为

的矩阵。

3.2将3.1得到的F′_v经过LSTM(长短期记忆，Long Short Term Memory)获得前向向量

与反向向量

并将两个拼接，记拼接得到的向量为ε_v。

3.3将步骤1得到的学生隐藏属性θ求平均，得到

3.4拼接3.2中得到的ε_v经过两个全连接层获得的向量，与3.3中得到的

经过两个全连接层获得的向量，并将其记为X_v。

3.5将3.4得到的X_v经过最后一个全连接层得到试题v的预测参数

3.6将3.5得到的

与真实的试题参数ξ_v比较，得到损失函数：

3.7根据步骤1得到的θ_u与3.5得到的

利用步骤1使用的反应函数

预测学生的答题情况Y′_uv，从而得到全体学生的对所有试题的答题情况Y′。

3.8统计真实的答题情况Y，与预测的答题情况Y′，计算Y的正确率r，与Y′的正确率r′，在loss中引入正则项λ×|r-r′|×|Y′-thres|，则3.6中的loss变为：

从而目标函数为：

其中thres为预设的目标阈值。

本申请提供的基于多视角认知诊断的学生成绩预测方法具有如下技术效果：

本申请提供的学生成绩预测方法，由于对试题文本信息建模使得学生与试题间的相关信息被进一步挖掘。

对来自fasttext与ernie提取的不同文本信息采用多视角学习方法，融合多个来源的试题信息，能够充分的获取文本信息，使得在小样本的情况下，也能使模型较好的学习如何预测试题参数，从而对学生的成绩进行更精准的预测。

以上实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。

需要说明的是，本申请实施例所涉及的术语“第一\第二\第三”仅仅是区别类似的对象，不代表针对对象的特定排序，可以理解地，“第一\第二\第三”在允许的情况下可以互换特定的顺序或先后次序。应该理解“第一\第二\第三”区分的对象在适当情况下可以互换，以使这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。

本申请实施例的术语“包括”和“具有”以及它们任何变形，意图在于覆盖不排他的包含。例如包含了一系列步骤或模块的过程、方法、装置、产品或设备没有限定于已列出的步骤或模块，而是可选地还包括没有列出的步骤或模块，或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或模块。

以上所述实施例仅表达了本申请的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对发明专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本申请构思的前提下，还可以做出若干变形和改进，这些都属于本申请的保护范围。因此，本申请专利的保护范围应以所附权利要求为准。

Claims

1.一种基于多视角认知诊断的学生成绩预测方法，其特征在于，包括如下步骤：

2.根据权利要求1所述的基于多视角认知诊断的学生成绩预测方法，其特征在于，根据目标学生参数与给定试题参数得到学生-试题反应函数包括：

P(Y_uv＝1|θ_u，ξ_v)≡f(θ_u，ξ_v)，

其中，Y_uv为学生u回答给定试题文本试题v的情况，θ_u为学生u的隐藏属性，ξ_v为试题的参数，P(Y_uv＝1|θ_u，ξ_v)学生u答对试题v的概率，f(θ_u，ξ_v)为认知诊断模型的学生-试题反应函数，符号≡表示概率P表示为函数f。

3.根据权利要求1所述的基于多视角认知诊断的学生成绩预测方法，其特征在于，所述第一词向量预训练模型为fasttext；所述第二词向量预训练模型为ernie。

4.根据权利要求3所述的基于多视角认知诊断的学生成绩预测方法，其特征在于，对于给定试题文本，使用第一词向量预训练模型提取第一试题文本信息，使用第二词向量预训练模型提取第二试题文本信息包括：

5.根据权利要求3所述的基于多视角认知诊断的学生成绩预测方法，其特征在于，第一词向量预训练模型作为一个视角对所述第一试题文本信息进行训练，将第二词向量预训练模型作为另一视角对所述第二试题文本信息进行训练，在每一步迭代过程中，每一个视角验证集的试题文本数据进行标记，标记得到的预测参数加入另一视角下一迭代步骤的训练集中，反复迭代，直到第一词向量预训练模型和第二词向量预训练模型收敛，在收敛后的第一词向量预训练模型和第二词向量预训练模型中选取一个模型作为预测用模型包括：

利用第二试题文本信息提取的文本信息预测试题参数的模型

在模型

和模型

中选取一个模型作为预测用模型。

6.根据权利要求5所述的基于多视角认知诊断的学生成绩预测方法，其特征在于，采用预测用模型提取待考试试题文本的多个试题文本信息，得到各个预测试题参数，将各个预测试题参数与给定试题参数进行对比，计算各个预测试题参数分别与给定试题参数余弦相似度，根据余弦相似度最高的K个预测试题参数确定目标试题参数；包括：

S52，计算已有的试题文本中每道题的参数

S53，计算

与

中每道试题的参数

的余弦相似度a_ij；

7.根据权利要求5所述的基于多视角认知诊断的学生成绩预测方法，其特征在于，将所述目标试题参数代入所述学生-试题反应函数，得到所述目标学生参数相对于所述待考试试题文本的考试成绩包括：