CN113919567A

CN113919567A - 一种结合知识追踪和序列标注模型的试卷成绩预测方法

Info

Publication number: CN113919567A
Application number: CN202111186987.7A
Authority: CN
Inventors: 段庆龙; 邱文勤; 陈家海; 叶家鸣; 吴波
Original assignee: Anhui Qitian Network Technology Co ltd
Current assignee: Anhui Qitian Network Technology Co ltd
Priority date: 2021-10-12
Filing date: 2021-10-12
Publication date: 2022-01-11

Abstract

本发明公开了一种结合知识追踪和序列标注模型的成绩预测方法。涉及学生成绩预测领域。对某一个学科的考试试卷，使用学习者历史考试信息训练知识追踪模型，将知识追踪的结果作为序列标注模型的部分特征输入，预测当前试卷成绩。本发明主要包含以下步骤：数据预处理，知识追踪模型训练，序列标注模型与成绩预测。利用本发明可以构建一种适合考试场景下的成绩预测方法。

Description

一种结合知识追踪和序列标注模型的试卷成绩预测方法

技术领域

本发明属于试卷成绩预测领域。具体涉及一种结合知识追踪和序列标注模型的试卷成绩预测方法。

背景技术

试卷成绩预测作为数据挖掘技术在教育领域的一个重要应用领域，是自动教师评价，学习者建模，试卷组织，试题推荐的基础性工作。随着智慧校园的普及，越来越多的考试信息可以被获取，从而对学生作进一步分析挖掘。一方面教师获取试卷的途径越来越多，在试题的选择上耗费较多的时间和精力，影响教师教学，教研环节的改善；另一方面，教师的主观性较强，在选择试卷的过程中，不能通过以往学习者过往的考试成绩，考试行为方式(如考试中的时间分配，不同难易题目的做题顺序等)进行考试成绩分布的估计。因此如何自动化的根据以往学习者考试信息，预测学习者当前考试成绩成为教育领域学术界和工业界关注的焦点。

目前在试卷成绩预测领域，以往针对每张试卷的预测主要使用学习者的历史考试成绩，通过机器学习或者神经网络模型进行预测，不考虑试卷中各个题目顺序之间的相互影响。而不同的题目顺序，往往对考试中的结果产生不同的结果影响，同时不同的题目组合产生的试卷也对学习者的成绩有一定影响，这造成了成绩预测准确性较低。如何更好的估计每个学习者在试卷上的得分，对学生翻译题目进行评分是当前亟需解决的问题。

针对以上现状，本方法提出一种新颖的结合知识追踪和序列标注模型的试卷成绩预测方法。本方法主要针对中学试卷得分进行预测，使用学习者的考试成绩作为训练数据，对数据进行预处理。使用基于Transformer的知识状态追踪模型对学习者的知识状态进行建模，获取通过历史考试信息预测的当前学习者的知识掌握状态。将预测出来的知识状态结合当前考试所考察的知识点序列作为输入，通过训练lstm-crf模型对考试中题目之间的相互影响进行建模，从而预测当前的试卷成绩。

发明内容

本发明的目的在于：针对中学试卷成绩预测提供一种新思路和解决方法。本发明采用的技术方案如下：

一种结合知识追踪和序列标注模型的试卷成绩预测方法，其特征在于，该方法基于知识状态追踪模型和序列标注模型，首先利用学习者日常答题数据训练知识状态追踪模型，然后将知识追踪模型估计的学习者知识掌握状态作为部分特征融合进序列标注模型中进行训练，最终通过训练的序列标注模型对试卷成绩进行预测。该方法主要包含数据预处理，知识追踪模型训练，序列标注模型与成绩预测。

其中，数据预处理过程具体描述为：将题目人工进行知识点的标注。清洗掉考试信息较少的学习者，然后对题目的得分归一化表示，题目得分为满分的表示为1，否则为0。

其中，所述知识追踪模型训练过程具体描述为：使用Transformer的网络结构，Transformer是一种基于自注意力机制和前馈神经网络的模型，其模型可以同时做分类和生成任务，Transformer的网络结构可以并行训练，加快模型训练速度，本方法将带有知识点标记的学习者历史答题数据作为输入，利用transformer结构建立知识追踪模型，在模型的最后一层输出学习者当前的知识掌握状态向量。

其中，所述特征抽取及评分具体描述为：使用基于lstm-crf的神经网络结构，lstm-crf是一种序列标注神经网络模型，模型融合标签与标签之间的转移概率，可以对试卷中题目之间的相互影响进行建模，对学习者答题的对错标注进行训练。

其中，所述的一种结合知识追踪和序列标注模型的试卷成绩预测方法，其特征在于，包括以下具体步骤：

步骤一、数据预处理：本方法为一种结合知识追踪和序列标注模型的试卷成绩预测方法，本方法的目标是设计一种结合知识追踪和序列标注模型的试卷成绩预测方法。由于本方法成绩预测主要针对中学考试试卷的成绩预测，所选取的模型训练数据均来自于中学考试中的题目得分情况。首先需要根据学习者在考试中所作的题目数量对学习者进行清洗，去掉做题数据较少的学生。然后将剩下学生的实际得分进行归一化，题目得分为满分的表示为1，否则为0。

步骤二、知识追踪模型训练：将筛选归一化后的学习者考试成绩进行向量化。向量化主要基于试题所标注的知识点进行，当题目中所标注的知识点个数为N时，设置题目输入的维度M。为了将输入的知识点及对错信息进行统一，在知识追踪模型中，会随机生成一个(2*N，M)的矩阵对所有的知识点的对错进行表示，其中矩阵的上半部分为当前题目对应知识点答对情况下的表示形式，矩阵的下半部分为当前题目对应知识点答错情况下的表示形式。Transformer是一种基于自注意力机制和前馈神经网络模型，其模型可以同时做分类和生成任务，Transformer的网络结构可以并行训练，加快翻译模型训练速度。本方法使用基于Transformer的知识追踪模型进行训练，知识追踪模型的参数设置如下：

1)学习率：初始学习率设置为0.01，每训练10轮减小10％。

2)优化器：使用adam或sgd优化器(实施过程根据模型训练情况决定)。

3)其它：batchsize大小设置为4096，与显存容量有关，总共训练轮数为20。

4)Transformer的层数设置为12层，与显存容量有关。

步骤三、序列标注模型与成绩预测：通过知识追踪模型可以预测出学习者各个知识点的掌握状态S。在训练的过程中，输入的向量是当前考试中的知识点向量的one-hot的编码基础上拼接上知识点当前的掌握状态S，通过lstm-crf模型对考试中题目之间的相互影响进行建模。其中基于lstm-crf的序列标注模型的参数设置如下：

其中基于lstm-crf的序列标注模型的参数设置如下：

5)学习率：初始学习率设置为0.01，每训练10轮减小10％。

6)优化器：使用adam或sgd优化器(实施过程根据模型训练情况决定)。

7)其它：batchsize大小设置为1024，与显存容量有关，总共训练轮数为50。

8)lstm的层数设置为2层，与显存容量有关。

附图说明

图1为本发明的整体实施流程图；

图2为本发明整体实施流程中的数据预处理结构图；

图3为本发明整体实施流程中的知识追踪模型结构图；

图4为本发明整体实施流程中的序列标注与试卷成绩预测的结构图；

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅用以解释本发明，并不用于限定本发明。

请参阅图1，一种结合知识追踪和序列标注模型的试卷成绩预测方法，主要包含数据预处理，知识追踪模型训练，序列标注模型与成绩预测。

数据预处理部分：如图2所示，准备标注知识点的题目和学习者在题目上的历史考试信息，作为训练知识追踪模型和序列标注模型的原始数据。首先对学习者历史考试信息进行数据清洗，清洗的规则为:当该学习者历史考试信息总的考试做题数目小于40道，将该学习者的历史信息进行移除。然后对学习者的历史数据进行归一化处理，归一化的方法为：当学习者的题目得分大于题目总分的80％的时候，该题目标注的结果为1，否则为0。

知识追踪模型训练部分：如图3所示，首先对处理好的训练数据进行向量化，将归一化后的学习者历史答题数据转化为低维向量的矩阵形式。向量化主要基于试题所标注的知识点进行，当题目中所标注的知识点个数为N时，设置题目输入的维度M。为了将输入的知识点及对错信息进行统一，在知识追踪模型中，会随机生成一个(2*N，M)的矩阵对所有的知识点的对错进行表示，其中矩阵的上半部分为当前题目对应知识点答对情况下的表示形式，矩阵的下半部分为当前题目对应知识点答错情况下的表示形式。输入学习者归一化的历史学习序列，根据每个题目的对错信息查找在矩阵中的向量表示，将归一化的历史信息转化为低维向量的矩阵形式。然后将低维向量矩阵形式输入transformer进行知识追踪模型的训练，基于transformer的知识追踪模型参数设置如下：

学习率：初始学习率设置为0.01，每训练10轮减小10％。

优化器：使用adam或sgd优化器(实施过程根据模型训练情况决定)。

其它：batchsize大小设置为4096，与显存容量有关，总共训练轮数为20。

Transformer的层数设置为12层，与显存容量有关。

序列标注模型与成绩预测部分：如图4所示，序列标注模型的输入向量主要由两部分向量拼接而成，其中第一部分为上一步知识追踪模型预测出来的当前学习者的知识掌握状态信息，总长度为知识点的个数N，对应的每一维度是该知识点的掌握概率，另一部分为当前考试中的知识点向量的one-hot的编码形式，总长度为知识点的个数N，当前考察的知识点对应的维度对应为1，其他为0.如果当前学习者当前考试中有Q道题目，那么序列标注模型输入的矩阵维度为(Q，2N)。将矩阵中的向量按照时序的方式输入到lstm-crf矩阵中对学习者试卷当中的Q个题目进行对错的预测的训练。其中基于lstm-crf的序列标注模型的参数设置如下：

学习率：初始学习率设置为0.01，每训练10轮减小10％。

其它：batchsize大小设置为1024，与显存容量有关，总共训练轮数为50。

lstm的层数设置为2层，与显存容量有关。

本发明针对试卷考试成绩进行预测，通过结合知识追踪和序列标注模型，实现一种可以融入试卷中题目之间的相互影响的考试成绩预测模型，能够方便教师在教学中对班级考试成绩进行估计，并为后续大规模的考试成绩预测提供了新的思路和基础工作。

以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等，均应包含在本发明的保护范围之内。

Claims

1.一种结合知识追踪和序列标注模型的试卷成绩预测方法，其特征在于，该方法基于知识状态追踪模型和序列标注模型，首先利用学习者历史考试信息训练知识状态追踪模型，然后将知识追踪模型估计的学习者知识掌握状态作为部分特征融合进序列标注模型中进行训练，最终通过训练的序列标注模型对试卷成绩进行预测，该方法主要包含数据预处理，知识追踪模型训练，序列标注模型与成绩预测。

2.如权利要求1所述的一种结合知识追踪和序列标注模型的试卷成绩预测方法，其特征在于，所述数据预处理具体描述为：将题目人工进行知识点的标注，清洗掉考试信息较少的学习者，然后对题目的得分归一化表示，题目得分为满分的表示为1，否则为0。

3.如权利要求1所述的一种结合知识追踪和序列标注模型的试卷成绩预测方法，其特征在于，所述知识追踪模型训练具体描述为：使用Transformer的网络结构，Transformer是一种基于自注意力机制和前馈神经网络的模型，其模型可以同时做分类和生成任务，Transformer的网络结构可以并行训练，加快模型训练速度，本方法将带有知识点标记的学习者历史答题数据作为输入，利用transformer结构建立知识追踪模型，在模型的最后一层输出学习者当前的知识掌握状态向量。

4.如权利要求1所述的一种结合知识追踪和序列标注模型的试卷成绩预测方法，其特征在于，所述序列标注模型与成绩预测具体描述为：使用基于lstm-crf的神经网络结构，lstm-crf是一种序列标注神经网络模型，模型融合标签与标签之间的转移概率，可以对试卷中题目之间的相互影响进行建模，对学习者答题的对错标注进行训练。

5.如权利要求1所述的一种结合知识追踪和序列标注模型的试卷成绩预测方法，其特征在于，包括以下具体步骤：

步骤一、数据预处理：本方法为一种结合知识追踪和序列标注模型的试卷成绩预测方法，本方法的目标是设计一种结合知识追踪和序列标注模型的试卷成绩预测方法，由于本方法成绩预测主要针对中学考试试卷的成绩预测，所选取的模型训练数据均来自于中学考试中的题目得分情况，首先需要根据学习者在考试中所作的题目数量对学习者进行清洗，去掉做题数据较少的学习者，然后将清洗后的实际得分进行归一化，题目得分为满分的表示为1，否则为0；步骤二、知识追踪模型训练：将筛选归一化后的学习者考试成绩进行向量化。向量化主要基于试题所标注的知识点进行，当题目中所标注的知识点个数为N时，设置题目输入的维度M，为了将输入的知识点及对错信息进行统一，在知识追踪模型中，会随机生成一个(2*N，M)的矩阵对所有的知识点的对错进行表示，其中矩阵的上半部分为当前题目对应知识点答对情况下的表示形式，矩阵的下半部分为当前题目对应知识点答错情况下的表示形式，Transformer是一种基于自注意力机制和前馈神经网络模型，其模型可以同时做分类和生成任务，Transformer的网络结构可以并行训练，加快翻译模型训练速度；本方法使用基于Transformer的知识追踪模型进行训练，知识追踪模型的参数设置如下：

学习率：初始学习率设置为0.01，每训练10轮减小10％；

优化器：使用adam或sgd优化器(实施过程根据模型训练情况决定)；

其它：batchsize大小设置为4096，与显存容量有关，总共训练轮数为20；

Transformer的层数设置为12层，与显存容量有关。

步骤三、序列标注模型与成绩预测：通过知识追踪模型可以预测出学习者各个知识点的掌握状态S，在训练的过程中，输入的向量是当前考试中的知识点向量的one-hot的编码基础上拼接上知识点当前的掌握状态S，通过lstm-crf模型对考试中题目之间的相互影响进行建模。其中基于lstm-crf的序列标注模型的参数设置如下：

1)学习率：初始学习率设置为0.01，每训练10轮减小10％；

2)优化器：使用adam或sgd优化器(实施过程根据模型训练情况决定)；

3)其它：batchsize大小设置为1024，与显存容量有关，总共训练轮数为50；

4)lstm的层数设置为2层，与显存容量有关。