CN113239699A

CN113239699A - 一种融合多特征的深度知识追踪方法及系统

Info

Publication number: CN113239699A
Application number: CN202110407038.0A
Authority: CN
Inventors: 孙波; 肖融; 黄宁; 李欢; 肖永康
Original assignee: Beijing Normal University
Current assignee: Beijing Normal University
Priority date: 2021-04-15
Filing date: 2021-04-15
Publication date: 2021-08-10
Anticipated expiration: 2041-04-15
Also published as: CN113239699B

Abstract

本发明提供一种融合多特征的深度知识追踪方法及系统。其中，该方法包括：确定待分析文本对应的知识点语义表征向量；其中，所述知识点语义表征向量包含知识点编号特征、题目文本特征以及知识点难度特征；将所述知识点语义表征向量输入至深度知识追踪模型中进行处理，得到所述深度知识追踪模型输出的相应的知识状态预测结果；其中，所述深度知识追踪模型是以样本文本、所述样本文本对应的样本知识状态预测结果以及真实标签进行训练得到的。采用本发明公开的融合多特征的深度知识追踪方法，引入多种特征，提高知识追踪模型的预测精度和效率，能够准确预测目标对象在下一次答题时的表现。

Description

一种融合多特征的深度知识追踪方法及系统

技术领域

本发明涉及计算机应用技术领域，具体涉及一种融合多特征的深度知识追踪方法及系统。另外，还涉及一种电子设备及非暂态计算机可读存储介质。

背景技术

随着信息技术的迅速发展，改变了人们传统学习方式，促进了在线教育的蓬勃兴起。丰富多样的线上教育资源和方便智能的在线教育平台使得在线教育用户规模不断扩大，人们在线上教育投入的时间逐渐增多。在线教育平台收集了海量的用户学习数据，教育行业逐渐进入大数据时代。然而，如何利用海量的用户学习数据结合人工智能技术来促进教育行业发展，是研究者长期探索的问题。其中，知识追踪是目前研究的热点之一。知识追踪是利用目标对象(比如学生)答题序列对目标对象知识状态的变化进行建模，评估目标对象对知识点的掌握程度以及预测目标对象对知识点的作答表现。

为了解决上述问题，现有技术中通常基于项目反应理论(Item Response Theory，IRT)、贝叶斯知识追踪(Bayesian Knowledge Tracing，BKT)模型、深度知识追踪(DeepKnowledge Tracing，DKT) 模型和动态键值对记忆网络(Dynamic Key-Value MemoryNetworks， DKVMN)模型实现。IRT模型假设在每一次答题测试中只评估目标对象(比如学生)的某一种能力，且学生在每一道题目上的作答反应是相互独立，互不影响的，作答反应只与学生自身的能力水平有关，与其他元素无关。BKT基于隐马尔可夫模型(HiddenMarkov Model， HMM)，学生在t+1时刻的知识状态仅依赖于t时刻，这不符合现实学习过程中知识状态的变化；而且，BKT根据知识点构建，不同的学生共用同一个模型，不能捕获不同知识点之间的联系。DKT利用长短时记忆(Long Short-Term Memory，LSTM)对学生历史知识状态进行记忆，其隐藏层状态表示学生综合的知识状态。DKT中不同知识点的知识状态之间相互影响，学生在知识点上的作答反应受到综合知识状态的影响。但是，在DKT中，如果知识点之间相互独立，仅用一个隐藏层状态表示知识状态不能区分学生对不同类知识点的知识状态。为了解决这个问题，DKVMN提出了使用Key-value Memory去存储和更新各个知识点的知识状态。上述知识追踪模型仅使用了学生的答题记录，即简单的使用知识点编号表示题目信息。但在现实场景中，题目文本蕴含着题目类型、题目难度、知识点等丰富信息，非常有必要将题目文本引入知识追踪模型。另外，知识点难度、学生能力和答题用时等均影响学生知识状态的预测。因此如何提供一种融合多特征的深度知识追踪方案成为本领域研究的重要课题。

发明内容

为此，本发明提供一种融合多特征的深度知识追踪方法及系统，以解决现有技术中存在的知识追踪方案准确度较低的问题。

本发明提供一种融合多特征的深度知识追踪方法，包括：

确定待分析文本对应的知识点语义表征向量；

其中，所述知识点语义表征向量包含知识点编号特征、题目文本特征以及知识点难度特征；

将所述知识点语义表征向量输入至深度知识追踪模型中进行处理，得到所述深度知识追踪模型输出的相应的知识状态预测结果；

其中，所述深度知识追踪模型是以样本文本、所述样本文本对应的样本知识状态预测结果以及真实标签进行训练得到的。

进一步的，所述确定待分析文本对应的知识点语义表征向量，具体包括：

确定所述待分析文本对应的知识点编号特征；

确定所述待分析文本对应的题目文本特征；

确定所述待分析文本对应的知识点难度特征；

基于预设转换器模型中的多头自注意力机制对所述知识点编号特征、所述题目文本特征以及所述知识点难度特征进行融合处理，得到相应的知识点语义表征向量。

进一步的，确定所述待分析文本对应的知识点编号特征，包括：基于所述待分析文本中的知识点编号对应的独热向量和嵌入知识点矩阵，得到相应的知识点编号特征；

确定所述待分析文本对应的题目文本特征，包括：对所述待分析文本中的题目文本进行分词处理，并对特殊符号、停用词进行清洗，得到分词特征；其中，所述题目文本为包含若干个词的句子；将所述题目文本中的每一个词转化为相应的词向量，得到所述题目文本对应的句子矩阵；并根据每一个词构建相应的位置向量，得到相应的位置矩阵；将所述句子矩阵和所述位置矩阵输入到预设的网络模型结构中，得到所述题目文本对应的题目文本特征；其中，所述题目文本特征用于对题目文本进行表征；

确定所述待分析文本对应的知识点难度特征，包括：确定知识点数据对应题目文本回答的正确率集合；根据所述正确率集合得到所述知识点数据正确率的下四分位点、中位数以及上四分位点，并将所述知识点数据正确率的下四分位点、中位数以及上四分位点输入到预设的限值公式中，得到相应的上限值和下限值；若所述正确率集合存在大于所述上限值或者小于所述下限值的正确率值，则判定所述正确率值为异常值，将所述正确率集合对应的均值替换所述异常值，得到目标正确率集合；根据所述目标正确率集合，对所述知识点数据按照不同的知识点难度区间进行划分，根据不同知识点难度数据对应的独热向量和嵌入难度类别数矩阵，得到相应的知识点难度特征。

进一步的，所述的融合多特征的深度知识追踪方法，还包括：

确定所有回答正确的题目对应的第一知识点难度数据；

确定所有回答过的题目对应的第二知识点难度数据；

根据所述第一知识点难度数据、所述第二知识点难度数据以及目标对象能力类别数，得到目标对象能力特征，并通过相应的嵌入矩阵，得到目标对象能力值特征向量。

对数据集合中所有的答题用时按升序进行排序，并将连续的答题用时进行离散化处理后，对目标对象的答题用时进行归一化处理，得到答题用时的下四分位点、中位数以及上四分位点；将所述答题用时的下四分位点、中位数以及上四分位点输入到预设的限值公式中，得到答题用时的上限值和下限值；

若所述数据集合的答题用时中存在大于所述上限值或者小于所述下限值的正确率值，则判定所述答题用时为异常值，将所述数据集合的答题用时对应的均值替换所述异常值，得到目标答题用时集合；

根据所述目标答题用时集合，对所述数据集合按照不同的答题用时区间进行划分，根据所述数据集合中不同答题用时对应的独热向量和嵌入答题用时等级数矩阵，得到相应的答题用时特征。

进一步的，所述知识状态预测结果，具体包括：目标对象对知识点的掌握程度的评估结果以及目标对象对知识点在下一时刻的作答表现的预测结果。

进一步的，所述深度知识追踪模型是以样本文本、所述样本文本对应的样本知识状态预测结果以及真实标签进行训练得到的，具体包括：所述深度知识追踪模型是以样本文本、所述样本文本对应的样本知识状态预测结果以及真实标签进行训练，以使所述真实标签与样本知识状态预测结果之间的交叉熵损失达到最小化为训练目标得到的；所述深度知识追踪模型用于基于对所述样本文本进行特征提取得到的知识点语义表征向量，对所述待分析文本进行语义理解。

相应的，本发明还提供一种融合多特征的深度知识追踪系统，包括：

知识点语义表征向量确定单元，用于确定待分析文本对应的知识点语义表征向量；其中，所述知识点语义表征向量包含知识点编号特征、题目文本特征以及知识点难度特征；

知识状态预测单元，用于将所述知识点语义表征向量输入至深度知识追踪模型中进行处理，得到所述深度知识追踪模型输出的相应的知识状态预测结果；其中，所述深度知识追踪模型是以样本文本、所述样本文本对应的样本知识状态预测结果以及真实标签进行训练得到的。

进一步的，所述知识点语义表征向量确定单元，具体包括：

知识点编号特征确定单元，用于确定所述待分析文本对应的知识点编号特征；

题目文本特征确定单元，用于确定所述待分析文本对应的题目文本特征；

知识点难度特征单元，用于确定所述待分析文本对应的知识点难度特征；

融合处理单元，用于基于预设转换器模型中的多头自注意力机制对所述知识点编号特征、所述题目文本特征以及所述知识点难度特征进行融合处理，得到相应的知识点语义表征向量。

进一步的，所述知识点编号特征确定单元，具体用于：基于所述待分析文本中的知识点编号对应的独热向量和嵌入知识点矩阵，得到相应的知识点编号特征；

所述题目文本特征确定单元，具体用于：对所述待分析文本中的题目文本进行分词处理，并对特殊符号、停用词进行清洗，得到分词特征；其中，所述题目文本为包含若干个词的句子；将所述题目文本中的每一个词转化为相应的词向量，得到所述题目文本对应的句子矩阵；并根据每一个词构建相应的位置向量，得到相应的位置矩阵；将所述句子矩阵和所述位置矩阵输入到预设的网络模型结构中，得到所述题目文本对应的题目文本特征；其中，所述题目文本特征用于对题目文本进行表征；

所述知识点难度特征单元，具体用于：确定知识点数据对应题目文本回答的正确率集合；根据所述正确率集合得到所述知识点数据正确率的下四分位点、中位数以及上四分位点，并将所述知识点数据正确率的下四分位点、中位数以及上四分位点输入到预设的限值公式中，得到相应的上限值和下限值；若所述正确率集合存在大于所述上限值或者小于所述下限值的正确率值，则判定所述正确率值为异常值，将所述正确率集合对应的均值替换所述异常值，得到目标正确率集合；根据所述目标正确率集合，对所述知识点数据按照不同的知识点难度区间进行划分，根据不同知识点难度数据对应的独热向量和嵌入难度类别数矩阵，得到相应的知识点难度特征。

进一步的，所述的融合多特征的深度知识追踪系统，还包括：

能力值特征向量获得单元，用于确定所有回答正确的题目对应的第一知识点难度数据；确定所有回答过的题目对应的第二知识点难度数据；根据所述第一知识点难度数据、所述第二知识点难度数据以及目标对象能力类别数，得到目标对象能力特征，并通过相应的嵌入矩阵，得到目标对象能力值特征向量。

答题用时特征获得单元，用于对数据集合中所有的答题用时按升序进行排序，并将连续的答题用时进行离散化处理后，对目标对象的答题用时进行归一化处理，得到答题用时的下四分位点、中位数以及上四分位点；将所述答题用时的下四分位点、中位数以及上四分位点输入到预设的限值公式中，得到答题用时的上限值和下限值；若所述数据集合的答题用时中存在大于所述上限值或者小于所述下限值的正确率值，则判定所述答题用时为异常值，将所述数据集合的答题用时对应的均值替换所述异常值，得到目标答题用时集合；根据所述目标答题用时集合，对所述数据集合按照不同的答题用时区间进行划分，根据所述数据集合中不同答题用时对应的独热向量和嵌入答题用时等级数矩阵，得到相应的答题用时特征。

进一步的，所述深度知识追踪模型是以样本文本、所述样本文本对应的样本知识状态预测结果以及真实标签进行训练，以使所述真实标签与样本知识状态预测结果之间的交叉熵损失达到最小化为训练目标得到的；所述深度知识追踪模型用于基于对所述样本文本进行特征提取得到的知识点语义表征向量，对所述待分析文本进行语义理解。

相应的，本发明还提供一种电子设备，包括：存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现如上述任意一项所述的融合多特征的深度知识追踪方法的步骤。

相应的，本发明还提供一种非暂态计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现如上述任意一项所述的融合多特征的深度知识追踪方法的步骤。

采用本发明所述的融合多特征的深度知识追踪方法，能够将目标对象的答题情况与对应的题目文本特征进行统一建模，同时将知识点难度特征、学生能力值特征和答题用时特征引入知识追踪模型中，并采用多头自注意力机制对上述特征组合，提高了知识追踪模型的预测精度和效率，能够准确预测目标对象在下一次答题时的表现。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获取其他的附图。

图1为本发明实施例提供的一种融合多特征的深度知识追踪方法的流程示意图；

图2为本发明实施例提供的一种融合多特征的深度知识追踪系统的结构示意图；

图3为本发明实施例提供的一种融合多特征的深度知识追踪系统的结构图；

图4为本发明实施例提供的一种电子设备的实体结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获取的所有其他实施例，都属于本发明保护的范围。

下面基于本发明所述的融合多特征的深度知识追踪方法，对其实施例进行详细描述。如图1所示，其为本发明实施例提供的融合多特征的深度知识追踪方法的流程示意图，具体实现过程包括以下步骤：

步骤101：确定待分析文本对应的知识点语义表征向量；其中，所述知识点语义表征向量包含知识点编号特征、题目文本特征以及知识点难度特征。

在本步骤中，确定待分析文本对应的知识点语义表征向量，具体实现过程包括：确定所述待分析文本对应的知识点编号特征，确定所述待分析文本对应的题目文本特征，确定所述待分析文本对应的知识点难度特征，并基于预设转换器模型(即Transformer模型)中的多头自注意力机制对所述知识点编号特征、所述题目文本特征以及所述知识点难度特征进行融合处理，得到相应的知识点语义表征向量。

需要说明的是，由于目标对象在答题过程中的每一道题都对应着一个知识点编号，若用独热(one-hot)向量来直接构造知识点编号特征会使特征非常稀疏。因此在本发明实施例中，确定所述待分析文本对应的知识点编号特征时，可基于所述待分析文本中的知识点编号对应的独热向量和嵌入知识点矩阵得到相应的知识点编号特征。具体的也就是将知识点编号对应的独热向量乘以相应的嵌入矩阵，得到知识点编号特征。

实践中，题目文本特征可以有效地对题目文本信息进行表征，比只用知识点编号来表示题目文本包含了更多语义信息。在本发明实施例中，使用的具有题目文本的数据集是中文的。对于中文题目文本，其题目文本特征可使用Transformer模型方法来提取。具体的，首先对所述待分析文本中的题目文本进行分词处理，并对特殊符号、停用词等进行清洗，得到分词特征。经过上述处理，所述题目文本可以描述为包含若干个词的句子。将所述题目文本中的每一个词转化为相应的词向量，得到所述题目文本对应的句子矩阵；并根据每一个词构建相应的位置向量，得到相应的位置矩阵。将所述句子矩阵和所述位置矩阵输入到预设的网络模型结构中，得到所述题目文本对应的题目文本特征。比如将句子矩阵和位置矩阵相加之后分别线性投影到三个不同的空间当作Key，Value，Query输入模型中，经过包含Multi-head Attention和Feed Forward Networks的Transformer Block结构，得到相应的题目文本特征。其中，所述题目文本特征用于对题目文本进行表征。

在具体实施过程中，知识点难度通常用各知识点相关题目回答的正确率表示，数值范围在[0，1]。考虑各个知识点上回答的正确率分布不均匀，在本发明实施例中可使用箱线图对数据进行处理。确定所述待分析文本对应的知识点难度特征，具体实现过程包括：计算知识点数据对应题目文本回答的正确率集合，根据所述正确率集合得到所述知识点数据正确率的下四分位点、中位数以及上四分位点，并将所述知识点数据正确率的下四分位点、中位数以及上四分位点输入到预设的限值公式，即下述公式(1)和(2)，得到相应的上限值和下限值；若所述正确率集合存在大于所述上限值或者小于所述下限值的正确率值，则判定所述正确率值为异常值，将所述正确率集合对应的均值替换所述异常值，得到目标正确率集合；根据所述目标正确率集合，对所述知识点数据按照不同的知识点难度区间进行划分，根据不同知识点难度数据对应的独热向量和嵌入难度类别数矩阵，得到相应的知识点难度特征。

另外，由于目标对象在各知识点上的表现还与目标对象能力值等有关。对于难度较大的题目，能力值较高的目标对象回答的正确率更高。因此，在本发明实施例中，还引入了目标对象能力值特征，其构造方法包括：确定所有回答正确的题目对应的第一知识点难度数据，确定所有回答过的题目对应的第二知识点难度数据，并根据所述第一知识点难度数据、所述第二知识点难度数据以及目标对象能力类别数，得到目标对象能力特征，并通过相应的嵌入矩阵，得到目标对象能力值特征向量。具体的，可将所有回答正确的题目对应的知识点难度求和，除以所有回答过的题目对应的知识点难度之和，再乘以目标对象能力类别数，然后向下取整得到目标对象能力值特征，再通过嵌入矩阵，得到目标对象能力值特征向量。

除此之外，现有多数研究的答题记录表征向量仅考虑了目标对象的作答情况。然而，答题用时也能在一定程度上反映作答该题时知识状态的掌握程度。因此，在本发明具体实施过程中，还引入了答题用时特征。其构造方法包括：对数据集合中所有的答题用时按升序进行排序，并将连续的答题用时进行离散化处理后，对目标对象的答题用时进行归一化处理，得到答题用时的下四分位点、中位数以及上四分位点；将所述答题用时的下四分位点、中位数以及上四分位点输入到预设的限值公式中，得到答题用时的上限值和下限值。该数据集合为所述待分析文本对应的答题用时数据的集合。若所述数据集合的答题用时中存在大于所述上限值或者小于所述下限值的正确率值，则判定所述答题用时为异常值，将所述数据集合的答题用时对应的均值替换所述异常值，得到目标答题用时集合。根据所述目标答题用时集合，对所述数据集合按照不同的答题用时区间进行划分，根据所述数据集合中不同答题用时对应的独热向量和嵌入答题用时等级数矩阵，得到相应的答题用时特征。

步骤102：将所述知识点语义表征向量输入至深度知识追踪模型中进行处理，得到所述深度知识追踪模型输出的相应的知识状态预测结果。其中，所述知识状态预测结果可包括目标对象对知识点的掌握程度的评估结果以及目标对象对知识点在下一时刻的作答表现的预测结果。所述深度知识追踪模型是以样本文本、所述样本文本对应的样本知识状态预测结果以及真实标签进行训练，以使所述真实标签与样本知识状态预测结果之间的交叉熵损失达到最小化为训练目标得到的；所述深度知识追踪模型用于基于对所述样本文本进行特征提取得到的知识点语义表征向量，对所述待分析文本进行语义理解。

举例而言，在一个完整实施例中，本发明所述融合多特征的深度知识追踪方法至少包括相关权重计算过程、读过程、写过程以及模型训练过程。如图2所示，其为本发明实施例提供的一种融合多特征的深度知识追踪系统的结构示意图。

在本发明实施例中，深度知识追踪模型(MFKT模型)引入了题目文本特征、知识点难度特征等来提取深层次的语义信息。第t时刻知识点语义表征向量q_t包括三个部分：知识点编号特征k_t，题目文本特征qt_t，知识点难度特征dif_t。需要说明的是，本发明所有特征的构造方法均以第t时刻深度知识追踪模型的输入特征为例，相关权重计算过程中相关特征构造方法具体如下所述：

知识点编号特征k_t构造方法：目标对象在答题过程中的每一道题都对应着一个知识点编号，若用独热向量来构造知识点编号特征会使特征非常稀疏，于是将知识点编号对应的独热(one-hot)向量乘以嵌入矩阵M_k(l×d_k维)，可得到知识点编号特征k_t(d_k维)；其中l为知识点总数。

题目文本特征qt_t使用Transformer方法来提取：题目文本特征可以有效地对题目文本信息进行表征，比只用知识点编号来表示题目包含了更多语义信息。首先使用预设的分词工具对题目文本进行分词，然后对特殊符号、停用词等进行清洗，最终得到分词特征。经过上述处理，题目文本可以描述为是一个包含m个词的句子 E_i＝{w₁，w₂，…，w_m}。对于E_i，首先将每一个词w_i转化为d₀维的词向量，题目文本E_i则对应一个m×d₀维的句子矩阵。进一步的，为每个词构建一个d₀维的位置向量，形成一个m×d₀维的位置矩阵。将句子矩阵和位置矩阵相加之后分别线性投影到三个不同的空间当作 Key，Value，Query输入模型中，经过包含Multi-head Attention和Feed Forward Networks的Transformer Block结构，得到题目文本特征q_t。

知识点难度特征dif_t构造方法DIF_box：通常知识点难度可用各知识点相关题目回答的正确率表示，数值范围在[0，1]。考虑到各个知识点上回答的正确率分布不均匀，因此本发明使用箱线图对数据进行处理。假如，有s个知识点，计算出s个知识点的正确率c＝{c₁，c₂，…，c_s}，从这s个数值中统计出下四分位点Q₁、中位数Q₂、上四分位点Q₃，分别利用公式(1)和(2)求出上限high和下限low。如果知识点正确率大于上限或者小于下限，则将其视为异常值，异常值用均值代替。然后，将连续特征c离散化，根据数据分布将知识点难度按区间划分为p类。因此，知识点难度特征dif_t(d_k维)由知识点难度对应的独热向量乘以相应的嵌入矩阵M_d(p×d_k维)得到。

high＝Q₃+(Q₃-Q₁)*1.5 (1)

low＝Q₁-(Q₃-Q₁)*1.5 (2)

另外，为了将上述三个部分的特征有效地融合在一起，充分表征知识点语义特征，本发明采用了基于Multi-head Self-Attention机制的方法来构造知识点语义特征。具体构造方法如下：

对于v个等长的特征向量{u₁，u₂，…，u_v}，先将其拼接起来得到

通过式(3)将U线性投影到不同的空间：

Q＝UW^Q，K＝UW^K，V＝UW^V (3)

然后，使用Scaled Dot-product得到注意力权重：

为了从不同的特征子空间中提取信息，还需要将Q、K、V线性投影k次，然后将所有的head拼接起来，得到：

MultiHead(Q，K，V)＝concat(head₁，…，head_k)W^O (5)

其中，

然后，进一步的将MultiHead(Q，K，V)通过Feed Forward Networks进行非线性变换。具体的，为了更好的优化深度网络，整个网络模型使用残差连接，并对子层进行了标准化处理。最后输出结果时，将原始v个特征向量统一成一个定长的特征向量。因此，知识点语义表征q_t可由式(6)得到，其中F函数表示上述提出的融合特征的方法。

q_t＝F(k_t，qt_t，dif_t) (6)

模型输入的知识点语义表征向量q_t与Key Memory的每一个 Key Slot向量M^k(i)(3d_k维)做内积运算，再通过Softmax激活函数，可以得到潜在知识点的相关权重。相关权重w_t表示当前输入知识点与各个潜在知识点之间的相关程度：

在本发明实施例中，读过程包括：当预测k_t作答表现时，模型利用相关权重w_t将Value Memory中所有Value Slot向量

(2d_v维) 加权求和得到读取内容r_t。r_t表示目标对象对知识点的掌握水平。

另外，在具体实施过程中，由于目标对象在各知识点上的表现还与目标对象能力值等有关。对于难度较大的题目，能力值较高的目标对象回答的正确率更高。因此MFKT模型引入了目标对象能力值特征abi_t，其构造方法ABI_att如下：将所有回答正确的题目对应的知识点难度求和，除以所有回答过的题目对应的知识点难度之和，再乘以目标对象能力类别数w，然后向下取整得到abi_t，如式(9)所示。再通过相应的嵌入矩阵，得到目标对象能力值向量abi_t。

将r_t与q_t和abi_t拼接，再通过一个全连接层和激活函数得到向量 f_t。

f_t＝Tanh(W₁ ^T[r_t，q_t，abi_t]+b₁) (10)

最终，向量f_t通过另一个全连接层和一个Sigmoid激活函数来预测目标对象的表现。p_t代表目标对象正确回答该知识点的概率。

在本发明实施例中，写过程包括：现有多数研究的答题记录表征向量qa_t仅考虑了目标对象的作答情况。目标对象在答题过程中的作答情况都对应着一个二元组x_t＝(k_t，r_t)，使x_t＝k_t+l*r_t，将x_t对应的独热向量乘以嵌入矩阵M_i(2l×d_v维)，可得到i_t(d_v维)。然而，答题用时也能在一定程度上反映作答该题时知识状态的掌握程度。因此，在本发明实施例中引入了答题用时特征d_t。其构造方法 DUR_box如下：对数据集中所有的答题用时按升序进行排序，其中最小值为min，最大值为max。考虑到答题用时分布不均匀，同样使用箱线图对数据进行处理。首先，将连续的答题用时离散化，将目标对象的答题用时进行归一化处理，然后统计出答题用时的下四分位点 Q₁、中位数Q₂、上四分位点Q₃，分别利用式(1)和(2)求出上限high和下限low。大于上限或小于下限的点为异常值，异常值用均值代替。根据数据分布将答题用时按区间划分为q类。因此，答题用时特征d_t由答题用时对应的的独热向量乘以相应的嵌入矩阵M_d(q×d_v维)得到。类似的，答题记录表征向量qa_t如式(12)所示。

qa_t＝F(i_t，d_t) (12)

当目标对象回答q_t后，MKFT模型使用t时刻的目标对象作答情况更新t+1时刻的Value Memory。受到长短时记忆网络输入门和遗忘门的启发，qa_t通过一个全连接层和一个Sigmoid激活函数得到擦除向量e_t：

e_t＝Sigmoid(E^Tqa_t+b_e) (13)

然后，qa_t通过一个全连接层和一个激活函数得到增长向量a_t：

a_t＝Tanh(D^Tqa_t+b_a)^T (14)

最后通过式(15)即可更新目标对象下一时刻的知识状态：

在本发明实施例中，训练过程包括：使用随机高斯分布N＝(0，σ) 初始化M^k、M^v、相应的嵌入矩阵以及其他权重矩阵。使用交叉熵函数来优化该模型，深度知识追踪系统模型的优化目标是使真实标签r_t与预测值p_t之间的交叉熵损失达到最小，如式(16)所示。训练结束后，深度知识追踪系统模型得到目标对象在该知识点上的知识状态。

在本发明实施例中，上述公式(1)-(16)中包含的参数对应的具体含义如下：k_t为知识点编号特征；M^k为知识点矩阵；dif_t为知识点难度特征；

为t时刻的知识点记忆矩阵；qt_t为题目文本特征； w_t为知识点权重；i_t为答题交互特征；r_t为对t时刻知识点的掌握程度；d_t为答题用时特征；abi_t为目标对象能力特征；q_t为知识点语义特征；f_t为对t时刻知识点的综合掌握程度；qa_t为答题记录特征；p_t为对t时刻知识点回答正确的概率；e_t为擦除向量；a_t为增长向量；n为答题序列最大长度；l为知识点总数；m为单词个数；s为知识点个数； p为难度类别数；c为正确率；u为特征向量；q为答题用时等级数；w为目标对象能力值等级数；v为特征向量个数。在此不再一一赘述。

本发明综合考虑了题目文本、知识点难度、目标对象能力和答题用时等关键特征，能够将目标对象的答题情况与对应的题目文本特征进行统一建模，同时将知识点难度特征、学生能力值特征和答题用时特征引入知识追踪模型中，并采用多头自注意力(Multi-head Self-Attention)机制对上述特征组合，提出了一种融合多特征的深度知识追踪方法，提高了知识追踪模型的预测精度和效率，能够准确预测目标对象在下一次答题时的表现。

与上述提供的一种融合多特征的深度知识追踪方法相对应，本发明还提供一种融合多特征的深度知识追踪系统。由于该系统的实施例相似于上述方法实施例，所以描述得比较简单，相关之处请参见上述方法实施例部分的说明即可，下面描述的融合多特征的深度知识追踪系统的实施例仅是示意性的。请参考图3所示，其为本发明实施例提供的一种融合多特征的深度知识追踪系统的结构示意图。

本发明所述的一种融合多特征的深度知识追踪系统具体包括如下部分：

知识点语义表征向量确定单元301，用于确定待分析文本对应的知识点语义表征向量；其中，所述知识点语义表征向量包含知识点编号特征、题目文本特征以及知识点难度特征；

知识状态预测单元302，用于将所述知识点语义表征向量输入至深度知识追踪模型中进行处理，得到所述深度知识追踪模型输出的相应的知识状态预测结果；其中，所述深度知识追踪模型是以样本文本、所述样本文本对应的样本知识状态预测结果以及真实标签进行训练得到的。

本发明综合考虑了题目文本、知识点难度、目标对象能力和答题用时等关键特征，能够将目标对象的答题情况与对应的题目文本特征进行统一建模，同时将知识点难度特征、学生能力值特征和答题用时特征引入知识追踪模型中，并采用多头自注意力(Multi-head Self-Attention)机制对上述特征组合，提出了一种融合多特征的深度知识追踪系统，提高了知识追踪模型的预测精度和效率，能够准确预测目标对象在下一次答题时的表现。

与上述提供的融合多特征的深度知识追踪方法相对应，本发明还提供一种电子设备。由于该电子设备的实施例相似于上述方法实施例，所以描述得比较简单，相关之处请参见上述方法实施例部分的说明即可，下面描述的电子设备仅是示意性的。如图4所示，其为本发明实施例公开的一种电子设备的实体结构示意图。该电子设备可以包括：处理器(processor)401、存储器(memory)402和通信总线403，其中，处理器401，存储器402通过通信总线403完成相互间的通信。处理器401可以调用存储器402中的逻辑指令，以执行融合多特征的深度知识追踪方法，该方法包括：确定待分析文本对应的知识点语义表征向量；其中，所述知识点语义表征向量包含知识点编号特征、题目文本特征以及知识点难度特征；将所述知识点语义表征向量输入至深度知识追踪模型中进行处理，得到所述深度知识追踪模型输出的相应的知识状态预测结果；其中，所述深度知识追踪模型是以样本文本、所述样本文本对应的样本知识状态预测结果以及真实标签进行训练得到的。

此外，上述的存储器402中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

另一方面，本发明实施例还提供一种计算机程序产品，所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序，所述计算机程序包括程序指令，当所述程序指令被计算机执行时，计算机能够执行上述各方法实施例所提供的融合多特征的深度知识追踪方法，该方法包括：确定待分析文本对应的知识点语义表征向量；其中，所述知识点语义表征向量包含知识点编号特征、题目文本特征以及知识点难度特征；将所述知识点语义表征向量输入至深度知识追踪模型中进行处理，得到所述深度知识追踪模型输出的相应的知识状态预测结果；其中，所述深度知识追踪模型是以样本文本、所述样本文本对应的样本知识状态预测结果以及真实标签进行训练得到的。

又一方面，本发明实施例还提供一种非暂态计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现以执行上述各实施例提供的融合多特征的深度知识追踪方法，该方法包括：确定待分析文本对应的知识点语义表征向量；其中，所述知识点语义表征向量包含知识点编号特征、题目文本特征以及知识点难度特征；将所述知识点语义表征向量输入至深度知识追踪模型中进行处理，得到所述深度知识追踪模型输出的相应的知识状态预测结果；其中，所述深度知识追踪模型是以样本文本、所述样本文本对应的样本知识状态预测结果以及真实标签进行训练得到的。

以上所描述的系统实施例仅仅是示意性的，其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下，即可以理解并实施。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件。基于这样的理解，上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在计算机可读存储介质中，如ROM/RAM、磁碟、光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。

最后应说明的是：以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims

1.一种融合多特征的深度知识追踪方法，其特征在于，包括：

确定待分析文本对应的知识点语义表征向量；

2.根据权利要求1所述的融合多特征的深度知识追踪方法，其特征在于，所述确定待分析文本对应的知识点语义表征向量，具体包括：

确定所述待分析文本对应的知识点编号特征；

确定所述待分析文本对应的题目文本特征；

确定所述待分析文本对应的知识点难度特征；

3.根据权利要求2所述的融合多特征的深度知识追踪方法，其特征在于，确定所述待分析文本对应的知识点编号特征，包括：基于所述待分析文本中的知识点编号对应的独热向量和嵌入知识点矩阵，得到相应的知识点编号特征；

4.根据权利要求3所述的融合多特征的深度知识追踪方法，其特征在于，还包括：

确定所有回答正确的题目对应的第一知识点难度数据；

确定所有回答过的题目对应的第二知识点难度数据；

5.根据权利要求1所述的融合多特征的深度知识追踪方法，其特征在于，还包括：

6.根据权利要求1所述的融合多特征的深度知识追踪方法，其特征在于，所述知识状态预测结果，具体包括：目标对象对知识点的掌握程度的评估结果以及目标对象对知识点在下一时刻的作答表现的预测结果。

7.根据权利要求1所述的融合多特征的深度知识追踪方法，其特征在于，所述深度知识追踪模型是以样本文本、所述样本文本对应的样本知识状态预测结果以及真实标签进行训练得到的，具体包括：所述深度知识追踪模型是以样本文本、所述样本文本对应的样本知识状态预测结果以及真实标签进行训练，以使所述真实标签与样本知识状态预测结果之间的交叉熵损失达到最小化为训练目标得到的；所述深度知识追踪模型用于基于对所述样本文本进行特征提取得到的知识点语义表征向量，对所述待分析文本进行语义理解。

8.一种融合多特征的深度知识追踪系统，其特征在于，包括：

9.一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述程序时实现如权利要求1-7任意一项所述的融合多特征的深度知识追踪方法的步骤。

10.一种非暂态计算机可读存储介质，其上存储有计算机程序，其特征在于，该计算机程序被处理器执行时实现如权利要求1-7任意一项所述的融合多特征的深度知识追踪方法的步骤。