CN113378581B

CN113378581B - 一种基于多元概念注意力模型的知识追踪方法及系统

Info

Publication number: CN113378581B
Application number: CN202110710894.3A
Authority: CN
Inventors: 徐斌; 吴豪
Original assignee: Zhejiang Gongshang University
Current assignee: Zhejiang Gongshang University
Priority date: 2021-06-25
Filing date: 2021-06-25
Publication date: 2023-06-06
Anticipated expiration: 2041-06-25
Also published as: CN113378581A

Abstract

本发明公开了一种基于多元概念注意力模型的知识追踪方法及系统，该方法包括以下步骤：获取学习者的历史习题回答的交互序列；建立多元概念注意力模型，根据学习者的习题键索引将历史习题回答的交互序列划分为多个不同大小的注意力模块；建立多元语义注意力模型，对上下文的内容和注意力模块数据进行整合；通过注意力分类层计算待测试的习题键索引的知识概念分布权重；将分类注意力分数值和历史回答向量相乘，获取学习者对新习题回答的特征分数值；根据特征分数值和待测试的习题键索引计算学习者对当前题目正确回答的概率，遍历与当前知识状态相似的历史习题，更新知识状态，从而准确的构建适合学习者的学习路线。

Description

一种基于多元概念注意力模型的知识追踪方法及系统

技术领域

本发明属于教育数据挖掘和知识追踪领域，具体涉及一种基于多元概念注意力模型的知识追踪方法及系统。

背景技术

随着大数据技术的迅猛发展，教育领域也引入了数据挖掘技术。尤其在互联网快速扩张的今天，在线学习平台被越来越多人关注和使用。知识追踪作为在线学习教育系统的重要组成部分，一直是众多研究的焦点。根据学习者的历史答题序列，抽象出习题的知识点和概念，知识追踪对学习者和习题进行交互建模，掌握不同时期学习者的知识状态，从而预测其对新习题的回答情况，以便对学习者个性化地学习。

传统的知识追踪方法大多只评价习题之间的相关性，而没有注意到涉及多个概念的习题之间的关联。知识追踪领域有两个经典的模型。以贝叶斯知识追踪(BayesianKnowledgeTracing,BKT)为代表的模型，其使用隐马尔可夫模型(Hidden MarkovModel)建模，模拟学习者对概念的两种知识状态，即掌握和未掌握状态。采用与学习者是否正确回答相关的先验概率，并且利用四个总要参数来更新学习者的知识状态。该模型的优点是一定程度上模拟了历史学习过程中存在的相关性；但不足是四个重要参数数值是随机生成，没有包含学习者的学习信息。

深度学习模型(Deep Learning Model)，它使用了循环神经网络(RecurrentNeural Network,RNN)构建高维度隐藏状态来模拟带有记忆性的学习者学习过程，进而预测学习者的答题表现。典型代表为深度知识追踪(Deep Knowledge Tracing,DKT)。本模型的优势是，神经网络易训练且收敛快；不足是模型存在解释性差和学习者知识状态模拟不佳的问题，理论解释方面还有待提高。

可见，现有技术由于理论和技术层面存在的问题，无法获得较好的知识追踪模型，进而影响知识追踪效果。针对上述的缺陷，亟需一种新的知识追踪方法或模型来改进需求，进而完善知识追踪的应用。

发明内容

本发明的目的在于针对现有技术的不足，提供一种基于多元概念注意力模型的知识追踪方法及系统，可以全方面处理多元和复杂概念的习题，从而很好地将多领域的问题迁移到新出现的习题上，实现学习者对待测试题认知状态的检测，并且预测学习者知识状态掌握程度。

本发明的目的是通过以下技术方案来实现的：

一方面，本申请提出一种基于多元概念注意力模型的知识追踪方法，该方法包括：

(1)获取学习者的历史习题回答的交互序列；所述交互序列包括习题标签和回答情况；所述习题标签包含习题键索引k和知识概念索引c；根据时间轴顺序，将历史习题回答的交互序列与知识组件组合成一个含有知识状态的序列；

(2)建立多元概念注意力模型；

根据学习者的习题键索引k将历史习题回答的交互序列X划分为M个不同大小的注意力模块；每个注意力模块中知识概念索引c和习题键索引k做注意力映射，得到数据单元的习题键索引；结合注意力模块中每个数据单元的注意力分数值，得到每个注意力模块的输出数据；

(3)建立多元语义注意力模型；

所述多元语义注意力模型包括依次连接的输入层、情感意识注意层和长短期记忆网络；

将每个注意力模块的输出数据Y_m通过输入层传入情感意识注意层；所述情感意识注意层中，利用上下文的内容和内容语义关系计算上下文组块数据co_t；

将Y_m和co_t按矩阵行拼接构成第m个注意力模块的注意力特征向量in_t；

将in_t输入长短期记忆网络，在长短期记忆网络中整合上下文组块之间的相似性；所述长短期记忆网络由记忆元组、激活函数和门控单元组成；所述门控单元用于更新co_t，从而对学习者的知识状态进行追踪；

将更新后的co_t与Y_m拼接构成第m个注意力模块的最终注意力特征向量

(4)将步骤(3)得到的

传入注意力分类层，所述注意力分类层将/>

和待测试的习题键索引进行范围点积，然后通过全连接层和Softmax激活函数归一化计算待测试的习题键索引的知识概念分布权重，用分类注意力分数值表示；

(5)将分类注意力分数值和历史回答向量相乘，获取学习者对新习题回答的特征分数值；

(6)根据特征分数值和待测试的习题键索引计算学习者对当前题目正确回答的概率，遍历与当前知识状态相似的历史习题，更新知识状态。

进一步地，所述步骤(2)中，第m个注意力模块的输出数据Y_m表示为：

其中m^*为第m个注意力模块的数据单元总数，k^m,i为第m个注意力模块的第i个数据单元的习题键索引，

为第m个注意力模块的第i个数据单元的注意力分数值；

其中

为第m个注意力模块的权值矩阵W^m和第m个注意力模块的第i个数据单元的习题键索引k^m,i的交互值，其表示为：

进一步地，所述步骤(3)中，上下文组块数据co_t表示为：

其中N为上下文组块的总数，k_t,i为第t时刻第i个上下文组块的习题键索引，α_t,i为第t时刻第i个上下文组块的注意力分数值；

其中h_t-1是长短期记忆网络的隐含状态，W_i ^h是长短期记忆网络中隐含状态h_t-1和第i个注意力分数值连接的权值矩阵，W_i是k_t,i的注意力分数值的权值矩阵，

表示矩阵按行拼接的运算。

进一步地，所述步骤(3)中，通过门控单元更新上下文组块数据co_t，表示为：

co_t＝f_t⊙co_t-1+i_t⊙g_t

h_t＝o_t⊙Tanh(co_t)

其中f_t是遗忘门，控制知识概念的遗忘情况；i_t是输入门，控制知识概念的记忆情况；h_t是长短期记忆网络中第t个隐含状态；g_t是注意力特征向量in_t中保存下来有效的数据，表示经过情感意识注意层保留下来的知识概念；W^g是长短期记忆网络的隐含状态h_t-1和注意力特征向量in_t按行拼接的权值矩阵；o_t是输出门，控制记忆元组有效知识概念的输出；⊙表示矩阵的基本积运算；更新后的co_t用于多元语义注意力模型中特征信息的预测和对下一时刻注意力映射的指示。

进一步地，在多元语义注意力模型训练过程中，利用交叉熵损失函数来评估模型收敛程度，运用反向传播算法对模型参数进行训练，直至整个模型网络收敛；依据学习者t时刻的回答情况，学习者对当前题目正确回答的概率采用交叉熵损失函数L为：

其中r_t表示学习者答题的真实结果数据；p_t表示计算学习者对当前题目回答的预测值。

进一步地，将计算所得习题回答数据和习题回答的真实结果正确作比较，计算模型的损失函数，通过损失函数最小化，获取隐含状态权值矩阵的最优值。

另一方面，本申请提出一种基于多元概念注意力模型的知识追踪系统，该系统包括：

学习者答题数据集模块：获取学习者的历史习题回答的交互序列；所述交互序列包括习题标签和回答情况；所述习题标签包含习题键索引k和知识概念索引c；根据时间轴顺序，将历史习题回答的交互序列与知识组件组合成一个含有知识状态的序列；

多元概念注意力模型模块：根据学习者的习题键索引k将历史习题回答的交互序列X划分为M个不同大小的注意力模块；每个注意力模块中知识概念索引c和习题键索引k做注意力映射，得到数据单元的习题键索引；结合注意力模块中每个数据单元的注意力分数值，得到每个注意力模块的输出数据；

多元语义注意力模型模块：多元语义注意力模型包括依次连接的输入层、情感意识注意层和长短期记忆网络；将每个注意力模块的输出数据Y_m通过输入层传入情感意识注意层；情感意识注意层中，利用上下文的内容和内容语义关系计算上下文组块数据co_t；将Y_m和co_t按矩阵行拼接构成第m个注意力模块的注意力特征向量in_t；将in_t输入长短期记忆网络，在长短期记忆网络中整合上下文组块之间的相似性；所述长短期记忆网络由记忆元组、激活函数和门控单元组成；所述门控单元用于更新co_t，从而对学习者的知识状态进行追踪；将更新后的co_t与Y_m拼接构成第m个注意力模块的最终注意力特征向量

注意力分类层：将多元语义注意力模型模块得到的

传入注意力分类层，注意力分类层将/>

特征分数值计算层：将分类注意力分数值和历史回答向量相乘，获取学习者对新习题回答的特征分数值；

知识状态更新模块：根据特征分数值和待测试的习题键索引计算学习者对当前题目正确回答的概率，遍历与当前知识状态相似的历史习题，更新知识状态。

进一步地，所述多元概念注意力模型模块中，第m个注意力模块的输出数据Y_m表示为：

为第m个注意力模块的第i个数据单元的注意力分数值；

其中

进一步地，所述多元语义注意力模型模块中，上下文组块数据co_t表示为：

表示矩阵按行拼接运算。

进一步地，所述多元语义注意力模型模块中，通过门控单元更新上下文组块数据co_t，表示为：

co_t＝f_t⊙co_t-1+i_t⊙g_t

/>

h_t＝o_t⊙Tanh(co_t)

总体而言，本发明所构思的以上技术方案与现有技术相比，具有以下技术效果：

本发明提供的基于多元概念注意力模型的知识追踪方法，其通过建立随时间序列的多元概念注意力模型和多元语义注意力模型，挖掘多元习题，知识概念之间的相似性与特征性，有利于解释深度学习对知识追踪的促进作用，学习者能更好地掌握和更新知识状态。根据知识状态矩阵，情感意识注意层，长短期神经网络构建的多元语义注意力的神经网络，设计了上下文组块的注意力分数值来解决多元知识概念下，知识点分散导致所需要的知识状态随时间削弱的问题。遍历所有的情感意识注意层，传入长短期记忆神经网络模型中，更新模型参数矩阵；根据所有整合的注意力模块，计算出学习者对新习题的知识状态。根据注意力机制更好的模拟出知识状态的变化，解决了多元概念信息忽视的问题，同时解决了不同概念对知识点多样性的限制影响。

附图说明

图1是本发明实施例提供的基于多元概念注意力模型的知识追踪方法的流程图；

图2是本发明实施例提供的长短期记忆神经网络模型的结构示意图。

具体实施方式

为了更好的理解本申请的技术方案，下面结合附图对本申请实施例进行详细描述。

应当明确，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例，都属于本申请保护的范围。

在本申请实施例中使用的术语是仅仅出于描述特定实施例的目的，而非旨在限制本申请。在本申请实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式，除非上下文清楚地表示其他含义。

图1为本发明实施例提供的基于多元概念注意力模型的知识追踪方法的流程图，如图1所示，该方法包括以下步骤：

(1)获取学习者的历史习题回答的交互序列；所述交互序列包括习题标签和回答情况；所述习题标签包含习题键索引k和知识概念索引c；根据时间轴顺序，将历史习题回答的交互序列与知识组件组合成一个含有知识状态的序列；当前时间记为t，时间轴中有t-1个历史时间点1,2,…,t-1；将历史习题回答的交互序列记为X＝{x₁,x₂,…,x_t-1}，习题概念序列记为C＝{c₁,c₂,…,c_t-1}；学习者对习题键索引k_t的回答向量记为r_t，r_t＝1表示回答正确，r_t＝0表示回答错误。

(2)建立多元概念注意力模型；

根据学习者的习题键索引k将历史习题回答的交互序列X划分为M个注意力模块，以便将冗长的历史习题回答习的交互序列划分成若干小段的注意力模块；每个注意力模块的大小不同，较大的注意力模块包含更多的知识概念信息；每个注意力模块中知识概念索引c和习题键索引k做注意力映射，得到数据单元的习题键索引；为了使得多元概念注意力模型能够关注更多的知识组件信息，结合注意力模块中每个数据单元的注意力分数值，得到每个注意力模块的输出数据，第m个注意力模块的输出数据Y_m定义为：

为第m个注意力模块的第i个数据单元的注意力分数值；

其中

(3)建立多元语义注意力模型；

将每个注意力模块的输出数据Y_m通过输入层传入情感意识注意层；所述情感意识注意层中，利用上下文的内容和内容语义关系计算上下文组块数据co_t，更好地整合起多元概念信息，上下文组块数据co_t表示为：

表示矩阵按行拼接的运算。

将Y_m和co_t按矩阵行拼接构成第m个注意力模块的注意力特征向量in_t：

将注意力特征向量in_t输入长短期记忆网络，在长短期记忆网络中整合上下文组块之间的相似性；所述长短期记忆网络由1个记忆元组、1个激活函数和3个门控单元组成；所述门控单元用于更新上下文组块数据co_t，从而对学习者的知识状态进行追踪，表示为：

co_t＝f_t⊙co_t-1+i_t⊙g_t

h_t＝o_t⊙Tanh(co_t)

其中f_t是遗忘门，控制知识概念的遗忘情况；i_t是输入门，控制知识概念的记忆情况；h_t是长短期记忆网络中第t个隐含状态；g_t是注意力特征向量in_t中保存下来有效的数据，表示经过情感意识注意层保留下来的知识概念；W^g是长短期记忆网络的隐含状态h_t-1和注意力特征向量in_t按行拼接的权值矩阵；o_t是输出门，控制记忆元组有效知识概念的输出；更新后的co_t用于多元语义注意力模型中特征信息的预测和对下一时刻注意力映射的指示；⊙表示矩阵的基本积运算。

(4)将步骤(3)得到的最终注意力特征向量

传入注意力分类层，所述注意力分类层将最终注意力特征向量/>

在多元语义注意力模型训练过程中，利用交叉熵损失函数来评估模型收敛程度，运用反向传播算法对模型参数进行训练，直至整个模型网络收敛；依据学习者t时刻的回答情况，学习者对当前题目正确回答的概率采用交叉熵损失函数L为：

本实施例的实验结果衡量指标是Area Under Curve(AUC)，它的定义为ROC曲线下与坐标围成的面积。AUC数值介于0.5到1，数值越大，模型的准确性越高。本实施例提供的方法在公开数据集Assistments2009，Assistments2015，Assistments2017和Statics 2010上的AUC测试结果优于现有的知识追踪方法预测结果。

表1为本发明的知识追踪方法和现有技术对学习者习题回答的预测表现

	Assistments2009	Assistments2015	Assistments2017	Statics 2010
					BKT	0.68	0.66	0.70	0.74
DKT	0.82	0.73	0.74	0.82
					本发明方法	0.82	0.90	0.81	0.84

以上所述仅为本说明书一个或多个实施例的较佳实施例而已，并不用以限制本说明书一个或多个实施例，凡在本说明书一个或多个实施例的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本说明书一个或多个实施例保护的范围内。