CN115422256A

CN115422256A - 融合学习认知要素的可解释知识认知水平挖掘方法及系统

Info

Publication number: CN115422256A
Application number: CN202211034335.6A
Authority: CN
Inventors: 王志锋; 左明章; 罗恒; 孙建文; 闵秋莎; 董石; 田元; 夏丹; 龙陶陶
Original assignee: Central China Normal University
Current assignee: Central China Normal University
Priority date: 2022-05-20
Filing date: 2022-08-26
Publication date: 2022-12-02

Abstract

本发明属于个性化学习技术领域，公开了一种融合学习认知要素的可解释知识认知水平挖掘方法及系统，包括：构建学习资源‑作答反应矩阵和学习资源‑知识点矩阵，估计基于认知诊断模型的失误和猜测参数；获取包含学习者对潜在知识点的总体掌握状态的特征向量；融入基于认知诊断模型的失误和猜测参数，得到新的特征向量，预测学习者在特定学习资源上的作答表现；获取知识增长向量、学习者对知识点的遗忘程度以及记忆强化程度，综合更新学习者与学习资源交互后的知识状态。本发明提出的融合学习认知要素的可解释知识认知水平挖掘方法比传统知识认知水平挖掘方法更有效。

Description

融合学习认知要素的可解释知识认知水平挖掘方法及系统

技术领域

本发明属于个性化学习技术领域，尤其涉及一种融合学习认知要素的可解释知识认知水平挖掘方法及系统。

背景技术

目前，新冠疫情的爆发，使得线上教育模式得到规模空前的普及。然而，疫情期间的线上教育模式还是延续着传统线下的教育模式，虽然用到一系列在线学习平台、计算机辅助系统等电子学习软件，但仍然没有很好地利用学习者在线上教育模式中产生的学习数据，也没有给每一位学生提供个性化的学习服务。

而知识认知水平挖掘是提供个性化学习服务的典型方法。在现有知识认知水平挖掘方法使用最为广泛的是引入深度学习的知识认知水平挖掘方法，这一类方法在表征学习者知识状态变化以及预测学习者表现方面的性能非常优越，但是由于深度学习的“黑匣子”属性，使得该类知识认知水平挖掘方法在教育领域的可解释性有待提升。因此，有不少研究针对提升知识认知水平挖掘模型的可解释性开展，但大部分都是基于统计学的方法，通常这些方法都是依据常识或者教育理论来对学习者的认知要素进行量化，虽然可解释性增强了，但是挖掘的学习者认知要素不够深入，没有深入到学习者的认知层面，仅仅停留在数据驱动层面。

通过上述分析，现有技术存在的问题及缺陷为：现有的知识认知水平挖掘系统或方法在教育领域的可解释性较弱；对学习者的认知要素挖掘不够深入，挖掘方法单一。

发明内容

针对现有技术存在的问题，本发明提供了一种融合学习认知要素的可解释知识认知水平挖掘方法及系统。

本发明是这样实现的，一种融合学习认知要素的可解释知识认知水平挖掘方法，所述融合学习认知要素的可解释知识认知水平挖掘方法包括：

步骤一，以学习者与学习资源的交互序列为基础，构建学习资源-作答反应矩阵和学习资源-知识点矩阵，估计基于认知诊断模型的失误和猜测参数；

步骤二，分别创建存储学习者作答学习资源潜在知识点的键矩阵以及存储对所述潜在知识点的掌握状态的值矩阵；同时从所述键矩阵获取学习者作答的学习资源所相关的知识点；从所述值矩阵读取学习者在相关知识点上的掌握情况，得到包含学习者对潜在知识点的总体掌握状态的特征向量；

步骤三，从所述包含学习者对潜在知识点的总体掌握状态的特征向量中学习基于学习者的个性化失误参数和猜测参数，融入基于认知诊断模型的失误和猜测参数，得到新的特征向量，预测学习者在特定学习资源上的作答表现；

步骤四，根据学习者与学习资源交互的交互序列的嵌入矩阵向量表示，并基于学习者当前的知识状态，获取知识增长向量；再基于学习者个性化的遗忘速率，获取学习者对知识点的遗忘程度以及记忆强化程度，综合更新学习者与学习资源交互后的知识状态。

进一步，所述步骤一包括：

(1)以学习者与学习资源的交互序列为基础，做学习资源序列的嵌入矩阵向量表示以及学习者与学习资源交互的交互序列的嵌入矩阵向量表示：

(1.1)设置学习资源的嵌入矩阵A，并将学习资源序列(q₁,q₂,...,q_t)与所述学习资源的嵌入矩阵A进行嵌入，得到学习资源序列的嵌入矩阵向量表示K＝(k₁,k₂,...,k_t)；

(1.2)设置学习者与学习资源的交互序列的嵌入矩阵B，将学习者与学习资源的交互序列X＝(x₁,x₂,...,x_t)与所述学习者与学习资源的交互序列的嵌入矩阵B进行嵌入，得到学习者与学习资源交互的交互序列的嵌入矩阵向量表示V＝(v₁,v₂,...,v_t)；

(2)以学习者与学习资源的交互序列为基础，构建学习资源-作答反应矩阵和学习资源- 知识点矩阵；所述学习资源-作答反应矩阵为行为学习者作答的学习资源，列为学习者在学习资源上的作答反应的矩阵；所述学习资源-知识点矩阵为行为学习者作答的学习资源，列为学习资源对应的知识点的矩阵；

(3)以学习资源-作答反应矩阵和学习资源-知识点矩阵为基础，引入认知诊断模型，估计基于认知诊断模型的失误和猜测参数：

(3.1)初始化学习者的知识状态α，再结合学习资源-知识点矩阵Q，得到学习者在学习资源上的理想作答情况；所述学习者在学习资源上的理想作答情况η计算公式如下：

其中，N表示学习资源包含的知识点数；

(3.2)依据学习资源-作答反应矩阵R和理想作答矩阵η形式化定义失误参数s和猜测参数g，得到学习资源-作答反应矩阵R的概率模型，如下：

s＝P(R＝0|η＝1)

g＝P(R＝1|η＝0)

P(α)＝P(R＝1|α)＝g^(1-η)·(1-s)^η

(3.3)引入认知诊断模型DINA，得到DINA模型的总似然函数：

(3.4)使用极大似然函数估计学习者的知识状态，使用EM算法估计失误参数和猜测参数，得到基于认知诊断模型的失误参数s和猜测参数g。

进一步，所述步骤二包括：

1)创建存储学习者作答学习资源潜在知识点的键矩阵以及存储所述潜在知识点的掌握状态的值矩阵；所述键矩阵为

所述值矩阵为 KC^v＝(KC^v(1),...,KC^v(i),...,KC^v(N))；

2)将学习资源序列的嵌入矩阵向量表示k_t与值矩阵

做内积，并通过sigmoid函数进行激活，获取学习者作答的学习资源所相关的知识点及所述学习者作答的学习资源所相关的知识点的权重；

所述学习者作答的学习资源所相关的知识点的权重w_t计算公式为：w_t＝σ(k_tKC^k)；

3)结合获取的学习者作答的学习资源所相关的知识点及所述学习者作答的学习资源所相关的知识点的权重w_t，从值矩阵KC^v＝(KC^v(1),...,KC^v(i),...,KC^v(N))中读取学习者在相关知识点上的掌握情况

4)将获取的学习者在相关知识点上的掌握情况进行加权求和，得到学习资源所包含的知识点的总体掌握状态；

所述学习资源所包含的知识点的总体掌握状态r_t计算公式如下：

5)将学习资源所包含的知识点的总体掌握状态与学习资源序列的嵌入矩阵向量表示k_t连接，再通过Tanh函数进行激活，获得包含学习者对潜在知识点的总体掌握状态的特征向量；

所述包含学习者对潜在知识点的总体掌握状态的特征向量F_t表示如下：

F_t＝Tanh(W₁ ^T[r_t,k_t]+b₁)。

进一步，所述步骤三包括：

首先，从特征向量中学习基于学习者的个性化失误参数和猜测参数：

s′_t＝tanh(W₁F_t+b₁)

g′_t＝tanh(W₂F_t+b₂)

其次，融入基于学习者的个性化失误参数s'和猜测参数g'以及基于认知诊断模型的失误参数s和猜测参数g，获得新的特征向量：

最后，通过sigmoid函数对获得的新的特征向量进行激活，预测学习者在特定学习资源上的作答表现；

所述预测学习者在特定学习资源上的作答表现P_t公式如下：

进一步，所述步骤四包括：

(1)结合学习者当前的知识状态，将得到新的特征向量与学习者与学习资源交互的交互序列的嵌入矩阵向量表示V＝(v₁,v₂,...,v_t)进行融合，获取学习者在作答完学习资源之后的知识增长向量：

v′_t＝[v_t,F_t]；

(2)获取学习资源所包含的全部知识点的知识增长向量，并将所述学习资源所包含的全部知识点的知识增长向量分布在所有记忆片段中：获取学习资源所包含的全部知识点的知识增长向量为w_tv′_t，将所述知识增长向量根据值矩阵KC^v＝(KC^v(1),...,KC^v(i),...,KC^v(N))的值槽进行分割，得到分割后的知识增长向量(w_tv′_t(1),...,w_tv′_t(i),...,w_tv′_t(N))；

(3)将每个值槽分布的片段都作为LSTM模型的输入，获得学习者个性化的遗忘速率 LSTM(w_t(i)v′_t)；

(4)依据学习者个性化的遗忘速率，获取学习者答完学习资源后对知识点的遗忘程度：

(5)获取学习者答完学习资源后的记忆强化程度

(6)根据学习者答完学习资源后的遗忘程度和记忆强化程度综合更新学习者与学习资源交互后的知识状态：

(7)定义损失函数，并使用Adma优化器对权值进行更新；所述损失函数、如下：

(8)在损失函数中添加正则化项l₁和l₂：L'＝L+λ₁l₁+λ₂l₂；其中，λ₁,λ₂为正则化项对应的系数。

进一步，所述步骤(4)中，依据学习者个性化的遗忘速率，获取学习者答完学习资源后对知识点的遗忘程度包括：

(4.1)将任一个值槽分布的片段输入LSTM中，确定丢弃信息： f_t(i)＝σ(W_f·[h_t-1,w(i)v']+b_f)；其中W表示权重系数；b表示相应偏置向量；

(4.2)确定待更新的信息：m_t(i)＝σ(W_m·[h_t-1,w(i)v']+b_m)；

(4.3)确定需更新的信息：

(4.4)根据丢弃的信息和待更新的信息更新状态：

(4.5)得到学习者个性化的遗忘速率：

其中，h_t(i)表示某一个值槽的记忆片段获取的遗忘程度。

本发明的另一目的在于提供一种实施所述融合学习认知要素的可解释知识认知水平挖掘方法的融合学习认知要素的可解释知识认知水平挖掘系统，所述融合学习认知要素的可解释知识认知水平挖掘系统包括：

学习资源-作答反应矩阵和学习资源-知识点矩阵构建模块，用于以学习者与学习资源的交互序列为基础，构建学习资源-作答反应矩阵和学习资源-知识点矩阵，估计基于认知诊断模型的失误和猜测参数；

特征向量提取模块，用于分别创建存储学习者作答学习资源潜在知识点的键矩阵以及存储对所述潜在知识点的掌握状态的值矩阵；同时从所述键矩阵获取学习者作答的学习资源所相关的知识点；从所述值矩阵读取学习者在相关知识点上的掌握情况；得到包含学习者对潜在知识点的总体掌握状态的特征向量；

作答表现预测模块，用于从所述包含学习者对潜在知识点的总体掌握状态的特征向量中学习基于学习者的个性化失误参数和猜测参数，融入基于认知诊断模型的失误和猜测参数，得到新的特征向量，预测学习者在特定学习资源上的作答表现；

知识状态更新模块，用于根据学习者与学习资源交互的交互序列的嵌入矩阵向量表示，并基于学习者当前的知识状态，获取知识增长向量；再基于学习者个性化的遗忘速率，获取学习者对知识点的遗忘程度以及记忆强化程度，综合更新学习者与学习资源交互后的知识状态。

本发明的另一目的在于提供一种计算机设备，所述计算机设备包括存储器和处理器，所述存储器存储有计算机程序，所述计算机程序被所述处理器执行时，使得所述处理器执行所述融合学习认知要素的可解释知识认知水平挖掘方法如下步骤：

本发明的另一目的在于提供一种计算机可读存储介质，存储有计算机程序，所述计算机程序被处理器执行时，使得所述处理器执行所述融合学习认知要素的可解释知识认知水平挖掘方法如下步骤：

本发明的另一目的在于提供一种信息数据处理终端，所述信息数据处理终端用于实现所述融合学习认知要素的可解释知识认知水平挖掘系统。

结合上述的技术方案和解决的技术问题，请从以下几方面分析本发明所要保护的技术方案所具备的优点及积极效果为：

第一、针对上述现有技术存在的技术问题以及解决该问题的难度，紧密结合本发明的所要保护的技术方案以及研发过程中结果和数据等，详细、深刻地分析本发明技术方案如何解决的技术问题，解决问题之后带来的一些具备创造性的技术效果。具体描述如下：

本发明一方面结合认知诊断模型估计的学习者认知要素，另一方面通过神经网络学习学习者的认知要素，不仅解决了目前知识认知水平领域对学习者认知要素挖掘不够的问题，还从参数可解释、预测结果可解释以及知识状态更新可解释层面增加了模型的可解释性，也提高了模型在预测学习者表现方面的性能。

本发明提高了模型在教育领域的可解释性；本发明为知识认知水平挖掘领域的发展提供新的发展视角；本发明提高了知识认知水平挖掘模型在预测学习者表现方面的性能；本发明考虑了更多的学习者认知参数，深度学习者的认知层面，更好地模拟了学习者的学习过程。

第二，把技术方案看作一个整体或者从产品的角度，本发明所要保护的技术方案具备的技术效果和优点，具体描述如下：

本发明提出的融合学习认知要素的可解释知识认知水平挖掘方法比传统知识认知水平挖掘方法更有效。

本发明提供的融合学习认知要素的可解释认知水平挖掘方法对学习者来说，不仅能使其更清晰自我知识结构，还能了解到自我认知层面的信息，例如失误概率、猜测概率、遗忘速率等等。对教师来说，能更好地进行干预和有针对性的教学，从而因材施教。

第三，作为本发明的权利要求的创造性辅助证据，还体现在以下几个重要方面：

本发明的技术方案填补了国内外业内技术空白：本发明创新性地集成了认知诊断方法和知识认知水平挖掘方法，融入了认知诊断模型估计的学习者认知要素。

本发明使用神经网络学习学习者的认知要素参数，使得模型在学习者认知要素挖掘方面方式更丰富、表征更精确。

本发明以认知诊断理论为支撑，在预测时考虑了学习者认知要素，不仅更好地模拟了学习者的学习过程，也从预测可解释层面提高了知识认知水平挖掘方法在教育领域的可解释性。

本发明在计算学习者知识增长量时，考虑到了学习者当前的知识状态，不仅仅停留于学习者的答题情况。

本发明的技术方案是否解决了人们一直渴望解决、但始终未能获得成功的技术难题：

本发明解决了以往知识认知水平挖掘方法在挖掘学习者认知要素时不足的问题，一方面结合认知诊断模型估计的学习者认知要素，一方面通过网络学习学习者的认知要素。

本发明解决了以往知识认知水平挖掘方法基于数据驱动的方法来预测学习者表现，导致模型可解释性较弱的问题，从参数可解释、预测结果可解释以及知识状态更新可解释层面增加了模型的可解释性，也提高了模型在预测学习者表现方面的性能。

本发明的技术方案是否克服了技术偏见：

以往知识认知水平挖掘方法使用深度学习方法表征学习者的知识认知水平，由于深度学习的黑匣子属性，使得其在教育领域的可解释性较差。本发明的技术方案融合了认知诊断理论和学习者的的认知要素参数，从参数可解释、预测结果可解释以及知识状态更新可解释层面增加了模型的可解释性。

附图说明

图1是本发明实施例提供的融合学习认知要素的可解释知识认知水平挖掘方法原理图；

图2是本发明实施例提供的融合学习认知要素的可解释知识认知水平挖掘方法流程图；

图3是本发明实施例提供的模型虚拟数据集上训练过程示意图；

图4是本发明实施例提供的模型在真实C语言数据集上训练过程示意图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

一、解释说明实施例。为了使本领域技术人员充分了解本发明如何具体实现，该部分是对权利要求技术方案进行展开说明的解释说明实施例。

如图1-图2所示，本发明实施例提供的融合学习认知要素的可解释知识认知水平挖掘方法包括：

S101，以学习者与学习资源的交互序列为基础，构建学习资源-作答反应矩阵和学习资源 -知识点矩阵，估计基于认知诊断模型的失误和猜测参数；

S102，分别创建存储学习者作答学习资源潜在知识点的键矩阵以及存储对所述潜在知识点的掌握状态的值矩阵；同时从键矩阵获取学习者作答的学习资源所相关的知识点；从值矩阵读取学习者在相关知识点上的掌握情况，得到包含学习者对潜在知识点的总体掌握状态的特征向量；

S103，从包含学习者对潜在知识点的总体掌握状态的特征向量中学习基于学习者的个性化失误参数和猜测参数，融入基于认知诊断模型的失误和猜测参数，得到新的特征向量，预测学习者在特定学习资源上的作答表现；

S104，根据学习者与学习资源交互的交互序列的嵌入矩阵向量表示，并基于学习者当前的知识状态，获取知识增长向量；再基于学习者个性化的遗忘速率，获取学习者对知识点的遗忘程度以及记忆强化程度，综合更新学习者与学习资源交互后的知识状态。

本发明实施例提供的融合学习认知要素的可解释知识认知水平挖掘方法具体包括：

(1)以学习者与学习资源的交互序列为基础，做学习资源序列的嵌入矩阵向量表示以及学习者与学习资源交互的交互序列的嵌入矩阵向量表示，并构建学习资源-作答反应矩阵和学习资源-知识点矩阵，估计基于认知诊断模型的失误和猜测参数，从参数可解释性层面增加了模型的可解释性，具体包括：

步骤1.1：以学习者与学习资源的交互序列为基础，做学习资源序列的嵌入矩阵向量表示以及学习者与学习资源交互的交互序列的嵌入矩阵向量表示。

本发明实施例提供的步骤1.1进一步包括：

步骤1.1.1：设置学习资源的嵌入矩阵A，并将学习资源序列(q₁,q₂,...,q_t)与该矩阵进行嵌入，获得学习资源序列的嵌入矩阵向量表示K＝(k₁,k₂,...,k_t)；

步骤1.1.2：设置学习者与学习资源的交互序列的嵌入矩阵B，将学习者与学习资源的交互序列X＝(x₁,x₂,...,x_t)与该矩阵进行嵌入，获得学习者与学习资源交互的交互序列的嵌入矩阵向量表示V＝(v₁,v₂,...,v_t)；

步骤1.2：以学习者与学习资源的交互序列为基础，构建学习资源-作答反应矩阵和学习资源-知识点矩阵；

本发明实施例提供的学习资源-作答反应矩阵为行为学习者作答的学习资源，列为学习者在学习资源上的作答反应的矩阵R；

本发明实施例提供的学习资源-知识点矩阵为行为学习者作答的学习资源，列为学习资源对应的知识点的矩阵Q。

本发明实施例提供的步骤1.2进一步包括：

步骤1.2.1：本发明实施例提供的进行实验所用的数据集有两个，包括：虚拟数据集和真实C语言数据集。

本发明实施例提供的虚拟数据集包含2000个学习者在50道学习资源上依次作答的记录，共有100000条学习数据，且设置这50道学习资源包含5个知识点；

本发明实施例提供的真实C语言数据集包含93名学习者在36道C语言练习题上依次作答的记录，共有3348条学习数据，且这36道C语言练习题包含12个知识点。

步骤1.2.2：设置虚拟数据集和真实C语言数据集的学习资源-作答反应矩阵R和学习资源-知识点矩阵Q。

虚拟数据集:

真实C语言数据集:

步骤1.3：以学习资源-作答反应矩阵和学习资源-知识点矩阵为基础，引入认知诊断模型，估计基于认知诊断模型的失误和猜测参数，进而从参数可解释性层面增加了模型的可解释性。步骤1.3进一步包括：

步骤1.3.1：初始化学习者的知识状态α，再结合学习资源-知识点矩阵Q，获得学习者在学习资源上的理想作答情况；

本发明实施例提供的理想作答情况为当学习者掌握了回答该学习资源所需的全部知识点，则作答正确，否则作答错误。具体公式为：

其中N表示学习资源包含的知识点数

步骤1.3.2：依据学习资源-作答反应矩阵R和理想作答矩阵η形式化定义失误参数s和猜测参数g，从而得到学习资源-作答反应矩阵R的概率模型；

s＝P(R＝0|η＝1)

g＝P(R＝1|η＝0)

P(α)＝P(R＝1|α)＝g^(1-η)·(1-s)^η

步骤1.3.3：引入认知诊断模型DINA，得到DINA模型的总似然函数；

步骤1.3.4：使用极大似然函数估计学习者的知识状态，使用EM算法估计失误参数和猜测参数，从而得到基于认知诊断模型的失误参数s和猜测参数g。其中EM算法估计失误参数和猜测参数的算法过程如表1所示。

表1使用EM算法估计失误参数s和猜测参数g的算法过程

步骤1.3.5：融入了失误参数和猜测参数，更好地模拟了学习者的真实学习情况，从参数层面增加了模型的可解释性。

(2)分别创建存储了学习者作答学习资源潜在知识点的键矩阵以及存储了对这些潜在知识点的掌握状态的值矩阵，并从键矩阵获取学习者作答的学习资源所相关的知识点，从值矩阵读取学习者在相关知识点上的掌握情况，从而获得包含学习者对潜在知识点的总体掌握状态的特征向量；具体包括：

步骤2.1：创建存储了学习者作答学习资源潜在知识点的键矩阵以及存储了对这些潜在知识点的掌握状态的值矩阵；

本发明实施例提供的键矩阵为

其用N个键槽存储了学习资源潜在的知识点；

本发明实施例提供的值矩阵为KC^v＝(KC^v(1),...,KC^v(i),...,KC^v(N))，其含有N个值槽，动态存储了学习者对这些知识点的掌握状态。

步骤2.2：将学习资源序列的嵌入矩阵向量表示k_t与值矩阵

做内积，并通过sigmoid函数进行激活，从而获取学习者作答的学习资源所相关的知识点及其权重；

w_t＝σ(k_tKC^k)

步骤2.3：结合获取的学习者作答的学习资源所相关的知识点及其权重，从值矩阵KC^v＝(KC^v(1),...,KC^v(i),...,KC^v(N))读取学习者在相关知识点上的掌握情况；

所述学习者在相关知识点上的掌握情况为

步骤2.4：将获取的学习者在相关知识点上的掌握情况进行加权求和，从而得到学习资源所包含的知识点的总体掌握状态；

步骤2.5：将学习资源所包含的知识点的总体掌握状态与学习资源序列的嵌入矩阵向量表示k_t连接，再通过Tanh函数进行激活，从而获得包含学习者对潜在知识点的总体掌握状态的特征向量。

(3)从特征向量中学习基于学习者的个性化失误参数和猜测参数，再以认知诊断理论为支撑，融入基于认知诊断模型的失误和猜测参数，获得新的特征向量，从而预测学习者在特定学习资源上的作答表现，一方面从参数可解释层面增加了模型的可解释性，一方面从预测结果可解释性层面增加了模型的可解释性，具体包括：

步骤3.1：从特征向量中学习基于学习者的个性化失误参数和猜测参数；

s′_t＝tanh(W₁F_t+b₁)

g′_t＝tanh(W₂F_t+b₂)

步骤3.2：以认知诊断理论为支撑，融入基于学习者的个性化失误参数s'和猜测参数g'以及基于认知诊断模型的失误参数s和猜测参数g，从而获得新的特征向量；

步骤3.3：依据获得的新的特征向量，将其通过sigmoid函数进行激活，从而预测学习者在特定学习资源上的作答表现；

步骤3.4：融入了认知诊断模型DINA估计的和神经网络学习的失误和猜测参数，在保证深度知识追踪模型预测性能的前提下，参照认知诊断理论，从学习者答题失误和猜测两个方面给予模型预测结果解释性。

(4)根据学习者与学习资源交互的交互序列的嵌入矩阵向量表示，并考虑学习者当前的知识状态，获取知识增长向量，再考虑学习者个性化的遗忘速率，获取学习者对知识点的遗忘程度以及记忆强化程度，从而综合更新学习者与学习资源交互后的知识状态，进而从知识状态更新可解释层面增加模型的可解释性，具体包括：

步骤4.1：考虑学习者当前的知识状态，将获得新的特征向量与学习者与学习资源交互的交互序列的嵌入矩阵向量表示V＝(v₁,v₂,...,v_t)进行融合，从而获取学习者在作答完学习资源之后的知识增长向量；

v′_t＝[v_t,F_t]

步骤4.2：获取学习资源所包含的全部知识点的知识增长向量，并将其根据值矩阵KC^v＝(KC^v(1),...,KC^v(i),...,KC^v(N))的值槽进行分割，从而将学习资源所包含的全部知识点的知识增长向量分布在所有记忆片段中。

本发明实施例提供的获取的学习资源所包含的全部知识点的知识增长向量为w_tv′_t。

本发明实施例提供的分割后的知识增长向量为(w_tv′_t(1),...,w_tv′_t(i),...,w_tv′_t(N))。

步骤4.3：将每个值槽分布的片段都作为LSTM模型的输入，从而获得学习者个性化的遗忘速率；

本发明实施例提供的某一个值槽中获得的学习者个性化的遗忘速率为LSTM(w_t(i)v′_t)。

步骤4.4：依据学习者个性化的遗忘速率，获取学习者答完学习资源后对知识点的遗忘程度，为学习者知识状态更新提供了一定的解释性；

本发明实施例提供的步骤4.4进一步包括：

步骤4.4.1：将某一个值槽分布的片段输入LSTM中，确定丢弃信息；

f_t(i)＝σ(W_f·[h_t-1,w(i)v']+b_f)

步骤4.4.2：确定待更新的信息；

m_t(i)＝σ(W_m·[h_t-1,w(i)v']+b_m)

步骤4.4.3：确定要更新的信息；

步骤4.4.4：根据丢弃的信息和待更新的信息更新状态；

步骤4.4.5：输出学习者个性化的遗忘速率。

g_t(i)＝σ(W_g·[h_t-1,w(i)v']+b_g)

h_t(i)＝g_t(i)·tanh(U_t)

步骤4.5：获取学习者答完学习资源后的记忆强化程度；

步骤4.6：根据学习者答完学习资源后的遗忘程度和记忆强化程度综合更新学习者与学习资源交互后的知识状态。

步骤4.7：定义损失函数，并使用Adma优化器对权值进行更新。

所述损失函数为真实输出和预测输出之间的二交叉熵，如下公式：

步骤4.8：在损失函数中添加正则化项l₁和l₂，使得知识认知水平挖掘模型的预测结果更加稳定。

L'＝L+λ₁l₁+λ₂l₂

其中，λ₁,λ₂为正则化项对应的系数。

本发明实施例提供的融合学习认知要素的可解释知识认知水平挖掘系统包括：

本发明实施例涉及的符号如下：

二、应用实施例。为了证明本发明的技术方案的创造性和技术价值，该部分是对权利要求技术方案进行具体产品上或相关技术上的应用实施例。

融合学习认知要素的可解释知识认知水平挖掘方法及系统具体包括：

(1)以学习者与学习资源的交互序列为基础，做学习资源序列的嵌入矩阵向量表示以及学习者与学习资源交互的交互序列的嵌入矩阵向量表示，并构建学习资源-作答反应矩阵和学习资源-知识点矩阵，从而估计基于认知诊断模型的失误和猜测参数，进而从参数可解释性层面增加了模型的可解释性；

(2)分别创建存储了学习者作答学习资源潜在知识点的键矩阵以及存储了对这些潜在知识点的掌握状态的值矩阵，并从键矩阵获取学习者作答的学习资源所相关的知识点，从值矩阵读取学习者在相关知识点上的掌握情况，从而获得包含学习者对潜在知识点的总体掌握状态的特征向量；

(3)从特征向量中学习基于学习者的个性化失误参数和猜测参数，再以认知诊断理论为支撑，融入基于认知诊断模型的失误和猜测参数，获得新的特征向量，从而预测学习者在特定学习资源上的作答表现，一方面从参数可解释层面增加了模型的可解释性，一方面从预测结果可解释性层面增加了模型的可解释性；

(4)根据学习者与学习资源交互的交互序列的嵌入矩阵向量表示，并考虑学习者当前的知识状态，获取知识增长向量，再考虑学习者个性化的遗忘速率，获取学习者对知识点的遗忘程度以及记忆强化程度，从而综合更新学习者与学习资源交互后的知识状态，进而从知识状态更新可解释层面增加模型的可解释性。

作为本发明优选实施例。以学习者与学习资源的交互序列为基础，做学习资源序列的嵌入矩阵向量表示以及学习者与学习资源交互的交互序列的嵌入矩阵向量表示，并构建学习资源-作答反应矩阵和学习资源-知识点矩阵，从而估计基于认知诊断模型的失误和猜测参数，进而从参数可解释性层面增加了模型的可解释性，具体包括：

步骤1.1：以学习者与学习资源的交互序列为基础，做学习资源序列的嵌入矩阵向量表示以及学习者与学习资源交互的交互序列的嵌入矩阵向量表示。步骤1.1进一步包括：

所述学习资源-作答反应矩阵为行为学习者作答的学习资源，列为学习者在学习资源上的作答反应的矩阵R；

所述学习资源-知识点矩阵为行为学习者作答的学习资源，列为学习资源对应的知识点的矩阵Q。

步骤1.2进一步包括：

步骤1.2.1：该实施例进行实验所用的数据集有两个，包括：虚拟数据集和真实C语言数据集。

所述虚拟数据集包含2000个学习者在50道学习资源上依次作答的记录，共有100000条学习数据，且设置这50道学习资源包含5个知识点；

所述真实C语言数据集包含93名学习者在36道C语言练习题上依次作答的记录，共有 3348条学习数据，且这36道C语言练习题包含12个知识点。

虚拟数据集:

真实C语言数据集:

所述理想作答情况为当学习者掌握了回答该学习资源所需的全部知识点，则作答正确，否则作答错误。具体公式为：

其中N表示学习资源包含的知识点数

s＝P(R＝0|η＝1)

g＝P(R＝1|η＝0)

P(α)＝P(R＝1|α)＝g^(1-η)·(1-s)^η

步骤1.3.4：使用极大似然函数估计学习者的知识状态，使用EM算法估计失误参数和猜测参数，从而得到基于认知诊断模型的失误参数s和猜测参数g。其中EM算法估计失误参数和猜测参数的算法过程如表2所示。

表2使用EM算法估计失误参数s和猜测参数g的算法过程

作为本发明优选实施例。分别创建存储了学习者作答学习资源潜在知识点的键矩阵以及存储了对这些潜在知识点的掌握状态的值矩阵，并从键矩阵获取学习者作答的学习资源所相关的知识点，从值矩阵读取学习者在相关知识点上的掌握情况，从而获得包含学习者对潜在知识点的总体掌握状态的特征向量，具体包括：

所述键矩阵为

其用N个键槽存储了学习资源潜在的知识点；

所述值矩阵为KC^v＝(KC^v(1),...,KC^v(i),...,KC^v(N))，其含有N个值槽，动态存储了学习者对这些知识点的掌握状态。

步骤2.2：将学习资源序列的嵌入矩阵向量表示k_t与值矩阵

w_t＝σ(k_tKC^k)

所述学习者在相关知识点上的掌握情况为

F_t＝Tanh(W₁ ^T[r_t,k_t]+b₁)

作为本发明优选实施例。从特征向量中学习基于学习者的个性化失误参数和猜测参数，再以认知诊断理论为支撑，融入基于认知诊断模型的失误和猜测参数，获得新的特征向量，从而预测学习者在特定学习资源上的作答表现，一方面从参数可解释层面增加了模型的可解释性，一方面从预测结果可解释性层面增加了模型的可解释性，具体包括：

s′_t＝tanh(W₁F_t+b₁)

g′_t＝tanh(W₂F_t+b₂)

作为本发明优选实施例。根据学习者与学习资源交互的交互序列的嵌入矩阵向量表示，并考虑学习者当前的知识状态，获取知识增长向量，再考虑学习者个性化的遗忘速率，获取学习者对知识点的遗忘程度以及记忆强化程度，从而综合更新学习者与学习资源交互后的知识状态，进而从知识状态更新可解释层面增加模型的可解释性，具体包括：

v′_t＝[v_t,F_t]

步骤4.2：获取学习资源所包含的全部知识点的知识增长向量，并将其根据值矩阵KC^v＝(KC^v(1),...,KC^v(i),...,KC^v(N))的值槽进行分割，从而将学习资源所包含的全部知识点的知识增长向量分布在所有记忆片段中。；

所述获取的学习资源所包含的全部知识点的知识增长向量为w_tv′_t。

所述分割后的知识增长向量为(w_tv′_t(1),...,w_tv′_t(i),...,w_tv′_t(N))。

所述某一个值槽中获得的学习者个性化的遗忘速率为LSTM(w_t(i)v′_t)。

步骤4.4进一步包括：

f_t(i)＝σ(W_f·[h_t-1,w(i)v']+b_f)

步骤4.4.2：确定待更新的信息；

m_t(i)＝σ(W_m·[h_t-1,w(i)v']+b_m)

步骤4.4.3：确定要更新的信息；

步骤4.4.4：根据丢弃的信息和待更新的信息更新状态；

步骤4.4.5：输出学习者个性化的遗忘速率。

g_t(i)＝σ(W_g·[h_t-1,w(i)v']+b_g)

h_t(i)＝g_t(i)·tanh(U_t)

步骤4.5：获取学习者答完学习资源后的记忆强化程度；

步骤4.7：定义损失函数，并使用Adma优化器对权值进行更新。

L'＝L+λ₁l₁+λ₂l₂

其中，λ₁,λ₂为正则化项对应的系数。

作为本发明的优选实施例。本发明实验过程中，主要开发环境为Windows 10，AMDRyzen Threadripper 2950X 16-Core Processor，32RAM，GTX 1080Ti graphics，Tensorflow1.9， Python3.5。训练时的实验超参数如表3所示。

表3训练时的实验参数

我们使用AUC和RMSE作为衡量模型预测性能的指标。AUC是在处理分类问题时被经常用到的可靠指标，处理时将学习者正确的回答作为正样本，学习者错误的回答作为负样本， AUC值越高说明预测更准确。RMSE用来衡量真实结果和预测结果之间的偏差，RMSE值越小代表着更好的预测性能。

我们将本方法与传统知识认知水平挖掘方法进行了比较。为了公平地进行比较，所有这些方法都被调整为具有最佳性能，一种融合学习认知要素的可解释知识认知水平挖掘方法与传统知识认知水平挖掘方法在虚拟数据集和真实C语言数据集下的AUC、RMSE对比结果如表4所示，模型在虚拟数据集和真实C语言数据集上训练过程示意图如图4所示。

表4在虚拟数据集和真实C语言数据集上实验结果对比

由实验结果可知：本发明提出的融合学习认知要素的可解释知识认知水平挖掘方法比传统知识认知水平挖掘方法更有效。在虚拟数据集上，传统知识认知水平挖掘方法上考虑学习者当前知识状态的AUC比传统知识认知水平挖掘方法提高了约0.8％，RMSE下降了约0.003，在真实C语言数据集的实验同样表现出传统知识认知水平挖掘方法上考虑学习者当前知识状态的AUC比传统知识认知水平挖掘方法高，RMSE低。这表明，传统知识认知水平挖掘方法上考虑学习者当前知识状态模型通过考虑学习者当前的知识状态，有效地提高了模型的预测性能。本方法的AUC较传统知识认知水平挖掘方法提升了约2％，这表明本章提出的融合学习认知要素的可解释知识认知水平挖掘方法有效，且提高了模型在预测学习者表现方面的精确度。另外，我们还发现传统知识认知水平挖掘方法上融入失误和猜测认知要素和传统知识认知水平挖掘方法上融入失误、猜测和遗忘速率认知要素较传统知识认知水平挖掘方法在AUC 值上有所提高，在RMSE值上有所下降，这表明从不同的角度挖掘并融入学习者认知要素对学习者在学习过程中的知识状态变化追踪以及表现预测有影响。总之，本方法具有最佳的实验效果。

三、实施例相关效果的证据。本发明实施例在研发或者使用过程中取得了一些积极效果，和现有技术相比的确具备很大的优势，下面内容结合试验过程的数据、图表等进行描述。

本发明仿真实验过程中，主要开发环境为Windows 10，AMD Ryzen Threadripper2950X 16-Core Processor，32RAM，GTX 1080Ti graphics，Tensorflow1.9，Python3.5。训练时的实验超参数如表5所示。

表5训练时的实验参数

实验参数	虚拟数据集	真实C语言数据集
			batch_size	32	32
learning_rate	0.05	0.05
			epoch	300	300
memory size	5	5
			sequence length	50	36
dropout	0.2	0.2
			hidden size(LSTM)	100	100

仿真实验使用AUC和RMSE作为衡量模型预测性能的指标。AUC是在处理分类问题时被经常用到的可靠指标，处理时将学习者正确的回答作为正样本，学习者错误的回答作为负样本，AUC值越高说明预测更准确。RMSE用来衡量真实结果和预测结果之间的偏差，RMSE值越小代表着更好的预测性能。

将本发明实施例与传统知识认知水平挖掘方法进行了比较。为了公平地进行比较，所有这些方法都被调整为具有最佳性能，一种融合学习认知要素的可解释知识认知水平挖掘方法与传统知识认知水平挖掘方法在虚拟数据集和真实C语言数据集下的AUC、RMSE对比结果如表3所示，模型在虚拟数据集和真实C语言数据集上训练过程示意图如图3、图4所示。

表6在虚拟数据集和真实C语言数据集上实验结果对比

由实验结果可知：本发明实施例提出的融合学习认知要素的可解释知识认知水平挖掘方法比传统知识认知水平挖掘方法更有效。在虚拟数据集上，传统知识认知水平挖掘方法上考虑学习者当前知识状态的AUC比传统知识认知水平挖掘方法提高了约0.8％，RMSE下降了约0.003，在真实C语言数据集的实验同样表现出传统知识认知水平挖掘方法上考虑学习者当前知识状态的AUC比传统知识认知水平挖掘方法高，RMSE低。这表明，传统知识认知水平挖掘方法上考虑学习者当前知识状态模型通过考虑学习者当前的知识状态，有效地提高了模型的预测性能。本发明实施例的AUC较传统知识认知水平挖掘方法提升了约2％，这表明本发明实施例提出的融合学习认知要素的可解释知识认知水平挖掘方法有效，且提高了模型在预测学习者表现方面的精确度。另外，本发明实施例还发现传统知识认知水平挖掘方法上融入失误和猜测认知要素和传统知识认知水平挖掘方法上融入失误、猜测和遗忘速率认知要素较传统知识认知水平挖掘方法在AUC值上有所提高，在RMSE值上有所下降，这表明从不同的角度挖掘并融入学习者认知要素对学习者在学习过程中的知识状态变化追踪以及表现预测有影响。总之，本发明实施例提供的融合学习认知要素的可解释知识认知水平挖掘方法具有最佳的实验效果。

应当注意，本发明的实施方式可以通过硬件、软件或者软件和硬件的结合来实现。硬件部分可以利用专用逻辑来实现；软件部分可以存储在存储器中，由适当的指令执行系统，例如微处理器或者专用设计硬件来执行。本领域的普通技术人员可以理解上述的设备和方法可以使用计算机可执行指令和/或包含在处理器控制代码中来实现，例如在诸如磁盘、CD或 DVD-ROM的载体介质、诸如只读存储器(固件)的可编程的存储器或者诸如光学或电子信号载体的数据载体上提供了这样的代码。本发明的设备及其模块可以由诸如超大规模集成电路或门阵列、诸如逻辑芯片、晶体管等的半导体、或者诸如现场可编程门阵列、可编程逻辑设备等的可编程硬件设备的硬件电路实现，也可以用由各种类型的处理器执行的软件实现，也可以由上述硬件电路和软件的结合例如固件来实现。

以上所述，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等，都应涵盖在本发明的保护范围之内。

Claims

1.一种融合学习认知要素的可解释知识认知水平挖掘方法，其特征在于，所述融合学习认知要素的可解释知识认知水平挖掘方法包括：

2.如权利要求1所述融合学习认知要素的可解释知识认知水平挖掘方法，其特征在于，所述步骤一包括：

(2)以学习者与学习资源的交互序列为基础，构建学习资源-作答反应矩阵和学习资源-知识点矩阵；所述学习资源-作答反应矩阵为行为学习者作答的学习资源，列为学习者在学习资源上的作答反应的矩阵；所述学习资源-知识点矩阵为行为学习者作答的学习资源，列为学习资源对应的知识点的矩阵；

其中，N表示学习资源包含的知识点数；

s＝P(R＝0|η＝1)

g＝P(R＝1|η＝0)

P(α)＝P(R＝1|α)＝g^(1-η)·(1-s)^η

(3.3)引入认知诊断模型DINA，得到DINA模型的总似然函数：

3.如权利要求1所述融合学习认知要素的可解释知识认知水平挖掘方法，其特征在于，所述步骤二包括：

所述值矩阵为KC^v＝(KC^v(1),...,KC^v(i),...,KC^v(N))；

2)将学习资源序列的嵌入矩阵向量表示k_t与值矩阵

4.如权利要求1所述融合学习认知要素的可解释知识认知水平挖掘方法，其特征在于，所述步骤三包括：

s′_t＝tanh(W₁F_t+b₁)

g′_t＝tanh(W₂F_t+b₂)

所述预测学习者在特定学习资源上的作答表现P_t公式如下：

P_t＝σ(W₃ ^TF_t”+b₃)。

5.如权利要求1所述融合学习认知要素的可解释知识认知水平挖掘方法，其特征在于，所述步骤四包括：

v′_t＝[v_t,F_t]；

(2)获取学习资源所包含的全部知识点的知识增长向量，并将所述学习资源所包含的全部知识点的知识增长向量分布在所有记忆片段中：获取学习资源所包含的全部知识点的知识增长向量为w_tv_t'，将所述知识增长向量根据值矩阵KC^v＝(KC^v(1),...,KC^v(i),...,KC^v(N))的值槽进行分割，得到分割后的知识增长向量(w_tv′_t(1),...,w_tv′_t(i),...,w_tv′_t(N))；

(3)将每个值槽分布的片段都作为LSTM模型的输入，获得学习者个性化的遗忘速率LSTM(w_t(i)v′_t)；

(5)获取学习者答完学习资源后的记忆强化程度α_t：α_t＝Tanh(W₃ ^Tv′_t+b₃)；

6.如权利要求5所述融合学习认知要素的可解释知识认知水平挖掘方法，其特征在于，所述步骤(4)中，依据学习者个性化的遗忘速率，获取学习者答完学习资源后对知识点的遗忘程度包括：

(4.1)将任一个值槽分布的片段输入LSTM中，确定丢弃信息：f_t(i)＝σ(W_f·[h_t-1,w(i)v']+b_f)；其中W表示权重系数；b表示相应偏置向量；

(4.2)确定待更新的信息：m_t(i)＝σ(W_m·[h_t-1,w(i)v']+b_m)；

(4.3)确定需更新的信息：

(4.4)根据丢弃的信息和待更新的信息更新状态：

(4.5)得到学习者个性化的遗忘速率：

其中，h_t(i)表示某一个值槽的记忆片段获取的遗忘程度。

7.一种实施如权利要求1-6任意一项所述融合学习认知要素的可解释知识认知水平挖掘方法的融合学习认知要素的可解释知识认知水平挖掘系统，其特征在于，所述融合学习认知要素的可解释知识认知水平挖掘系统包括：

8.一种计算机设备，其特征在于，所述计算机设备包括存储器和处理器，所述存储器存储有计算机程序，所述计算机程序被所述处理器执行时，使得所述处理器执行如权利要求1-6任意一项所述融合学习认知要素的可解释知识认知水平挖掘方法如下步骤：

9.一种计算机可读存储介质，存储有计算机程序，所述计算机程序被处理器执行时，使得所述处理器执行如权利要求1-6任意一项所述融合学习认知要素的可解释知识认知水平挖掘方法如下步骤：

10.一种信息数据处理终端，其特征在于，所述信息数据处理终端用于实现如权利要求7所述融合学习认知要素的可解释知识认知水平挖掘系统。