CN113591988A

CN113591988A - 知识认知结构分析方法、系统、计算机设备、介质、终端

Info

Publication number: CN113591988A
Application number: CN202110874755.4A
Authority: CN
Inventors: 王志锋; 熊莎莎; 左明章; 叶俊民; 田元; 闵秋莎; 罗恒; 夏丹; 董石; 姚璜
Original assignee: Central China Normal University
Current assignee: Central China Normal University
Priority date: 2021-07-30
Filing date: 2021-07-30
Publication date: 2021-11-02
Anticipated expiration: 2041-07-30
Also published as: CN113591988B

Abstract

本发明属于个性化学习技术领域，公开了一种知识认知结构分析方法、系统、计算机设备、介质、终端，以学习者的学习交互序列为基础，得到联合先验特征；设计分层卷积神经网络对学习者学习状态进行空间分析，提取包含学习者个性化学习能力的空间特征；输出学习者在给定异构特征下对练习的反应情况，构建学习过程中影响学习者知识认知结构及表现的学习者时空融合特征；引入双向门循环单元，构建基于长时间依赖和融合时空特征的知识认知结构分析模型去动态诊断学习者的知识认知结构，预测学习者的学习表现。本发明有利于提高知识认知结构分析模型在预测学习者在特定资源下的学习表现方面的预测精度，对个性化教学的发展具有一定的借鉴意义。

Description

知识认知结构分析方法、系统、计算机设备、介质、终端

技术领域

本发明属于个性化学习技术领域，尤其涉及一种知识认知结构分析方法、系统、计算机设备、介质、终端。

背景技术

目前，随着在线教学技术和教育信息化的发展，各类e-learning系统，例如Coursera、Edx、Khan Academy、MOOC等大规模开放的在线开放课程平台、智能辅导系统、计算机辅助教育系统等等逐渐普及。但无论是线下教学模式还是线上教学方案，都会受到有限的教育资源的制约，导致教育者无法提供个性化的教学指导，学习者也无法获得个性化的学习服务。于是，人们试图通过人工智能技术来填补这项服务的空缺，作为人工智能在教育领域发展的分支的教育大数据应用使得智慧教学、个性化学习得到支持。

知识认知结构分析就是实现个性化学习指导的技术之一，其利用在线学习系统产生的大量来自学习者学习轨迹的功能丰富的数据，自动追踪学习者的知识水平随时间的变化过程，从而估计学习者掌握所需知识认知结构的学习进度，进而对学习者在特定资源的学习表现进行准确预测。目前，较为主流的知识认知结构分析方法有基于概率图的知识认知结构分析方法以及基于深度学习的知识认知结构分析方法。基于概率图的知识认知结构分析方法因模型简单、预测结果较为良好且具可解释性而被广泛应用。但基于概率图的知识认知结构分析方法也有其不足之处：1)学习者知识认知结构表征不足；2)过度依赖教育专家对教学场景的理解；3)不能建模学习者长期学习的时序依赖。自深度学习发展依赖，基于深度学习的知识认知结构分析方法逐渐进入大众视野，也被研究学者证明其在学习者表现预测以及知识认知结构分析方面具有优越性。基于深度学习的知识认知结构分析方法不仅学习者表现预测表现优良，还打破了知识之间的独立性，并且因深度学习算法的引入能更好地表征学习者的知识认知结构。但是不可否认的是，基于深度学习的知识认知结构分析方法也存在许多不足，例如基于深度学习的知识认知结构分析方法只将学习者作答练习以及学习者作答反应作为输入，忽略了学习者学习过程中其他影响学习者知识认知结构及表现的学习者特征以及资源特征，这样是不符合学习者实际的学习场景。由于已有研究已经证明基于深度学习的知识认知结构分析方法在学习者知识认知结构分析以及预测学习者在特征资源下的学习表现方面明显由于基于概率图的知识认知结构分析，因此以下讨论的传统知识认知结构分析方法即为基于深度学习的知识认知结构分析方法。

通过上述分析，现有技术存在的问题及缺陷为：

(1)传统知识认知结构分析方法忽略了学习者学习过程中其他影响学习者知识认知结构及表现的学习因素，这样无法表征学习者真实的学习场景，也会导致学习者表现预测不准确。

(2)传统知识认知结构分析方法表征方法单一，这些单一特征表达的深度知识追踪模型缺乏对影响学习表现信息的多方面考虑，导致模型在分析学习者知识认知结构时不够准确。

(3)传统知识认知结构分析方法在预测学习者知识认知结构的时候结果不够稳定，而学习者知识认知结构的变化过程应该是较为稳定的。

(4)传统知识认知结构分析方法虽然采用了LSTM建模学习者交互序列，但当学习者与练习的交互序列过长时，还是会出现梯度消失和梯度爆炸问题，从而导致学习者表现预测不准确。

解决以上问题及缺陷的难度为：

(1)如何能够在考虑到影响学习者知识认知结构及表现的学习因素的同时又能给予模型较良好的初始化；

(2)如何从不同维度表征学习者知识认知结构，又使得特征得到充分的表达。

(3)如何解决知识认知结构分析模型的预测结果较为波动的问题。

(4)如何使得知识认知结构分析方法模型能够建模具有较长的学习者交互序列，且不会出现梯度消失和梯度爆炸的情况。

解决以上问题及缺陷的意义为：

(1)本发明充分利用了在线学习平台中丰富的学习者特征以及资源特征，能更好地表征学习者的学习过程；

(2)本发明能更好地对学习者知识认知结构进行诊断，对学习者在特定资源下的表现进行更精准地预测，也为知识认知结构分析领域发展提供了新的思路，助力该领域发展。

(3)本发明提出的一种基于学习状态时-空表征的知识认知结构分析方法来动态诊断学习者知识认知结构并预测学习者表现。对学习者来说，能使自己更加清晰地掌握自身知识认知结构，认识到自己的知识盲区，从而查漏补缺，规划学习，提高学习效率，促进个性化学习地开展；对教师来说，能更好地了解学习者学习状态、知识认知结构，以调整教学策略，并根据学习者的薄弱环节因材施教，从而提升教学效率和教学质量。同时教师可以根据对学习者进行针对性学习反馈，制定学习方案，指导学习者个性化需求等，从而提高教学效果；对于教育管理者来说，有助于进行更有针对性的教学干预，帮助教师优化教学，同时优化教育管理；对科研工作者来说，能更好地修正知识认知结构分析原理，完善知识认知结构分析模型，助推领域发展。

发明内容

针对现有技术存在的问题，本发明提供了一种知识认知结构分析方法及系统、计算机设备、介质、终端，尤其涉及一种基于学习状态时-空表征的知识认知结构分析方法及系统。

本发明是这样实现的，一种知识认知结构分析方法，所述知识认知结构分析方法包括以下步骤：

步骤一，以学习者的学习交互序列为基础，从历史相关绩效和练习正确率的角度建模学习者个性化先验知识，得到包含个性化先验知识的联合先验特征；

步骤二，设计分层卷积神经网络对学习者学习状态进行空间分析，并利用选通线性单元控制学习者知识状态的遗忘情况，在捕获学习者个性化学习率的同时，提取包含学习者个性化学习能力的空间特征；

步骤三，通过系列融合量化操作联合随机森林算法输出的学习者在给定异构特征下对练习的反应情况的预分类特征、包含个性化学习能力的空间特征以及原始输入特征，从时间和空间两个不同维度构建学习过程中影响学习者知识认知结构及表现的学习者时空融合特征；

步骤四，引入双向门循环单元，构建基于长时间依赖和融合时空特征的知识认知结构分析模型去动态诊断学习者的知识认知结构，并添加l₁和l₂正则化控制模型参数调整范围，最终预测学习者在特定资源下的学习表现。

进一步，步骤一中，所述以学习者的学习交互序列为基础，从历史相关绩效和练习正确率的角度建模学习者个性化先验知识，得到包含个性化先验知识的联合先验特征，包括：

(1)用嵌入矩阵表示学习者的学习交互序列；其中，所述嵌入矩阵的构造公式为：

其中，s_t是练习的嵌入矩阵表示；r_t表示学习者的真实作答反应情况；0是一个与s_t维度相同的全零向量，两者通过两种方式连接来反映学习者在练习上的作答正确与否。

用嵌入矩阵表示的学习者交互序列向量为：

F_LIS＝(x₁,x₂,...,x_t,...,x_n)；

其中，n表示学习者与练习有n次交互。

(2)基于学习者对相关练习的回答对当前练习的回答有显著影响的假设，获取历史相关绩效向量。

(3)计算练习正确率以衡量学习者对所有知识点的掌握程度，从而获得练习正确率向量；其中，所述计算练习正确率公式为：

其中，m∈(1,M)，M表示知识点个数；s^m表示与知识点m有关的练习，total(s^m)表示已经回答练习s^m的次数；

表示正确回答练习s^m的次数。

(4)将用嵌入矩阵表示的学习者交互序列向量、历史相关绩效向量、练习正确率向量连接起来，得到联合先验特征，并使其通过GLU机制，从而获得包含个性化先验知识的联合先验特征向量；其中，所述连接方法为：

其中，W₁,W₂,b₁,b₂表示要学习的参数，W₁,W₂是权重参数，b₁,b₂为相应的偏置参数；σ为sigmoid激活函数。

步骤(2)中，所述获取历史相关绩效向量，包括：

1)学习者当前回答的练习与之前回答的练习之间的相似度评估；其中，所述相似度评估方式为：

relation_t(j)＝Masking(s_j·s_t),j∈(t,n)；

其中，s_j为先前回答的练习；s_t为当前回答的练习；Masking是将不相关的练习设置为-∞的操作。

2)学习者当前回答的练习与之前回答的练习之间的相关系数计算；其中，所述相关系数计算公式为：

weight_t(j)＝Softmax(relation_t(j)),j∈(1,n)。

3)历史相关绩效为所有历史学习交互的加权总和；其中，所述加权总和方法为：

进一步，步骤二中，所述设计分层卷积神经网络对学习者学习状态进行空间分析，并利用选通线性单元控制学习者知识状态的遗忘情况，在捕获学习者个性化学习率的同时，提取包含学习者个性化学习能力的空间特征，包括：

(1)将包含个性化先验知识的联合先验特征向量输入到一维卷积层中，并通过将滑动窗口的后半部分设置为0的方式屏蔽后续学习交互的干扰；

F_Conv＝Conv(F_ILA)。

(2)对卷积层的输出实现简单的选通线性单元，控制学习者学习过程中的知识是否遗忘，同时捕获学习者个性化学习率；

F_Conv-GLU＝GLU(Conv(F_ILA))。

(3)在卷积层的输入和输出之间添加剩余连接，优化模型结构；

F_re＝GLU(Conv(F_ILA))+F_ILA。

(4)将多个相同的卷积层堆叠起来，设计成分层卷积，使得较低层捕获最近一段时间的学习速率，较高的层可以监视更远的范围；

F_mConv＝{GLU(Conv(F_ILA))+F_ILA}_z；

其中，z代表有z个相同的卷积层。

(5)提取包含学习者个性化学习能力的空间特征：

F_sf＝σ({GLU(Conv(F_ILA))+F_ILA}_m)。

进一步，步骤三中，所述通过系列融合量化操作联合随机森林算法输出的学习者在给定异构特征下对练习的反应情况的预分类特征、包含个性化学习能力的空间特征以及原始输入特征，从时间和空间两个不同维度构建学习过程中影响学习者知识认知结构及表现的学习者时空融合特征，包括：

(1)从学习者与练习的交互序列中获取学习者练习交互特征；其中，所述学习者练习交互特征包括包含学习者个人信息、行为信息、认知信息的学习者特征以及包含资源文本信息、挖掘信息的资源特征。

(2)从学习者练习交互特征种提取正确性特征以及知识点特征，从而组成原始输入特征。

(3)使用随机森林算法获得学习者在给定异构特征下对练习的反应情况的预分类特征。

(4)通过一系列融合量化操作联合预分类特征、包含个性化学习能力的空间特征以及原始输入特征，从而时间和空间两个维度构建学习过程中影响学习者知识认知结构及表现的学习者时空融合特征。

进一步，步骤(2)中，所述提取正确性特征以及知识点特征，从而组成原始输入特征，包括：

2.1)选择学习者练习交互特征中学习者在练习上的反应情况作为正确性特征，其属于包含学习者行为信息的学习者特征；

2.2)选择学习者练习交互特征中练习包含的知识点作为知识点特征，其属于包含资源文文本信息的资源特征；

2.3)将正确性特征以及知识点特征进行交叉特征处理，形成原始输入特征；其中，交叉特征公式如下：

C(q_t,r_t)＝q_t+(max(q)+1)*r_t；

其中，q_t表示t时刻学习者所答知识点，r_t表示t时刻学习者是否回答正确，max(q)表示在所有知识点特征的数据中的最大值，C(·)表示交叉特征。

步骤(3)中，所述使用随机森林算法获得学习者在给定异构特征下对练习的反应情况的预分类特征，包括：

3.1)输入学习者的在练习上的交互数据D，随机从中选取部分D'(D＞D')不作为一棵决策树的构建；

3.2)使用Gini指数来选择划分特征，并选择使得划分后Gini指数最小的特征作为最优划分特征，最终生成一棵决策树；其中，所述划分特征公式如下：

a_*＝arg min Gini_index(D,a)；

其中，p_k表示第k类样本所占比例，V表示特征a有V种取值；

3.3)重复步骤3.1)和步骤3.2)，并生成多颗决策树，同时预测学习者在练习上的作答情况；

3.4)整合每棵决策树的预测结果，将最多的预测结果作为整个随机森林最后预测学习者在练习上的作答情况，即预分类特征。

步骤(4)中，所述系列融合量化操作，包括：

4.1)设定阈值，将提取的包含学习者个性化学习能力的空间特征转化为二分类特征；

4.2)分别将包含学习者个性化学习能力的空间特征、预分类特征与知识点特征进行交叉特征处理，从而形成空间联合特征、预分类联合特征；

4.3)将原始输入特征、空间联合特征和预分类联合特征分别采用One-Hot编码形成具有固定长度的特征，再将三者串联，从而形成学习者时空融合特征。

进一步，步骤四中，所述引入双向门循环单元，构建基于长时间依赖和融合时空特征的知识认知结构分析模型去动态诊断学习者的知识认知结构，添加l₁和l₂正则化控制模型参数调整范围，最终预测学习者在特定资源下的学习表现，包括：

(1)将学习者时空融合特征输入到双向门循环单元模型中，获得学习者潜在的知识认知结构以及学习者每一时刻的作答表现概率。

(2)预测t+1时刻学习者的作答反应r′_t+1；其中，所述作答反应计算为：

r′_t+1＝σ(p_t)。

(3)根据预测反应与真实反应，定义损失函数L；其中，所述损失函数定义为：

(4)添加l₁和l₂正则化控制模型参数调整范围，并对预测结果进行平滑处理，从而得到新的损失函数L'；其中，所述l₁和l₂正则化定义为：

所述新的损失函数为：

L'＝L+λ₁l₁+λ₂l₂；

其中，λ₁,λ₂为两个l₁和l₂正则化的系数。

(5)使用随机梯度下降法对权值进行更新。

步骤(1)中，所述将学习者时空融合特征输入到双向门循环单元模型中，获得学习者潜在的知识认知结构以及学习者每一时刻的作答表现概率包括：

1)将学习者时空融合特征输入到第一层门循环单元模型，通过获取控制重置信息的门控状态以及控制更新信息的门控状态，使用重置门控从长时信息里提取局部信息，更新长时信息，得到学习者知识认知结构；其中，所述获取控制重置信息的门控状态以及控制更新信息的门控状态公式如下：

f＝σ(W_r·[h_t-1,x_t])

g＝σ(W_g·[h_t-1,x_t])；

所述通过使用重置门控从长时信息里提取局部信息公式如下：

h′_t-1＝h_t-1⊙f

h'＝tanh(W_h'·[x_t,h′_t-1])；

所述更新长时信息并输出学习者知识认知结构信息公式如下：

其中，W_r,W_g,W_h'为权值矩阵，tanh为激活函数。

2)将学习者时空融合特征输入第二层门循环单元模型，与步骤1)同理，只不过t时刻学习者的知识认知结构和t+1时刻有关，同理即可得到第二层门循环单元模型输出的学习者知识认知结构

3)基于得到的两层门循环单元模型输出的学习者知识认知结构得到学习者最终潜在的知识认知结构以及在特定资源下作答表现概率；其中，所述学习者最终潜在的知识认知结构以及在特定资源下作答表现概率为：

p_t＝W_hyh_t+b_hy；

其中，W_hy为权值矩阵，b_hy为相应的偏置向量。

本发明的另一目的在于提供一种应用所述的知识认知结构分析方法的知识认知结构分析系统，所述知识认知结构分析系统包括：

个性化先验知识建模模块，用于以学习者的学习交互序列为基础，从历史相关绩效和练习正确率两个角度建模学习者个性化的先验知识，从而得到包含个性化先验知识的联合先验特征；

学习状态空间分析模块，用于利用设计的分层卷积神经网络对包含个性化先验知识的联合先验特征进行学习者学习状态空间分析，从而提取包含学习者个性化学习能力的空间特征；

学习者时空融合特征构建模块，用于通过系列融合量化操作联合随机森林算法输出的学习者在给定异构特征下对练习的反应情况的预分类特征、包含个性化学习能力的空间特征以及原始输入特征，从时间和空间两个不同维度构建学习过程中影响学习者知识认知结构及表现的学习者时空融合特征；

基于Bi-GRU的知识认知结构分析模型构建模块，用于构建基于长时间依赖和融合时空特征的知识认知结构分析模型去动态诊断学习者的知识认知结构，并添加l₁和l₂正则化控制模型参数调整范围，最终准确而稳定地预测学习者在特定资源下的学习表现。

本发明的另一目的在于提供一种计算机设备，所述计算机设备包括存储器和处理器，所述存储器存储有计算机程序，所述计算机程序被所述处理器执行时，使得所述处理器执行如下步骤：

以学习者的学习交互序列为基础，从历史相关绩效和练习正确率的角度建模学习者个性化先验知识，得到包含个性化先验知识的联合先验特征；设计分层卷积神经网络对学习者学习状态进行空间分析，并利用选通线性单元控制学习者知识状态的遗忘情况，在捕获学习者个性化学习率的同时，提取包含学习者个性化学习能力的空间特征；

通过系列融合量化操作联合随机森林算法输出的学习者在给定异构特征下对练习的反应情况的预分类特征、包含个性化学习能力的空间特征以及原始输入特征，从时间和空间两个不同维度构建学习过程中影响学习者知识认知结构及表现的学习者时空融合特征；

引入双向门循环单元，构建基于长时间依赖和融合时空特征的知识认知结构分析模型去动态诊断学习者的知识认知结构，并添加l₁和l₂正则化控制模型参数调整范围，最终预测学习者在特定资源下的学习表现。

本发明的另一目的在于提供一种计算机可读存储介质，存储有计算机程序，所述计算机程序被处理器执行时，使得所述处理器执行如下步骤：

本发明的另一目的在于提供一种信息数据处理终端，所述信息数据处理终端用于实现所述的知识认知结构分析系统。

结合上述的所有技术方案，本发明所具备的优点及积极效果为：本发明提供的知识认知结构分析方法，以学习者的学习交互序列为基础，从历史相关绩效和练习正确率两个角度建模学习者个性化的先验知识，从而得到包含个性化先验知识的联合先验特征；设计分层卷积神经网络对学习者学习状态进行空间分析，并利用选通线性单元控制学习者知识状态的遗忘情况，在捕获学习者个性化学习率的同时，提取包含学习者个性化学习能力的空间特征；通过一系列融合量化操作联合随机森林算法输出的学习者在给定异构特征下对练习的反应情况的预分类特征、包含个性化学习能力的空间特征以及原始输入特征，从而从时间和空间两个不同维度构建学习过程中影响学习者知识认知结构及表现的学习者时空融合特征；创造性地引入双向门循环单元，构建基于长时间依赖和融合时空特征的知识认知结构分析模型去动态诊断学习者的知识认知结构，并添加l₁和l₂正则化控制模型参数调整范围，最终准确而稳定地预测学习者在特定资源下的学习表现。本发明有利于提高知识认知结构分析模型在预测学习者在特定资源下的学习表现方面的预测精度，对个性化教学的发展有一定意义，也为知识认知结构分析领域提供了新的发展思路。

本发明利用随机森林算法处理学习过程中影响学习者知识认知结构及表现的学习者特征及资源特征形成预分类特征，不仅追踪了学习者真实的学习过程，还能给予后续模型更良好的初始化。本发明考虑了知识点之间的先验关系，从而更好地表征学习者的学习过程。

本发明设计了分层卷积神经网络，提取了学习者交互序列中学习者个性化的学习率，从空间维度构建了包含学习者个性化学习能力的空间特征；还从时序维度构建了包含学习者特征以及资源特征的时序特征，并将空间特征与时序特征融合，再将融合的特征输入到Bi-GRU模型中动态诊断学习者知识认知结构，从而解决了深度知识追踪单一表征问题，使得模型在分析学习者知识认知结构时更加准确。

本发明利用在训练模型时添加l₁和l₂正则化，使得模型预测结果更加稳定，模型参数范围更加合理。本发明采用Bi-GRU建模学习者交互序列，能更好地建模更长的学习者交互序列，利用交互序列中更多的信息，也能解决模型训练时梯度消失和梯度爆炸问题。本发明能利用在线学习平台中丰富的学习者特征以及资源特征，也能更好地表征学习者的学习过程。

本发明对学习者来说，能使自己更加清晰地掌握自身知识结构，认识到自己的知识盲区，从而查漏补缺，规划学习，提高学习效率，促进个性化学习地开展；对教师来说，能更好地了解学习者学习状态、知识水平，以调整教学策略，并根据学习者的薄弱环节因材施教，从而提升教学效率和教学质量。同时教师可以根据对学习者进行针对性学习反馈，制定学习方案，指导学习者个性化需求等，从而提高教学效果；对于教育管理者来说，有助于进行更有针对性的教学干预，帮助教师优化教学，同时优化教育管理；对科研工作者来说，能更好地修正知识追踪原理，完善知识追踪模型，助推领域发展。

本发明也能更好地对学习者知识认知结构进行诊断，对学习者表现进行更精准地预测，也为知识追踪领域发展提供了新的思路，助力该领域发展。本发明可以应用于资源推荐、知识图谱、个性化教学等领域，帮助在线平台推荐更合适的学习序列以及进一步发现交互数据中知识的潜在依赖关系，从而提高学习者的学习效率。

本发明提出的基于学习状态时-空表征的知识认知结构分析方法从不同维度深度表征学习学习过程及学习者知识认知结构，并构建基于长时间时序依赖的知识认知结构分析模型去动态诊断学习者知识掌握状态以及预测学习者在特定资源下的学习表现，预测性能明显优于基于其他知识认知结构分析方法，实验表明在AUC和R²等方面，本发明提出的，方法比其他知识掌握建模方法更有效。

本发明将基于学习状态时-空表征的知识认知结构分析方法与其他知识认知结构分析方法进行对比，对比指标曲线下面积AUC和皮尔逊相关系数的平方R²。AUC和R²为学习者表现预测评估提供了可靠的指标，0.5的AUC值代表随机可获得的得分，较高的AUC分数代表预测结果越准确。R²是隐变量真实值与预测值之间皮尔逊相关系数的平方，其值越大，表示预测结果越准确。

将本发明方法与传统知识认知结构分析方法进行了比较。为了公平地进行比较，所有这些方法都被调整为具有最佳性能，一种基于学习状态时-空表征的知识认知结构分析方法与传统知识认知结构分析方法在数据集ASSIST和数据集SSAI下的AUC、R²对比结果如表5、图4和表6、图5所示，模型在数据集ASSIST和数据集SSAI上训练过程示意图如图6、图7所示。

表5数据集ASSIST实验结果对比

表6数据集SSAI实验结果对比

由实验结果可知，本发明提出的基于学习状态时-空表征的知识认知结构分析方法在数据集ASSIST和数据集SSAI上，AUC提升了19％和25.6％，R²提升了0.711和0.5257。说明本发明考虑更多影响学习者知识认知结构及表现的学习者特征以及资源特征、从时序和空间两个维度融合更多特征能更好地表征学习者真实的学习过程，并且使用Bi-GRU能更好地建模学习者较长交互序列，从而更精准地预测学习者的表现。本发明提出的基于学习状态时-空表征的知识认知结构分析方法融合了多种学习因素，从多种角度表征学习者知识认知结构，并构建了基于长时间依赖的知识认知结构分析模型动态诊断学习者知识认知结构以及预测学习者在特定资源下的学习表现，预测结果明显优于传统知识认知结构分析方法，甚至在数据集ASSIST上预测结果几乎接近真实。实验表明在AUC和R²等方面，本发明提出的基于学习状态时-空表征的知识认知结构分析方法比传统知识认知结构分析方法更有效，总之，本方法具有最佳的实验效果。

综上，本发明提供的基于学习状态时-空表征的知识认知结构分析方法及系统实现了更为精准的学习者表现预测，该方法以学习者的学习交互序列为基础，从历史相关绩效和练习正确率两个角度建模学习者个性化的先验知识，并设计分层卷积神经网络对学习者学习状态进行空间分析，从而提取包含学习者个性化学习能力的空间特征。另外，利用随机森林算法预分类学习者在给定学习者特征及资源特征下对练习的反应情况，并将其与空间特征与原始输入特征联合，从而时序和空间两个维度构建影响学习者知识认知结构及表现的学习者时空融合特征。最终引入双向门循环单元，构建基于长时间依赖和融合时空特征的知识认知结构分析模型去动态诊断学习者的知识认知结构，并添加l₁和l₂正则化平滑预测结果，从而准确而稳定地预测学习者在特定资源下的学习表现，也更好地表征学习者的学习过程及知识认知结构。对学习者来说，能更好地进行知识认知结构预测和有针对性的学习。该方法可以应用于资源推荐、知识图谱、个性化教学等领域，帮助在线平台推荐更合适的学习序列以及进一步发现交互数据中知识的潜在依赖关系，从而提高学习者的学习效率。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对本发明实施例中所需要使用的附图做简单的介绍，显而易见地，下面所描述的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下还可以根据这些附图获得其他的附图。

图1是本发明实施例提供的知识认知结构分析方法流程图。

图2是本发明实施例提供的知识认知结构分析方法原理图。

图3是本发明实施例提供的知识认知结构分析系统结构示意图；

图中：1、个性化先验知识建模模块；2、学习状态空间分析模块；3、学习者时空融合特征构建模块；4、基于Bi-GRU的知识认知结构分析模型构建模块。

图4是本发明实施例提供的数据集ASSIST实验结果对比示意图。

图5是本发明实施例提供的数据集SSAI实验结果对比示意图。

图6是本发明实施例提供的模型在数据集ASSIST上训练过程示意图。

图7是本发明实施例提供的模型在数据集SSAI上训练过程示意图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

针对现有技术存在的问题，本发明提供了一种知识认知结构分析方法及系统，下面结合附图对本发明作详细的描述。

如图1所示，本发明实施例提供的知识认知结构分析方法包括以下步骤：

S101，以学习者的学习交互序列为基础，从历史相关绩效和练习正确率的角度建模学习者个性化的先验知识，得到包含个性化先验知识的联合先验特征；

S102，设计分层卷积神经网络对学习者学习状态进行空间分析，并利用选通线性单元控制学习者知识状态的遗忘情况，在捕获学习者个性化学习率的同时，提取包含学习者个性化学习能力的空间特征；

S103，通过系列融合量化操作联合随机森林算法输出的学习者在给定异构特征下对练习的反应情况的预分类特征、包含个性化学习能力的空间特征以及原始输入特征，从而从时间和空间两个不同维度构建学习过程中影响学习者知识认知结构及表现的学习者时空融合特征；

S104，引入双向门循环单元，构建基于长时间依赖和融合时空特征的知识认知结构分析模型去动态诊断学习者的知识认知结构，并添加l₁和l₂正则化控制模型参数调整范围，最终预测学习者在特定资源下的学习表现。

本发明实施例提供的知识认知结构分析方法原理图如图2所示。

如图3所示，本发明实施例提供的知识认知结构分析系统包括：

个性化先验知识建模模块1，用于以学习者的学习交互序列为基础，从历史相关绩效和练习正确率两个角度建模学习者个性化的先验知识，从而得到包含个性化先验知识的联合先验特征；

学习状态空间分析模块2，用于利用设计的分层卷积神经网络对包含个性化先验知识的联合先验特征进行学习者学习状态空间分析，从而提取包含学习者个性化学习能力的空间特征；

学习者时空融合特征构建模块3，用于通过一系列融合量化操作联合随机森林算法输出的学习者在给定异构特征下对练习的反应情况的预分类特征、包含个性化学习能力的空间特征以及原始输入特征，从时间和空间两个不同维度构建学习过程中影响学习者知识认知结构及表现的学习者时空融合特征；

基于Bi-GRU的知识认知结构分析模型构建模块4，用于构建基于长时间依赖和融合时空特征的知识认知结构分析模型去动态诊断学习者的知识认知结构，并添加l₁和l₂正则化控制模型参数调整范围，最终准确而稳定地预测学习者在特定资源下的学习表现。

下面结合符号解释对本发明的技术方案作进一步描述。

本发明涉及的符号如表1所示。

表1本发明涉及的符号

下面结合具体实施例对本发明的技术方案作进一步描述。

实施例1

本发明实施例提供的基于学习状态时-空表征的知识认知结构分析方法具体包括：

(1)以学习者的学习交互序列为基础，从历史相关绩效和练习正确率两个角度建模学习者个性化的先验知识，从而得到包含个性化先验知识的联合先验特征；

(2)设计分层卷积神经网络对学习者学习状态进行空间分析，并利用选通线性单元控制学习者知识状态的遗忘情况，在捕获学习者个性化学习率的同时，提取包含学习者个性化学习能力的空间特征；

(3)通过一系列融合量化操作联合随机森林算法输出的学习者在给定异构特征下对练习的反应情况的预分类特征、包含个性化学习能力的空间特征以及原始输入特征，从而从时间和空间两个不同维度构建学习过程中影响学习者知识认知结构及表现的学习者时空融合特征；

(4)创造性地引入双向门循环单元，构建基于长时间依赖和融合时空特征的知识认知结构分析模型去动态诊断学习者的知识认知结构，并添加l₁和l₂正则化控制模型参数调整范围，最终准确而稳定地预测学习者在特定资源下的学习表现。

作为本发明优选实施例。以学习者的学习交互序列为基础，从历史相关绩效和练习正确率两个角度建模学习者个性化的先验知识，从而得到包含个性化先验知识的联合先验特征，具体包括：

步骤1.1：用嵌入矩阵表示学习者的学习交互序列，避免了编码后的向量不具备高维性和稀疏性，也有助于网络学习练习之间的关系。步骤1.1进一步包括：

步骤1.1.1：将学习者交互的练习用嵌入矩阵s_t表示；

步骤1.1.2：将学习者作答情况扩展到一个零向量，并与练习的嵌入矩阵s_t通过两种方式连接，连接方式的选择取决于学习者在练习上的作答情况。具体如下公式：

步骤1.1.3：用嵌入矩阵表示学习者交互序列向量，具体如下：

F_LIS＝(x₁,x₂,...,x_t,...,x_n)

其中n表示学习者与练习有n次交互。

步骤1.2：基于学习者对相关练习的回答对当前练习的回答有显著影响的假设，获取历史相关绩效向量。步骤1.2进一步包括：

步骤1.2.1：评估学习者当前回答的练习与之前回答的练习之间的相似度，相似度评估方式为：

relation_t(j)＝Masking(s_j·s_t),j∈(t,n)

其中s_j为先前回答的练习；s_t为当前回答的练习；Masking是将不相关的练习设置为-∞的操作。

步骤1.2.2：计算学习者当前回答的练习与之前回答的练习之间的相关系数。计算公式为：

weight_t(j)＝Softmax(relation_t(j)),j∈(1,n)

步骤1.2.3：将所有历史学习交互的加权总和，即可得到历史相关绩效。加权总和方法如下：

步骤1.3：计算练习正确率以衡量学习者对所有知识点的掌握程度，从而获得练习正确率向量。计算练习正确率公式为：

其中m∈(1,M)，M表示知识点个数；s^m表示与知识点m有关的练习，total(s^m)表示已经回答练习s^m的次数；

表示正确回答练习s^m的次数。

步骤1.4：将用嵌入矩阵表示的学习者交互序列向量、历史相关绩效向量、练习正确率向量连接起来，得到联合先验特征，并使其通过GLU机制，从而获得包含个性化先验知识的联合先验特征向量。连接方法具体如下公式：

W₁,W₂,b₁,b₂表示要学习的参数，W₁,W₂是权重参数，b₁,b₂为相应的偏置参数；σ为sigmoid激活函数。

作为本发明优选实施例。设计分层卷积神经网络对学习者学习状态进行空间分析，并利用选通线性单元控制学习者知识状态的遗忘情况，在捕获学习者个性化学习率的同时，提取包含学习者个性化学习能力的空间特征，具体包括：

步骤2.1：将包含个性化先验知识的联合先验特征向量输入到一维卷积层中，并通过将滑动窗口的后半部分设置为0的方式屏蔽后续学习交互的干扰。

F_Conv＝Conv(F_ILA)

步骤2.2：对卷积层的输出实现简单的选通线性单元，控制学习者学习过程中的知识是否遗忘，同时捕获学习者个性化学习率；

F_Conv-GLU＝GLU(Conv(F_ILA))

步骤2.3：在卷积层的输入和输出之间添加剩余连接，优化模型结构；

F_re＝GLU(Conv(F_ILA))+F_ILA

步骤2.4：将多个相同的卷积层堆叠起来，设计成分层卷积，使得较低层捕获最近一段时间的学习速率，较高的层可以监视更远的范围；

F_mConv＝{GLU(Conv(F_ILA))+F_ILA}_z

其中z代表有z个相同的卷积层。

步骤2.5：提取包含学习者个性化学习能力的空间特征。

F_sf＝σ({GLU(Conv(F_ILA))+F_ILA}_m)

作为本发明优选实施例。通过一系列融合量化操作联合随机森林算法输出的学习者在给定异构特征下对练习的反应情况的预分类特征、包含个性化学习能力的空间特征以及原始输入特征，从而从时间和空间两个不同维度构建学习过程中影响学习者知识认知结构及表现的学习者时空融合特征，具体包括：

步骤3.1：从学习者与练习的交互序列中获取学习者练习交互特征。学习者练习交互特征包括包含学习者个人信息、行为信息、认知信息的学习者特征以及包含资源文本信息、挖掘信息的资源特征。

步骤3.2：从学习者练习交互特征种提取正确性特征以及知识点特征，从而组成原始输入特征。步骤3.2进一步包括：

步骤3.2.1：选择学习者练习交互特征中学习者在练习上的反应情况作为正确性特征，其属于包含学习者行为信息的学习者特征；

步骤3.2.2：选择学习者练习交互特征中练习包含的知识点作为知识点特征，其属于包含资源文文本信息的资源特征；

步骤3.2.3：将正确性特征以及知识点特征进行交叉特征处理，形成原始输入特征。交叉特征公式如下：

C(q_t,r_t)＝q_t+(max(q)+1)*r_t

其中，q_t表示t时刻学习者所答知识点，r_t表示t时刻学习者是否回答正确，max(q)表示在所有知识点特征的数据中的最大值，C(·)表示交叉特征；

步骤3.3：使用随机森林算法获得学习者在给定异构特征下对练习的反应情况的预分类特征。步骤3.3进一步包括：

步骤3.3.1：从在线学习平台收集学习者与练习的交互数据，并分别组成数据集ASSIST和数据SSAI，其中数据集A来自ASSISTments学习系统，数据集S来自松鼠AI智适应平台。数据集ASSIST和数据集SSAI包含的交互数、知识点数、学生数如表2所示。

表2数据集ASSIST和数据集SSAI的相关信息

步骤3.3.2：分别从数据集ASSIST和数据集SSAI选择一些影响学习者知识认知结构及表现的学习者特征及资源特征，选择的特征如表3所示。

表3数据集ASSIST和数据集SSAI中所选择的特征

步骤3.3.3：将选择的所有异构特征输入学习者的在练习上的交互数据D，随机从中选取部分D'(D＞D')不作为一棵决策树的构建。

步骤3.3.4：使用Gini指数来选择划分特征，并选择使得划分后Gini指数最小的特征作为最优划分特征，最终生成一棵决策树，划分特征公式如下：

a_*＝arg min Gini_index(D,a)

p_k表示第k类样本所占比例，V表示特征a有V种取值。

步骤3.3.5：重复步骤(3.3.3)和(3.3.4)，并生成多颗决策树，同时预测学习者在练习上的作答情况；

步骤3.3.6：整合每棵决策树的预测结果，将最多的预测结果作为整个随机森林最后预测学习者在练习上的作答情况，即预分类特征。

步骤3.4：通过一系列融合量化操作联合预分类特征、包含个性化学习能力的空间特征以及原始输入特征，从而时间和空间两个维度构建学习过程中影响学习者知识认知结构及表现的学习者时空融合特征。步骤3.4进一步包括：

步骤3.4.1：设定阈值，将提取的包含学习者个性化学习能力的空间特征转化为二分类特征；

步骤3.4.2：分别将包含学习者个性化学习能力的空间特征、预分类特征与知识点特征进行交叉特征处理，从而形成空间联合特征、预分类联合特征；

步骤3.4.3：将原始输入特征、空间联合特征、预分类联合特征分别采用One-Hot编码形成具有固定长度的特征，再将三者串联起来，从而形成学习者时空融合特征。

作为本发明优选实施例。创造性地引入双向门循环单元，构建基于长时间依赖和融合时空特征的知识认知结构分析模型去动态诊断学习者的知识认知结构，并添加l₁和l₂正则化控制模型参数调整范围，最终准确而稳定地预测学习者在特定资源下的学习表现，具体包括：

步骤4.1：将学习者时空融合特征输入到双向门循环单元模型中，获得学习者潜在的知识认知结构以及学习者每一时刻的作答表现概率。步骤4.1进一步包括：

步骤4.1.1：将学习者时空融合特征输入到第一层门循环单元模型，通过获取控制重置信息的门控状态以及控制更新信息的门控状态，使用重置门控从长时信息里提取局部信息，更新长时信息，得到学习者知识认知结构。

获取控制重置信息的门控状态以及控制更新信息的门控状态公式如下：

f＝σ(W_r·[h_t-1,x_t])

g＝σ(W_g·[h_t-1,x_t])

通过使用重置门控从长时信息里提取局部信息的公式如下：

h′_t-1＝h_t-1⊙f

h'＝tanh(W_h'·[x_t,h′_t-1])

更新长时信息并输出学习者知识认知结构信息的公式如下：

其中W_r,W_g,W_h'为权值矩阵，tanh为激活函数。

步骤4.1.2：基于得到的两层门循环单元模型输出的学习者知识认知结构得到学习者最终潜在的知识认知结构以及在特定资源下作答表现概率。学习者最终潜在的知识认知结构以及在特定资源下作答表现概率为：

p_t＝W_hyh_t+b_hy

其中W_hy为权值矩阵，b_hy为相应的偏置向量。

步骤4.2：预测t+1时刻学习者的作答反应r′_t+1，作答反应计算如下：

r′_t+1＝σ(p_t)

步骤4.3：根据预测反应与真实反应，定义损失函数L，损失函数定义为：

步骤4.4：添加l₁和l₂正则化控制模型参数调整范围，并对预测结果进行平滑处理，从而得到新的损失函数L'。l₁和l₂正则化定义为：

新的损失函数为：

L'＝L+λ₁l₁+λ₂l₂

λ₁,λ₂为两个l₁和l₂正则化的系数。

步骤4.5：使用随机梯度下降法对权值进行更新。本发明实验中模型的超参数设置如表4所示。

表4数据集ASSIST和SSAI实验超参数设置

超参数	数据集ASSIST	数据集SSAI
			num_step	383	75
batch_size	50	50
			epoch	50	50
dropout	0.8	0.8
			learning rate	0.003	0.003
hidden size	100	100
			filter	100	100
kernel_size	6	6

除此之外，实验开发平台使用了Tensorflow框架，一系列机器学习库以及集成了众多python包的Anaconda。在模型构建、预分类、训练模型和结果可视化等环节上都使用了Python进行编译和实现。

将本发明方法与传统知识认知结构分析方法进行了比较。为了公平地进行比较，所有这些方法都被调整为具有最佳性能，一种基于学习状态时-空表征的知识认知结构分析方法与传统知识认知结构分析方法在数据集ASSIST和数据集SSAI下的AUC、R²对比结果如表5、图4、表6和图5所示，模型在数据集ASSIST和数据集SSAI上训练过程示意图如图6、图7所示。

表5数据集ASSIST实验结果对比

表6数据集SSAI实验结果对比

在上述实施例中，可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用全部或部分地以计算机程序产品的形式实现，所述计算机程序产品包括一个或多个计算机指令。在计算机上加载或执行所述计算机程序指令时，全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中，或者从一个计算机可读存储介质向另一个计算机可读存储介质传输，例如，所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL)或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输)。所述计算机可读取存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质，(例如，软盘、硬盘、磁带)、光介质(例如，DVD)、或者半导体介质(例如固态硬盘SolidState Disk(SSD))等。

以上所述，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等，都应涵盖在本发明的保护范围之内。

Claims

1.一种知识认知结构分析方法，其特征在于，所述知识认知结构分析方法包括以下步骤：

2.如权利要求1所述的知识认知结构分析方法，其特征在于，步骤一中，所述以学习者的学习交互序列为基础，从历史相关绩效和练习正确率的角度建模学习者个性化先验知识，得到包含个性化先验知识的联合先验特征，包括：

其中，s_t是练习的嵌入矩阵表示；r_t表示学习者的真实作答反应情况；0是一个与s_t维度相同的全零向量，两者通过两种方式连接来反映学习者在练习上的作答正确与否；

用嵌入矩阵表示的学习者交互序列向量为：

F_LIS＝(x₁,x₂,...,x_t,...,x_n)；

其中，n表示学习者与练习有n次交互；

(2)基于学习者对相关练习的回答对当前练习的回答有显著影响的假设，获取历史相关绩效向量；

表示正确回答练习s^m的次数；

(4)将用嵌入矩阵表示的学习者交互序列向量、历史相关绩效向量、练习正确率向量连接起来，得到联合先验特征，并使其通过GLU机制，从而获得包含个性化先验知识的联合先验特征向量；所述连接方法为：

其中，W₁,W₂,b₁,b₂表示要学习的参数，W₁,W₂是权重参数，b₁,b₂为相应的偏置参数；σ为sigmoid激活函数；

步骤(2)中，所述获取历史相关绩效向量，包括：

relation_t(j)＝Masking(s_j·s_t),j∈(t,n)；

其中，s_j为先前回答的练习；s_t为当前回答的练习；Masking是将不相关的练习设置为-∞的操作；

weight_t(j)＝Softmax(relation_t(j)),j∈(1,n)；

3.如权利要求1所述的知识认知结构分析方法，其特征在于，步骤二中，所述设计分层卷积神经网络对学习者学习状态进行空间分析，并利用选通线性单元控制学习者知识状态的遗忘情况，在捕获学习者个性化学习率的同时，提取包含学习者个性化学习能力的空间特征，包括：

F_Conv＝Conv(F_ILA)；

F_Conv-GLU＝GLU(Conv(F_ILA))；

F_re＝GLU(Conv(F_ILA))+F_ILA；

F_mConv＝{GLU(Conv(F_ILA))+F_ILA}_z；

其中，z代表有z个相同的卷积层；

(5)提取包含学习者个性化学习能力的空间特征：

F_sf＝σ({GLU(Conv(F_ILA))+F_ILA}_m)。

4.如权利要求1所述的知识认知结构分析方法，其特征在于，步骤三中，所述通过系列融合量化操作联合随机森林算法输出的学习者在给定异构特征下对练习的反应情况的预分类特征、包含个性化学习能力的空间特征以及原始输入特征，从时间和空间两个不同维度构建学习过程中影响学习者知识认知结构及表现的学习者时空融合特征，包括：

(1)从学习者与练习的交互序列中获取学习者练习交互特征；其中，所述学习者练习交互特征包括包含学习者个人信息、行为信息、认知信息的学习者特征以及包含资源文本信息、挖掘信息的资源特征；

(2)从学习者练习交互特征种提取正确性特征以及知识点特征，从而组成原始输入特征；

(3)使用随机森林算法获得学习者在给定异构特征下对练习的反应情况的预分类特征；

5.如权利要求4所述的知识认知结构分析方法，其特征在于，步骤(2)中，所述提取正确性特征以及知识点特征，从而组成原始输入特征，包括：

C(q_t,r_t)＝q_t+(max(q)+1)*r_t；