CN117828184A

CN117828184A - 一种考虑学习交互方式的自适应学习推荐方法及系统

Info

Publication number: CN117828184A
Application number: CN202311873693.0A
Authority: CN
Inventors: 盖伟; 王雯菲; 臧晨宇; 李曼祎; 刘浩; 杨承磊
Original assignee: Shandong University
Current assignee: Shandong University
Priority date: 2023-12-29
Filing date: 2023-12-29
Publication date: 2024-04-05

Abstract

本发明属于自适应学习领域，提供了一种考虑学习交互方式的自适应学习推荐方法及系统，其技术方案为获取用户特征数据和学习交互界面特征数据；基于用户特征数据和学习交互界面特征数据，结合训练后的学习交互界面推荐模型为用户推荐最佳学习交互界面；结合IRT模型，获取用户在最佳学习交互界面的学习模拟数据集；基于学习模拟数据集，结合训练后的深度知识追踪模型进行预测，根据预测结果为用户推荐相应的个性化学习内容。不仅有助于提高内容推荐算法的准确性，还能够为学生提供更具个性化和贴近实际需求的学习体验。

Description

一种考虑学习交互方式的自适应学习推荐方法及系统

技术领域

本发明属于自适应学习领域，尤其涉及一种考虑学习交互方式的自适应学习推荐方法及系统。

背景技术

本部分的陈述仅仅是提供了与本发明相关的背景技术信息，不必然构成在先技术。

随着信息技术的飞速发展，自适应学习成为教育领域的研究和实践的热点。自适应学习通过根据学生的兴趣、能力和学习风格提供定制化的学习体验，旨在最大程度地激发学生的学习潜力。在这一背景下，学习内容的个性化推荐算法应运而生，为学生提供了根据其个体差异进行定制的教育资源。

传统的个性化内容推荐方法采用的方法包括：Corbett等人提出了一种模拟学生在技能习得过程中知识状态变化的方法，被称为贝叶斯知识追踪(BKT)，其是通过将学习者的潜在知识状态建模为一组二元变量来实现，每个变量代表对单个概念的理解或不理解，核心在于应用隐马尔可夫模型(Hidden Markov Model，HMM)。当学习者回答给定习题集中的练习时，无论是正确还是错误，隐马尔可夫模型(HMM)都用于更新这些二元变量中每一个的概率，从学习者的练习表现出发，该模型推断学习者的知识掌握程度。Yudelson等人提出在标准的BKT实现中，只有特定于技能的参数，当考虑到数据中学生特定的可变性时，如学习者的先验知识，可以提高模型的准确性。Piech等人首次提出了使用递归神经网络(RNN)来模拟学生学习的效果，RNN不需要对人类领域知识进行显式编码，并且可以捕获学习者知识的更复杂的表示，Piech等人提出的DKT模型可以找出知识点之间的关联性，且更适合处理时间序列的问题。DKT取得了很好的结果。但是DKT模型有个问题是，不能很好的处理稀疏数据，因此Pandey等人提出了SAKT模型，首次将google提出的transformer模型对学生做题序列进行建模，很好地处理了数据稀疏的问题。

发明人发现，上述的个性化内容推荐方法均忽略了学生在学习中的交互方式，事实上，学生的学习不仅仅是知识的吸收和记忆，还涉及他们与学习环境的互动，目前的内容推荐主要基于学科兴趣、学习历史等静态因素进行推荐，忽略了学生在学习过程中采用的不同交互方式，导致推荐结果的不准确以及个性化程度不足。

发明内容

为了解决上述背景技术中存在的至少一项技术问题，本发明提供一种考虑学习交互方式的自适应学习推荐方法及系统，其考虑了学生在学习中的交互方式对内容推荐的影响，通过强化学习提高交互的精确度，能全面考虑学生交互的各项因素，不仅有助于提高内容推荐算法的准确性，还能够为学生提供更具个性化和贴近实际需求的学习体验。

为了实现上述目的，本发明采用如下技术方案：

本发明的第一方面提供一种考虑学习交互方式的自适应学习推荐方法，包括如下步骤：

获取用户特征数据和学习交互界面特征数据；

基于用户特征数据和学习交互界面特征数据，结合训练后的学习交互界面推荐模型为用户推荐最佳学习交互界面；

结合IRT模型，获取用户在最佳学习交互界面的学习模拟数据集；

基于学习模拟数据集，结合训练后的深度知识追踪模型进行预测，根据预测结果为用户推荐相应的个性化学习内容。

本发明的第二方面提供一种考虑学习交互方式的自适应学习推荐系统，包括：

数据获取模块，其用于获取用户特征数据和学习交互界面特征数据；

交互界面推荐模块，其用于基于用户特征数据和学习交互界面特征数据，结合训练后的学习交互界面推荐模型为用户推荐最佳学习交互界面；

模拟数据集获取模块，其用于结合IRT模型，获取用户在最佳学习交互界面的学习模拟数据集；

内容推荐模块，其用于基于学习模拟数据集，结合训练后的深度知识追踪模型进行预测，根据预测结果为用户推荐相应的个性化学习内容。

本发明的第三方面提供一种计算机可读存储介质。

一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现如第一方面所述的一种考虑学习交互方式的自适应学习推荐方法中的步骤。

本发明的第四方面提供一种计算机设备。

一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现如第一方面所述的一种考虑学习交互方式的自适应学习推荐方法中的步骤。

与现有技术相比，本发明的有益效果是：

本发明考虑不同的交互方式可能会对学生的学习体验和效果产生显著影响，通过对支持脚运动的交互方式进行研究，探索了脚交互的交互方式在学习内容推荐中的作用，将学生在学习中的交互方式与个性化推荐算法结合起来，分析了学生在学习中的交互方式对内容推荐的影响，能全面考虑学生交互的各项因素，不仅有助于提高内容推荐算法的准确性，还能够为学生提供更具个性化和贴近实际需求的学习体验。

本发明附加方面的优点将在下面的描述中部分给出，部分将从下面的描述中变得明显，或通过本发明的实践了解到。

附图说明

构成本发明的一部分的说明书附图用来提供对本发明的进一步理解，本发明的示意性实施例及其说明用于解释本发明，并不构成对本发明的不当限定。

图1是本发明实施例提供的一种考虑学习交互方式的自适应学习推荐方法流程图；

图2是本发明实施例提供的学习交互界面推荐方法流程图；

图3是本发明实施例提供的深度知识追踪方法流程图；

图4是本发明实施例提供的用户整体交互具体流程图；

图5是本发明实施例提供的界面元素分布示意图；

图6是本发明实施例提供的界面元素坐标示意图；

图7是本发明实施例提供的界面设计相关变量示意图；

图8是本发明实施例提供的系统整体架构示意图；

图9是本发明实施例提供的一种考虑学习交互方式的自适应学习推荐架构图；

图10是本发明实施例提供的界面不同元素大小示意图；

图11是本发明实施例提供的脚长与元素对应关系示意图；其中，图11中(a)为脚长大于选择元素长度示意图，图11中(b)为脚长等于选择元素长度示意图，图11中(c)为脚长小于选择元素长度示意图；

图12是本发明实施例提供的FFM模型架构示意图；

图13是本发明实施例提供的界面元素不同形状示意图；

图14是本发明实施例提供的知识追踪模型序列嵌入表示学习示意图，其中，图14中(a)为交互序列嵌入表示学习示意图，图14中(b)为练习序列嵌入表示学习示意图；

图15是本发明实施例提供的知识追踪模型核心架构示意图。

具体实施方式

下面结合附图与实施例对本发明作进一步说明。

应该指出，以下详细说明都是例示性的，旨在对本发明提供进一步的说明。除非另有指明，本文使用的所有技术和科学术语具有与本发明所属技术领域的普通技术人员通常理解的相同含义。

需要注意的是，这里所使用的术语仅是为了描述具体实施方式，而非意图限制根据本发明的示例性实施方式。如在这里所使用的，除非上下文另外明确指出，否则单数形式也意图包括复数形式，此外，还应当理解的是，当在本说明书中使用术语“包含”和/或“包括”时，其指明存在特征、步骤、操作、器件、组件和/或它们的组合。

术语解释

1、知识追踪(Knowledge Tracking，KT)：

知识追踪的任务是对学生的知识状态进行建模，以便准确预测学生未来互动的表现。简而言之，通过分析学生的历史做题序列数据，能够推断出学生当前的知识水平以及题目的特性，从而实现对学生在题目上表现的预测。知识追踪模型的综合分类有两大类：(1)传统知识追踪模型；(2)深度学习知识追踪模型。传统知识追踪模型包括贝叶斯知识追踪以及因素分析模型，如项目反应理论(IRT)，加性因子模型(AFM)，绩效因素分析(PFA)等，传统模型通常依赖于人工定义的交互函数，如IRT模型，其中包括学生的能力参数和题目的难度、区分度以及猜测性参数。

近年来，出现了一些改进模型，例如Liu提出的NeuralCD模型，它摆脱了对人工定义的交互函数的依赖。然而，这些模型在许多情况下仍更适用于对学生历史做题数据的测评，而难以实现动态追踪，面临着冷启动问题。冷启动问题涉及在缺乏足够历史数据时，如何有效地对新的学生或新的题目进行预测。传统方法的局限性在于其固定的参数设置，无法灵活地适应学生知识状态的动态变化。因此需要寻找更灵活、动态的模型，以便更好地应对学生学习过程中的个体差异和变化。

Piech等人首次成功将深度学习引入知识追踪领域，这一创新显著提升了知识追踪模型的性能，为后续的研究奠定了基础。随后，出现了许多改进的深度知识追踪模型，如记忆增强知识追踪模型(键值记忆网络(KVMN)，动态键值存储网络(DKVMN)，顺序键值存储网络(SKVMN))，注意力知识追踪模型(自我关注知识追踪(SAKT)，细心知识追踪(AKT)，分离自注意力神经知识追踪(SAINT)，知识追踪的关系感知自我注意(RKT)，卷积知识追踪(CKT)，协同知识追踪(CoKT))，基于图的知识追踪模型(基于图的知识追踪(GKT)，基于图形的交互知识追踪(GIKT)，基于结构的知识追踪(SKT)，通过二分预训练嵌入图(PEBG))，文本感知知识追踪模型(运动增强型循环神经网络(EERNN)，运动感知知识追踪(EKT)，适应性知识追踪(AdaptKT))，遗忘意识知识追踪模型(深度知识追踪(DKT+)，知识熟练度追踪(KPT)，深度图记忆网络(DGMN)，学习过程一致的知识追踪(LPKT))，这些模型的引入标志着知识追踪领域由传统的基于统计方法的模型向深度学习方法的转变。

深度知识追踪模型的突出特点是其能够动态追踪学生的知识状态。与以往只能对测评数据进行静态诊断的模型相比，深度知识追踪模型更适用于当前多变的测评场景。通过对学生的历史做题序列数据进行深度学习分析，这些模型能够捕捉学生知识状态的动态演变，实现更精准、实时的评估。相较于传统方法，深度知识追踪模型的优势在于其能够自动地学习复杂的知识状态变化和学习轨迹。这为个性化学习提供了更为灵活的可能性，因为模型能够更好地适应不同学生的学习风格和速度，为教育实践提供更为智能的支持。

2、自注意力机制(Self-Attention Mechanism)

自注意力机制是一种用于处理序列数据的注意力机制，这种注意力机制允许模型在处理序列数据时动态地关注序列中不同位置的信息，其核心思想是在输入序列中的每个位置上分配一个权重，用于计算该位置对其他所有位置的贡献，然后将这些贡献加权求和，以获得当前位置的上下文表示。这使得模型能够在不同的位置上分配不同的注意力权重，更灵活地捕捉输入序列中的长程依赖关系。神经网络接收许多大小不同的向量作为输入，这些向量之间存在一定关联，然而在实际训练过程中，模型难以充分利用这些输入之间的关系，从而导致模型的训练效果极差。针对全连接神经网络对于多个相关的输入无法建立起相关性的这个问题，通过自注意力机制来解决，自注意力机制实际上是想让机器注意到整个输入中不同部分之间的相关性。

在自注意力机制中，通常涉及查询(Query)、键(Key)和值(Value)这三个概念，通常简写为Q、K和V。这三者被用来计算注意力权重，进而加权求和得到输出。

下面是自注意力机制中Q、K和V的计算过程：

查询(Query)计算：

对于输入序列中的每个元素，通过一个线性变换(通常是一个全连接层)将其映射为查询向量Q。如果输入序列的维度为d，那么查询向量的维度通常也是d，Q＝X·W^Q，其中，X是输入序列，W^Q是查询权重矩阵。

键(Key)计算：

同样地，对于输入序列中的每个元素，通过一个线性变换将其映射为键向量K，K＝X·W^K，其中，W^K是键权重矩阵。

值(Value)计算：

对于输入序列中的每个元素，通过一个线性变换将其映射为值向量V，V＝X·W^V，其中，W^V是值权重矩阵。

计算注意力权重：

利用查询向量Q和键向量K计算注意力权重。通常使用点积(dot product)或其他类似的方法，然后通过softmax函数进行归一化：其中，d_K是查询或键的维度。

计算加权和：

使用注意力权重对值向量V进行加权求和，得到最终的自注意力输出。O＝Attention(Q,K)·V。

自注意力机制中的Q、K和V所使用的权重矩阵是通过训练学习得到的参数。这种机制允许模型在处理序列数据时对不同位置的信息分配不同的注意力权重，从而更好地捕捉长距离依赖关系。

3、残差连接(Residual Connection)

残差连接是深度学习中一种常用的连接方式，它的提出主要是为了解决深层网络训练过程中的梯度消失和梯度爆炸问题，它被广泛应用于深度神经网络的设计中，特别是在深度残差网络(Residual Neural Networks，简称ResNet)中。在传统的神经网络中，每一层的输入都是上一层的输出，堆叠更多的层次可能导致网络性能的下降，主要是因为在反向传播的过程中，梯度会变得非常小，甚至消失，导致深层网络很难训练。在残差网络中，残差块引入了一个“跳跃连接”，将前一层的输入直接加到后一层的输出上，形成了残差。这样的连接方式有助于解决深度神经网络训练过程中的梯度消失或梯度爆炸等问题，使得网络更容易训练。

具体来说，残差连接的基本思想是通过将输入直接添加到网络的输出中，形成一个残差块。设输入为x，网络学习的映射为H(x)，则残差连接的输出为H(x)+x。这样，如果网络学到的映射H(x)接近于零，那么输出就近似于输入，从而避免了梯度消失的问题。如果网络能够学到一个有益的映射，那么残差块就起到了加速收敛的作用。这样的设计使得网络可以更轻松地学习恒等映射(identity mapping)，因为当网络不需要学习任何变换时，可以将残差设为零，从而不引入额外的复杂性。而当网络需要学习非线性映射时，残差可以提供一个捷径，避免梯度消失的问题。

4、位置编码

深度学习中的位置编码是一种用于处理序列数据的技术，在深度学习模型中，特别是注意力机制(attention mechanism)的模型中，位置编码被用来为输入序列中的每个位置提供一个独特的表示，以便模型能够捕捉序列中元素的相对位置信息。在Transformer模型中，位置编码是通过以下方式实现的：对于输入序列中的每个位置，都会为其分配一个独特的向量表示。这个位置向量会与输入的词嵌入(word embedding)相加，从而获得一个包含了位置信息的最终表示。这是因为在基本的词嵌入中，词与词之间是没有顺序关系的，而位置编码的引入可以使模型区分不同位置的词。位置编码的引入有助于模型更好地理解输入序列中元素的顺序信息，特别是在处理长序列时。

实施例一

如图1-图4所示，本实施例提供一种考虑学习交互方式的自适应学习推荐方法，包括如下步骤：

S101：利用格式塔心理学、尼尔森F视觉模型等美学规则，随机生成交互界面备选库；

包括如下步骤：

S1011：根据格式塔心理学设计原则将交互界面的设计元素分组，具体包括：

界面设计中遵循视觉设计中的相似原则(格式塔心理学)，其中一个重要的概念是相关元素，将从视觉角度以某种方式看起来相似的设计元素(共享相同的颜色、形状、大小或元素之间的距离)视为相同组，而将看起来不同的元素视为不同的组。

S1012：根据分组结果对交互界面进行区域划分，具体包括：

在用户界面设计方面，认定具有相似视觉特征的对象很可能是相关的，或者至少处于应该是相关的这一方向，遵循这一原则，将界面进行区域划分，划分为三块主要区域，在图5中展示的是描述区域、待选择区域以及用户初始位置区域。这三个区域在界面设计中各司其职，其中描述区域和待选择区域为主要区域，待选择区域不仅是设计中的关键区域，更是整体界面变化的主要区域。它不仅反映了用户输入和系统响应，还在很大程度上决定了用户体验的质量。

S1013：基于尼尔森F视觉模型将区域划分后的交互界面优化，得到交互界面第一优化结果。

本实施例特别关注并优化了这一区域的设计，以确保用户能够高效而愉悦地与系统进行交互。相同区域采用一致的图案，而不同的区域采用差异较大的图案。尼尔森F视觉模型指出，在没有副标题和项目符号的情况下，用户倾向于将单词集中在行首和页面顶部。这种扫描行为会产生类似于大写字母F的眼动模式。针对这项原则，在进行界面设计时，将描述区域和待选择区域置于初始位置区域之上，用户在每一轮答题的时候，需要站在初始位置区域点击开始按钮，题目和答案才会显现出来，因此将初始位置区域放置在最下层，保证用户题目和答案集中在页面顶部，这符合F型原则的用户眼动模式。

图5展示了地面答题系统用户界面的模块划分。主要包含三个模块，分别为描述区域模块(S1)，待选择区域模块(S2)，用户初始位置区域模块(S3)。每一轮答题之前，用户需要站在S3区域，踩亮开始按钮，触发题目和答案显示。用户在答题交互的过程中，主要在S1和S2两模块活动，因此找到S1和S2的最佳设计方案对于提高答题系统的用户答题脚部操作准确性至关重要。

根据F型规则的界面参数设置如下：S1,S2,S3区域中每一个元素都会有一个在屏幕上的坐标，图6展示界面元素坐标分布情况。S1中四个答案在屏幕的坐标分别为(X₁,Y₁)，(X₂,Y₂)，(C₃,Y₃)，(X₄,Y₄)，S2区域中题目的坐标位置为(X_t,Y_t)，S3区域中开始按钮的坐标位置为(X_k,Y_k)。存在的约束有：Y_k>Y₁、Y_k>Y_t，Y值约束S3必须在S1和S2的下面。

S1014：基于交互界面第一优化结果，结合接近度分组原则优化，得到交互界面第二优化结果；

接近度是最重要的分组原则之一，可以压倒相互竞争的其他无关视觉线索，例如颜色或者形状的相似性。在地面答题系统界面模块设计中，模块之间可以重叠，但是同一模块内部的元素不可被其他模块的元素分隔开。具体的界面参数设置上：描述区域和初始位置区域在四个答案的显示区域的同一侧；且要保证每一个界面四个答案的大小是相同的，确保四个答案在视觉上是一个整体。

S1015：基于交互界面第二优化结果，结合界面元素与人体俯视角之间的关系，优化得到交互界面第三优化结果；

呈现给用户使用的系统的操作界面被投影在地面上，使得用户以俯视的角度与系统进行互动。在这种情境下，需要特别关注界面元素与人体俯视角之间的关系。为了确保用户体验的舒适性和有效性，通过邀请测试人员参与，并根据测量的数据提供最小俯视角度值。通过收集测试数据，能够确定用户俯视的最小角度，并将其作为设计的基础。结合每个用户的身高信息，可以计算出题目和答案相对于用户俯视角的距离。这些数据将被用于设定题目和答案的位置，确保它们在投影到地面上时能为用户提供相对舒服且合适的俯视角度。

S1016：基于交互界面第三优化结果，结合设计变量对界面布局的影响进行优化，得到交互界面第四优化结果；

在实施例中设计变量的选择方面，通过深入用户调研的分析，得出结论认为选项大小、选项形状以及选项间距等七个变量对界面布局产生显著影响。因此，在实施例中，将这些关键设计变量优先考虑，并将它们纳入设计目标的首要考量范畴。如图7所示，设计变量的选择上出于对用户体验和界面可用性的考虑，从而确保最终的设计方案能够更好地满足用户的期望与需求。

通过S1011-S1016，随机生成10*3*3不同的用户界面作为界面库，其中界面元素大小分为三类，界面元素间距分为三类，相同大小和间距的界面有10个不同的位置布局，这些界面具有不同的答案大小，位置以及间距等，目标是利用算法，自动的为每个用户寻找出最适合他的界面，来达到一种自适应界面布局推荐的目的。

S102：基于交互界面备选库进行地面投影，为地面投影坐标与三维世界坐标建立映射关系，基于映射关系，追踪用户实时位置，计算得到交互结果；

本实施例中，此处的交互结果包括用户脚长步幅数据，用户性别，专业，年龄，家庭所在地等第一第二特征数据，还有答题误踩次数等一系列的数据，将其全部存入数据库中，之后结合数据库中的数据结合聚类算法，UCB算法和FFm算法，由这些算法计算出下一步需要推荐得界面推荐给用户。在具体实施中，参照图8，本实施例主要由服务器、位置跟踪设备和地面投影设备组成；

位置跟踪设备和地面投影设备处于同一个物理空间内；利用WPF框架搭建系统，界面在地面投影区域呈现，用户在地面投影区域中进行答题活动，位置跟踪设备捕获用户的特征信息，位置数据及交互响应数据，并上传至服务器，并实时追踪用户状态，服务器端通过相关位置变化计算出交互活动，通过WPF框架展示界面，利用地面投影设备展示相应的交互结果，同时数据同步至数据库中；

本实施例中，位置跟踪设备可以采用RGB-D相机。

如图9所示，用户在地面投影区域中观看地上投影的问题，随后进行回答。位置跟踪设备实时追踪用户位置并将数据传输至服务器，服务器计算互动结果及要进行推荐的问题和界面风格及元素，实时反馈至地面投影设备，使用户能在实际空间中移动身体以进行互动答题，当前答题结果会同步到数据库中，并影响后续推荐的问题和界面风格及元素。

S103：获取用户第一特征信息，结合用户第一特征信息进行聚类，基于得到的分类结果，从交互界面备选库中为用户推荐相应大小的界面元素；

其中，所述用户第一特征信息包括利用用户身高计算用户脚长和步幅。

在本实施例中，采集了多个用户的步长和脚长数据，并运用K-means聚类算法将这些数据分别分成三个不同的类别，代表三种不同的答案大小和答案间距。

如图10所示，这三个不同的答案大小反映了用户的脚长，而答案的间距则反映了用户的步幅。

在具体实施中，根据用户的脚长和步幅计算出每个用户所属聚类的数值。通过这一过程，将答题的用户划分为三个不同的类别，这有助于更准确地理解用户群体的特征和行为。

这种分类方法提供了一种有效的手段，可以根据用户的生理特征对其实施个性化的答题体验。通过深入了解用户的步长和脚长和元素大小间距的对应关系，能够更好地满足他们的需求，提供更贴近实际的测量结果，从而提高答题的准确性和用户满意度。这种个性化的方法为用户提供了更好的用户体验，同时也提供了更多关于用户行为和特征的有价值的信息。

本实施例中，待选择区域是地面答题系统界面变化的主要区域，也是直接影响用户体验的主要区域。基于不同身高的人的脚长不同，引入了界面元素大小这一设计变量。

如图11所示，图11中(a)为脚长大于选择元素长度示意图，图11中(b)为脚长等于选择元素长度示意图，图11中(c)为脚长小于选择元素长度示意图，过小的元素会被用户的脚长遮盖，从而影响用户的答题；而过大的元素又会造成界面设计空间的浪费，因此本实施例为不同脚长的用户推荐合适大小的界面元素，避免了因为答案大小与脚长大小的不匹配出现，脚过长遮盖答案或者答案过大导致界面空间浪费的问题。

基于上述考虑，将收集到的用户信息，即用户的脚长和用户的步幅，利用聚类方法分为三类，以脚长为例，脚长被分为三类，取每类的平均值，作为每一个类别下答案大小的参考值，尽量让答案的大小和脚的大小的契合度一致。将用户步幅也进行分类，分为三类，取每一类别的平均值作为答案之间间距的参考值。设置了三个大小不同的答案区域，分别是135*135,150*150，165*165，设置了三种不同的间距，分别是2200mm，2450mm，2700mm。

S104：利用用户第二特征(家庭所在地，专业，年龄，性别)，对用户进行聚类分析，将用户分为三类相似用户，为新用户推荐相似用户所喜欢的界面背景和界面元素形状，解决冷启动问题；

用于聚类的用户第二特征数据通过问卷调查形式收集，包括用户个人信息和对用户界面元素的评分两个部分。被测需首先填写个人信息(包括家庭所在地，专业，年龄，性别)，之后完成对“背景样式/元素形状”这两种用户界面元素的评价。最终的用户特征为用户的家庭所在地，专业，年龄，性别，即根据不同人的特征进行K-Means聚类分析，预测每一类人的界面评分情况，将每一类人的评分情况存入数据库中，当新用户到来时，为新用户找到相似特征用户，推荐相似用户喜欢的界面给新用户，解决冷启动问题。

S105：将用户第二特征及界面元素的形状和背景作为输入，结合训练后的Field-aware Factorization Machine(FFM)推荐模型，预测每一个界面的得分，根据得分为不同的用户推荐不同的背景和形状的界面；

在具体实施中，将设计元素方案定义为其中s_j为该方案的第j个特征，如元素形状对应的弧度值，背景图片样式所属编号等，然后，将用户/>对方案/>的评价表示为/>

整个推荐过程包括训练阶段和预测阶段两部分。

训练阶段：如图12所示，从数据库中查询参与设计元素方案评价的用户集合，获取相应信息并提取出用户特征集合U_train，用户对应的设计元素集合S_train以及用户对应设计元素的评分集合

将U_train中的每条用户特征与该用户对应的设计元素/>拼接为特征向量/>其对应的评价分数/>为该向量的标签，所有/>和/>组合成训练集D_train，送入模型训练，拟合后的模型可根据输入的用户特征拟合出该用户对设计元素方案域中任意元素的评分。

预测阶段：对于使用该系统的用户，只需要提供个人信息(新用户注册时，将信息存入数据库，只需从数据库获取个人信息)，系统将个人信息转化为用户特征并由模型拟合出评分，对评分排序后即可为用户推荐个性化的设计元素方案。

本实施例中，所述FFM在构建时，使用隐向量分解稀疏矩阵和加入特征交叉，定义如下式所示：

FFM将特征划分到不同的场当中，x_i的隐向量进一步变成了对应其交互对象x_j所在场的隐向量/>以此来解决不同特征交叉时的不同强度问题，使特征交互关系的刻画得更精细。

界面元素设计方案集合S_ui共包含16种，其中的设计方案的特征向量/> (背景编号4种，元素形状所对应的弧度值4种)，对应形状如图13所示。

收集到用户信息和对应评价后，将数据分为包含用户特征与不包含用户特征的两种：对于包含用户特征的数据，其特征向量由/>和/>拼接而成；对于不包含用户特征的数据，其特征向量/>即为/>数据集D＝(X,Y)由特征向量集合X和其对应的评分集合Y组成。

由于用户对设计元素的评价是用户偏好的体现，评价域应该体现出偏好的程度，本实施例的采用的是5分的Likert评量表(1-非常不喜欢，5-非常喜欢)。采取的方法是：对相同评分的方案随机进行50次排序，在每次排序后计算一次结果，最终结果为所有排序情况平均值。用这种方法减少了由排序带来的误差。

S106：将界面元素位置的推荐工作转化为多臂强盗求解的过程，借助UCB方法根据用户历史操作过程产生的记录求解，计算出界面元素最佳的位置；

具体步骤如下：

S1061：初始化答题场景空间中用户和地面投影区域的初始位置；

S1062：人脸识别程序会对用户的面部特征进行捕捉，与人脸库中数据对比，判断用户是否为新用户，如果为新用户，则跳转步骤S1063，否则跳转步骤S1064；

S1063：借助微软Kinect3.0得到用户的身高，根据用户身高计算出用户的脚长，使用K-Means算法将用户的脚长进行聚类计算，计算出与用户最佳匹配的界面元素的大小，在推荐界面中使用UCB1算法更新用户在该界面的误踩情况，为用户推荐最低误踩界面；

S1064：获取用户历史数据信息，将用户地面答题系统界面元素位置设计转化为一个多臂强盗问题的求解过程，结合用户历史数据信息求解为用户推荐最低误踩界面。

在本实施例中，将用户地面答题系统界面元素位置设计转化为一个多臂强盗问题的求解过程：每一种不同的界面设计都可以被视为老虎机的“手臂”，其中收益(如避免误操作次数)是未知的。用户在答题期间，使用UCB1算法计算收益，该算法乐观地面对不确定性，计算出不同界面的置信上限，将具有最高置信上限的界面推荐给当前用户。

算法思想为首先需要猜测各臂可能给出的收益，然后选择收益最高的臂，若实际的收益较少，算法会尽快地降低对该臂的猜测，反之，则尽量多选择该臂。此处的“猜测”，为对各臂的收益建立一个指数，通过动态调整这个指数，最终确定期望收益最高的臂。

对于一台拥有K个臂的老虎机，随机变量X_i,n,1≤i≤K,n≥1表示第i个臂在第n个回合产生的收益，第i个臂的收益期望有μ_i表示，即IE[X_i,n]＝μ_i,IE[.]表示收益，每个臂在每个回合产生的收益都是独立的。

策略A表示如何根据过去的动作和获取的收益来选择下一轮执行的臂，用T_i(n)表示根据策略A第i个臂在前n轮被选择的次数，将策略A的遗憾值定义如下：

遗憾值表示的是最优策略带来的收益和当前策略带来的收益之差。而这里的最优策略是已知每个臂的奖励分布情况下，每个回合中都一直选择收益最高的臂。

在本系统中设计多个不同的界面，每个界面相当于一个老虎机的手臂，借助UCB1算法计算奖励值的方法，实现界面跟随用户近期的答题行为进行变化。初步设计90个界面，通过设置界面中元素的位置，元素的大小，元素之间不同的距离来保证界面的不同。

用户在界面上的选择视为动作，其中，

At：第t次行动所选择的界面；

Rt：用户在这次选择的界面上的误踩到的次数(在停留到用户最终选择的答案之前踩到其他答案的次数)；

qt：最佳误踩次数，本实例中，最佳误踩次数为0次，即没有发生误踩的情况；

收益：将Rt与qt的差值(因为qt等于0所以差值就是Rt的值)利用softmax函数进行归一化处理，归一化后的值我们用b来表示，计算的目的是获取最小的b值，收益为1-b，力求收益达到最大。

所述将用户地面答题系统界面元素位置设计转化为一个多臂强盗问题的求解过程，结合用户历史数据信息求解为用户推荐最低误踩界面，包括：

1、初始化：μ1,μ2，μ3……μK(k是界面的个数)每个界面初始的误踩次数；

2、循环：(每答一次题，该公式就会更新一次)。其中uj是每个界面的平均误踩次数，t是包括初始化的次数以外的总次数(t>＝k)，nj是某个界面的误踩次数，选出最大的UCB1max，然后更新μmax；

3、uj∈[0,1](所以得到的误踩次数需要进行归一化)。

首先对于S101中生成的界面，邀请多位测试人员测试出每个界面的初始误踩值ai，计算每个界面的误踩次数的平均值，作为初始化数据。因为总共有四个答案，且必有一个答案是正确选项，所有误踩次数一定小于等于3。

Ui代表收益，因此ui等于3-ai，归一化ui，确保ui属于0-1，根据公式计算UCBi，选择最大的UCBi的界面推荐给用户，如果存在UCBi相同的情况下，随机挑选一个呈现给用户，更新ai，更新ui，将ui归一化，重新更新UCBi。

S107：利用IRT模型，结合学习者的潜在能力水平，练习题目的难度，以及随机猜测参数，模拟虚拟学习者的学习知识，获得学习者的学习数据仿真数据集；

在具体实施中，该方法通过模拟虚拟学生的行为生成用于训练的输入数据。IRT(Item Response Theory，项目反应理论)是一种用于评估考试和测验项目的统计模型。该理论的基本思想是，一个人在一个给定项目上的表现不仅仅取决于他们的能力水平，还取决于项目本身的特性。IRT考虑到了测试中每个项目的难度、区分度和其他属性，以更全面地评估被测者的能力。

IRT模型的核心概念包括以下几个方面：

1.被试者的能力水平(Latent Trait)：IRT将被试者的潜在能力看作一个难以直接观察到的概念，通常被称为“潜在特质”或“θ”(theta)。

2.项目的特性：IRT认为每个测验项目都有自己的一组特性，包括难度和区分度。难度表示一个项目对能力较低被试者的难易程度，而区分度表示一个项目有多大程度上能够区分高、低能力被试者。

3.项目反应函数(Item Response Function，IRF)：项目反应函数描述了在给定被试者能力水平下，被试者对项目的反应概率。这个函数通常与潜在能力水平和项目特性有关。

IRT模型有不同的变体，其中三个基本的模型是：

一参数模型(1PL)：也称为Rasch模型，它假设项目只有一个参数，即难度。

二参数模型(2PL)：考虑了难度和区分度这两个参数。

三参数模型(3PL)：在2PL的基础上加入了一个猜测参数，用于描述即使被试者的能力较低，仍然有可能猜对的情况。

本实施例中，采用的是三参数模型(3PL)，考虑到被测群体均为接近大学生，因此区分度参数设为0。具体而言，模拟包括了对1500名虚拟学生的回答轨迹，题库题目数量为1800道题，每次随机抽取50道题供学生回答，共进行75000次回答。

根据本发明所用系统应用模型的具体学习任务，题库中的题目共涉及5大知识点，每道题目只涉及唯一的知识点，每道题目都具有一个难度参数β。每个学生对每个知识点都有一个潜在的知识状态，称为“能力”θ。该方法采用IRT(Item Response Theory)模型生成能力为θ的学生答对一个难度为β的题目的概率P(correct|θ,β)如下：

其中，c表示即使学生的能力较低，仍然有可能猜对的情况，即随机猜测正确的概率，本实施例所用题目结尾四选一的选择题，因此可将c设置为0.25。

学生的回答数据由模型产生。学生s在回答题号为q，难度为β的题目时，通过计算出当前的P(correct|θ,β)，之后随机产生一个均匀分布的随机数r，则对于该题的作答正确性a可表示为如下：

1表示回答正确，0表示回答错误。

在具体实施中，利用该模型模拟20份虚拟学生回答仿真数据集，并进行了20次重复实验，通过平均值评估准确性。最终得到的深度知识追踪模型输入数据包括练习题目标签(题号)、题目分类以及题目回答的结果(正确或错误)。

S108：利用学生学习数据仿真数据集训练深度知识追踪模型A Self-Attentivemodel for Knowledge Tracing(SAKT)，模型根据学生历史答题记录进行预测，根据预测结果进行个性化学习内容推荐；

在具体实施中，将学生的历史答题序列定义为要预测这个学生在x_t+1题目上的表现，将学生的答题记录采用x_t＝{q_t|a_t}表示，其中q_t表示题目标签(最简单可以理解为题号)，a_t表示作答结果(目前大多是0/1计分，0表示答错，1表示答对)，当模型预测时，就是将题目标签q_t+1输入到模型中，模型预测学生答对概率，输出结果a_t+1。

推荐系统由MySQL数据库保存用户信息，题目信息，训练数据集，预测结果以及推荐题目列表，模型由两个主要部分组成，整个系统的工作可以划分为训练阶段和应用阶段两部分。

训练阶段

在学生答题仿真数据集上，进行了知识追踪模型的训练。利用知识追踪模型对各个学生在题目上的掌握能力进行建模。通过利用学生过去回答问题的历史数据，训练好的模型能够预测当前问题的回答结果。在具体实施中，模型的输入是数据集中用户的历史答题数据序列X，而输出则是对用户在各个题目上的掌握程度的预测。这一预测以回答正确的概率序列P的形式呈现。

具体步骤如下：

S1081：构建数据集

下面对用于模型训练的数据集进行描述：假设数据集X中有E道题目，M个学生，学生s在第t次答题时，对某道题q的回答情况x_t＝(q_t,c_t,a_t)，其中q_t∈{1，2，……E},c_t表示题目q_t所属的知识点，a_t∈{0,1}(0代表答错，1代表答对)。学生s一共做了n道题，则学生s所有的历史答题情况为X_s＝{x_t|t∈(1,n)}。那么数据集X＝{X_s1……X_sm}，其中m≤M。

本实施例中使用IRT(Item Response Theory)模型对虚拟学生学习知识进行建模，以获取充足的仿真数据集样本，用于训练知识追踪模型。

S1082：构建网络模型

本实施例中，知识追踪模型的目的是模拟每个学生在一系列学习活动中对知识概念的掌握情况。近年来，基于RNN(循环神经网络)方法的知识追踪模型，如Deep KnowledgeTracing(DKT)和Dynamic Key-Value Memory Network(DKVMN)等，取得了显著的成果。然而，这些模型存在一个问题，即不能有效处理稀疏数据。在真实世界中，部分学生仅涉及很少部分的知识概念交互，或者我们只能获取这些学生极少的学习数据。A Self-Attentivemodel for Knowledge Tracing(SAKT)模型，能够有效处理数据稀疏的情况。SAKT模型首先从过去的学习交互中识别相关的知识概念KCs(knowledge concepts)，然后根据学生在这些KCs上的表现来预测学生的表现。

为了预测学生在不同题目中的表现，本实施例使用题目本身作为知识概念。SAKT模型使用自注意力机制为之前回答的题目分配权重，同时预测学生在特定题目中的表现，即SAKT首先识别学生过去所有交互题目的相关性，然后预测学生的表现。比如学习方程前，学生要先掌握加减乘除。

本实施例使用SAKT网络模型作为预测模型；

所述预测模型的输入为：包括练习题目标签(题号)、题目分类以及题目回答的结果(正确或错误)的数据集合；

输出为：用户对E道题目的掌握概率向量P＝{p₁,p₂,……,p_e}，长度为E，对应了每道练习题的掌握程度。即利用前t个时间步来预测用户在t+1时刻对各练习题的掌握情况。

所述模型的具体结构为：

1、嵌入层(Embedding layer)：Embedding层将输入的交互信息和练习信息编码为嵌入(Embedding)矩阵。如图14所示，SAKT有两个矩阵，M和E。M是交互嵌入矩阵(Interaction embedding)，并加入位置编码(Position encoding)，E是练习(exercise)矩阵。

在具体实施中，将交互y_t嵌入(embedding)成矩阵M_s，即将变换得到的输入序列y＝{y₁,y₂,……,y_t,}变化成s＝{s₁,s₂,……,s_n,}，其中n为模型可以处理的最大长度。

由于模型可以处理固定长度序列的输入，如果序列长度t小于n，则在序列的左侧padding补全。当t大于n时，将序列划分为长度为n的子序列。具体来说，当t大于n时，将其划分为t/n个长度为n的子序列。

所有这些子序列都作为模型的输入，训练一个交互嵌入矩阵，M∈R^2E×d，其中d是潜在维数。该矩阵用于获得序列中每个元素的嵌入M_s。同样，训练练习嵌入矩阵E∈R^E×d，使得集合e_i中的每个练习都嵌入到第e_i行。

位置编码是自注意神经网络中用于对位置进行编码的层，与卷积网络和递归神经网络一样，可以对序列的顺序进行编码。

这一层在知识跟踪问题中尤为重要，因为学生的知识状态会随着时间的推移而逐渐稳定地变化。为了结合这一点，使用了一个参数，位置嵌入矩阵，P∈R^n×d，这是在训练中学习的。然后将位置嵌入矩阵的第i行P_i加到交互序列的第i个元素的交互嵌入向量中。

2、自注意力层(Self-attention layer)：这一层找到学生每个先前做的练习的对应的相对权重，以预测当前练习的正确性概率。

具体实施例中，使用下列等式获得查询(query,Q)和键(key,K)，值(value,V)：

其中，W^Q，W^K,W^V∈R^d×d分别为查询(query)、键(key)和值(value)的映射矩阵，即将各自的向量线性映射到不同的空间，如图14所示。

每个先前的交互练习与当前的交互练习的相关性是使用注意力权重来确定的。使用缩放后的点积来求注意力权重，如图15所示，定义为：

/>

多头注意力机制(Mutiple heads)：为了共同关注来自不同代表性子空间的信息，使用不同的投影矩阵对查询、键和值进行了h次线性投影：

在模型中，预测第(t+1)个练习的结果时，应该只考虑前t个相互作用，因为以前的练习会对后面的练习产生影响，未来时刻的练习不应该产生影响。因此，对于查询Q_i，键K_j(j>i)不应该被考虑。模型使用因果关系层来掩盖从未来的交互键中学习到的权重。

3、前馈层(Feed Forward layer)：上述描述的自注意力层的结果是先前交互的V_i的加权和，然而，从多头层得到的矩阵，即仍然是过去交互练习的值V_i的线性组合。为了在模型中引入非线性，并考虑不同潜在维度之间的相互作用，模型使用了一个前馈网络如下：

F＝FFN(S)＝Relu(SW⁽¹⁾+b⁽¹⁾)W⁽²⁾+b⁽²⁾，其中W⁽¹⁾∈R^d×d,

其中，W⁽²⁾∈R^d×d,b⁽¹⁾∈R^d,b⁽²⁾∈R^d是训练过程中学习到的参数。

残差连接被用于将较低层的特征传播到较高层。因此，如果低层特征对于预测很重要，残差连接将有助于将它们传播到最终层，即进行预测的层。在知识追踪的背景下，学生学习特定概念的练习题以加强该知识概念掌握程度。因此，残差连接可以帮助传播最近交互的练习的嵌入到最终层，使模型更容易利用低层信息。残差连接应用在自注意力和前馈层之后。

跨特征归一化输入有助于稳定和加速神经网络。因此模型的架构中使用层归一化来达到相同的目的。层归一化也被应用在自注意力和前馈层上。

4、预测层：最后，将上述得到的矩阵F的每一行通过Sigmoid函数激活的全连接网络进行传递，以预测学生的答对概率，公式如下：

p_i＝Sigmoid(F_iw+b)

其中，其中p_i是一个标量，表示学生对习题e_i做出正确反应的概率，F_i是F的第i行，w，b是训练出来的参数。

Sigmoid(z)＝1/(1+e^-z)

模型训练的目标是最小化模型观察到的学生反应序列的负对数似然。通过最小化p_t和a_t之间的交叉熵损失来学习参数，公式如下：

S1083：基于训练的知识追踪模型对用户在各个问题上的掌握程度(即他们回答正确的概率)进行预测。

这个模型的输出被应用于实际的脚交互答题系统，以向学生推送符合其个人水平的问题。

在具体实施中，将用户的历史答题序列X输入已经训练过的知识追踪模型，首先得到用户在所有问题上预测回答正确的概率序列P，并按照这些概率进行排序。然后，根据近端发展区学习理论，为了实现有效的学习效果，我们选择符合用户当前能力的问题序列P_n，作为下一轮的推送，并将该问题序列写入数据库以备后续读取使用。需要注意的一点是，在用户首次使用时，历史答题序列X为空，因此需要进行适当的初始化步骤。

具体步骤如下：

用户登录系统进行人脸识别，若识别用户在数据库D中不存在，则对用户进行注册，利用人脸识别识别人脸，生成用户编号id以及记录用户注册信息(年龄，学历，性别，专业等)，根据预先设置好的学历与题目等级l的映射，对题目等级l进行初始化操作，转至第2步，若系统识别该用户已存在，通过匹配数据库D得到D中用户id和题目等级l，转至第3步。

1、正确匹配等级l：从数据库D中随机挑选等级为l的10道题目(参考Khan Academy学习平台，要求用户在连续回答正确10道题目后才算达到掌握的阈值)。一旦用户成功回答所有这10道题目，他们的题目等级将被更新为l+1。然后，这个过程将重复进行，直到用户未能连续回答正确。系统将记录用户在等级l下的历史答题数据序列X_n，并进入第3步。

2、等级l下的知识追踪：采用预先训练好的知识追踪模型M，将第2步得到的用户历史答题数据序列X_n输入模型中，得到用户在各个题目上的掌握程度(回答正确的概率P)的预测值序列P_n＝{P₁,P₂,…P_N}。

3、P_n按照概率P重新排序，根据近端发展区(Zone of Proximal Development，ZPD)学习理论，选择适应用户当前能力的题目序列——中等级别的h道题，作为标识为id的用户下一次推送题目序列P_h写入数据库D。

4、将题目序列P_h推送给标识为id的用户作答。

5、用户完成题目序列P_h的作答，更新标识为id的用户的历史答题数据序列X_n，将X_n加入并更新所有用户历史答题数据序列X，返回X。

6、若用户答题准确率高达一定的阈值，则推荐等级加1，更新用户题目等级l，转至第2步。

实施例二

本实施例提供一种考虑学习交互方式的自适应学习推荐系统，包括：

实施例三

本实施例提供了一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现如上述所述的一种考虑学习交互方式的自适应学习推荐方法中的步骤。

实施例四

本实施例提供了一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现如上述所述的一种考虑学习交互方式的自适应学习推荐方法中的步骤。

以上所述仅为本发明的优选实施例而已，并不用于限制本发明，对于本领域的技术人员来说，本发明可以有各种更改和变化。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种考虑学习交互方式的自适应学习推荐方法，其特征在于，包括如下步骤：

获取用户特征数据和学习交互界面特征数据；

2.如权利要求1所述的一种考虑学习交互方式的自适应学习推荐方法，其特征在于，所述基于用户特征数据和学习交互界面特征数据，结合训练后的学习交互界面推荐模型为用户推荐最佳学习交互界面，包括：

对用户第一特征信息进行聚类得到第一分类结果，根据第一分类结果为用户推荐相应大小的界面元素；

对用户第二特征信息进行聚类得到第二分类结果，根据第二分类结果为用户进行初始化推荐，推荐相应的界面背景和界面元素形状；

结合用户第二特征信息、界面背景和界面元素形状，结合训练后的学习交互界面推荐模型，预测每一个界面的得分，根据得分为不同的用户推荐不同的背景和形状的界面；

将界面元素位置的推荐转化为多臂强盗求解的过程，借助UCB方法根据用户历史操作过程产生的记录求解，计算出界面元素最佳的位置。

3.如权利要求2所述的一种考虑学习交互方式的自适应学习推荐方法，其特征在于，所述将界面元素位置的推荐转化为多臂强盗求解的过程，借助UCB方法根据用户历史操作过程产生的记录求解，计算出界面元素最佳的位置，包括：

初始化答题场景空间中用户和地面投影区域的初始位置；

对用户的面部特征进行捕捉，与人脸库中数据对比，判断用户是否为新用户，如果为新用户，获取用户的身高，根据用户身高计算出用户的脚长，使用K-Means算法将用户的脚长进行聚类计算，计算出与用户最佳匹配的界面元素的大小，在推荐界面中使用UCB1算法更新用户在该界面的误踩情况，为用户推荐最低误踩界面；

否则获取用户历史数据信息，将用户地面答题系统界面元素位置设计转化为一个多臂强盗问题的求解过程，结合用户历史数据信息求解为用户推荐最低误踩界面。

4.如权利要求1所述的一种考虑学习交互方式的自适应学习推荐方法，其特征在于，所述学习交互界面推荐模型构建时，使用隐向量分解稀疏矩阵和加入特征交叉。

5.如权利要求1所述的一种考虑学习交互方式的自适应学习推荐方法，其特征在于，所述结合IRT模型，获取用户在最佳学习交互界面的学习模拟数据集，包括：基于三参数模型，在为用户推荐的最佳学习交互界面上，结合用户的潜在能力水平，分别模拟练习题目的难度和随机猜测参数，模拟虚拟用户学习知识，得到练习题目标签、题目分类以及题目回答的结果。

6.如权利要求1所述的一种考虑学习交互方式的自适应学习推荐方法，其特征在于，所述基于学习模拟数据集，结合训练后的深度知识追踪模型进行预测，根据预测结果为用户推荐相应的个性化学习内容，包括：

获取历史答题序列；

基于历史答题序列，将题目本身作为知识概念，使用自注意力机制为之前回答的题目分配权重，识别用户前t个时间步所有交互题目的相关性；

基于用户前t个时间步所有交互题目的相关性预测预测用户在t+1时刻对各练习题的掌握情况；

根据用户在t+1时刻对各练习题的掌握情况，选择符合用户当前能力的问题序列，作为下一轮的推送。

7.如权利要求1所述的一种考虑学习交互方式的自适应学习推荐方法，其特征在于，所述深度知识追踪模型包括嵌入层、自注意力层、前馈层和预测层；

在嵌入层中，引入位置嵌入向量，将位置嵌入矩阵的第i行加到交互序列的第i个元素的交互嵌入向量中，输出嵌入交互矩阵和嵌入练习矩阵；

在自注意力层，结合嵌入交互矩阵和嵌入练习矩阵，使用不同的投影矩阵对查询、键和值进行了h次线性投影，得到先前交互的加权和；

在前馈层，引入非线性，考虑不同潜在维度之间的相互作用，得到矩阵F；

在预测层，将矩阵F的每一行通过Sigmoid函数激活的全连接网络进行传递，预测得到最终的学生答对题目的概率。

8.一种考虑学习交互方式的自适应学习推荐系统，其特征在于，包括：

9.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现如权利要求1-7中任一项所述的一种考虑学习交互方式的自适应学习推荐方法中的步骤。

10.一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述程序时实现如权利要求1-7中任一项所述的一种考虑学习交互方式的自适应学习推荐方法中的步骤。