CN117743699A

CN117743699A - 一种基于dkt与汤普森采样算法的习题推荐方法及系统

Info

Publication number: CN117743699A
Application number: CN202410188406.0A
Authority: CN
Inventors: 郭莹; 刘尚旭; 杨晓晗; 张颖
Original assignee: Qilu University of Technology; Shandong Computer Science Center National Super Computing Center in Jinan
Current assignee: Qilu University of Technology; Shandong Computer Science Center National Super Computing Center in Jinan
Priority date: 2024-02-20
Filing date: 2024-02-20
Publication date: 2024-03-22
Anticipated expiration: 2044-02-20
Also published as: CN117743699B

Abstract

本发明涉及一种基于DKT与汤普森采样算法的习题推荐方法及系统，属于新一代信息技术和在线教育技术领域；本发明将汤普森采样算法与基于用户的协同过滤算法相结合，特别为新用户设计了一种基于用户的协同过滤算法，解决深度知识追踪模型面临的冷启动问题。而且考虑了用户的个人背景和需求进行相关习题的推荐。本发明采用了基于多头注意力机制的知识追踪模型，加入习题类型特征，通过对用户的答题数据和答题结果进行深入分析，准确预测用户对未尝试习题的答题表现以及知识掌握情况。使推荐系统能够动态地调整习题难度和类型，以匹配用户的实际学习进度和能力。

Description

一种基于DKT与汤普森采样算法的习题推荐方法及系统

技术领域

本发明涉及新一代信息技术和在线教育技术领域，尤其涉及一种基于DKT与汤普森采样算法的习题推荐方法及系统。

背景技术

在线教育平台的兴起带来了对学习内容个性化的新需求。传统的静态习题推荐系统，通过为所有用户提供一致的题目集，已不足以满足日益多样化的学习需求。不同的学习背景、知识水平和个人兴趣要求更加精细化的学习资料推荐。为此，深度知识追踪技术应运而生，它通过深度学习模型—如循环神经网络或长短时记忆网络预测学习者对未来习题的表现，为他们量身定制推荐。

然而，深度知识追踪在实践中面临若干挑战，包括初始阶段对数据的依赖性导致的冷启动问题，以及可能过分适应学习者当前水平和过度依赖预测的习题准确度进行推荐，而忽视学习者潜在成长的问题，容易使学习者陷入“信息茧房”，甚至因为推荐相似的习题降低学习者学习效率。此外，它往往未考虑学习者的主观愿望和动机，可能造成学习者陷入仅限于其已知知识范畴的循环中，限制了探索新领域的可能性。因此，在当前的在线习题推荐领域，深度知识追踪尤其是在习题推荐方面仍存在改进空间。

发明内容

针对以上所阐述的在线学习资源推荐领域中习题推荐方法遇到的问题，本发明提供了一种融合基于多头注意力机制的知识追踪与汤普森采样算法的在线习题动态推荐方法和系统。通过根据用户特征信息，建立相似用户集，利用汤普森采样算法和协同过滤算法进行初始的习题推荐，解决深度知识追踪的冷启动问题。引入习题类型特征和用户做题数据利用基于多头注意力机制的知识追踪模型，预测用户未做习题的正确率。再结合汤普森采样算法和知识点关系表对用户进行习题的动态推荐。

本发明中，首先，将汤普森采样算法与基于用户的协同过滤算法相结合，特别为新用户设计了一种基于用户的协同过滤算法，解决深度知识追踪模型面临的冷启动问题。而且考虑了用户的个人背景和需求（相关课程基础、专业、学习能力和偏好）进行相关习题的推荐。其次，本发明的采用了基于多头注意力机制的知识追踪模型，加入习题类型特征，通过对用户的答题数据和答题结果进行深入分析，准确预测用户对未尝试习题的答题表现以及知识掌握情况。使推荐系统能够动态地调整习题难度和类型，以匹配用户的实际学习进度和能力。最后，结合汤普森采样算法通过动态权衡探索未知与利用已知，可以鼓励用户挑战稍难的题目，降低已掌握习题的重复做题率，避免学习者陷入“信息茧房”，进而促进和扩展知识点的掌握。这种结合不仅增加了习题推荐的多样性，还能够激发学习者的好奇心和探索欲，推动他们走出舒适区，探索新知识，从而实现更全面的学习发展。因此，与传统的静态习题推荐相比，本发明所提出的方法能够进行动态、灵活的习题推荐，更有效地促进学习者个性化学习，同时提高学习效率和用户满意度。

术语解释：

1、知识追踪：是一种用于教育和学习环境的技术，它旨在监测和预测学生对特定知识点的掌握程度。这种技术通常应用于个性化学习系统，帮助教育者和学习平台更好地了解每位学生的学习进展，并据此提供适当的教学材料和习题。

2、多头注意力机制：是一种深度学习技术，尤其在处理序列数据如文本时效果显著，由Vaswani等人在2017首次提出，作为Transformer模型的核心组成部分。这一机制的核心思想是将传统的注意力机制拆分为多个“头”，每个头独立处理输入数据的不同部分，从而同时捕捉数据间的多种关系。

3、汤普森采样算法：（Thompson Sampling Algorithm），是一种概率性的在线决策算法，主要用于处理具有不确定性的问题，如多臂老虎机问题。在多臂老虎机问题中，每个“臂”代表一个选择，每个选择都有一个未知的潜在回报率。目标是最大化长期的回报。

4、DKT：深度知识追踪（Deep Knowledge Tracing, DKT）是一种使用深度学习技术来追踪和预测学生学习过程中知识掌握程度的方法。它是知识追踪（KnowledgeTracing,KT）的一种进阶形式，通常使用递归神经网络（RNN）或其变体（如长短期记忆网络，LSTM）来实现。

本发明的技术方案为：

基于DKT与汤普森采样算法的习题推荐方法，包括：

获取学校编程学习平台的习题的信息和专家标注的知识点信息，建立知识点关系表和习题知识点关系表；

获取学校编程学习平台的用户的信息，包括新用户和历史用户的学习特征信息，建立新用户的相似用户集；

利用汤普森用户采样模型，在新用户的相似用户集中抽取相似用户所做过的习题，建立习题推荐列表并推荐给新用户进行作答；更新汤普森用户采样模型的参数；循环执行该步骤直至循环结束条件；

根据输入的新用户做题记录数据，深度知识追踪模型输出预测的新用户在未作答习题上的答题正确率向量；

将深度知识追踪模型输出的新用户在未作答习题上的答题正确率向量，输入汤普森知识点采样模型，得到为新用户进行习题推荐的汤普森知识点采样模型；

通过汤普森知识点采样模型，抽取习题建立习题推荐列表推荐给新用户，并采集用户本次的做题结果信息；

将用户历史做题结果和用户本次做题结果再次输入深度知识追踪模型，更新用户未作答习题的答题正确率向量；

根据用户本次做题结果和更新后的用户未作答习题的答题正确率向量，结合知识点关系表更新汤普森知识点采样模型的贝塔分布参数；

在用户做题过程中，持续根据用户做题情况更新模型参数和预测结果，动态的为用户提供个性化的习题推荐。

根据本发明优选的，知识点关系表kt包括知识点的名称、类型、前驱知识点和后继知识点；知识点的类型分为基础知识点、进阶知识点和独立知识点；其中，基础知识点代表每个学习者最初需要学习的内容，作为进阶知识点的先验积累，两者存在前驱和后继的关系；独立知识点则单独存在，与其他知识点无关联关系；习题知识点关系表tkt包括习题的编号、习题类型和专家标注的知识点信息，每个习题包括一到三个核心知识点。

根据本发明优选的，获取学校编程学习平台的用户的信息，包括新用户和历史用户的学习特征信息，建立新用户的相似用户集；包括：

获取新用户A的课程基础、专业、学习能力和知识点兴趣偏好学习特征；

根据新用户A的特征信息，计算新用户A与学校编程学习平台的数据库中每个历史用户的相似度，根据用户的基础、专业相关性、学习能力和知识点兴趣值进行计算，相似度的计算公式如下：

其中，代表新用户A和历史用户B的相似度值；/>是指：如果，则返回1，否则，返回0；/>分别表示新用户A和历史用户B的课程基础、专业相关性和学习能力值，课程基础是指用户是否具备相关课程的基本知识，如果具备，则此值标记为1，否则为0；专业相关性是指用户是否是该课程相关专业的学生，是则标为1，不是则为0；学习能力是指用户是否具备较好的学习能力，能力较好则标为1，否则为0；/>分别表示新用户A和历史用户B的知识点兴趣标签，n为知识点标签的总个数；

按照相似度值进行排序，取相似度大于阈值的用户组成用户A的相似用户集users_0；

删除相似用户集users_0中不合格的用户；形成最终的新用户A的相似用户集users_A，;/>表示为第i个用户，/>为相似用户集中用户的总数。

进一步优选的，阈值为0.8。

根据本发明优选的，利用汤普森用户采样模型，在新用户的相似用户集中抽取相似用户所做过的习题，建立习题推荐列表并推荐给新用户进行作答；包括：

为新用户A的相似用户集users_A中每个用户都维护一个贝塔分布/>，贝塔分布定义如下：

其中，与/>为贝塔分布的参数，初始值设置为1；bt为积分变量；

对新用户A的相似用户集users_A中每个用户的贝塔分布/>进行采样，得到用户/>的采样概率值/>，/>；

将新用户A的相似用户集users_A中每个用户的/>按从大到小排序，选择排在前m个的用户形成用户集/>，在用户/>做题记录/>中，按照习题难度采用习题抽取策略抽取一道习题，最终共抽取m道习题，建立包含m道习题的为新用户A进行第一轮推荐的习题列表TestA_1即习题推荐列表；

习题难度计算公式如下：

其中，代表习题que的难度，0＜que＜1，/>代表学校编程学习平台上所有用户回答习题que正确的次数，/>代表学校编程学习平台上所有用户作答习题que的次数。

进一步优选的，习题抽取策略，包括：

首轮习题抽取时，根据包含m个用户的用户集，对每个用户/>的做题记录/>，选择习题难度/>的习题，其中，/>为用户/>做题记录中习题难度/>的中位数，创建第一轮包含m道习题的推荐列表TestA_1；

当用户完成TestA_1中的习题后，根据用户答题表现来微调后续推荐习题的难易程度，建立下一轮习题推荐列表；具体来说，用户如果正确解答n-1轮习题推荐列表中，在用户的做题记录中抽取的习题/>，则在第n轮习题抽取中，在用户/>的做题记录中选择抽取习题难度大于/>的习题；反之，则抽取的习题难度小于/>的习题。

根据本发明优选的，更新汤普森用户采样模型的参数的策略为：当新用户A正确作答从用户的做题记录中抽取的习题时，用户/>贝塔分布/>中的/>参数增加1，反之，用户A未能正确回答，则/>参数增加1。

根据本发明优选的，深度知识追踪模型采用基于注意力机制，包括嵌入层、多头注意力层、编码器、解码器及预测层；根据输入的新用户A做题记录数据，深度知识追踪模型输出预测的新用户A在未作答习题上的答题正确率向量；具体实现过程包括：

嵌入层将新用户A的答题数据嵌入为向量；分别生成题型嵌入向量/>和交互嵌入向量/>；

将题型嵌入向量和交互嵌入向量/>分别与不同的投影矩阵相乘，映射到相同的输入维度；矩阵映射公式如下：

其中，/>和/>分别为交互投影矩阵和题型嵌入矩阵；E是题型总数，d是深度知识追踪模型的维度，/>是映射后的交互嵌入向量，/>是映射后的题型嵌入向量；

多头注意力层的输入经过与不同的权重矩阵的投影生成/>、/>和/>，计算后得到注意力值/>；这个过程重复h次，每次使用不同的权重矩阵进行计算，将每次计算的结果合并，形成多头注意力层的输出；具体计算过程如下：

其中，、/>和/>为交互矩阵/>经过不同的权重矩阵投影生成，/>归一化操作将数值转为概率分布，/>为掩码操作，表现为与一个全为1的下三角矩阵进行“与”操作；/>为计算后的注意力得分，/>为多头合并操作，/>是权重矩阵；

在编码器包括一层多头注意力和一层前馈神经网络，使用残差连接和层归一化处理；编码器的计算过程如下：

其中，、/>和/>为交互矩阵/>经过不同的权重矩阵投影生成，/>为注意力得分，/>为/>层归一化后的输出，/>分别为权重矩阵，/>为偏置，/>为前馈神经网络中的激活函数，/>为编码器的输出结果：

解码器第一注意力层的输入、/>和/>为题型矩阵/>经过不同的权重矩阵投影生成；第二注意力层的输入/>来自第一注意力层的输入，/>和/>来自编码器的输出；第二注意力层计算出注意力值后，经过分组归一化输入到前馈神经网络，经过分组归一化后得到最终输出，解码器计算过程所下：

其中，、/>为分组归一化后输出的结果，/>为编码器的输出结果，GN为分组归一化操作，/>为计算后的注意力得分，/>为解码器输出的最终结果；

经过预测层处理后得到最终的预测结果；预测层的全连接层使用和/>激活函数将解码器的输出/>转换为最终的预测结果/>；预测层的计算过程如下：

其中，W₃、W₄为全连接层的权重，b₃、b₄为全连接层的偏置，为解码器的输出，h₁为中间特征向量，y为预测的用户正确回答习题的概率向量。

进一步优选的，深度知识追踪模型中，采用二元交叉熵作为损失函数；具体计算过程如下：

其中，N为习题总数，Loss表示损失函数的值，a_i是第i个习题的答题结果实际值，y_i是深度知识追踪模型预测的第i个习题正确概率。

根据本发明优选的，将深度知识追踪模型输出的新用户在未作答习题上的答题正确率向量，输入汤普森知识点采样模型，得到为新用户进行习题推荐的汤普森知识点采样模型；包括：

为新用户未做习题集中包括的每个知识点k都维护一个贝塔分布：

根据深度知识追踪模型输出的新用户A答题正确率向量y，按照习题知识点关系表tkt，计算用户知识点掌握程度；知识点掌握程度计算公式如下：

其中，是与知识点/>相关的所有习题的集合；/>是新用户A答对习题/>的正确概率；/>是习题/>对知识点/>的影响因子，表示该习题在评估知识点的掌握程度时的权重大小；

根据用户的每个知识点掌握度为每个知识点的贝塔分布参数和/>赋值，赋值算法如下：

其中，y是用户A在习题上的答题正确率，round（y,1）表示将y四舍五入到小数点后一位，和/>是贝塔分布的参数。

根据本发明优选的，通过汤普森知识点采样模型，抽取习题建立习题推荐列表推荐给新用户，并采集新用户本次的做题结果信息；包括：

对每个知识点的贝塔分布进行采样，得到每个知识点的采样数值；

选择采样数值排在前m个的知识点，并在每个知识点中抽取一道相关的习题，具体抽取习题采用以下策略：在第一轮抽取中，选取每个知识点相关习题中难度等于中位数的习题，建立包含m道习题的习题推荐列表Test2；在后续的习题抽取中，则根据用户对前一题的回答情况来决定；具体是指：如果用户正确解答了上一道习题，则抽取难度高于前一题的习题；相反的，则抽取难度低于前一题的习题。

根据本发明优选的，根据用户本次做题结果和更新后的用户未作答习题的答题正确率向量，结合知识点关系表更新汤普森知识点采样模型的贝塔分布参数；包括：

当新用户A正确作答从知识点s2中抽取的习题时，相应知识点s2的贝塔分布中/>参数增加1；根据知识点关系表kt，提取出知识点s2的前驱知识点s1和后继知识点s2；将知识点s2的前驱知识点s1的贝塔分布/>中/>参数也增加1；将知识点s2的后继知识点s3的贝塔分布/>中/>参数也增加1；具体如下：

其中，为贝塔分布，/>为知识点s2对应的贝塔分布参数，/>为知识点s2的前置知识点s1对应的贝塔分布参数，/>为知识点s2的后置知识点s3对应的贝塔分布参数；

反之，用户A未能正确作答从知识点s2中抽取的习题时，则知识点s2、s1和s3对应的贝塔分布的参数、/>和/>分别增加1；具体如下：

。

基于DKT与汤普森采样算法的习题推荐系统，包括：

习题推荐信息获取单元，被配置为：获取学校编程学习平台习题的信息和专家标注的知识点信息，建立知识点关系表和习题知识点关系表；获取学校编程学习平台用户的信息，包括新用户和历史用户的学习特征信息，建立新用户的相似用户集；

习题推荐列表建立单元，被配置为：利用汤普森用户采样模型，在新用户的相似用户集中抽取相似用户所做过的习题，建立习题推荐列表并推荐给新用户进行作答；更新汤普森用户采样模型的参数；循环执行该步骤直至循环结束条件；

汤普森知识点采样模型建立单元，被配置为：根据输入的新用户做题记录数据，深度知识追踪模型输出预测的新用户在未作答习题上的答题正确率向量；将深度知识追踪模型输出的新用户在未作答习题上的答题正确率向量，输入汤普森知识点采样模型，得到为新用户进行习题推荐的汤普森知识点采样模型；

个性化的习题推荐单元，被配置为：通过汤普森知识点采样模型，抽取习题建立习题推荐列表推荐给新用户，并采集用户本次的做题结果信息；将用户历史做题结果和用户本次做题结果再次输入深度知识追踪模型，更新用户未作答习题的答题正确率向量；根据用户本次做题结果和更新后的用户未作答习题的答题正确率向量，结合知识点关系表更新汤普森知识点采样模型的贝塔分布参数；在用户做题过程中，持续根据用户做题情况更新模型参数和预测结果，动态的为用户提供个性化的习题推荐。

本发明的有益效果为：

1、本发明的核心优势在于将深度知识追踪与汤普森采样算法的优点结合，形成了一种先进的推荐方法及系统。这种融合克服了单一使用深度知识追踪进行习题推荐的局限性。引入汤普森采样算法，推荐系统不仅能够根据学习者过去的表现调整习题难度，还能够在探索新知识点和巩固已学知识之间找到平衡。同时，汤普森算法的动态调整机制保证了习题的多样性和挑战性，避免了学习过程中的单调和停滞。

2、本发明引入了题型特征作为深度知识追踪模型的额外输入变量。通过考虑不同题型的做题效果，显著提高了模型在知识追踪方面的预测精度。这种创新方法不仅增强了模型的预测能力，而且为基于题型特点进行精准推荐提供了坚实的理论基础。通过这样的改进，带来了更为精准和高效的个性化学习路径规划。

3、本发明在进行习题推荐的过程中也关注了习题、知识点关联关系。通过构建相应关系表，在进行习题推荐时，增强学习者学习的连贯性，更有效地构建和巩固知识体系，实现真正意义上的理解和应用。

4、本发明解决了推荐系统的冷启动问题，针对新用户无做题记录的情形，根据用户特征建立相似用户集，以汤普森采样算法和基于用户的协同过滤算法进行初始推荐，后期结合深度知识追踪模型进行基于做题记录的推荐，解决了深度知识追踪的冷启动问题。

附图说明

图1所示为本发明基于DKT与汤普森采样算法的习题推荐方法的流程示意图；

图2所示为本发明基于注意力机制的深度知识追踪模型的架构图；

图3所示为本发明汤普森用户采样模型的参数更新流程示意图。

具体实施方式

下面结合说明书附图和实施例对本发明作进一步限定，但不限于此。

实施例1

基于DKT与汤普森采样算法的习题推荐方法，如图1所示，包括：

获取学校编程学习平台的用户的信息，包括新用户和历史用户的学习特征信息，建立新用户的相似用户集；其中，用户的学习特征信息包括用户的课程基础、专业相关性、学习能力和知识点兴趣特征信息；

利用汤普森用户采样模型，在新用户的相似用户集中抽取相似用户所做过的习题，建立习题推荐列表并推荐给新用户进行作答；更新汤普森用户采样模型的参数；循环执行该步骤直至循环结束条件；循环执行该步骤用于持续地为新用户提供习题推荐。直到用户完成的习题数量超过预定的阈值（例如50道题），拥有了足够的数据来输入深度知识追踪模型，该模型将对用户的学习状态进行更全面的分析和预测。通过这种方法，本发明能够确保在开始使用深度知识追踪模型之前，每位用户的数据集都足够丰富，从而提高模型的准确性和可靠性。

汤普森用户采样模型中，基于汤普森采样算法对新用户的相似用户进行建模和决策。在汤普森用户采样模型中，为相似用户集中每个相似用户分配一个初始值相同的贝塔分布。贝塔分布在这里被用作先验分布，用于表示新用户对相似用户集中用户的偏好程度。在每一轮选择中，从每个相似用户的贝塔分布中独立地抽取一个样本，选择出最高样本值的相似用户。再按照习题抽取策略1进行习题的抽取，为新用户进行习题推荐，并根据用户做题结果不断更新每个相似用户的贝塔分布参数。

实施例2

根据实施例1所述的基于DKT与汤普森采样算法的习题推荐方法，其区别在于：

知识点关系表kt，包括列“knowledge”、“type”、“link_front”和“link_after”。包括（分别代表）知识点的名称、类型、前驱知识点和后继知识点；知识点的类型分为基础知识点、进阶知识点和独立知识点；其中，基础知识点代表每个学习者最初需要学习的内容，作为进阶知识点的先验积累，两者存在前驱和后继的关系；独立知识点则单独存在，与其他知识点无关联关系；以python程序设计课程中的算数运算符知识点为例：其类型为进阶知识点，其前驱知识点为数据类型与变量知识点，其后继知识点为条件语句知识点。知识点关系表kt如表1所示。

表1

习题知识点关系表tkt中，包含列“exercises”、“type1”、“knowledge1”、“knowledge2”和“knowledge3”。包括（分别代表）习题的编号、习题类型和专家标注的知识点信息，每个习题包括一到三个核心知识点。习题知识点关系表tkt如表2所示。

表2

以python程序设计课程中的习题17（在Python中，布尔数据类型的值只能是True或False）为例：其习题编号为17，习题类型为判断题，知识点信息包含Python数据类型、布尔数据类型和布尔值True和False知识点。

knowledge3：列表操作；在这个例子中，习题编号是 “Q123”，表示这是第123道习题。习题类型（type1）是“编程题”，表明这是一道需要编写Python代码来解决的题目。知识点信息列包含了三个知识点，分别是“条件语句”、“循环语句”和“列表操作”，这些知识点说明了这道习题涉及的关键概念或主题。学生可以根据这些知识点来判断习题的难度和内容，并选择合适的学习资源来准备这道习题。

获取学校编程学习平台的用户的信息，包括新用户和历史用户的学习特征信息，建立新用户的相似用户集；包括：

通过在新用户A开始学习前进行调查问卷的形式，获取新用户A的课程基础、专业、学习能力和知识点兴趣偏好学习特征；通过在新用户A开始学习前进行调查问卷的形式，获取新用户A的课程基础（是否具备）、专业（是否相关）、学习能力（是否较强）和知识点兴趣偏好特征；以新用户A为例，课程基础（具备），专业（相关），学习能力（一般），知识点偏好（文件操作、数据库编程）；

按照新用户A与历史用户的相似度值进行排序，取相似度大于阈值的用户组成用户A的相似用户集users_0；

删除相似用户集users_0中不合格的用户；形成最终的新用户A的相似用户集users_A，;/>表示为第i个用户，/>为相似用户集中用户的总数。阈值为0.8。

利用汤普森用户采样模型，在新用户的相似用户集中抽取相似用户所做过的习题，建立习题推荐列表并推荐给新用户进行作答；包括：

习题难度计算公式如下：

习题抽取策略，包括：

如图3所示，更新汤普森用户采样模型的参数的策略为：当新用户A正确作答从用户的做题记录中抽取的习题时，用户/>贝塔分布/>中的/>参数增加1，反之，用户A未能正确回答，则/>参数增加1。

如图2所示，深度知识追踪模型采用基于注意力机制，包括嵌入层、多头注意力层、编码器、解码器及预测层；根据输入的新用户A做题记录数据，深度知识追踪模型输出预测的新用户A在未作答习题上的答题正确率向量；具体实现过程包括：

嵌入层将新用户A的答题数据嵌入为向量；分别生成题型嵌入向量/>和交互嵌入向量/>；题型嵌入向量/>由题型特征（单项选择题、多项选择题、填空题、判断题和主观题）映射后使用独热编码进行处理得到；在此基础上，根据答题结果，正确则在/>左侧连接等长的零向量，错误则在/>右侧连接等长的零向量，得到交互嵌入向量/>；

经过预测层处理后得到最终的预测结果；预测层的全连接层使用和激活函数将解码器的输出/>转换为最终的预测结果/>；预测层的计算过程如下：

深度知识追踪模型中，采用二元交叉熵作为损失函数；具体计算过程如下：

将深度知识追踪模型输出的新用户在未作答习题上的答题正确率向量，输入汤普森知识点采样模型，得到为新用户进行习题推荐的汤普森知识点采样模型；包括：

根据深度知识追踪模型输出的新用户A答题正确率向量y，按照习题知识点关系表tkt，计算用户知识点掌握程度；具体如下：用户对每个知识点的掌握程度被量化为一个从0到1的值；这个值是基于用户在相关习题上的正确率计算得出的，其中，0表示用户完全没有掌握该知识点，而1则意味着用户已经完全掌握；这样，通过习题知识点关系表tkt内习题与知识点的对应关系，综合用户在多个相关习题上的表现，为用户对于知识点的掌握程度提供一个综合的、量化的评分。知识点掌握程度计算公式如下：

其中，是与知识点/>相关的所有习题的集合；/>是新用户A答对习题/>的正确概率；/>是习题/>对知识点/>的影响因子，表示该习题在评估知识点的掌握程度时的权重大小；这个权重可以根据习题和知识点之间的关联强度来确定。

通过汤普森知识点采样模型，抽取习题建立习题推荐列表推荐给新用户，并采集新用户本次的做题结果信息；包括：

根据用户本次做题结果和更新后的用户未作答习题的答题正确率向量，结合知识点关系表更新汤普森知识点采样模型的贝塔分布参数；包括：

。

采用上述基于深度知识追踪和汤普森采样算法的模型，预测用户做题结果。在三个benchmark数据集上，本发明实施例模型与三个现有模型(DKT、DKVMN（记忆增强网络知识追踪）、SAKT（自注意力知识追踪）)的预测性能对比实验结果对比如表3所示。

表3

其中，ACC准确率表示模型正确预测率，在机器学习和统计领域，准确率是一个非常常见和重要的性能指标，用于衡量模型的表现。具体来说，在本发明中ACC是模型正确预测的做题结果除以总的预测数量。AUC是ROC曲线与横坐标轴围成图形的面积，该面积的取值在0.5到1之间，若AUC的值为0.5，说明知识追踪模型是随机预测模型；AUC的值越大，说明知识追踪模型预测性能越好；

表3的实验结果表明，本发明模型的性能在三个真实的数据集上优于基线模型DKT、DKVMN和SAKT。特别是在ASSISTments2009数据集上，其性能表现优于DKT、DKVMN和SAKT模型。这证明本发明可以成为学习分析和个性化学习推荐系统中的有力工具。

实施例3

基于DKT与汤普森采样算法的习题推荐系统，包括：

习题推荐列表建立单元，被配置为：利用汤普森用户采样模型，在新用户的相似用户集中抽取相似用户所做过的习题，建立习题推荐列表并推荐给新用户进行作答；更新汤普森用户采样模型的参数；循环执行该步骤直至循环结束条件；循环执行该步骤用于持续地为新用户提供习题推荐。直到用户完成的习题数量超过预定的阈值（例如50道题），拥有了足够的数据来输入深度知识追踪模型，该模型将对用户的学习状态进行更全面的分析和预测。通过这种方法，本发明能够确保在开始使用深度知识追踪模型之前，每位用户的数据集都足够丰富，从而提高模型的准确性和可靠性。

Claims

1.基于DKT与汤普森采样算法的习题推荐方法，其特征在于，包括：

2.根据权利要求1所述的基于DKT与汤普森采样算法的习题推荐方法，其特征在于，知识点关系表kt包括知识点的名称、类型、前驱知识点和后继知识点；知识点的类型分为基础知识点、进阶知识点和独立知识点；其中，基础知识点代表每个学习者最初需要学习的内容，作为进阶知识点的先验积累，两者存在前驱和后继的关系；独立知识点则单独存在，与其他知识点无关联关系；习题知识点关系表tkt包括习题的编号、习题类型和专家标注的知识点信息，每个习题包括一到三个核心知识点；

；

删除相似用户集users_0中不合格的用户；形成最终的新用户A的相似用户集users_A，; />表示为第i个用户，/>为相似用户集中用户的总数。

3.根据权利要求1所述的基于DKT与汤普森采样算法的习题推荐方法，其特征在于，利用汤普森用户采样模型，在新用户的相似用户集中抽取相似用户所做过的习题，建立习题推荐列表并推荐给新用户进行作答；包括：

；

习题难度计算公式如下：

；

4.根据权利要求1所述的基于DKT与汤普森采样算法的习题推荐方法，其特征在于，习题抽取策略，包括：

首轮习题抽取时，根据包含m个用户的用户集，对每个用户/>的做题记录/>，选择习题难度/>的习题，其中，/>为用户做题记录中习题难度/>的中位数，创建第一轮包含m道习题的推荐列表TestA_1；

5.根据权利要求1所述的基于DKT与汤普森采样算法的习题推荐方法，其特征在于，更新汤普森用户采样模型的参数的策略为：当新用户A正确作答从用户的做题记录中抽取的习题时，用户/>贝塔分布/>中的/>参数增加1，反之，用户A未能正确回答，则/>参数增加1。

6.根据权利要求1所述的基于DKT与汤普森采样算法的习题推荐方法，其特征在于，深度知识追踪模型采用基于注意力机制，包括嵌入层、多头注意力层、编码器、解码器及预测层；根据输入的新用户A做题记录数据，深度知识追踪模型输出预测的新用户A在未作答习题上的答题正确率向量；具体实现过程包括：

；

其中，、/>和/>为交互矩阵/>经过不同的权重矩阵投影生成，/>归一化操作将数值转为概率分布，/>为掩码操作，表现为与一个全为1的下三角矩阵进行“与”操作；为计算后的注意力得分，/>为多头合并操作，/>是权重矩阵；

；

其中，W₃、W₄为全连接层的权重，b₃、b₄为全连接层的偏置，为解码器的输出，h₁为中间特征向量，y为预测的用户正确回答习题的概率向量；

；

7.根据权利要求1所述的基于DKT与汤普森采样算法的习题推荐方法，其特征在于，将深度知识追踪模型输出的新用户在未作答习题上的答题正确率向量，输入汤普森知识点采样模型，得到为新用户进行习题推荐的汤普森知识点采样模型；包括：

；

其中，是与知识点/>相关的所有习题的集合；/>是新用户A答对习题/>的正确概率；/>是习题/>对知识点/>的影响因子，表示该习题在评估知识点/>的掌握程度时的权重大小；

；

8.根据权利要求1所述的基于DKT与汤普森采样算法的习题推荐方法，其特征在于，通过汤普森知识点采样模型，抽取习题建立习题推荐列表推荐给新用户，并采集新用户本次的做题结果信息；包括：

对每个知识点的贝塔分布进行采样，得到每个知识点的采样数值/>；

9.根据权利要求1-8任一所述的基于DKT与汤普森采样算法的习题推荐方法，其特征在于，根据用户本次做题结果和更新后的用户未作答习题的答题正确率向量，结合知识点关系表更新汤普森知识点采样模型的贝塔分布参数；包括：

；

。

10.基于DKT与汤普森采样算法的习题推荐系统，其特征在于，包括：