CN117556381B

CN117556381B - 一种面向跨学科主观试题的知识水平深度挖掘方法及系统

Info

Publication number: CN117556381B
Application number: CN202410009208.3A
Authority: CN
Inventors: 王志锋; 侯玉林; 何贝; 李军; 左明章
Original assignee: Seal Cutting Time Technology Wuhan Co ltd; Central China Normal University
Current assignee: Seal Cutting Time Technology Wuhan Co ltd; Central China Normal University
Priority date: 2024-01-04
Filing date: 2024-01-04
Publication date: 2024-04-02
Anticipated expiration: 2044-01-04
Also published as: CN117556381A

Abstract

本发明属于个性化学习技术领域，公开了一种面向跨学科主观试题的知识水平深度挖掘方法及系统，包括：提取学习者特征、跨学科主观试题特征、学习者‑试题交互特征，引入深度神经网络对学习者和试题的交互信息进行挖掘；结合模糊逻辑对学习者在主观试题上的答题情况进行表征，基于深度模糊神经网络对学习者在主观试题上的知识认知状态进行预测；利用学习者与试题之间的交互信息，在对学习者知识水平深度挖掘的同时，对试题区分度以及试题所涉及知识点难度进行预测。本发明公开的方法有利于提高模型在学习者试题表现和知识认知状态的预测准确度性能，优化了模型的收敛速率和训练速率，从技术层面助力智慧教育的落地。

Description

一种面向跨学科主观试题的知识水平深度挖掘方法及系统

技术领域

本发明属于个性化学习技术领域，尤其涉及一种面向跨学科主观试题的知识水平深度挖掘方法及系统。

背景技术

学习诊断指对个体的认知过程、加工技能或知识结构的诊断评估，它建立在传统测验理论之上。随着心理测量学和认知心理学的发展，人们不满足于只关注个体宏观层次的能力水平评估，还希望深入了解个体内部微观心理加工过程。学习诊断被视为新一代测验理论的核心，它把认知与测量结合起来，不仅在宏观能力层面对个体进行评估，还对个体内部微观认知结构进行诊断，进一步揭示个体内部心理加工过程。

在智能教育系统中，学习诊断旨在发现学习者在学习过程中的状态，例如学习者对特定知识点的掌握程度。目前，较为主流的学习诊断方法根据学习者正确回答问题所需的知识、技能、策略等，即学习者的认知属性如何影响问题的作答概率，可以分为简化的学习诊断方法和饱和的学习诊断方法。简化的学习诊断方法假设不同的认知属性组合对学习者答对问题的概率影响不同，有些方法假设学习者缺少任何一个属性都会导致错误回答问题，也就是说学习者缺少任何一个属性答对问题的概率与学习者缺少所有属性答对问题的概率完全一样。例如经典的决定型输入、噪音与门模型方法，其假设学习者正确回答问题需掌握该问题测量的全部属性，缺少任何一个属性都会导致学习者错误回答或回答正确概率很低。另一些方法假设学习者掌握任何一个属性都会正确回答问题，也就是说学习者掌握任何一个属性与掌握所有属性答对问题的概率完全相同。例如经典的决定型输入、噪音或门模型方法，其假设学习者只要掌握了问题所要测量的任何一个属性，就可以正确回答问题。然而由于测验项目的认知加工过程不尽相同，如果仅采用一种简化的学习诊断方法来分析整个测验项目，则有可能导致数据与使用的模型方法不拟合，从而影响数据结果的正确性和可靠性。由此，学者开发出了饱和的学习诊断方法，这种方法没有严格的属性作用机制假设，方法更加灵活，适用面也更加广泛。

传统的学习诊断方法通常采用人工设计的项目反应函数来挖掘学习者在答题过程中与试题的交互过程，这种交互通常是线性的，不足以捕捉学习者和问题之间复杂的关系。基于这种使用自动学习复杂交互作用的方法来代替人工设计的交互函数进行学习诊断的需求，学者开发出了一种利用神经网络来学习复杂的非线性相互作用的学习诊断方法，用来获得准确和可解释的诊断结果。然而，无论是经典的诊断方法还是基于神经网络的诊断方法，现有方法仍然存在一些局限性。首先，目前的学习诊断方法多数只能针对单一学科进行诊断，而不同学科之间学习者试题交互的共性信息没有被充分挖掘；其次，传统的学习诊断方法只能基于简单的客观题来对学习者的知识水平进行评估，而蕴含着更多信息的主观试题在很大程度上没有得到充分的挖掘，同时，与客观题相比，主观试题通常没有预设的标准答案，对于主观试题的回答，根据评判者的主观判断，可以是完全正确、部分正确或完全错误的，因此学习者很难通过猜测来正确回答主观试题，或因粗心而导致出错，所以不能简单按照客观题的模式对主观试题进行诊断。总而言之，寻找一种针对主观试题的学习诊断方式是很有必要的。

通过上述分析，现有技术存在的问题及缺陷为：

（1）传统的学习诊断方法通常采用人工设计的交互函数来对学习者的答题过程进行诊断，这种方法只是线性地将学习者和问题的特征相乘结合起来，无法挖掘学习者和问题之间更加复杂的关系。

（2）传统的学习诊断方法通常只针对单一学科进行诊断，无法采用一种方式对不同学科的学习者-试题交互序列中的共性信息进行充分挖掘。

（3）传统的学习诊断方法通常只能对客观试题进行诊断，对于主观试题则无法获得较好的诊断结果。

（4）传统的学习诊断方法大多数只关注到了对学习者本身知识认知状态的诊断，而忽视了对问题所包含信息的诊断。

发明内容

针对现有技术存在的问题，本发明提供了一种面向跨学科主观试题的知识水平深度挖掘方法及系统。

本发明是这样实现的，一种面向跨学科主观试题的知识水平深度挖掘方法，包括：

S1，提取学习者特征、跨学科主观试题特征、学习者-试题交互特征，基于多维项目反应理论设计学习-反应交互函数对学习者和试题的交互信息进行建模；

S2，基于深度模糊神经网络对学习者在主观试题上的答题情况进行表征，基于教育测量理论构建预测层对学习者在主观试题上的成绩进行预测，同时利用学习-反应交互函数进一步挖掘学习者的知识水平；

S3，利用学习者与试题之间的交互信息，在对学习者知识水平深度挖掘的同时，对试题区分度以及试题所涉及知识点难度进行预测。

进一步，所习者特征、跨学科主观试题特征、学习者-试题交互特征，按多维项目反应理论的思路组合各种表征，使用跨学科主观试题特征与学习者特征和试题本身的难度表征进行元素级乘法，并将这个结果与试题区分度表征相乘，作为学习者和试题之间的交互函数；学习者特征和试题特征为学习者和试题的独热编码表示向量，试题本身的难度表征为试题所考察的每个知识点的难度，试题区分度表征为试题区分不同知识掌握程度的学习者的能力矩阵。

进一步，对学习者进行表征的具体过程包括：

为每个学习者创建一个知识点数量维度的向量表示，将学习者ID经嵌入层转换之后，得到一个学习者嵌入矩阵；构建预测层，使用逻辑斯蒂函数对学习者嵌入矩阵的每个元素进行压缩，将其归一化在区间[0, 1]内；将压缩之后的矩阵乘以变换因子a（a>0.5），并加上变换因子b（b<0.5），将其元素限制在区间[b, a + b]内，从而将学习者特征向量的分布从[0, 1]改为[b, a + b]，使其更好地与其它特征向量的分布相匹配；

对学习者在主观试题上的答题情况进行表征的过程为：将学习者在主观试题上的得分归一化到[b, a + b]区间。

进一步，基于教育测量理论构建预测层对学习者在主观试题上的成绩进行预测包括：

根据使用跨学科主观试题特征与学习者特征和试题本身的难度表征进行元素级乘法，并将结果与试题区分度表征相乘，构建的学习-反应交互函数公式为：

式中，表示模型的输入；表示跨学科主观试题特征；表示学习者特征；表示试题本身的难度表征；表示试题区分度表征；

基于模糊逻辑构建模糊神经网络，以学习-反应交互函数作为输入，模糊神经网络包括模糊层、归一化层、加权层、输出层，具体表示为：

模糊层：对于输入数据，将其映射到模糊子集并计算其隶属度，计算隶属度的公式为：

式中，表示第个神经元的第个成员函数，其中每个神经元代表一个模糊规则的前提，每个成员函数代表一个特征，对每个特征应用单独的成员函数；表示输入张量，表示第个神经元第个成员函数中心的可训练权重，表示第个神经元第个成员函数宽度的可训练权重；

根据构建的模糊处理逻辑计算模糊层的输出，公式如下：

式中，表示第个神经元的输出，表示扩充张量之后的输入；

归一化层：将模糊层的输出数据输入归一化层进行归一化调整，使得每个神经元的输出值与上一层神经元的总输出值之比保持一致，计算归一化的公式为：

式中，表示第个神经元归一化之后的输出，表示第个神经元的输出，表示上一层神经元的输出总值；

加权层：根据输入特征和神经元的权重，计算加权偏差，加权偏差计算公式为：

首先根据输入特征和神经元的权重，计算加权偏差，加权偏差计算公式为：

式中，表示原始输入特征的数量，表示权重参数向量，表示输入特征向量；

然后根据前一个相关神经元的输出和加权偏差，计算当前神经元的输出结果，计算公式为：

式中，表示当前神经元的输出结果，表示加权偏差，表示归一化层中第个神经元的输出结果；

输出层：对前一层的输出结果进行求和操作，得到每个样本的非加权和，求和公式为：

式中，对前一层的输出结果进行求和操作，得到每个样本的非加权和，求和公式为：

式中，表示第k个神经元，表示神经元的总数，表示前一层的输出结果；

根据学习-反应交互函数和模糊神经网络对学习者在主观试题上的成绩进行预测，构建损失函数计算训练过程中预测值和真实值之间的差值，公式为：

式中，表示模型预测的学习者成绩，表示学习者的真实成绩；

将学习-反应交互函数输入模糊神经网络，产生的输出就是学习者在主观试题上的预测成绩。

进一步，利用学习-反应交互函数进一步挖掘学习者的知识水平包括：

获取一个学习者ID，将学习者ID输入嵌入层中进行转换得到一个学习者嵌入向量，并乘以一个可训练的矩阵；使用逻辑斯蒂函数对学习者嵌入矩阵的每个元素进行压缩，将其归一化在区间[0, 1]；嵌入层公式为：

式中，表示学习者嵌入向量，表示嵌入的数量，表示每个嵌入的维度；

学习者特征经过模型的训练之后，获取的的数据部分就是需要的学习者知识水平。

进一步，对试题区分度以及试题所涉及知识点难度进行预测包括：

S101，获取试题的ID，将试题ID输入到试题区分度嵌入中进行转换，将转换之后的结果放入深度神经网络进行训练，对试题区分度进行预测；

S102，获取试题ID，将试题ID输入到试题难度嵌入中进行转换，将转换之后的结果放入深度神经网络进行训练，对试题难度进行预测。

进一步，S101的具体过程包括：

将试题ID输入试题区分度嵌入层中进行转换得到一个试题区分度嵌入向量，并乘以一个可训练的矩阵；使用逻辑斯蒂函数对学习者嵌入矩阵的每个元素进行压缩，将其归一化在区间[0, 1]；试题区分度嵌入层公式为：

式中，表示试题区分度嵌入向量，表示嵌入的数量，表示每个嵌入的维度，用来表示试题的区分度；

试题区分度计算公式为：

式中，为试题区分度表征，B是一个可训练的矩阵，其大小为试题数量1；试题区分度作为学习-反应交互函数的一部分，经过模糊神经网络训练之后，将结果放大10 倍，获取的数据就是试题区分度预测；

S102的具体过程包括：

将试题ID输入试题难度嵌入层中进行转换得到一个试题难度嵌入向量，并乘以一个可训练的矩阵；使用逻辑斯蒂函数对学习者嵌入矩阵的每个元素进行压缩，将其归一化在区间[0, 1]；试题难度嵌入层公式为：

式中，表示试题难度嵌入向量，表示嵌入的数量，表示每个嵌入的维度，用来表示试题的难度；

试题难度计算公式为：

式中，为试题难度表征，D是一个可训练的矩阵，其大小为试题数量知识点数量；试题难度作为学习-反应交互函数的一部分，经过模糊神经网络训练之后，获取的数据就是试题难度预测。

本发明的另一目的在于提供一种实施所述面向跨学科主观试题的知识水平深度挖掘方法的面向跨学科主观试题的知识水平深度挖掘预测系统，包括：

学习者试题信息融合量化模块，用于从学习者试题交互数据中采集学习者特征、跨学科主观试题特征和学习者-试题交互特征，利用嵌入技术提取出学习者表征、试题区分度表征以及试题所涉及知识点难度表征，基于多维项目反应理论将其组合得到学习者与试题之间的学习-反应交互函数；

基于模糊逻辑的学习者主观试题表现分析模块，用于结合学习者与试题之间的学习-反应交互函数，引入模糊逻辑构建深度模糊神经网络，以学习者与试题之间的学习-反应交互函数作为输入，获取学习者在主观试题上的表现预测；

统计量构建模块，用于结合学习者和试题的表征信息，利用嵌入技术获取嵌入向量，经归一化处理之后得到向量的数据部分，获取学习者的知识水平、试题所涉及知识点的难度及试题区分度。

本发明的另一目的在于提供一种计算机设备，计算机设备包括存储器和处理器，存储器存储有计算机程序，计算机程序被处理器执行时，使得处理器执行所述的面向跨学科主观试题的知识水平深度挖掘方法的步骤。

本发明的另一目的在于提供一种计算机可读存储介质，存储有计算机程序，计算机程序被处理器执行时，使得处理器执行所述的面向跨学科主观试题的知识水平深度挖掘方法的步骤。

本发明的另一目的在于提供一种信息数据处理终端，信息数据处理终端用于实现所述的面向跨学科主观试题的知识水平深度挖掘系统。

结合上述的技术方案和解决的技术问题，本发明所要保护的技术方案所具备的优点及积极效果为：

第一，本发明解决上述现有技术技术问题的意义：

（1）本发明在设计学习诊断任务中的交互函数时，提取了学习者特征和试题特征，利用深度神经网络强大的拟合能力模拟学习者和试题之间的交互过程，有利于提高学习诊断的准确性，使教育者能够更好地理解学习者的学习需求和问题所在，从而更好地开展个性化教育。

（2）本发明提出一种面向跨学科主观试题的学习者知识水平深度挖掘方法，设计了一种能够提取不同学科中学习者和主观试题之间的交互信息的处理框架，有助于获取学习者在多个学科领域的学习表现和需求的全面信息，使教育者能够更全面地评估学习者的整体知识水平。

（3）本发明提出一种面向跨学科主观试题的学习者知识水平深度挖掘方法，引入模糊逻辑来处理主观试题得分情况，利用深度学习挖掘学习者在主观试题上的答题过程，从而更加全面地评估学习者在主观试题上的知识水平，这对于涵盖各种知识领域和学科的教育系统非常有意义。

（4）本发明在关注学习者认知状态的同时，还增加了对问题所涉及知识点难度和问题本身区分度的诊断，通过这些诊断信息，教育者可以更好地理解学习者在特定知识点上的困难，从而改进教学内容和方法，有助于提高教学质量和学习成效。

第二，本发明和现有技术的效果的对比分析如下：

（1）传统的学习诊断方法仅采用人工设计的交互函数来对学习者的答题过程进行诊断，却忽视了学习者和试题之间，尤其是含有更丰富语义信息的跨学科主观试题之间的复杂关系，在性能方面仍有待提高。本发明充分利用了学习者和跨学科主观试题之间的复杂关系，基于多维项目反应理论设计了交互函数表示的方法，更好地表征了学习者和试题信息；

（2）传统的学习诊断方法仅针对单一学科进行诊断，无法采用一种方式对不同学科的学习者-试题交互序列中的共性信息进行充分挖掘，忽视了不同学科之间学习者-试题交互序列中的相似性，因为在现实的学习中，问题和挑战通常不是单一学科所涉及的。本发明设计了一种能够提取不同学科中学习者和主观试题之间的交互信息的处理框架，有助于获取学习者在多个学科领域的学习表现和需求的全面信息，使得教育者能够更加全面地评估学习者的整体知识水平。

（3）传统的学习诊断方法仅能对有着明确二分类回答的客观试题进行诊断，忽略了含有更多信息的主观试题。本发明利用模糊逻辑来表征学习者对主观试题的答题情况，通过捕捉不是严格对与错的主观试题答案的模糊性，能够增强学习者的知识水平信息，提高预测的效果；

（4）传统的学习诊断方法大多数仅能诊断出学习者本身的知识水平，而没有在试题乃至知识点层面上进行诊断。本发明将学习者特征和试题特征组合成为学习诊断的交互函数，并利用深度神经网络对其进行更新，从而解决了在分析学习者知识水平的同时对试题区分度和知识点难度进行诊断的实现问题。

第三，本发明提出的面向跨学科主观试题的学习者知识水平深度挖掘方法在学习者主观试题知识状态预测方面明显优于传统的学习诊断方法，实验表明在RMSE、Loss等方面，本发明提出的方法比其他传统学习诊断方法更有效，此外本发明对学习者的知识水平进行量化，有利于可视化的学习分析。

第四，本发明的技术方案转化后的预期收益和商业价值为：

本发明提出的面向跨学科主观试题的学习者知识水平深度挖掘方法能够更好地量化和预测学习者的学习知识状态，助力了智慧教育的落地，具有巨大的商业价值。

针对如何在主观试题训练数据上保证较好的预测性能，本发明使用深度模糊神经网络对学习者在主观试题上的答题情况进行提取，结合学习者的试题表现预测学习者的知识水平。

传统学习诊断方法对学习者知识水平的捕捉较为粗粒度，且无法解决主观试题的诊断问题，本发明充分考虑主观试题的得分特点以及学习者与主观试题之间复杂的交互过程，引入深度模糊神经网络完成对学习者知识水平的预测，提高分析结果的可靠性，帮助学习者更有针对性地完成自己的学习计划。

传统学习诊断方法仅采用人工设计的交互函数来提取学习者和试题之间的线性关系，却忽视了试题中蕴含的复杂的非线性信息，本发明基于多维项目反应理论设计学习-反应交互函数，使用深度神经网络拟合学习者和试题之间的非线性交互信息，从而完善对于模型的结构构建，得到更准确的分析结果。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对本发明实施例中所需要使用的附图做简单的介绍，显而易见地，下面所描述的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下还可以根据这些附图获得其他的附图。

图1是本发明实施例提供的面向跨学科主观试题的者知识水平深度挖掘方法流程图；

图2是本发明实施例提供的面向跨学科主观试题的学习者知识水平深度挖掘方法原理图；

图3是本发明实施例提供的面向跨学科主观试题的者知识水平深度挖掘系统结构示意图；

图4是本发明实施例提供的数据集在RMSE的实验结果对比示意图；

图5是本发明实施例提供的数据集在Loss的实验结果对比示意图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

针对现有技术存在的问题，本发明提供了一种面向跨学科主观试题的知识水平深度挖掘方法及系统，下面结合附图对本发明作详细的描述。

本发明实施例的两个具体实施例为：

实施例 1 - 多元化在线教育平台的学习效果评估与课程推荐系统

全面评估学习者表现：在多学科在线教育平台中，收集学习者在各种主观试题上的答题数据，包括文本回答、案例分析等。分析学习者的回答风格、理解深度和创新能力。

动态学习路径调整：通过深度挖掘方法实时评估学习者的知识掌握水平和学习风格。根据评估结果，动态调整学习者的学习路径，推荐适合其当前水平和兴趣的课程。

交互式学习体验优化：利用学习者-试题交互分析，为学习者设计更具交互性和挑战性的学习任务，以提高学习者的参与度和满意度。

个性化反馈和引导：为学习者提供个性化的学习反馈，指出其在不同学科的强项和待改进区域，同时提供专业的学习建议和资源。

实施例 2 - 专业研究型大学的跨学科研究生教育评价系统

综合评价研究生学术表现：在跨学科研究生教育中应用该系统，深入分析学生在多学科研究项目中的表现，包括论文写作、实验设计、数据分析等方面。

科研能力映射：基于深度学习技术，分析学生在科研项目中的创新能力、问题解决能力和团队协作能力。

个性化科研路径规划：根据学生的表现和兴趣，为其规划个性化的科研路径，包括推荐合适的导师、研究课题和实验室。

教学与科研相结合的反馈机制：为教师提供关于学生跨学科知识掌握和科研能力的全面反馈，帮助他们更好地指导学生的学习和研究。

本发明主要针对以下现有技术的问题和缺陷进行改进，实现显著的技术进步：

有限的个性化学习分析：传统的学习者评估方法往往缺乏对个体学习特性的深入理解，导致不能有效地提供个性化的学习支持和建议。

对复杂数据的处理不足：在跨学科主观试题的分析中，现有技术往往难以充分处理和解释复杂的学习者-试题交互数据。

缺乏动态和多维度分析：以往的技术多侧重于静态的成绩评估，缺乏对学习者知识掌握的动态跟踪和多维度深度分析。

本发明解决现有技术问题所带来的技术效果和显著技术进步：

提高个性化学习支持的能力：本发明能够提供更精细化的学习者特征分析，从而支持更个性化的学习建议和资源匹配。

增强数据处理和分析能力：通过深度学习和模糊逻辑的结合，本发明显著提高了对复杂学习数据的处理和分析能力。

动态和多维度的知识水平评估：本发明能够实现对学习者知识水平的动态追踪和多维度深度分析，有助于更全面地理解学习者的学习状态和进步。

如图1所示，本发明实施例提供的面向跨学科主观试题的知识水平深度挖掘方法包括以下步骤：

本发明实施例提供的面向跨学科主观试题的学习者知识水平深度挖掘方法原理图如图2所示。

如图3所示，本发明实施例提供的面向跨学科主观试题的学习者知识水平深度挖掘系统包括：

本发明实施例涉及的符号如表1所示。

表 1 本发明实施例涉及的符号

本发明实施例提供的面向跨学科主观试题的学习者知识水平深度挖掘方法具体包括：

（1）提取学习者特征、跨学科主观试题特征、学习者-试题交互特征，基于多维项目反应理论设计学习-反应交互函数对学习者和试题的交互信息进行建模；

（2）基于深度模糊神经网络对学习者在主观试题上的答题情况进行表征，基于教育测量理论构建预测层对学习者在主观试题上的成绩进行预测，同时利用学习-反应交互函数进一步挖掘学习者的知识水平；

（3）利用学习者与试题之间的交互信息，在对学习者知识水平深度挖掘的同时，对试题区分度以及试题所涉及知识点难度进行预测。

本发明实施例提供的步骤一，具体包括：

（1.1）从学习者试题交互序列中采集学习者特征、跨学科主观试题特征、学习者-试题交互特征：

选取云南省13所高中的129个班级共6220个学习者在2023年10月月考中面向高二年级学习者对于语文、数学、英语、物理、历史学科试题的交互数据，组成数据集Multidisciplinary2023，其中包含的交互数、知识点数、试题数、学习者数如下表2所示；

表 2 数据集Multidisciplinary2023的相关信息

从数据集Multidisciplinary2023中选择学习者特征、跨学科主观试题特征和学习者-试题交互特征，选择的学习者相关特征以及试题相关特征如下表3所示。

表 3 数据集Multidisciplinary2023中选择的特征

（1.2）针对学习者特征，使用嵌入技术，获取学习者的特征向量表示：

为每个学习者创建一个知识点数量维度的向量表示，将学习者ID经嵌入层转换之后，得到一个学习者嵌入矩阵；

使用逻辑斯蒂函数对学习者嵌入矩阵的每个元素进行压缩，将其归一化在区间[0, 1]内；

将压缩之后的矩阵乘以变换因子a（a>0.5），并加上变换因子b（b<0.5），将其元素归一化在区间[b, a + b]内，此处将变换因子a设置为0.6，变换因子b设置为0.2，从而将学习者特征向量的分布从[0, 1]改为[0.2, 0.8]，使其更好地与其它特征向量的分布相匹配。

（1.3）针对跨学科主观试题特征，将试题与知识点进行关联：

获取试题ID，将其转换为独热编码形式，然后将独热编码与知识点Q矩阵相乘，得到试题表征；

针对试题的区分度特征，将试题ID输入试题区分度嵌入层中进行转换得到一个试题区分度嵌入向量，并乘以一个可训练的矩阵；使用逻辑斯蒂函数对学习者嵌入矩阵的每个元素进行压缩，将其归一化在区间[0, 1]；试题区分度嵌入层公式为：

试题区分度计算公式为：

式中，为试题区分度表征，是一个可训练的矩阵，其大小为试题数量1；

针对试题难度特征，将试题ID输入试题难度嵌入层中进行转换得到一个试题难度嵌入向量，并乘以一个可训练的矩阵；使用逻辑斯蒂函数对学习者嵌入矩阵的每个元素进行压缩，将其归一化在区间[0, 1]；试题难度嵌入层公式为：

试题难度计算公式为：

式中，为试题难度表征，是一个可训练的矩阵，其大小为试题数量知识点数量。

（1.4）提取学习者-试题交互特征，使用试题特征与学习者特征和试题本身的难度表征进行元素级乘法，并将结果与试题区分度表征相乘，构建的学习-反应交互函数公式为：

式中，表示模型的输入；表示所述试题特征；表示所述学习者特征；表示所述试题本身的难度表征；表示所述试题区分度表征。

本发明实施例提供的步骤二，具体包括：

（2.1）引入模糊逻辑构建深度模糊神经网络，以学习-反应交互函数作为输入，模型包括模糊层、归一化层、加权层、输出层，具体可以表现为：

式中，表示模糊层中第个神经元的第个成员函数，表示模糊层中第个神经元的输出，表示归一化层中第个神经元归一化之后的输出，表示加权层中的加权偏差，表示加权层中当前神经元的输出结果，表示输出层的输出结果；

（2.2）根据所述学习-反应交互函数和所述深度模糊神经网络对学习者在主观试题上的成绩进行预测，构建损失函数计算训练过程中预测值和真实值之间的差值，公式为：

将所述学习-反应交互函数输入所述深度模糊神经网络，产生的输出就是学习者在主观试题上的预测成绩；

（2.3）计算学习者的知识水平，获取一个学习者ID，将学习者ID输入嵌入层中进行转换得到一个学习者嵌入向量，并乘以一个可训练的矩阵；使用逻辑斯蒂函数对学习者嵌入矩阵的每个元素进行压缩，将其归一化在区间[0, 1]；嵌入层公式为：

学习者知识水平计算公式如下：

其中表示一个可训练的实数矩阵，其行数为学习者的数量，列数为知识点的数量，经过模型的训练之后，获取的数据部分就是需要的学习者知识水平。

本发明实施例提供的步骤三，具体包括：

（3.1）对试题的区分度进行预测：

试题区分度计算公式为：

式中，为试题区分度表征，是一个可训练的矩阵，其大小为试题数量1；试题区分度作为所述学习-反应交互函数的一部分，经过所述深度模糊神经网络训练之后，将结果放大10倍，获取的数据就是试题区分度预测；

（3.2）对试题的难度进行预测：

试题难度计算公式为：

式中，为试题难度表征，是一个可训练的矩阵，其大小为试题数量知识点数量；试题难度作为所述学习-反应交互函数的一部分，经过所述深度模糊神经网络训练之后，获取的数据就是试题难度预测。

作为优选，本发明实施例提供的面向跨学科主观试题的知识水平深度挖掘方法包括：

步骤一，提取学习者因素和跨学科主观试题因素，利用嵌入技术对学习者因素和跨学科主观试题因素加以表示；

步骤二，基于多维项目反应理论设计学习-反应交互函数，基于模糊逻辑构建深度模糊神经网络学习各因素之间的交互函数；

步骤三，基于教育测量理论构建预测层，根据学习者因素和跨学科主观试题因素预测学习者的成绩；

步骤四，计算学习者的知识水平、试题所涉及知识点的难度和试题本身区分度。

步骤一中，所述学习者因素表征了学习者的特质，这些特质会影响学习者对练习的反应；所述跨学科主观试题因素用来表征主观试题的特征，包括知识点难度和试题区分度。

步骤一中，所述利用嵌入技术对学习者因素和跨学科主观试题因素加以表示包括：

（1）学习者嵌入。首先，基于学习者与知识点的关联，为每个学习者创建一个知识点数量维度的向量表示，将学习者ID经嵌入层转换之后，得到一个学习者嵌入矩阵；然后使用逻辑斯蒂函数对学习者嵌入矩阵的每个元素进行压缩，将其限制在区间[0, 1]内；最后将压缩之后的矩阵乘以变换因子a（a>0.5），并加上变换因子b（b<0.5），将其元素归一化在区间[b, a + b]内，从而将学习者特征向量的分布从[0, 1]改为[b, a + b]，以便更好地与其它特征向量的分布相匹配。

（2）知识点难度嵌入。首先基于试题和知识点的关联，为每个试题创建一个知识点数量维度的嵌入表示，将知识点ID经过嵌入层转换之后，得到一个知识点难度矩阵；然后使用逻辑斯蒂函数对知识点难度嵌入矩阵的每个元素进行了压缩，将其归一化在区间[0, 1]内。

（3）试题区分度嵌入。首先将试题ID映射到一个实数表示区分度，试题ID经过嵌入层转换之后，得到一个试题区分度矩阵；然后使用逻辑斯蒂函数对试题区分度嵌入矩阵的每个元素进行压缩，将其归一化在区间[0, 1]内；最后将压缩之后的矩阵乘以10，将其元素归一化在区间[0, 10]内，从而放大试题区分度的影响，使得该特征更加重要。

步骤二中，所述基于模糊逻辑构建的模糊神经网络包括：

（1）模糊层。对于输入数据，将其映射到模糊子集并计算其隶属度。所述计算隶属度的公式为：

式中，表示第个神经元的第个成员函数，其中每个神经元代表一个模糊规则的前提，每个成员函数代表一个特征，对每个特征应用单独的成员函数；表示输入张量，表示第个神经元第个成员函数中心的可训练权重，表示第个神经元第个成员函数宽度的可训练权重。

将输入张量扩展为与输出神经元数量相同的维度，并重复填充，以便与模糊规则中的输入张量形状一致，扩充之后的输入由转换为，表示第个神经元的第个特征。

根据构建的模糊处理逻辑计算模糊层的输出，公式如下：

式中，表示第个神经元的输出，表示扩充张量之后的输入。

（2）归一化层。将模糊层的输出数据输入归一化层进行归一化调整，使得每个神经元的输出值与上一层神经元的总输出值之比保持一致。

首先计算每个样本中每个神经元输出的总和，然后将每个样本的总和复制若干次，复制的次数同归一化层输出的维度，最后进行归一化处理。所述计算归一化的公式为：

式中，表示第个神经元归一化之后的输出，表示第个神经元的输出，表示上一层神经元的输出总值。

（3）加权层。首先根据输入特征和神经元的权重，计算加权偏差。所述加权偏差计算公式为：

式中，表示原始输入特征的数量，表示权重参数向量，表示输入特征向量。

然后根据前一个相关神经元的输出和加权偏差，计算当前神经元的输出结果。所述计算公式为：

式中，表示当前神经元的输出结果，表示加权偏差，表示归一化层中第个神经元的输出结果。

（4）输出层。首先对前一层的输出结果进行求和操作，得到每个样本的非加权和。所述求和公式为：

式中，表示第k个神经元，表示神经元的总数，表示前一层的输出结果。

然后，根据输入数据的形状，将求和结果转换为适合最终输出的形状。此处所述的输入数据指前一层的输出结果。所述相关过程如下：

（4.1）利用切片操作获取输入数据除最后一维的所有维度，然后将这些维度组成一个新的元组。

（4.2）将新的元组和定义的输出维度拼接在一起，形成一个全新的元组，这个新元组代表整个模糊神经网络的输出形状。

对最终的输出应用逻辑斯蒂函数，将输出结果归一化到[0, 1]之间。

步骤三中，所述根据学习者因素和跨学科主观试题因素预测学习者的成绩包括：

（1）交互函数。根据步骤一中的学习者因素和跨学科主观试题因素，基于多维项目反应理论设计学习-反应交互函数，所述学习-反应交互函数公式为：

式中，表示模型的输入；表示步骤一中所述的试题因素，其中表示试题的独热编码，表示知识点Q矩阵；表示步骤一中所述的学习者因素，其中表示学习者的独热编码，表示一个可训练的实数矩阵，其行数为学习者的数量，列数为知识点的数量；表示步骤一中所述跨学科主观试题因素中的知识点难度，其中表示一个可训练的实数矩阵，其行数为试题的数量，列数为知识点的数量；表示步骤一中所述跨学科主观试题因素中的试题区分度，其中表示一个可训练的实数矩阵，其行数为试题的数量，列数为1。

（2）损失函数。根据主观试题数据连续性的特点，采取回归策略训练模型，因此将损失函数定义为模型的输出和学习者的实际得分对应点误差的平方和的均值MSE。所述损失函数公式为：

（3）计算学习者正确回答问题的概率。将步骤三（1）中定义的学习-反应交互函数作为步骤二所述深度模糊神经网络的输入，依次通过神经网络的每一层，获取预测的学习者成绩。

步骤三（3）中，所述预测学习者成绩包括：

（3.1）在训练步骤开始时，将优化器中的梯度值清零，确保每个批次的梯度计算都是基于当前批次的损失函数计算的。

（3.2）通过正向传播过程获取模型预测的学习者成绩。

（3.3）将获取到的模型预测的学习者成绩和学习者的实际得分计算损失。

（3.4）调用反向传播算法计算损失函数关于模型参数的梯度，用来进行参数的更新。

（3.5）采用梯度下降算法对模型参数进行一次更新，逐步降低模型的损失函数值。

（3.6）修正权值，将所有权值为负的设置为0，正值保持不变，确保梯度只朝着使损失函数变小的方向更新参数。

进一步，步骤三（3.6）中，所述修正权值包括：

（3.6.1）获取模块的权重数据。

（3.6.2）对权重数据进行处理，首先将权重数据取负，然后使用relu函数将负值变为0，得到一个全为非负值的张量。

（3.6.3）将张量加到原权重数据上，实现将负值变为0的操作。

步骤四中，所述计算学习者的知识水平、试题所涉及知识点的难度和试题本身区分度包括：

（1）计算学习者的知识水平。经过训练之后，所述步骤三中的学习者因素就是获取的学习者的知识水平。首先接受一个学习者ID，将学习者ID输入到步骤一（1）所述学习者嵌入中进行转换；然后获取处理之后的嵌入向量的数据部分，获取的数据即为学习者的认知水平。

（2）计算试题所涉及知识点的难度。首先接受一个试题的ID，将试题ID输入到步骤一（2）所述知识点难度嵌入中进行转换；然后获取处理之后的嵌入向量的数据部分，获取的数据即为试题所涉及知识点的难度。

（3）计算试题本身的区分度。首先接受一个试题的ID，将试题ID输入到步骤一（3）所述试题区分度嵌入中进行转换；然后将转换之后的结果乘上因子10，将结果放大10倍，调整题目区分度的数值范围；最后获取处理之后的嵌入向量的数据部分，获取的数据即为试题本身的区分度。

本发明的应用实施例提供了一种计算机设备，计算机设备包括存储器和处理器，存储器存储有计算机程序，计算机程序被处理器执行时，使得处理器执行面向跨学科主观试题的知识水平深度挖掘方法的步骤。

本发明的应用实施例提供了一种计算机可读存储介质，存储有计算机程序，计算机程序被处理器执行时，使得处理器执行面向跨学科主观试题的知识水平深度挖掘方法的步骤。

本发明的应用实施例提供了一种信息数据处理终端，信息数据处理终端用于实现面向跨学科主观试题的知识水平深度挖掘系统。

本发明实施例中，主要开发环境包括：Windows10，RTX 2080Ti，Pytorch2.0.0，Python3.9，模型具体的超参数设置如下表4所示：

表 4 实验模型超参数设置

本发明将面向跨学科主观试题的学习者知识水平深度挖掘方法与传统学习诊断方法在主观试题上的表现进行对比，对比指标均方根误差RMSE和平均平方误差Loss。评价指标RMSE是一种用于衡量预测模型在连续性数据上的预测精度的指标，它衡量了预测值与真实值之间的均方根差异，数值越小表示预测结果越准确。Loss值能在一定程度上衡量预测值与真实值之间的偏差，数值越小表示决策结果越准确。

本发明将面向跨学科主观试题的学习者知识水平深度挖掘方法与传统学习诊断方法在主观试题上的表现进行对比，为了实现比较的公平，两个模型中涉及相同模块的相应超参数都设置为相同的，一种面向跨学科主观试题的学习者知识水平深度挖掘方法与传统学习诊断方法在主观试题上的表现在数据集下的RMSE、Loss对比结果如表5所示，其中训练采用完整的数据集，测试采用学生在历史学科上的表现数据；模型在数据集上训练过程示意图如图4、图5所示，其中图4展现了训练过程中RMSE的表现结果，图5展示了训练过程中Loss的表现结果。

表 5 不同方法的实验结果对比

由实验结果可知：本发明提出的面向跨学科主观试题的学习者知识水平深度挖掘方法在数据集上，最优的epoch对应的RMSE下降了21.3%，Loss下降了0.207。说明本发明考虑融入模糊逻辑构建深度模糊神经网络，提高了模型在预测学习者主观试题知识水平的精度，结果优于其他传统学习诊断方法。实验表明，在RMSE和Loss方面，本发明提出的面向跨学科主观试题的学习者知识水平深度挖掘方法比传统学习诊断方法在主观试题上的表现更有效，总之，本发明具有最佳的实验效果。

应当注意，本发明的实施方式可以通过硬件、软件或者软件和硬件的结合来实现。硬件部分可以利用专用逻辑来实现；软件部分可以存储在存储器中，由适当的指令执行系统，例如微处理器或者专用设计硬件来执行。本领域的普通技术人员可以理解上述的设备和方法可以使用计算机可执行指令和/或包含在处理器控制代码中来实现，例如在诸如磁盘、CD或DVD-ROM的载体介质、诸如只读存储器(固件)的可编程的存储器或者诸如光学或电子信号载体的数据载体上提供了这样的代码。本发明的设备及其模块可以由诸如超大规模集成电路或门阵列、诸如逻辑芯片、晶体管等的半导体、或者诸如现场可编程门阵列、可编程逻辑设备等的可编程硬件设备的硬件电路实现，也可以用由各种类型的处理器执行的软件实现，也可以由上述硬件电路和软件的结合例如固件来实现。

以上所述，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等，都应涵盖在本发明的保护范围之内。

Claims

1.一种面向跨学科主观试题的知识水平深度挖掘方法，其特征在于，包括：

S3，利用学习者与试题之间的交互信息，在对学习者知识水平深度挖掘的同时，对试题区分度以及试题所涉及知识点难度进行预测；

基于教育测量理论构建预测层对学习者在主观试题上的成绩进行预测包括：

；

根据构建的模糊处理逻辑计算模糊层的输出，公式如下：

；

式中，表示第个神经元的输出，表示扩充张量之后的输入；

；

根据学习-反应交互函数和深度模糊神经网络对学习者在主观试题上的成绩进行预测，构建损失函数计算训练过程中预测值和真实值之间的差值，公式为：

；

将学习-反应交互函数输入深度模糊神经网络，产生的输出就是学习者在主观试题上的预测成绩。

2.如权利要求1所述的面向跨学科主观试题的知识水平深度挖掘方法，其特征在于，所述学习者特征、跨学科主观试题特征、学习者-试题交互特征，按多维项目反应理论的思路组合各种表征，使用跨学科主观试题特征与学习者特征和试题本身的难度表征进行元素级乘法，并将这个结果与试题区分度表征相乘，作为学习者和试题之间的学习-反应交互函数；学习者特征和跨学科主观试题特征为学习者和试题的独热编码表示向量，试题本身的难度表征为试题所考察的每个知识点的难度，试题区分度表征为试题区分不同知识掌握程度的学习者的能力矩阵。

3.如权利要求1所述的面向跨学科主观试题的知识水平深度挖掘方法，其特征在于，对学习者进行表征的具体过程包括：

为每个学习者创建一个知识点数量维度的向量表示，将学习者ID经嵌入层转换之后，得到一个学习者嵌入矩阵；构建预测层，使用逻辑斯蒂函数对学习者嵌入矩阵的每个元素进行压缩，将其归一化在区间[0, 1]内；将压缩之后的矩阵乘以变换因子a（a>0.5），并加上变换因子b（b<0.5），将其元素归一化在区间[b, a + b]内，从而将学习者特征向量的分布从[0, 1]改为[b, a + b]，使其更好地与其它特征向量的分布相匹配；

4.如权利要求1所述的面向跨学科主观试题的知识水平深度挖掘方法，其特征在于，利用学习-反应交互函数进一步挖掘学习者的知识水平包括：

；

5.如权利要求1所述的面向跨学科主观试题的知识水平深度挖掘方法，其特征在于，对试题区分度以及试题所涉及知识点难度进行预测包括：

6.如权利要求5所述的面向跨学科主观试题的知识水平深度挖掘方法，其特征在于，S101的具体过程包括：

；

试题区分度计算公式为：

；

式中，为试题区分度表征，B是一个可训练的矩阵，其大小为试题数量1；试题区分度作为学习-反应交互函数的一部分，经过深度模糊神经网络训练之后，将结果放大10倍，获取的数据就是试题区分度预测；

S102的具体过程包括：

；

试题难度计算公式为：

；

式中，为试题难度表征，D是一个可训练的矩阵，其大小为试题数量知识点数量；试题难度作为学习-反应交互函数的一部分，经过深度模糊神经网络训练之后，获取的数据就是试题难度预测。

7.一种实施如权利要求1~6任意一项所述面向跨学科主观试题的知识水平深度挖掘方法的面向跨学科主观试题的知识水平深度挖掘预测系统，包括：

8.一种计算机设备，计算机设备包括存储器和处理器，存储器存储有计算机程序，计算机程序被处理器执行时，使得处理器执行如权利要求1~6任意一项所述的面向跨学科主观试题的知识水平深度挖掘方法的步骤。

9.一种信息数据处理终端，信息数据处理终端用于实现如权利要求7所述的面向跨学科主观试题的知识水平深度挖掘系统。