CN117150151A

CN117150151A - 一种基于大语言模型的错题分析及试题推荐系统和方法

Info

Publication number: CN117150151A
Application number: CN202311436886.XA
Authority: CN
Inventors: 阚保春; 孙艺; 陈圆谜; 黄程韦; 朱晓明
Original assignee: Zhejiang Lab
Current assignee: Zhejiang Lab
Priority date: 2023-11-01
Filing date: 2023-11-01
Publication date: 2023-12-01
Anticipated expiration: 2043-11-01
Also published as: CN117150151B

Abstract

本发明公开了一种基于大语言模型的错题分析及试题推荐系统和方法，属于在线教育和自然语言处理技术领域，包括：获取学生做题的历史数据整合得到答题数据，将答题数据和人为给定的答题指令输入智能算法得到指令数据；指令数据作为训练数据，采用LoRA方案对大语言模型ChatGLM‑6B进行指令微调，经过优化器优化，得到训练好的错题分析模型，将答题数据输入训练好的错题分析模型得到错题分析结果；试题推荐模型，采用DINA算法和基于内容的协同过滤算法得到个性化习题，与错题分析结果一起发送给学生。本发明能够实现文字类全题型的在线错题分析，辅助教师进行教学，并为学生提供更具个性化、交互性好的试题推荐系统。

Description

一种基于大语言模型的错题分析及试题推荐系统和方法

技术领域

本发明涉及在线教育和自然语言处理技术领域，具体涉及一种基于大语言模型的错题分析及试题推荐系统和方法。

背景技术

在当前的在线教育领域中，面对海量的试题以及学习资源，学生很难根据自己的做题历史数据得到准确的错题分析和个性化的学习资源推荐。目前，错题分析主要以人工分析和专家规则为主，在线教育系统中一些选择题和填空题，有经验的老师或专家会预先定义出学生选择错误答案时可能的原因，但是简答题和应用题仍需要人工批阅并给出错题分析。另外，当前给学生推荐个性化的学习资源的方式，大多是基于规则或者传统的协同过滤算法，频繁推荐相似习题，并且普遍采用的协同过滤算法具有可解释性较差的问题，这也是在线教育行业中个性化推荐亟需克服的问题。

大语言模型（Large Language Model，LLM），也称大型语言模型，是一种人工智能模型，旨在理解和生成人类语言。它们在大量的文本数据上进行训练，拥有强大的语义理解和推理能力，可以执行广泛的自然语言任务，包括文本总结、翻译、情感分析等。

公开号为CN109977230A的专利文献公开了适合自适应教学的选择题错因分析方法，包括：通过将选择题的一个或多个选项设为正确选项，将剩余的选项设为错误选项，根据选择题的题干，确定与题干关联的知识点名称，根据错误选项对应的题干，获取与题干关联的知识点名称，根据错误选项的内容，获取用户输入的选择题的编号，判断编号对应的选项是否为正确选项，若否，则根据选项对应的题干，获取与题干关联的知识点名称、超纳米级知识点名称及超纳米级知识点内容并展示编号、超纳米级知识点名称及超纳米级知识点内容，利用通用语言模型对超纳米级知识点名称及超纳米级知识点内容进行语义分析。但是该发明仅仅涉及到对选择题的错因分析，对于简答题和应用题的错因分析并没有提及相关的解决办法。

公开号为CN107273490A的专利文献公开了一种基于知识图谱的组合错题推荐方法，包括：从大规模非结构化试题数据中抽取知识，构建知识图谱；对学习者的错题进行文本挖掘，分词，提取出错题关键字，进而确定该错题所包含的知识点；通过对试题的语义相识性进行分析，得到该知识点的语义近邻；通过错题知识点映射到知识图谱中，获得符合其知识点的试题实体；通过对试题库进行相识性权重计算，得到试卷的相识度矩阵，利用协同过滤技术得到错题的推荐试题；利用加权、混合、层叠和元级别等方式对两种推荐结果进行进一步组合，给出最终推荐结果。但是该发明采用构建知识图谱的方式，需要采集大量的学生数据，最终的推荐精度也十分依赖所构建的知识图谱的质量。

发明内容

本发明的目的是提供一种基于大语言模型的错题分析及试题推荐系统和方法，能够实现文字类全题型的在线错题分析，辅助教师进行教学，并为学生提供更具个性化、交互性好的试题推荐系统。

为实现上述发明目的，本发明提供的技术方案如下：

第一方面，本发明实施例提供的一种基于大语言模型的错题分析及试题推荐系统，包括以下模块：

数据处理模块，用于对采集到的做题记录、试题集合和错题解析数据整合得到答题数据，将所述答题数据和人为给定的答题指令输入智能算法并辅以人工标注审核得到指令数据；

错题分析模块，用于采用指令数据对ChatGLM模型进行指令微调构建错题分析模型，得到训练好的错题分析模型，将答题数据输入训练好的错题分析模型得到错题分析结果；

试题推荐模块，用于对错题分析结果进行解析，得到知识点集合1，与根据DINA算法得到的学生未掌握知识点集合2求并集，得到知识点列表，根据所述知识点列表在资源库中检索得到相关试题，采用基于内容的协同过滤算法对相关试题进行过滤，得到个性化试题，与错题分析结果一起发送给学生。

本发明提出采用大语言模型构建错题分析及试题推荐系统和方法，选取大语言模型中的ChatGLM-6B模型，运用训练速度块、计算需求低的LoRA微调方案，采集学生做题的历史数据构建指令数据作为训练数据集，将ChatGLM-6B模型训练为适用于错题分析及试题推荐场景的错题分析模型。

针对错题分析模型输出的错题分析结果进行解析，得到知识点集合1，采用DINA算法得到学生的知识点掌握度矩阵，将知识点集合1和知识点掌握度矩阵中的学生未掌握知识点集合2求并集，得到知识点列表，在资源库中进行检索得到知识点列表对应的相关试题。

为了进一步提升推荐的效果，本发明采用协同过滤算法对相关试题进行过滤，学生-试题矩阵中的元素0对应的试题内容为错题内容，计算错题内容与相关试题之间的相似度，人为设定阈值，过滤掉相似度低于阈值的相关试题，保留相似度不低于阈值的相关试题作为个性化习题，最后将个性化试题和错题分析结果一起发送给学生。

进一步的，数据处理模块中，所述做题记录包括试题编号、学生编号以及试题得分，所述试题集合包括试题编号、试题内容、试题答案以及考查知识点列表，所述错题解析数据包括试题编号、学生答题内容以及批注内容，所述答题数据包括试题内容、考查知识点列表以及学生答题内容。

进一步的，数据处理模块中，所述智能算法为ChatGPT-4，ChatGPT-4基于人为给定的答题指令对答题数据进行标注，得到答题结果，所述答题结果包括答题解析、解题步骤以及建议，所述人工标注审核为人工根据试题答案、批注内容对智能算法输出的答题结果进行审核，所述指令数据包括答题指令、答题数据以及答题结果。

进一步的，错题分析模块中，所述采用指令数据对ChatGLM模型进行指令微调构建错题分析模型，包括：

将指令数据中的答题指令和答题数据作为ChatGLM模型的输入，指令数据中的答题结果作为ChatGLM模型的真值标签，采用LoRA微调方案，将ChatGLM模型训练为适用于错题分析及试题推荐场景的错题分析模型。

进一步的，错题分析模块中，所述错题分析结果包括答题解析、解题步骤和建议。

进一步的，试题推荐模块中，所述根据DINA算法得到的学生未掌握知识点，包括：

基于学生编号、试题内容、试题得分构建学生-试题矩阵，其中，试题得分作为矩阵元素；

基于试题编号、考查知识点列表构建试题-知识点矩阵；

所述DINA算法基于学生-试题矩阵和试题-知识点矩阵，得到知识点掌握度矩阵；其中，知识点掌握度矩阵中的元素1对应的知识点为学生已掌握知识点，元素0对应的知识点为学生未掌握知识点。

进一步的，试题推荐模块中，所述采用基于内容的协同过滤算法对相关试题进行过滤，包括：

基于学生编号、试题内容、试题得分构建学生-试题矩阵；

学生-试题矩阵中的元素0对应的试题内容为错题内容，基于内容的协同过滤算法采用余弦相似度计算所述错题内容与相关试题的相似度，人为设定阈值并过滤掉相似度低于阈值的相关试题。

第二方面，为实现上述发明目的，本发明实施例还提供了一种基于大语言模型的错题分析及试题推荐方法，所述方法采用第一方面所述的基于大语言模型的错题分析及试题推荐系统，包括以下步骤：

步骤1：对采集到的做题记录、试题集合和错题解析数据整合得到答题数据，将所述答题数据和人为给定的答题指令输入智能算法并辅以人工标注审核得到指令数据；

步骤2：采用指令数据对ChatGLM模型进行指令微调构建错题分析模型，得到训练好的错题分析模型，将答题数据输入训练好的错题分析模型得到错题分析结果；

步骤3：对错题分析结果进行解析，得到知识点集合1，与根据DINA算法得到的学生未掌握知识点集合2求并集，得到知识点列表，根据所述知识点列表在资源库中检索得到相关试题，采用基于内容的协同过滤算法对相关试题进行过滤，得到个性化试题，与错题分析结果一起发送给学生。

第三方面，为实现上述发明目的，本发明实施例还提供了一种基于大语言模型的错题分析及试题推荐设备，包括存储器和处理器，所述存储器用于存储计算机程序，其特征在于，所述处理器用于当执行所述计算机程序时，实现第一方面所述的基于大语言模型的错题分析及试题推荐系统。

第四方面，为实现上述发明目的，本发明实施例还提供了一种计算机可读的存储介质，所述存储介质上存储有计算机程序，其特征在于，所述计算机程序使用计算机时，实现第一方面所述的基于大语言模型的错题分析及试题推荐系统。

本发明的有益效果如下：

(1)本发明提出的系统和方法采用大语言模型ChatGLM并进行基于LoRA方案的指令微调，以学生做题的历史数据构建指令数据并作为训练数据集，将ChatGLM模型训练为适用于错题分析及试题推荐场景的错题分析模型。解决了现有技术中，简答题和应用题需要人工批阅的问题，实现了文字类全题型的在线错题分析，并且学生和错题分析模型之间的交互能够进一步提升错题分析结果的准确性；

(2)本发明采用DINA算法构建了学生的知识点掌握度矩阵，并对错题分析结果中知识点相关的关键词进行解析得到知识点集合1，通过对知识点集合1和知识点掌握度矩阵中的学生未掌握知识点集合2求并集，得到学生未掌握的知识点列表，基于所述知识点列表检索获得具有一定个性化的相关试题。为了进一步提升相关试题的个性化，本发明还采用了协同过滤算法对相关试题进行过滤，只保留与学生错题内容相似度不低于阈值的相关试题作为个性化试题，与错题分析结果一起发送给学生；

(3)本发明提出的系统和方法能够实现文字类全题型的在线错题分析，具有模型简单、推荐系统个性化强的优势，且构建的错题分析模型具有较好的交互性。

附图说明

图1是本发明实施例提供的基于大语言模型的错题分析及试题推荐系统的结构示意图。

图2是本发明实施例提供的答题数据的示意图。

图3是本发明实施例提供的指令数据的示意图。

图4是本发明实施例提供的试题推荐模块构建的矩阵示意图。

图5是本发明实施例提供的基于大语言模型的错题分析及试题推荐方法的流程图。

具体实施方式

为使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例对本发明进行进一步的详细说明。应当理解，此处所描述的具体实施方式仅用以解释本发明，并不限定本发明的保护范围。

本发明的技术构思为：针对当前的在线教育系统中，学生很难根据自己的做题历史数据得到准确的错题分析和个性化的学习资源推荐，学生的简答题和应用题的错题分析主要依靠人工分析实现，而对学生的个性化学习资源推荐方法又存在习题个性化不强、推荐模型构建复杂、模型交互性差等问题。

本发明提出采用大语言模型构建错题分析及试题推荐系统和方法，选取大语言模型中的ChatGLM-6B模型，基于学生做题的历史数据构建指令数据作为训练数据集，运用与该模型适配性较好的LoRA指令微调方案，将ChatGLM-6B模型训练为适用于错题分析及试题推荐场景的错题分析模型。在试题推荐模块中，采用DINA算法和协同过滤算法相结合，得到个性化试题，所述个性化试题和错题分析结果一起发送给学生。

ChatGLM-6B模型是清华大学和智谱AI联合研发的产品，是一个开源的、支持中英双语问答的对话语言模型，并针对中文进行了优化，ChatGLM-6B模型具备监督微调、反馈自助和人类反馈强化学习等技术特点，因此该模型能够生成相当符合人类偏好的回答。ChatGLM-6B模型具有广泛的应用前景，能够适用于聊天机器人、对话生成以及情感陪伴等多种场景。

图1是本发明实施例提供的基于大语言模型的错题分析及试题推荐系统的结构示意图。如图1所示，本发明实施例提供了一基于大语言模型的错题分析及试题推荐系统500，包括数据处理模块510，错题分析模块520，试题推荐模块530：

数据处理模块510，用于对采集到的做题记录、试题集合和错题解析数据整合得到答题数据，将所述答题数据和人为给定的答题指令输入智能算法并辅以人工标注审核得到指令数据。

本实施例中，做题记录、试题集合和错题解析数据均来自于在线教学系统。在线教学系统中，学生用户通过做题产生做题记录，教师上传试题集合并在系统上对学生答题内容进行批注产生错题解析数据。其中，做题记录包括试题编号、学生编号以及试题得分；试题集合包括试题编号、试题内容、试题答案以及考查知识点列表；错题解析数据包括试题编号、学生编号、学生答题内容以及批注内容。

对上述采集到的数据进行整合，选取试题内容、考查知识点列表以及学生答题内容作为答题数据，答题数据如图2所示。将答题数据和人为给定的答题指令作为智能算法ChatGPT-4的输入，ChatGPT-4基于人为给定的答题指令对答题数据进行标注，得到包含答题解析、解题步骤以及建议在内的答题结果。进一步的，为了保证智能算法的输出的准确性，通过采集到的试题答案和批注内容，人工对答题结果进行审核修正，提升答题结果的准确性。

本实施例中，人为给定的答题指令为“请对学生作答数据进行解析，然后根据试题写出正确的做题步骤，最后根据错误原因和考查的知识点给出建议”。如图3所示，指令数据包括答题指令、答题数据以及答题结果。

错题分析模块520，用于采用指令数据对ChatGLM模型进行指令微调构建错题分析模型，得到训练好的错题分析模型，将答题数据输入训练好的错题分析模型得到错题分析结果。

本实施例中，使用的大语言模型为ChatGLM-6B模型。该模型是一个适用于多种场景的训练好的模型，因此为了让ChatGLM-6B模型与错题分析及试题推荐场景更为适配，需要利用数据处理模块510中的指令数据作为训练数据集，对ChatGLM-6B模型进行指令微调。指令微调是为了激发大语言模型的错题理解能力，通过在指令数据上进行训练使得大语言模型生成的错题分析结果更加合理，所述错题分析结果包括答案解析、解题步骤和建议。

指令微调使用LoRA方案，LoRA方案具有训练速度快、计算需求低的优势，在错题分析及试题推荐系统中采用LoRA方案进行训练，能够大大减少训练时间和训练成本。

将ChatGLM-6B模型训练为错题分析模型的具体步骤如下：

给定ChatGLM-6B预训练模型的权重W₀∈R^d*k，通过低秩分解来表示其更新W₀+ ΔW= W₀+ BA，其中B∈R^d*r，A∈R^r*k，A和B均表示低秩矩阵，且秩r<<min(d，k)。在训练过程中仅更新低秩矩阵A和B，W₀被冻结不接受梯度更新。经过LoRA微调方案训练后ChatGLM-6B模型的前向推理由y = W₀x变为y=W₀x + BAx，其中，y表示模型输出，x为模型输入。训练完成后使用web框架将训练好的错题分析模型部署成接口服务，用于进行错题解析。

将答题数据输入训练好的错题分析模型中获取错题分析结果，错题分析结果如图3中output所示，教师可对错题分析结果进行纠错，教师的纠错数据会进一步对模型进行优化。

试题推荐模块530，用于对错题分析结果进行解析，得到知识点集合1，与根据DINA算法得到的学生未掌握知识点集合2求并集，得到知识点列表，根据所述知识点列表在资源库中检索得到相关试题，采用基于内容的协同过滤算法对相关试题进行过滤，得到个性化试题，与错题分析结果一起发送给学生。

本实施例中，采用协同过滤算法和DINA算法共同实现个性化试题推荐，图4展示了上述两种算法构建的矩阵示意图。

如图4所示，本实施例中，根据学生编号、试题内容、试题得分构建了学生-试题R矩阵，其中，试题得分作为矩阵元素，根据试题编号、考查知识点列表构建了试题-知识点Q矩阵。DINA算法根据学生-试题R矩阵和试题-知识点Q矩阵建立起学生-知识点A矩阵，即知识点掌握度矩阵，其中，知识点掌握度矩阵中的元素1对应的知识点表示学生已掌握知识点，元素0对应的知识点表示学生未掌握知识点。

基于训练好的错题分析模型，能够针对学生用户的答题数据给出错题分析结果。通过对错题分析结果中知识点相关的关键词进行解析，结合教师提供的专家经验或专家规则(该知识点的前置知识点、相关知识点等)，获得知识点集合1。根据所述知识点集合1与DINA算法中得到的学生未掌握知识点集合2求并集，得到知识点列表。基于得到的知识点列表在资源库中进行检索，所述资源库中包含试题、文档、视频等资源，得到与学生用户相关的相关试题。

考虑到知识点集合1与知识点集合2求并集得到的知识点列表数量较为庞大，为了进一步提升个性化，本发明实施例进一步采用协同过滤算法，对知识点列表中的知识点进行排序过滤。

利用构建好的学生-试题R矩阵，矩阵元素0对应的试题内容为错题内容，基于内容的协同过滤算法采用余弦相似度计算所述错题内容与相关试题的相似度。本实施例中，将阈值设定为0.5，当相关试题与错题内容的相似度不低于0.5时，表明学生用户对于这部分相关试题中涉及到的知识点的掌握度比较低，即这部分相关试题的个性化较强，且相似度越大，个性化越强。

通过协同过滤算法过滤掉相似度低于0.5的相关试题，将相似度不低于0.5的相关试题作为个性化试题和错误分析结果一起发送给学生，完成错题分析及试题推荐。

另外，学生用户在系统中的做题记录会进一步训练本发明提出的模型，即学生与模型之间的交互能够使本发明提出的错题分析模型的错题分析精度会越来越高，试题推荐的个性化越来越强。

基于同样的发明构思，如图5所示，本发明实施例还提供了一种基于大语言模型的错题分析及试题推荐方法，包括以下步骤：

步骤1：用于对采集到的做题记录、试题集合和错题解析数据整合得到答题数据，将所述答题数据和人为给定的答题指令输入智能算法并辅以人工标注审核得到指令数据；

基于同样的发明构思，本发明实施例还提供了一种基于大语言模型的错题分析及试题推荐设备，包括存储器和处理器，其中，存储器用于存储计算机程序，处理器用于当执行所述计算机程序时，实现上述基于大语言模型的错题分析及试题推荐系统。

基于同样的发明构思，本发明实施例还提供了一种计算机可读的存储介质，存储介质上存储有计算机程序，计算机程序使用计算机时，实现上述基于大语言模型的错题分析及试题推荐系统。

需要说明的是，上述实施例提供的基于大语言模型的错题分析及试题推荐方法、基于大语言模型的错题分析及试题推荐设备和计算机可读的存储介质，均与基于大语言模型的错题分析及试题推荐系统实施例属于同一构思，其具体实现过程详见基于大语言模型的错题分析及试题推荐系统实施例，这里不再赘述。

Claims

1.一种基于大语言模型的错题分析及试题推荐系统，其特征在于，包括以下模块：

2.根据权利要求1所述的基于大语言模型的错题分析及试题推荐系统，其特征在于，数据处理模块中，所述做题记录包括试题编号、学生编号以及试题得分，所述试题集合包括试题编号、试题内容、试题答案以及考查知识点列表，所述错题解析数据包括试题编号、学生编号、学生答题内容以及批注内容，所述答题数据包括试题内容、考查知识点列表以及学生答题内容。

3.根据权利要求1或2所述的基于大语言模型的错题分析及试题推荐系统，其特征在于，数据处理模块中，所述智能算法为ChatGPT-4，ChatGPT-4基于人为给定的答题指令对答题数据进行标注，得到答题结果，所述答题结果包括答题解析、解题步骤以及建议，所述人工标注审核为人工根据试题答案、批注内容对智能算法输出的答题结果进行审核，所述指令数据包括答题指令、答题数据以及审核过的答题结果。

4.根据权利要求1所述的基于大语言模型的错题分析及试题推荐系统，其特征在于，错题分析模块中，所述采用指令数据对ChatGLM模型进行指令微调构建错题分析模型，包括：

5.根据权利要求1所述的基于大语言模型的错题分析及试题推荐系统，其特征在于，错题分析模块中，所述错题分析结果包括答题解析、解题步骤和建议。

6.根据权利要求1或2所述的基于大语言模型的错题分析及试题推荐系统，其特征在于，试题推荐模块中，所述根据DINA算法得到的学生未掌握知识点，包括：

基于试题编号、考查知识点列表构建试题-知识点矩阵；

7.根据权利要求1或2所述的基于大语言模型的错题分析及试题推荐系统，其特征在于，试题推荐模块中，所述采用基于内容的协同过滤算法对相关试题进行过滤，包括：

基于学生编号、试题内容、试题得分构建学生-试题矩阵；

8.一种基于大语言模型的错题分析及试题推荐方法，其特征在于，所述方法采用权利要求1-7任一项所述的基于大语言模型的错题分析及试题推荐系统，包括以下步骤：

步骤3：用于对错题分析结果进行解析，得到知识点集合1，与根据DINA算法得到的学生未掌握知识点集合2求并集，得到知识点列表，根据所述知识点列表在资源库中检索得到相关试题，采用基于内容的协同过滤算法对相关试题进行过滤，得到个性化试题，与错题分析结果一起发送给学生。

9.一种基于大语言模型的错题分析及试题推荐设备，包括存储器和处理器，所述存储器用于存储计算机程序，其特征在于，所述处理器用于当执行所述计算机程序时，实现权利要求1-7任一项所述的基于大语言模型的错题分析及试题推荐系统。

10.一种计算机可读的存储介质，所述存储介质上存储有计算机程序，其特征在于，所述计算机程序使用计算机时，实现权利要求1-7任一项所述的基于大语言模型的错题分析及试题推荐系统。