CN117894217B

CN117894217B - 一种用于在线学习系统的数学题目导学系统

Info

Publication number: CN117894217B
Application number: CN202410279635.3A
Authority: CN
Inventors: 周熠; 宋泽; 陈德弘
Original assignee: University of Science and Technology of China USTC
Current assignee: University of Science and Technology of China USTC
Priority date: 2024-03-12
Filing date: 2024-03-12
Publication date: 2024-06-04
Anticipated expiration: 2044-03-12
Also published as: CN117894217A

Abstract

本发明公开了一种用于在线学习系统的数学题目导学系统，涉及在线教育学习技术领域，该导学系统包括：录入识别模块、文本识别与处理模块、答案预处理模块、得分点比对模块、得分推理模块及提示生成模块，其中：录入识别模块，用于输入学生的作答内容与题目信息，并依据作答类型进行文本形式或图片形式的识别与判断；文本识别与处理模块，用于将图片形式的学生作答图片及其作答笔迹转换为可识别的纯文本格式，再经过合并处理后输出答题识别结果。本发明通过即时反馈与深度分析，学生在完成作答过程后，能立即获得关于答案正确度的反馈，如果答案不完全正确，系统还会提供包括可能的错误原因和正确答案的后续步骤等深入提示，帮助学生理解和学习。

Description

一种用于在线学习系统的数学题目导学系统

技术领域

本发明涉及在线教育学习技术领域，尤其是涉及一种用于在线学习系统的数学题目导学系统。

背景技术

在线学习系统是一种通过互联网提供教育内容和资源的平台。通常，这些系统包含教学资源（如教学用视频、文档、幻灯片等）、测评功能（如在线作业、线上测试），以及其他方便教师和学生的功能（如课程管理、学生管理、学习数据报告等）。在线学习系统的最大优势是摆脱了传统教育方式对于时间、地点以及人物的限制，它允许学生无论在何时何处都可以访问课程和学习材料，并减少了对教师即时干预的需求。与传统教育方式相比，它还具有学习资源更丰富、个性化程度更高、更容易普及等优势。

然而，与在线学习相比，传统教育方式仍然具有一些难以替代的特点。以数学学科为例，学生在完成作业或考试后，不仅会收到题目得分作为反馈，教师还会对错误率高的题目进行统一讲解。另外，对于学生答错且教师没有讲解的题目，学生也可以询问教师，了解到自己的错误原因及改进建议，从而更加高效和有针对性地学习。相比之下，尽管在线学习系统包括在线作业与考试功能，但它们通常仅能提供得分信息，缺少上述的导学过程。同时，在数学学科中，在线学习系统往往只能对选择题或填空题进行评分，对于解答题、证明题等作答过程比较复杂的题目则难以处理与评分。

如何对学生答案进行评分，是一个在人工智能领域比较有挑战性的研究方向。当前有比较多的自动评分算法可用于对作文、历史等文科学科的作答进行评分，但是对数学学科的导学算法研究较少。不过，随着人工智能技术的发展，用于数学问题打分的算法也取得了一定的进展。

现有的产品级AI导学算法往往涉及的题目不够全面，其AI批改功能也具有一定的局限性。例如，常见的学习问答APP主要针对于口算题，因此只支持小学六年级及以下的题目；科大讯飞学习机的AI阅卷功能也不支持高中数学题目，并且只能给出正确或错误的二元结果，无法给出更详细的分析。

此外，虽然基于机器学习的模型在解决数学问题方面取得了显著进展，但它们的准确性和可靠性严重受限于训练数据的质量和多样性；并且，在复杂或不常见的问题上，基于机器学习的模型可能无法达到足够高的准确度。更重要的一点是，实验室中的机器学习算法往往仅能处理文本形式的答案，如果学生选择在纸上作答，再向在线学习系统提交作答图片，则无法处理。

发明内容

基于此，有必要针对上述技术问题，提供一种用于在线学习系统的数学题目导学系统。

本发明提供了一种用于在线学习系统的数学题目导学系统，该导学系统包括：录入识别模块、文本识别与处理模块、答案预处理模块、得分点比对模块、得分推理模块及提示生成模块，其中：

录入识别模块，用于输入学生的作答内容与题目信息，并依据作答类型进行文本形式或图片形式的识别与判断；

文本识别与处理模块，用于将图片形式的学生作答图片及其作答笔迹转换为可识别的纯文本格式，再经过合并处理后输出答题识别结果；

答案预处理模块，用于将标准答案与学生答案转换成逻辑表达式；

得分点比对模块，用于对比标准答案与学生答案的逻辑表达式；

得分推理模块，用于根据标准答案与学生答案的对比结果，对学生的每个答题步骤进行打分，并计算出题目总得分；

提示生成模块，用于基于各个答题步骤的中间结果，生成学生题目作答过程中的作答错误原因及提示。

进一步的，文本识别与处理模块包括噪音去除子模块、分行处理子模块、公式分类子模块、文字识别子模块及组合合并子模块，其中：

噪音去除子模块，用于利用灰度图像矩阵及卷积神经网络的方式去除作答图片中包含的噪音，该噪音包括图片噪点与笔迹噪音；

分行处理子模块，用于以行为单位对学生作答进行文本识别；

公式分类子模块，用于利用YOLOX模型对作答图片中的文本执行多目标检测，实现中文与公式的分类；

文字识别子模块，用于采用调用识别API的方式对公式与中文分别进行识别；

组合合并子模块，用于将中文与公式的识别结果进行组合，形成最终的答题识别结果。

进一步的，噪音去除子模块包括图像去噪单元与网络去噪单元，其中：

图像去噪单元，用于构建学生作答图片的灰度图像矩阵，利用高斯滤波处理对灰度图像矩阵进行处理，得到滤波后灰度图像矩阵，当处理前灰度图像矩阵中的某个像素值大于或等于滤波后灰度图像矩阵中对应位置的像素值时，将处理后灰度图像矩阵中相应位置的值设为255，灰度图像矩阵的高斯滤波处理与像素值设定公式为：

式中，A代表处理前的灰度图像矩阵；

B代表处理后的灰度图像矩阵；

S代表经过高斯滤波处理的A的灰度图像矩阵；

K代表任意高斯核；

网络去噪单元，用于统计作答图片中的每个黑色连通域的长宽，并拟合一个正态分布，如果某个连通域的长宽比超过阈值，或该连通域的长与宽任意一项与其正态分布均值相比超过2个标准差，则将该连通域标记为此类噪声，再采用3层卷积神经网络以及K近邻算法，在标注的数据上进行训练，预测并去除作答图片中的无用信息。

进一步的，以行为单位对学生作答进行文本识别包括：

首先对完整的作答图片进行二值化预处理，再统计作答图片中所有黑色点的纵坐标，形成纵坐标-黑色点数量直方图，并对直方图曲线进行平滑后，找到曲线中每个极小值点所对应的纵坐标，以所有纵坐标为相邻两行的分界，实现作答文本的分行。

进一步的，答案预处理模块包括答案录入子模块、公式转换子模块、题型分类子模块及算子组合子模块，其中：

答案录入子模块，用于获取在线学习系统中的标准答案、学生提供的文本形式答案与图片形式答案，再次利用文字识别与处理的方式进行文本格式的识别与转换，得到文本格式的解题答案；

公式转换子模块，用于提取解题答案中的公式部分，并转换为形式统一的逻辑表达式；

题型分类子模块，用于依据题目类型与应用年级的不同，将解题答案划分至对应的类别中；

算子组合子模块，用于按照类别将不同种类的公式转换为表达式与算子组合表示的形式，将转换后的公式称为公式单元。

进一步的，得分点比对模块包括单元比对子模块与种类比对子模块，其中：

单元比对子模块，用于将答题识别结果与解题答案中的公式单元进行比对，如果单元种类相同，则继续比较，如果单元种类不同，则查表判断两种公式单元是否可以跨种类比对，若可以，则继续进行比对，若不可以，则判断该公式单元组合比对不成功，结束比对；

种类比对子模块，用于按照种类内比对规则，对答题识别结果与解题答案进行比对，并记录所有比对成功的单元组合。

进一步的，得分推理模块包括题型分组子模块、客观题推理子模块、解答题推理子模块及证明题推理子模块，其中：

题型分组子模块，用于按照得分点将题目划分为多组，且划分成组的数量与题目数量一致，依据题目的题型决定得分推理的方式；

客观题推理子模块，用于获取学生的答题识别结果与解题答案中关于客观题的比对结果，若比对成功，则该客观题得满分，若比对失败，则该客观题不得分；

解答题推理子模块，用于获取答题识别结果与解题答案中关于解答题的比对结果，采用答案优先的推理方式，对解答题的得分点进行比对，判断该解答题的成功得分；

证明题推理子模块，用于获取答题识别结果与解题答案中关于解答题的比对结果，采用过程优化的推理方式，对证明题的得分点进行比对，判断该证明题的成功得分。

进一步的，采用答案优先的推理方式，对解答题的得分点进行比对，判断该解答题的成功得分包括：

将每个解答题的得分点按照在解题答案中出现的先后顺序排序，从后往前依次确定每个得分点对应的公式单元是否比对成功，如果成功，则本解答题得分为本得分点与之前所有得分点的累计得分，继续查找之前得分点是否比对成功，找到所有比对成功的学生作答单元所在行，均为成功得分，如果失败，则继续查找前一个得分点是否比对成功，直至查找完毕。

进一步的，采用过程优化的推理方式，对证明题的得分点进行比对，判断该证明题的成功得分包括：

将每个证明题的得分点按照在解题答案中出现的先后顺序排序，逐个确定得分点所对应的公式单元是否比对成功，全部确定完毕后，如果一个得分点比对成功，但其前后两个得分点均未比对成功，则将该得分点标记为不得分，否则可以得分，最终，该证明题的总分由所有成功得分的得分点对应的分数求和产生，所有得分的步骤则为成功得分的得分点对应的学生作答所在行。

进一步的，提示生成模块包括失分提取子模块与分析提示子模块，其中：

失分提取子模块，用于获取得分不为满分的所有题目，从每个失分题目的最后一个得分步骤所在行的下一行，直到该失分题目作答的最后一行的文本提取出来；

分析提示子模块，用于将每个题目的题目知识点与最后一个比对成功的得分点的下一个得分点输入至文本生成模型中，生成题目的错误原因以及对学生的提示。

本发明的有益效果为：

1、通过即时反馈与深度分析，学生在完成作答过程后，能够立即获得关于答案正确度的反馈，如果答案不完全正确，系统还会提供包括可能的错误原因和正确答案的后续步骤等深入提示，帮助学生更好地理解和学习。

2、题型支持广泛，相比于现有的产品，本发明融合了多种人工智能技术，采用基于深度学习的算法识别学生作答图片中的文本，采用基于规则的匹配算法进行题目批改与分析，再采用生成式语言模型提供导学建议，能够支持从小学到高中的大部分数学题目，这一特点使得系统适用范围更广，鲁棒性更强，能够满足更多年级学生的需求。

3、格式支持丰富，本发明不仅支持文本形式答案的批改，还能处理图片形式的答案。这种灵活性使得学生可以选择在纸上作答后上传图片，这更符合学生的习惯，同时也提供了更方便的学习方式。

附图说明

此处所说明的附图用来提供对本发明的进一步理解，构成本发明的一部分，本发明的示意性实施例及其说明用于解释本发明，并不构成对本发明的不当限定。在附图中：

图1是根据本发明实施例的一种用于在线学习系统的数学题目导学系统的系统原理框图；

图2是根据本发明实施例的一种用于在线学习系统的数学题目导学系统的逻辑路程图；

图3是根据本发明实施例的数据集1上，教师与算法评分分差分布图；

图4是根据本发明实施例的在数据集2上，教师与算法评分分差分布图。

附图标号：1、录入识别模块；2、文本识别与处理模块；201、噪音去除子模块；202、分行处理子模块；203、公式分类子模块；204、文字识别子模块；205、组合合并子模块；3、答案预处理模块；301、答案录入子模块；302、公式转换子模块；303、题型分类子模块；304、算子组合子模块；4、得分点比对模块；401、单元比对子模块；402、种类比对子模块；5、得分推理模块；501、题型分组子模块；502、客观题推理子模块；503、解答题推理子模块；504、证明题推理子模块；6、提示生成模块；601、失分提取子模块；602、分析提示子模块。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

请参阅图1-图2，提供了一种用于在线学习系统的数学题目导学系统，该导学系统包括：录入识别模块1、文本识别与处理模块2、答案预处理模块3、得分点比对模块4、得分推理模块5及提示生成模块6，其中：

录入识别模块1，用于输入学生的作答内容与题目信息，并依据作答类型进行文本形式或图片形式的识别与判断。

在本发明的描述中，本系统集成于在线学习系统的服务器端，为增强用户的使用体验，本系统不具有单独的用户界面，而是由在线学习系统将学生的作答情况提交给本系统，本系统处理完成后再返回给在线学习系统，由在线学习系统进行后处理并显示。

本系统可以接受的输入包含两种：第一种为学生直接从在线学习系统的客户端完成的作答，为文本形式；第二种为学生首先在纸张、平板电脑或其他书写设备上完成，再上传到在线学习系统的作答，可以为图片或书写笔迹文件形式。

此外，在线学习系统需要向本系统提供学生作答所对应的题目信息，包含题目的题型、年级、分值、得分点及其涉及的所有知识点等信息。本系统处理完成后，将向在线学习系统返回本系统生成的导学信息，包含学生作答的分步骤分数、各题目总分，以及完整题目的分数；如果题目不为客观题（选择题、填空题）且系统返回的学生作答分数不为满分，则系统还将返回预测的学生错误原因，以及一条答题提示，该提示为学生答案中正确部分的下一步骤。

根据输入学生作答的形式、题目的题型、年级等不同，本系统可以动态调整算法的执行流程，整个系统的流程图如图2所示。

文本识别与处理模块2，用于将图片形式的学生作答图片及其作答笔迹转换为可识别的纯文本格式，再经过合并处理后输出答题识别结果。

该模块在整个系统中的主要作用为：将学生以图片或笔迹形式进行的作答，转换成纯文本格式。在真实的在线教育系统中，学生对数学解答题、证明题的作答不仅包含简单的算式与中文字符，而且会涉及比较复杂的数学公式，同时还包含了删除笔等噪音信息。因此，在文本识别完成后，还需要对识别结果进行处理，将学生答案的公式部分统一转换成LaTeX格式，以便本系统的后续部分正常运行。

本发明中的此部分所采用的技术路线为：首先去除作答图片或笔迹中的噪音信息，之后将学生作答进行分行，分出的每一行进行中文与公式二分类，再将分类完成的中文或公式输入对应的手写识别API，转换成文本形式，最后将所有文本结果进行组合并处理，输出最终结果。

在本发明的描述中，文本识别与处理模块2包括噪音去除子模块201、分行处理子模块202、公式分类子模块203、文字识别子模块204及组合合并子模块205，其中：

噪音去除子模块201，用于利用灰度图像矩阵及卷积神经网络的方式去除作答图片中包含的噪音，该噪音包括图片噪点与笔迹噪音。

学生作答的图片（书写笔迹本质上是点的集合，因此可以视为带有各点先后顺序的图片。此后不再赘述）可能含有噪音信息，这些噪音可归为两类：第一类是图片本身存在的噪点等，另一类是删除笔、辅助图等无助于系统中后续各步骤的信息。

由于纸张过薄或学生书写力度过大等原因，学生作答图像可能存在笔迹背透情况，这属于上述所提到的第一类噪音信息。由于文字图像与一般图像不同，其文字轮廓较为复杂且密度较小，因此在常见的图像去噪方法中，高斯模糊处理很容易影响字迹清晰度；同样地，自适应阈值的二值化方法往往难以找到一个理想的阈值，且这种方法容易导致与背景紧密相连的字迹轮廓产生锯齿状效果。因此，本发明提出了一种新的算法，应用于噪音去除子模块201中。

在本发明的描述中，噪音去除子模块201包括图像去噪单元与网络去噪单元，其中：

图像去噪单元，用于构建学生作答图片的灰度图像矩阵，利用高斯滤波处理对灰度图像矩阵进行处理，得到滤波后灰度图像矩阵，当处理前灰度图像矩阵中的某个像素值大于或等于滤波后灰度图像矩阵中对应位置的像素值时，将处理后灰度图像矩阵中相应位置的值设为255，相反，当处理前的灰度图像矩阵A中的某个像素值小于S中对应位置的像素值时，B矩阵中相应位置的值会相应增大。该方法可以有效去除图像中的背景噪声。

灰度图像矩阵的高斯滤波处理与像素值设定公式为：

式中，A代表处理前的灰度图像矩阵；B代表处理后的灰度图像矩阵；S代表经过高斯滤波处理的A的灰度图像矩阵；K代表任意高斯核。

分行处理子模块202，用于以行为单位对学生作答进行文本识别。

学生在书写题目的解答过程时，通常会从纸张或书写设备的第一行从左向右开始书写；如果一行写不下当前的步骤，或这一步骤已经书写完毕，再换到下一行进行书写，依此类推，直到学生完成作答。因此，学生的书写顺序以及换行时机能够一定程度上表明学生在答题时的思维方式。本系统即利用这一特点，以行为单位对学生作答进行文本识别。

在本发明的描述中，以行为单位对学生作答进行文本识别包括：

首先对完整的作答图片进行二值化预处理（确保图片背景为白色，而学生的作答部分为黑色），再统计作答图片中所有黑色点的纵坐标，形成纵坐标-黑色点数量直方图，并对直方图曲线进行平滑后，找到曲线中每个极小值点所对应的纵坐标，以所有纵坐标为相邻两行的分界，实现作答文本的分行。

公式分类子模块203，用于利用YOLOX模型对作答图片中的文本执行多目标检测，实现中文与公式的分类。

其中，目前的手写识别方法在处理中文与数学公式混合的情况时，识别准确率通常不够理想。为了同时提高学生作答中的中文与公式的识别准确率，本发明采用YOLOX模型对行图像中的文本执行多目标检测任务，在此过程中对中文与公式进行分类。YOLOX是一种先进的目标检测模型，其采用了一系列新技术，包括锚点自由检测、解耦头和强大的数据增强策略，这些特性使其在处理实时图像和视频流时表现出色。YOLOX的一个关键特点是其高效性，它能够在保持高精度的同时实现快速检测，这使得它适用于需要实时分析的应用，如自动驾驶、视频监控和工业自动化，因此能够胜任本发明中的任务。在本任务中，中文字符以外的字符都被视为公式。

分类完成后，原图片中每一个被分类为中文的区域都将单独生成一张图片，原图中相应的区域会替换为#号；识别出的中文区域与替换后的原图将进入下一步骤，以便识别完成后的组合。

文字识别子模块204，用于采用调用识别API的方式对公式与中文分别进行识别。

其中，当前对图像中文字进行识别的表现最好的方法大部分基于Transformer架构，这些方法通常需要消耗大量计算资源才可保证计算速度。所以与上一步骤不同，本步骤采用调用识别API的方式对公式与中文分别进行识别。

在本发明中，公式识别API采用MathpixAPI，此API在经过测试之后效果最好；中文识别API采用百度手写识别。

组合合并子模块205，用于将中文与公式的识别结果进行组合，形成最终的答题识别结果。

本模块将上述公式与中文的识别结果组合，形成最终识别结果。对于每一行的#号替换后图片，按照之前各步骤所述，如果行内包含n个#号，则一定会产生n个中文区域图片，将这些图片的中文识别结果按照原有顺序，替换掉公式识别部分相对应的#号，即可产生一行图片的识别结果。将所有行的识别结果按行序拼接，即可产生最终整张学生作答图片的识别结果。

答案预处理模块3，用于将标准答案与学生答案转换成逻辑表达式。

其中，答案预处理模块3的主要作用为：将在线学习系统中题目的标准答案文本、学生以文本形式提供的答案，或学生以图片形式提供，且经过文本识别与处理部分识别后的文本形式答案，提取出其公式部分，并转换成形式统一的逻辑表达式。

如果输入为图片识别后的文本答案，根据上述步骤的描述，在文本识别模块中已经对中文与公式完成了分类，因此不需要额外提取公式部分。否则，将文本答案以任意汉字作为分割线进行切分，剩余的部分视为公式。

在本发明的描述中，答案预处理模块3包括答案录入子模块301、公式转换子模块302、题型分类子模块303及算子组合子模块304，其中：

答案录入子模块301，用于获取在线学习系统中的标准答案、学生提供的文本形式答案与图片形式答案，再次利用文字识别与处理的方式进行文本格式的识别与转换，得到文本格式的解题答案。

公式转换子模块302，用于提取解题答案中的公式部分，并转换为形式统一的逻辑表达式。

题型分类子模块303，用于依据题目类型与应用年级的不同，将解题答案划分至对应的类别中。

算子组合子模块304，用于按照类别将不同种类的公式转换为表达式与算子组合表示的形式，将转换后的公式称为公式单元。

在完成上述处理之后，答案中的公式将依据内容格式，按照本发明中固定的规则进行分类，常用规则如表1所示：

表1：常用公式分类表

根据题目题型以及年级的不同，划分类别的方式可能会有差异。例如，（2，3）这一公式在年级为初中时，将被分类为“坐标”，而在年级为高中时则被分类为“区间”；原因是，初中阶段没有引入数学中区间的概念，而高中阶段的坐标一般应用于立体几何题目中，通常包含三个参数。

分类完成后，再按类别将不同种类的公式转换为表达式与算子组合表示的形式，其中算子是一个接受任意数量的表达式或算子输出作为输入的单值函数。转换后的公式称为“公式单元”，或简称“单元”。转换仍然按照固定规则进行，一条公式可能会转换为一个单元，或一组最外层算子（以下也简称“种类”）相同的单元。常用规则如表2所示：

表2：部分常用公式转换规则

得分点比对模块4，用于对比标准答案与学生答案的逻辑表达式。

其中，得分点比对模块4负责将上一部分中处理完成的标准答案中的得分点单元与学生答案中的公式单元进行比对。根据上一步骤，标准答案中一个得分点可能具有多个单元，但这些单元一定具有相同的最外层算子；因此，本算法遍历所有可能的标准答案单元与学生作答单元的组合，逐一进行比对。

在本发明的描述中，得分点比对模块4包括单元比对子模块401与种类比对子模块402，其中：

单元比对子模块401，用于将答题识别结果与解题答案中的公式单元进行比对，如果单元种类相同，则继续比较，如果单元种类不同，则查表判断两种公式单元是否可以跨种类比对，若可以，则继续进行比对，若不可以，则判断该公式单元组合比对不成功，结束比对。

种类比对子模块402，用于按照种类内比对规则，对答题识别结果与解题答案进行比对，并记录所有比对成功的单元组合。

其中，本发明定义了一系列比对规则，用于比对两个公式单元；而如果标准答案包含不止一个单元，则要求学生作答的公式单元需要有一个子集与标准答案单元集合一一对应。待全部比对结束后，记录所有比对成功的单元组合，进入下一步。常用比对规则如表3所示：表3：常用比对规则

得分推理模块5，用于根据标准答案与学生答案的对比结果，对学生的每个答题步骤进行打分，并计算出题目总得分。

在本发明的描述中，得分推理模块5包括题型分组子模块501、客观题推理子模块502、解答题推理子模块503及证明题推理子模块504，其中：

题型分组子模块501，用于按照得分点将题目划分为多组，且划分成组的数量与题目数量一致，依据题目的题型决定得分推理的方式。

客观题推理子模块502，用于获取学生的答题识别结果与解题答案中关于客观题的比对结果，若比对成功，则该客观题得满分，若比对失败，则该客观题不得分。

解答题推理子模块503，用于获取答题识别结果与解题答案中关于解答题的比对结果，采用答案优先的推理方式，对解答题的得分点进行比对，判断该解答题的成功得分。

在本发明的描述中，采用答案优先的推理方式，对解答题的得分点进行比对，判断该解答题的成功得分包括：

证明题推理子模块504，用于获取答题识别结果与解题答案中关于解答题的比对结果，采用过程优化的推理方式，对证明题的得分点进行比对，判断该证明题的成功得分。

在本发明的描述中，采用过程优化的推理方式，对证明题的得分点进行比对，判断该证明题的成功得分包括：

提示生成模块6，用于基于各个答题步骤的中间结果，生成学生题目作答过程中的作答错误原因及提示。

在本发明的描述中，提示生成模块6包括失分提取子模块601与分析提示子模块602，其中：

失分提取子模块601，用于获取得分不为满分的所有题目，从每个失分题目的最后一个得分步骤所在行的下一行，直到该失分题目作答的最后一行的文本提取出来。

分析提示子模块602，用于将每个题目的题目知识点与最后一个比对成功的得分点的下一个得分点输入至文本生成模型中，生成题目的错误原因以及对学生的提示。

为衡量本系统所做出导学评分及建议的准确性，本发明在三个数据集上进行了实验。数据集中的作答全部为解答题或证明题，文本或图片均收集于高中学生在模拟考试中，对高考模拟卷的作答，题目满分在10至15分之间。按照高考标准，将本算法所给出的打分与教师给出的打分相差2分以内的情况视为给分准确。实验结果如表4及图3、图4所示，可以观察到，本发明在文本答案上的准确率接近85%，在图片答案的准确率也接近70%，达到了国际领先水平。

表4：实验结果

综上所述，借助于本发明的上述技术方案，通过即时反馈与深度分析，学生在完成作答过程后，能够立即获得关于答案正确度的反馈，如果答案不完全正确，系统还会提供包括可能的错误原因和正确答案的后续步骤等深入提示，帮助学生更好地理解和学习。题型支持广泛，相比于现有的产品，本发明融合了多种人工智能技术，采用基于深度学习的算法识别学生作答图片中的文本，采用基于规则的匹配算法进行题目批改与分析，再采用生成式语言模型提供导学建议，能够支持从小学到高中的大部分数学题目，这一特点使得系统适用范围更广，鲁棒性更强，能够满足更多年级学生的需求。格式支持丰富，本发明不仅支持文本形式答案的批改，还能处理图片形式的答案。这种灵活性使得学生可以选择在纸上作答后上传图片，这更符合学生的习惯，同时也提供了更方便的学习方式。

应该理解的是，虽然附图的流程图中的各个步骤按照箭头的指示依次显示，但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明，这些步骤的执行并没有严格的顺序限制，其可以以其他的顺序执行。而且，附图的流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段，这些子步骤或者阶段并不必然是在同一时刻执行完成，而是可以在不同的时刻执行，其执行顺序也不必然是依次进行，而是可以与其他步骤或者其他步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。

Claims

1.一种用于在线学习系统的数学题目导学系统，其特征在于，该导学系统包括：录入识别模块、文本识别与处理模块、答案预处理模块、得分点比对模块、得分推理模块及提示生成模块，其中：

所述录入识别模块，用于输入学生的作答内容与题目信息，并依据作答类型进行文本形式或图片形式的识别与判断；

所述文本识别与处理模块，用于将图片形式的学生作答图片及其作答笔迹转换为可识别的纯文本格式，再经过合并处理后输出答题识别结果；

所述答案预处理模块，用于将标准答案与学生答案转换成逻辑表达式；

所述得分点比对模块，用于对比标准答案与学生答案的逻辑表达式；

所述得分推理模块，用于根据标准答案与学生答案的对比结果，对学生的每个答题步骤进行打分，并计算出题目总得分；

所述提示生成模块，用于基于各个答题步骤的中间结果，生成学生题目作答过程中的作答错误原因及提示；

所述文本识别与处理模块包括噪音去除子模块、分行处理子模块、公式分类子模块、文字识别子模块及组合合并子模块，其中：

所述噪音去除子模块，用于利用灰度图像矩阵及卷积神经网络的方式去除所述作答图片中包含的噪音，该噪音包括图片噪点与笔迹噪音；

所述分行处理子模块，用于以行为单位对学生作答进行文本识别；

所述公式分类子模块，用于利用YOLOX模型对所述作答图片中的文本执行多目标检测，实现中文与公式的分类；

所述文字识别子模块，用于采用调用识别API的方式对公式与中文分别进行识别；

所述组合合并子模块，用于将中文与公式的识别结果进行组合，形成最终的答题识别结果；

所述噪音去除子模块包括图像去噪单元与网络去噪单元，其中：

所述图像去噪单元，用于构建学生作答图片的灰度图像矩阵，利用高斯滤波处理对灰度图像矩阵进行处理，得到滤波后灰度图像矩阵，当处理前灰度图像矩阵中的某个像素值大于或等于滤波后灰度图像矩阵中对应位置的像素值时，将处理后灰度图像矩阵中相应位置的值设为255，灰度图像矩阵的高斯滤波处理与像素值设定公式为：

；

式中，A代表处理前的灰度图像矩阵；

B代表处理后的灰度图像矩阵；

S代表经过高斯滤波处理的A的灰度图像矩阵；

K代表任意高斯核；

所述网络去噪单元，用于统计作答图片中的每个黑色连通域的长宽，并拟合一个正态分布，如果某个连通域的长宽比超过阈值，或该连通域的长与宽任意一项与其正态分布均值相比超过2个标准差，则将该连通域标记为此类噪声，再采用3层卷积神经网络以及K近邻算法，在标注的数据上进行训练，预测并去除作答图片中的无用信息；

所述以行为单位对学生作答进行文本识别包括：

首先对完整的所述作答图片进行二值化预处理，再统计所述作答图片中所有黑色点的纵坐标，形成纵坐标-黑色点数量直方图，并对直方图曲线进行平滑后，找到曲线中每个极小值点所对应的纵坐标，以所有纵坐标为相邻两行的分界，实现作答文本的分行；

所述答案预处理模块包括答案录入子模块、公式转换子模块、题型分类子模块及算子组合子模块，其中：

所述答案录入子模块，用于获取在线学习系统中的标准答案、学生提供的文本形式答案与图片形式答案，再次利用文字识别与处理的方式进行文本格式的识别与转换，得到文本格式的解题答案；

所述公式转换子模块，用于提取所述解题答案中的公式部分，并转换为形式统一的逻辑表达式；

所述题型分类子模块，用于依据题目类型与应用年级的不同，将所述解题答案划分至对应的类别中；

所述算子组合子模块，用于按照类别将不同种类的公式转换为表达式与算子组合表示的形式，将转换后的公式称为公式单元；

所述得分点比对模块包括单元比对子模块与种类比对子模块，其中：

所述单元比对子模块，用于将所述答题识别结果与所述解题答案中的所述公式单元进行比对，如果单元种类相同，则继续比较，如果单元种类不同，则查表判断两种公式单元是否可以跨种类比对，若可以，则继续进行比对，若不可以，则判断该公式单元组合比对不成功，结束比对；

所述种类比对子模块，用于按照种类内比对规则，对所述答题识别结果与所述解题答案进行比对，并记录所有比对成功的单元组合；

所述得分推理模块包括题型分组子模块、客观题推理子模块、解答题推理子模块及证明题推理子模块，其中：

所述题型分组子模块，用于按照得分点将题目划分为多组，且划分成组的数量与题目数量一致，依据题目的题型决定得分推理的方式；

所述客观题推理子模块，用于获取学生的答题识别结果与解题答案中关于客观题的比对结果，若比对成功，则该客观题得满分，若比对失败，则该客观题不得分；

所述解答题推理子模块，用于获取所述答题识别结果与所述解题答案中关于解答题的比对结果，采用答案优先的推理方式，对解答题的得分点进行比对，判断该解答题的成功得分；

所述证明题推理子模块，用于获取所述答题识别结果与所述解题答案中关于解答题的比对结果，采用过程优化的推理方式，对证明题的得分点进行比对，判断该证明题的成功得分；

采用答案优先的推理方式，对解答题的得分点进行比对，判断该解答题的成功得分包括：

将每个解答题的得分点按照在解题答案中出现的先后顺序排序，从后往前依次确定每个得分点对应的公式单元是否比对成功，如果成功，则本解答题得分为本得分点与之前所有得分点的累计得分，继续查找之前得分点是否比对成功，找到所有比对成功的学生作答单元所在行，均为成功得分，如果失败，则继续查找前一个得分点是否比对成功，直至查找完毕；

采用过程优化的推理方式，对证明题的得分点进行比对，判断该证明题的成功得分包括：

将每个证明题的得分点按照在解题答案中出现的先后顺序排序，逐个确定得分点所对应的公式单元是否比对成功，全部确定完毕后，如果一个得分点比对成功，但其前后两个得分点均未比对成功，则将该得分点标记为不得分，否则可以得分，最终，该证明题的总分由所有成功得分的得分点对应的分数求和产生，所有得分的步骤则为成功得分的得分点对应的学生作答所在行；

所述提示生成模块包括失分提取子模块与分析提示子模块，其中：

所述失分提取子模块，用于获取得分不为满分的所有题目，从每个失分题目的最后一个得分步骤所在行的下一行，直到该失分题目作答的最后一行的文本提取出来；

所述分析提示子模块，用于将每个题目的题目知识点与最后一个比对成功的得分点的下一个得分点输入至文本生成模型中，生成题目的错误原因以及对学生的提示。