CN113407676A

CN113407676A - 题目批改方法和系统、电子设备和计算机可读介质

Info

Publication number: CN113407676A
Application number: CN202110707924.5A
Authority: CN
Inventors: 崔寅生; 陈俊文; 刘海哮; 胡科; 刘洋; 潘东; 韩均雷
Original assignee: Zuoyebang Education Technology Beijing Co Ltd
Current assignee: Beijing Baige Feichi Technology Co.,Ltd.
Priority date: 2021-06-24
Filing date: 2021-06-24
Publication date: 2021-09-17

Abstract

一种题目批改方法及系统、电子设备及计算机可读介质。所述题目批改方法包括：对待批改图像的所有文字进行识别，区分出印刷文字和手写文字；对待批改图像进行大题切分，并针对每一大题，执行：获取大题的题型，并根据所述题型获取所述大题对应的题型结构；根据所述大题对应的题型结构，将所述印刷文字和手写文字分别拼接成题干部分、用户作答的答案文字和冗余文字，且形成至少一批改模块，所述批改模块包括至少一答案文字和至少一题干部分；基于拼接后的批改模块进行检索并对各所述批改模块进行批改。本发明能高容错率地应付各种复杂题型，适应范围广，且通过结合上下文实现特征向量的检索，通过模型验证用户作答的准确度，批改宽容度更高。

Description

题目批改方法和系统、电子设备和计算机可读介质

技术领域

本发明属于图像识别和处理技术领域，尤其是人工智能辅助图像识别技术领域，更具体的是涉及一种题目批改方法及系统，以及采用其的电子设备和计算机可读介质。

背景技术

随着技术进步，现在的学生在遇到难题时可以通过手机拍摄不会解的难题来网络搜索答案，或者将用签字笔或圆珠笔手写做好的试题通过拍摄上传，由机器进行批改，极大地便利了对知识的求索，弥补了师资的缺乏。

但是机器毕竟是机器，并不能像人类一样去理解和思考输入的内容的内在逻辑和含义，由此导致在学生拍摄上传一大段试题时，机器并无法理解每个字的相互关系和具体含义，需要技术人员对其进行精心设计才能实现准确地批改学生的作答。此外，在机器可以批改的手写试题中，由于答案可能有不同的表述方式，答案数据库不一定收录完全，有可能就导致用户作答的答案因为一个字的偏差而被判错，而这个字并不影响答案的正误，因此如何准确识别并批改答题人的手写答案，尤其是与标准答案相似但仍然正确的答案，这些均成了亟待研究和解决的技术问题。

发明内容

有鉴于此，本发明的主要目的在于提出一种题目批改方法及系统，以及采用其的电子设备和计算机可读介质，以期至少部分地解决上述技术问题中的至少之一。

为了实现上述目的，作为本发明的第一个方面，提出了一种题目批改方法，包括如下步骤：

对待批改图像的所有文字进行识别，区分出印刷文字和手写文字；

对待批改图像进行大题切分，并针对每一大题，进行如下流程：

获取所述大题的题型，并根据所述大题的题型获取所述大题对应的题型结构；以及

根据所述大题对应的题型结构，将所述印刷文字和手写文字分别拼接成题干部分、用户作答的答案文字和冗余文字，且形成至少一个批改单元，所述批改单元包括至少一所述答案文字和至少一所述题干部分；

基于拼接后的批改单元进行检索并对各所述批改单元进行批改。

可选地，所述对待批改图像进行大题切分的步骤，是通过题号、行间距来实现的；其中，所述行间距是通过识别出的印刷文字的位置信息计算得到；

可选地，所述对待批改图像进行大题切分的步骤还包括：基于所述大题的识别文字进行检索，如果在数据库中检索到匹配度高于阈值的第一题目，所述切分步骤基于所述大题与所述第一题目的比对结果来实现切分。

可选地，所述基于拼接后的批改单元进行检索并进行批改的步骤，包括：

基于拼接后的批改单元进行检索获取对应的标准答案；

基于用户作答的答案文字、题干上下文、题型、题型结构、答案类别、学科和学段、所述标准答案，判定所述答案文字是否正确。

可选地，所述基于拼接后的批改单元进行检索获取对应的标准答案的步骤，包括：

将每一个所述批改单元转化成向量表达，利用特征向量进行检索获取标准答案；通过所述向量表达中的特征向量在一答案数据库中检索得到对应的标准答案；

可选地，所述将批改单元转化成向量表达的步骤，包括：

将所述题干部分和用户作答部分根据题目类型进行拼接，形成一文本串，通过字符输入字典将所述文本串输入一第一人工智能模型，转化成向量表达。

可选地，所述第一人工智能模型为Word2vec模型、textCNN模型或BERT预训练模型。

可选地，所述判定答案文字是否正确的步骤，包括：

将所述题干部分、用户作答的答案文字和得到的标准答案输入一预先训练好的第二人工智能模型进行二分类，输出所述答案文字是否正确的结论；

其中，所述第二人工智能模型为一卷积神经网络模型。

可选地，所述区分印刷文字和手写文字的步骤，是通过预先训练的一第三人工智能模型来实现的；

可选地，所述第三人工智能模型为实现分类的一卷积神经网络模型；

可选地，识别出所述印刷文字和手写文字时还记录其位置信息。

作为本发明的第二个方面，还提出了一种题目批改系统，包括：

文字辨别模块，用于对待批改图像中所有文字进行识别，区分出印刷文字和手写文字；

大题切分模块，用于对待批改图像进行大题切分；

题型结构获取模块，用于获取所述大题的题型，并根据所述大题的题型获取所述大题对应的题型结构；

拼接模块，用于根据所述大题对应的题型结构，将所述印刷文字和手写文字分别拼接成题干部分、用户作答的答案文字和冗余文字，且形成至少一个批改单元，所述批改单元包括至少一所述答案文字和至少一所述题干部分；

检索验证答案模块，用于基于拼接后的批改单元进行检索并验证用户作答的答案文字是否正确；

批改模块，用于基于所述检索验证答案模块验证结果对所述批改单元进行批改。

作为本发明的第三个方面，还提出了一种电子设备，包括处理器和存储器，所述存储器用于存储计算机可执行程序，当所述计算机可执行程序被所述处理器执行时，所述处理器执行如上所述的题目批改方法。

作为本发明的第四个方面，还提出了一种计算机可读介质，存储有计算机可执行程序，所述计算机可执行程序被执行时，实现如上所述的题目批改方法。

基于上述技术方案可知，本发明的题目批改方法及系统相对于现有技术至少具有如下有益效果之一：

本发明系统地提出了识别待识别图像中各种元素，将其区分并拼接成若干批改单元的方法步骤，从而可以准确识别各种题型下的题干信息和用户作答部分；

本发明能够通过结合用户作答部分和其上下文，将其通过字符输入字典embedding(转化)成向量，利用特征向量表示来提高检索效率；

本发明通过一二分类模型来识别用户作答部分是否与标准答案构成相同或相近似，是否也可以成为正确答案，从而扩大了答题的宽容度，避免了批改时太过僵化的死套标准答案的情形。

附图说明

图1是本发明的题目批改方法的方框流程图；

图2是本发明的题目批改系统的结构示意图；

图3是本发明的电子设备的结构示意图；

图4是本发明的计算机可读介质的示意图；

图5是本发明实施例1的一实际处理效果照片；

图6是本发明实施例1的另一实际处理效果照片。

具体实施方式

在对于具体实施例的介绍过程中，对结构、性能、效果或者其他特征的细节描述是为了使本领域的技术人员对实施例能够充分理解。但是，并不排除本领域技术人员可以在特定情况下，以不含有上述结构、性能、效果或者其他特征的技术方案来实施本发明。

附图中的流程图仅是一种示例性的流程演示，不代表本发明的方案中必须包括流程图中的所有的内容、操作和步骤，也不代表必须按照图中所显示的顺序执行。例如，流程图中有的操作/步骤可以分解，有的操作/步骤可以合并或部分合并，等等，在不脱离本发明的发明主旨的情况下，流程图中显示的执行顺序可以根据实际情况改变。

附图中的框图一般表示的是功能实体，并不一定必然与物理上独立的实体相对应。即，可以采用软件形式来实现这些功能实体，或在一个或多个硬件模块或集成电路中实现这些功能实体，或在不同网络和/或处理模块装置和/或微控制器装置中实现这些功能实体。

各附图中相同的附图标记表示相同或类似的元件、组件或部分，因而下文中可能省略了对相同或类似的元件、组件或部分的重复描述。还应理解，虽然本文中可能使用第一、第二、第三等表示编号的定语来描述各种器件、元件、组件或部分，但是这些器件、元件、组件或部分不应受这些定语的限制。也就是说，这些定语仅是用来将一者与另一者区分。例如，第一器件亦可称为第二器件，但不偏离本发明实质的技术方案。此外，术语“和/或”、“及/或”是指包括所列出项目中的任一个或多个的所有组合。

本发明一方面是系统提出识别待识别图像中各种元素，将其区分并拼接成若干批改单元的方法步骤，从而可以准确识别各种题型下的题干信息和用户作答，且扩展性好。

本发明另一方面是针对现有的答题有时需要与标准答案完全一致，稍微变形一点就算错误的情形而提出来的，其能避免批改时太过僵化，能够准确高效地完成近似答案的批改任务。

需要说明的是，本发明中并不是只适合于填空题，只要能够获取相应题型结构，能够对其内容进行准确拼接即可以使用。此外，对于填空题，也不是只有在下划线上或括号内答题的题才叫填空题，像使用圆圈、椭圆圈、方格网格等表示中间需要填入内容的比较大小题、数列题、数独题和成语接龙题等，均可以视为填空题。而从整个算法来说，本发明也并不只是适合批改数学题，对于语文、历史、地理、……等各个学科均可以进行批改。

基于此，如图1所示，本发明提出了一种题目批改方法，包括如下步骤：

其中，这里的“大题”是本发明中定义的一个概念，是指一道大题或同一题目类型的一组题，通常会用一个大题号进行区分。一个“大题”中可以包括多个具有标号的小题，或者具有相似结构的不标号的多组题型。具体的事例如图5、6所示，图5中的第一大题为选声母或韵母题，包括6个具有相似结构的不标号的题型，即6个批改模块；图5中的第二大题为看拼音写词语题，包括4个具有相似结构的不标号的题型，即4个批改模块；图6中的第三大题包括5个小题，每个小题视为一个批改模块。

其中，所述对待批改图像进行大题切分的步骤，是通过题号或行间距来实现的；其中，题号可以直接通过对首行题目文字的识别，从中识别出例如“一、”、“二、”或者“5、”等，所述行间距则是通过识别出的印刷文字的位置信息计算得到，例如有的情况下，大题内的行间距为1.5倍，大题之间的行间距则为2.0倍，通过行间隔不同也是区别不同题目的一种方式。

可选地，对待批改图像进行大题切分时，也可以利用辅助确认标准：基于所述大题的识别文字进行检索，如果在数据库中检索到匹配度高于阈值的第一题目，所述切分步骤就可以基于所述大题与所述第一题目的比对结果来实现切分，换句话说就是，在数据库中如果找到了原题，与原题一样的部分就是这一题的，不一样的部分就可以排除。

其中，在进行拼接步骤之前优选进行冗余文字的识别，例如通过训练模型或者根据手写位置是否落入特定区域等来判断用户作答是答案文字还是冗余文字。这个冗余文字的识别可以基于位置信息，也可以通过训练一模型来执行，在另一专利申请中专门进行了详述，这里不再赘述。

其中，所述基于拼接后的批改单元进行检索并进行批改的步骤，包括：

基于拼接后的批改单元进行检索获取对应的标准答案；

基于用户作答的答案文字、题干上下文、题型、题型结构、答案类别、学科和学段、所述标准答案等，判定所述答案文字是否正确。

其中，所述基于拼接后的批改单元进行检索获取对应的标准答案的步骤，包括：

将每一个所述批改单元转化成向量表达，利用特征向量进行检索获取标准答案；

可选地，所述将批改单元转化成向量表达的步骤，包括：

将所述题干部分和用户作答的答案文字根据题目类型进行拼接，形成一文本串，通过字符输入字典将所述文本串输入一第一人工智能模型(embedding)，转化成向量表达。所述题干部分根据题目类型可以分成单独的题干部分(判断题、选择题)、区分为上文和下文的两部分(填空位置在中间的填空题)等，与用户作答的答案文字进行拼接实际上就是形成完整的上下文文本串，再转化成向量表达。

可选地，所述利用特征向量进行检索获取标准答案的步骤，包括：

通过所述向量表达中的特征向量在一答案数据库中检索得到对应的标准答案；其中，所述答案数据库中存储有与题型和题干内容对应的结构化的标准答案，例如填空题包括题干部分、出题空格设置位置和标准答案。

其中，所述第一人工智能模型例如为Word2vec模型、textCNN模型或BERT预训练模型，其中优选为Word2vec模型。

可选地，所述判定答案文字是否正确的步骤，包括：

其中，所述第二人工智能模型例如为神经网络模型，优选为卷积神经网络(CNN)模型，其主要执行一个二分类，因此只要能够基于标准答案查找相近似的答案的分类模型均可以使用。所述第二人工智能模型例如可以采用大量样本进行训练得到，所述大量样本来自本公司平台上的实际Query，从而可以更贴近真实环境而识别的准确率更高。

可选地，所述第三人工智能模型例如为实现分类的一卷积神经网络(CNN)模型。

可选地，所述对答案文字进行批改的步骤中，可以基于前面的判断结果在“答案文字”的一设定方位的一设定距离处设置一不同颜色的批改标记，例如“√”或“×”或“〇”，具体设置在另一专利申请中详述，这里不再赘述。

如图2所示，本发明还提出了一种题目批改系统，包括：

大题切分模块，用于对待批改图像进行大题切分；

其中，所述大题切分模块对待批改图像进行大题切分时，是通过题号或行间距来实现的；其中，题号可以直接通过对首行题目文字的识别，从中识别出例如“一、”、“二、”或者“5、”等，所述行间距是通过识别出的印刷文字的位置信息计算得到，例如有的情况下，大题内的行间距为1.5倍，大题之间的行间距则为2.0倍，通过行间隔不同也是区别不同题目的一种方式。

可选地，所述大题切分模块对待批改图像进行大题切分时，也可以利用辅助确认标准：基于所述大题的识别文字进行检索，如果在数据库中检索到匹配度高于阈值的第一题目，所述切分步骤就可以基于所述大题与所述第一题目的比对结果来实现切分，换句话说就是，在数据库中如果找到了原题，与原题一样的部分就是这一题的，不一样的部分就排除。

其中，本系统还包括冗余文字识别模块，用于在进行拼接步骤之前优选进行冗余文字的识别，例如通过训练模型或者根据手写位置是否落入特定区域等来判断用户作答是答案文字还是冗余文字。这个冗余文字的识别可以基于位置信息，也可以通过训练一模型来执行，在另一专利申请中专门进行了详述，这里不再赘述。

其中，所述检索验证答案模块基于拼接后的批改单元进行检索并进行批改时，包括：

基于拼接后的批改单元进行检索获取对应的标准答案；

其中，所述检索验证答案模块基于拼接后的批改单元进行检索获取对应的标准答案时，包括：

可选地，所述将批改模块转化成向量表达的步骤，包括：

将所述批改模块中的题干部分和用户作答的答案文字基于题目类型按顺序拼接成一个字符串，通过字符输入字典将所述文本串输入一第一人工智能模型(embedding)，转化成向量表达。所述题干部分基于题目类型可以分成单独的题干部分(判断题、选择题)或是区分为上文和下文的两部分(填空位置在中间的填空题)等，与用户作答的答案文字进行拼接实际上就是形成完整的上下文文本串，再转化成向量表达。

通过所述向量表达中的特征向量在一答案数据库中检索得到对应的标准答案；其中，所述答案数据库中存储有与题型和题干内容对应的结构化的标准答案。

其中，所述答案数据库中存储有格式化的标准答案，例如填空题包括题干部分、出题空格设置位置和标准答案。

可选地，所述判定答案文字是否正确的步骤，包括：

可选地，所述对答案文字进行批改的步骤中，可以基于前面的判断结果在“答案文字”的一设定方位的一设定距离处设置一不同颜色的批改标记，例如“√”或“×”，具体设置在另一专利申请中详述，这里不再赘述。

本发明还公开了一种电子设备，图3是本发明的电子设备的结构示意图，如图3所示，所述电子设备包括处理器和存储器，所述存储器用于存储计算机可执行程序，其中当所述计算机可执行程序被所述处理器执行时，所述处理器执行如上所述的方法。

该电子设备例如可以以通用计算设备的形式表现。其中，处理器可以是一个，也可以是多个且协同工作。本发明也不排除进行分布式处理，即处理器可以分散在不同的实体设备中。本发明的电子设备并不限于单一实体，也可以是多个实体设备的总和。

其中，存储器存储有计算机可执行程序，通常是机器可读的代码，该计算机可执行程序可以被所述处理器执行，以使得电子设备能够执行本发明的方法，或者方法中的至少部分步骤。

该存储器包括易失性存储器，例如随机存取存储模块(RAM)和/或高速缓存存储模块，还可以是非易失性存储器，如只读存储模块(ROM)。

可选的，该实施方式中，电子设备还包括有I/O接口，其用于电子设备与外部的设备进行数据交换。I/O接口可以为表示几类总线结构中的一种或多种，包括存储模块总线或者存储模块控制器、外围总线、图形加速端口、处理模块或者使用多种总线结构中的任意总线结构的局域总线。

本发明的电子设备中还可以包括上述示例中未示出的元件或组件。例如，有些电子设备中还包括有显示屏等显示模块，有些电子设备还包括人机交互元件，例如按钮、键盘等。只要该电子设备能够执行存储器中的计算机可读程序以实现本发明方法或方法的至少部分步骤，均可认为是本发明所涵盖的电子设备。

本发明还公开了一种计算机可读介质，图4是本发明的计算机可读记录介质的示意图，如图4所示，所述计算机可读介质上存储有计算机可执行程序，其中所述计算机可执行程序被执行时，实现如上所述的方法。

计算机可读存储介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了可读程序代码。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。可读存储介质还可以是可读存储介质以外的任何可读介质，该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。可读存储介质上包含的程序代码可以用任何适当的介质传输，包括但不限于无线、有线、光缆、RF等等，或者上述的任意合适的组合。

可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码，所述程序设计语言包括面向对象的程序设计语言—诸如Python、Java、C++等，还包括常规的过程式程序设计语言—诸如C语言、汇编语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中，远程计算设备可以通过任意种类的网络，包括局域网(LAN)或广域网(WAN)，连接到用户计算设备，或者，可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。

为使本发明的目的、技术方案和优点更加清楚明白，以下结合具体实施例，并参照附图，对本发明作进一步的详细说明。需要注意的是，下述实施例仅是用于说明本发明，而不是用于对本发明作出限制。

实施例1

本实施例的题目批改系统装载在手机内存中，包括：

大题切分模块，用于对待批改图像进行大题切分；

拼接模块，用于根据所述大题对应的题型结构，将所述印刷文字和手写文字分别拼接成题干部分、用户作答的答案文字和冗余文字，且形成至少一批改单元，所述批改单元包括至少一所述答案文字和至少一所述题干部分；

检索验证答案模块，用于基于拼接后的批改单元进行检索并验证用户作答的答案文字是否正确，具体包括：

将每一个所述批改单元中的题干部分和用户作答的答案文字基于题目类型按顺序拼接成一个字符串，通过字符输入字典将所述文本串输入一第一人工智能模型(embedding)，转化成向量表达。

将每一个所述批改单元中的题干部分、用户作答的答案文字和得到的标准答案输入一预先训练好的第二人工智能模型进行二分类，输出所述答案文字是否正确的结论；

其中，所述第一人工智能模型为Word2vec模型，所述答案数据库中存储有格式化的标准答案，所述第二人工智能模型为卷积神经网络(CNN)模型，其训练样本来自本公司平台上的实际Query，从而可以更贴近真实环境而识别的准确率更高。

图5是本发明实施例1的实际处理效果照片。如图5所示，图5中出现了四种题型，系统首先进行大题维度的切分，页面中出现了五个切分框，其中第一个是空白框(有可能是图像残余信息等影响识别结果)，不影响评判，另外四个均切分准确。其次，系统进行题型结构的获取，第一大题是补充拼音，属于答案的拼音和题干的文字是前后结构的情形；第二大题是看拼音写汉字，属于题干的拼音和答案的汉字属于上下结构的情形；第三大题是选词填空，需要先识别出上面方框中的印刷字体为待选项①-⑨，然后判断每一个括号中是否为正确答案；第四大题是括号填空，需要识别出这种大括号表示的并列多个空的题型(预先收录其特定题型构型)。然后，系统需要根据图像中上述识别出的相关信息，去答案数据库查找结构化的标准答案，并验证用户作答是否正确，并依次进行批改。从对了画“√”、错了画“〇”的结果来看，系统也准确识别了对应题型结构，并且给出了准确评判。

图6是本发明实施例1的另一张实际处理效果照片。如图6所示，其第三大题能够准确切分，第二大题的第4、5、6小题由于形式差异较大被切分成两种题型，并不影响最后评判结果，第四大题太混乱，未形成切分框，但其中的小题均有批改。

在第四大题的第二问为竖式计算，可以看到卷面上除了演算的竖式之外，还包括算错的部分、进位标记，以及最终答案。系统通过冗余文字识别模型判断出答案文字，然后基于题干内容查找标准答案，再通过第二模型验证答案文字是否为正确答案，如果是则在答案文字后面打“√”，错误的则被画“〇”。

由此可见，本发明的方法容错能力强，能够适应各种复杂的题型，准确地对手写答案进行批改。

以上所述的具体实施例，对本发明的目的、技术方案和有益效果进行了进一步详细说明，应理解的是，本发明不与任何特定计算机、虚拟装置或者电子设备固有相关，各种通用装置也可以实现本发明。以上所述仅为本发明的具体实施例而已，并不用于限制本发明，凡在本发明的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种题目批改方法，其特征在于，包括如下步骤：

2.根据权利要求1所述的方法，其特征在于，所述对待批改图像进行大题切分的步骤，是通过题号、行间距来实现的；其中，所述行间距是通过识别出的印刷文字的位置信息计算得到；

3.根据权利要求1所述的方法，其特征在于，所述基于拼接后的批改单元进行检索并进行批改的步骤，包括：

基于拼接后的批改单元进行检索获取对应的标准答案；

4.根据权利要求3所述的方法，其特征在于，所述基于拼接后的批改单元进行检索获取对应的标准答案的步骤，包括：

可选地，所述将批改单元转化成向量表达的步骤，包括：

将所述题干部分和用户作答的答案文字根据题目类型进行拼接，形成一文本串，通过字符输入字典将所述文本串输入一第一人工智能模型，转化成向量表达；

5.根据权利要求4所述的方法，其特征在于，所述第一人工智能模型为Word2vec模型、textCNN模型或BERT预训练模型。

6.根据权利要求3或4中任一项所述的方法，其特征在于，所述判定答案文字是否正确的步骤，包括：

其中，所述第二人工智能模型为一卷积神经网络模型。

7.根据权利要求1所述的方法，其特征在于，所述区分印刷文字和手写文字的步骤，是通过预先训练的一第三人工智能模型来实现的；

8.一种题目批改系统，其特征在于，包括：

大题切分模块，用于对待批改图像进行大题切分；

9.一种电子设备，包括处理器和存储器，所述存储器用于存储计算机可执行程序，其特征在于：

当所述计算机可执行程序被所述处理器执行时，所述处理器执行如权利要求1-7中任一项所述的题目批改方法。

10.一种计算机可读介质，存储有计算机可执行程序，其特征在于，所述计算机可执行程序被执行时，实现如权利要求1-7中任一项所述的题目批改方法。