CN113033480A

CN113033480A - 基于答题卡的客观题批阅方法、装置、设备及存储介质

Info

Publication number: CN113033480A
Application number: CN202110422319.3A
Authority: CN
Inventors: 常治国
Original assignee: Shenzhen Geesunn Technology Co ltd
Current assignee: Shenzhen Geesunn Technology Co ltd
Priority date: 2021-04-20
Filing date: 2021-04-20
Publication date: 2021-06-25

Abstract

本发明涉及数据处理领域，提供了基于答题卡的客观题批阅方法、装置、设备及存储介质。该方法包括：拍摄作答完成的答题卡以获取其数字图像；基于数字图像获取水平线段对应的离散曲线和竖直线段对应的离散曲线；根据水平离散曲线和竖直离散曲线从数字图像中定位网格单元；从定位的各网格单元中获取各题目的手写作答内容；对手写作答内容进行识别得到各题目的识别结果；将各题目的识别结果与预先设定的标准答案进行一一比对，以获取各题目的批阅结果。本发明通过离散曲线进行网格单元定位，当答题卡发生曲翘等变形时，相比传统的直线检测算法更为精准，相比基于深度学习的算法，算力需求更小，更适用于课堂实时测验等基于边缘计算的实时应用场景。

Description

基于答题卡的客观题批阅方法、装置、设备及存储介质

技术领域

本发明涉及数据处理领域，尤其涉及一种基于答题卡的客观题批阅方法、装置、设备及存储介质。

背景技术

随着人工智能技术的发展，智慧教育逐渐走入课堂。在课堂上实时完成学生课堂测验的实时批阅与统计是智慧教育应用领域的一大挑战，需求也甚为强烈。如果能在课堂上实时完成学生课堂测验的实时批阅与统计，老师就能及时掌握学情，优化课堂教学活动的组织，提高教与学的效率，减轻学生和老师的课后负担。

现有技术主要采用两种方案实现课堂测验的批阅。第一种方案是给每个学生发放一台平板电脑，学生在平板电脑上完成课堂测验，平板电脑采集数据后发送至联网的后台服务系统完成自动批阅与统计。此方案的优点是系统实时性好，自动批阅准确度高，但系统建设成本高，使用与维护成本也高，平板电脑的屏幕对学生视力有负面作用，在屏幕上书写不方便，比较适合职业教育与高等教育，不适用于中小学课堂应用，使用场景较为有限。

第二种方案是在教室里安装高速扫描仪，学生用普通笔在纸张上作答，作答完成后老师将纸张收上来，使用高速扫描仪扫描成数字图像，联网的后台系统基于数字图像完成自动批阅与统计。相对第一种方案，此方案不需要给学生任何电子设备，减轻了系统使用和维护的成本，但不利之处在于实时性不够，因为扫描获得的试卷图像数据属于非结构化的数据，自动批阅精度没有方案一高。

近年随着人工智能技术尤其是深度学习技术的进步，人工智能技术在各行各业逐步得到了广泛的应用，人们对人工智能技术的普及应用充满了热切的期待，然而真正具备逻辑推理和思考能力的通用人工智能技术仍然处在理论研究的早期阶段，离大规模商业应用还有很遥远的距离，然而，还是可通过将待识别目标进行结构化处理，将传统图像处理算法与已普及应用的AI技术结合，从而使得AI技术得到最大价值的使用。

当答题卡发生曲翘等变形时，若采用基于Hough变换或者投影变换等直线检测算法，对于网格单元的定位精度不高且算力代价也不小，若采用基于深度学习的算法检测网格角点，训练数据的准备成本大，对算力需求更大，不适用于基于边缘计算的实时应用场景。因此，有必要发明一种适用于实时应用场景的小算力网格单元识别算法，以提高答题卡结构识别的效率和精度。

发明内容

有鉴于此，本发明实施例提供了基于答题卡的客观题批阅方法、装置、设备及存储介质，用以解决现有技术在实时应用场景中对于手写答题卡识别速度慢、精度低的问题。

第一方面，本发明实施例提供了一种基于答题卡的客观题批阅方法，所述答题卡包括由水平线段和竖直线段构成的二维网格，所述二维网格包括多个网格单元，所述网格单元用于提供给被测验者进行手写作答，所述方法包括：

S10：拍摄作答完成的答题卡以获取其数字图像；

S20：基于所述数字图像获取所述水平线段对应的离散曲线和所述竖直线段对应的离散曲线；其中，记所述水平线段对应的离散曲线为水平离散曲线，记所述竖直线段对应的离散曲线为竖直离散曲线；

S30：根据所述水平离散曲线和所述竖直离散曲线从所述数字图像中定位所述网格单元；

S40：从定位的各所述网格单元中获取各题目的手写作答内容；

S50：对所述手写作答内容进行识别得到各题目的识别结果；

S60：将各题目的所述识别结果与预先设定的标准答案进行一一比对，以获取各题目的批阅结果。

本发明实施例公开了一种基于答题卡的客观题批阅方法，通过安装在教室天花板上的智能文档采集系统对着学生课桌拍摄作答完成的答题卡以获取其数字图像，相比采用扫描仪进行扫描的技术方案更适用于实时应用场景。基于所述数字图像获取所述水平离散曲线和竖直离散曲线进行网格单元定位，相比采用Hough变换等直线检测算法在答题卡发生翘曲畸变等情形中对于网格单元的定位更加精确，同时算力需求较小，基本实现在课堂上实时完成学生课堂测验客观题的实时批阅。在无需给学生配备任何电子设备的条件下，在课堂上实时完成练习/测验结果的采集、识别，具有极高的应用便捷性，使得老师在课堂上能实时掌握学情，及时优化课堂教学活动的组织，提高教与学的效率，减轻学生和老师的课后负担。

优选地，在所述S20中，包括：

S21：对所述数字图像进行二值化处理；

S22：基于经过二值化处理的数字图像计算水平方向特征图像和竖直方向特征图像；

S23：基于所述水平方向特征图像执行水平离散曲线追踪过程得到水平离散曲线，以及基于所述竖直方向特征图像执行竖直离散曲线追踪过程得到竖直离散曲线。

本发明实施例基于水平方向特征图像和竖直方向特征图像获取水平离散曲线和竖直离散曲线，整个过程无需浮点运算，无需GPU加速，执行速度快，算力需求小，十分适用于实时应用场景。

优选地，所述水平离散曲线包括第一水平离散曲线和第二水平离散曲线，记所述第一水平离散曲线的右端点坐标为(x_a,y_a)，记所述第二水平离散曲线的左端点坐标为(x_b,y_b)，若|x_a-x_b|＜T_hx且|y_a-y_b|＜T_hy，T_hx和T_hy为预设阈值，在所述S23之后，还包括：将所述第二水平离散曲线作为所述第一水平离散曲线的右边部分，合并至所述第一水平离散曲线。

本发明实施例通过将坐标差值较小的水平离散曲线进行合并，进一步避免由于图像畸变等原因带来的误差所导致的误识别，从而提升定位精度。

优选地，在所述S30中，包括：

S31：根据所述水平离散曲线和所述竖直离散曲线，确定各所述网格单元的角点；

S32：根据所述角点完成对所述网格单元的定位。

本发明实施例通过根据所述水平离散曲线和竖直离散曲线，确定各所述网格单元的角点，并利用角点完成对所述网格单元的定位，每个网格单元仅需要4个角点即可完成定位，精确高效。

优选地，在所述S31中，包括：

S311：针对所述网格单元的任一角点，判断该角点对应的水平离散曲线和竖直离散曲线是否存在重叠坐标点；若是，执行S312，若否，执行S313；

S312：以所述重叠坐标点的坐标均值作为该角点的坐标；

S313：判断该角点对应的水平离散曲线和竖直离散曲线是否存在至少一条离散曲线处于二维网格的边缘；若是，执行S314，若否，执行S315；

S314：分别从该角点对应的水平离散曲线和竖直离散曲线各取1个坐标点，将属于水平离散曲线的坐标点沿水平方向延伸以及将属于竖直离散曲线的坐标点沿竖直方向延伸，直至存在重叠坐标点，并取所述重叠坐标点的坐标作为该角点的坐标；

S315：从该角点对应的水平离散曲线和竖直离散曲线取坐标相差最小的2个坐标点之间的中点坐标作为该角点的坐标。

本发明实施例针对角点对应的水平离散曲线和竖直离散曲线是否存在重叠坐标点，对角点的坐标进行对应优化，进一步提高网格单元的定位精度，从而提高对于手写作答内容的获取精度，减少后续任务出错的概率，进而提升自动批阅精度。

优选地，所述答题卡还包括编码有格式参数的定位标识，所述格式参数包括二维网格的行数、列数以及网格单元的高度、宽度中的一种或多种，在所述S30和S40之间，所述方法还包括：

S301：基于所述数字图像解码所述定位标识以获取所述格式参数；

S302：根据所述格式参数对所述网格单元的定位进行校验与纠错。

本发明实施例通过在答题卡中设置定位标识，在进行网格单元定位时，通过解析定位标识，能够根据解析得到的格式参数，对定位进行校验与纠错，以避免整个应用系统基于错误的网格识别结果或者错误的答题卡输入进行后续的文字识别，消除人为错误因素和算法偶发错误因素对整体识别精度的影响。

优选地，所述S50包括：根据各题目预先设定的标准答案，分别选择对应最小字符集的预训练模型对各题目对应的手写作答内容进行识别得到各题目的识别结果。

本发明实施例在对各题目对应的手写作答内容进行文字识别时，根据各题目预先设定的标准答案选择对应最小字符集的预训练模型进行识别，相比使用一个大而全支持所有字符集的大模型，能显著提升识别效率与识别精度，解决对于非结构化的手写体文字识别精度和效率不高的技术问题，对于算力的需求更小，十分适用于实时应用场景。

优选地，在所述S60之后，所述方法还包括：

S70：获取各题目对应的手写作答内容或识别结果；

S80：分别将各题目的所述手写作答内容或识别结果粘贴至空白测验试卷的对应位置，以合成完整的已作答试卷图像。

本发明实施例通过将各题目的所述手写作答内容或识别结果粘贴至对应位置区域，从而合成完整的已作答试卷图像，解决了作答结果与题目相互割裂的技术问题，便于构建学生的学习档案，便于学生复习巩固。

优选地，所述水平离散曲线由x坐标连续且x坐标连续的2个坐标点的y坐标变化不超过1的坐标点组成；所述竖直离散曲线由y坐标连续且y坐标连续的2个坐标点的x坐标变化不超过1的坐标点组成。

第二方面，本发明实施例提供了一种基于答题卡的客观题批阅装置，所述答题卡包括由水平线段和竖直线段构成的二维网格，所述二维网格包括多个网格单元，所述网格单元用于提供给被测验者进行手写作答，所述装置包括：

数字图像获取模块，用于拍摄作答完成的答题卡以获取其数字图像；

离散曲线获取模块，用于基于所述数字图像获取所述水平线段对应的离散曲线和所述竖直线段对应的离散曲线；其中，记所述水平线段对应的离散曲线为水平离散曲线，记所述竖直线段对应的离散曲线为竖直离散曲线；

定位模块，用于根据所述水平离散曲线和所述竖直离散曲线从所述数字图像中定位所述网格单元；

手写作答内容获取模块，用于从定位的各所述网格单元中获取各题目的手写作答内容；

文字识别模块，用于对所述手写作答内容进行识别得到各题目的识别结果；

批阅模块，用于将各题目的所述识别结果与预先设定的标准答案进行一一比对，以获取各题目的批阅结果。

第三方面，本发明实施例提供了一种基于答题卡的客观题批阅设备，包括：至少一个处理器、至少一个存储器以及存储在存储器中的计算机程序指令，当计算机程序指令被处理器执行时实现如上述实施方式中第一方面的方法。

第四方面，本发明实施例提供了一种存储介质，其上存储有计算机程序指令，当计算机程序指令被处理器执行时实现如上述实施方式中第一方面的方法。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对本发明实施例中所需要使用的附图作简单地介绍，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图，这些均在本发明的保护范围内。

图1是本发明实施例提供的一种答题卡的示意图。

图2是本发明实施例提供的另一种答题卡的示意图。

图3是本发明实施例提供的一种答题卡配置软件的示意图。

图4是本发明实施例提供的一种基于答题卡的客观题批阅方法的流程示意图。

图5是本发明实施例提供的一种获取离散曲线的方法流程示意图。

图6A是本发明实施例提供的一种数字图像。

图6B是本发明实施例提供的一种获取离散曲线的过程示意图。

图6C是本发明实施例提供的一种获取离散曲线的过程示意图。

图6D是本发明实施例提供的一种获取离散曲线的过程示意图。

图6E是本发明实施例提供的一种获取离散曲线的过程示意图。

图6F是本发明实施例提供的一种获取离散曲线的效果图。

图7是本发明实施例提供的一种定位网格单元的方法的流程示意图。

图8是本发明实施例提供的一种确定角点坐标的方法的流程示意图。

图9A是本发明实施例提供的一种存在多个重叠坐标点的示意图。

图9B是本发明实施例提供的一种存在一个重叠坐标点的示意图。

图9C是本发明实施例提供的一种不存在重叠坐标点的示意图。

图9D是本发明实施例提供的一种不存在重叠坐标点的示意图。

图9E是本发明实施例提供的一种不存在重叠坐标点的示意图。

图10是本发明实施例提供的一种对网格单元定位进行校验与纠错的方法的流程示意图。

图11是本发明实施例提供的一种合成完整试卷图像的方法的流程示意图。

图12是本发明实施例提供的一种题目标引软件的示意图。

图13是本发明实施例提供的一种作答完成的答题卡的示意图。

图14是本发明实施例提供的一种完整的试卷图像的示意图。

图15是本发明实施例提供的一种基于答题卡的客观题批阅装置的示意图。

图16是本发明实施例提供的一种基于答题卡的客观题批阅设备的硬件结构示意图。

具体实施方式

下面将详细描述本发明的各个方面的特征和示例性实施例，为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细描述。应理解，此处所描述的具体实施例仅被配置为解释本发明，并不被配置为限定本发明。对于本领域技术人员来说，本发明可以在不需要这些具体细节中的一些细节的情况下实施。下面对实施例的描述仅仅是为了通过示出本发明的示例来提供对本发明更好的理解。

需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

现有的自动判卷技术主要包括切题环节、题干识别环节、手写体识别环节及判断环节。切题环节包括从整体试卷图像中把每道题的区域定位出来，并且要把每道题的题干和答题区域也要分割开。特别的，在一些场景中，还需要处理题干跨栏、跨页，答题区跨栏、跨页的情况。题干识别环节包括对题干进行印刷体文字识别，将文字识别结果组织成可用于题库数据库查询的结构化字符流，然后从题库数据库中查询出字符流格式的标准答案。手写体识别环节包括对答题区域考试作答内容进行手写体文字识别，将手写体文字识别结果组织成与标准答案相同格式的字符流。判断环节包括比对题干识别、手写体识别所获取的字符流，由此判断答题的情况。

以上技术方案存在如下困难与弊端：一是需要对试卷图像进行切题，特别是涉及到跨页场景时，处理起来较为繁琐且容易出错。二是由于任务的输入(试卷图像)是非结构化的像素图像数据，其处理与运算结果是一种概率化的结果，不可能像结构化的数据库运算一样高度精确，图像的倾斜、旋转、缩放、光影噪声、非线性畸变等多种因素会影响上述切题环节、题干识别环节以及手写体识别环节的精度，每一步的错误到会导致任务的失败。由此可见，在通用人工智能技术取得突破前，上述技术方案的应用需要较大工作量的人工干预。

有鉴于此，本发明实施例提供了一种基于答题卡的客观题批阅方法、装置、设备及存储介质，以简化自动判卷中的环节,并对网格单元的定位做了相应优化,以期提高自动判卷的识别精度和识别效率，减少对算力的需求，更加适用于课堂“当堂测试当堂评”的实时应用场景。

其中，所述答题卡包括由水平线段和竖直线段构成的二维网格，所述二维网格包括多个网格单元，所述网格单元用于提供给被测验者进行手写作答。为便于理解，请参见图1，是本发明实施例提供的一种答题卡的示意图。所述答题卡包括由4条水平线段和4条竖直线段构成的二维网格10，二维网格10包括以二维矩阵形式排布的网格单元20，一个网格单元20用于填写一道题目的答案。显而易见的是，所述二维网格10的行数、列数以及网格单元20的高度、宽度可通过根据实际需要进行设置。

进一步的，请参见图2，为了方便定位，答题卡还可以设置定位标识30，所述定位标识30为二维码，在进行定位时，可以以二维码的中心点为坐标原点。在本发明其它的实施方式中，所述定位标识还可以为其它具体定位功能的标识，例如可变标签、条形码等。在本发明一种实施方式中，还可以在所述定位标识中编码格式参数，所述格式参数可以为二维网格10的行数、列数、网格单元20的高度、宽度等信息。

进一步的，在本发明一些实施方式中为了区分被测验者的身份，答题卡上还可以设置身份标识40，所述身份标识40为提供给被测验者填写的单元。需要说明的是，在本发明其它的实施方式中，可以采用姓名、学号之外的信息作为身份标识。当然，身份标识同样可以采用二维码等能够编码信息的标签。

为了便于设计答题卡，本发明实施例还提供了一种答题卡配置软件。请参见图3，是本发明实施例提供的一种答题卡配置软件的示意图。具体的，用户将待测验题目的标准答案填入对应的各单元中，以此完成标准答案的预先设置，并通过“导出答案文件”控件，获取包括各题目标准答案的数据包，即以题目标号为索引，以标准答案为返回值；以及通过“打印答题卡”控件，生成答题卡。需要说明的是，在生成答题卡时，二维网格10的行数、列数、网格单元20的高度、宽度等格式参数通过编码成二维码集成在答题卡上。在本发明其它的实施方式中，用户也可以预先为各题目分配分值，则数据包中相应的包括各题目的分值作为返回值。进一步的，用户还可以通过答题卡配置软件对二维网格10的行数、列数、网格单元20的高度、宽度等进行调整。

基于上述实施例所公开的答题卡，本发明实施例提供了一种基于答题卡的客观题批阅方法，请参见图4，所述方法包括：

S10：拍摄作答完成的答题卡以获取其数字图像；

S50：对所述手写作答内容进行识别得到各题目的识别结果；

具体的，本发明实施例在实施时，用户先使用答题卡配置软件进行答题卡设计以及标准答案预先设置，然后打印答题卡分发给各被测验者。被测验者完成作答后(或者是作答时间结束后)，拍摄作答完成的答题卡以获取其数字图像。在获取到数字图像后，可将其转换为灰度图像并进行二值化处理，以便于后续处理。进一步的，测验的场景通常为课堂，因此可在教室的天花板上安装智能文档采集设备，实时对放置在学生各自课桌桌面上的答题卡进行拍摄，效率更高，智能文档采集设备对答题卡进行数字图像采集的具体技术方案可参阅公开文件CN109274898A。

进一步的，由于答题卡可能发生曲翘等变形，水平线段和竖直线段在数字图像中可能存在一定畸变，在图像处理领域中，通常采用离散曲线对数字图像中的“水平线段”和“竖直线段”进行描述。基于采集得到的数字图像可获取所述水平线段对应的离散曲线和竖直线段对应的离散曲线。为便于描述，记所述水平线段对应的离散曲线为水平离散曲线，记所述竖直线段对应的离散曲线为竖直离散曲线。具体的，本发明实施例采用连续的(x,y)坐标点对水平离散曲线进行记录，同一水平离散曲线相邻的坐标点的x坐标相差1，y坐标相差0，1或者-1；相应的，采用连续的(x,y)坐标点对竖直离散曲线进行记录，同一竖直离散曲线相邻的坐标点的y坐标相差1，x坐标相差0，1或者-1。换言之，所述水平离散曲线由x坐标连续且x坐标连续的2个坐标点的y坐标变化不超过1的坐标点组成；所述竖直离散曲线由y坐标连续且y坐标连续的2个坐标点的x坐标变化不超过1的坐标点组成。

请参见图5，是本发明实施例提供的一种获取水平离散曲线和竖直离散曲线的方法的流程示意图，包括：

S21：对所述数字图像进行二值化处理；

具体的，以获取水平离散曲线进行说明。以图像左上角像素为原点，每条水平离散曲线由连续的(x,y)坐标点进行记录，相邻的坐标点的x坐标相差1，y坐标相差0，1或者-1。

首先，将图6A所示的数字图像进行二值化处理得到I_b(x,y)，0≤x＜W，0≤y＜H，W为图像宽度，H为图像高度，I_b(x,y)取0xff表示背景，I_b(x,y)取0表示前景，经二值化处理后的数字图像如图6B所示。当然，背景、前景的定义方式可以相反。

然后，计算水平方向特征图像F_h(x,y)。具体的，可采用公式F_h(x,y)＝I_b(x,y)XORI_b(x,y+1)AND I_b(x,y)进行计算。其中，0≤x＜W，0≤y＜H-1，XOR为按二进制位异或运算，AND为按二进制位与运算。经XOR运算后的数字图像如图6C所示，经AND运算后的数字图像如6D所示。计算得到的水平方向特征图像F_h(x,y)的特征为前景色仅包含0条、1条或多条像素宽度为1，长度为1至W，且任意一点斜率绝对值小于等于1的水平离散曲线，具体来说水平离散曲线是水平网格线的上边缘。当然，本领域技术人员基于本发明所公开的内容，经过简单置换后可采用水平网格线的下边缘来表征水平离散曲线。

然后从F_h(1,1)开始，先行后列对F_h(x,y)进行遍历。对于每个前景色像素F_h(x,y)，如果F_h(x,y-1)、F_h(x,y+1)、F_h(x-1,y-1)、F_h(x-1,y)、F_h(x-1,y+1)均为背景色，则F_h(x,y)为一水平离散曲线的左侧端点，以F_h(x,y)为起点，执行水平离散曲线追踪过程，得到水平离散曲线集合S_h(i)，i≥0为水平离散曲线索引号。具体的，以F_h(x,y)为起点执行水平离散曲线追踪过程包括：

将点(x,y)加入S_h(i)，将F_h(x,y)设置为背景色；

循环开始：

如果F_h(x+1,y)为前景色：

令x等于x+1，将点(x,y)加入S_h(i)，将F_h(x,y)设置为背景色；

否则，如果F_h(x+1,y-1)为前景色：

令x等于x+1且令y等于y-1，将点(x,y)加入S_h(i)，将F_h(x,y)设置为背景色；

否则，如果F_h(x+1,y+1)为前景色：

令x等于x+1且令y等于y+1，将点(x,y)加入S_h(i)，将F_h(x,y)设置为背景色；

否则：

结束循环；

循环结束。

基于以上过程，即完成对水平离散曲线的获取，效果图如图6E所示。基于以上公开的技术方案，本领域技术人员容易获知竖直离散曲线的获取方式，此处不再赘述。在本发明一种实施方式中，也可以将数字图像像素矩阵转置后执行上述方法，再将获得的水平离散曲线的xy坐标交换，同样可得到竖直离散曲线。在获取到水平离散曲线和竖直离散曲线后，得到如图6F所示的效果图。上述离散曲线识别算法具有算法简洁、算力需求小、曲线检测结果稳定的优点。

由于图像畸变等原因，对于水平离散曲线和竖直离散曲线的识别可能出现断线，因此，在本发明一种实施方式中，所述水平离散曲线包括第一水平离散曲线和第二水平离散曲线，记所述第一水平离散曲线的右端点坐标为(x_a,y_a)，记所述第二水平离散曲线的左端点坐标为(x_b,y_b)，若|x_a-x_b|＜T_hx且|y_a-y_b|＜T_hy，T_hx和T_hy为预设阈值，在所述S23之后，还包括：将所述第二水平离散曲线作为所述第一水平离散曲线的右边部分，合并至所述第一水平离散曲线。

具体的，对于水平离散曲线S_h(i)中的第一水平离散曲线S_h(a)和第二水平离散曲线S_h(b)，S_h(a)中的最后一个坐标点(x_a,y_a)与S_h(b)中的第一个坐标点(x_b,y_b)，如果|x_a-x_b|＜T_hx且|y_a-y_b|＜T_hy,T_hx和T_hy为预设阈值，则将S_h(b)作为S_h(a)的右边部分合并进S_h(a)，并删除S_h(b)，此过程递归进行到无合并可执行为止。所述将S_h(b)作为S_h(a)的右边部分合并进S_h(a)，需要补充坐标(x_a,y_a)与坐标(x_b,y_b)之间的点，补点的原则为相邻点的x坐标值相差1，相邻点的y坐标值相差0，或者1，或者-1，以补点数最少为优。在本发明一种实施方式中，剔除坐标点数小于N_h的离散曲线S_h(i)，N_h为预设阈值，用于滤除噪声线段。在本发明一种实施方式中，为方便后续算法步骤，在计算得到水平方向特征图像F_h(x,y)后，可以给水平方向特征图像F_h(x,y)最后一行之后补一行背景图像，再将F_h(x,y)最上一行、最左一列、最右一列全置为背景色。若采用此方案，因为在执行水平离散曲线追踪过程开始前，F_h(x,y)的边界像素已全被设置为背景色，上述过程无需判断x坐标和y坐标是否超出图像有效坐标范围，当x坐标和y坐标的取值达到边界值自动触发循环结束。类似的，竖直离散曲线可基于同样的原理进行合并，此处不再赘言。

在获取到水平离散曲线和竖直离散曲线后，即可对网格单元进行定位，本发明实施例提供至少2种定位方法。

其一，对于任一网格单元而言，根据其在二维网格中的行数和列数，即可确定其对应的水平离散曲线和竖直离散曲线，因此可从所述数字图像中定位所述网格单元。具体的，可采取将水平离散曲线均等分割的方式，确定各个网格单元对应的部分水平离散曲线，类似的，可将竖直离散曲线均等分割，确定各个网格单元对应的部分竖直离散曲线。例如，二维网格为4行4列，则将第一条水平离散曲线(从上往下定义)和第二条水平离散曲线分别均等分为4份，且将第一条竖直离散曲线(从左往右定义)和第二条竖直离散曲线分别均等分为4份，则第一条水平离散曲线的前四分之一、第二条水平离散曲线的前四分之一、第一条竖直离散曲线的前四分之一和第二条竖直离散曲线的前四分之一构成第一行第一列的网格单元，由此实现定位。

其二，请参见图7，是本发明实施例提供的另一种定位网格单元的方法的流程示意图，具体的，在所述S30中，包括：

S32：根据所述角点完成对所述网格单元的定位。

具体的，m条水平离散曲线和n条竖直离散曲线将二维网格划分为为R行C列网格单元，R＝m-1，C＝n-1。第i行j列网格单元B(i,j)由4个角点Vertex(i,j,k)围成的四边形确定，左上角角点Vertex(i,j,0)由水平离散曲线H_i和竖直离散曲线V_j的相交点确定，右上角角点Vertex(i,j,1)由水平离散曲线H_i和竖直离散曲线V_j+1的相交点确定，右下角角点Vertex(i,j,2)由水平离散曲线H_i+1和竖直离散曲线V_j+1的相交点确定，左下角角点Vertex(i,j,3)由水平离散曲线H_i+1和竖直离散曲线V_j的相交点确定。其中，相交点的坐标可根据水平离散曲线和竖直离散曲线的相同元素(即相同的坐标点)进行确定。因此，对于任一个网格单元均能通过水平离散曲线和竖直离散曲线实现定位。

在实现网格单元定位后，可分别从各网格单元中获取各题目的手写作答内容。在进行手写体识别之后，即得到各题目对应的识别结果。进一步的，以题目标号为索引在前述数据包中进行查询，得到对应的标准答案，然后可将所述识别结果与标准答案进行一一比对，从而确定各题目的批阅结果，实现客观题的自动批阅。

在一些场景中，由于答题卡曲翘等原因，从数字图像中检测到的水平离散曲线和竖直离散曲线可能存在多个相交点或者不存在相交点。对此，请参见图8，本发明实施例提出了一种优化方案，具体的，在所述S31中，包括：

S312：以所述重叠坐标点的坐标均值作为该角点的坐标；

具体的，对于每一个角点而言，对应一条水平离散曲线以及一条竖直离散曲线，因此，可根据这2条离散曲线是否存在相同元素判断是否存在重叠坐标点。

如图9A所示，若水平离散曲线101和竖直离散曲线102存在多个重叠坐标点，则取重叠坐标点的坐标均值作为角点的坐标。特别的，若如图9B所示，水平离散曲线101和竖直离散曲线102仅存在一个重叠坐标点，则以该重叠坐标点的坐标为角点的坐标。

若如图9C、图9D和图9E所示，水平离散曲线101和竖直离散曲线102不存在重叠坐标点，则先判断该角点对应的水平离散曲线和/或水平离散曲线是否为二维网格的边缘，判断是否为二维网格的边缘，可基于坐标值进行实现或者基于水平离散曲线或竖直离散曲线的线段索引号实现。

若水平离散曲线或竖直离散曲线存在至少一条离散曲线处于二维网格边缘，则在水平离散曲线选取一个元素，将其x坐标进行递增或递减，且在竖直离散曲线选取一个元素，将其y坐标进行递增或递减，直至二者存在一个相同的坐标，以此作为该角点坐标。

若水平离散曲线和竖直离散曲线均不处于二维网格的边缘，则分别在水平离散曲线和竖直离散曲线选取一个点，且保证是水平离散曲线的和竖直离散曲线中坐标相差最小的2个坐标点，计算其中点坐标，以中点坐标作为角点的坐标。

请参见图10，是本发明实施例提供的一种根据格式参数对网格单元定位进行校验与纠错的方法，在所述S30和S40之间，所述方法还包括：

如前述，所述定位标识编码有格式参数，所述格式参数包括二维网格的行数、列数、网格单元的高度、宽度等。因此，对所述定位标识进行解码后，即可得到这些格式参数。

然后，可根据所述格式参数对所述网格单元的定位进行校验与纠错。例如，在前述方案中共记录了m条水平离散曲线，n条竖直离散曲线，相当于检测得到了二维网格包括m-1行以及n-1列，可将检测得到的行数和列数与预先编码的格式参数进行对比，如果检测出来的行/列数多于格式参数中的的网格行/列数，则合并高度/宽度最小的相邻网格行/列，如果检测出来的网格行/列数少于格式参数中的网格行/列数，则拆分高度/宽度最大的相邻网格行/列。当然，以上校验与纠错方式仅是一种示例性说明，本领域技术人员可以在本发明公开的基础上，设置不同的格式参数以实现不同的校验与纠错方式。

在本发明一种实施方式中，所述S50包括：根据各题目预先设定的标准答案，分别选择对应最小字符集的预训练模型对各题目对应的手写作答内容进行识别得到各题目的识别结果。

具体的，在获取到各题目的手写作答内容之后，可根据各题目对应的标准答案，分别选用对应最小字符集的预训练模型进行文字识别。例如，第一题的标准答案为字母A，因此，可选择仅支持识别英文字母的预训练模型对第一题的手写作答内容进行识别。又比如，第五题的标准答案为符号“√”，因此可选择仅支持包括符号“√”和符号“×”的预训练模型对第五题的手写作答内容进行识别。以上预训练模型的选择仅为一种实施例的描述，本领域技术人员可基于本发明所公开的内容，根据标准答案的类型，分别设定最优的预训练模型进行识别。值得一提的是，在对诸如数字0和字母O等近似字符进行识别时，采用本发明实施例所公开的技术方案进行识别，可有效提高识别精度。本发明实施例通过答题卡的结构化设计，以及老师在备课阶段输入信息(答题卡的图形结构和题目的标准答案)，极大的减轻了判卷任务的复杂度，提升系统的识别效率与识别精度；尤其是每个网格单元中的手写作答内容的识别，由于识别前能从所述结构化的答案信息文件中得知目标识别结果，因而可以选用对应的小模型进行识别，相比仅使用一个大而全支持所有字符集的手写识别大模型，能显著提升识别精度，同时教室里的普通电脑的算力就能匹配小模型的算力需求，无需使用云端算力，节省了带宽费用和云算力费用，提升了系统的实时性。

请参见图11，在本发明一种实施方式中，在所述S60之后，所述方法还包括：

S70：获取各题目对应的手写作答内容或识别结果；

具体的，用户获取测验试卷，并为每一道题目设定一个定位区域，在题目批阅完成后，将题目的手写作答内容或者识别结果粘贴在定位区域处，从而合成完整的已作答试卷图像。在具体实施时，当用户设定定位区域时，记录所述定位区域所对应的题号以及定位区域在测验试卷中的位置，通过题号即可检索到对应的手写作答内容或者识别结果，然后将其粘贴至定位区域。在设定定位区域时，获取定位区域在所述测验试卷中的坐标信息，坐标系的原点可设定为试卷左上方第一个像素点。因此，即确定了以题号为索引，以坐标信息为返回值的数据包。在进行粘贴时，根据题号检索到对应的坐标信息，以此将手写作答内容或者识别结果粘贴至对应坐标中，以合成完整的已作答试卷图像。

为便于上述技术方案的实施，请参见图12，是本发明实施例提供的一种题目标引软件的示意图。用户通过在试卷的电子档上做标引，即在题目的答题区域画一个答题框，填写标引信息，所述标引信息包括题号、标准答案、分值、坐标信息等，其中坐标信息可基于软件自动生成，然后通过“打印答题卡”控件，跳转至答题卡配置软件，进行答题卡的编辑，答题卡配置软件的配置操作在上文中已详细描述，此处不再重复；并可通过“导出答案文件”控件，生成包括题号、标准答案、分值、坐标信息等信息的数据包。

为便于理解，请一并参见图13和图14。当学生完成作答后，得到如图13所示的答题卡，在进行批阅之后，得到手写作答内容和识别结果(此处以手写作答内容作为粘贴对象进行说明)，根据各手写作答内容的题号，可从数据包中检索到对应的坐标信息，并根据该坐标信息，将所述手写作答内容粘贴至试卷中，得到如图14所示的已作答完整试卷。

在本发明一种实施方式中，在所述S80之后，所述方法还包括：

S90：根据所述各题目的批阅结果，在所述完整的已作答试卷图像中为各所述题目粘贴对应的标识符，所述标识符用于标识题目的批阅结果。

具体的，如批阅结果为正确，则粘贴标识符“√”至题目的对应区域，如批阅结果为错误，则粘贴标识符“×”至题目的对应区域。当然，还可以采用其它标识符，本发明并不具体限定。

在本发明一种实施方式中，在所述S60之后，所述方法还包括：根据各题目的批阅结果和各题目所对应的分值，计算得到各答题卡所对应的得分。

如前述，通过答题卡配置软件可为各题目分别对应分值，当批阅结果为正确时，获取该题目的分值累计到总分值中；当批阅结果为错误时，则不进行累加操作。

进一步的，所述方法还包括：解析身份标识，以确定被测验者的身份；根据各题目的批阅结果和各题目对应的分值，确定被测验者的总得分。

本发明实施例基于对身份标识的解析，可确定被测验者的身份，从而根据各题目的批阅结果和各题目对应的分值，确定被测验者的总得分。需要说明的是，对于身份标识中的手写体识别，同样可采用对应最小字符集的预训练模型进行高精度识别。如前述，身份标识可包括姓名和学号，对姓名选用预训练的指定语种的手写识别模型进行识别，对学号选用预训练的手写数字识别模型进行识别，从而获得答题学生的姓名和学号信息，答题卡上的姓名语种由用户预先指定。

进一步的，根据各个题目的批阅结果、各个被测验者的得分等信息，生成统计信息，便于用户进行查看和分析，提高课堂教学质量。

请参见图15，是本发明实施例提供的一种基于答题卡的客观题批阅装置，所述装置包括：

另外，结合图1描述的本发明实施例的基于答题卡的客观题批阅方法可以由基于答题卡的客观题批阅设备来实现。图16示出了本发明实施例提供的基于答题卡的客观题批阅设备的硬件结构示意图。

基于答题卡的客观题批阅设备可以包括处理器以及存储有计算机程序指令的存储器。

具体地，上述处理器可以包括中央处理器(CPU)，或者特定集成电路(ApplicationSpecific Integrated Circuit，ASIC)，或者可以被配置成实施本发明实施例的一个或多个集成电路。

存储器可以包括用于数据或指令的大容量存储器。举例来说而非限制，存储器可包括硬盘驱动器(Hard Disk Drive，HDD)、软盘驱动器、闪存、光盘、磁光盘、磁带或通用串行总线(Universal Serial Bus，USB)驱动器或者两个或更多个以上这些的组合。在合适的情况下，存储器可包括可移除或不可移除(或固定)的介质。在合适的情况下，存储器可在数据处理装置的内部或外部。在特定实施例中，存储器是非易失性固态存储器。在特定实施例中，存储器包括只读存储器(ROM)。在合适的情况下，该ROM可以是掩模编程的ROM、可编程ROM(PROM)、可擦除PROM(EPROM)、电可擦除PROM(EEPROM)、电可改写ROM(EAROM)或闪存或者两个或更多个以上这些的组合。

处理器通过读取并执行存储器中存储的计算机程序指令，以实现上述实施例中的任意一种基于答题卡的客观题批阅方法。

在一个示例中，基于答题卡的客观题批阅设备还可包括通信接口和总线。其中，如图16所示，处理器、存储器、通信接口通过总线连接并完成相互间的通信。

通信接口，主要用于实现本发明实施例中各模块、装置、单元和/或设备之间的通信。

总线包括硬件、软件或两者，将基于答题卡的客观题批阅设备的部件彼此耦接在一起。举例来说而非限制，总线可包括加速图形端口(AGP)或其他图形总线、增强工业标准架构(EISA)总线、前端总线(FSB)、超传输(HT)互连、工业标准架构(ISA)总线、无限带宽互连、低引脚数(LPC)总线、存储器总线、微信道架构(MCA)总线、外围组件互连(PCI)总线、PCI-Express(PCI-X)总线、串行高级技术附件(SATA)总线、视频电子标准协会局部(VLB)总线或其他合适的总线或者两个或更多个以上这些的组合。在合适的情况下，总线可包括一个或多个总线。尽管本发明实施例描述和示出了特定的总线，但本发明考虑任何合适的总线或互连。

另外，结合上述实施例中的基于答题卡的客观题批阅方法，本发明实施例可提供一种计算机可读存储介质来实现。该计算机可读存储介质上存储有计算机程序指令；该计算机程序指令被处理器执行时实现上述实施例中的任意一种基于答题卡的客观题批阅方法。

需要明确的是，本发明并不局限于上文所描述并在图中示出的特定配置和处理。为了简明起见，这里省略了对已知方法的详细描述。在上述实施例中，描述和示出了若干具体的步骤作为示例。但是，本发明的方法过程并不限于所描述和示出的具体步骤，本领域的技术人员可以在领会本发明的精神后，作出各种改变、修改和添加，或者改变步骤之间的顺序。

以上所述的结构框图中所示的功能块可以实现为硬件、软件、固件或者它们的组合。当以硬件方式实现时，其可以例如是电子电路、专用集成电路(ASIC)、适当的固件、插件、功能卡等等。当以软件方式实现时，本发明的元素是被用于执行所需任务的程序或者代码段。程序或者代码段可以存储在机器可读介质中，或者通过载波中携带的数据信号在传输介质或者通信链路上传送。“机器可读介质”可以包括能够存储或传输信息的任何介质。机器可读介质的例子包括电子电路、半导体存储器设备、ROM、闪存、可擦除ROM(EROM)、软盘、CD-ROM、光盘、硬盘、光纤介质、射频(RF)链路，等等。代码段可以经由诸如因特网、内联网等的计算机网络被下载。

还需要说明的是，本发明中提及的示例性实施例，基于一系列的步骤或者装置描述一些方法或系统。但是，本发明不局限于上述步骤的顺序，也就是说，可以按照实施例中提及的顺序执行步骤，也可以不同于实施例中的顺序，或者若干步骤同时执行。

以上所述，仅为本发明的具体实施方式，所属领域的技术人员可以清楚地了解到，为了描述的方便和简洁，上述描述的系统、模块和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。应理解，本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到各种等效的修改或替换，这些修改或替换都应涵盖在本发明的保护范围之内。

Claims

1.一种基于答题卡的客观题批阅方法，其特征在于，所述答题卡包括由水平线段和竖直线段构成的二维网格，所述二维网格包括多个网格单元，所述网格单元用于提供给被测验者进行手写作答，所述方法包括：

S10：拍摄作答完成的答题卡以获取其数字图像；

S50：对所述手写作答内容进行识别得到各题目的识别结果；

2.根据权利要求1所述的方法，其特征在于，在所述S20中，包括：

S21：对所述数字图像进行二值化处理；

3.根据权利要求2所述的方法，其特征在于，所述水平离散曲线包括第一水平离散曲线和第二水平离散曲线，记所述第一水平离散曲线的右端点坐标为(x_a,y_a)，记所述第二水平离散曲线的左端点坐标为(x_b,y_b)，若|x_a-x_b|＜T_hx且|y_a-y_b|＜T_hy，T_hx和T_hy为预设阈值，在所述S23之后，还包括：将所述第二水平离散曲线作为所述第一水平离散曲线的右边部分，合并至所述第一水平离散曲线。

4.根据权利要求1所述的方法，其特征在于，在所述S30中，包括：

S32：根据所述角点完成对所述网格单元的定位。

5.根据权利要求4所述的方法，其特征在于，在所述S31中，包括：

S312：以所述重叠坐标点的坐标均值作为该角点的坐标；

6.根据权要求1所述的方法，其特征在于，所述答题卡还包括编码有格式参数的定位标识，所述格式参数包括二维网格的行数、列数以及网格单元的高度、宽度中的一种或多种，在所述S30和S40之间，所述方法还包括：

7.根据权利要求1所述的方法，其特征在于，所述S50包括：根据各题目预先设定的标准答案，分别选择对应最小字符集的预训练模型对各题目对应的手写作答内容进行识别得到各题目的识别结果。

8.根据权利要求1所述的方法，其特征在于，在所述S60之后，所述方法还包括：

S70：获取各题目对应的手写作答内容或识别结果；

9.根据权利要求1-8任一项所述的方法，其特征在于，所述水平离散曲线由x坐标连续且x坐标连续的2个坐标点的y坐标变化不超过1的坐标点组成；所述竖直离散曲线由y坐标连续且y坐标连续的2个坐标点的x坐标变化不超过1的坐标点组成。

10.一种基于答题卡的客观题批阅装置，其特征在于，所述答题卡包括由水平线段和竖直线段构成的二维网格，所述二维网格包括多个网格单元，所述网格单元用于提供给被测验者进行手写作答，所述装置包括：

11.一种基于答题卡的客观题批阅设备，其特征在于，包括：至少一个处理器、至少一个存储器以及存储在所述存储器中的计算机程序指令，当所述计算机程序指令被所述处理器执行时实现如权利要求1-9中任一项所述的方法。

12.一种存储介质，其上存储有计算机程序指令，其特征在于，当所述计算机程序指令被处理器执行时实现如权利要求1-9中任一项所述的方法。