CN108416345A

CN108416345A - 一种答题卡区域识别方法和计算设备

Info

Publication number: CN108416345A
Application number: CN201810128164.0A
Authority: CN
Inventors: 刘辉; 刘宁; 郭龙; 徐行; 张东祥; 陈李江
Original assignee: Hainan Cloud River Technology Co Ltd
Current assignee: Hainan Avanti Technology Co ltd
Priority date: 2018-02-08
Filing date: 2018-02-08
Publication date: 2018-08-17
Anticipated expiration: 2038-02-08
Also published as: CN108416345B

Abstract

本发明公开了一种答题卡区域识别方法，适于在计算设备中执行，该方法包括：获取待识别的答题卡图像；提取该答题卡图像中的所有连通域，并将各连通域按照面积大小降序排序；依次找出各连通域内的横线和竖线，如果某连通域内具有两条以上横线和三条以上竖线，则将该连通域标记为答题卡区域。本发明还公开了对应的计算设备。

Description

一种答题卡区域识别方法和计算设备

技术领域

本发明涉及图像数据处理领域，尤其涉及一种答题卡区域识别和计算设备。

背景技术

随着计算机和互联网技术的发展，人们越来越多的使用自动化设备对学生考试试卷进行阅卷。在试卷分析时中，经常需要对答题卡区域进行识别以进行分数统计。但受限于目前的光电识别技术和图像识别技术，现有方案中的答题卡识别通常要求答题卡设计格式固定、答题卡必须是扫描仪输入且答题卡不能出现倾斜旋转等问题。而且教师在在打分区域填写分数时，还通常要求将分数规范写在每道题的矩形框内而不能写出框外，且无法做到对客观题的自动评分。这些都极大地限制了答题卡的检测效率和答题卡分数的统计效率和准确度。

因此，需要提供一种更有效的答题卡区域的识别和分数统计方法。

发明内容

鉴于上述问题，本发明提出了一种答题卡区域识别方法和计算设备，以力图解决或者至少解决上面存在的问题。

根据本发明的一个方面，提供一种答题卡区域识别方法，适于在计算设备中执行，该方法包括：获取待识别的答题卡图像；提取该答题卡图像中的所有连通域，并将各连通域按照面积大小降序排序；依次找出各连通域内的横线和竖线，如果某连通域内具有两条以上横线和三条以上竖线，则将该连通域标记为答题卡区域。

可选地，在根据本发明的答题卡区域识别方法中，还包括步骤：分别识别该答题卡区域内由各横线和竖线交织出的各矩形框中的文字内容，文字内容包括题号、分值和答案中的至少一种，以便根据所识别的文字内容进行分数统计。

可选地，在根据本发明的答题卡区域识别方法中，设某连通域所在位置的图像宽度为M、高度为N，则找出该连通域内的横线的步骤包括：将连通域中的每个点标记为一个二维节点a_i,j，i＝1,2…,M，j＝1,2…,N；根据该连通域图像建立横向有向图，其中若点a_i,j为背景色节点，则其没有任何边，若其非背景色节点，则分别将其到点a_i+1,j-1、点a_i+1,j和点a_i+1,j+1之间作为该横向有向图中的一条边；以及采用预定算法找出到达点a_M,j的最长路径，该最长路径所在线条即为一条横线。

可选地，在根据本发明的答题卡区域识别方法中，到达点a_M,j的最长路径P(a_M,j)＝Max(P(a_M-1,j-1)+w(a_M-1,j-1，a_M,j)，P(a_M-1,j+1)+w(a_M-1,j+1，a_M,j)，P(a_M-1,j)+w(a_M-1,j，a_M,j))，其中Max表示取最大值，w(a_x，a_y)表示有向边<a_x，a_y>的权值。

可选地，在根据本发明的答题卡区域识别方法中，找出该连通域内的竖线的步骤包括：根据该连通域图像建立竖向有向图，其中若点a_i,j为背景色节点，则其没有任何边，若其非背景色节点，则分别将其到点a_i-1,j+1、点a_i,j+1和点a_i+1,j+1之间作为该竖向有向图中的一条边；以及采用预定算法找出到达点a_i,N的最长路径，该最长路径所在线条即为一条竖线。

可选地，在根据本发明的答题卡区域识别方法中，预定算法为Dijkstra算法。

可选地，在根据本发明的答题卡区域识别方法中，在提取该答题卡图像中的所有连通域之前，还包括对该答题卡图像进行二值化处理的操作。

可选地，在根据本发明的答题卡区域识别方法中，在提取该答题卡图像中的所有连通域之后，还包括对该答题卡图像进行旋转矫正的操作，旋转矫正操作适于根据各连通域之间的相对位置关系来确定旋转角度。

可选地，在根据本发明的答题卡区域识别方法中，分别识别该答题卡区域内由各横线和竖线交织出的各矩形框中的文字内容的步骤包括：分别提取每个矩形框中的文字连通域；分别对各文字连通域进行文字识别，从中识别出“题号”“答案”和“分值”所在矩形框，其中“题号”矩形框所在行即为试题编号，“答案”矩形框所在行即为相应题号的答案，“分值”矩形框所在行即为相应题号的分值。

可选地，在根据本发明的答题卡区域识别方法中，还包括步骤：若文字连通域跨越两个或多个矩形框，则将该两个或多个矩形框的文字连通域进行合并。

可选地，在根据本发明的答题卡区域识别方法中，还包括步骤：从该答题卡图像中获取试卷编号，根据该试卷编号从数据库中查询该试卷中各题号的分值和正确答案，将该正确答案与所识别出的试题答案作对比，以得到各题号的分数。

根据本发明的又一个方面，提供一种计算设备，包括：至少一个处理器；和存储有程序指令的存储器，其中，该程序指令被配置为适于由所述至少一个处理器执行，程序指令包括用于执行如上所述的答题卡区域识别方法的指令。

根据本发明的又一个方面，提供一种存储有程序指令的可读存储介质，当该程序指令被计算设备读取并执行时，使得该计算设备执行如上所述的答题卡区域识别方法。

根据本发明的技术方案，可以针对答题部分进行自动识别和分数统计。首先识别出答题部分的连通域，随后在这个矩形区域中识别横竖线条。当某连通域中具有两条以上横线和三条以上竖线，则将该连通域标记为答题卡区域。之后，本发明还可以识别由这些横竖线条构成的矩形框，识别各个矩形框里面的文字内容，并根据各个矩形框的位置关系和试题特有的字符排序，识别出各个题目题号以及和每个题目对应的结果或者分数。这样再结合之前对试题的配置信息即可确定最终的试题分数。

本发明所能识别的答题卡以及尺寸和位置均不需要特殊预设，一般表格形式打印后都可以作为答题卡，系统导入方便快捷。而且本方案适应性好，任何的考试试卷都可以应用本方法进行答题卡区域统计和分数统计。另外，本发明的试卷输入非常简单，无需使用扫描仪，使用日常的手机随拍即可输入，节约成本。

附图说明

为了实现上述以及相关目的，本文结合下面的描述和附图来描述某些说明性方面，这些方面指示了可以实践本文所公开的原理的各种方式，并且所有方面及其等效方面旨在落入所要求保护的主题的范围内。通过结合附图阅读下面的详细描述，本公开的上述以及其它目的、特征和优势将变得更加明显。遍及本公开，相同的附图标记通常指代相同的部件或元素。

图1示出了根据本发明一个实施例的计算设备100的结构框图；

图2示出了根据本发明一个实施例的答题卡区域识别方法200的流程图；

图3示出了根据本发明一个实施例的答题卡图像示意图；以及

图4示出了从图3中的答题卡图像中所提取出的答题卡区域及检测到的所有横线和竖线。

具体实施方式

下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例，然而应当理解，可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反，提供这些实施例是为了能够更透彻地理解本公开，并且能够将本公开的范围完整的传达给本领域的技术人员。

图1是示例计算设备100的框图。在基本的配置102中，计算设备100典型地包括系统存储器106和一个或者多个处理器104。存储器总线108可以用于在处理器104和系统存储器106之间的通信。

取决于期望的配置，处理器104可以是任何类型的处理，包括但不限于：微处理器(μP)、微控制器(μC)、数字信息处理器(DSP)或者它们的任何组合。处理器104可以包括诸如一级高速缓存110和二级高速缓存112之类的一个或者多个级别的高速缓存、处理器核心114和寄存器116。示例的处理器核心114可以包括运算逻辑单元(ALU)、浮点数单元(FPU)、数字信号处理核心(DSP核心)或者它们的任何组合。示例的存储器控制器118可以与处理器104一起使用，或者在一些实现中，存储器控制器118可以是处理器104的一个内部部分。

取决于期望的配置，系统存储器106可以是任意类型的存储器，包括但不限于：易失性存储器(诸如RAM)、非易失性存储器(诸如ROM、闪存等)或者它们的任何组合。系统存储器106可以包括操作系统120、一个或者多个应用122以及程序数据124。在一些实施方式中，应用122可以布置为在操作系统上利用程序数据124进行操作。程序数据124包括指令，在根据本发明的计算设备100中，程序数据124包含用于执行答题卡区域识别方法200的指令。

计算设备100还可以包括有助于从各种接口设备(例如，输出设备142、外设接口144和通信设备146)到基本配置102经由总线/接口控制器130的通信的接口总线140。示例的输出设备142包括图形处理单元148和音频处理单元150。它们可以被配置为有助于经由一个或者多个A/V端口152与诸如显示器或者扬声器之类的各种外部设备进行通信。示例外设接口144可以包括串行接口控制器154和并行接口控制器156，它们可以被配置为有助于经由一个或者多个I/O端口158和诸如输入设备(例如，键盘、鼠标、笔、语音输入设备、触摸输入设备)或者其他外设(例如打印机、扫描仪等)之类的外部设备进行通信。示例的通信设备146可以包括网络控制器160，其可以被布置为便于经由一个或者多个通信端口164与一个或者多个其他计算设备162通过网络通信链路的通信。

网络通信链路可以是通信介质的一个示例。通信介质通常可以体现为在诸如载波或者其他传输机制之类的调制数据信号中的计算机可读指令、数据结构、程序模块，并且可以包括任何信息递送介质。“调制数据信号”可以这样的信号，它的数据集中的一个或者多个或者它的改变可以在信号中编码信息的方式进行。作为非限制性的示例，通信介质可以包括诸如有线网络或者专线网络之类的有线介质，以及诸如声音、射频(RF)、微波、红外(IR)或者其它无线介质在内的各种无线介质。这里使用的术语计算机可读介质可以包括存储介质和通信介质二者。

计算设备100可以实现为服务器，例如文件服务器、数据库服务器、应用程序服务器和WEB服务器等，也可以实现为小尺寸便携(或者移动)电子设备的一部分，这些电子设备可以是诸如蜂窝电话、个人数字助理(PDA)、个人媒体播放器设备、无线网络浏览设备、个人头戴设备、应用专用设备、或者可以包括上面任何功能的混合设备。计算设备100还可以实现为包括桌面计算机和笔记本计算机配置的个人计算机。在一些实施例中，计算设备100被配置为执行根据本发明的答题卡区域识别方法200。

图2示出了根据本发明一个实施例的答题卡区域识别方法200，可以在计算设备中执行，如在计算设备100中执行。如图2所示，该方法始于步骤S220。

在步骤S220，获取待识别的答题卡图像。这里，该原始图片可以通过扫描仪获取高清的文字图像，也可以通过手机或照相机获取拍照获取图像。而且，图片获取没有严格的环境要求(如光照、角度和纸张纹理等)，只需自然光照下正常拍摄普通纸张即可另外，该答题卡可以是任意形式、格式及尺寸的答题卡，如可以是专门特质的卡片式答题卡；也可以是考试试卷上的任意答题区域，学生统一将答题结果写在该答题区域，而该考试试卷也可以是任意类型的考试试卷。这些都从多个角度提高了答题卡图像识别的普适性，也降低了图像识别的工作量和成本。

随后，在步骤S240中，提取该答题卡图像中的所有连通域，并将各连通域按照面积大小降序排序。

其中，连通域是指由8连通点形成的连通区域，这里可以采用现有任意的连通域识别方法，如标记法，本发明对此不作限制。通常，可以直接调用图像处理库中的现有连通域检测函数进行检测识别。图1示出了一张待识别的答题卡图像，其包括编码行区域和答题卡区域，编码行区域包括“编”“码”及相应的几个编码数字，答题卡区域即由最外周的粗边框所框起来的区域。对该答题卡图像进行连通域检测后，可检测到多个连通域，其中编码行中的每个文字可单独检测出一个连通域，答题卡表格的外边框所框起来的也是一个连通域。确定答题卡图像的连通域后，即可计算各连通域的面积，并按面积从大到小排列。

根据本发明的一个实施例，在提取该答题卡图像中的所有连通域之前，还包括对该答题卡图像进行二值化处理的操作。其中二值化方法可以采用现有任意方法，如可以采用Sauvola算法，当然不限于此。

根据本发明的另一个实施例，在提取该答题卡图像中的所有连通域之后，还可以对该答题卡图像进行旋转矫正的操作，该旋转矫正操作可以根据各连通域之间的相对位置关系来确定旋转角度。对于倾斜矫正，通常负45度到正45度之间的角度并不影响识别结果，因此无需矫正，实际可只矫正图像旋转90度、180度和270度的情况。倾斜矫正主要利用矩形框答题卡的左上部的试卷编码的文字，利用答题卡表格和试卷编码行文字的相对位置关系来确定图像是否发生了旋转，并进行相应的矫正处理。

随后，在步骤S260中，依次找出各连通域内的横线和竖线，如果某连通域内具有两条以上横线和三条以上竖线，则将该连通域标记为答题卡区域。也就是依次取出排序好的连通域，对每个连通域找出所有的横线和竖线。图4中即是根据图3中的答题卡图像所提取出的答题卡区域及所找到的所有横线和竖线。

根据本发明的一个实施例，设某连通域所在位置的图像宽度为M、高度为N，则可以根据以下方法找出该连通域内的横线：将连通域中的每个点标记为一个二维节点a_i，j，i＝1,2…,M，j＝1,2…,N；根据该连通域图像建立横向有向图，其中若点a_i，j为背景色节点，则其没有任何边，若其非背景色节点，则分别将其到点a_i+1,j-1、点a_i+1,j和点a_i+1,j+1之间作为该横向有向图中的一条边；采用预定算法找出到达点a_M,j的最长路径，该最长路径所在线条即为一条横线。其中，若答题卡图像或其所转换的二值图像的背景色为白色(如图1中所示)，答题卡文字和边框为黑色，则背景色节点即为白色点，非背景色节点即为黑色点；反之亦然。

也就是，本发明将连通域所在位置的图像看成为M*N的二维节点a_i,j(i＝1,2…,M,j＝1,2…,N)。对于背景色节点a_i,j，最多有三条边跟其他三个背景色节点连接,分别是a_i+1,j-1、a_i+1,j和a_i+1,j+1，三条边的权值分别是w、1和w，其中w<1；而非背景色节点没有任何边。因此建立了一个有向图，可以应用寻找最长路径的预定算法找到到达a_M,j的最长路径，如果到达a_M,j无有效路径，则取它前一层到达a_M-1,j，若a_M-1,j无有效路径，则继续取它前一层a_M-2,j，直至有有效路径(j＝1,2…,N)。之后，找出其路径长度L_j(j＝1,2,…N)的波峰，以这些长度波峰所属的路径，即为其找出的横直线。关于路径长度的波峰，虽然用手机拍摄出来的答题卡中的直线通常是非理想的直线，但仍然可以模拟二维图像水平投影的方式，将二维图像水平投影替换成最大长度路径的长度，再找出这些路径长度的波峰，即为找到的所有直线。

根据一个实施例，预定算法可以是Dijkstra算法，当然不限于此。本发明中构建的有向图的顶点和边比较简单，因此可以利用Dijkstra算法的思想来找出最长路径。对于目标点a_M,j，其最多有三个顶点与之连接，即点a_M-1,j、点a_M-1,j-1和点a_M-1,j+1，因此到达点a_M,j的最长路径P(a_M,j)＝Max(P(a_M-1,j-1)+w(a_M-1,j-1，a_M,j)，P(a_M-1,j+1)+w(a_M-1,j+1，a_M,j)，P(a_M-1,j)+w(a_M-1,j，a_M,j))，其中Max表示取最大值，w(a_x，a_y)表示有向边<a_x，a_y>的权值。这里用a_x和a_y的方式代表某有向边的两个节点，本领域技术人员应当理解其实际是指点a_M-1,j-1和a_M,j对，a_M-1,j+1和a_M,j点对、以及a_M-1,j和a_M,j点对。另外，P(a_M-1,j-1)代表到点a_M-1,j-1的最长路径，P(a_M-1,j+1)代表到点a_M-1,j+1的最长路径，以此类推。

找竖线的方法与找横线类似，同样是将连通域中的每个点标记为一个二维节点a_i,j，i＝1,2…,M，j＝1,2…,N；根据该连通域图像建立竖向有向图，其中若点a_ij为背景色节点，则其没有任何边，若其非背景色节点，则分别将其可到点a_i-1,j+1、点a_i,j+1和点a_i+1,j+1之间作为该竖向有向图中的一条边；采用预定算法找出到达点a_i,N的最长路径，该最长路径所在线条即为一条竖线。找竖线的具体细节可以参考找横线的描述，只是将横向点相应的换成竖向点，这里不再赘述。

根据本发明的一个实施例，在步骤S260之后，还可以进一步地分别识别该答题卡区域内由各横线和竖线交织出的各矩形框中的文字内容，该文字内容包括题号、分值和答案中的至少一种，以便根据所识别的文字内容进行分数统计。

具体地，根据步骤S260中所找出的所有横直线和竖直线，找出这些横竖线的交点，这些交点即为所有矩形框的顶点，可以用r_i,j表示第i行的第j个矩形框。之后，分别提取每个矩形框中的文字连通域，并分别对各文字连通域进行文字识别，从中识别出“题号”“答案”和“分值”所在矩形框，其中“题号”矩形框所在行即为试题编号，“答案”矩形框所在行即为相应题号的答案，“分值”矩形框所在行即为相应题号的分值。另外，若文字连通域跨越两个或多个矩形框，则还可以将该两个或多个矩形框的文字连通域进行合并。

通常，矩形框r_i,1(即第一列矩形框)可代表该矩形框所在行的内容属性，文字内容为“题号”的即为题号，该“题号”矩形框所在行的内容均为试题编号；文字内容为“答案”的即为客观题答案，该“答案”矩形框所在行的内容均为试题答案；文字内容为“分值”的即为老师填写的该题主观题得分分值，该“分值”矩形框所在行的内容均为试题分数。当然，答题卡中也可以其他相近或相似词语，如“题目”“结果”“分数”，本领域技术人员可以根据词语常识判断出题目编号行、题目答案/结果行、以及题目分数行。随后即可建立起题号与客观题答案的对应关系、以及题号与主观题分值的对应关系。例如r_1,1识别内容为“题号”，r_2,1识别内容为“答案”，r_3,1识别内容为“题号”，r_4,1识别内容为“分值”，则题号r_1,j(j>1)对应的客观题答案为r_2,j，题号r_3,j(j>1)对应的主观题的分值为r_4,j。这样根据各个矩形框的位置关系和试题特有的字符排序，识别出各个题目题号以及和每个题目对应的结果/或者分数。

根据本发明的一个实施例，还可以从该答题卡图像中获取试卷编号，根据该试卷编号从数据库中查询该试卷中各题号的分值和正确答案，将该正确答案与所识别出的各矩形框中的试题答案作对比，以得到各题号的分数。通常试卷编号位于答题卡区域的左上方或右上方位置，其通常具有特殊的文字特征，如固定的字符编码或特定的起始文字(如“试卷编号”)，根据这些特征可以有效识别该试卷编号。之后，即可根据这些试卷编号从数据库中查询每道客观题的分值及答案信息，对比识别出的学生所写出的答案，自动给出客观题分值。另外，如果教师直接在答题卡上写明了主观题分数(如图1中的第16-18题的4、8和8分值)，那根据该主观题分数及所计算得到的客观题分数还可给出试卷总分。

根据本发明的技术方案，通过对答题卡图像中各连通域中的横线和竖线检测，准确识别出了其中的答题卡区域。之后，根据对答题卡区域中各矩形框内的文字识别，自动构建题号与客观题、题号与分值之间的对应。这样，根据每道题的题号、答题结果及正确答案之间的对比，即可实现客观题的自动评分。最后，根据所识别出的主观题分值即可给出试卷总分。本发明可适应任意形式、格式及尺寸的答题卡、以及任意类型的考试试卷，试卷输入简单，采用手机拍摄答题卡照片即可进行识别，有效提高了试卷分数统计的效率及普适性。

A9、如A2所述的方法，其中，所述分别识别该答题卡区域内由各横线和竖线交织出的各矩形框中的文字内容的步骤包括：分别提取每个矩形框中的文字连通域；分别对各文字连通域进行文字识别，从中识别出“题号”“答案”和“分值”所在矩形框，其中“题号”矩形框所在行即为试题编号，“答案”矩形框所在行即为相应题号的答案，“分值”矩形框所在行即为相应题号的分值。

A10、如A9所述的方法，其中，还包括步骤：若文字连通域跨越两个或多个矩形框，则将该两个或多个矩形框的文字连通域进行合并。

A11、如A9所述的方法，其中，还包括步骤：从该答题卡图像中获取试卷编号，根据该试卷编号从数据库中查询该试卷中各题号的分值和正确答案，将该正确答案与所识别出的试题答案作对比，以得到各题号的分数。

在此处所提供的说明书中，说明了大量具体细节。然而，能够理解，本发明的实施例可以在没有这些具体细节的情况下被实践。在一些实例中，并未详细示出公知的方法、结构和技术，以便不模糊对本说明书的理解。

类似地，应当理解，为了精简本公开并帮助理解各个发明方面中的一个或多个，在上面对本发明的示例性实施例的描述中，本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而，并不应将该公开的方法解释成反映如下意图：即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多特征。更确切地说，如下面的权利要求书所反映的那样，发明方面在于少于前面公开的单个实施例的所有特征。因此，遵循具体实施方式的权利要求书由此明确地并入该具体实施方式，其中每个权利要求本身都作为本发明的单独实施例。

本领域那些技术人员应当理解在本文所公开的示例中的设备的模块或单元或组件可以布置在如该实施例中所描述的设备中，或者可替换地可以定位在与该示例中的设备不同的一个或多个设备中。前述示例中的模块可以组合为一个模块或者此外可以分成多个子模块。

本领域那些技术人员可以理解，可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件，以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外，可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述，本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。

此外，本领域的技术人员能够理解，尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征，但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如，在下面的权利要求书中，所要求保护的实施例的任意之一都可以以任意的组合方式来使用。

这里描述的各种技术可结合硬件或软件，或者它们的组合一起实现。从而，本发明的方法和设备，或者本发明的方法和设备的某些方面或部分可采取嵌入有形媒介，例如软盘、CD-ROM、硬盘驱动器或者其它任意机器可读的存储介质中的程序代码(即指令)的形式，其中当程序被载入诸如计算机之类的机器，并被所述机器执行时，所述机器变成实践本发明的设备。

在程序代码在可编程计算机上执行的情况下，计算设备一般包括处理器、处理器可读的存储介质(包括易失性和非易失性存储器和/或存储元件)，至少一个输入装置，和至少一个输出装置。其中，存储器被配置用于存储程序代码；处理器被配置用于根据该存储器中存储的所述程序代码中的指令，执行本发明的答题卡区域识别方法。

此外，所述实施例中的一些在此被描述成可以由计算机系统的处理器或者由执行所述功能的其它装置实施的方法或方法元素的组合。因此，具有用于实施所述方法或方法元素的必要指令的处理器形成用于实施该方法或方法元素的装置。此外，装置实施例的在此所述的元素是如下装置的例子：该装置用于实施由为了实施该发明的目的的元素所执行的功能。

如在此所使用的那样，除非另行规定，使用序数词“第一”、“第二”、“第三”等等来描述普通对象仅仅表示涉及类似对象的不同实例，并且并不意图暗示这样被描述的对象必须具有时间上、空间上、排序方面或者以任意其它方式的给定顺序。

尽管根据有限数量的实施例描述了本发明，但是受益于上面的描述，本技术领域内的技术人员明白，在由此描述的本发明的范围内，可以设想其它实施例。此外，应当注意，本说明书中使用的语言主要是为了可读性和教导的目的而选择的，而不是为了解释或者限定本发明的主题而选择的。因此，在不偏离所附权利要求书的范围和精神的情况下，对本技术领域的普通技术人员来说许多修改和变更都是显而易见的。对于本发明的范围，对本发明所做的公开是说明性的，而非限制性的，本发明的范围由所附权利要求书限定。

Claims

1.一种答题卡区域识别方法，适于在计算设备中执行，该方法包括：

获取待识别的答题卡图像；

提取该答题卡图像中的所有连通域，并将各连通域按照面积大小降序排序；以及

依次找出各连通域内的横线和竖线，如果某连通域内具有两条以上横线和三条以上竖线，则将该连通域标记为答题卡区域。

2.如权利要求1所述的方法，其中，还包括步骤：

分别识别该答题卡区域内由各横线和竖线交织出的各矩形框中的文字内容，所述文字内容包括题号、分值和答案中的至少一种，以便根据所识别的文字内容进行分数统计。

3.如权利要求1所述的方法，其中，设某连通域所在位置的图像宽度为M、高度为N，则找出该连通域内的横线的步骤包括：

将连通域中的每个点标记为一个二维节点a_i,j，i＝1,2…,M，j＝1,2…,N；

根据该连通域图像建立横向有向图，其中若点a_i,j为背景色节点，则其没有任何边，若其非背景色节点，则分别将其到点a_i+1,j-1、点a_i+1,j和点a_i+1,j+1之间作为该横向有向图中的一条边；以及

采用预定算法找出到达点a_M,j的最长路径，该最长路径所在线条即为一条横线。

4.如权利要求3所述的方法，其中，到达点a_M,j的最长路径P(a_M,j)＝Max(P(a_M-1,j-1)+w(a_M-1,j-1，a_M,j)，P(a_M-1,j+1)+w(a_M-1,j+1，a_M,j)，P(a_M-1,j)+w(a_M-1,j，a_M,j))，其中Max表示取最大值，w(a_x，a_y)表示有向边<a_x，a_y>的权值。

5.如权利要求1或3所述的方法，其中，找出该连通域内的竖线的步骤包括：

根据该连通域图像建立竖向有向图，其中若点a_i,j为背景色节点，则其没有任何边，若其非背景色节点，则分别将其到点a_i-1,j+1、点a_i,j+1和点a_i+1,j+1之间作为该竖向有向图中的一条边；以及

采用预定算法找出到达点a_i,N的最长路径，该最长路径所在线条即为一条竖线。

6.如权利要求3或5所述的方法，其中，所述预定算法为Dijkstra算法。

7.如权利要求1所述的方法，其中，在提取该答题卡图像中的所有连通域之前，还包括对该答题卡图像进行二值化处理的操作。

8.如权利要求1所述的方法，其中，在提取该答题卡图像中的所有连通域之后，还包括对该答题卡图像进行旋转矫正的操作，所述旋转矫正操作适于根据各连通域之间的相对位置关系来确定旋转角度。

9.一种计算设备，包括：

一个或多个处理器；

存储器；以及

一个或多个程序，其中所述一个或多个程序存储在所述存储器中并被配置为由所述一个或多个处理器执行，所述一个或多个程序包括用于执行根据权利要求1-8所述的方法中的任一方法的指令。

10.一种存储一个或多个程序的计算机可读存储介质，所述一个或多个程序包括指令，所述指令当由计算设备执行时，使得所述计算设备执行根据权利要求1-8所述的方法中的任一方法。