CN108647680A

CN108647680A - 图像定位框检测方法和装置

Info

Publication number: CN108647680A
Application number: CN201810407970.1A
Authority: CN
Inventors: 黎小说
Original assignee: Beijing Boxfish Education Co Ltd
Current assignee: Beijing Boxfish Education Co Ltd
Priority date: 2018-04-28
Filing date: 2018-04-28
Publication date: 2018-10-12
Anticipated expiration: 2038-04-28
Also published as: CN108647680B

Abstract

本发明涉及图像定位框检测方法和装置，该定位框检测方法包括：图像获取步骤，获取带有定位框的页面的图像；预处理步骤，将所述图像二值化；辅助检测色块绘制步骤，在所述二值化图像的中心区域绘制重叠的辅助背景色块和辅助前景色块，且辅助背景色块包围辅助背景色块；二值图连通域检测步骤，检测二值图的连通域，建立连通域之间的层次关系；辅助前景色块轮廓的连通域确定步骤，根据所绘制的辅助前景色块的坐标，确定辅助前景色块轮廓的连通域；定位框连通域确定步骤，利用连通域的层次关系，通过辅助前景色块轮廓的连通域向外找到定位框的连通区域；定位框顶点检测步骤，根据所述定位框的连通区域，进行定位框的顶点检测。

Description

图像定位框检测方法和装置

技术领域

本发明涉及图像检测和畸形校正，可用于远程阅卷系统的答题区域定位和校正。

背景技术

计算机网络的发展极大地改变了人们的生活，远程阅卷和批改也逐渐增多。通常的远程阅卷系统通常只能处理扫描图像。而用户使用手机随手拍摄的照片因为存在背景嘈杂、透视及扭曲形变等问题，很难准确定位到准确的答题区域。因此基于图像处理的阅卷系统通常只用于大型考试中(使用扫描仪统一扫描试卷)，而不能普及到日常的批改中(使用手机随手拍)。

发明内容

本发明鉴于以上的情况而做出，用于对具有定位框的页面图像进行定位框的检测，从而能够准确进行定位框的定位，从而方便对页面的识别。

为了实现上述目的，根据本发明的一个方面，提供了一种定位框检测方法，包括如下的步骤：图像获取步骤，获取带有定位框的页面的图像；预处理步骤，将所述图像二值化；辅助前景色块区域绘制步骤，在所述二值化图像的中心区域绘制辅助前景色块区域；二值图连通域检测步骤，检测二值图的连通域，建立连通域之间的层次关系；辅助前景色块区域连通域确定步骤，根据所绘制的辅助前景色块区域的坐标，确定辅助前景色块色块区域的连通域；定位框连通域确定步骤，利用连通域的层次关系，通过辅助前景色块区域的连通域向外找到定位框的连通区域；定位框顶点检测步骤，根据所述定位框的连通区域，进行定位框的顶点检测。

根据本发明的另一方面，提供了一种定位框检测装置，包括：图像获取单元，获取带有定位框的页面的图像；预处理单元，将所述图像二值化；辅助检测区域绘制前景颜色色块单元，在所述二值化图像的中心区域绘制辅助前景色块区域；二值图连通域检测单元，检测二值图的连通域，建立连通域之间的层次关系；辅助前景色块区域连通域确定单元，根据所绘制的辅助前景色块区域的坐标，确定辅助前景色块区域的连通域；定位框连通域确定单元，利用连通域的层次关系，通过辅助前景色块区域的连通域向外找到定位框的连通区域；定位框顶点检测单元，根据所述定位框的连通区域，进行定位框的顶点检测。

本发明涉及一种计算机程序存储介质，所存储的计算机程序在被处理执行时，可以实现本发明要求权利的各方法。

本发明也涉及一种计算机，其包括处理器和存储介质，所述存储介质所存储的计算机程序在被处理执行时，可以实现本发明要求权利的各方法。

根据本发明的实施方式，可以准确定位定位框的位置，为采用手机等进行拍摄获取试卷图像并进行图像识别创造了条件，从而使得基于图像处理的阅卷系统可以应用于日常作业的批改中。

附图说明

图1示出了依据本发明的一种实施方式的图像定位框检测方法的示意性流程图；

图2示出了根据本发明的一种实施方式进行定位框轮廓检测的示意性流程图；

图3示出了在二值化图像中叠加被辅助背景色块区域包围的辅助前景色块区域的示意图；

图4示出了利用连通域层次关系，根据辅助前景色块区域找出定位框的连通域的示意图；

图5示出了依据本发明一种实施方式的顶点检测方法的示意图；

图6中示出了依据本发明的一种实施方式的进行多边形拟合的示意图；

图7示出了依据本发明的一种实施方式的定位框扭曲调整的示意性流程图；

图8示出了依据本发明的一种实施方式的扭曲程度检测的示意图；

图9示出了获得图像子图的示意图；

图10示出了断层现象的示意图；

图11示出了依据本发明的一种实施方式的图像定位框检测装置的示意性方框图；

图12示出了根据本发明的一种实施方式的定位框轮廓检测单元502的示意性方框图；

图13示出了依据本发明一种实施方式的定位框的顶点检测单元的方框图；

图14示出了依据本发明的一种实施方式的定位框扭曲调整单元的示意性方框图。

具体实施方式

下面结合附图，对本发明的实施方式进行详细的说明。

图1示出了依据本发明的一种实施方式的图像定位框检测方法的示意性流程图。

首先，在图像获取步骤101，获取带有定位框的页面的图像。所述图像包括完整的定位框且定位框内图像面积占整幅图像的大部分。定位框指页面内待处理信息的外围封闭框，定位框为包括N个顶点N条边的多边形，N通常为4。实际应用中，N边形可以表现为直线、一定曲率的曲线、花纹、图案等。定位框外为非信息区域，定位框内为有价值的信息区域，例如试题以及答案。可以以各种方式获得习题页图像。例如可以通过摄像机或手机上的摄像头获得，也可以是从远端通过有线或无线网络获得，或通过键盘、鼠标、屏幕、USB接口等外围设备，由用户输入而获得。

然后在步骤102进行图像预处理。根据一种实施方式，预处理步骤包括：将图像转为灰度图，并采用高斯滤波去掉图像中的噪声点。

然后在步骤103进行图像二值化。根据一种实施方式，可以如下地进行：对上一步骤预处理后的图像采用阈值法或者边缘检测法进行二值化，并进行闭运算。二值化后的图像的前景中包括了定位框的纹理。通过设定二值化和闭运算的超参数，尽可能地保证二值化图像中定位框纹理的完整。

接着在步骤104，进行定位框轮廓检测。根据一种实施方式，采用从内向外轮廓查找法，确定定位框轮廓。该方法通过主动绘制位于图像正中的辅助检测色块(由辅助背景色块和辅助前景色块组成，且辅助背景色块包围辅助前景色块)，辅助检测色块通常位于定位框内部，且其中的辅助前景色块与周围区域前景无相交，其轮廓与定位框的轮廓具有稳定的位置关系。根据辅助前景色块的准确的位置信息，确定辅助前景色块的轮廓；进而，根据连通域之间的位置关系，以辅助前景色块的轮廓为起点，向外层查找指定的层数即可准确获取定位框轮廓。从内到外轮廓查找法，可以有效适应图像的背景嘈杂、颜色亮度纹理不可预知，而定框内部信息可控的情况。

图2示出了根据本发明的一种实施方式进行定位框轮廓检测的示意性流程图。如图2所示，依据本发明的一种实施方式，定位框轮廓检测包括以下的步骤。

首先在步骤201进行辅助前景色块区域的绘制(根据上下文，色块区域也称色块)。图3示出了绘有辅助检测色块的二值图的示意图。如图3所示，根据本发明的一种实施方式，在二值化图像中，背景表现为黑色(背景的颜色)，文字或部分干扰信息表现为白色(即前景的颜色)，在二值图中心区域绘制特定大小的辅助背景色块，并在此区域上绘制尺寸略小的辅助前景色块(见图3)。略小是指辅助背景色块的面积与辅助前景色块的面积之差在预定的阈值范围内，并且辅助前景色块被辅助背景色块包围。通过两步进行绘制是为了保证人为绘制的辅助前景色块可以和原有图像的前景区域完全分隔开，保证辅助前景色块的连通域不受原有图案影响。其中，绘制区域的大小以超过定位框中单个有意义对象(即文字或图像)，且不超过定位框大小为宜。默认定位框是覆盖图像的大部分面积的，具体尺寸的选择根据经验设定。在例如既有图像又有文字的情况，可以选择最大的。

在步骤202检测二值图的连通域，并建立连通域之间的层次关系。利用图像处理通用方法得到图像的所有连通域，同时得到所有连通域的层次关系。因为在绘制的辅助前景色块的周围，有一圈纯背景色，从而使该色块不会与原图的前景图案相交，能够准确得到该色块的连通域。检测连通域和建立连通域之间的层次关系，可以采用本领域技术人员所知的各种方法(例如，参考论文：Suzuki,S.and Abe,K.,TopologicalStructural Analysisof Digitized Binary Images by Border Following.CVGIP 301,pp32-46(1985)，参考算法实现：OpenCV的findContours函数，并将该函数参数中轮廓的检索模式设为CV_RETR_TREE)，在此不予赘述。

在步骤203，根据绘制的辅助前景色块的准确坐标，从步骤202得到的一系列连通域中找到辅助前景色块的连通域。

接着，在步骤204，确定定位框的连通域。在该步骤204，利用在步骤202中连通域的层次关系，通过辅助前景色块的连通域向外找到定位框的连通区域。根据一种实施方式，可以使用上面说的OpenCV开源库的接口，这种层次关系接口会返回结果。如图4所示，标号1所指示的区域的外层轮廓由标号2指示，标号2指示的外层轮廓由标号3指示。轮廓3即是我们要找的定位框的轮廓构成的连通区域。定位框的连通区域表示为n个点的有序集合C。该n个点按序连接成n边形，即为定位框的n边形拟合。

然后在步骤205，进行定位框的顶点检测。步骤204得到的点集数目n通常大于顶点数目m，需要从n中选出m个正确的顶点。假设定位框包括4个顶点，这是实际应用中最常见的形式，但是算法不限于4个顶点，可以扩展，即根据实际情况进行扩展。

图5示出了依据本发明一种实施方式的顶点检测方法。如图5所示，依据本发明的一种实施方式，如下进行顶点检测。

首先在步骤301，进行非顶点滤除。根据一种实施方式，将定位框的连通域(即点集C)进行多边形拟合得到点集C’(包含点的个数n’,n’<＝n)。在图6中示出了依据本发明的一种实施方式的进行多边形拟合的示意图。如图6所示，根据一种实施方式，首先，设定合适的拟合参数epsilon，然后根据该参数筛选掉C中的点，即去掉定位框连通域中的微小噪声。epsilon为拟合后多边形边上的点距离拟合前的多边形的边的最大距离。图6中，灰色的点为被过滤掉的点。进行拟合可以采用各种方法，在此不予赘述。可以采用其他方法滤除掉不是顶点的点。

然后在步骤302进行候选顶点的获取：在拟合后的连通域点集C’中，根据每对相邻两点的夹角，判断该点属于哪条边。将同一条边的点集合并，获取每条边上的最长线段，得到线段的端点。

接着，在步骤303，进行顶点的微调：以相邻两个端点为首末点，在C中选择首末点内的所有点，将其拟合为一条直线。这个步骤与上面的步骤301的拟合不一样，这里是线性回归，步骤301是去噪。两者均可采用本领域所熟知的实现方法。在相邻两条线的交点p_cross的epsilon距离内，将距离交点p_cross最近的C中的点作为准确的顶点。

回到图1，在步骤104之后的步骤105，进行定位框的扭曲调整。

图7示出了依据本发明的一种实施方式的定位框扭曲调整的示意性流程图。

首先在步骤401，进行图像的扭曲程度检测。

图8示出了依据本发明的一种实施方式的扭曲程度检测的示意图。如图8所示，以定位框相邻两个顶点(在图8中选择了在下部的两个顶点)为首末点，即a点和b点，在C中选择a、b两点内的所有点，即c-f点。将所有点围成的面积除以a和b两个点之间的欧氏距离作为扭曲程度的评价指标。

curve＝S(C[p_a:p_b])/|p_ap_b|

其中，|p_ap_b|表示ab两点的距离，S(C[p_a:p_b])表示图中a-b点之间所有点围成的多边形区域的面积。

然后在步骤402到步骤406进行定位框的校正及微调。

以定位框为4个点的矩形为例讲解定位框的校正和微调。

首先，在步骤402进行图像子图划分，根据扭曲程度将图像横向划分成R个子图,记为rect_sub-image。

当扭曲程度小于某经验值时，子图数目R设为1，即认为没有扭曲，只需要处理透视形变。

当扭曲程度大于该经验值时，将纵向两条边的夹角等分为R份(R正比于扭曲程度，可简化为一个固定值，在我们的示例中，R值选为6)，每个等分角的两边与连通域C共4个交点，这四个交点围成的矩形构成了一个子图rect_sub-image。

图9示出了所获得的R个子图，即图像子图。在图9所示的示例中，获得了6个图像子图。

回到图7，在步骤403对标准定位框进行对应的子图划分，获得R个子图，即标准子图。标准定位框可以预先存储在数据库中，可以根据标准定位框的位置定位定位框中的信息。如将标准的答题框位置沿横向等分R份，每一份为一个子图对应的标准答题框，记为rect_sub-stand。

然后，在步骤404，根据标准子图和图像子图，获得单应矩阵，并根据单应矩阵进行各图像子图的调整，可以将手机拍照的定位框内部的图像变为标准大小。

在该步骤404，对每个子图rect_sub-image和rect_sub-stand，存在4对对应点，易于求出单应矩阵M。利用M，将rect_sub-image转换为校正后的rect’_sub-image

rect’_sub-image＝M*rect_sub-stand

最后，在步骤405，进行图像子图微调。两个相邻的子图的相邻像素是根据不同的单应矩阵M计算得到的新的像素值。如果直接将rect’_sub-image拼接在一起，有可能会产生断层现象。图10的方框示出了断层现象的示意图，图中还有其他的断层现象，尤其对于处于不同子图的横线处较为明显。因此，根据一种实施方式，需要进行子图微调。可以根据相邻的变换后的图像子图的高度进行该中微调。

根据一种实施方式的微调算法如下。

设子图rectⁱ _sub-stand的右侧边线点集line_i经过矩阵M_i变换得到line’,经过矩阵M_i+1变换得到line”。

line’＝M_i*line_i

line”＝M_i+1*line_i

这里，我们只考虑纵坐标y。把line’和line”纵向等分k份，每等份称为line的block。

选取line’第i个block，这个block的高度为

height’_i＝line’[(i+1)*block_span]-line’[i*block_span]

选取line”第i个block，这个block的高度为

height”_i＝line”[(i+1)*block_span]-line”[i*block_span]，其中blockspan为校正之前，每个小网格侧边被分成k份后的长度。

根据图像的对应关系，易知rect’_i中line’[i*block_span]至line’[(i+1)*block_span]这一block和rect’_i+1的line”[i*block_span]至line”[(i+1)*block_span]这一block图像内容对应。

可以参照左侧block的高度对右侧block图像缩放大小，也可以参考右侧block的高度对左侧block图像缩放大小。并从左向右，或从右向左依次完成对所有子图的微调。

最后，在步骤406，将每个子图的block纵向叠放在一起，并将微调后的子图横向叠放在一起。得到最终结果。

图11示出了依据本发明的一种实施方式的图像定位框检测装置的示意性方框图。

首先，图像获取单元501获取带有定位框的页面的图像。如前所述，所述图像包括完整的定位框且定位框内图像面积占整幅图像的大部分。定位框指待处理信息的外围封闭框，可以表现为直线、一定曲率的曲线、花纹、图案等。定位框外为非信息区域，定位框内为有价值的信息区域，例如试题以及答案。可以以各种方式获得习题页图像。例如可以通过摄像机或手机上的摄像头获得，也可以是从远端通过有线或无线网络获得，或通过键盘、鼠标、屏幕、USB接口等外围设备，有用户输入而获得。

然后图像预处理单元502进行图像预处理。可以进行将图像转为灰度图、去掉图像中的噪声点等各种处理。

然后图像二值化单元503进行图像二值化。如上所述，根据一种实施方式，可以对预处理后的图像采用阈值法或者边缘检测法进行二值化，并进行闭运算，并尽可能的保证二值化图像中定位框纹理的完整。

接着定位框轮廓检测单元504进行定位框轮廓检测。根据一种实施方式，采用从内向外轮廓查找法，确定定位框轮廓。

图12示出了根据本发明的一种实施方式的定位框轮廓检测单元504的示意性方框图。如图12所示，依据本发明的一种实施方式，定位框轮廓检测单元504包括前景区域绘制单元601、二值图连通域检测单元602、前景区域连通域确定单元603、定位框连通域确定单元604、以及定位框顶点检测单元605。

首先前景区域绘制单元601进行纯白色色块(前景区域)绘制。绘制的过程可以参见图3和上文的描述。例如根据一种实施方式，首先绘制辅助背景色块区域，然后绘制比背景色块区域略小的前景色块区域。略小是指这两种色块区域的面积之差小于预定值并且辅助前景色块完全被辅助背景色块包围。

二值图连通域检测单元602检测二值图的连通域，并建立连通域之间的层次关系。具体的方法可以参见上文对方法的描述。

在本文中，对方法的描述可以用来理解对装置的说明，对装置的说明也可以用来理解前文的方法。

前景区域连通域确定单元603根据绘制的辅助前景色块的准确坐标找到辅助前景色块的连通域。

定位框连通域确定单元604确定定位框的连通域。根据一种实施方式，利用连通域的层次关系，通过辅助前景色块的连通域向外找到定位框的连通区域。

定位框顶点检测单元605进行定位框的顶点检测。

图13示出了依据本发明一种实施方式的定位框的顶点检测单元的方框图。如图13所示，依据本发明的一种实施方式，定位框的顶点检测单元包括非顶点滤除单元701、候选顶点获取单元702以及顶点微调单元703。

非顶点滤除单元701进行非顶点滤除。根据一种实施方式，如前所述，可以采用拟合参数epsilon进行非顶点的滤除。

候选顶点获取单元702进行候选顶点的获取：在拟合后的连通域点集C’中，根据每对相邻两点的夹角，判断该点属于哪条边。将同一条边的点集合并，获取每条边上的最长线段，得到线段的端点，作为候选顶点。

顶点微调单元703进行顶点的微调：以相邻两个端点为首末点，在C中选择首末点内的所有点，将其拟合为一条直线。在相邻两条线的交点p_cross的epsilon距离内，将距离交点p_cross最近的C中的点作为准确的顶点。

图14示出了依据本发明的一种实施方式的定位框扭曲调整单元505的示意性方框图。如图14所示，依据本发明的一种实施方式的定位框扭曲调整单元505包括扭曲程度检测单元801、图像子图获得单元802、标准子图获得单元803、图像子图分别调整单元804、图像子图微调单元805、子图叠合单元806。

首先扭曲程度检测单元801进行图像的扭曲程度检测。进行图像的扭曲程度检测可以参见前文以及结合图8的描述。

图像子图获得单元802进行图像子图划分，根据扭曲程度将图像纵向划分成R个子图。当扭曲程度小于某经验值时，子图数目R设为1，即认为没有扭曲，只需要处理透视形变。当扭曲程度大于该经验值时，将纵向两条边的夹角等分为R份，从而获得R个子图rect_sub-image。

标准子图获得单元803对标准定位框进行对应的子图划分，获得R个子图，即标准子图。

然后，图像子图分别调整单元804根据标准子图和图像子图，获得单应矩阵，并根据单应矩阵进行各图像子图的调整，从而可将手机拍照的定位框内部的图像变为标准大小。

图像子图微调单元805进行图像子图微调。可以根据相邻的变换后的图像子图的高度进行该中微调。可以根据各图像子图的纵坐标，将该子图分为k个块(block)，然后参照左侧block的高度对右侧block图像缩放大小，也可以参考右侧block的高度对左侧block图像缩放大小。并从左向右，或从右向左依次完成对所有子图的微调。

最后，子图叠放单元806将所有的block纵向叠放在一起，并将微调后的子图横向叠放在一起。得到最终结果。

本发明的定位检测装置和方法例如可以用于一种远程阅卷系统，该阅卷系统例如包括通过互联网、移动通信网络等连接的服务器和移动终端，该系统的服务器能够通过移动终端获得试题页图像，所述试题页包括定位框以及所述定位框内的信息区和试题区；然后进行定位框识别，识别所述试题页图像中的定位框的位置；并根据所述定位框的位置，确定所述试题页图像中信息区的位置，并提取试题页信息；然后根据所述试题页信息，确定所述试题页上的答题区，并从所述答题区提取答案的图像。

本发明的方法和装置可以由计算机实现，所述计算机包括鼠标、键盘、麦克风、触摸屏等输入装置，打印机、显示屏、受话器等输入装置，CPU等处理器、存储有软件(计算机程序)的存储装置(如硬盘、内存、磁盘、光盘、DVD等)。在由处理器运行存储装置上的软件时，实现本发明的方法或作为本发明的装置或单元。另一方面，本发明的各单元也可以由现场可编程门阵列、芯片等硬件来完全实现。本发明也涉及一种存储介质，其上存储有计算机程序，当该程序被处理器执行时，使得该处理器能够实现上文所述的各种方法或步骤，或者使处理器用作上文的各装置或单元。

对实施方式的描述仅仅是为了本领域技术人员可以实现本发明，不是对本发明的限制。在背景技术中描述的技术也不一定是本领域已经公开的现有技术，本发明的保护范围由本发明的权利要求限定。

Claims

1.一种定位框检测方法，包括如下的步骤：

图像获取步骤，获取带有定位框的页面的图像；

二值化步骤，将所述图像二值化，获得二值化图像；

辅助前景色块绘制步骤，在所述二值化图像的中心区域绘制辅助前景色块；

二值图连通域检测步骤，检测所述二值化图像的连通域，建立连通域之间的层次关系；

辅助前景色块的连通域确定步骤，根据所绘制的辅助前景色块区域的坐标，确定所述辅助前景色块区域的连通域；

定位框连通域确定步骤，利用连通域的层次关系，通过所述辅助前景色块区域的连通域向外找到定位框的连通区域；

定位框顶点检测步骤，根据所述定位框的连通区域，进行定位框的顶点检测。

2.根据权利要求1所述的方法，其特征在于，所述辅助前景色块绘制步骤包括：

在所述二值化图像的中心区域绘制特定大小的辅助背景色块区域；

在所述辅助背景色块区域上绘制比所述辅助背景色块区域略小并被所述辅助背景色块区域包围的辅助前景色块区域，

其中，所述辅助前景色块区域的大小超过定位框中单个有意义对象的大小。

3.根据权利要求1所述的方法，所述定位框顶点检测步骤包括：

对所述定位框的连通域的集合C进行多边形拟合得到点集C’；

进行顶点的获取：在所述点集C’中，根据每对相邻两点的夹角，判断该点属于哪条边，将同一条边的点集合并，获取每条边上的最长线段，得到线段的端点；

进行顶点的微调：以相邻两个端点为首末点，在C中选择首末点内的所有点，将其拟合为一条直线，在相邻两条线的交点的预定距离内，将距离交点最近的C中的点作为准确的顶点。

4.根据权利要求1所述的方法，其特征在于，所述方法还包括定位框扭曲调整步骤，所述定位框扭曲调整步骤包括：

扭曲程度检测步骤，检测图像的扭曲程度；

图像子图获取步骤，根据扭曲程度将图像横向划分成n个子图，即n个图像子图；

标准子图获得步骤，将标准定位框进行子图划分，获得与所述n个图像子图对应的标准子图；

图像子图调整步骤，根据标准子图和图像子图，获得单应矩阵，并根据单应矩阵进行各图像子图的调整；

横向叠放步骤，将进行过调整的各图像子图横向叠放。

5.根据权利要求4所述的方法，其特征在于，所述定位框扭曲调整步骤还包括图像子图微调步骤，根据相邻图像子图根据相邻的单应矩阵变换得到的不同高度之间的对应关系，对每个子图纵向切分多块并微调各块的高度。

6.一种定位框检测装置，包括：

图像获取单元，获取带有定位框的页面的图像；

二值化单元，将所述图像二值化，获得二值化图像；

辅助前景色块绘制单元，在所述二值化图像的中心区域绘制辅助前景色块；

二值图连通域检测单元，检测所述二值化图像的连通域，建立连通域之间的层次关系；

辅助前景色块连通域确定单元，根据所绘制的辅助前景色块区域的坐标，确定所述辅助前景色块区域的连通域；

定位框连通域确定单元，利用连通域的层次关系，通过所述辅助前景色块区域的连通域向外找到定位框的连通区域；

定位框顶点检测单元，根据所述定位框的连通区域，进行定位框的顶点检测。

7.根据权利要求6所述的装置，其特征在于，所述辅助前景色块绘制单元包括：

辅助背景色块区域绘制单元，在所述二值化图像的中心区域绘制特定大小的辅助背景色块区域；

辅助前景色块区域绘制单元，在所述辅助背景色块区域上绘制比所述辅助背景色块区域略小并被所述辅助背景色块区域包围的辅助前景色块区域，

8.根据权利要求6所述的装置，所述定位框顶点检测单元包括：

拟合单元，对所述定位框的连通域进行多边形拟合得到点集C’；

顶点获取单元，在所述点集C’中，根据每对相邻两点的夹角，判断该点属于哪条边，将同一条边的点集合并，获取每条边上的最长线段，得到线段的端点的集合C；

顶点微调单元，以相邻两个端点为首末点，在C中选择首末点内的所有点，将其拟合为一条直线，在相邻两条线的交点的预定距离内，将距离交点最近的C中的点作为准确的顶点。

9.根据权利要求6所述的装置，其特征在于，所述装置还包括定位框扭曲调整单元，所述定位框扭曲调整单元包括：

扭曲程度检测单元，检测图像的扭曲程度；

图像子图获取单元，根据扭曲程度将图像横向划分成n个子图，即n个图像子图；

标准子图获得单元，将标准定位框进行子图划分，获得与所述n个图像子图对应的标准子图；

图像子图调整单元，根据标准子图和图像子图，获得单应矩阵，并根据单应矩阵进行各图像子图的调整；

横向叠放单元，将进行过调整的各图像子图横向叠放，

所述装置还包括图像子图微调单元，所述图像子图微调单元根据相邻图像子图根据相邻的单应矩阵变换得到的不同高度之间的对应关系，对每个子图纵向切分多块并微调各块的高度。

10.一种程序存储介质，所存储的程序在被处理器执行时，能够实现权利要求1-5任一项所述的方法。