CN109034165A

CN109034165A - 一种证件图像的裁切方法、装置、系统及存储介质

Info

Publication number: CN109034165A
Application number: CN201810739364.XA
Authority: CN
Inventors: 易爱春; 杨超
Original assignee: Beijing Zhong An Future Technology Co Ltd
Current assignee: Beijing Zhong An Future Technology Co Ltd
Priority date: 2018-07-06
Filing date: 2018-07-06
Publication date: 2018-12-18
Anticipated expiration: 2038-07-06
Also published as: CN109034165B

Abstract

本发明提供了一种证件图像的裁切方法、装置、系统及存储介质。所述方法包括：获取待裁切的原始证件图像；对原始证件图像进行预处理，得到灰度图像和二值图像；对灰度图像进行边缘线段检测，得到所述灰度图像的边缘线段信息；对所述二值图像进行版面分析，得到二值图像中的文本行的位置信息，并得到对应的证件的位置信息和尺寸信息，并确定对应的证件类型；根据所述证件类型得到对应的检测区域并进行裁切；计算证件的字符朝向并对所述裁切后的证件图像进行旋转；计算所述裁切后的证件图像的倾斜角度，并调整所述裁切后的证件图像，得到裁切后的端正的证件图像。

Description

一种证件图像的裁切方法、装置、系统及存储介质

技术领域

本发明涉及图像处理领域，尤其涉及证件图像的处理领域，具体的讲是一种证件图像的裁切方法、装置、系统及存储介质。

背景技术

如今越来越多的行业，如通信行业、酒店、网吧等，都需要对身份证件信息进行采集和登记，以进行实名制。传统的证件识别分类器不仅费时费力，效率低下，且对于大多数的行业的证件采集过程中，在对第二代居民身份证进行采集的基础上，还需要对护照、驾驶证、行驶证等有效证件上的信息进行采集，所以单纯的二代身份证读卡器，已经远远不能满足证件采集的需求，在如今在互联网大数据背景下，利用现代信息技术开展高效快捷便民服务工作，已是大势所趋，也正是在这种大背景下，各类证件识别软件应运而生。

如今的证件识别系统，大多数不经过证件图像的裁切和调整，直接识别图像中的字符信息。但是，这种识别方法，由于没有证件的位置，方向或不进行倾斜角度校正，后续分类模块很难对证件类型进行准确的分类，后续识别模块也很容易识别错误。

应该注意，上面对技术背景的介绍只是为了方便对本发明的技术方案进行清楚、完整的说明，并方便本领域技术人员的理解而阐述的。不能仅仅因为这些方案在本发明的背景技术部分进行了阐述而认为上述技术方案为本领域技术人员所公知。

发明内容

本发明实施例提出一种证件图像的裁切方法、装置、系统及存储介质，以解决现有的证件识别过程不经过证件采集图像的位置、方向和倾斜角度的校正，容易造成后续分类不准确及识别错误的问题。

为了达到上述目的，本发明实施例提供一种证件图像的裁切方法，包括：获取待裁切的原始证件图像；对所述原始证件图像进行预处理，得到所述原始证件图像的灰度图像，以及对所述灰度图像进行二值化后生成的二值图像；对所述灰度图像进行边缘线段检测，得到所述灰度图像的边缘线段信息，所述边缘线段信息包括边缘水平线段和边缘垂直线段；对所述二值图像进行版面分析，得到所述二值图像中的文本行的位置信息，并根据所述文本行的位置信息得到对应的证件的位置信息和尺寸信息，并确定对应的证件类型；根据所述证件类型，利用所述边缘线段信息、文本行的位置信息、证件的位置信息和尺寸信息，得到检测区域并在所述灰度图像中根据所述检测区域进行裁切，得到裁切后的证件图像；根据所述证件的位置信息，对所述裁切后的证件图像中的字符朝向进行判定，并根据所述字符朝向对所述裁切后的证件图像进行旋转；对所述旋转后的裁切后的证件图像进行版面分析，计算所有文本行的倾斜角度的平均值作为所述裁切后的证件图像的倾斜角度，并根据所述倾斜角度调整所述裁切后的证件图像，得到裁切后的端正的证件图像。

为了达到上述目的，本发明实施例还提供一种证件图像的裁切装置，包括：获取模块，用于获取待裁切的原始证件图像；预处理模块，用于对所述原始证件图像进行预处理，得到所述原始证件图像的灰度图像，以及对所述灰度图像进行二值化后生成的二值图像；线段检测模块，用于对所述灰度图像进行边缘线段检测，得到所述灰度图像的边缘线段信息，所述边缘线段信息包括边缘水平线段和边缘垂直线段；版面分析模块，用于对所述二值图像进行版面分析，得到所述二值图像中的文本行的位置信息，并根据所述文本行的位置信息得到对应的证件的位置信息和尺寸信息，并确定对应的证件类型；检测区域生成模块，用于根据所述证件类型，利用所述边缘线段信息、文本行的位置信息、证件的位置信息和尺寸信息，得到检测区域并在所述灰度图像中根据所述检测区域进行裁切，得到裁切后的证件图像；方向判断模块，用于根据所述证件的位置信息，对所述裁切后的证件图像中的字符朝向进行判定，并根据所述字符朝向对所述裁切后的证件图像进行旋转；倾斜角度计算模块，用于对所述旋转后的裁切后的证件图像进行版面分析，计算所有文本行的倾斜角度的平均值作为所述裁切后的证件图像的倾斜角度，并根据所述倾斜角度调整所述裁切后的证件图像，得到裁切后的端正的证件图像。

为了达到上述目的，本发明实施例还提供一种证件图像的裁切系统，所述系统包括：存储器和处理器，所述存储器中存储计算机程序，所述计算机程序被所述处理器执行时，实现如上所述的方法步骤。

为了达到上述目的，本发明实施例还提供一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时，实现如上所述的方法步骤。

本发明实施例所揭示的证件图像的裁切方法、装置、系统及存储介质，对线段和文本版面信息进行了综合考虑，可以更有效的排除干扰区域，根据返回的位置、方向、倾斜角度等信息，可以准确的得到端正的证件图像，为后续分类和识别模块奠定了坚实基础；并且，本发明具有通用性，快速性，可以在预先不知道证件类型的情况下，快速、准确的裁切出不同类型，不同尺寸的证件图像。

参照后文的说明和附图，详细公开了本发明的特定实施方式，指明了本发明的原理可以被采用的方式。应该理解，本发明的实施方式在范围上并不因而受到限制。在所附权利要求的精神和条款的范围内，本发明的实施方式包括许多改变、修改和等同。

针对一种实施方式描述和/或示出的特征可以以相同或类似的方式在一个或更多个其它实施方式中使用，与其它实施方式中的特征相组合，或替代其它实施方式中的特征。

应该强调，术语“包括/包含”在本文使用时指特征、整件、步骤或组件的存在，但并不排除一个或更多个其它特征、整件、步骤或组件的存在或附加。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例的证件图像的裁切方法的处理流程图；

图2为本发明实施例的步骤S102的方法流程图；

图3为本发明实施例的步骤S103的方法流程图；

图4为本发明实施例的步骤S104的方法流程图；

图5为本发明实施例的步骤S105的一种实施方式的方法流程图；

图6为本发明实施例的步骤S105的另一种实施方式的方法流程图；

图7为本发明实施例的步骤S106的方法流程图；

图8为本发明实施例的步骤S107的方法流程图；

图9为本发明实施例的证件图像的裁切装置的结构示意图；

图10为本发明实施例的证件图像的裁切系统的结构示意图；

图11为本发明一具体实施例中的缩放后的灰度图像；

图12为本发明一具体实施例中的缩放后的二值图像；

图13为本发明一具体实施例中的边缘线段检测后的，线段表示检测到的边线；

图14为本发明一具体实施例中的版面分析后的图像；

图15为本发明一具体实施例中的根据选线区域裁切下来的证件图像；

图16为本发明一具体实施例中的对裁切图像进行版面分析的图像；

图17为本发明一具体实施例中的端正后的证件图像。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本领域技术技术人员知道，本发明的实施方式可以实现为一种系统、装置、设备、方法或计算机程序产品。因此，本公开可以具体实现为以下形式，即：完全的硬件、完全的软件(包括固件、驻留软件、微代码等)，或者硬件和软件结合的形式。

下面参考本发明的若干代表性实施方式，详细阐释本发明的原理和精神。

需要首先说明的是，为了说明清楚，本发明实施例中

本发明主要提出一种设备端证件图像的裁切方法、装置、系统和存储介质，针对目前的证件读取类设备，对拍摄的证件图像进行证件检测，如果检测到证件，则返回证件的位置坐标，方向和倾斜角度等信息，通过以上信息可以去除图像背景干扰，变换得到端正的证件图像；如果未检测到证件则返回无证件。通过检测结果，可准确地把证件从图像中裁切出来，为后续的分类和识别奠定基础。

图1为本发明实施例的证件图像的裁切方法的处理流程图。如图1所示，本实施例的证件图像的裁切方法包括：

步骤S101，获取待裁切的原始证件图像；

步骤S102，对所述原始证件图像进行预处理，得到所述原始证件图像的灰度图像，以及对所述灰度图像进行二值化后生成的二值图像；

步骤S103，对所述灰度图像进行边缘线段检测，得到所述灰度图像的边缘线段信息，所述边缘线段信息包括边缘水平线段和边缘垂直线段；

步骤S104，对所述二值图像进行版面分析，得到所述二值图像中的文本行的位置信息，并根据所述文本行的位置信息得到对应的证件的位置信息和尺寸信息，并确定对应的证件类型；

步骤S105，根据所述证件类型，利用所述边缘线段信息、文本行的位置信息、证件的位置信息和尺寸信息，得到检测区域并在所述灰度图像中根据所述检测区域进行裁切，得到裁切后的证件图像；

步骤S106，根据所述证件的位置信息，对所述裁切后的证件图像中的字符朝向进行判定，并根据所述字符朝向对所述裁切后的证件图像进行旋转；

步骤S107，对所述旋转后的裁切后的证件图像进行版面分析，计算所有文本行的倾斜角度的平均值作为所述裁切后的证件图像的倾斜角度，并根据所述倾斜角度调整所述裁切后的证件图像，得到裁切后的端正的证件图像。

在本申请实施例的步骤S101中，原始证件图像可以为通过外接设备导入的图片、通过感兴趣区域拍摄的照片或者在所述感兴趣区域内拍摄的视频流中截取的单帧图像。所述外接设备可以是摄像头、扫描仪、数码相机和手机相机等能够获取图片的设备。

在本申请实施例的步骤S102中，对原始证件图像进行预处理。预处理是指为了准确地裁切出证件，对原始图像进行灰度化、二值化、缩放等图像处理操作，预处理为后续的线段检测和版面分析奠定了基础。其具体的处理步骤如图2所示，包括：

步骤S1021，读入待裁切的原始证件图像，进行灰度化处理，生成灰度图像；

步骤S1022，对灰度图像进行缩放；

步骤S1023，对缩放后的灰度图像进行二值化处理，生成二值图像。

在本申请实施例的步骤S103中，可以利用LSD(Line SegmentDetector，线段检测器)检线算法或者ED(Edge Drawing，边缘绘制)检线算法，对灰度图像进行边缘线段检测，得到水平方向和竖直方向的所有线段。具体的，一种实施方式中，实现步骤S103的方法流程如图3所示：

步骤S1031，读入待检线的灰度图像；

步骤S1032，调用LSD检线算法或ED检线算法对增强后的图像进行检线，并返回所有边缘线段信息；

步骤S1033，对返回的线段进行合并，并分类为水平线段或竖直线段。

在步骤1032中，LSD检线算法和ED检线算法都是本领域技术人员所熟知的检线算法，因此本申请中不再详述。另外，LSD检线算法检到的线段的质量略优于ED检线算法，但是ED检线算法的速度要比LSD检线算法快，具体利用哪种边缘线段检测算法可由技术人员可以实际需要进行选择使用。

在本申请实施例的步骤S104中，版面分析是对版面内的图像、文本、表格信息和位置关系所进行的自动分析、识别和理解的过程。版面分析模块是指针对二值图像进行版面分析，可以获取文本行的位置信息。并且，可以根据文本行的位置信息判断证件是水平还是竖直放置，大、小尺寸类型，并可以判断是否是机读码类证件。

具体的，一种实施方式中，实现步骤S104的方法流程如图4所示：

步骤S1041，读入二值图像，进行版面分析，得到二值图像中的文本行的位置信息。其中，文本行是指一行文字，文本行的位置信息包含本行所有文字的区域坐标(区域是一个矩形框，有上下左右四边界，记录的是在图像上的像素位置)和整行文字的区域坐标。例如，18位身份证号可以认为是一个文本行，其包括18个字符，文本行的位置信息不但包括整个文本行的区域坐标，也包括每个字符的区域坐标。

步骤S1042，根据文本行的区域坐标判断证件的位置信息为水平放置还是竖直放置。一种实施方式中，如果文本行的区域的宽度要大于高度，且证件里这种文本行多的话，那么可以认为此证是水平放置的，否则为竖直放置。举例说明，比如对于水平放置的身份证来讲，18位身份证号可以认为是一个文本行，从它的位置信息可以分析出，该文本行由水平的18个字符组成，整个文本行的区域的宽度要大于高度，如果证件里这种文本行多的话，那么可以认为此证是水平放置的，否则为竖直放置。另外，当证件水平放置时，字符就是朝上或下；当证件竖直放置时，字符就是朝左或右，比如正常书写的字符是朝上的。

步骤S1043，根据所有文本行的位置信息，计算外包区域，判断所述证件的尺寸大小。其中，外包区域是指这个区域正好放进去所有的文本行的最小区域。例如，大尺寸证件包括护照类证件等，小尺寸证件包括身份证、驾驶证等证件。

步骤S1044，根据所述文本行的位置信息，判断所述证件是否是机读码类证件。其中，机读码类证件为护照类证件，其余为非机读码类证件。机读码(MRZ)是例如护照的下方两行*44个字符的文本行，如果上述得到的文本行集合中，出现这种文本行，可认为是机读码类证件，机读码的特征是很强的，因此识别的正确率很高。

需要说明的是，步骤S1042、步骤S1043和步骤S1044可以并列执行，并无前后执行的关系。

在本申请实施例的步骤S105中，通过步骤S103和步骤S104得到的信息，进行综合设计区域评分模型，计算出最优区域作为检测区域。

该步骤中包括两个方案：

方案一：针对护照类证件选择区域；如果从步骤S104中判断出大尺寸类且为机读码类证件，那么可以大致确定为护照类证件，这时执行本方案。方案一包括如图5所示的方法步骤：

步骤S1051，根据步骤S104检测出的机读码位置和长度，按比例映射出证件的大致区域。本步骤中，机读码位置和长度等信息都包括在步骤S104得到的文本行的位置信息中。并且，机读码的特征是很强的，比如2*44是认为是护照的，护照又有固定的印刷规范，所以可以由机读码的位置去估计整个证件的大体位置。

步骤S1052，在大致区域的对应四边的小范围内，分别寻找长度最长的线段，四边围成的区域就是检测到的区域，为后续作透射变换记录四个坐标点，可以计算出倾斜角度，此时省去了步骤S107；该步骤中，四个坐标点是指上下左右四个边线围成区域的角点。透射变换是一种现有的算法，用于将不规则的四边形图像，变换成规则的矩形。

步骤S1053，如果四边中某边找不到满足长度要求的线段，取大致区域的此边边界作为检测到的区域，此时不可省去步骤S107。例如，一种实施方式中，大致区域的区域高度是H，这时左或右的边线，长度要求是H*0.4，指的是在图像中的长度，长度为1表示1个像素点。

步骤S1054，根据机读码的位置，已经可以判断出来方向，作为机读码类证件的方向。本实施例中，机读码的位置所包含的信息就是文本行的信息。由于设备中只有两种放置护照的方式，要么字符朝上，要么字符朝下，如果机读码在图像的下方(护照中机读码是在下方)，则说明方向是朝上的，或者说字符朝上的，反之，方向为朝下。

方案二：针对非护照类证件选择区域，也可以称为通用方案；除了护照类证件都是执行此方案。方案二包括如图6的方法步骤：

步骤S1051＇，配对水平线段和竖直线段，具体实现方式是，如果水平线段L1和L2之间的距离大于最小证件距离(这里默认的是最小可识别证件高度和宽度的较小值)，则进行配对；竖直同理；分别得到水平和竖直线段的配对集合；

步骤S1052＇，对所有水平和竖直线段配对集合，组合成区域集合，再对不满足证件尺寸的区域进行过滤，得到初始区域集合Rsrc。因为设备的相机到被拍的证件光路距离是一定的，所以同样的证件的尺寸在图像中也是相差无几的，证件的大小又是基本一致的，比如与护照大小，二代身份证大小相同的最多。因此，该步骤可以过滤掉明显不满足常规证件尺寸的区域集合。

步骤S1053＇，对初始区域集合Rsrc，分别计算其评分，取评分最高的区域最为检测区域并对所述检测区域进行裁切。其中，评分的公式为：Score＝50*(区域四条线段的区域内部截取长度之和-区域四条线段的区域外部截取长度之和)/区域周长+50*(区域内字符连通域的个数/连通域总数)。

在本申请实施例的步骤S106中，进行方向判断。方向判断是指，在设备的使用过程中，证件的放置方向是随机的，字符的朝向可能是上、下、左、右四个方向都存在的，本步骤需要判断出证件的字符朝向，再通过字符朝向将证件图像都旋转为字符朝上放置。

本步骤包括如图7所示的方法步骤：

步骤S1061，待输入图像为根据步骤S105得到的检测区域，从原始证件图像裁切下来的图像；根据步骤S104可以判断出水平放置或竖直放置，如果是竖直放置，先对图像进行90度顺时针旋转，得到水平图像W；

步骤S1062，对水平图像W进行180度旋转得到图像M；

步骤S1063，对水平图像W进行连通域分析，得到各字符区域；

步骤S1064，分别对各字符区域内对应的水平图像W和翻转图像M进行识别，统计、比较满足置信度要求的字符个数，如果水平图像W中满足置信度要求的个数大于翻转图像M，则字符为朝上，否则为朝下；

步骤S1065，如果步骤S1061中是竖直图像，步骤S1064中判断是字符朝上，则证件中的文字方向为朝左，即证件放置的方向为朝左放置；如果步骤S1064中判断是字符朝下，则证件中的文字方向为朝右，即证件放置的方向为朝右放置。

在本申请实施例的步骤S107中，计算倾斜角度。在步骤S105中，如果四边都找到线段，则后续可以利用透射变换算法进行校正，可省去此步骤；计算倾斜角度主要针对在步骤S105中，无法找齐四边的图像，判断文字行的倾斜角度的情况。

具体的，步骤S107的主要实现的方法流程如图8所示：

步骤S1071，待输入图像为根据步骤S105得到的检测区域，从原始证件图像上裁切下来的图像，并根据步骤S106的方向旋转成字符朝上的图像；

步骤S1072，对输入图像进行版面分析，得到文本行信息；

步骤S1073，对具有多个字符(例如大于5个字符)的文本行，利用文本行第一个和最后一个字符的中心点位置，计算倾斜角度，并求解所有文本行倾斜角度的平均值，作为图像的倾斜角度。

最后，根据所述倾斜角度调整所述裁切后的证件图像，得到裁切后的端正的证件图像。

通过以上实施例的描述，可以得到，本申请所公开的证件图像的裁切方法，对线段和文本版面信息进行了综合考虑，可以更有效的排除干扰区域，根据返回的位置、方向、倾斜角度等信息，可以准确的得到端正的证件图像，为后续分类和识别模块奠定了坚实基础；并且，本发明具有通用性，快速性，可以在预先不知道证件类型的情况下，快速、准确的裁切出不同类型，不同尺寸的证件图像。

应当注意，尽管在附图中以特定顺序描述了本发明方法的操作，但是，这并非要求或者暗示必须按照该特定顺序来执行这些操作，或是必须执行全部所示的操作才能实现期望的结果。附加地或备选地，可以省略某些步骤，将多个步骤合并为一个步骤执行，和/或将一个步骤分解为多个步骤执行。

在介绍了本发明示例性实施方式的方法之后，接下来，参考图2对本发明示例性实施方式的证件图像的裁切装置进行介绍。该装置的实施可以参见上述方法的实施，重复之处不再赘述。以下所使用的术语“模块”和“单元”，可以是实现预定功能的软件和/或硬件。尽管以下实施例所描述的模块较佳地以软件来实现，但是硬件，或者软件和硬件的组合的实现也是可能并被构想的。

基于同一发明构思，请参阅图9，本申请还提供一种证件图像的裁切装置，包括：

获取模块101，用于获取待裁切的原始证件图像；

预处理模块102，用于对所述原始证件图像进行预处理，得到所述原始证件图像的灰度图像，以及对所述灰度图像进行二值化后生成的二值图像；

线段检测模块103，用于对所述灰度图像进行边缘线段检测，得到所述灰度图像的边缘线段信息，所述边缘线段信息包括边缘水平线段和边缘垂直线段；

版面分析模块104，用于对所述二值图像进行版面分析，得到所述二值图像中的文本行的位置信息，并根据所述文本行的位置信息得到对应的证件的位置信息和尺寸信息，并确定对应的证件类型；

检测区域生成模块105，用于根据所述证件类型，利用所述边缘线段信息、文本行的位置信息、证件的位置信息和尺寸信息，得到检测区域并在所述灰度图像中根据所述检测区域进行裁切，得到裁切后的证件图像；

方向判断模块106，用于根据所述证件的位置信息，对所述裁切后的证件图像中的字符朝向进行判定，并根据所述字符朝向对所述裁切后的证件图像进行旋转；

倾斜角度计算模块107，用于对所述旋转后的裁切后的证件图像进行版面分析，计算所有文本行的倾斜角度的平均值作为所述裁切后的证件图像的倾斜角度，并根据所述倾斜角度调整所述裁切后的证件图像，得到裁切后的端正的证件图像。

在一种实施方式中，所述线段检测模块103用于对所述灰度图像进行边缘线段检测，得到所述灰度图像的边缘线段信息，所述边缘线段信息包括边缘水平线段和边缘垂直线段，其具体包括：

检线单元，用于利用LSD检线算法或ED检线算法对所述灰度图像进行边缘线段检测，得到所述灰度图像的所有边缘线段；

线段合并单元，用于对所述所有边缘线段进行合并，并分类为所述边缘水平线段和边缘垂直线段。

在一种实施方式中，所述版面分析模块104用于对所述二值图像进行版面分析，得到所述二值图像中的文本行的位置信息，并根据所述文本行的位置信息得到对应的证件的位置信息和尺寸信息，并确定对应的证件类型，其具体包括：

版面分析单元，用于对所述二值图像进行版面分析，得到所述二值图像中的文本行的位置信息，所述文本行的位置信息包括文本行的区域坐标以及文本行中每个字符的区域坐标；

位置信息判断单元，用于根据所述文本行的位置信息判断所述证件的位置信息为水平放置还是竖直放置；

证件尺寸判断单元，用于根据所述文本行的位置信息，计算外包区域，判断所述证件的尺寸大小；

证件类型判断单元，用于根据所述文本行的位置信息，判断所述证件是否是机读码类证件。

在一种实施方式中，如果所述证件类型为机读码类证件，则所述文本行的位置信息包括机读码的位置和长度，则所述检测区域生成模块105包括：

大致区域映射单元，用于根据所述机读码的位置和长度，按比例映射出证件的大致区域；

区域检测单元，用于在所述大致区域对应四边的小范围内，分别寻找长度最长的线段，四边围成的区域就是检测到的区域，如果四边中某边找不到满足长度要求的线段，取所述大致区域的此边边界作为检测到的区域。

在一种实施方式中，如果证件类型为非机读码类证件，则所述检测区域生成模块105包括：

配对集合单元，用于配对所述边缘水平线段和边缘竖直线段，如果两个水平线段或者两个竖直线段之间的距离大于设定的最小证件距离，则进行配对，分别得到水平线段和竖直线段的配对集合；

初始区域集合生成单元，用于将所有水平线段和竖直线段的配对集合组合成区域集合，对不满足证件尺寸的区域集合进行过滤，得到初始区域集合Rsrc；

评分计算单元，用于分别计算所述初始区域集合Rsrc的评分，取评分最高的区域为所述检测区域，其中评分的公式为：Score＝50*(区域四条线段的区域内部截取长度之和-区域四条线段的区域外部截取长度之和)/区域周长+50*(区域内字符连通域的个数/连通域总数)。

在一种实施方式中，所述方向判断模块106用于根据所述证件的位置信息，对所述裁切后的证件图像中的字符朝向进行判定，并根据所述字符朝向对所述裁切后的证件图像进行旋转，其具体包括：

水平图像生成单元，用于当所述证件的位置信息为竖直放置时，对所述裁切后的证件图像进行90度顺时针旋转，得到水平图像；

翻转图像生成单元，用于对所述水平图像进行180度旋转得到翻转图像；

连通域分析单元，用于对所述水平图像进行连通域分析，得到各字符区域；

字符朝向判定单元，用于分别对所述各字符区域内对应的水平图像和翻转图像进行识别，统计并比较满足置信度要求的个数，如果所述水平图像中满足置信度要求的个数大于所述翻转图像，则所述裁切后的证件图像中的字符为朝上，否则字符为朝下；

证件方向判断单元，如果所述裁切后的证件图像为竖直图像，且为字符朝上，则判定的证件方向为朝左，否则为朝右。

在一种实施方式中，所述倾斜角度计算模块107用于对所述旋转后的裁切后的证件图像进行版面分析，计算所有文本行的倾斜角度的平均值作为所述裁切后的证件图像的倾斜角度，并根据所述倾斜角度调整所述裁切后的证件图像，得到裁切后的端正的证件图像，其具体包括：

版面分析单元，用于对所述旋转后的裁切后的证件图像进行版面分析，得到对应的文本行信息；

倾斜角度计算单元，用于对具有多个字符个数的文本行，利用文本行第一个和最后一个字符的中心点位置，计算倾斜角度；

图像角度计算单元，用于计算所有文本行的倾斜角度的平均值，作为所述裁切后的证件图像的倾斜角度。

此外，尽管在上文详细描述中提及了证件图像的裁切装置的若干单元，但是这种划分仅仅并非强制性的。实际上，根据本发明的实施方式，上文描述的两个或更多单元的特征和功能可以在一个单元中具体化。同样，上文描述的一个单元的特征和功能也可以进一步划分为由多个单元来具体化。

请参阅图10，本申请还提供一种证件图像的裁切系统，所述系统包括：存储器a和处理器b，所述存储器a中存储计算机程序，所述计算机程序被所述处理器b执行时，实现以下功能：

获取待裁切的原始证件图像；

对所述原始证件图像进行预处理，得到所述原始证件图像的灰度图像，以及对所述灰度图像进行二值化后生成的二值图像；

对所述灰度图像进行边缘线段检测，得到所述灰度图像的边缘线段信息，所述边缘线段信息包括边缘水平线段和边缘垂直线段；

对所述二值图像进行版面分析，得到所述二值图像中的文本行的位置信息，并根据所述文本行的位置信息得到对应的证件的位置信息和尺寸信息，并确定对应的证件类型；

根据所述证件类型，利用所述边缘线段信息、文本行的位置信息、证件的位置信息和尺寸信息，得到检测区域并在所述灰度图像中根据所述检测区域进行裁切，得到裁切后的证件图像；

根据所述证件的位置信息，对所述裁切后的证件图像中的字符朝向进行判定，并根据所述字符朝向对所述裁切后的证件图像进行旋转；

对所述旋转后的裁切后的证件图像进行版面分析，计算所有文本行的倾斜角度的平均值作为所述裁切后的证件图像的倾斜角度，并根据所述倾斜角度调整所述裁切后的证件图像，得到裁切后的端正的证件图像。

本申请还提供一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时，实现如上所述的方法步骤。

图11-图17为根据本发明实施例所公开的证件图像的裁切方法对身份证图像进行裁切和调整的具体实施例的示意图。首先，利用摄像头或者扫描仪等图像获取设备得到身份证的原始证件图像，并且：

图11为对原始证件图像进行缩放后的灰度图；

图12为对图11的灰度图进行二值化处理，生成的二值化图像；

图13为对灰度图进行边缘线段检测，其中的线段表示检测到的边线；

图14为对二值化图像进行版面分析后的图像；

图15为根据选线区域裁切下来的图像；

图16为对图15所得到的裁切下来的图像进行版面分析后的图像，用于方向判断和倾斜角度计算；

图17为根据图16的方向判断结果和角度计算结果，对图15得到的裁切下来的图像进行旋转和角度调整后，得到的最终的端正的证件图像。

本领域内的技术人员应明白，本发明的实施例可提供为方法、系统、或计算机程序产品。因此，本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

本发明中应用了具体实施例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的一般技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本发明的限制。

Claims

1.一种证件图像的裁切方法，其特征在于，包括：

获取待裁切的原始证件图像；

2.根据权利要求1所述的证件图像的裁切方法，其特征在于，所述对所述灰度图像进行边缘线段检测，得到所述灰度图像的边缘线段信息，所述边缘线段信息包括边缘水平线段和边缘垂直线段，具体包括：

利用LSD检线算法或ED检线算法对所述灰度图像进行边缘线段检测，得到所述灰度图像的所有边缘线段；

对所述所有边缘线段进行合并，并分类为所述边缘水平线段和边缘垂直线段。

3.根据权利要求1所述的证件图像的裁切方法，其特征在于，所述对所述二值图像进行版面分析，得到所述二值图像中的文本行的位置信息，并根据所述文本行的位置信息得到对应的证件的位置信息和尺寸信息，并确定对应的证件类型，具体包括：

对所述二值图像进行版面分析，得到所述二值图像中的文本行的位置信息，所述文本行的位置信息包括文本行的区域坐标以及文本行中每个字符的区域坐标；

根据所述文本行的位置信息判断所述证件的位置信息为水平放置还是竖直放置；

根据所述文本行的位置信息，计算外包区域，判断所述证件的尺寸大小；

根据所述文本行的位置信息，判断所述证件是否是机读码类证件。

4.根据权利要求3所述的证件图像的裁切方法，其特征在于，所述根据所述证件类型，利用所述边缘线段信息、文本行的位置信息、证件的位置信息和尺寸信息，得到检测区域并在所述灰度图像中根据所述检测区域进行裁切，得到裁切后的证件图像，具体包括：

如果所述证件类型为机读码类证件，则所述文本行的位置信息包括机读码的位置和长度，且得到裁切后的证件图像的步骤包括：

根据所述机读码的位置和长度，按比例映射出证件的大致区域；

在所述大致区域对应四边的小范围内，分别寻找长度最长的线段，四边围成的区域就是检测到的区域，如果四边中某边找不到满足长度要求的线段，取所述大致区域的此边边界作为检测到的区域。

5.根据权利要求3所述的证件图像的裁切方法，其特征在于，所述根据所述证件类型，利用所述边缘线段信息、文本行的位置信息、证件的位置信息和尺寸信息，得到检测区域并在所述灰度图像中根据所述检测区域进行裁切，得到裁切后的证件图像，具体包括：

如果证件类型为非机读码类证件，则得到裁切后的证件图像的步骤包括：

配对所述边缘水平线段和边缘竖直线段，如果两个水平线段或者两个竖直线段之间的距离大于设定的最小证件距离，则进行配对，分别得到水平线段和竖直线段的配对集合；

将所有水平线段和竖直线段的配对集合组合成区域集合，对不满足证件尺寸的区域集合进行过滤，得到初始区域集合Rsrc；

分别计算所述初始区域集合Rsrc的评分，取评分最高的区域为所述检测区域，其中评分的公式为：Score＝50*(区域四条线段的区域内部截取长度之和-区域四条线段的区域外部截取长度之和)/区域周长+50*(区域内字符连通域的个数/连通域总数)。

6.根据权利要求5所述的证件图像的裁切方法，其特征在于，所述根据所述证件的位置信息，对所述裁切后的证件图像中的字符朝向进行判定，并根据所述字符朝向对所述裁切后的证件图像进行旋转，具体包括：

当所述证件的位置信息为竖直放置时，对所述裁切后的证件图像进行90度顺时针旋转，得到水平图像；

对所述水平图像进行180度旋转得到翻转图像；

对所述水平图像进行连通域分析，得到各字符区域；

分别对所述各字符区域内对应的水平图像和翻转图像进行识别，统计并比较满足置信度要求的个数，如果所述水平图像中满足置信度要求的个数大于所述翻转图像，则所述裁切后的证件图像中的字符为朝上，否则字符为朝下；

如果所述裁切后的证件图像为竖直图像，且为字符朝上，则方向为朝左，否则为朝右。

7.根据权利要求6所述的证件图像的裁切方法，其特征在于，所述对所述旋转后的裁切后的证件图像进行版面分析，计算所有文本行的倾斜角度的平均值作为所述裁切后的证件图像的倾斜角度，并根据所述倾斜角度调整所述裁切后的证件图像，得到裁切后的端正的证件图像，具体包括：

对所述旋转后的裁切后的证件图像进行版面分析，得到对应的文本行信息；

对具有多个字符个数的文本行，利用文本行第一个和最后一个字符的中心点位置，计算倾斜角度；

计算所有文本行的倾斜角度的平均值，作为所述裁切后的证件图像的倾斜角度。

8.一种证件图像的裁切装置，其特征在于，包括：

获取模块，用于获取待裁切的原始证件图像；

预处理模块，用于对所述原始证件图像进行预处理，得到所述原始证件图像的灰度图像，以及对所述灰度图像进行二值化后生成的二值图像；

线段检测模块，用于对所述灰度图像进行边缘线段检测，得到所述灰度图像的边缘线段信息，所述边缘线段信息包括边缘水平线段和边缘垂直线段；

版面分析模块，用于对所述二值图像进行版面分析，得到所述二值图像中的文本行的位置信息，并根据所述文本行的位置信息得到对应的证件的位置信息和尺寸信息，并确定对应的证件类型；

检测区域生成模块，用于根据所述证件类型，利用所述边缘线段信息、文本行的位置信息、证件的位置信息和尺寸信息，得到检测区域并在所述灰度图像中根据所述检测区域进行裁切，得到裁切后的证件图像；

方向判断模块，用于根据所述证件的位置信息，对所述裁切后的证件图像中的字符朝向进行判定，并根据所述字符朝向对所述裁切后的证件图像进行旋转；

倾斜角度计算模块，用于对所述旋转后的裁切后的证件图像进行版面分析，计算所有文本行的倾斜角度的平均值作为所述裁切后的证件图像的倾斜角度，并根据所述倾斜角度调整所述裁切后的证件图像，得到裁切后的端正的证件图像。

9.根据权利要求8所述的证件图像的裁切装置，其特征在于，所述线段检测模块用于对所述灰度图像进行边缘线段检测，得到所述灰度图像的边缘线段信息，所述边缘线段信息包括边缘水平线段和边缘垂直线段，其具体包括：

10.根据权利要求8所述的证件图像的裁切装置，其特征在于，所述版面分析模块用于对所述二值图像进行版面分析，得到所述二值图像中的文本行的位置信息，并根据所述文本行的位置信息得到对应的证件的位置信息和尺寸信息，并确定对应的证件类型，其具体包括：

文本行位置信息获得单元，用于对所述二值图像进行版面分析，得到所述二值图像中的文本行的位置信息，所述文本行的位置信息包括文本行的区域坐标以及文本行中每个字符的区域坐标；

11.根据权利要求10所述的证件图像的裁切装置，其特征在于，如果所述证件类型为机读码类证件，则所述文本行的位置信息包括机读码的位置和长度，则所述检测区域生成模块包括：

12.根据权利要求10所述的证件图像的裁切装置，其特征在于，如果证件类型为非机读码类证件，则所述检测区域生成模块包括：

13.根据权利要求12所述的证件图像的裁切装置，其特征在于，所述方向判断模块用于根据所述证件的位置信息，对所述裁切后的证件图像中的字符朝向进行判定，并根据所述字符朝向对所述裁切后的证件图像进行旋转，其具体包括：

14.根据权利要求13所述的证件图像的裁切装置，其特征在于，所述倾斜角度计算模块用于对所述旋转后的裁切后的证件图像进行版面分析，计算所有文本行的倾斜角度的平均值作为所述裁切后的证件图像的倾斜角度，并根据所述倾斜角度调整所述裁切后的证件图像，得到裁切后的端正的证件图像，其具体包括：

15.一种证件图像的裁切系统，其特征在于，所述系统包括：存储器和处理器，所述存储器中存储计算机程序，所述计算机程序被所述处理器执行时，实现如权利要求1-7任一项所述的方法步骤。

16.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时，实现如权利要求1-7任一项所述的方法步骤。