CN110766026A

CN110766026A - 一种快速识别卡号的方法及装置、模型训练方法及装置

Info

Publication number: CN110766026A
Application number: CN201910964463.2A
Authority: CN
Inventors: 赵毅仁; 高澍; 李铁铮
Original assignee: Shanghai Lake Information Technology Co Ltd
Current assignee: Shanghai Lake Information Technology Co Ltd
Priority date: 2019-10-11
Filing date: 2019-10-11
Publication date: 2020-02-07

Abstract

本发明提供一种快速识别卡号的方法及装置、模型训练方法及装置，通过深度卷积神经网络对待识别的卡片图像进行特征提取，获得与卡片图像相应的特征图；根据第一预设单位长度，沿卡号长度方向将特征图垂直切分成n个图片；将n个图片输入训练好的预测模型进行预测，输出待识别卡片图像的卡号数据；其中，预测模型为基于Bi‑LSTM网络结构预先训练获得，该方法相较传统的卡片OCR技术，不需要对卡号预先切割进行单个逐一识别，而是通过基于Bi‑LSTM网络结构构建的模型，通过该预测模型对全局信息进行抓取，从而基于深度卷积网络处理后获取的卡片图像的特征图，进行卡号识别，该方法支持不定长卡号的识别，不仅对卡号识别时精度较高，并且速度较快，用户体验较佳。

Description

一种快速识别卡号的方法及装置、模型训练方法及装置

技术领域

本发明涉及光学字符识别领域，特别涉及一种快速识别卡号的方法及装置、模型训练方法及装置。

背景技术

线上支付已经成为大多数人的首选，而很多具有支付功能的金融机构APP 会需要用户绑定卡片。手动地输入银行卡号，不仅耗时、繁琐，还容易出错。因此现在很多APP辅助设置卡号识别装置，该装置中包括卡号位置识别装置，用于卡号位置的定位，对银行卡进行扫描，通过OCR功能，即可自动定位卡号位置。

目前在进行卡号识别时，部分银行卡OCR识别方法容易产生识别错误，准确性较差。为了提高识别的准确性，通常需要将卡号进行切割，切割成单个卡号，再进行逐一识别。在进行卡号切割时，由于卡号之间距离较小，进行卡号切割时容易造成误切割，即造成多个卡号无法完全切割等，为此，需要通过膨胀、腐蚀等手段对卡号图像进行多类型且多次预处理。因此，在这些识别方法中，在通过模型识别之前需要经过较多图像处理步骤才能获得相应的输入数据，耗时较长。

当然，如会员卡、身份证证件等卡片，在进行卡号识别时，同样面临上述问题。

因此，提出一种快速识别卡号的新方法，是目前亟待解决的问题。

发明内容

为解决上述技术问题，本发明提供了一种快速识别卡号的方法及装置、模型训练方法及装置，能对卡号进行快速、准确识别。

本发明实施例提供的技术方案如下：

第一方面，提供一种快速识别卡号的方法，所述方法至少包括如下步骤：

对待识别的卡片图像进行特征提取，获得与所述卡片图像相应的特征图；

根据第一预设单位长度，沿所述卡号长度方向将所述特征图垂直切分成n 个图片，n>0；

将所述n个图片输入预先训练好的预测模型进行预测，输出所述待识别卡片图像的卡号数据；

其中，所述预测模型为基于Bi-LSTM网络结构预先训练获得。

在一些较佳的实施方式中，所述对待识别的卡片图像进行特征提取，获得与所述卡片图像相应的特征图之前，还包括如下步骤：

对待识别的卡片图像进行预处理，所述预处理至少包括对所述待识别的卡片图像进行去均值化处理。

在一些较佳的实施方式中，所述对待识别的卡片图像进行特征提取，获得与所述卡片图像相应的特征图，至少包括如下子步骤：

设置一卷积神经网络的卷积层和池化层；

通过所述卷积层对待识别的卡片图像进行特征提取；

输出与所述卡片图像相应的特征图。

在一些较佳的实施方式中，所述方法还包括：预先训练预测模型，所述预先训练预测模型至少包括如下子步骤：

对预先采集的卡片图像样本进行特征提取，获得与所述卡片图像样本相应的特征图，并对所述卡片图像样本标注标签，获得卡号标签；

根据第二预设单位长度，沿所述卡号长度方向将所述样本特征图垂直切分成m个图片，m>0；

将所述m个图片输入至所述Bi-LSTM网络结构，获得m个输出；

基于所述m个输出及预先获取的卡号标签计算CTC损失函数，结合反向传播，进行预测模型的训练，至CTC损失函数不超过预设阈值时，结束训练，获得预测模型。

在一些较佳的实施方式中，所述预先训练预测模型还包括：

预先获取所述待识别卡片图像的卡号区域图像；

为所述卡号区域图像标注标签，所述标签内容为与所述卡号区域图像一致的数字字符。

另一方面，还提供一种快速识别卡号的模型训练方法，所述训练方法至少包括如下步骤：

根据第二预设单位长度，沿所述卡号长度方向将所述特征图垂直切分成m 个图片，m>0；

将所述m个图片输入至所述Bi-LSTM网络结构，获得m个输出；

基于所述m个输出及卡号标签计算CTC损失函数，结合反向传播，进行预测模型的训练，至CTC损失函数不超过预设阈值时，结束训练，获得预测模型。

在一些较佳的实施方式中，所述训练方法还包括：

预先获取卡片图像样本的卡号区域图像；

又一方面，还提供一种执行上述方法的快速识别卡号的装置，所述装置至少包括：

第一特征提取模块：用于对待识别的卡片图像进行特征提取，获得与所述卡片图像相应的特征图；

第一切分模块：用于根据第一预设单位长度，沿所述卡号长度方向将所述特征图垂直切分成n个图片，n>0；

预测模型模块：用于将所述n个图片输入预先训练好的预测模型进行预测，输出所述待识别卡片图像的卡号数据；

其中，所述预测模型为基于Bi-LSTM网络结构预先训练获得。

在一些较佳的实施方式中，

所述特征提取模块还用于：对预先采集的卡片图像样本进行特征提取，获得与所述卡片图像样本相应的特征图；

所述切分模块还用于：根据第二预设单位长度，沿所述卡号长度方向将所述特征图垂直切分成m个图片，m>0；

所述装置还包括：预测模型预训练模块，其至少包括：

打标单元：用于预先获取卡号区域图像，并对所述卡号区域图像标注标签，所述标签内容位于所述卡号区域图像一致的数字字符；

Bi-LSTM网络结构单元：用于将所述m个图片输入至所述Bi-LSTM网络结构，获得m个输出；

训练单元：用于基于所述n个输出及预先获取的卡号标签计算CTC损失函数，结合反向传播，进行预测模型的训练，至CTC损失函数不超过预设阈值时，结束训练，获得预测模型。

在一些较佳的实施方式中，所述装置还包括：预处理模块：用于对待识别的卡片图像进行预处理，所述预处理至少包括对所述待识别的卡片图像进行去均值化处理。

在一些较佳的实施方式中，所述特征提取模块至少包括：

设置单元：用于设置一卷积神经网络的卷积层和池化层；

特征提取单元：用于通过所述卷积层对待识别的卡片图像/卡片图像样本进行特征提取；

输出单元：用于输出与所述待识别的卡片图像/卡片图像样本相应的特征图。

又一方面，还提供一种执行所述快速识别卡号的模型训练方法的快速识别卡号的模型训练装置，所述模型训练装置至少包括：

第二特征提取模块：用于对预先采集的卡片图像样本进行特征提取，获得与所述卡片图像样本相应的特征图；

第二切分模块：用于根据第二预设单位长度，沿所述卡号长度方向将所述特征图垂直切分成m个图片，m>0；

打标模块：用于预先获取卡号区域图像，并对所述卡号区域图像标注标签，所述标签内容位于所述卡号区域图像一致的数字字符；

Bi-LSTM网络结构模块：用于将所述m个图片输入至所述Bi-LSTM网络结构，获得m个输出；

训练模块：用于基于所述m个输出及预先获取的卡号标签计算CTC损失函数，结合反向传播，进行预测模型的训练，至CTC损失函数不超过预设阈值时，结束训练，获得预测模型。

本发明相比现有技术而言的有益效果在于：

本发明提供一种快速识别卡号的方法及装置、模型训练方法及装置，该方法通过深度卷积神经网络对待识别的卡片图像进行特征提取，获得与卡片图像相应的特征图；根据预设单位长度，沿卡号长度方向将特征图垂直切分成n个图片；将n个图片输入预先训练好的预测模型进行预测，输出待识别卡片图像的卡号数据；其中，预测模型为基于Bi-LSTM网络结构预先训练获得，该方法相较于传统的卡片OCR技术，不需要对卡号预先切割进行单个逐一识别，而是通过基于Bi-LSTM网络结构构建的模型，通过该预测模型对全局信息进行抓取，从而基于深度卷积网络处理后获取的卡片图像的特征图，进行卡号识别，该方法支持不定长卡号的识别，不仅对卡号识别时精度较高，并且速度较快，用户体验较佳。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明实施例一中的一种快速识别卡号的方法的流程图；

图2是本发明实施例二中的一种快速识别卡号的模型训练方法的流程图；

图3是本发明实施例二中概率P的计算示意图；

图4是本发明实施例三中的一种快速识别卡号的装置的结构示意图；

图5是本发明实施例四中的一种快速识别卡号的模型训练装置的结构示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明提供了一种快速识别卡号的方法及装置、模型训练方法及装置，通过提取待识别卡片图像的特征图，再将特征图垂直切分成n个图片，并将n各图片输入预先训练好的模型中进行预测，获得卡号数据，相较于现有技术，不需要进行卡号切割及一系列的图像预处理，因此能实现卡号的快速识别，并且在识别时对于卡号字符长度并不限制，故该方法适用于多种类型卡片，通用性较高。

实施例一

如图1所示，本实施例提供一种卡号识别方法，属于光学字符识别领域。本实施例中的待识别对象为卡片中的卡号，可以为身份证中的身份证号码、银行卡中的银行卡号、会员卡中的会员号等等，为了便于描述，本实施例以识别银行卡中的银行卡号为例进行详细撰述。

具体地，该方法至少包括如下步骤：

S1、对待识别的卡片图像进行特征提取，获得与卡片图像相应的特征图。步骤S1至少包括如下子步骤：

S11、设置一卷积神经网络的卷积层和池化层；

S12、通过卷积层对待识别的卡片图像进行特征提取；

S13、输出与卡片图像相应的特征图。

本实施例中所指的待识别的卡片图像是指通过拍摄、扫描等获取的银行卡图像。理论上是包括银行卡卡面的图像均可，但为了减少剪裁等图像处理过程，本实施例中卡片图像优选仅包括银行卡卡面的图像。特征图是指经过卷积层进行特征提取后获得的包括卡片图像图形特征的图像。

具体地，需选择一个适合用于提取银行卡特征的卷积神经网络进行特征提取，通常，该步骤中适合采用的卷积神经网络至少包括VGG、Alexnet、Resnet 中的一种类型。

在步骤S1之前，该快速识别卡号的方法还包括如下步骤：

S0、对待识别的卡片图像进行预处理，预处理至少包括对待识别卡片图像进行去均值化处理。

去均值化处理，是指针对待处理的卡片图像，都减去全部待处理的卡片图像的特征均值，如此，可以把各维度的数据(RGB)都中心化为0，如此可以减轻过拟合的风险。

S2、根据第一预设单位长度，沿卡号长度方向将特征图垂直切分成n个图片，n>0。

就现有银行卡而言，卡号通常沿银行卡长度方向设置，因此卡号长度方向与银行卡长度方向一致。

假设在步骤1中获得的特征图的尺寸为400*30(mm)，该特征图中的卡号字符数量为k个，即银行卡字符长度。

沿卡号长度方向将特征图垂直切分时，切分的单位长度可以自己设置，单位长度的取值范围是1～400mm之间，因此当单位长度为1mm时，特征图被切分的数量最多，为400个图片。当单位长度为400mm时，特征图被切分的数量最少，为1个图片。

作为一种优选的实施方式，可以选择1mm作为单位长度，对银行卡特征图进行切分，获得400个图片，以提高识别精度。

S3、将n个图片输入预先训练好的预测模型进行预测，输出待识别卡片图像的卡号数据。

其中，预测模型为基于Bi-LSTM网络结构预先训练获得，对于Bi-LSTM的网络结构，如果有n个输入就会有n个输出。对n个图片按序进行识别，并将识别结果按序输出，即可获得相应的银行卡卡号。

当然，在步骤S3之前，该方法还包括预先训练预测模型过程，具体的模型训练过程请参照实施例二。

本实施例提供一种快速识别卡号的方法，可用于银行卡、身份证等卡片中卡号的快速识别，该方法相较于传统的卡片OCR技术，不需要对卡号预先切割进行单个逐一识别，而是通过基于Bi-LSTM网络结构构建的模型，通过该预测模型对全局信息进行抓取，从而基于深度卷积网络处理后获取的卡片图像的特征图，进行卡号识别，该方法支持不定长卡号的识别，不仅对卡号识别时精度较高，并且速度较快，用户体验较佳。

实施例二

本实施例提供一种快速识别卡号的模型训练方法，如图2所示，该训练方法至少包括如下步骤：

Sa1、对预先采集的卡片图像样本进行特征提取，获得与卡片图像样本相应的特征图，并对卡片图像样本标注标签，获得卡号标签；

Sa2、根据第二预设单位长度，沿卡号长度方向将特征图垂直切分成m个图片，m>0；

Sa3、将m个图片输入至Bi-LSTM网络结构，获得m个输出；

Sa4、基于m个输出及卡号标签计算CTC损失函数，结合反向传播，进行预测模型的训练，至CTC损失函数不超过预设阈值时，结束训练，获得预测模型。

在步骤Sa1之前，还包括卡片图像样本采集步骤，通过拍照、扫描等方式采集至少500个卡片图像样。

在上述步骤Sa1中，在对卡片图像样本标注标签，获得卡号标签，具体包括：

Sa11、预先获取卡片图像样本的卡号区域图像；及

Sa12、对卡号区域图像标注标签，标签内容为与卡号区域图像一致的数字字符。

其中，卡号区域获取过程可通过简单的图像处理软件进行人工剪裁，也可以通过预先设置的模型获取，可采用的模型为基于VGG16、VGG19等卷积神经网络进行训练而获得。对卡号区域图像标注标签，可以人工对样本进行标注，也可以通过在对卡号字符进行切割后通过分类模型进行打标。本实施例中涉及的卡号区域获取及对卡号字符进行切割后通过分类模型进行打标的技术方案，均为目前较为成熟的技术手段，此处不再一一赘述。

对于Bi-LSTM的网络结构，如果有n个输入就会有n个输出，通过CTC 损失函数，计算这n个输出和k个银行卡号标签之间的损失函数，然后进行反向传播，训练模型参数使得该损失函数最小，并且当损失函数低于阈值时，停止训练，获得最终快速识别卡号的预测模型，此处的阈值优选0.00001。

示例性地，假设获得的银行卡的特征图为400x30的图片，获得的卡号数字串标签是"6214000000189247"，把图片按400列切分，再对切分出来的每个图片进行卡号数字识别，若无法识别则标记为特殊字符"-"。这样就得到了基于输入的特征图获得的每一个相互独立建模单元个体(包括“-”节点在内)的类属概率分布。基于概率分布，算出标签序列是"6214000000189247"的概率P，当然这里设定"6214000000189247"的概率P为所有子序列之和，这里子序列包括'-' 和数字的连续重复，如图3所示。

CTC损失函数可以自动端到端地同时优化模型参数并对齐切分的边界。因此可以进行上述n个输出中的每一个输出与整个银行卡的标签的计算CTC损失函数，然后反向传播更新模型参数，直到损失函数低于阈值之后停止训练。

本实施例提供一种快速识别卡号的模型训练方法，其通过基于Bi-LSTM网络结构构建模型，同时采用CTC损失函数及反向传播进行模型更新，采用CTC 作为损失函数的模型训练，可以实现自动端到端的模型训练，同时优化模型参数并对齐切分的边界，可缩短模型训练时间，并提高模型精度及可靠性。

实施例三

为执行上述实施例一中的一种快速识别卡号位置的方法，本实施例提供一种快速识别卡号的装置100。图4为该卡号识别装置的结构示意图，该装置100 至少包括：

第一特征提取模块1：对待识别的卡片图像进行特征提取，获得与卡片图像相应的特征图；

第一切分模块2：用于根据第一预设单位长度，沿卡号长度方向将特征图垂直切分成n个图片，n>0；

预测模型模块3：用于将n个图片输入预先训练好的预测模型进行预测，输出待识别卡片图像的卡号数据；

其中，预测模型为基于Bi-LSTM网络结构预先训练获得。

在一些实施方式中，

第一特征提取模块1还用于：对预先采集的卡片图像样本进行特征提取，获得与卡片图像样本相应的特征图；

第一切分模块2还用于：根据第二预设单位长度，沿卡号长度方向将卡片图像样本相应的特征图垂直切分成m个图片，m>0；

该装置100还包括：预测模型预训练模块4及预处理模块0，其中预测模型预训练模块4至少包括：

打标单元41：用于预先获取卡号区域图像，并对卡号区域图像标注标签，标签内容位于卡号区域图像一致的数字字符；

Bi-LSTM网络结构单元42：用于将m个图片输入至Bi-LSTM网络结构，获得m个输出；

训练单元43：用于基于n个输出及预先获取的卡号标签计算CTC损失函数，结合反向传播，进行预测模型的训练，至CTC损失函数不超过预设阈值时，结束训练，获得预测模型。

预处理模块0用于对待识别的卡片图像进行预处理，所述预处理至少包括对所述待识别的卡片图像进行去均值化处理。

实施例四

为执行上述实施例二中的一种快速识别卡号的模型训练方法，本实施例提供快速识别卡号的模型训练装置200。图5为该快速识别卡号的模型训练装置 200的结构示意图，该装置200至少包括：

第二特征提取模块21：用于对预先采集的卡片图像样本进行特征提取，获得与卡片图像样本相应的特征图；

第二切分模块22：用于根据第二预设单位长度，沿卡号长度方向将特征图垂直切分成m个图片，m>0；

打标模块23：用于预先获取卡号区域图像，并对卡号区域图像标注标签，标签内容位于卡号区域图像一致的数字字符；

Bi-LSTM网络结构模块24：用于将m个图片输入至Bi-LSTM网络结构，获得m个输出；

训练模块25：用于基于m个输出及预先获取的卡号标签计算CTC损失函数，结合反向传播，进行预测模型的训练，至CTC损失函数不超过预设阈值时，结束训练，获得预测模型。

需要说明的是：上述实施例三提供的一种快速识别卡号的装置在触发卡号识别业务时，以及实施例四提供的一种快速识别卡号的模型训练装置在触发模型训练业务时，仅以上述各功能模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能模块完成，即将装置的内部结构划分成不同的功能模块，以完成以上描述的全部或者部分功能。另外，上述实施例提供的一种快速识别卡号的装置与快速识别卡号的方法的实施例属于同一构思，同样的，快速识别卡号的模型训练装置与快速识别卡号的模型训练方法的实施例属于同一构思，即装置是基于相应方法的，其具体实现过程及实施效果详见方法实施例，这里不再赘述。

本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成，也可以通过程序来指令相关的硬件完成，所述程序可以存储于一种计算机可读存储介质中，上述提到的存储介质可以是只读存储器，磁盘或光盘等。

以上仅为本发明的较佳实施例，并不用以限制本发明，凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种快速识别卡号的方法，其特征在于，所述方法至少包括如下步骤：

根据第一预设单位长度，沿所述卡号长度方向将所述特征图垂直切分成n个图片，n>0；

其中，所述预测模型为基于Bi-LSTM网络结构预先训练获得。

2.根据权利要求1所述的一种快速识别卡号的方法，其特征在于，所述对待识别的卡片图像进行特征提取，获得与所述卡片图像相应的特征图之前，还包括如下步骤：

3.根据权利要求2所述的一种快速识别卡号的方法，其特征在于，所述对待识别的卡片图像进行特征提取，获得与所述卡片图像相应的特征图，至少包括如下子步骤：

设置一卷积神经网络的卷积层和池化层；

通过所述卷积层对待识别的卡片图像进行特征提取；

输出与所述卡片图像相应的特征图。

4.根据权利要求1～3任意一项所述的一种快速识别卡号的方法，其特征在于，所述方法还包括：预先训练预测模型，所述预先训练预测模型至少包括如下子步骤：

将所述m个图片输入至所述Bi-LSTM网络结构，获得m个输出；

5.一种快速识别卡号的模型训练方法，其特征在于，所述训练方法至少包括如下步骤：

根据第二预设单位长度，沿所述卡号长度方向将所述特征图垂直切分成m个图片，m>0；

将所述m个图片输入至所述Bi-LSTM网络结构，获得m个输出；

6.根据权利要求5所述的一种快速识别卡号的模型训练方法，其特征在于，所述训练方法还包括：

预先获取卡片图像样本的卡号区域图像；

7.一种执行权利要求1～4任意一项所述方法的快速识别卡号的装置，其特征在于，所述装置至少包括：

其中，所述预测模型为基于Bi-LSTM网络结构预先训练获得。

8.根据权利要求7所述的一种快速识别卡号的装置，其特征在于，

所述第一特征提取模块还用于：对预先采集的卡片图像样本进行特征提取，获得与所述卡片图像样本相应的特征图；

所述第一切分模块还用于：根据第二预设单位长度，沿所述卡号长度方向将所述特征图垂直切分成m个图片，m>0；

所述装置还包括：预测模型预训练模块，其至少包括：

9.根据权利要求8所述的一种快速识别卡号的装置，其特征在于，所述特征提取模块至少包括：

设置单元：用于设置一卷积神经网络的卷积层和池化层；

10.一种执行权利要求5～6任意一项所述训练方法的快速识别卡号的模型训练装置，其特征在于，所述模型训练装置至少包括：