CN115761759A

CN115761759A - 资源交互凭据的处理方法、装置、计算机设备和存储介质

Info

Publication number: CN115761759A
Application number: CN202211481902.2A
Authority: CN
Inventors: 吴建伟; 庄广强; 薛文; 黄勇斌; 刘煜; 居胜峰; 李铭仪
Original assignee: Jiangsu Changshu Rural Commercial Bank Co ltd
Current assignee: Jiangsu Changshu Rural Commercial Bank Co ltd
Priority date: 2022-11-24
Filing date: 2022-11-24
Publication date: 2023-03-07

Abstract

本公开涉及一种资源交互凭据的处理方法、装置、计算机设备、存储介质和计算机程序产品。所述方法包括：获取资源交互凭据的图像；根据所述图像中的预设区域的数据确定所述资源交互凭据的凭据种类；利用与所述凭据种类相匹配的文本识别模型获取所述图像中的文本信息，对所述文本信息进行存储，其中，所述文本识别模型为基于预设的卷积神经网络算法和预设的循环神经网络算法得到。采用本方法能够快速准确地管理资源交互凭据。

Description

资源交互凭据的处理方法、装置、计算机设备和存储介质

技术领域

本公开涉及图像数据处理技术领域，特别是涉及一种资源交互凭据的处理方法、装置、计算机设备和存储介质。

背景技术

在一些特定的资源交互场景下，当完成资源交互的流程之后，可以生成对应的资源交互凭据。通常情况下，为了保证资源交互的有序性，需要对资源交互凭据进行处理。

传统技术中，可以通过人工对不同种类的资源交互凭据进行录入、审核、校验，以实现对资源交互凭据的管理。然而，针对大量的多种类的资源交互凭据，人工管理的方法流程繁琐，效率低下，且由于主观因素较大，还会存在校验错误等问题。

发明内容

基于此，有必要针对上述技术问题，提供一种快速准确地管理资源交互凭据的资源交互凭据的处理方法、装置、计算机设备、存储介质和计算机程序产品。

第一方面，本公开实施例提供了一种资源交互凭据的处理方法。所述方法包括：

获取资源交互凭据的图像；

根据所述图像中的预设区域的数据确定所述资源交互凭据的凭据种类；

利用与所述凭据种类相匹配的文本识别模型获取所述图像中的文本信息，对所述文本信息进行存储，其中，所述文本识别模型为基于预设的卷积神经网络算法和预设的循环神经网络算法得到。

在其中一个实施例中，所述根据所述图像中的预设区域的数据确定所述资源交互凭据的凭据种类，包括：

获取资源交互凭据多个区域对应的凭据种类验证方式；

按照预设顺序获取所述图像中的多个区域中的预设区域的数据；

利用与所述预设区域相匹配的凭据种类验证方式对所述预设区域的数据进行验证，直到确定所述资源交互凭据的凭据种类。

获取所述图像中的文本区域的边框长度数据；

在所述边框长度数据符合第一预设条件的情况下，确定所述资源交互凭据的凭据种类为第一凭据种类。

获取所述图像中的标识区域个数和预设颜色区域个数；

在所述标识区域个数和所述预设颜色区域个数符合第二预设条件的情况下，确定所述资源交互凭据对应为第二凭据种类。

获取所述图像中的预设区域的灰度数据；

在所述灰度数据符合第三预设条件的情况下，确定所述资源交互凭据的种类为第三凭据种类。

获取所述图像中预设区域中的标识文本数据；

根据所述标识文本数据确定所述资源交互凭据的凭据种类。

在其中一个实施例中，所述利用与所述凭据种类相匹配的文本识别模型获取所述图像中的文本信息，包括：

在所述图像中包括多个资源交互凭据的情况下，获取所述图像中预设颜色区域图像数据；

根据所述预设颜色区域图像数据对所述图像进行分割，得到所述多个资源交互凭据对应的多个子图像；

利用与所述凭据种类相匹配的文本识别模型获取所述多个子图像的文本信息。

在其中一个实施例中，所述获取资源交互凭据的图像，包括：

获取资源交互凭据的原始图像；

利用预设的直线检测方式获取所述原始图像中预设方向的直线角度；

在所述直线角度在预设范围以内的情况下，对所述原始图像进行水平校正，得到资源交互凭据的图像。

在其中一个实施例中，所述文本识别模型的获取方式包括：

获取资源交互凭据的样本图像数据，其中，所述样本图像数据包括标注文本信息的资源交互凭据图像数据；

基于预设的卷积神经网络算法和预设的循环网络算法构建初始文本识别模型，所述初始文本识别模型中设置有训练参数；

将所述样本图像数据输入至所述初始文本识别模型，得到输出结果；

基于所述输出结果与标注的文本信息标签的差异，对所述初始文本识别模型进行迭代调整，直至所述差异满足预设要求，得到文本识别模型。

在其中一个实施例中，所述获取资源交互凭据的样本图像数据包括：

获取资源交互凭据的初始样本图像数据；

对所述初始样本图像数据进行预设比例的缩放处理，得到处理后的初始样本图像数据；

将所述处理后的初始样本图像数据与预设背景图像融合，得到资源交互凭据的样本图像数据。

第二方面，本公开实施例还提供了一种资源交互凭据的处理装置。所述装置包括：

获取模块，用于获取资源交互凭据的图像；

确定模块，用于根据所述图像中的预设区域的数据确定所述资源交互凭据的凭据种类；

存储模块，用于利用与所述凭据种类相匹配的文本识别模型获取所述图像中的文本信息，对所述文本信息进行存储，其中，所述文本识别模型为基于预设的卷积神经网络算法和预设的循环神经网络算法得到。

在其中一个实施例中，所述确定模块，包括：

第一获取子模块，用于获取资源交互凭据多个区域对应的凭据种类验证方式；

第二获取子模块，用于按照预设顺序获取所述图像中的多个区域中的预设区域的数据；

验证模块，用于利用与所述预设区域相匹配的凭据种类验证方式对所述预设区域的数据进行验证，直到确定所述资源交互凭据的凭据种类。

在其中一个实施例中，所述确定模块，包括：

第三获取子模块，用于获取所述图像中的文本区域的边框长度数据；

第一确定子模块，用于在所述边框长度数据符合第一预设条件的情况下，确定所述资源交互凭据的凭据种类为第一凭据种类。

在其中一个实施例中，所述确定模块，包括：

第四获取子模块，用于获取所述图像中的标识区域个数和预设颜色区域个数；

第二确定子模块，用于在所述标识区域个数和所述预设颜色区域个数符合第二预设条件的情况下，确定所述资源交互凭据对应为第二凭据种类。

在其中一个实施例中，所述确定模块，包括：

第五获取子模块，用于获取所述图像中的预设区域的灰度数据；

第三确定子模块，用于在所述灰度数据符合第三预设条件的情况下，确定所述资源交互凭据的种类为第三凭据种类。

在其中一个实施例中，所述确定模块，包括：

第六获取子模块，用于获取所述图像中预设区域中的标识文本数据；

第四确定子模块，用于根据所述标识文本数据确定所述资源交互凭据的凭据种类。

在其中一个实施例中，所述存储模块，包括：

第七获取子模块，用于在所述图像中包括多个资源交互凭据的情况下，获取所述图像中预设颜色区域图像数据；

分割模块，用于根据所述预设颜色区域图像数据对所述图像进行分割，得到所述多个资源交互凭据对应的多个子图像；

第八获取子模块，用于利用与所述凭据种类相匹配的文本识别模型获取所述多个子图像的文本信息。

在其中一个实施例中，所述获取模块，包括：

第九获取子模块，用于获取资源交互凭据的原始图像；

第十获取子模块，用于利用预设的直线检测方式获取所述原始图像中预设方向的直线角度；

校正模块，用于在所述直线角度在预设范围以内的情况下，对所述原始图像进行水平校正，得到资源交互凭据的图像。

在其中一个实施例中，所述文本识别模型的获取模块包括：

获取单元，用于获取资源交互凭据的样本图像数据，其中，所述样本图像数据包括标注文本信息的资源交互凭据图像数据；

构建模块，用于基于预设的卷积神经网络算法和预设的循环网络算法构建初始文本识别模型，所述初始文本识别模型中设置有训练参数；

输入模块，用于将所述样本图像数据输入至所述初始文本识别模型，得到输出结果；

调整模块，用于基于所述输出结果与标注的文本信息标签的差异，对所述初始文本识别模型进行迭代调整，直至所述差异满足预设要求，得到文本识别模型。

在其中一个实施例中，所述获取单元包括：

获取子单元，用于获取资源交互凭据的初始样本图像数据；

处理模块，用于对所述初始样本图像数据进行预设比例的缩放处理，得到处理后的初始样本图像数据；

融合模块，用于将所述处理后的初始样本图像数据与预设背景图像融合，得到资源交互凭据的样本图像数据。

第三方面，本公开实施例还提供了一种计算机设备。所述计算机设备包括存储器和处理器，所述存储器存储有计算机程序，所述处理器执行所述计算机程序时实现本公开实施例中任一项所述的方法的步骤。

第四方面，本公开实施例还提供了一种计算机可读存储介质。所述计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现本公开实施例中任一项所述的方法的步骤。

第五方面，本公开实施例还提供了一种计算机程序产品。所述计算机程序产品，包括计算机程序，该计算机程序被处理器执行时实现本公开实施例中任一项所述的方法的步骤。

本公开实施例，在处理资源交互凭据时，先获取资源交互凭据的图像，根据资源交互凭据图像中的预设区域的数据，结合不同资源交互凭据种类的特征信息，确定所述资源交互凭据的凭据种类，利用与该凭据种类相匹配的文本识别模型对图像进行识别，获取图像中的文本信息，并存储获取到的文本信息，根据存储的文本信息能够对资源交互凭据的具体信息进行校验，从而实现了对资源交互凭据的全自动化管理，无需人工对资源交互凭据进行分类、录入、审核等流程，节约了流程，提高了资源交互凭据管理的效率；且通过预设的方式和模型进行信息的识别和提取，排除了主观因素的干扰，保证了资源交互凭据信息提取的准确率；本实施例中通过预设的卷积神经网络算法和预设的循环神经网络算法得到文本识别模型，保证了文本识别模型的准确性，提高了提取到的文本信息的准确性，进而在提升效率的同时，保证了资源交互凭据的自动化管理的可靠性。

附图说明

图1为一个实施例中资源交互凭据的处理方法的流程示意图；

图2为一个实施例中资源交互凭据的处理方法的流程示意图；

图3为一个实施例中资源交互凭据的处理方法的流程示意图；

图4为一个实施例中资源交互凭据的处理装置的结构框图；

图5为一个实施例中计算机设备的内部结构图。

具体实施方式

为了使本公开实施例的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本公开实施例进行进一步详细说明。应当理解，此处描述的具体实施例仅仅用以解释本公开实施例，并不用于限定本公开实施例。

在一个实施例中，如图1所示，提供了一种资源交互凭据的处理方法，所述方法包括：

步骤S110，获取资源交互凭据的图像；

本公开实施例中，在对资源交互凭据进行处理时，获取资源交互凭据的图像。在一个示例中，资源交互凭据的图像可以为通过图像扫描装置对资源交互凭据进行扫描后得到。本实施例中，资源交互凭据的图像可以包括事先获取得到的图像，也可以包括在对资源交互凭据进行处理时实时获取得到的图像。在一个示例中，获取到资源交互凭据的图像后，会通过预设的文本检测方式，例如YOLOV3算法，确定图像中资源交互凭据的放置方向，YOLOV3会检测到水平方向连续文字，如果是垂直放置文本，长宽比通常情况下小于预设阈值，因此通过文本行检测数目可以判断垂直还是水平放置，在一个示例中，预设阈值可以设置为2。

步骤S120，根据所述图像中的预设区域的数据确定所述资源交互凭据的凭据种类；

本公开实施例中，从获取到的图像中获取预设区域的数据，其中，所述预设区域为事先设定的图像区域范围，可以根据实际场景设置不同的预设区域。根据所述预设区域的数据确定得到图像对应的资源交互凭据对应的凭据种类，其中，不同的资源交互凭据的种类对应的预设区域的数据也会存在差异。在一个示例中，可以事先获取不同凭据种类的资源交互凭据，根据不同种类的资源交互凭据的特征信息确定不同预设区域的数据对应的不同的凭据种类，例如，当A类凭据种类的图像中文本区域较大时，可以设置预设区域为连续文本区域，当预设区域的数据，即连续文本区域的大小大于预设阈值的情况下，可以确认此时图像对应的资源交互凭据为A类凭据种类，实现了对凭据种类的判断。在一种可能的实现方式中，本实施例中，还可以设置多个不同的预设区域，根据对不同预设区域的数据特征的分析，确定对应的凭据种类，从而能够实现对多种不同的凭据种类的判别。

步骤S130，利用与所述凭据种类相匹配的文本识别模型获取所述图像中的文本信息，对所述文本信息进行存储，其中，所述文本识别模型为基于预设的卷积神经网络算法和预设的循环神经网络算法得到。

本公开实施例中，由于不同凭据种类对应的凭据的有效信息通常会对应在凭据的不同区域位置处，且有效信息的格式也会存在差异，因此，针对不同凭据种类的凭据，需要利用不同的文本识别模型进行识别。在确定图像对应的凭据种类后，获取与所述凭据种类相匹配的文本识别模型。利用文本识别模型对图像中的文本信息进行提取，并将提取到的文本信息存储在预设的存储位置。在一个示例中，提取到文本信息后，将文本信息与预设数据库中的相匹配的文本信息进行比对，在比对一致的情况下，认为通过校验；在比对不一致的情况下，认为未通过校验，可以通过人工进行审核。在一个示例中，文本识别模型提取文本信息时，可以设置为提取图像中的有效信息，其中，有效信息可以包括但不限于资源交互种类、资源交互量、资源交互时间等。本实施例中，文本识别模型为基于预设的卷积神经网络算法和预设的循环神经网络算法得到，利用卷积神经网络算法可以采样到图像卷积特征，再结合循环神经网络算法，能够通过字符上下文关系校正识别结果，提高识别准确率和识别效率。在一个示例中，预设的卷积神经网络可以为残差网络(ResNET)，预设的循环神经网络可以为双向长短记忆网络(BiLstm)，具体的，还可以结合时序分类网络(CTC)训练得到最终的文本识别模型。在一种可能的实现方式中，采用ResNet-18进行采样文本信息(例如日期、资源交互量)等特征，ResNet-18网络结构是经过7*7conv(卷积网络)、maxPool(降采样网络)、3次shortcut(是残差结构，在两层之间增加了权重，缓解梯度发散问题)网络裁剪，shortcut是由4个3*3conv(卷积网络)依次将图像特征采样到512*7*7、avgpool(平均池化层)、FC(全连接层)最终生成512*1000特征、BiLstm(双向长短记忆网络)资源交互量是22*60特征，日期是15*100特征、CTC(时序分类网络)得到识别结果。因为日期和资源交互量最大字符数类数不超过22，因此采用ResNet-18中卷积特征就能采样到图像卷积特征，同时采用双向长短记忆网络和时序分类网络可以通过字符上下文关系来矫正识别结果，提高识别准确度又可以提高识别效率。本实施例中，CTC是一种Loss计算方法，用CTC代替SoftmaxLoss，训练样本无需对齐。引入空字符，解决有些位置没有字符的问题，通过递推，快速计算梯度。采用CTC中定义的条件概率，按照给个时刻预测y＝y1，...，yt对标签序列资源交互量标签序列L定义概率。y1，...，yt是L不同位置的概率分布，其中去除空格和重复标签就是一个序列到另外一个序列的映射。B将π(当个字符)映射到最终输出结果L，首先删除重复标签，然后删除空格，例如B把“2021-年--10月21--日”(“-”表示空格)映射到“2021年10月21日”。条件概率定义由B映射到L上所有π的概率之和：

π的概率定义为

其中

是位置t有字符π_t的概率。因此BiLstm对应位置t字符概率由π_t、π_t-1、π_t+1，根据上下文关系推导得出，条件更为严格。这里的位置可以对应到像素，y_t就是从BiLstm的输出，对每个像素列的预测。L就是标注的标签序列，每一个便是一个字符串，比如“2021年10月21日”。y→π→l就是从BiLstm经过CTC得到每个字符概率再到识别到整个图像文字结果标签。因此本实施例采用的端到端文本识别方法通过ResNET残差网络提取到图像的卷积特征提取的特征更能丰富图像的文字边缘特征，同时采用BiLstm比Lstm多了上下文的文字进行预测当前文字标签，更为准确。

在一个实施例中，如图2所示，所述根据所述图像中的预设区域的数据确定所述资源交互凭据的凭据种类，包括：

步骤S121，获取资源交互凭据多个区域对应的凭据种类验证方式；

步骤S122，按照预设顺序获取所述图像中的多个区域中的预设区域的数据；

步骤S123，利用与所述预设区域相匹配的凭据种类验证方式对所述预设区域的数据进行验证，直到确定所述资源交互凭据的凭据种类。

本公开实施例中，确定资源交互凭据的凭据种类时，获取资源交互凭据多个区域对应的凭据种类验证方式，其中，根据不同凭据种类，设置对不同区域的数据的验证方式，一个区域可以对应有多种凭据种类验证方式，具体可以根据实际应用场景进行设置。在对图像进行判断时，可以按照预设顺序获取图像中多个区域中的预设区域的数据并进行验证，其中，预设顺序通常为事先根据实际应用场景设置得到，在一个示例中，预设顺序可以根据凭据种类验证方式的实现难易程度由易到难进行设置。按照预设顺序依次获取多个区域中的预设区域的数据，利用与预设区域相匹配的凭据种类验证方式对预设区域的数据进行验证，直到确定资源交互凭据的凭据种类。在一个示例中，每获取一个预设区域的数据，就进行一次验证，在验证得到凭据种类时，就停止获取预设区域的数据；在验证不符合无法确定凭据种类时，就按照预设顺序获取下一个预设区域的数据进行验证，直到确定资源交互凭据的凭据种类。

本公开实施例，根据不同的凭据种类设置不同的凭据种类验证方式，在获取到资源交互凭据的图像后，按照预设顺序获取不同区域中的预设区域，并按照对应的凭据种类验证方式进行验证，得到图像对应的资源交互凭据的凭据种类，实现了对多种凭据种类的资源交互凭据的识别；且按照预设顺序依次获取不同区域的数据进行判断，能够保证凭据种类识别的准确性的同时，提高凭据种类识别的效率，避免了资源浪费。

在一个实施例中，所述根据所述图像中的预设区域的数据确定所述资源交互凭据的凭据种类，包括：

获取所述图像中的文本区域的边框长度数据；

本公开实施例中，在确定资源交互凭据的凭据种类时，获取图像中的文本区域的边框长度数据，其中，可以通过预设的文本行检测算法确定图像中的文本区域的边框，得到文本区域的边框后，获取边框的长度数据。在一个示例中，边框的形状可以根据实际应用场景确定得到，例如，矩形边框等。根据文本区域的边框长度数据可以确定图像对应的资源交互凭据中的文本内容量。本公开实施例中，对第一凭据种类进行验证，第一凭据种类可以设置为文本内容占比较多的资源交互凭据，此时，第一预设条件可以设置为文本边框长度大于预设阈值，当边框长度数据符合第一预设条件时，可以认为此时文本边框长度较长，文本内容量较多，符合第一凭据种类的文本内容占比较多的特征，确定此时的图像对应的资源交互凭据为第一凭据种类，其中，预设阈值可以为根据第一凭据种类的文本内容量特征确定得到。在一个示例中，第一预设条件通常为根据实际应用场景设置得到，例如，还可以设置第一凭据种类为文本内容占比较少的资源交互凭据，此时，可以将第一预设条件设置为文本边框长度小于预设阈值，进而对文本内容量较少的第一凭据种类进行判别。在一个示例中，通过YOLOV3文本检测算法实现对第一凭据种类的判断，具体的，可以采用宽度为8和高度为11、23、33、48、97、139的锚点，标签分为文本和非文本，YOLOV3首先通过5个卷积层、2个全连接层、激活函数预测2个放置方向对应的类别，然后将整幅图像分成8*11，8*23，8*33，8*38，8*97，8*139的网格，每个网格点负责一个区域检测，通过检测模型预测出偏移量tx、ty、tw、th来推导边框坐标位置(bx，by)和边框宽高(bw，bh)。对应推导公式如式(2)至式(6)所示，其中，边界框的坐标用bx，by表示，边界框宽和高用bw，bh表示，(cx，cy)表示该点所在网格的左上角相差的格子数，(pw，ph)表示先验框的边长。

bx ＝σ(tx) + cx (2)

by ＝σ(ty) + cy (3)

bw ＝p_we^tw (4)

bh ＝p_he^th (5)

Pr(object)*IOU(b，Object) ＝σ(to) (6)

可以看出，通过Pr(object)*IOU(b，Object)为网格点中是文字区域的概率，其中，此概率可以通过文本检测算法，例如YOLOV3模型预测得到，得到该概率后，就可以得到σ(tx)、σ(ty)，其中cx，cy已知，因此可以推出bx和by坐标位置，pw、ph、tw、th已知，可以推导出bw和bh。

本公开实施例，通过对图像中文本框的长度数据的判断，能够对文本内容量特征较为明显的凭据种类的资源交互凭据进行判别，实现了根据图像的文本量对资源交互凭据的凭据种类进行判断，判断方式简单，简化了判断流程，且准确率较高，进而保证了后续的文本信息的提取。

获取所述图像中的标识区域个数和预设颜色区域个数；

本公开实施例中，在确定资源交互凭据的凭据种类时，获取图像中的标识区域个数和预设颜色区域个数。由于不同的资源交互凭据对应有不同的特点，本实施例中，第二凭据种类的资源交互凭据被设置为包括第一预设数量的标识区域和第二预设数量的预设颜色区域的资源交互凭据，当图像中包含第一预设数量的标识区域和第二预设数量的预设颜色区域时，可以认为此时图像对应的资源交互凭据为第二凭据种类。第二预设条件通常为根据实际应用场景设置得到，本实施例中，第二预设条件包括所述标识区域个数符合第一预设数量且所述预设颜色区域个数符合第二预设数量。其中，标识区域通常包括特定标识对应的图像区域，例如二维码区域等；预设颜色区域中预设颜色可以根据实际应用场景进行设置，例如，红色区域等。在一个示例中，预设颜色区域可以设置为红色印章区域，能够实现对图像中印章数量进行判断。在一个示例中，标识区域可以通过Adaboost方法进行检测，具体的，训练Adaboost检测模型时，采集第一预设数量的正样本和第二预设数量的负样本，利用Adaboost方法训练得到Adaboost检测模型，其中，正样本包括资源交互凭据的标识区域，负样本包括资源交互凭据的非标识区域，在一个示例中，第一预设数量可以设置为10000，第二预设数量可以设置为60000。在一个示例中，预设颜色区域可以为红色印章区域，确定红色印章区域时，可以先将图像映射到HSV(色调、饱和度、明度颜色模型)空间，并将在红色色阶区域的位置设置成255，非红色阶区域的位置设置成0，然后通过腐蚀和膨胀的算子将红色区域进行连接，最后通过训练椭圆轮廓方法确定红色印章区域位置。

本公开实施例，通过对图像中标识区域个数和预设颜色区域个数进行判断识别，能够对存在标识区域特点和预设颜色区域特点的资源交互凭据进行判断识别，实现了根据图像的标识区域数量和预设颜色区域数量对资源交互凭据的凭据种类进行判断，判断方式简单，简化了判断流程，且准确率较高，进而保证了后续的文本信息的提取。

获取所述图像中的预设区域的灰度数据；

本公开实施例中，在确定资源交互凭据的凭据种类时，获取图像中预设区域的灰度数据。在一个示例中，可以通过预设的色彩提取算法获取所述图像中预设区域的灰度数据。其中，预设区域通常为根据实际应用场景设置得到。由于不同的资源交互凭据对应有不同的特点，本实施例中，第三凭据种类的资源交互凭据被设置为无色彩凭据种类，此时，当灰度数据在预设灰度区域内时，可以认为此时图像对应的资源交互凭据为第三凭据种类。第三预设条件通常为根据实际应用场景设置得到，本实施例中，第三预设条件可以包括灰度数据在预设灰度区域内。

本公开实施例，通过对图像中预设区域的灰度数据进行判断识别，能够对存在色彩特征的资源交互凭据进行判断识别，实现了根据图像的灰度数据对资源交互凭据的凭据种类进行判断，判断方式简单，简化了判断流程，且准确率较高，进而保证了后续的文本信息的提取。

获取所述图像中预设区域中的标识文本数据；

根据所述标识文本数据确定所述资源交互凭据的凭据种类。

本公开实施例中，在确定资源交互凭据的凭据种类时，获取图像中预设区域中的标识文本数据。由于不同的资源交互凭据对应有不同的特征，本实施例中，可以根据图像中预设区域的标识文本数据确定资源交互凭据的种类。在一个示例中，可以根据标识文本数据区分第四凭据种类和第五凭据种类，第四凭据种类和第五凭据种类在预设区域中均对应有标识文本，根据标识文本的具体种类可以对凭据种类进行区分，例如，当标识文本为凭据编码时，可以根据凭据编码确定对应的凭据种类。其中，可以利用预设的文本识别算法对预设区域中的标识文本数据进行识别，得到对应的标识文本，进而根据标识文本的特征信息确定凭据种类。在一个示例中，事先设置标识文本的特征信息与凭据种类之间的对应关系，在获取到标识文本数据后，根据标识文本的特征信息和所述对应关系，确定图像对应的凭据种类。

本公开实施例，通过对图像中预设区域的标识文本数据进行判断识别，能够对存在标识文本特征的资源交互凭据进行判断识别，实现了根据图像的标识文本的特征数据对资源交互凭据的凭据种类进行判断，判断方式简单，简化了判断流程，且准确率较高，进而保证了后续的文本信息的提取。

在一个实施例中，所述利用与所述凭据种类相匹配的文本识别模型获取所述图像中的文本信息，包括：

本公开实施例中，在一些场景中，一个图像中可以对应有多个资源交互凭据，此时，需要对图像进行处理，以获取每个资源交互凭据的文本信息。根据资源交互凭据的凭据种类，获取图像中预设颜色区域图像数据，其中，预设颜色区域可以为根据实际应用场景中资源交互凭据种类的特征设置得到，本实施例中，图像中对应的多个资源交互凭据中均包含预设颜色区域。在一个示例中，预设颜色区域可以设置为红色印章区域，一个资源交互凭据对应一个红色印章，从而对图像进行分割处理。根据预设颜色区域图像数据的位置对图像进行分割处理，得到多个包含有预设颜色区域的子图像，一个子图像对应为一个资源交互凭据，其中，在进行分割处理时，根据预设颜色区域大小和资源交互凭据大小的比例进行分割，以保证分割后的子图像与资源交互凭据的对应关系。在一个示例中，根据预设颜色区域的位置对图像进行分割处理，分割后的子图像中预设颜色区域位置均在预设范围内。得到多个子图像后，利用与该凭据种类相匹配的文本识别模型获取子图像中的文本信息。在一个示例中，针对不同的凭据种类，可以设置不同的预设颜色区域图像数据。

本公开实施例，在一张图像存在多张资源交互凭据的情况下，根据资源交互凭据的预设颜色区域图像的特征对图像进行分割，得到多张资源交互凭据对应的多个子图像，实现了对多凭据图像的处理，能够适用于更多应用场景，保证了提取得到的文本信息的准确性，提高了资源交互凭据管理的效率。

在一个实施例中，所述获取资源交互凭据的图像，包括：

获取资源交互凭据的原始图像；

本公开实施例中，获取资源交互凭据的图像时，获取资源交互凭据的原始图像，由于原始图像为未经处理的，所以可能会存在歪斜等情况，此时，利用预设的直线检测方式获取原始图像中预设方向的直线角度，其中，预设方向通常为根据实际应用场景设置得到，例如水平方向、垂直方向等。在直线角度在预设范围以内的情况下，可以进行水平校正，使得校正后的图像在预设方向的直线角度符合要求，得到资源交互凭据的图像。其中，预设范围通常为根据实际应用场景设置得到。在一个示例中，预设范围被设置为一个较小的值，从而能够实现对稍微偏斜的图像进行校正，在图像偏斜角度过大时，存在严重失真的情况，图像可能为无效图像，无效进行校正处理。在一个示例中，通过霍夫变换直线检测方法统计水平方向超过一定阈值长度的直线角度平均值，如果直线数目超过一定数量且角度不超过-5到+5之间的图像进行清晰校正，其它不符合条件的图像保持不变，这样可以对带有表格的资源交互凭据进行水平校正，便于文本行检测和识别。在一种可能的实现方式中，在直线数量超过预设阈值的情况下，进行水平校正，以实现对带有表格的资源交互凭据的图像的校正。

本公开实施例，对资源交互凭据的原始图像进行直线检测，进而进行水平校正，得到资源交互凭据的图像，能够保证用于进行文字信息提取的资源交互凭据的图像不歪斜，避免无效图像造成的信息无法提取或提取错误的情况，保证了后续对凭据种类判别和对文本信息提取的准确性，在提升效率的同时，保证了资源交互凭据的自动化管理的可靠性。

在一个实施例中，所述文本识别模型的获取方式包括：

本公开实施例中，获取文本识别模型时，先获取资源交互凭据的样本图像数据，样本图像数据中包括标注有文本信息的资源交互凭据图像数据。基于预设的卷积神经网络算法和预设的循环网络算法构建初始文本识别模型，初始文本识别模型中设置有训练参数，其中，训练参数可以根据实际应用场景进行调整。将样本图像数据输入到初始文本识别模型中，得到初始文本信息输出结果，根据初始文本信息输出结果与标注的文本信息的标签之间的差异，对初始文本识别模型进行迭代调整。在一个示例中，迭代调整时包括对初始文本识别模型中的训练参数的调整、对初始文本识别模型的基础参数进行调整等，具体可以根据实际应用场景确定。在调整后的初始文本识别模型的输出结果与标注的文本信息之间的差异满足预设要求时，得到文本识别模型，其中，预设要求为根据实际应用场景设置得到，当差异满足该预设要求时，可以认为此时的文本识别模型的输出结果与实际标注的标签之间的差异在允许的误差范围内，文本识别模型的输出结果较为准确，可以用于进行文本信息的提取。在一个示例中，在文本识别模型的应用过程中，还可以根据实际需求对文本识别模型进行迭代优化，以进一步提升文本识别模型的输出结果的准确性。

本公开实施例，通过构建初始文本识别模型，并利用样本图像数据对初始文本识别模型进行迭代调整，得到文本识别模型，保证了文本识别模型的准确率，进而保证了对资源交互凭据的文本信息提取的可靠性和有效性；且通过预设的卷积神经网络算法和预设的循环神经网络算法得到文本识别模型，保证了文本识别模型的准确性，提高了提取到的文本信息的准确性，进而在提升效率的同时，保证了资源交互凭据的自动化管理的可靠性。

在一个实施例中，所述获取资源交互凭据的样本图像数据包括：

获取资源交互凭据的初始样本图像数据；

本公开实施例中，在训练得到文本识别模型时，需要获取资源交互凭据的样本图像。获取资源交互凭据的初始样本图像数据，其中，初始样本图像数据的大小尺寸可能存在不一致，从而影响训练得到的文本识别模型的准确性。本实施例中，对初始样本图像数据按照预设比例进行缩放处理，其中，预设比例可以为根据实际应用场景设置得到，在一个示例中，可以设置一个宽度定值或长度定值，在进行缩放时，将图像的宽度拉至宽度定值，同时长度等比例缩放，或将图像的长度拉至长度定值，同时宽度等比例缩放。缩放处理后，得到处理后的初始样本图像数据，将处理后的初始样本图像数据与预设背景图像融合，得到资源交互凭据的样本图像数据。其中，预设背景图为根据实际应用场景设置得到，例如，预设尺寸的纯色背景图，通常情况下，预设背景图的长和宽要大于等于处理后的初始样本图像数据。将所有处理后的初始样本图像数据与预设背景图融合后，得到与预设背景图尺寸大小相同的样本图像数据。

本公开实施例，通过对样本数据的缩放处理以及与预设背景图的融合处理，能够得到比例接近尺寸相同的样本图像数据，利用比例接近尺寸相同的样本图像数据训练得到的文本识别模型的识别准确率较高，进而保证了资源交互凭据的文本信息提取的可靠性和有效性。相比于传统方法中进行压缩造成样本失真或进行裁剪导致样本缺失的情况，既保证了训练样本的完整性，也降低了训练样本的制作难度；且可以针对多种尺寸的原始图像进行处理，丰富了训练样本，进一步提升了文本识别模型的准确性和有效性。

图3是根据一示例性实施例示出的一种资源交互凭据的处理方法的流程示意图，参考图3所示，可以实现根据不同的资源交互凭据的特征将资源交互凭据划分为A、B、C、D、E几种凭据种类，利用预设的图像扫描装置对资源交互凭据进行扫描；对扫描的图像进行直线检测和水平校正，进行预处理；先利用预设的文本检测算法对图像进行初步分类，能够根据文本框的长宽数据初步分类出文本信息特征明显的资源交互凭据；然后进行更细一步的精细划分，先检测图像中标识区域(通过Adaboost方法进行检测)和红色印章区域块(通过提取红色颜色范围的区域块)，通过检测到的标识区域个数和红色区域块个数是否符合预设条件来对图像进行分类，分类出标识区域和颜色区域特征明显的资源交互凭据；如果检测到的标识区域个数和红色区域块个数不符合上述预设条件，可以综合检测到的文本行长度和预设颜色区域块的数目分类出文本特征和颜色区域特征符合预设要求的资源交互凭据，具体的，可以根据具体的特征设置不同的阈值对文本行长度和预设颜色区域块的数目进行判别划分；还可以通过图像的灰度实现对色彩特征明显的资源交互凭据；经过上述判断划分后，进一步的，在进行文字信息的提取时，根据预设的文本识别模型识别候选区域的文字信息，可以通过文字信息中包含的标识文字信息进一步分类出标识文本特征明显的资源交互凭据，如果图像中没有识别到对应的文本标识信息，则认为为其他种类，继续识别文本行按从上到下前几行文字内容，并与数据库中预设的文档模板进行比对，如果一致表示该张图像是预设文档格式，如合同等，无需进行处理，如果不一致，则转由人工处理。针对不同凭据种类的资源交互凭据进行文字信息的提取时，流程也会存在差异。在一种可能的实现方式中，当一张图像中包含多张资源交互凭据时，需要先对图像进行分割，通过印章区域和标识区域位置进行分割，并利用预设的文本识别模型提取资源交互凭据中的文字信息。在一种可能的实现方式中，还需要对资源交互凭据的放置方向进行确认，可以先通过印章外接边框推导资源交互凭据的位置，再计算资源交互凭据的区域前景密度，通过密度判断资源交互凭据是否倒置，进而利用预设的文本识别模型对资源交互凭据中的文字信息进行提取。在一种可能的实现方式中，可以通过标识区域的位置识别文本信息要素，并通过标识区域位置推导文本信息位置，使用文本识别模型提取文本信息；根据凭据种类和文本信息的具体内容，与预设数据库中的数据进行比较，若比较一致，则校验成功；如果不一致表示校验失败，可以通过人工审核修正。

本公开实施例，采用传统和深度相结合的算法，能在方向不一、多种版式、多张资源交互凭据、其它文档混合图像中区分出不同的凭据种类，并快速确定候选区域，识别文字信息内容，通过多种算法结合训练文本识别模型提高识别效率、通过率、以及识别准确率。本实施例通过传统颜色密度计算、二值化密度计算、基于Adaboost的标识区域位置检测、预设颜色区域提取、直线检测、基于yolov3文本行检测、CRNN和resnet端到端文本识别方法，减少了资源交互凭据识别时间，对拍摄或者扫描的图像角度和方向要求降低，提高了资源交互凭据的录入效率，同时，多种方法核验能提高识别的准确率。

应该理解的是，虽然附图的流程图中的各个步骤按照箭头的指示依次显示，但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明，这些步骤的执行并没有严格的顺序限制，这些步骤可以以其它的顺序执行。而且，附图中的至少一部分步骤可以包括多个步骤或者多个阶段，这些步骤或者阶段并不必然是在同一时刻执行完成，而是可以在不同的时刻执行，这些步骤或者阶段的执行顺序也不必然是依次进行，而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。

基于同样的发明构思，本公开实施例还提供了一种用于实现上述所涉及的资源交互凭据的处理方法的资源交互凭据的处理装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似，故下面所提供的一个或多个资源交互凭据的处理装置实施例中的具体限定可以参见上文中对于资源交互凭据的处理方法的限定，在此不再赘述。

在一个实施例中，如图4所示，提供了一种资源交互凭据的处理装置400。所述装置包括：

获取模块410，用于获取资源交互凭据的图像；

确定模块420，用于根据所述图像中的预设区域的数据确定所述资源交互凭据的凭据种类；

存储模块430，用于利用与所述凭据种类相匹配的文本识别模型获取所述图像中的文本信息，对所述文本信息进行存储，其中，所述文本识别模型为基于预设的卷积神经网络算法和预设的循环神经网络算法得到。

在一个实施例中，所述确定模块，包括：

在一个实施例中，所述存储模块，包括：

在一个实施例中，所述获取模块，包括：

第九获取子模块，用于获取资源交互凭据的原始图像；

在一个实施例中，所述文本识别模型的获取模块包括：

在一个实施例中，所述获取单元包括：

获取子单元，用于获取资源交互凭据的初始样本图像数据；

上述资源交互凭据的处理装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中，也可以以软件形式存储于计算机设备中的存储器中，以便于处理器调用执行以上各个模块对应的操作。

在一个实施例中，提供了一种计算机设备，该计算机设备可以是服务器，其内部结构图可以如图5所示。该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中，该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储资源交互凭据的图像数据等数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种资源交互凭据的处理方法。

本领域技术人员可以理解，图5中示出的结构，仅仅是与本公开实施例方案相关的部分结构的框图，并不构成对本公开实施例方案所应用于其上的计算机设备的限定，具体的计算机设备可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

在一个实施例中，还提供了一种计算机设备，包括存储器和处理器，存储器中存储有计算机程序，该处理器执行计算机程序时实现上述各方法实施例中的步骤。

在一个实施例中，提供了一种计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现上述各方法实施例中的步骤。

在一个实施例中，提供了一种计算机程序产品，包括计算机程序，该计算机程序被处理器执行时实现上述各方法实施例中的步骤。

需要说明的是，本公开实施例所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等)，均为经用户授权或者经过各方充分授权的信息和数据。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一非易失性计算机可读取存储介质中，该计算机程序在执行时，可包括如上述各方法的实施例的流程。其中，本公开实施例所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用，均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-Only Memory，ROM)、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(ReRAM)、磁变存储器(Magnetoresistive Random Access Memory，MRAM)、铁电存储器(Ferroelectric Random Access Memory，FRAM)、相变存储器(Phase Change Memory，PCM)、石墨烯存储器等。易失性存储器可包括随机存取存储器(Random Access Memory，RAM)或外部高速缓冲存储器等。作为说明而非局限，RAM可以是多种形式，比如静态随机存取存储器(Static Random Access Memory，SRAM)或动态随机存取存储器(Dynamic RandomAccess Memory，DRAM)等。本公开实施例所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等，不限于此。本公开实施例所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等，不限于此。

以上实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本公开实施例的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对本公开实施例专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本公开实施例构思的前提下，还可以做出若干变形和改进，这些都属于本公开实施例的保护范围。因此，本公开实施例的保护范围应以所附权利要求为准。

Claims

1.一种资源交互凭据的处理方法，其特征在于，所述方法包括：

获取资源交互凭据的图像；

2.根据权利要求1所述的方法，其特征在于，所述根据所述图像中的预设区域的数据确定所述资源交互凭据的凭据种类，包括：

获取资源交互凭据多个区域对应的凭据种类验证方式；

3.根据权利要求1所述的方法，其特征在于，所述根据所述图像中的预设区域的数据确定所述资源交互凭据的凭据种类，包括：

获取所述图像中的文本区域的边框长度数据；

4.根据权利要求1所述的方法，其特征在于，所述根据所述图像中的预设区域的数据确定所述资源交互凭据的凭据种类，包括：

获取所述图像中的标识区域个数和预设颜色区域个数；

5.根据权利要求1所述的方法，其特征在于，所述根据所述图像中的预设区域的数据确定所述资源交互凭据的凭据种类，包括：

获取所述图像中的预设区域的灰度数据；

6.根据权利要求1所述的方法，其特征在于，所述根据所述图像中的预设区域的数据确定所述资源交互凭据的凭据种类，包括：

获取所述图像中预设区域中的标识文本数据；

根据所述标识文本数据确定所述资源交互凭据的凭据种类。

7.根据权利要求1所述的方法，其特征在于，所述利用与所述凭据种类相匹配的文本识别模型获取所述图像中的文本信息，包括：

8.根据权利要求1所述的方法，其特征在于，所述获取资源交互凭据的图像，包括：

获取资源交互凭据的原始图像；

9.根据权利要求1所述的方法，其特征在于，所述文本识别模型的获取方式包括：

10.根据权利要求9所述的方法，其特征在于，所述获取资源交互凭据的样本图像数据包括：

获取资源交互凭据的初始样本图像数据；

11.一种资源交互凭据的处理装置，其特征在于，所述装置包括：

获取模块，用于获取资源交互凭据的图像；

12.一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，其特征在于，所述处理器执行所述计算机程序时实现权利要求1至10中任一项所述的资源交互凭据的处理方法的步骤。