CN113392835A

CN113392835A - 票据识别模型的训练方法、票据识别方法及装置

Info

Publication number: CN113392835A
Application number: CN202110674751.1A
Authority: CN
Inventors: 程鼎刚; 刘炼; 霍志翠; 陈涛
Original assignee: Industrial and Commercial Bank of China Ltd ICBC
Current assignee: Industrial and Commercial Bank of China Ltd ICBC
Priority date: 2021-06-17
Filing date: 2021-06-17
Publication date: 2021-09-14

Abstract

本公开提供了一种票据识别模型的训练方法，可以应用于金融领域及人工智能技术领域。该票据识别模型的训练方法包括：获取样本数据集，其中，样本数据集中包括样本图像组，样本图像组中包括真实票据图像和与真实票据图像相关联的虚假票据图像；将虚假票据图像输入待训练票据识别模型的生成器，将真实票据图像输入待训练票据识别模型的鉴别器，以便利用样本数据集训练待训练票据识别模型，得到训练完成的票据识别模型；其中，生成器和鉴别器是基于实例正则化层构建得到的。本公开还提供了一种票据识别方法、票据识别模型的训练装置、票据识别装置、设备、存储介质和程序产品。

Description

票据识别模型的训练方法、票据识别方法及装置

技术领域

本公开涉及金融领域及人工智能技术领域，更具体地，涉及一种票据识别模型训练方法、票据识别方法及装置。

背景技术

票据类业务是银行的核心业务之一，票据类业务通常伴随这各种各样的形式，不同票据业务之间的处理规则和逻辑无通用规律可循，彼此之前无法实现互联互通。现如今银行黑产越发猖獗，虚假票据充斥于各种线上票据办理业务中，给银行针对票据进行审核、办理、拒绝等处理带来了额外的人力及财力成本，大幅度降低业务办理效率，同时也给用户带来了极差的体验感。

相关技术中通常采用人工鉴别票据真假的方式，在实现本公开构思的过程中，发明人发现相关技术中存在人工鉴别的成本较高且准确率较低的问题。

发明内容

有鉴于此，本公开提供了一种票据识别模型的训练方法、票据识别方法、票据识别模型的训练装置、票据识别装置、设备、存储介质和程序产品。

本公开的一个方面提供了一种票据识别模型的训练方法，包括：

获取样本数据集，其中，上述样本数据集中包括样本图像组，上述样本图像组中包括真实票据图像和与上述真实票据图像相关联的虚假票据图像；

将上述虚假票据图像输入待训练票据识别模型的生成器，将上述真实票据图像输入上述待训练票据识别模型的鉴别器，以便利用上述样本数据集训练上述待训练票据识别模型，得到训练完成的票据识别模型；

其中，上述生成器和上述鉴别器是基于实例正则化层构建得到的。

根据本公开的实施例，上述第一特征提取模块适用于对输入的图像数据执行以下操作：

利用上述图像数据的自身数据对上述图像数据进行插值上采样，输出第一图像数据；

将上述第一图像数据输入上述第一卷积层，输出第二图像数据；

将上述第二图像数据输入上述实例正则化层，输出第三图像数据。

根据本公开的实施例，上述将上述第二图像数据输入上述实例正则化层，输出第三图像数据包括：

根据上述第二图像数据的高和宽，计算得到第一数据；

根据上述第一数据、上述第二图像数据计算得到第二数据；

根据上述第一数据和上述第二数据，生成上述第三图像数据。

根据本公开的实施例，上述鉴别器包括第二特征提取模块，上述第二特征提取模块包括：

第三特征提取子模块，包括依次级联的第二卷积、第二实例正则化层和第一带泄露修正激活函数层；

第四特征提取子模块，包括依次级联的第三卷积、第三实例正则化层和第二带泄露修正激活函数层；

第五特征提取子模块，包括依次级联的第四卷积、第四实例正则化层和第三带泄露修正激活函数层。

根据本公开的实施例，上述将上述虚假票据图像输入待训练票据识别模型的生成器，将上述真实票据图像输入上述待训练票据识别模型的鉴别器，以便利用上述训练样本数据集训练上述待训练票据识别模型，得到训练好的票据识别模型包括：

将上述虚假票据图像输入上述生成器，输出去伪票据图像；

将上述去伪票据图像和上述真实票据图像输入上述鉴别器，以便判断上述去伪票据图像和上述真实票据图像的特征差异，得到差异信息；

上述生成器根据上述差异信息调整网络参数，直至上述差异信息满足预设条件。

根据本公开的实施例，上述差异信息包括第一差异信息和第二差异信息；其中，

上述第一差异信息包括基于一张上述真实票据图像和一张上述去伪票据图像得到的差异信息；

上述第二差异信息包括基于多张上述真实票据图像和多张上述去伪票据图像得到的差异信息。

根据本公开的实施例，上述票据识别模型的训练方法还包括：

获取增强样本数据集，以便利用上述增强样本数据集对上述生成器进行增强训练，其中，上述增强样本数据集中的增强训练样本包括上述去伪票据图像。

根据本公开的实施例，上述第二卷积层包括128个卷积核，其中，上述卷积核的尺寸为3×3，步长为2；

上述第三卷积层包括256个卷积核，其中，上述卷积核的尺寸为3×3，步长为2；

上述第四卷积层包括512个卷积核，其中，上述卷积核的尺寸为3×3，步长为1。

本公开的另一个方面提供了一种票据识别方法，包括：

获取待识别票据图像；

将上述待识别票据图像输入票据识别模型，输出识别结果，其中，上述识别结果表征上述待识别票据图像是真实票据图像或虚假票据图像，上述票据识别模型由本公开提供的票据识别模型的训练方法训练得到。

本公开的另一个方面提供了一种票据识别模型的训练装置，包括：

第一获取模块，用于获取样本数据集，其中，上述样本数据集中包括样本图像组，上述样本图像组中包括真实票据图像和与上述真实票据图像相关联的虚假票据图像；

训练模块，用于将上述虚假票据图像输入待训练票据识别模型的生成器，将上述真实票据图像输入上述待训练票据识别模型的鉴别器，以便利用上述样本数据集训练上述待训练票据识别模型，得到训练完成的票据识别模型；

本公开的另一个方面提供了一种票据识别装置，包括：

第二获取模块，用于获取待识别票据图像；

识别模块，用于将上述待识别票据图像输入票据识别模型，输出识别结果，其中，上述识别结果表征上述待识别票据图像是真实票据图像或虚假票据图像，上述票据识别模型由本公开提供的票据识别模型的训练方法训练得到。

本公开的另一方面提供了电子设备，包括：一个或多个处理器；存储器，用于存储一个或多个指令，其中，当所述一个或多个指令被所述一个或多个处理器执行时，使得所述一个或多个处理器实现如上所述的方法。

本公开的另一方面提供了一种计算机可读存储介质，存储有计算机可执行指令，所述指令在被执行时用于实现如上所述的方法。

本公开的另一方面提供了一种计算机程序产品，所述计算机程序产品包括计算机可执行指令，所述指令在被执行时用于实现如上所述的方法。

在本公开的实施例中，通过利用虚假票据图像和与虚假票据图像相关联的真实票据图像训练待训练的票据识别模型，得到训练完成的票据识别模型。因此在利用训练完成的票据识别模型进行票据识别时，可以至少部分地克服相关技术中存在的识别成本高且准确率低的技术问题，实现了降低识别成本、提高识别准确率的技术效果。

附图说明

通过以下参照附图对本公开实施例的描述，本公开的上述以及其他目的、特征和优点将更为清楚，在附图中：

图1示意性示出了根据本公开实施例的可以应用票据识别模型的训练方法、票据识别方法、票据识别模型的训练装置、票据识别装置的示例性系统架构；

图2示意性示出了根据本公开实施例的票据识别模型的训练方法的流程图；

图3示意性示出了相关技术中对待卷积图像数据进行反卷积的示意图；

图4示意性示出了根据本公开实施例的第一特征提取模块对输入的图像数据执行的操作的流程图；

图5示意性示出了根据本公开实施例的利用图像数据的自身数据对图像数据进行插值上采样，输出第一图像数据的示意图；

图6示意性示出了根据本公开实施例的将第二图像数据输入实例正则化层，输出第三图像数据的流程图；

图7示意性示出了根据本公开实施例的生成器的结构示意图；

图8示意性示出了根据本公开实施例的鉴别器的结构示意图；

图9示意性示出了根据本公开实施例的将虚假票据图像输入待训练票据识别模型的生成器，将真实票据图像输入待训练票据识别模型的鉴别器，以便利用训练样本数据集训练待训练票据识别模型，得到训练好的票据识别模型的流程图；

图10示意性示出了根据本公开实施例的票据识别方法的流程图；

图11示意性示出了根据本公开的实施例的票据识别模型的训练装置的框图；

图12示意性示出了根据本公开的实施例的票据识别装置的框图；以及

图13示意性示出了根据本公开实施例的适于实现票据识别模型的训练方法、票据识别方法的电子设备的框图。

具体实施方式

以下，将参照附图来描述本公开的实施例。但是应该理解，这些描述只是示例性的，而并非要限制本公开的范围。在下面的详细描述中，为便于解释，阐述了许多具体的细节以提供对本公开实施例的全面理解。然而，明显地，一个或多个实施例在没有这些具体细节的情况下也可以被实施。此外，在以下说明中，省略了对公知结构和技术的描述，以避免不必要地混淆本公开的概念。

在此使用的术语仅仅是为了描述具体实施例，而并非意在限制本公开。在此使用的术语“包括”、“包含”等表明了所述特征、步骤、操作和/或部件的存在，但是并不排除存在或添加一个或多个其他特征、步骤、操作或部件。

在此使用的所有术语(包括技术和科学术语)具有本领域技术人员通常所理解的含义，除非另外定义。应注意，这里使用的术语应解释为具有与本说明书的上下文相一致的含义，而不应以理想化或过于刻板的方式来解释。

在使用类似于“A、B和C等中至少一个”这样的表述的情况下，一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如，“具有A、B和C中至少一个的系统”应包括但不限于单独具有A、单独具有B、单独具有C、具有A和B、具有A和C、具有B和C、和/或具有A、B、C的系统等)。在使用类似于“A、B或C等中至少一个”这样的表述的情况下，一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如，“具有A、B或C中至少一个的系统”应包括但不限于单独具有A、单独具有B、单独具有C、具有A和B、具有A和C、具有B和C、和/或具有A、B、C的系统等)。

近年来，各金融机构线上办理银行业务的数量呈喷口式暴增，其中，线上业务中的票据类业务是核心业务之一。

票据类业务通常伴随着各种各样的形式，不同票据业务之间的处理规则和逻辑无通用规律可循，彼此之间无法实现互联互通。现如今银行黑产越发猖獗，充斥着各种线上票据办理业务，给银行针对票据进行审核、办理、拒绝等处理带来了额外的人力及财力成本，大幅度降低业务办理效率，同时也给用户带来了极差的体验感。

随着人工智能领域与金融场景的深度融合，使得线上票据的自动识别、审批带来了巨大可能性。但基于模型的票据图像鉴伪方法会依赖于大量的票据数据集，虽然银行领域有大量票据的存根，但对于虚假票据图像仍然是缺失的，从而给训练模型的鲁棒性带来了瓶颈。针对上述问题，相关技术中的图像去伪方法大都基于模拟估计未知虚假核，但在银行实际处理场景中，虚假票据的虚假核基本都是未知的，充分挖掘和利用图像先验知识成为解决虚假票据鉴别问题的关键。但由此会带来昂贵的计算成本，并且虚假票据会产生棋盘伪影现象，因此训练好的模型存在缺乏良好模型泛化能力、图像细节和纹理信息恢复不佳等多个问题。

为了至少部分地解决相关技术中存在的技术问题，本公开提供了一种票据识别模型的训练方法，可以应用于金融领域及人工智能技术领域。该票据识别模型的训练方法包括：获取样本数据集，其中，样本数据集中包括样本图像组，样本图像组中包括真实票据图像和与真实票据图像相关联的虚假票据图像；将虚假票据图像输入待训练票据识别模型的生成器，将真实票据图像输入待训练票据识别模型的鉴别器，以便利用样本数据集训练待训练票据识别模型，得到训练完成的票据识别模型；其中，生成器和鉴别器是基于实例正则化层构建得到的。本公开还提供了一种票据识别方法、票据识别模型的训练装置、票据识别装置、设备、存储介质和程序产品。

图1示意性示出了根据本公开实施例的可以应用票据识别模型的训练方法、票据识别方法、票据识别模型的训练装置、票据识别装置的示例性系统架构100。需要注意的是，图1所示仅为可以应用本公开实施例的系统架构的示例，以帮助本领域技术人员理解本公开的技术内容，但并不意味着本公开实施例不可以用于其他设备、系统、环境或场景。

如图1所示，根据该实施例的系统架构100可以包括终端设备101、102、103，网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型，例如有线和/或无线通信链路等等。

用户可以使用终端设备101、102、103通过网络104与服务器105交互，以接收或发送消息等。终端设备101、102、103上可以安装有各种通讯客户端应用，例如购物类应用、网页浏览器应用、搜索类应用、即时通信工具、邮箱客户端和/或社交平台软件等(仅为示例)。

终端设备101、102、103可以是具有显示屏并且支持网页浏览的各种电子设备，包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。

服务器105可以是提供各种服务的服务器，例如对用户利用终端设备101、102、103所浏览的网站提供支持的后台管理服务器(仅为示例)。后台管理服务器可以对接收到的用户请求等数据进行分析等处理，并将处理结果(例如根据用户请求获取或生成的网页、信息、或数据等)反馈给终端设备。

需要说明的是，本公开实施例所提供的票据识别模型的训练方法、票据识别方法一般可以由服务器105执行。相应地，本公开实施例所提供的票据识别模型的训练装置、票据识别装置一般可以设置于服务器105中。本公开实施例所提供的票据识别模型的训练方法、票据识别方法也可以由不同于服务器105且能够与终端设备101、102、103和/或服务器105通信的服务器或服务器集群执行。相应地，本公开实施例所提供的票据识别模型的训练装置、票据识别装置也可以设置于不同于服务器105且能够与终端设备101、102、103和/或服务器105通信的服务器或服务器集群中。或者，本公开实施例所提供的票据识别模型的训练方法、票据识别方法也可以由终端设备101、102、或103执行，或者也可以由不同于终端设备101、102、或103的其他终端设备执行。相应地，本公开实施例所提供的票据识别模型的训练装置、票据识别装置也可以设置于终端设备101、102、或103中，或设置于不同于终端设备101、102、或103的其他终端设备中。

例如，样本数据集可以原本存储在终端设备101、102、或103中的任意一个(例如，终端设备101，但不限于此)之中，或者存储在外部存储设备上并可以导入到终端设备101中。然后，终端设备101可以在本地执行本公开实施例所提供的票据识别模型的训练方法，或者将样本数据集发送到其他终端设备、服务器、或服务器集群，并由接收该样本数据集的其他终端设备、服务器、或服务器集群来执行本公开实施例所提供的票据识别模型的训练方法。

应该理解，图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要，可以具有任意数目的终端设备、网络和服务器。

图2示意性示出了根据本公开实施例的票据识别模型的训练方法的流程图。

需要说明的是，本公开实施例中的流程图所示的操作除非明确说明不同操作之间存在执行的先后顺序，或者不同操作在技术实现上存在执行的先后顺序，否则，多个操作之间的执行顺序可以不分先后，多个操作也可以同时执行。

如图2所示，该方法包括操作S201～S202。

在操作S201，获取样本数据集，其中，样本数据集中包括样本图像组，样本图像组中包括真实票据图像和与真实票据图像相关联的虚假票据图像。

根据本公开的实施例，真实票据图像可以包括对纸质票据进行拍照所生成的票据图像，但不限于此，真实票据图像还可以包括电子票据图像。

根据本公开的实施例，虚假票据图像可以包括对真实票据图像添加随机噪声而生成的票据图像。

根据本公开的实施例，例如样本数据集中包括样本图像组P＝{pg₁，pg₂}，其中，pg₁可以表示真实票据图像，pg₂可以表示与真实票据图像相关联的虚假票据图像。

在操作S202，将虚假票据图像输入待训练票据识别模型的生成器，将真实票据图像输入待训练票据识别模型的鉴别器，以便利用样本数据集训练待训练票据识别模型，得到训练完成的票据识别模型。

根据本公开的实施例，可以随机在样本数据集中选取一个样本图像组，然后将样本图像组中的虚假票据图像输入待训练票据识别模型的生成器，然后将样本图像组中的真实票据图像输入待训练票据识别模型的鉴别器。

根据本公开的实施例，生成器和鉴别器是基于实例正则化层构建得到的。

根据本公开的实施例，对于实例正则化层的具体介绍将在下文中详述，此处不做具体限定。

根据本公开的实施例，生成器包括第一特征提取模块，第一特征提取模块包括依次级联的上采样层、第一卷积层、第一实例正则化层。

下面参考图3～图10，结合具体实施例对图2所示的方法做进一步说明。

图3示意性示出了相关技术中对待卷积图像数据进行反卷积的示意图。

如图3所示，在相关技术中，在对待卷积图像数据301进行反卷积操作时，通常使用函数库中的Conv2DTranspose函数做反卷积。该函数由两个步骤组成，首先，对待卷积图像数据301进行0扩充，即在待卷积图像数据中相邻两元素之间插入0，生成扩充图像数据302，其中，插入的0的个数与反卷积的步长相关，从而达到对待卷积图像数据301进行扩充的效果。然后，对扩充图像数据进行卷积，即对扩充图像数据302用反卷积的卷积核进行卷积运算。

由于在对待卷积图像数据301进行扩充时，在待卷积图像数据中相邻两元素之间插入0，从而使得扩充图像数据302中的元素被插入的0分割，这样的处理使得对图像进行反卷积后会导致最终生成的图像产生棋盘伪影现象，即在图像上产生一些类似于棋盘的方格。

在用带有棋盘伪影现象的图像数据进行模型训练时，会很大程度上影响模型的训练精度，因此，本公开实施例提供提供了一种新的图像生成方法。

图4示意性示出了根据本公开实施例的第一特征提取模块对输入的图像数据执行的操作的流程图。

如图4所示，该方法包括操作S401～S403。

在操作S401，利用图像数据的自身数据对图像数据进行插值上采样，输出第一图像数据。

在操作S402，将第一图像数据输入第一卷积层，输出第二图像数据。

图5示意性示出了根据本公开实施例的利用图像数据的自身数据对图像数据进行插值上采样，输出第一图像数据的示意图。

根据本公开的实施例，如图5所示，在对图像数据501进行插值上采样时，可以首先将图像数据501按照高度和宽度进行复制，生成复制图像数据502，然后利用复制图像数据502的数据对图像数据501进行插值，生成经过上采样的第一图像数据503。

根据本公开的实施例，由于在对图像数据501进行插值上采样时，利用的是图像数据501本身的数据，因此生成的第一图像数据503与图像数据501是相似的，从而即可避免基于第一图像数据503进行卷积运算得到的图像数据产生棋盘伪影现象，进而实现了提高生成器所生成的去伪图像的清晰度的效果。

在操作S403，将第二图像数据输入实例正则化层，输出第三图像数据。

根据本公开的实施例，票据识别模型的训练方法还包括以下操作：

获取增强样本数据集，以便利用增强样本数据集对生成器进行增强训练，其中，增强样本数据集中的增强训练样本包括去伪票据图像。

根据本公开的实施例，由于生成器在对虚假票据图像进行插值上采样时，利用的是虚假票据图像本身的数据，因此输出的去伪图像较为清晰，因此可以利用生成器输出的去伪图像生成增强样本数据集，以便对生成器进行增强训练，解决了相关技术中生成器缺少训练样本的技术问题。

相关技术中，通常利用Batch Normalization对第二图像数据进行处理。BatchNormalization的工作原理如以下公式(1)所示。

其中，μ_B可以表示一个batch中所有图像数据的均差，

可以表示一个batch中所有图像数据的方差，

可以表示对一个batch中的图像数据利用Batch Normalization处理过后的图像数据，λ和β可以表示正则化因子，y_i表示对所有batch中的图像利用BatchNormalization处理过后的图像数据。

从公式(1)中可以看出，Batch Normalization注重对每个batch进行正则化，以保证数据分布一致，导致最终生成器生成的图像和整体训练的数据集的整体分布之间存在密切联系，每一个图像数据均会受到同一个batch中其他图像数据的影响。

然而，在本公开的实施例中，要使生成器输出的去伪图像尽可能的清晰。然而在进行图像去模糊的过程中，生成器的输出主要依赖于某个图像数据，而与整个batch中的图像分布没有关系，因此，本公开实施例提出了一种新的实例正则化方法。

图6示意性示出了根据本公开实施例的将第二图像数据输入实例正则化层，输出第三图像数据的流程图。

如图6所示，该方法包括操作S601～S603。

在操作S601，根据第二图像数据的高和宽，计算得到第一数据。

在操作S602，根据第一数据、第二图像数据，计算得到第二数据。

在操作S603，根据第一数据和第二数据，生成第三图像数据。

根据本公开的实施例，第一数据可以包括均值数据，第二数据可以包括方差数据。

根据本公开的实施例，以上处理过程可以用以下公式(2)表示。

其中，X_hwn表示第二图像数据，H表示第二图像数据的高度，W表示第二图像数据的宽度，μ表示第二图像数据X_hwn从H和W维度计算得到的均值数据。σ²表示第二图像数据X_hwn的方差数据，

表示对X_hwn实例正则化后生成的第三图像数据，ε表示常数因子，避免图像正则化过度。

从公式(2)可以看出，实例正则化层是将一个batch中的每张图像分别进行实例正则化处理，从而使得每张图像均满足均值为μ，方差为σ²的正态分布，然后将示例正则化后的图像作为鉴别器的输入，不但可保证票据识别模型加速收敛，还可以是每一张图像不受同一批次中其他图像的影响，从而保证每张图像的独立性。

图7示意性示出了根据本公开实施例的生成器的结构示意图。

如图7所示，生成器还包括第三特征提取模块701、第四特征提取模块702、第五特征提取模块703、残差模块704、第一特征提取模块705、第六特征提取模块706和第七特征提取模块707。其中，n64s1可以表示第三特征提取模块中的第六卷积层由64个大小为3x3，步长为1的卷积核组成，同理，第四特征提取模块的n128s2可以表示第四特征提取模块中的第七卷积层由128个大小为3x3，步长为2的卷积核组成。

根据本公开的实施例，第三特征提取模块701包括依次连接的第一填充层1(ReflectionPadding2D)、第五卷积层2(Conv2D)、第五实例正则化层3(InstanceNorm)以及第一修正线性激活函数层(Relu)4。

根据本公开的实施例，第四特征提取模块702包括依次连接的卷积层21、实例正则化层3和修正线性激活函数层4。

根据本公开的实施例，第五特征提取模块703包括依次连接的卷积层22、实例正则化层4和修正线性激活函数层5。

如图7所示，残差模块704包括9个残差网络，以便更深层次地提取图像特征。其中，每一个残差网络中均可以包括依次级联的填充层(ReflectionPadding2D)、卷积层(Conv2D)、实例正则化层(InstanceNorm)以及修正线性激活函数层(Relu)。

根据本公开的实施例，第六特征提取模块706包括依次级联的填充层1、卷积层24、实例正则化层3以及修正线性激活函数层4。

根据本公开的实施例，第七特征提取模块707包括依次级联的填充层1、卷积层25以及修正线性激活函数层4。

根据本公开的实施例，鉴别器包括第二特征提取模块，第二特征提取模块包括第三特征提取子模块、第四特征提取子模块和第五特征提取子模块。

第三特征提取子模块，包括依次级联的第二卷积、第二实例正则化层和第一带泄露修正激活函数层。

第四特征提取子模块，包括依次级联的第三卷积、第三实例正则化层和第二带泄露修正激活函数层。

根据本公开的实施例，第二卷积层包括128个卷积核，其中，卷积核的尺寸为3×3，步长为2；

第三卷积层包括256个卷积核，其中，卷积核的尺寸为3×3，步长为2；

第四卷积层包括512个卷积核，其中，卷积核的尺寸为3×3，步长为1。

根据本公开的实施例，第一带泄露修正激活函数层(Leaky ReLU)、第二带泄露修正激活函数层(Leaky ReLU)和第三带泄露修正激活函数层(Leaky ReLU)均可以用以下公式(3)表示。

其中，X_i表示输入带泄露修正激活函数层的图像数据，y_i表示带泄露修正激活函数层输出的图像数据，α_i表示修正系数，取值从0到正无穷。

根据本公开的实施例，参照上述公式(3)，图像数据输入带泄露修正激活函数层后，若图像数据小于0，则将其赋值为以α_i作为斜率与x_i做乘积作为修正，可以使鉴别器变得更加强大，间接提高模型效果。

图8示意性示出了根据本公开实施例的鉴别器的结构示意图。

如图8所示，鉴别器包括依次级联的第七特征提取模块801、第二特征提取模块802、输出模块803。

根据本公开的实施例，第七特征提取模块的输入包括真实票据图像以及生成器输出的去伪票据图像。第七特征模块包括依次级联的第六卷积层(Conv2D)26以及第四带泄露修正激活函数层5。

根据本公开的实施例，输出模块803包括依次级联的第七卷积层27、Tanh激活函数层7以及Sigmoid激活函数层8。

根据本公开的实施例，鉴别器可以利用输出模块将第二特征提取模块802提取的图像局部特征进行整合，形成一张完整图图像，然后使用Sigmoid激活函数对每一个可能的输出给定一个概率值并根据该值最大的可能性输出图像最有可能的分类。例如，输出模块803输出去伪图像是真实票据图像的概率为70％，去伪图像是虚假票据图像的概率为30％，则鉴别器的输出为真，表示经过鉴别器的鉴别，认为去伪图像是真实票据图像。

图9示意性示出了根据本公开实施例的将虚假票据图像输入待训练票据识别模型的生成器，将真实票据图像输入待训练票据识别模型的鉴别器，以便利用训练样本数据集训练待训练票据识别模型，得到训练好的票据识别模型的流程图。

如图9所示，该方法包括操作S901～S903。

在操作S901，将虚假票据图像输入生成器，输出去伪票据图像。

在操作S902，将去伪票据图像和真实票据图像输入鉴别器，以便判断去伪票据图像和真实票据图像的特征差异，得到差异信息。

在操作S903，生成器根据差异信息调整网络参数，直至差异信息满足预设条件。

根据本公开的实施例，差异信息包括第一差异信息和第二差异信息；其中，

第一差异信息包括基于一张真实票据图像和一张去伪票据图像得到的差异信息；

第二差异信息包括基于多张真实票据图像和多张去伪票据图像得到的差异信息。

根据本公开的实施例，第一差异信息可以包括票据识别模型的对抗损失信息，对抗损失信息可以利用以下公式(4)表示。

其中，L_adversarial表示对抗损失信息，I^B表示虚假票据图像，G表示生成器，D表示鉴别器，N为一个batch中虚假票据图像的数量。

上式可理解为输入一批次虚假票据图像，虚假票据图像首先经过生成器的处理，输出去伪图像，然后将去伪图像作为鉴别器的输入，通过鉴别器的判断可以得出该图像的真伪。通过将一个批次的图像做平均就可以得出一个批次中票据图像识别模型的输入图像到输出图像之间的对抗损失。换句话说，其本质就是生成器希望生成的图像和真是票据图像之间的差距越来越小。

根据本公开的实施例，第二差异信息可以包括票据识别模型的内容损失信息，内容损失信息可以利用以下公式(5)表示。

其中，L_content表示内容损失信息，μ_ij表示通过第i个上采样之前的第j个卷积层处理过后所得到的特征映射，W_i，j和H_i，j是特征映射的维度。

根据本公开的实施例，μ_ij可以采用预训练好的VGG19网络。

根据本公开的实施例，通过以上公式(5)，可计算出一张虚假票据图像经过生成器处理后输出的一张去伪图像与一张真实图像之间特征映射的差异。经过多次的迭代训练，每次反向传播更新票据识别模型的权重和偏置，最终使得生成器生成的去伪图像和真实票据图像之间的差异越来越小，就能得到一个训练良好的鉴别器网络，从而实现将任意票据图像输入鉴别器均能准确判断该票据图像的真伪的效果。

图10示意性示出了根据本公开实施例的票据识别方法的流程图。

如图10所示，该方法包括操作S1001～S1002。

在操作S1001，获取待识别票据图像。

在操作S1002，将待识别票据图像输入票据识别模型，输出识别结果，其中，识别结果表征待识别票据图像是真实票据图像或虚假票据图像，票据识别模型由本公开实施例提供的票据识别模型的训练方法训练得到。

图11示意性示出了根据本公开的实施例的票据识别模型的训练装置的框图。

如图11所示，票据识别模型的训练装置1100包括第一获取模块1101、训练模块1102。

第一获取模块1101，用于获取样本数据集，其中，样本数据集中包括样本图像组，样本图像组中包括真实票据图像和与真实票据图像相关联的虚假票据图像。

训练模块1102，用于将虚假票据图像输入待训练票据识别模型的生成器，将真实票据图像输入待训练票据识别模型的鉴别器，以便利用样本数据集训练待训练票据识别模型，得到训练完成的票据识别模型。

根据本公开的实施例，训练模块1102包括上采样单元、第一处理单元和第二处理单元。

上采样单元，用于利用图像数据的自身数据对图像数据进行插值上采样，输出第一图像数据。

第一处理单元，用于将第一图像数据输入第一卷积层，输出第二图像数据。

第二处理单元，用于将第二图像数据输入实例正则化层，输出第三图像数据。

根据本公开的实施例，训练模块1102还包括第一计算单元、第二计算单元和生成单元。

第一计算单元，用于根据第二图像数据的高和宽，计算得到第一数据。

第二计算单元，用于根据第一数据、图像数据计算得到第二数据。

生成单元，用于根据第一数据和第二数据，生成第三图像数据。

根据本公开的实施例，鉴别器包括第二特征提取模块，第二特征提取模块包括：

第五特征提取子模块，包括依次级联的第四卷积、第四实例正则化层和带第三带泄露修正激活函数层。

根据本公开的实施例，训练模块1102还包括第一训练单元、第二训练单元和第三训练单元。

第一训练单元，用于将虚假票据图像输入生成器，输出去伪票据图像。

第二训练单元，用于将去伪票据图像和真实票据图像输入鉴别器，以便判断去伪票据图像和真实票据图像的特征差异，得到差异信息。

第三训练单元，用于生成器根据差异信息调整网络参数，直至差异信息满足预设条件。

根据本公开的实施例，票据识别模型的训练装置1100还包括第三获取模块。

第三获取模块，用于获取增强样本数据集，以便利用增强样本数据集对生成器进行增强训练，其中，增强样本数据集中的增强训练样本包括去伪票据图像。

图12示意性示出了根据本公开的实施例的票据识别装置的框图。

如图12所示，票据识别装置的训练装置1200包括第二获取模块1201、识别模块1202。

第二获取模块1201，用于获取待识别票据图像。

识别模块1202，用于将待识别票据图像输入票据识别模型，输出识别结果，其中，识别结果表征待识别票据图像是真实票据图像或虚假票据图像，票据识别模型由本公开实施例提供的票据识别模型的训练方法训练得到。

根据本公开的实施例的模块、子模块、单元、子单元中的任意多个、或其中任意多个的至少部分功能可以在一个模块中实现。根据本公开实施例的模块、子模块、单元、子单元中的任意一个或多个可以被拆分成多个模块来实现。根据本公开实施例的模块、子模块、单元、子单元中的任意一个或多个可以至少被部分地实现为硬件电路，例如现场可编程门阵列(FPGA)、可编程逻辑阵列(PLA)、片上系统、基板上的系统、封装上的系统、专用集成电路(ASIC)，或可以通过对电路进行集成或封装的任何其他的合理方式的硬件或固件来实现，或以软件、硬件以及固件三种实现方式中任意一种或以其中任意几种的适当组合来实现。或者，根据本公开实施例的模块、子模块、单元、子单元中的一个或多个可以至少被部分地实现为计算机程序模块，当该计算机程序模块被运行时，可以执行相应的功能。

例如，第一获取模块1101、训练模块1102、第二获取模块1201、识别模块1202中的任意多个可以合并在一个模块/单元/子单元中实现，或者其中的任意一个模块/单元/子单元可以被拆分成多个模块/单元/子单元。或者，这些模块/单元/子单元中的一个或多个模块/单元/子单元的至少部分功能可以与其他模块/单元/子单元的至少部分功能相结合，并在一个模块/单元/子单元中实现。根据本公开的实施例，第一获取模块1101、训练模块1102、第二获取模块1201、识别模块1202中的至少一个可以至少被部分地实现为硬件电路，例如现场可编程门阵列(FPGA)、可编程逻辑阵列(PLA)、片上系统、基板上的系统、封装上的系统、专用集成电路(ASIC)，或可以通过对电路进行集成或封装的任何其他的合理方式等硬件或固件来实现，或以软件、硬件以及固件三种实现方式中任意一种或以其中任意几种的适当组合来实现。或者，第一获取模块1101、训练模块1102、第二获取模块1201、识别模块1202中的至少一个可以至少被部分地实现为计算机程序模块，当该计算机程序模块被运行时，可以执行相应的功能。

需要说明的是，本公开的实施例中票据识别模型的训练装置部分与本公开的实施例中票据识别模型的训练方法部分是相对应的，票据识别模型的训练装置部分的描述具体参考票据识别模型的训练方法部分，在此不再赘述。

图13示意性示出了根据本公开实施例的适于实现上文描述的方法的电子设备的框图。图13示出的电子设备仅仅是一个示例，不应对本公开实施例的功能和使用范围带来任何限制。

如图13所示，根据本公开实施例的电子设备1300包括处理器1301，其可以根据存储在只读存储器(ROM)1302中的程序或者从存储部分1308加载到随机访问存储器(RAM)1303中的程序而执行各种适当的动作和处理。处理器1301例如可以包括通用微处理器(例如CPU)、指令集处理器和/或相关芯片组和/或专用微处理器(例如，专用集成电路(ASIC))，等等。处理器1301还可以包括用于缓存用途的板载存储器。处理器1301可以包括用于执行根据本公开实施例的方法流程的不同动作的单一处理单元或者是多个处理单元。

在RAM 1303中，存储有电子设备1300操作所需的各种程序和数据。处理器1301、ROM 1302以及RAM 1303通过总线1304彼此相连。处理器1301通过执行ROM 1302和/或RAM1303中的程序来执行根据本公开实施例的方法流程的各种操作。需要注意，所述程序也可以存储在除ROM 1302和RAM 1303以外的一个或多个存储器中。处理器1301也可以通过执行存储在所述一个或多个存储器中的程序来执行根据本公开实施例的方法流程的各种操作。

根据本公开的实施例，电子设备1300还可以包括输入/输出(I/O)接口1305，输入/输出(I/O)接口1305也连接至总线1304。电子设备1300还可以包括连接至I/O接口1305的以下部件中的一项或多项：包括键盘、鼠标等的输入部分1306；包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分1307；包括硬盘等的存储部分1308；以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分1309。通信部分1309经由诸如因特网的网络执行通信处理。驱动器1310也根据需要连接至I/O接口1305。可拆卸介质1311，诸如磁盘、光盘、磁光盘、半导体存储器等等，根据需要安装在驱动器1310上，以便于从其上读出的计算机程序根据需要被安装入存储部分1308。

根据本公开的实施例，根据本公开实施例的方法流程可以被实现为计算机软件程序。例如，本公开的实施例包括一种计算机程序产品，其包括承载在计算机可读存储介质上的计算机程序，该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中，该计算机程序可以通过通信部分1309从网络上被下载和安装，和/或从可拆卸介质1311被安装。在该计算机程序被处理器1301执行时，执行本公开实施例的系统中限定的上述功能。根据本公开的实施例，上文描述的系统、设备、装置、模块、单元等可以通过计算机程序模块来实现。

本公开还提供了一种计算机可读存储介质，该计算机可读存储介质可以是上述实施例中描述的设备/装置/系统中所包含的；也可以是单独存在，而未装配入该设备/装置/系统中。上述计算机可读存储介质承载有一个或者多个程序，当上述一个或者多个程序被执行时，实现根据本公开实施例的方法。

根据本公开的实施例，计算机可读存储介质可以是非易失性的计算机可读存储介质。例如可以包括但不限于：便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中，计算机可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。

例如，根据本公开的实施例，计算机可读存储介质可以包括上文描述的ROM 1302和/或RAM 1303和/或ROM 1302和RAM 1303以外的一个或多个存储器。

本公开的实施例还包括一种计算机程序产品，其包括计算机程序，该计算机程序包含用于执行本公开实施例所提供的方法的程序代码，当计算机程序产品在电子设备上运行时，该程序代码用于使电子设备实现本公开实施例所提供的字符识别模型的训练方法和字符识别方法。

在该计算机程序被处理器1301执行时，执行本公开实施例的系统/装置中限定的上述功能。根据本公开的实施例，上文描述的系统、装置、模块、单元等可以通过计算机程序模块来实现。

在一种实施例中，该计算机程序可以依托于光存储器件、磁存储器件等有形存储介质。在另一种实施例中，该计算机程序也可以在网络介质上以信号的形式进行传输、分发，并通过通信部分1309被下载和安装，和/或从可拆卸介质1311被安装。该计算机程序包含的程序代码可以用任何适当的网络介质传输，包括但不限于：无线、有线等等，或者上述的任意合适的组合。

根据本公开的实施例，可以以一种或多种程序设计语言的任意组合来编写用于执行本公开实施例提供的计算机程序的程序代码，具体地，可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。程序设计语言包括但不限于诸如Java，C++，python，“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中，远程计算设备可以通过任意种类的网络，包括局域网(LAN)或广域网(WAN)，连接到用户计算设备，或者，可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。

附图中的流程图和框图，图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分，上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个接连地表示的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图或流程图中的每个方框、以及框图或流程图中的方框的组合，可以用执行规定的功能或操作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。本领域技术人员可以理解，本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合和/或结合，即使这样的组合或结合没有明确记载于本公开中。特别地，在不脱离本公开精神和教导的情况下，本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合和/或结合。所有这些组合和/或结合均落入本公开的范围。

以上对本公开的实施例进行了描述。但是，这些实施例仅仅是为了说明的目的，而并非为了限制本公开的范围。尽管在以上分别描述了各实施例，但是这并不意味着各个实施例中的措施不能有利地结合使用。本公开的范围由所附权利要求及其等同物限定。不脱离本公开的范围，本领域技术人员可以做出多种替代和修改，这些替代和修改都应落在本公开的范围之内。

Claims

1.一种票据识别模型的训练方法，包括：

获取样本数据集，其中，所述样本数据集中包括样本图像组，所述样本图像组中包括真实票据图像和与所述真实票据图像相关联的虚假票据图像；

将所述虚假票据图像输入待训练票据识别模型的生成器，将所述真实票据图像输入所述待训练票据识别模型的鉴别器，以便利用所述样本数据集训练所述待训练票据识别模型，得到训练完成的票据识别模型；

其中，所述生成器和所述鉴别器是基于实例正则化层构建得到的。

2.根据权利要求1所述的方法，其中，所述生成器包括第一特征提取模块，所述第一特征提取模块包括依次级联的上采样层、第一卷积层、第一实例正则化层。

3.根据权利要求2所述的方法，其中，所述第一特征提取模块适用于对输入的图像数据执行以下操作：

利用所述图像数据的自身数据对所述图像数据进行插值上采样，输出第一图像数据；

将所述第一图像数据输入所述第一卷积层，输出第二图像数据；

将所述第二图像数据输入所述实例正则化层，输出第三图像数据。

4.根据权利要求2所述的方法，其中，所述将所述第二图像数据输入所述实例正则化层，输出第三图像数据包括：

根据所述第二图像数据的高和宽，计算得到第一数据；

根据所述第一数据、所述第二图像数据计算得到第二数据；

根据所述第一数据和所述第二数据，生成所述第三图像数据。

5.根据权利要求1所述的方法，其中，所述鉴别器包括第二特征提取模块，所述第二特征提取模块包括：

6.根据权利要求1所述的方法，所述将所述虚假票据图像输入待训练票据识别模型的生成器，将所述真实票据图像输入所述待训练票据识别模型的鉴别器，以便利用所述训练样本数据集训练所述待训练票据识别模型，得到训练好的票据识别模型包括：

将所述虚假票据图像输入所述生成器，输出去伪票据图像；

将所述去伪票据图像和所述真实票据图像输入所述鉴别器，以便判断所述去伪票据图像和所述真实票据图像的特征差异，得到差异信息；

所述生成器根据所述差异信息调整网络参数，直至所述差异信息满足预设条件。

7.根据权利要求6所述的方法，其中，所述差异信息包括第一差异信息和第二差异信息；其中，

所述第一差异信息包括基于一张所述真实票据图像和一张所述去伪票据图像得到的差异信息；

所述第二差异信息包括基于多张所述真实票据图像和多张所述去伪票据图像得到的差异信息。

8.根据权利要求6所述的方法，还包括：

获取增强样本数据集，以便利用所述增强样本数据集对所述生成器进行增强训练，其中，所述增强样本数据集中的增强训练样本包括所述去伪票据图像。

9.根据权利要求5所述的方法，其中，

所述第二卷积层包括128个卷积核，其中，所述卷积核的尺寸为3×3，步长为2；

所述第三卷积层包括256个卷积核，其中，所述卷积核的尺寸为3×3，步长为2；

所述第四卷积层包括512个卷积核，其中，所述卷积核的尺寸为3×3，步长为1。

10.一种票据识别方法，包括：

获取待识别票据图像；

将所述待识别票据图像输入票据识别模型，输出识别结果，其中，所述识别结果表征所述待识别票据图像是真实票据图像或虚假票据图像，所述票据识别模型由权利要求1至9任一项所述的票据识别模型的训练方法训练得到。

11.一种票据识别模型的训练装置，包括：

第一获取模块，用于获取样本数据集，其中，所述样本数据集中包括样本图像组，所述样本图像组中包括真实票据图像和与所述真实票据图像相关联的虚假票据图像；

训练模块，用于将所述虚假票据图像输入待训练票据识别模型的生成器，将所述真实票据图像输入所述待训练票据识别模型的鉴别器，以便利用所述样本数据集训练所述待训练票据识别模型，得到训练完成的票据识别模型；

12.一种票据识别装置，包括：

第二获取模块，用于获取待识别票据图像；

识别模块，用于将所述待识别票据图像输入票据识别模型，输出识别结果，其中，所述识别结果表征所述待识别票据图像是真实票据图像或虚假票据图像，所述票据识别模型由权利要求1至9任一项所述的票据识别模型的训练方法训练得到。

13.一种电子设备，包括：

一个或多个处理器；

存储器，用于存储一个或多个指令，

其中，当所述一个或多个指令被所述一个或多个处理器执行时，使得所述一个或多个处理器实现权利要求1至10中任一项所述的方法。

14.一种计算机可读存储介质，其上存储有可执行指令，该指令被处理器执行时使处理器实现权利要求1至10中任一项所述的方法。

15.一种计算机程序产品，所述计算机程序产品包括计算机可执行指令，所述指令在被执行时用于实现权利要求1至10中任一项所述的方法。