CN116935428A - 票据识别方法、装置和处理器及电子设备 - Google Patents
票据识别方法、装置和处理器及电子设备 Download PDFInfo
- Publication number
- CN116935428A CN116935428A CN202310930016.1A CN202310930016A CN116935428A CN 116935428 A CN116935428 A CN 116935428A CN 202310930016 A CN202310930016 A CN 202310930016A CN 116935428 A CN116935428 A CN 116935428A
- Authority
- CN
- China
- Prior art keywords
- bill
- model
- training
- image
- target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 72
- 238000012545 processing Methods 0.000 claims abstract description 101
- 230000006835 compression Effects 0.000 claims abstract description 23
- 238000007906 compression Methods 0.000 claims abstract description 23
- 238000013507 mapping Methods 0.000 claims abstract description 23
- 230000009466 transformation Effects 0.000 claims abstract description 16
- 238000012549 training Methods 0.000 claims description 133
- 230000006870 function Effects 0.000 claims description 74
- 238000012360 testing method Methods 0.000 claims description 40
- 238000000605 extraction Methods 0.000 claims description 32
- 238000012795 verification Methods 0.000 claims description 26
- 150000003839 salts Chemical class 0.000 claims description 6
- 238000006243 chemical reaction Methods 0.000 claims description 5
- 238000010200 validation analysis Methods 0.000 claims description 3
- 238000005516 engineering process Methods 0.000 abstract description 7
- 238000003860 storage Methods 0.000 description 13
- 230000008569 process Effects 0.000 description 12
- 238000009826 distribution Methods 0.000 description 11
- 238000004590 computer program Methods 0.000 description 10
- 238000013140 knowledge distillation Methods 0.000 description 10
- 238000010586 diagram Methods 0.000 description 9
- 238000013528 artificial neural network Methods 0.000 description 8
- 230000005540 biological transmission Effects 0.000 description 7
- 230000000694 effects Effects 0.000 description 5
- 238000009499 grossing Methods 0.000 description 5
- 238000004422 calculation algorithm Methods 0.000 description 4
- 230000007246 mechanism Effects 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 230000007547 defect Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 238000009827 uniform distribution Methods 0.000 description 3
- 238000007635 classification algorithm Methods 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 235000002566 Capsicum Nutrition 0.000 description 1
- 239000006002 Pepper Substances 0.000 description 1
- 235000016761 Piper aduncum Nutrition 0.000 description 1
- 235000017804 Piper guineense Nutrition 0.000 description 1
- 244000203593 Piper nigrum Species 0.000 description 1
- 235000008184 Piper nigrum Nutrition 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000002238 attenuated effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/42—Document-oriented image-based pattern recognition based on the type of document
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/082—Learning methods modifying the architecture, e.g. adding, deleting or silencing nodes or connections
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/19—Recognition using electronic means
- G06V30/191—Design or setup of recognition systems or techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
- G06V30/19127—Extracting features by transforming the feature space, e.g. multidimensional scaling; Mappings, e.g. subspace methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/19—Recognition using electronic means
- G06V30/191—Design or setup of recognition systems or techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
- G06V30/19173—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Multimedia (AREA)
- Evolutionary Computation (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Molecular Biology (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Medical Informatics (AREA)
- Databases & Information Systems (AREA)
- Image Analysis (AREA)
Abstract
本申请公开了一种票据识别方法、装置和处理器及电子设备。涉及大数据处理技术领域,该方法包括:获取待分类的票据图像;对票据图像进行特征提取,得到票据图像在第一卷积维度上的第一特征信息;对第一特征信息进行映射填充处理,得到票据图像在第二卷积维度上的第二特征信息,其中,第二卷积维度高于第一卷积维度;对第二特征信息进行压缩变换处理,得到票据图像在第一卷积维度上的目标特征信息;对目标特征信息进行识别处理,得到票据图像对应的目标票据类型。通过本申请,解决了相关技术中票据识别的准确性较低的问题。
Description
技术领域
本申请涉及大数据处理技术领域,具体而言,涉及一种票据识别方法、装置和处理器及电子设备。
背景技术
随着金融市场的迅速扩张,金融业务量大幅增长,纸质票据每年的使用增幅达到15%-20%,票据种类也随之大量增加。当前,金融机构大部分的票据处理工作仍由人工完成,面临着效率低,流程长,耗时多等问题,不仅需要消耗大量的人力资源,并且人工检测票据出现的处理差错还会公司带来巨大损失,因此,如何实现票据的自动化处理,成为各大金融机构的热点研究课题。
由于不同类型的票据往往对应着不同的处理流程,实现票据的自动化处理首先需要解决票据的自动化分类。然而,现有技术中采用的用于完成票据识别分类的图像识别算法,无法满足票据的细粒度图像分类需求,例如由于票据出具机构的不同以及各机构业务流程存在多样性,尽管相同种类的票据具有相似的结构布局和内容信息,但在图像的局部区域包含关键判别信息,现有的图像分类方法往往无法获得较高的分类精度,进而导致票据识别的准确性较低的问题。
针对相关技术中票据识别的准确性较低的问题,目前尚未提出有效的解决方案。
发明内容
本申请的主要目的在于提供一种票据识别方法、装置和处理器及电子设备,以解决相关技术中票据识别的准确性较低的问题。
为了实现上述目的,根据本申请的一个方面,提供了一种票据识别方法。该方法包括:获取待分类的票据图像;对上述票据图像进行特征提取,得到上述票据图像在第一卷积维度上的第一特征信息;对上述第一特征信息进行映射填充处理,得到上述票据图像在第二卷积维度上的第二特征信息,其中,上述第二卷积维度高于上述第一卷积维度;对上述第二特征信息进行压缩变换处理,得到上述票据图像在上述第一卷积维度上的目标特征信息;对上述目标特征信息进行识别处理,得到上述票据图像对应的目标票据类型。
作为一种可选的方案,在所获取待分类的票据图像之后,上述方法还包括:将上述票据图像输入预设模型进行特征提取处理,得到上述票据图像在上述第一卷积维度上的上述第一特征信息,其中,上述预设模型至少用于获取上述票据图像在不同卷积维度上的特征信息;在获取到上述票据图像的目标特征信息的情况下,利用上述预设模型对上述目标特征信息进行识别预测,输出上述票据图像对应的上述目标票据类型,其中,上述目标特征信息为利用上述预设模型对上述第一特征信息先映射至上述第二卷积维度进行特征填补,以及在特征填补完成后压缩变换回上述第一卷积维度得到的。
作为一种可选的方案,在上述将上述票据图像输入预设模型进行特征提取处理之前,上述方法还包括:获取初始化的第一模型、以及获取用于训练上述第一模型的票据样本集,其中,上述票据样本集包括:训练票据样本、验证票据样本和测试票据样本;利用上述训练票据样本对上述第一模型进行训练,得到训练后的第二模型;基于上述验证票据样本获取上述第二模型的目标损失函数值;在上述目标损失函数值小于预设损失阈值的情况下,基于上述测试票据样本获取上述第二模型的测试结果;在上述测试结果指示预测全部正确的情况下,将上述第二模型确定为上述预设模型。
作为一种可选的方案,上述基于上述验证票据样本获取上述第二模型的目标损失函数值包括:获取上述第二模型的初始损失函数;对上述初始损失函数进行标签正则化处理,得到目标损失函数,其中,上述目标损失函数用于提供上述第二模型的类间信息;根据上述验证票据样本和上述目标损失函数,得到上述第二模型的上述目标损失函数值。
作为一种可选的方案,上述利用上述训练票据样本对上述第一模型进行训练包括:利用上述训练票据样本对上述第一模型进行N轮训练,其中,在当前轮次训练完成的情况下,将上述当前轮次的上述训练票据样本的训练次序进行更新,得到下一轮的上述训练票据样本的训练次序,以及在每10轮训练完成的情况下,更新后10轮的训练学习率,其中,后10轮的上述训练学习率为上述前10轮的上述训练学习率的十分之一,上述N为大于10的正整数。
作为一种可选的方案,上述获取用于训练上述第一模型的票据样本集包括:获取不同票据类型的初始票据样本,对上述初始票据样本进行数据增强处理,以及将数据增强后的票据样本按预设比例划分为上述训练票据样本、上述验证票据样本和上述测试票据样本,其中,上述数据增强处理包括:随机旋转处理、高斯模糊处理、椒盐模糊处理、随机亮度调整处理。
作为一种可选的方案,上述获取待分类的票据图像包括:利用数据摄像机,将采集到的票据扫描为图像形式,得到上述票据图像;在上述得到上述票据图像对应的目标票据类型之后,上述方法还包括:播报与上述目标票据类型对应的提示信息,其中,上述提示信息用于指示执行与上述票据图像对应的票据业务。
为了实现上述目的,根据本申请的另一方面,提供了一种票据识别装置。该装置包括:获取单元,用于获取待分类的票据图像;提取单元,用于对上述票据图像进行特征提取,得到上述票据图像在第一卷积维度上的第一特征信息;映射单元,用于对上述第一特征信息进行映射填充处理,得到上述票据图像在第二卷积维度上的第二特征信息,其中,上述第二卷积维度高于上述第一卷积维度;压缩单元,用于对上述第二特征信息进行压缩变换处理,得到上述票据图像在上述第一卷积维度上的目标特征信息;识别单元,用于对上述目标特征信息进行识别处理,得到上述票据图像对应的目标票据类型。
作为一种可选的方案,上述装置还包括:提取模块,用于在所获取待分类的票据图像之后,将上述票据图像输入预设模型进行特征提取处理,得到上述票据图像在上述第一卷积维度上的上述第一特征信息,其中,上述预设模型至少用于获取上述票据图像在不同卷积维度上的特征信息;预测模块,用于在所获取待分类的票据图像之后,在获取到上述票据图像的目标特征信息的情况下,利用上述预设模型对上述目标特征信息进行识别预测,输出上述票据图像对应的上述目标票据类型,其中,上述目标特征信息为利用上述预设模型对上述第一特征信息先映射至上述第二卷积维度进行特征填补,以及在特征填补完成后压缩变换回上述第一卷积维度得到的。
作为一种可选的方案,上述装置还包括:第一获取模块,用于在上述将上述票据图像输入预设模型进行特征提取处理之前,获取初始化的第一模型、以及获取用于训练上述第一模型的票据样本集,其中,上述票据样本集包括:训练票据样本、验证票据样本和测试票据样本;训练模块,用于在上述将上述票据图像输入预设模型进行特征提取处理之前,利用上述训练票据样本对上述第一模型进行训练,得到训练后的第二模型;第二获取模块,用于在上述将上述票据图像输入预设模型进行特征提取处理之前,基于上述验证票据样本获取上述第二模型的目标损失函数值;第三获取模块,用于在上述将上述票据图像输入预设模型进行特征提取处理之前,在上述目标损失函数值小于预设损失阈值的情况下,基于上述测试票据样本获取上述第二模型的测试结果;确定模块,用于在上述将上述票据图像输入预设模型进行特征提取处理之前,在上述测试结果指示预测全部正确的情况下,将上述第二模型确定为上述预设模型。
作为一种可选的方案,上述第二获取模块包括:第一获取子模块,用于获取上述第二模型的初始损失函数;标签正则化子模块,用于对上述初始损失函数进行标签正则化处理,得到目标损失函数,其中,上述目标损失函数用于提供上述第二模型的类间信息;确定子模块,用于根据上述验证票据样本和上述目标损失函数,得到上述第二模型的上述目标损失函数值。
作为一种可选的方案,上述训练模块包括:训练子模块,用于利用上述训练票据样本对上述第一模型进行N轮训练,其中,在当前轮次训练完成的情况下,将上述当前轮次的上述训练票据样本的训练次序进行更新,得到下一轮的上述训练票据样本的训练次序,以及在每10轮训练完成的情况下,更新后10轮的训练学习率,其中,后10轮的上述训练学习率为上述前10轮的上述训练学习率的十分之一,上述N为大于10的正整数。
作为一种可选的方案,上述第一获取模块包括:第二获取子模块,用于获取不同票据类型的初始票据样本,对上述初始票据样本进行数据增强处理,以及将数据增强后的票据样本按预设比例划分为上述训练票据样本、上述验证票据样本和上述测试票据样本,其中,上述数据增强处理包括:随机旋转处理、高斯模糊处理、椒盐模糊处理、随机亮度调整处理。
作为一种可选的方案,上述获取单元包括:第四获取模块,用于利用数据摄像机,将采集到的票据扫描为图像形式,得到上述票据图像;上述装置还包括:播报单元,用于在上述得到上述票据图像对应的目标票据类型之后,播报与上述目标票据类型对应的提示信息,其中,上述提示信息用于指示执行与上述票据图像对应的票据业务。
通过本申请,采用以下步骤:获取待分类的票据图像;对上述票据图像进行特征提取,得到上述票据图像在第一卷积维度上的第一特征信息;对上述第一特征信息进行映射填充处理,得到上述票据图像在第二卷积维度上的第二特征信息,其中,上述第二卷积维度高于上述第一卷积维度;对上述第二特征信息进行压缩变换处理,得到上述票据图像在上述第一卷积维度上的目标特征信息;对上述目标特征信息进行识别处理,得到上述票据图像对应的目标票据类型。通过对待分类票据图像的初始低维度(第一卷积维度)的特征信息映射至高维空间(第二卷积维度),并对映射后的高维度的特征信息进行细粒度的特征填充以弥补特征信息,以及在特征填充后再压缩回原低维度(第一卷积维度),不仅得到了更加全面的特征信息,增强了特征信息的梯度信息传递能力,还通过卷积维度的复原保证不增加额外计算量的目的,进而使用更加全面的目标特征信息以得到票据图像对应的票据类型,从而实现提高票据识别的准确性的技术效果,解决了相关技术中存在的票据识别的准确性较低的技术问题。
附图说明
构成本申请的一部分的附图用来提供对本申请的进一步理解,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是根据本申请实施例提供的票据识别方法的流程图;
图2是根据本申请实施例提供的票据识别方法的示意图;
图3是根据本申请实施例提供的票据识别方法的示意图;
图4是根据本申请实施例提供的票据识别装置的示意图;
图5是根据本申请实施例提供的票据识别电子设备的示意图。
具体实施方式
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
需要说明的是,本公开所涉及的相关信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于展示的数据、分析的数据等),均为经用户授权或者经过各方充分授权的信息和数据。例如,本系统和相关用户或机构间设置有接口,在获取相关信息之前,需要通过接口向前述的用户或机构发送获取请求,并在接收到前述的用户或机构反馈的同意信息后,获取相关信息。
下面结合优选的实施步骤对本发明进行说明,图1是根据本申请实施例提供的票据识别方法的流程图,如图1所示,该方法包括如下步骤:
步骤S101,获取待分类的票据图像;
步骤S102,对票据图像进行特征提取,得到票据图像在第一卷积维度上的第一特征信息;
步骤S103,对第一特征信息进行映射填充处理,得到票据图像在第二卷积维度上的第二特征信息,其中,第二卷积维度高于第一卷积维度;
步骤S104,对第二特征信息进行压缩变换处理,得到票据图像在第一卷积维度上的目标特征信息;
步骤S105,对目标特征信息进行识别处理,得到票据图像对应的目标票据类型。
可选地,在本实施例中,上述票据识别方法可以但不限于应用在银行票据业务处理场景,例如,将基于上述票据识别方法的票据分类设备灵活部署在银行各个业务场景,帮助业务人员快速且准确的完成票据分类,避免人工出错的同时完成业务分工,直接进入票据处理环节,节省大量时间,提高工作效率,也为票据自动化处理打下基础。
需要说明的是,随着金融市场的迅速扩张,金融业务量大幅增长,纸质票据每年的使用增幅达到15%-20%,票据种类也随之大量增加。当前,金融机构大部分的票据处理工作仍由人工完成,面临着效率低,流程长,耗时多等问题,不仅需要消耗大量的人力资源,并且人工检测票据出现的处理差错还会公司带来巨大损失,因此,如何实现票据的自动化处理,成为各大金融机构的热点研究课题。
由于不同类型的票据往往对应着不同的处理流程,实现票据的自动化处理首先需要解决票据的自动化分类。为灵活应对海量的票据处理,使用专业的扫描将票据转为图像形式,使用图像识别算法批量完成票据分类成为业内主流方法。然而,由于票据出具机构的不同以及各机构业务流程存在多样性,尽管相同种类的票据具有相似的结构布局和内容信息,但在图像的局部区域包含关键判别信息,属于细粒度图像分类问题,分类难度较大,传统的图像分类方法往往无法获得较高的分类精度。
针对上述传统的图像分类方法无法获得较高的分类精度导致票据识别准确性较低的问题,采用上述票据识别方法,通过对待分类票据图像的初始低维度(第一卷积维度)的特征信息映射至高维空间(第二卷积维度),并对映射后的高维度的特征信息进行细粒度的特征填充以弥补特征信息,以及在特征填充后再压缩回原低维度(第一卷积维度),不仅得到了更加全面的特征信息,增强了特征信息的梯度信息传递能力,还通过卷积维度的复原保证不增加额外计算量的目的,进而使用更加全面的目标特征信息以得到票据图像对应的票据类型,从而实现提高票据识别的准确性的技术效果,解决了上述票据识别的准确性较低的问题。
可选地,在本实施例中,待分类的票据图像可以但不限于为利用专业设备将采集到的发票进行扫描得到的图像形式,其中,专业设备可以但不限于为CMOS数字摄像机等设备。
可选地,在本实施例中,采集到的发票可以但不限于为银行票据,可以但不限于包括支付性银行票据(如支票、汇票)、投资性银行票据(如存单、定期存储证明)、金融衍生品票据(如期货合约)等。
可选地,在本实施例中,票据图像在第一卷积维度上的第一特征信息可以但不限于为对票据图像进行特征提取时初始得到的低维度的特征信息。
可选地,在本实施例中,对第一特性信息进行特征填充处理,可以但不限于包括将第一特征信息映射到第二卷积维度上,并对映射后的特征信息进行特征填补,以完成缺陷特征信息提取(弥补),得到特征提取(弥补)后的第二特征信息。
进一步举例说明,上述映射处理可以但不限于包括采用卷积核大小为1x1的逐点卷积扩展维度将第一特征信息映射到更高卷积维度的第二卷积维度上,以扩大特征信息提取范围;上述填补处理可以但不限于包括采用3x3大小的卷积核进行深度卷积完成缺陷特征提取(弥补)。
需要说明是,通过对卷积维度扩展后的特征信息进行特征填补,达到了细粒度的特征增强的目的,提高了特征信息的梯度信息传递能力。
可选地,在本实施例中,上述压缩变换处理可以但不限于包括通过1x1的卷积核进行线性变换将第二特征信息映射回原维度空间,并使用线性激活函数防止压缩变换过程中特征信息丢失。
需要说明的是,通过先升维再降维的方式,能够在保证特征信息的全面性的同时,减少不必要的额外计算量,从而兼顾票据识别的准确性和效率。
需要说明的是,对目标特征信息进行识别处理得到票据图像对应的目标票据类型。
需要说明的是,上述特征提取、映射填充处理、压缩变换处理、以及识别处理,均可以但不限于通过训练好的预设模型实现,其中,预设模型可以但不限于基于适用于边缘端的瓶颈残差结构为基础构建网络,得到改进后的神经网络,并使用一定数量的票据样本在改进后的神经网络进行训练得到的。
进一步举例说明,上述适用于边缘端的瓶颈残差结构的具体结构如图2所示,包括用于将特征信息映射到高维空间的1x1逐点卷积模块201、用于进行深度卷积完成缺陷特征提取的3x3深度卷积模块202、以及用于将特征信息线性变换回低维空间的1x1逐点卷积模块203。
进一步举例说明,上述改进后的神经网络的具体结构如图3所示,包括票据图像预处理模块301、输入模块302、瓶颈残差层模块303、池化模块304和输出模块305。其中,瓶颈残差层模块303包括不同层级且每一个层级的数量和尺寸等参数信息不同,具体为基于图2所示的瓶颈残差结果为基础进行参数设置得到的。
通过本申请提供的实施例,获取待分类的票据图像;对票据图像进行特征提取,得到票据图像在第一卷积维度上的第一特征信息;对第一特征信息进行映射填充处理,得到票据图像在第二卷积维度上的第二特征信息,其中,第二卷积维度高于第一卷积维度;对第二特征信息进行压缩变换处理,得到票据图像在第一卷积维度上的目标特征信息;对目标特征信息进行识别处理,得到票据图像对应的目标票据类型。通过对待分类票据图像的初始低维度(第一卷积维度)的特征信息映射至高维空间(第二卷积维度),并对映射后的高维度的特征信息进行细粒度的特征填充以弥补特征信息,以及在特征填充后再压缩回原低维度(第一卷积维度),不仅得到了更加全面的特征信息,增强了特征信息的梯度信息传递能力,还通过卷积维度的复原保证不增加额外计算量的目的,进而使用更加全面的目标特征信息以得到票据图像对应的票据类型,从而实现提高票据识别的准确性的技术效果,解决了上述票据识别的准确性较低的问题。
作为一种可选的方案,在所获取待分类的票据图像之后,方法还包括:
S1,将票据图像输入预设模型进行特征提取处理,得到票据图像在第一卷积维度上的第一特征信息,其中,预设模型至少用于获取票据图像在不同卷积维度上的特征信息;
S2,在获取到票据图像的目标特征信息的情况下,利用预设模型对目标特征信息进行识别预测,输出票据图像对应的目标票据类型,其中,目标特征信息为利用预设模型对第一特征信息先映射至第二卷积维度进行特征填补,以及在特征填补完成后压缩变换回第一卷积维度得到的。
可选地,在本实施例中,预设模型可以但不限于基于适用于边缘端的瓶颈残差结构为基础构建网络,得到改进后的神经网络,并使用一定数量的票据样本在改进后的神经网络进行训练得到的,可以但不限于至少用于获取票据图像在不同卷积维度上的特征信息,不同卷积维度包括第一卷积维度、第二卷积维度。
可选地,在本实施例中,利用预设模型对输入的票据图像进行特征提取得到票据图像在第一卷积维度的第一特征信息,并利用预设模型对第一特征信息进行映射填充处理得到票据图像在第二卷积维度上的第二特征信息,以及利用预设模型对第二特征信息进行压缩变换处理得到票据图像在第一卷积维度上的目标特征信息,和利用预设模型对目标特征信息进行识别预测,得到并输出票据图像对应的目标票据类型。
通过本申请提供的实施例,将票据图像输入预设模型进行特征提取处理,得到票据图像在第一卷积维度上的第一特征信息,其中,预设模型至少用于获取票据图像在不同卷积维度上的特征信息;在获取到票据图像的目标特征信息的情况下,利用预设模型对目标特征信息进行识别预测,输出票据图像对应的目标票据类型,其中,目标特征信息为利用预设模型对第一特征信息先映射至第二卷积维度进行特征填补,以及在特征填补完成后压缩变换回第一卷积维度得到的。使用基于深度学习和卷积神经网络训练得到预设模型进行票据的识别预测分类,能够直接处理原始图像数据,并通过网络训练自动发现和提取细粒度的图像特征,不仅提高了票据识别分类的准确性,还兼顾了票据识别分类的效率与性能。
作为一种可选的方案,在将票据图像输入预设模型进行特征提取处理之前,方法还包括:
S1,获取初始化的第一模型、以及获取用于训练第一模型的票据样本集,其中,票据样本集包括:训练票据样本、验证票据样本和测试票据样本;
S2,利用训练票据样本对第一模型进行训练,得到训练后的第二模型;
S3,基于验证票据样本获取第二模型的目标损失函数值;
S4,在目标损失函数值小于预设损失阈值的情况下,基于测试票据样本获取第二模型的测试结果;
S5,在测试结果指示预测全部正确的情况下,将第二模型确定为预设模型。
可选地,在本实施例中,第一模型可以但不限于为基于改进后的神经网络初始化的模型,其中,改进后的神经网络为基于适用于边缘端的瓶颈残差结构为基础构建得到的。
可选地,在本实施例中,用于训练第一模型的票据样本集包括训练票据样本、验证票据样本、测试票据样本,其中,训练票据样本、验证票据样本、测试票据样本可以但不限于为按照预设或随机比例进行划分得到的,例如8:1:1。
可选地,在本实施例中,训练票据样本可以但不限于用于对第一模型进行训练,可以但不限于包括使用训练票据样本对第一模型进行N轮训练,初步得到训练后的第二模型。
可选地,在本实施例中,验证票据样本可以但不限于用于获取第二模型的目标损失函数值,以验证第二模型的目标损失情况是否符合损失收敛条件,其中,在目标损失函数值小于预设阈值的情况下,确定第二模型初步符合损失收敛条件,将进一步通过测试票据样本进行个例二次测试验证,以及在目标损失值不小于预设阈值的情况下,确定第二模型初步不符合损失收敛条件,将返回至使用训练票据样本进行训练直至符合损失收敛条件。
可选地,在本实施例中,测试票据样本可以但不限于用于比对样本在第二模型的图像输入之后得到的预测类型结果和样本的真实类型结果是否一样,在测试票据样本包括的各个样本的测试结果均指示一样的情况下,确定测试结果指示预测全部正确,以及确定第二模型在总体的损失情况和局部的个例测试上均满足要求,将第二模型确定为预设模型。
通过本申请提供的实施例,获取初始化的第一模型、以及获取用于训练第一模型的票据样本集,其中,票据样本集包括:训练票据样本、验证票据样本和测试票据样本;利用训练票据样本对第一模型进行训练,得到训练后的第二模型;基于验证票据样本获取第二模型的目标损失函数值;在目标损失函数值小于预设损失阈值的情况下,基于测试票据样本获取第二模型的测试结果;在测试结果指示预测全部正确的情况下,将第二模型确定为预设模型。通过不同维度上的两次模型验证,进而在模型的初步整体上的损失情况符合收敛且模型的局部个例测试验证通过的情况下,确定模型已训练完成,进而达到了提高预设模型的训练至质量和性能的目的,从而实现提高票据识别的准确性的技术效果。
作为一种可选的方案,基于验证票据样本获取第二模型的目标损失函数值包括:
S1,获取第二模型的初始损失函数;
S2,对初始损失函数进行标签正则化处理,得到目标损失函数,其中,目标损失函数用于提供第二模型的类间信息;
S3,根据验证票据样本和目标损失函数,得到第二模型的目标损失函数值。
可选地,在本实施例中,初始损失函数可以但不限于为标准的交叉熵损失函数H(q,p),其中,q代表真实的概率分布,可以但不限于为一个one-hot向量或标签的概率分布,p代表模型预测的概率分布。初始损失函数可以但不限于用于衡量模型预测与真实情况之间的差异。
可选地,在本实施例中,对初始损失函数进行标签正则化处理,包括通过改进的标签分布qlsr(k)替换传统的one-hot编码分布q(k),并最小化qlsr(k)与网络输出p(k)之间的交叉熵以完成标签平滑,qlsr(k)表达式如式1-1:
qlsr(k)=(1-α)q(k)+αu(k) (1-1)
其中α为超参数,u(k)为引入的均匀分布噪声,由此可以得到经过平滑标签的交叉熵可以表示为式1-2:
其中H(p,q)为标准的交叉熵损失函数,DKL(u,p)为均匀分布u和输出p求相对熵。由于H(u)为均匀分布,最终可以得到经过标签平滑正则化后的损失函数为式1-3:
Llsr=(1-α)H(q,p)+αDKL(u,p) (1-3)
进一步,基于式1-3,设教师模型的标签分布为学生模型的分布为pτ(k),得到学生模型的损失函数表示为式1-4:
其中,是学生和教师推理输出之间的相对熵,τ表示温度,α为超参数。对比式1-3和式1-4可以看出,知识蒸馏与标签平滑正则化最终对损失函数的改造存在极大的相似性,区别在于/>分布来自于教师模型的学习,而标签平滑正则化是预先定义的均匀分布函数,但当温度系数τ的不断上升,教师分布将不断接近均匀分布。由此思路,虚拟教师知识蒸馏的方法,人工设计教师模型分布,对学生模型进行标签正则化,从而达到利用复杂模型知识蒸馏才能达到的性能提升。该虚拟教师模型的输出分布将被设置为如式1-5:
其中K为类别总数,r为正确类别,n为识别正确的概率,同时n将始终被设置为大于等于0.9以保证虚拟模型性能。虚拟教师知识蒸馏(Teacher Free KnowledgeDistillation,TF-KD)将损失函数改进为式1-6:
需要说明的是,上述式1-6即为标签正则化处理后得到的第二模型的目标损失函数。其中,温度参数τ设置为大于等于20来软化虚拟教师模型分布。这一损失函数能够有效提供类间信息并具备标签平滑正则化的特性,防止模型的过拟合。
需要说明的是,通过设计教师模型损失函数的方法,直接将所训练的模型作为学生模型,对其损失函数进行标签正则化,从而达到使用复杂模型进行知识蒸馏才能达到的性能。
还需要说明的是,知识蒸馏是将复杂的教师模型中的知识提取到轻量级的学生模型中,其成功通常归功于复杂的教师模型传递的类别间的相似信息。简单的学生模型以相同方式进行知识蒸馏可以提高复杂的教师模型性能,而训练不足的教师模型也能给学生模型带来提高,知识蒸馏实际上所能为学生模型带来的是一个可学习的标签平滑正则化,且相比于教师模型传递的类间相似信息,这种标签的正则化起到更重要的作用。
通过本申请提供的实施例,获取所述第二模型的初始损失函数;对所述初始损失函数进行标签正则化处理,得到目标损失函数,其中,所述目标损失函数用于提供所述第二模型的类间信息;根据所述验证票据样本和所述目标损失函数,得到所述第二模型的所述目标损失函数值。通过对第二模型的损失函数标签正则化的处理,有效提供第二模型的类间信息并具备标签正则化的特征,放置第二模型的过拟合。
作为一种可选的方案,利用训练票据样本对第一模型进行训练包括:
S1,利用训练票据样本对第一模型进行N轮训练,其中,在当前轮次训练完成的情况下,将当前轮次的训练票据样本的训练次序进行更新,得到下一轮的训练票据样本的训练次序,以及在每10轮训练完成的情况下,更新后10轮的训练学习率,其中,后10轮的训练学习率为前10轮的训练学习率的十分之一,N为大于10的正整数。
可选地,在本实施例中,将改进后的神经网络在划分出的训练票据样本上进行多轮训练,训练过程中将每一批次训练集随机打乱,防止出现对某一类别的票据识别出现过拟合现象,并通过多步长衰减学习率的方法进行模型微调,将初始学习率设置为0.01,设定前10轮不进行学习率的微调以加快网络的收敛,随后在10轮训练后在第20轮与第30轮将学习率衰减0.1倍使得网络更好地收敛到最优解。每轮结束后及时监控并记录模型在验证集上的准确率及损失情况,再与下一轮训练结束后的数据比较,准确率值较大,则保存当前模型;否则不保存模型,进行下一轮训练,直至训练票据样本与验证票据样本的准确率与损失结果相近,表明模型没有出现过拟合或者欠拟合的情况,具备泛化能力。
作为一种可选的方案,获取用于训练第一模型的票据样本集包括:
S1,获取不同票据类型的初始票据样本,对初始票据样本进行数据增强处理,以及将数据增强后的票据样本按预设比例划分为训练票据样本、验证票据样本和测试票据样本,其中,数据增强处理包括:随机旋转处理、高斯模糊处理、椒盐模糊处理、随机亮度调整处理。
需要说明的是,为了提取更准确的特征,模型训练往往需要海量的训练样本。而本实施例通过多种数据增强技术,基于已获取到的有限的初始票据样本,进行数据增强处理,提高数据集数据量,提升泛化能力,防止过拟合,且无需海量的训练样本的获取,节省了模型的训练成本和训练时间,提高了模型的训练效率。其中,数据增强处理包括:随机旋转处理、高斯模糊处理、椒盐模糊处理以及随机亮度调整处理等。
可选地,在本实施例中,在得到数据增强后的M个初始票据样本之后,按照预设或随机比例,如8:1:1进行样本划分,得到第一数量的训练票据样本、第二数量的验证票据样本和第三数量的测试票据样本。
作为一种可选的方案,获取待分类的票据图像包括:
S1,利用数据摄像机,将采集到的票据扫描为图像形式,得到票据图像;
在得到票据图像对应的目标票据类型之后,方法还包括:
S2,播报与目标票据类型对应的提示信息,其中,提示信息用于指示执行与票据图像对应的票据业务。
可选地,在本实施例中,可以但不限于利用CMOS数字摄像机,将采集到的、待分类的发票扫描为图像形式,得到待分类的票据图像。
可选地,在本实施例中,在得到票据图像对应的目标票据类型之后,可以但不限于播报与目标票据类型对应的提示信息,其中,提示信息用于指示执行与票据图像对应的票据业务。
需要说明的是,利用上述票据识别方法,能够帮助业务人员快速且准确的完成票据分类,避免人工出错的同时完成业务分工,直接进入票据处理环节,节省大量时间,提高工作效率。
需要说明的是,利用上述票据识别方法,实现了一种基于深度学习的票据分类算法,实现自动化提取特征且具有较高的分类准确率,使用该算法能够解决传统分类算法精度不高以及算法泛化能力较差的问题。以及,以轻量化模块构建网络,结合虚拟教师知识蒸馏方法保证算法精度,能够支持票据的实时分类且由于网络模型内存占用小,适于部署在边缘端无法使用大型图像识别设备场景。
需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
本申请实施例还提供了一种票据识别装置,需要说明的是,本申请实施例的票据识别装置可以用于执行本申请实施例所提供的用于票据识别方法。以下对本申请实施例提供的票据识别装置进行介绍。
图4是根据本申请实施例的票据识别装置的示意图。如图5所示,该装置包括:
获取单元401,用于获取待分类的票据图像;
提取单元402,用于对票据图像进行特征提取,得到票据图像在第一卷积维度上的第一特征信息;
映射单元403,用于对第一特征信息进行映射填充处理,得到票据图像在第二卷积维度上的第二特征信息,其中,第二卷积维度高于第一卷积维度;
压缩单元404,用于对第二特征信息进行压缩变换处理,得到票据图像在第一卷积维度上的目标特征信息;
识别单元405,用于对目标特征信息进行识别处理,得到票据图像对应的目标票据类型。
可选地,在本申请实施例提供的票据识别装置中,装置还包括:
提取模块,用于在所获取待分类的票据图像之后,将票据图像输入预设模型进行特征提取处理,得到票据图像在第一卷积维度上的第一特征信息,其中,预设模型至少用于获取票据图像在不同卷积维度上的特征信息;
预测模块,用于在所获取待分类的票据图像之后,在获取到票据图像的目标特征信息的情况下,利用预设模型对目标特征信息进行识别预测,输出票据图像对应的目标票据类型,其中,目标特征信息为利用预设模型对第一特征信息先映射至第二卷积维度进行特征填补,以及在特征填补完成后压缩变换回第一卷积维度得到的。
可选地,在本申请实施例提供的票据识别装置中,装置还包括:
第一获取模块,用于在将票据图像输入预设模型进行特征提取处理之前,获取初始化的第一模型、以及获取用于训练第一模型的票据样本集,其中,票据样本集包括:训练票据样本、验证票据样本和测试票据样本;
训练模块,用于在将票据图像输入预设模型进行特征提取处理之前,利用训练票据样本对第一模型进行训练,得到训练后的第二模型;
第二获取模块,用于在将票据图像输入预设模型进行特征提取处理之前,基于验证票据样本获取第二模型的目标损失函数值;
第三获取模块,用于在将票据图像输入预设模型进行特征提取处理之前,在目标损失函数值小于预设损失阈值的情况下,基于测试票据样本获取第二模型的测试结果;
确定模块,用于在将票据图像输入预设模型进行特征提取处理之前,在测试结果指示预测全部正确的情况下,将第二模型确定为预设模型。
可选地,在本申请实施例提供的票据识别装置中,第二获取模块包括:
第一获取子模块,用于获取第二模型的初始损失函数;
标签正则化子模块,用于对初始损失函数进行标签正则化处理,得到目标损失函数,其中,目标损失函数用于提供第二模型的类间信息;
确定子模块,用于根据验证票据样本和目标损失函数,得到第二模型的目标损失函数值。
可选地,在本申请实施例提供的票据识别装置中,训练模块包括:
训练子模块,用于利用训练票据样本对第一模型进行N轮训练,其中,在当前轮次训练完成的情况下,将当前轮次的训练票据样本的训练次序进行更新,得到下一轮的训练票据样本的训练次序,以及在每10轮训练完成的情况下,更新后10轮的训练学习率,其中,后10轮的训练学习率为前10轮的训练学习率的十分之一,N为大于10的正整数。
可选地,在本申请实施例提供的票据识别装置中,第一获取模块包括:
第二获取子模块,用于获取不同票据类型的初始票据样本,对初始票据样本进行数据增强处理,以及将数据增强后的票据样本按预设比例划分为训练票据样本、验证票据样本和测试票据样本,其中,数据增强处理包括:随机旋转处理、高斯模糊处理、椒盐模糊处理、随机亮度调整处理。
可选地,在本申请实施例提供的票据识别装置中,获取单元501包括:
第四获取模块,用于利用数据摄像机,将采集到的票据扫描为图像形式,得到票据图像;
装置还包括:
播报单元,用于在得到票据图像对应的目标票据类型之后,播报与目标票据类型对应的提示信息,其中,提示信息用于指示执行与票据图像对应的票据业务。
本申请实施例提供的票据识别装置,通过对待分类票据图像的初始低维度(第一卷积维度)的特征信息映射至高维空间(第二卷积维度),并对映射后的高维度的特征信息进行细粒度的特征填充以弥补特征信息,以及在特征填充后再压缩回原低维度(第一卷积维度),不仅得到了更加全面的特征信息,增强了特征信息的梯度信息传递能力,还通过卷积维度的复原保证不增加额外计算量的目的,进而使用更加全面的目标特征信息以得到票据图像对应的票据类型,从而实现提高票据识别的准确性的技术效果,解决了相关技术中存在的票据识别的准确性较低的技术问题。
所述票据识别装置包括处理器和存储器,上述获取单元、提取单元、映射单元、压缩单元、识别单元等均作为程序单元存储在存储器中,由处理器执行存储在存储器中的上述程序单元来实现相应的功能。
处理器中包含内核,由内核去存储器中调取相应的程序单元。内核可以设置一个或以上,通过调整内核参数来训练或优化预设模型,从而提高票据识别的准确性和效率。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM),存储器包括至少一个存储芯片。
本发明实施例提供了一种计算机可读存储介质,其上存储有程序,该程序被处理器执行时实现上述票据识别方法。
本发明实施例提供了一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行上述票据识别方法。
如图5所示,本发明实施例提供了一种电子设备,设备包括处理器、存储器及存储在存储器上并可在处理器上运行的程序,处理器执行程序时实现以下步骤:
获取待分类的票据图像;
对票据图像进行特征提取,得到票据图像在第一卷积维度上的第一特征信息;
对第一特征信息进行映射填充处理,得到票据图像在第二卷积维度上的第二特征信息,其中,第二卷积维度高于第一卷积维度;
对第二特征信息进行压缩变换处理,得到票据图像在第一卷积维度上的目标特征信息;
对目标特征信息进行识别处理,得到票据图像对应的目标票据类型。
本文中的设备可以是服务器、PC、PAD、手机等。
本申请还提供了一种计算机程序产品,当在数据处理设备上执行时,适于执行初始化有如下方法步骤的程序:
获取待分类的票据图像;
对票据图像进行特征提取,得到票据图像在第一卷积维度上的第一特征信息;
对第一特征信息进行映射填充处理,得到票据图像在第二卷积维度上的第二特征信息,其中,第二卷积维度高于第一卷积维度;
对第二特征信息进行压缩变换处理,得到票据图像在第一卷积维度上的目标特征信息;
对目标特征信息进行识别处理,得到票据图像对应的目标票据类型。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。存储器是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
以上仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。
Claims (10)
1.一种票据识别方法,其特征在于,包括:
获取待分类的票据图像;
对所述票据图像进行特征提取,得到所述票据图像在第一卷积维度上的第一特征信息;
对所述第一特征信息进行映射填充处理,得到所述票据图像在第二卷积维度上的第二特征信息,其中,所述第二卷积维度高于所述第一卷积维度;
对所述第二特征信息进行压缩变换处理,得到所述票据图像在所述第一卷积维度上的目标特征信息;
对所述目标特征信息进行识别处理,得到所述票据图像对应的目标票据类型。
2.根据权利要求1所述的方法,其特征在于,在所获取待分类的票据图像之后,所述方法还包括:
将所述票据图像输入预设模型进行特征提取处理,得到所述票据图像在所述第一卷积维度上的所述第一特征信息,其中,所述预设模型至少用于获取所述票据图像在不同卷积维度上的特征信息;
在获取到所述票据图像的目标特征信息的情况下,利用所述预设模型对所述目标特征信息进行识别预测,输出所述票据图像对应的所述目标票据类型,其中,所述目标特征信息为利用所述预设模型对所述第一特征信息先映射至所述第二卷积维度进行特征填补,以及在特征填补完成后压缩变换回所述第一卷积维度得到的。
3.根据权利要求2所述的方法,其特征在于,在所述将所述票据图像输入预设模型进行特征提取处理之前,所述方法还包括:
获取初始化的第一模型、以及获取用于训练所述第一模型的票据样本集,其中,所述票据样本集包括:训练票据样本、验证票据样本和测试票据样本;
利用所述训练票据样本对所述第一模型进行训练,得到训练后的第二模型;
基于所述验证票据样本获取所述第二模型的目标损失函数值;
在所述目标损失函数值小于预设损失阈值的情况下,基于所述测试票据样本获取所述第二模型的测试结果;
在所述测试结果指示预测全部正确的情况下,将所述第二模型确定为所述预设模型。
4.根据权利要求3所述的方法,其特征在于,所述基于所述验证票据样本获取所述第二模型的目标损失函数值包括:
获取所述第二模型的初始损失函数;
对所述初始损失函数进行标签正则化处理,得到目标损失函数,其中,所述目标损失函数用于提供所述第二模型的类间信息;
根据所述验证票据样本和所述目标损失函数,得到所述第二模型的所述目标损失函数值。
5.根据权利要求3所述的方法,其特征在于,所述利用所述训练票据样本对所述第一模型进行训练包括:
利用所述训练票据样本对所述第一模型进行N轮训练,其中,在当前轮次训练完成的情况下,将所述当前轮次的所述训练票据样本的训练次序进行更新,得到下一轮的所述训练票据样本的训练次序,以及在每10轮训练完成的情况下,更新后10轮的训练学习率,其中,后10轮的所述训练学习率为所述前10轮的所述训练学习率的十分之一,所述N为大于10的正整数。
6.根据权利要求3所述的方法,其特征在于,所述获取用于训练所述第一模型的票据样本集包括:
获取不同票据类型的初始票据样本,对所述初始票据样本进行数据增强处理,以及将数据增强后的票据样本按预设比例划分为所述训练票据样本、所述验证票据样本和所述测试票据样本,其中,所述数据增强处理包括:随机旋转处理、高斯模糊处理、椒盐模糊处理、随机亮度调整处理。
7.根据权利要求1至6任一项所述的方法,其特征在于,
所述获取待分类的票据图像包括:
利用数据摄像机,将采集到的票据扫描为图像形式,得到所述票据图像;
在所述得到所述票据图像对应的目标票据类型之后,所述方法还包括:
播报与所述目标票据类型对应的提示信息,其中,所述提示信息用于指示执行与所述票据图像对应的票据业务。
8.一种票据识别装置,其特征在于,包括:
获取单元,用于获取待分类的票据图像;
提取单元,用于对所述票据图像进行特征提取,得到所述票据图像在第一卷积维度上的第一特征信息;
映射单元,用于对所述第一特征信息进行映射填充处理,得到所述票据图像在第二卷积维度上的第二特征信息,其中,所述第二卷积维度高于所述第一卷积维度;
压缩单元,用于对所述第二特征信息进行压缩变换处理,得到所述票据图像在所述第一卷积维度上的目标特征信息;
识别单元,用于对所述目标特征信息进行识别处理,得到所述票据图像对应的目标票据类型。
9.一种处理器,其特征在于,所述处理器用于运行程序,其中,所述程序运行时执行权利要求1至7中任意一项所述的方法。
10.一种电子设备,其特征在于,包括一个或多个处理器和存储器,所述存储器用于存储一个或多个程序,其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现权利要求1至7中任意一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310930016.1A CN116935428A (zh) | 2023-07-26 | 2023-07-26 | 票据识别方法、装置和处理器及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310930016.1A CN116935428A (zh) | 2023-07-26 | 2023-07-26 | 票据识别方法、装置和处理器及电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116935428A true CN116935428A (zh) | 2023-10-24 |
Family
ID=88382431
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310930016.1A Pending CN116935428A (zh) | 2023-07-26 | 2023-07-26 | 票据识别方法、装置和处理器及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116935428A (zh) |
-
2023
- 2023-07-26 CN CN202310930016.1A patent/CN116935428A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111191791B (zh) | 基于机器学习模型的图片分类方法、装置及设备 | |
CN112614125B (zh) | 手机玻璃缺陷检测方法、装置、计算机设备及存储介质 | |
CN107545301B (zh) | 页面展示方法及装置 | |
CN112598294A (zh) | 在线建立评分卡模型的方法、装置、机器可读介质及设备 | |
CN114971891A (zh) | 风险预测方法和装置、处理器及电子设备 | |
Zhou et al. | MSAR‐DefogNet: Lightweight cloud removal network for high resolution remote sensing images based on multi scale convolution | |
CN112598526A (zh) | 资产数据的处理方法及装置 | |
CN115809837B (zh) | 基于数字化模拟场景的金融企业管理方法、设备及介质 | |
CN117196625A (zh) | 用于汇兑业务的信息展示方法、系统、设备及存储介质 | |
CN116935428A (zh) | 票据识别方法、装置和处理器及电子设备 | |
CN116977091A (zh) | 个股投资组合的确定方法、装置、电子设备及可读存储介质 | |
CN115860889A (zh) | 一种基于人工智能的金融贷款大数据管理方法及系统 | |
CN111429215B (zh) | 数据的处理方法和装置 | |
CN118053169A (zh) | 票据的录入方法和装置、存储介质及电子设备 | |
CN117351297A (zh) | 噪声干扰图像的识别方法、装置、处理器及电子设备 | |
Kaakeh et al. | Leading Indicators of Turkey’s Financial Crises | |
CN118115257A (zh) | 金融业务的处理方法和装置、存储介质及电子设备 | |
CN118096380A (zh) | 金融风险预测方法和装置、存储介质及电子设备 | |
CN117152730A (zh) | 凭证的识别方法及装置、存储介质和电子设备 | |
CN116187581A (zh) | 金融机构的业务量预测方法和装置、处理器及电子设备 | |
CN116740496A (zh) | 银行影像识别模型的训练方法、装置、设备及存储介质 | |
CN116883156A (zh) | 贷款数据处理方法、装置、存储介质和计算机设备 | |
CN116610956A (zh) | 金融合同识别模型的更新方法、装置、设备及存储介质 | |
CN116246116A (zh) | 强化多尺度特征提取、复用与融合的目标检测方法 | |
CN117952719A (zh) | 金融产品的推荐方法和装置、存储介质及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |