CN111967395A - 银行票据识别方法及装置 - Google Patents

银行票据识别方法及装置 Download PDF

Info

Publication number
CN111967395A
CN111967395A CN202010832458.9A CN202010832458A CN111967395A CN 111967395 A CN111967395 A CN 111967395A CN 202010832458 A CN202010832458 A CN 202010832458A CN 111967395 A CN111967395 A CN 111967395A
Authority
CN
China
Prior art keywords
training
bill
bank
recognition model
parameters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010832458.9A
Other languages
English (en)
Inventor
廖旺胜
庄恩瀚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Bank of China Ltd
Original Assignee
Bank of China Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Bank of China Ltd filed Critical Bank of China Ltd
Priority to CN202010832458.9A priority Critical patent/CN111967395A/zh
Publication of CN111967395A publication Critical patent/CN111967395A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种银行票据识别方法及装置,该方法包括:根据预设字体文件和银行票据内容生成训练样本;根据训练样本,对设置超参数的票据识别模型进行训练;对训练好的票据识别模型的训练参数进行调整;将待识别银行票据数据输入至调整参数后的票据识别模型中,输出识别结果。本发明可以保证模型的工作能力,提高银行票据的识别准确度。

Description

银行票据识别方法及装置
技术领域
本发明涉及计算机技术领域,尤其涉及一种银行票据识别方法及装置。
背景技术
随着人工智能和计算机视觉技术的快速发展,银行将光学字符识别(OpticalCharacter Recognition,简称OCR)技术应用在凭证识别、单据识别和票据识别等场景。在银行票据识别实践中,现有技术通常采用深度学习方法进行识别,但是深度学习方法需要准备大量的训练样本数据,并且需要根据实际场景对模型进行调整。在此过程中,样本的准备和训练耗时耗力,且容易出现训练样本多样性不足和模型能力不足导致银行票据识别准确率不高的情况。
发明内容
本发明实施例提供一种银行票据识别方法,用以保证模型的工作能力,提高银行票据的识别准确度,该方法包括:
根据预设字体文件和银行票据内容生成训练样本;
根据训练样本,对设置超参数的票据识别模型进行训练;
对训练好的票据识别模型的训练参数进行调整;
将待识别银行票据数据输入至调整参数后的票据识别模型中,输出识别结果。
可选的,根据预设字体文件和银行票据内容生成训练样本之后,所述方法还包括:
对所述训练样本进行扩充处理,所述扩充处理包括叠加背景、膨胀腐蚀、高斯模糊、缩放拉升。
可选的,所述方法还包括:
根据错误识别的银行票据,对票据识别模型进行训练。
可选的,对训练好的票据识别模型的训练参数进行调整,包括:
为不同票据类型的训练样本配置不同的权重;
根据配置有不同权重的训练样本对票据识别模型进行训练。
本发明实施例还提供一种银行票据识别装置,用以保证模型的工作能力,提高银行票据的识别准确度,该装置包括:
训练样本生成模块,用于根据预设字体文件和银行票据内容生成训练样本;
模型训练模块,用于根据训练样本,对设置超参数的票据识别模型进行训练;
参数调整模块,用于对训练好的票据识别模型的训练参数进行调整;
票据识别模块,用于将待识别银行票据数据输入至调整参数后的票据识别模型中,输出识别结果。
可选的,所述装置还包括:
扩充处理模块,用于对所述训练样本进行扩充处理,所述扩充处理包括叠加背景、膨胀腐蚀、高斯模糊、缩放拉升。
可选的,所述装置还包括:
优化训练模块,用于根据错误识别的银行票据,对票据识别模型进行训练。
可选的,模型训练模块进一步用于:
为不同票据类型的训练样本配置不同的权重;
根据配置有不同权重的训练样本对票据识别模型进行训练。
本发明实施例还提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述方法。
本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有执行上述方法的计算机程序。
本发明实施例中,通过根据预设字体文件和银行票据内容生成训练样本,保证了训练样本的多样性。通过根据训练样本,对设置超参数的票据识别模型进行训练,对训练好的票据识别模型的训练参数进行调整,将待识别银行票据数据输入至调整参数后的票据识别模型中,输出识别结果,保证了模型的工作能力,提高了银行票据的识别准确度。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:
图1为本发明实施例中银行票据识别方法的流程图;
图2为本发明实施例中对训练样本进行扩充处理的流程图;
图3为本发明实施例中银行票据识别装置的结构示意图;
图4为本发明实施例中对训练样本进行扩充处理的结构示意图;
图5是本发明实施例计算机设备示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚明白,下面结合附图对本发明实施例做进一步详细说明。在此,本发明的示意性实施例及其说明用于解释本发明,但并不作为对本发明的限定。
在本说明书的描述中,所使用的“包含”、“包括”、“具有”、“含有”等,均为开放性的用语,即意指包含但不限于。参考术语“一个实施例”、“一个具体实施例”、“一些实施例”、“例如”等的描述意指结合该实施例或示例描述的具体特征、结构或者特点包含于本申请的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。各实施例中涉及的步骤顺序用于示意性说明本申请的实施,其中的步骤顺序不作限定,可根据需要作适当调整。
图1为本发明实施例提供的一种银行票据识别方法的流程图,如图1所示,该方法包括:
步骤101、根据预设字体文件和银行票据内容生成训练样本。
在实施例中,预设字体文件为TTF字体文件,TTF字体文件是Apple公司和Microsoft公司共同推出的字体文件格式,随着windows的流行,已经变成最常用的一种字体文件表示方式。
步骤102、根据训练样本,对设置超参数的票据识别模型进行训练。
在实施例中,票据识别模型可以为深度学习模型。
步骤103、对训练好的票据识别模型的训练参数进行调整。
在实施例中,对训练好的票据识别模型的训练参数进行调整,包括:
为不同票据类型的训练样本配置不同的权重;
根据配置有不同权重的训练样本对票据识别模型进行训练。
具体实施时,举例来说,银行票据类型包括:A、B、C、D类,应用时,可以根据A、B、C、D类银行票据的重要程度为其配置不同的权重。
此外,该训练参数还包括训练的初始状态。
步骤104、将待识别银行票据数据输入至调整参数后的票据识别模型中,输出识别结果。
由图1可知,本发明实施例提供的银行票据识别方法,通过根据预设字体文件和银行票据内容生成训练样本,保证了训练样本的多样性。通过根据训练样本,对设置超参数的票据识别模型进行训练,对训练好的票据识别模型的训练参数进行调整,将待识别银行票据数据输入至调整参数后的票据识别模型中,输出识别结果,保证了模型的工作能力。提高了银行票据的识别准确度。
图2为本发明实施例提供的对训练样本进行扩充处理的流程图,如图2所示,根据预设字体文件和银行票据内容生成训练样本之后,所述方法还包括:
步骤201、对所述训练样本进行扩充处理,所述扩充处理包括叠加背景、膨胀腐蚀、高斯模糊、缩放拉升。
通过对训练样本进行扩充处理,保证了生成的训练样本符合生产样本多样性或一定程度上比实际更复杂。
在本发明实施例中,所述方法还包括:
根据错误识别的银行票据,对票据识别模型进行训练。
具体地,即将识别结果为错误的训练样本重新输入票据识别模型进行优化处理,以获得更好的效果。
基于同一发明构思,本发明实施例中还提供了一种银行票据识别装置,如下面的实施例所述。由于银行票据识别装置解决问题的原理与银行票据识别方法相似,因此,银行票据识别装置的实施可以参见银行票据识别方法的实施,重复之处不再赘述。以下所使用的,术语“单元”或者“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。
图3为本发明实施例提供的一种银行票据识别装置的结构示意图,如图3所示,该装置包括:
训练样本生成模块301,用于根据预设字体文件和银行票据内容生成训练样本;
模型训练模块302,用于根据训练样本,对设置超参数的票据识别模型进行训练;
参数调整模块303,用于对训练好的票据识别模型的训练参数进行调整;
票据识别模块304,用于将待识别银行票据数据输入至调整参数后的票据识别模型中,输出识别结果。
图4为本发明实施例提供的对训练样本进行扩充处理的结构示意图,如图4所示,所述装置还包括:
扩充处理模块401,用于对所述训练样本进行扩充处理,所述扩充处理包括叠加背景、膨胀腐蚀、高斯模糊、缩放拉升。
在本发明实施例中,所示装置还包括:
优化训练模块,用于根据错误识别的银行票据,对票据识别模型进行训练。
在本发明实施例中,模型训练模块进一步用于:
为不同票据类型的训练样本配置不同的权重;
根据配置有不同权重的训练样本对票据识别模型进行训练。
为了实现上述目的,根据本申请的另一方面,还提供了一种计算机设备。如图5所示,该计算机设备包括存储器、处理器、通信接口以及通信总线,在存储器上存储有可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述实施例方法中的步骤。
处理器可以为中央处理器(Central Processing Unit,CPU)。处理器还可以为其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等芯片,或者上述各类芯片的组合。
存储器作为一种非暂态计算机可读存储介质,可用于存储非暂态软件程序、非暂态计算机可执行程序以及单元,如本发明上述方法实施例中对应的程序单元。处理器通过运行存储在存储器中的非暂态软件程序、指令以及模块,从而执行处理器的各种功能应用以及作品数据处理,即实现上述方法实施例中的方法。
存储器可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储处理器所创建的数据等。此外,存储器可以包括高速随机存取存储器,还可以包括非暂态存储器,例如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在一些实施例中,存储器可选包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至处理器。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
所述一个或者多个单元存储在所述存储器中,当被所述处理器执行时,执行上述实施例中的方法。
本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有执行上述方法的计算机程序。
本发明通过根据预设字体文件和银行票据内容生成训练样本,保证了训练样本的多样性。通过根据训练样本,对设置超参数的票据识别模型进行训练,对训练好的票据识别模型的训练参数进行调整,将待识别银行票据数据输入至调整参数后的票据识别模型中,输出识别结果,保证了模型的工作能力。提高了银行票据的识别准确度。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施例而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种银行票据识别方法,其特征在于,包括:
根据预设字体文件和银行票据内容生成训练样本;
根据训练样本,对设置超参数的票据识别模型进行训练;
对训练好的票据识别模型的训练参数进行调整;
将待识别银行票据数据输入至调整参数后的票据识别模型中,输出识别结果。
2.如权利要求1所述的方法,其特征在于,根据预设字体文件和银行票据内容生成训练样本之后,所述方法还包括:
对所述训练样本进行扩充处理,所述扩充处理包括叠加背景、膨胀腐蚀、高斯模糊、缩放拉升。
3.如权利要求1所述的方法,其特征在于,还包括:
根据错误识别的银行票据,对票据识别模型进行训练。
4.如权利要求1所述的方法,其特征在于,对训练好的票据识别模型的训练参数进行调整,包括:
为不同票据类型的训练样本配置不同的权重;
根据配置有不同权重的训练样本对票据识别模型进行训练。
5.一种银行票据识别装置,其特征在于,包括:
训练样本生成模块,用于根据预设字体文件和银行票据内容生成训练样本;
模型训练模块,用于根据训练样本,对设置超参数的票据识别模型进行训练;
参数调整模块,用于对训练好的票据识别模型的训练参数进行调整;
票据识别模块,用于将待识别银行票据数据输入至调整参数后的票据识别模型中,输出识别结果。
6.如权利要求5所述的装置,其特征在于,所述装置还包括:
扩充处理模块,用于对所述训练样本进行扩充处理,所述扩充处理包括叠加背景、膨胀腐蚀、高斯模糊、缩放拉升。
7.如权利要求5所述的装置,其特征在于,还包括:
优化训练模块,用于根据错误识别的银行票据,对票据识别模型进行训练。
8.如权利要求5所述的装置,其特征在于,模型训练模块进一步用于:
为不同票据类型的训练样本配置不同的权重;
根据配置有不同权重的训练样本对票据识别模型进行训练。
9.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至4任一项所述方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有执行权利要求1至4任一项所述方法的计算机程序。
CN202010832458.9A 2020-08-18 2020-08-18 银行票据识别方法及装置 Pending CN111967395A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010832458.9A CN111967395A (zh) 2020-08-18 2020-08-18 银行票据识别方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010832458.9A CN111967395A (zh) 2020-08-18 2020-08-18 银行票据识别方法及装置

Publications (1)

Publication Number Publication Date
CN111967395A true CN111967395A (zh) 2020-11-20

Family

ID=73388296

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010832458.9A Pending CN111967395A (zh) 2020-08-18 2020-08-18 银行票据识别方法及装置

Country Status (1)

Country Link
CN (1) CN111967395A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112651340A (zh) * 2020-12-28 2021-04-13 上海商米科技集团股份有限公司 一种购物小票的文字识别方法、系统、终端设备和存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107766809A (zh) * 2017-10-09 2018-03-06 平安科技(深圳)有限公司 电子装置、票据信息识别方法和计算机可读存储介质
CN110263694A (zh) * 2019-06-13 2019-09-20 泰康保险集团股份有限公司 一种票据识别方法及装置
CN110378350A (zh) * 2019-07-23 2019-10-25 中国工商银行股份有限公司 一种文字识别的方法、装置及系统
CN110415119A (zh) * 2019-07-30 2019-11-05 中国工商银行股份有限公司 模型训练、票据交易预测方法、装置、存储介质及设备
CN111161740A (zh) * 2019-12-31 2020-05-15 中国建设银行股份有限公司 意图识别模型训练方法、意图识别方法以及相关装置
CN111414906A (zh) * 2020-03-05 2020-07-14 北京交通大学 纸质票据图片的数据合成与文本识别方法
CN111461100A (zh) * 2020-03-31 2020-07-28 重庆农村商业银行股份有限公司 一种票据识别方法、装置、电子设备和存储介质

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107766809A (zh) * 2017-10-09 2018-03-06 平安科技(深圳)有限公司 电子装置、票据信息识别方法和计算机可读存储介质
CN110263694A (zh) * 2019-06-13 2019-09-20 泰康保险集团股份有限公司 一种票据识别方法及装置
CN110378350A (zh) * 2019-07-23 2019-10-25 中国工商银行股份有限公司 一种文字识别的方法、装置及系统
CN110415119A (zh) * 2019-07-30 2019-11-05 中国工商银行股份有限公司 模型训练、票据交易预测方法、装置、存储介质及设备
CN111161740A (zh) * 2019-12-31 2020-05-15 中国建设银行股份有限公司 意图识别模型训练方法、意图识别方法以及相关装置
CN111414906A (zh) * 2020-03-05 2020-07-14 北京交通大学 纸质票据图片的数据合成与文本识别方法
CN111461100A (zh) * 2020-03-31 2020-07-28 重庆农村商业银行股份有限公司 一种票据识别方法、装置、电子设备和存储介质

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112651340A (zh) * 2020-12-28 2021-04-13 上海商米科技集团股份有限公司 一种购物小票的文字识别方法、系统、终端设备和存储介质

Similar Documents

Publication Publication Date Title
CN111859960B (zh) 基于知识蒸馏的语义匹配方法、装置、计算机设备和介质
CN108205699B (zh) 生成用于神经网络输出层的输出
KR102201936B1 (ko) 신경망을 사용한 텍스트 세그먼트의 의존성 파스 생성
CN111275107A (zh) 一种基于迁移学习的多标签场景图像分类方法及装置
CN113140018B (zh) 训练对抗网络模型的方法、建立字库的方法、装置和设备
CN114970522A (zh) 语言模型的预训练方法、装置、设备、存储介质
TW201633181A (zh) 用於經非同步脈衝調制的取樣信號的事件驅動型時間迴旋
JP7412489B2 (ja) 連合学習方法及び装置、電子機器、記憶媒体ならびにコンピュータプログラム
CN113378855A (zh) 用于处理多任务的方法、相关装置及计算机程序产品
CN105335375A (zh) 主题挖掘方法和装置
CN113361567B (zh) 图像处理方法、装置、电子设备和存储介质
CN111967395A (zh) 银行票据识别方法及装置
CN114186681A (zh) 用于生成模型簇的方法、装置及计算机程序产品
CN111680514B (zh) 信息处理和模型训练方法、装置、设备及存储介质
CN116912653A (zh) 一种模型训练方法、装置及电子设备
CN115147547B (zh) 人体重建方法和装置
CN115935909A (zh) 一种文件生成方法、装置及电子设备
CN113887535B (zh) 模型训练方法、文本识别方法、装置、设备和介质
CN114241411B (zh) 基于目标检测的计数模型处理方法、装置及计算机设备
CN113127058B (zh) 数据标注方法、相关装置及计算机程序产品
CN106776552A (zh) 文件识别方法、装置、服务器和计算机存储介质
CN114676835A (zh) 基于模式的神经网络修剪
CN113361719A (zh) 基于图像处理模型的增量学习方法和图像处理方法
CN108182210B (zh) 基于页面信息解析的服务语义获取方法及系统
CN111062477A (zh) 一种数据处理方法、装置及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination