CN115909348A - 一种银行电子回单的识别方法和装置 - Google Patents

一种银行电子回单的识别方法和装置 Download PDF

Info

Publication number
CN115909348A
CN115909348A CN202211404402.9A CN202211404402A CN115909348A CN 115909348 A CN115909348 A CN 115909348A CN 202211404402 A CN202211404402 A CN 202211404402A CN 115909348 A CN115909348 A CN 115909348A
Authority
CN
China
Prior art keywords
electronic receipt
target
receipt
recognition
electronic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211404402.9A
Other languages
English (en)
Inventor
肖建伟
柴晓男
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Hesi Information Technology Co Ltd
Original Assignee
Beijing Hesi Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Hesi Information Technology Co Ltd filed Critical Beijing Hesi Information Technology Co Ltd
Priority to CN202211404402.9A priority Critical patent/CN115909348A/zh
Publication of CN115909348A publication Critical patent/CN115909348A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Character Input (AREA)

Abstract

本发明提供了一种银行电子回单的识别方法和装置,涉及数据处理的技术领域,包括:获取样本电子回单,对样本电子回单进行预处理,得到目标样本电子回单;基于目标样本电子回单对应的银行,对样本电子回单进行分类,得到多个电子回单集;利用多个电子回单集对多个初始识别模型进行训练,得到多个目标识别模型,其中,一个初始识别模型对应一个电子回单集,初始识别模型用于识别电子回单中的文字;在获取到待识别电子回单之后,利用待识别电子回单对应的目标识别模型识别出待识别电子回单的识别结果,并将识别结果发送给用户,解决了现有的银行电子回单的识别方法的识别准确率较低的技术问题。

Description

一种银行电子回单的识别方法和装置
技术领域
本发明涉及数据处理的技术领域,尤其是涉及一种银行电子回单的识别方法和装置。
背景技术
为了获取电子银行回单对应的结构化数据,一般采用OCR识别方式,对电子银行回单进行文字识别。目前市面上的OCR技术,一般是获取海量的电子银行回单文件,然后组成数据集,然后使用数据集使用人工智能算法训练出一个通用的电子银行回单识别模型出来,进行电子银行回单识别。
由于银行种类繁多,银行回单文件样式多变,增加了OCR识别率提升的难度,通用识别模型识别率的提升会因种类太多受到阻碍,而且新增一个银行,旧有的模型难以匹配,额外训练需要考虑新银行类型和旧有数据的兼容性。
针对上述问题,还未提出有效的解决方案。
发明内容
有鉴于此,本发明的目的在于提供一种银行电子回单的识别方法和装置,以缓解了现有的银行电子回单的识别方法的识别准确率较低的技术问题。
第一方面,本发明实施例提供了一种银行电子回单的识别方法,包括:获取样本电子回单,对所述样本电子回单进行预处理,得到目标样本电子回单;基于所述目标样本电子回单对应的银行,对所述样本电子回单进行分类,得到多个电子回单集;利用多个电子回单集对多个初始识别模型进行训练,得到多个目标识别模型,其中,一个初始识别模型对应一个电子回单集,所述初始识别模型用于识别电子回单中的文字;在获取到待识别电子回单之后,利用所述待识别电子回单对应的目标识别模型识别出所述待识别电子回单的识别结果,并将所述识别结果发送给用户。
进一步地,对所述样本电子回单进行预处理,得到目标样本电子回单,包括:确定出所述样本电子回单中的第一电子回单,其中,所述第一电子回单为格式不是图像格式的电子回单;将所述第一电子回单转换为图像格式,得到第二电子回单;将所述第二电子回单和所述样本电子回单中出所述第一电子回单以外的电子回单转化为尺寸统一的第三电子回单;对所述第三电子回单中文字所处区域和所述文字所处区域中的文字进行标注,得到所述目标电子回单。
进一步地,所述初始识别模型包括:基于yolo-v4算法构建的图像抓取模块和基于OCR文字识别算法构建的文字识别模块;
利用多个电子回单集对多个初始识别模型进行训练,得到多个目标识别模型,包括:利用所述多个电子回单集,对多个初始识别模型的图像抓取模块进行训练,得到多个目标识别模型的图像抓取模块;利用所述多个电子回单集,对多个初始识别模型的文字识别模块进行训练,得到多个目标识别模型的文字识别模块。
进一步地,利用所述多个电子回单集,对多个初始识别模型的图像抓取模块进行训练,得到多个目标识别模型的图像抓取模块,包括:
第一输入步骤,将电子回单集中的第一目标电子回单输入所述初始识别模型的图像抓取模块,得到所述第一目标回单中的文字区域的初始坐标信息,其中,所述第一目标电子回单为所述电子回单集中的任意一个电子回单;第一优化步骤,利用所述初始坐标信息和所述第一目标回单中的文字区域的标注,对所述初始识别模型的图像抓取模块进行优化,得到优化后的图像抓取模块;将第二目标电子回单确定为所述第一目标电子回单,将所述优化后的图像抓取模块确定为所述初始识别模型的图像抓取模块,重复执行所述第一输入步骤和所述第一优化步骤,直至所述初始坐标信息与所述第一目标回单中的文字区域的标注之间的误差小于第一预设阈值,并将误差小于第一预设阈值对应的优化后的图像抓取模块确定为目标识别模型的图像抓取模块。
进一步地,利用所述多个电子回单集,对多个初始识别模型的文字识别模块进行训练,得到多个目标识别模型的文字识别模块,包括:分割步骤,对电子回单集中的第三目标电子回单中文字所处区域进行分割,得到多个图像块,其中,一个图像块中包含一个文字;第二输入步骤,将所述多个图像块输入所述初始识别模型的文字识别模块,得到所述第三目标回单的文字识别结果,其中,所述第三目标电子回单为所述电子回单集中的任意一个电子回单;第二优化步骤,利用所述第三目标回单的文字识别结果和所述第三目标回单中的文字区域中文字的标注,对所述初始识别模型的文字识别模块进行优化,得到优化后的文字识别模块;将第四目标电子回单确定为所述第三目标电子回单,将所述优化后的文字识别模块确定为所述初始识别模型的文字识别模块,重复执行所述分割步骤、所述第二输入步骤和所述第二优化步骤,直至所述第三目标回单的文字识别结果与所述第三目标回单中的文字区域种文字的标注之间的错误率小于第二预设阈值,并将错误略小于第二预设阈值对应的优化后的文字模块确定为目标识别模型的文字识别模块。
第二方面,本发明实施例还提供了一种银行电子回单的识别装置,包括:获取单元,用于获取样本电子回单,对所述样本电子回单进行预处理,得到目标样本电子回单;分类单元,用于基于所述目标样本电子回单对应的银行,对所述样本电子回单进行分类,得到多个电子回单集;训练单元,用于利用多个电子回单集对多个初始识别模型进行训练,得到多个目标识别模型,其中,一个初始识别模型对应一个电子回单集,所述初始识别模型用于识别电子回单中的文字;识别单元,用于在获取到待识别电子回单之后,利用所述待识别电子回单对应的目标识别模型识别出所述待识别电子回单的识别结果,并将所述识别结果发送给用户。
进一步地,所述获取单元,用于:确定出所述样本电子回单中的第一电子回单,其中,所述第一电子回单为格式不是图像格式的电子回单;将所述第一电子回单转换为图像格式,得到第二电子回单;将所述第二电子回单和所述样本电子回单中出所述第一电子回单以外的电子回单转化为尺寸统一的第三电子回单;对所述第三电子回单中文字所处区域和所述文字所处区域中的文字进行标注,得到所述目标电子回单。
进一步地,所述初始识别模型包括:基于yolo-v4算法构建的图像抓取模块和基于OCR文字识别算法构建的文字识别模块,则所述训练单元,用于:利用所述多个电子回单集,对多个初始识别模型的图像抓取模块进行训练,得到多个目标识别模型的图像抓取模块;
利用所述多个电子回单集,对多个初始识别模型的文字识别模块进行训练,得到多个目标识别模型的文字识别模块。
第三方面,本发明实施例还提供了一种电子设备,包括存储器以及处理器,所述存储器用于存储支持处理器执行上述第一方面中所述方法的程序,所述处理器被配置为用于执行所述存储器中存储的程序。
第四方面,本发明实施例还提供了一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序。
在本发明实施例中,通过获取样本电子回单,对所述样本电子回单进行预处理,得到目标样本电子回单;基于所述目标样本电子回单对应的银行,对所述样本电子回单进行分类,得到多个电子回单集;利用多个电子回单集对多个初始识别模型进行训练,得到多个目标识别模型,其中,一个初始识别模型对应一个电子回单集,所述初始识别模型用于识别电子回单中的文字;在获取到待识别电子回单之后,利用所述待识别电子回单对应的目标识别模型识别出所述待识别电子回单的识别结果,并将所述识别结果发送给用户,达到了对不同类型的电子回单进行准确识别的目的,进而解决了现有的银行电子回单的识别方法的识别准确率较低的技术问题,从而实现了提高银行电子回单的识别准确率的技术效果。
本发明的其他特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。
为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种银行电子回单的识别方法的流程图;
图2为本发明实施例提供的一种银行电子回单的识别装置的示意图;
图3为本发明实施例提供的一种电子设备的示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例一:
根据本发明实施例,提供了一种银行电子回单的识别方法的实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
图1是根据本发明实施例的一种银行电子回单的识别方法的流程图,如图1所示,该方法包括如下步骤:
步骤S102,获取样本电子回单,对所述样本电子回单进行预处理,得到目标样本电子回单;
步骤S104,基于所述目标样本电子回单对应的银行,对所述样本电子回单进行分类,得到多个电子回单集;
需要说明的是,本申请可以通过各种途径(合作客户提供,对接银行系统获取,第三方接口获取,开放信息获取等)采集各银行的电子银行回单,按照不同的银行类型进行分类,比如中国银行、中国工商银行、平安银行和中信银行等,将同一家银行的电子银行回单文件分为一个类别。如果同一家银行有多种样式,那么同一家银行也再进一步细分,保证同一类样式为一个类别,确定将同一类样式的电子银行回单文件放入同一个类别。
步骤S106,利用多个电子回单集对多个初始识别模型进行训练,得到多个目标识别模型,其中,一个初始识别模型对应一个电子回单集,所述初始识别模型用于识别电子回单中的文字;
步骤S108,在获取到待识别电子回单之后,利用所述待识别电子回单对应的目标识别模型识别出所述待识别电子回单的识别结果,并将所述识别结果发送给用户。
在本发明实施例中,通过获取样本电子回单,对所述样本电子回单进行预处理,得到目标样本电子回单;基于所述目标样本电子回单对应的银行,对所述样本电子回单进行分类,得到多个电子回单集;利用多个电子回单集对多个初始识别模型进行训练,得到多个目标识别模型,其中,一个初始识别模型对应一个电子回单集,所述初始识别模型用于识别电子回单中的文字;在获取到待识别电子回单之后,利用所述待识别电子回单对应的目标识别模型识别出所述待识别电子回单的识别结果,并将所述识别结果发送给用户,达到了对不同类型的电子回单进行准确识别的目的,进而解决了现有的银行电子回单的识别方法的识别准确率较低的技术问题,从而实现了提高银行电子回单的识别准确率的技术效果。
在本发明实施例中,步骤S102包括如下步骤:
确定出所述样本电子回单中的第一电子回单,其中,所述第一电子回单为格式不是图像格式的电子回单;
将所述第一电子回单转换为图像格式,得到第二电子回单;
将所述第二电子回单和所述样本电子回单中出所述第一电子回单以外的电子回单转化为尺寸统一的第三电子回单;
对所述第三电子回单中文字所处区域和所述文字所处区域中的文字进行标注,得到所述目标电子回单。
在本发明实施例中,如果样本电子银行回单本身是图像,那么可以直接使用,缩放成样式的统一长宽尺寸。如果样本电子银行回单不是图像,而是pdf或者ofd等文件,那么则利用第三方工具将pdf或ofd文件转成图像,然后再转成统一长宽尺寸大小。
接着,所有电子银行回单文件转成统一长款尺寸大小后,再手动进行标注,将图像上有文字的地方用矩形标注出来,记录矩形的在图像的位置,然后标记对应的文字。
在本发明实施例中,所述初始识别模型包括:基于yolo-v4算法构建的图像抓取模块和基于OCR文字识别算法构建的文字识别模块;步骤S106包括如下步骤:
步骤S11,利用所述多个电子回单集,对多个初始识别模型的图像抓取模块进行训练,得到多个目标识别模型的图像抓取模块;
步骤S12,利用所述多个电子回单集,对多个初始识别模型的文字识别模块进行训练,得到多个目标识别模型的文字识别模块。
具体的,步骤S11包括如下步骤:第一输入步骤,将电子回单集中的第一目标电子回单输入所述初始识别模型的图像抓取模块,得到所述第一目标回单中的文字区域的初始坐标信息,其中,所述第一目标电子回单为所述电子回单集中的任意一个电子回单;
第一优化步骤,利用所述初始坐标信息和所述第一目标回单中的文字区域的标注,对所述初始识别模型的图像抓取模块进行优化,得到优化后的图像抓取模块;
将第二目标电子回单确定为所述第一目标电子回单,将所述优化后的图像抓取模块确定为所述初始识别模型的图像抓取模块,重复执行所述第一输入步骤和所述第一优化步骤,直至所述初始坐标信息与所述第一目标回单中的文字区域的标注之间的误差小于第一预设阈值,并将误差小于第一预设阈值对应的优化后的图像抓取模块确定为目标识别模型的图像抓取模块。
在本发明实施例中,首先使用yolo-v4算法对目标样本电子回单中的文字区域进行抓取,抓取出带有文字的矩形部分,与文字区域的标注进行比对。
反复训练多轮,直到图像抓取模块抓取图像文字目标位置坐标值和实际标注文字位置坐标值相差在1%以内时,停止训练,得到目标识别模型的图像抓取模块。
具体的,步骤S12包括如下步骤:
分割步骤,对电子回单集中的第三目标电子回单中文字所处区域进行分割,得到多个图像块,其中,一个图像块中包含一个文字;
第二输入步骤,将所述多个图像块输入所述初始识别模型的文字识别模块,得到所述第三目标回单的文字识别结果,其中,所述第三目标电子回单为所述电子回单集中的任意一个电子回单;
第二优化步骤,利用所述第三目标回单的文字识别结果和所述第三目标回单中的文字区域中文字的标注,对所述初始识别模型的文字识别模块进行优化,得到优化后的文字识别模块;
将第四目标电子回单确定为所述第三目标电子回单,将所述优化后的文字识别模块确定为所述初始识别模型的文字识别模块,重复执行所述分割步骤、所述第二输入步骤和所述第二优化步骤,直至所述第三目标回单的文字识别结果与所述第三目标回单中的文字区域种文字的标注之间的错误率小于第二预设阈值,并将错误略小于第二预设阈值对应的优化后的文字模块确定为目标识别模型的文字识别模块。
在本发明实施例中,对标记好图像文字位置的目标电子银行回单进行切割,将带有文字的图像部分单独切割出来,然后将图像进一步按照文字切割,切割成一个个文字的小块,得到图像块。
然后将图像块输入文字识别模块,得到文字识别结果,然后将文字识别结果与文字的标注进行比对,观察识别准确度。
反复训练多轮,直接算法模型识别后的文字错误率降到0.01%以下。
最后,使用测试训练集测试目标识别模型,确保目标识别模型的准确率。
分别按照不同的电子银行回单类型,分开训练目标抓取的模型和文字OCR识别的模型,直接获取到每个分类的目标识别模型。
下面对步骤S108进行详细说明。
当获取到待识别电子回单时,由目标用户先行选择电子回单样式(电子回单样式用于表征电子回单对应的分类),此处有人工主观性,不可随意选择,必须文件和样式对应。如果文件和样式不对应,那么识别准确率会大大降低。
然后,对电子银行回单进行统一尺寸图像化。如果电子回单本身是图像,那么可以直接使用,缩放成样式的统一长宽尺寸。如果电子银行回单文件不是图像,而是pdf或者ofd等文件,那么则利用第三方工具将pdf或ofd文件转成图像,然后再转成统一长宽尺寸大小。
然后利用目标用户选择的待识别电子回单的类型对应的目标识别模型对待识别电子回单进行单识别,识别出对应的区域和文字结果(即,待识别电子回单的识别结果)。
然后将识别结果回显给目标用户的交互终端,由目标用户进行下一步处理。
如果有识别错误的地方,目标用户还进行识别结果修改后保存中心化数据库。
同时,修改后的识别结果也会回传给平台,由平台根据修改后的识别结果再次当作训练数据进行训练,提高模型的准确率。
在本发明实施例中,将电子回单按照不同的样式分开训练,得到不同的模型,这种针对性的训练可以提高电子银行回单识别的准确率。同时,将电子银行回单识别,先进行目标抓取,然后进行文字OCR识别。分成两个模型,针对性的识别处理,也可以提高电子银行回单识别的准确率。
本发明实施例优化了传统的一套模型进行识别电子银行回单的低准确率,以及模型参数大,使用样本多的弊端。
目前在国内电子会计档案行业和银行电子回单识别领域内,还没有公开使用过类似技术的报告,填补了国内电子会计档案行业和银行电子回单识别领域的技术空白。
实施例二:
本发明实施例还提供了一种银行电子回单的识别装置,该银行电子回单的识别装置用于执行本发明实施例上述内容所提供的银行电子回单的识别方法,以下是本发明实施例提供的银行电子回单的识别装置的具体介绍。
如图2所示,图2为上述银行电子回单的识别装置的示意图,该银行电子回单的识别装置包括:
获取单元10,用于获取样本电子回单,对所述样本电子回单进行预处理,得到目标样本电子回单;
分类单元20,用于基于所述目标样本电子回单对应的银行,对所述样本电子回单进行分类,得到多个电子回单集;
训练单元30,用于利用多个电子回单集对多个初始识别模型进行训练,得到多个目标识别模型,其中,一个初始识别模型对应一个电子回单集,所述初始识别模型用于识别电子回单中的文字;
识别单元40,用于在获取到待识别电子回单之后,利用所述待识别电子回单对应的目标识别模型识别出所述待识别电子回单的识别结果,并将所述识别结果发送给用户。
在本发明实施例中,通过获取样本电子回单,对所述样本电子回单进行预处理,得到目标样本电子回单;基于所述目标样本电子回单对应的银行,对所述样本电子回单进行分类,得到多个电子回单集;利用多个电子回单集对多个初始识别模型进行训练,得到多个目标识别模型,其中,一个初始识别模型对应一个电子回单集,所述初始识别模型用于识别电子回单中的文字;在获取到待识别电子回单之后,利用所述待识别电子回单对应的目标识别模型识别出所述待识别电子回单的识别结果,并将所述识别结果发送给用户,达到了对不同类型的电子回单进行准确识别的目的,进而解决了现有的银行电子回单的识别方法的识别准确率较低的技术问题,从而实现了提高银行电子回单的识别准确率的技术效果。
实施例三:
本发明实施例还提供了一种电子设备,包括存储器以及处理器,所述存储器用于存储支持处理器执行上述实施例一中所述方法的程序,所述处理器被配置为用于执行所述存储器中存储的程序。
参见图3,本发明实施例还提供一种电子设备100,包括:处理器50,存储器51,总线52和通信接口53,所述处理器50、通信接口53和存储器51通过总线52连接;处理器50用于执行存储器51中存储的可执行模块,例如计算机程序。
其中,存储器51可能包含高速随机存取存储器(RAM,Random Access Memory),也可能还包括非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。通过至少一个通信接口53(可以是有线或者无线)实现该系统网元与至少一个其他网元之间的通信连接,可以使用互联网,广域网,本地网,城域网等。
总线52可以是ISA总线、PCI总线或EISA总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示,图3中仅用一个双向箭头表示,但并不表示仅有一根总线或一种类型的总线。
其中,存储器51用于存储程序,所述处理器50在接收到执行指令后,执行所述程序,前述本发明实施例任一实施例揭示的流过程定义的装置所执行的方法可以应用于处理器50中,或者由处理器50实现。
处理器50可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器50中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器50可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(Digital SignalProcessing,简称DSP)、专用集成电路(Application Specific Integrated Circuit,简称ASIC)、现成可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本发明实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器51,处理器50读取存储器51中的信息,结合其硬件完成上述方法的步骤。
实施例四:
本发明实施例还提供了一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器运行时执行上述实施例一中所述方法的步骤。
另外,在本发明实施例的描述中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
在本发明的描述中,需要说明的是,术语“中心”、“上”、“下”、“左”、“右”、“竖直”、“水平”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
最后应说明的是:以上所述实施例,仅为本发明的具体实施方式,用以说明本发明的技术方案,而非对其限制,本发明的保护范围并不局限于此,尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。

Claims (10)

1.一种银行电子回单的识别方法,其特征在于,包括:
获取样本电子回单,对所述样本电子回单进行预处理,得到目标样本电子回单;
基于所述目标样本电子回单对应的银行,对所述样本电子回单进行分类,得到多个电子回单集;
利用多个电子回单集对多个初始识别模型进行训练,得到多个目标识别模型,其中,一个初始识别模型对应一个电子回单集,所述初始识别模型用于识别电子回单中的文字;
在获取到待识别电子回单之后,利用所述待识别电子回单对应的目标识别模型识别出所述待识别电子回单的识别结果,并将所述识别结果发送给用户。
2.根据权利要求1所述的方法,其特征在于,对所述样本电子回单进行预处理,得到目标样本电子回单,包括:
确定出所述样本电子回单中的第一电子回单,其中,所述第一电子回单为格式不是图像格式的电子回单;
将所述第一电子回单转换为图像格式,得到第二电子回单;
将所述第二电子回单和所述样本电子回单中出所述第一电子回单以外的电子回单转化为尺寸统一的第三电子回单;
对所述第三电子回单中文字所处区域和所述文字所处区域中的文字进行标注,得到所述目标电子回单。
3.根据权利要求2所述的方法,其特征在于,所述初始识别模型包括:基于yolo-v4算法构建的图像抓取模块和基于OCR文字识别算法构建的文字识别模块;
利用多个电子回单集对多个初始识别模型进行训练,得到多个目标识别模型,包括:
利用所述多个电子回单集,对多个初始识别模型的图像抓取模块进行训练,得到多个目标识别模型的图像抓取模块;
利用所述多个电子回单集,对多个初始识别模型的文字识别模块进行训练,得到多个目标识别模型的文字识别模块。
4.根据权利要求1所述的方法,其特征在于,利用所述多个电子回单集,对多个初始识别模型的图像抓取模块进行训练,得到多个目标识别模型的图像抓取模块,包括:
第一输入步骤,将电子回单集中的第一目标电子回单输入所述初始识别模型的图像抓取模块,得到所述第一目标回单中的文字区域的初始坐标信息,其中,所述第一目标电子回单为所述电子回单集中的任意一个电子回单;
第一优化步骤,利用所述初始坐标信息和所述第一目标回单中的文字区域的标注,对所述初始识别模型的图像抓取模块进行优化,得到优化后的图像抓取模块;
将第二目标电子回单确定为所述第一目标电子回单,将所述优化后的图像抓取模块确定为所述初始识别模型的图像抓取模块,重复执行所述第一输入步骤和所述第一优化步骤,直至所述初始坐标信息与所述第一目标回单中的文字区域的标注之间的误差小于第一预设阈值,并将误差小于第一预设阈值对应的优化后的图像抓取模块确定为目标识别模型的图像抓取模块。
5.根据权利要求3所述的方法,其特征在于,利用所述多个电子回单集,对多个初始识别模型的文字识别模块进行训练,得到多个目标识别模型的文字识别模块,包括:
分割步骤,对电子回单集中的第三目标电子回单中文字所处区域进行分割,得到多个图像块,其中,一个图像块中包含一个文字;
第二输入步骤,将所述多个图像块输入所述初始识别模型的文字识别模块,得到所述第三目标回单的文字识别结果,其中,所述第三目标电子回单为所述电子回单集中的任意一个电子回单;
第二优化步骤,利用所述第三目标回单的文字识别结果和所述第三目标回单中的文字区域中文字的标注,对所述初始识别模型的文字识别模块进行优化,得到优化后的文字识别模块;
将第四目标电子回单确定为所述第三目标电子回单,将所述优化后的文字识别模块确定为所述初始识别模型的文字识别模块,重复执行所述分割步骤、所述第二输入步骤和所述第二优化步骤,直至所述第三目标回单的文字识别结果与所述第三目标回单中的文字区域种文字的标注之间的错误率小于第二预设阈值,并将错误略小于第二预设阈值对应的优化后的文字模块确定为目标识别模型的文字识别模块。
6.一种银行电子回单的识别装置,其特征在于,包括:
获取单元,用于获取样本电子回单,对所述样本电子回单进行预处理,得到目标样本电子回单;
分类单元,用于基于所述目标样本电子回单对应的银行,对所述样本电子回单进行分类,得到多个电子回单集;
训练单元,用于利用多个电子回单集对多个初始识别模型进行训练,得到多个目标识别模型,其中,一个初始识别模型对应一个电子回单集,所述初始识别模型用于识别电子回单中的文字;
识别单元,用于在获取到待识别电子回单之后,利用所述待识别电子回单对应的目标识别模型识别出所述待识别电子回单的识别结果,并将所述识别结果发送给用户。
7.根据权利要求6所述的装置,其特征在于,所述获取单元,用于:
确定出所述样本电子回单中的第一电子回单,其中,所述第一电子回单为格式不是图像格式的电子回单;
将所述第一电子回单转换为图像格式,得到第二电子回单;
将所述第二电子回单和所述样本电子回单中出所述第一电子回单以外的电子回单转化为尺寸统一的第三电子回单;
对所述第三电子回单中文字所处区域和所述文字所处区域中的文字进行标注,得到所述目标电子回单。
8.根据权利要求7所述的装置,其特征在于,所述初始识别模型包括:基于yolo-v4算法构建的图像抓取模块和基于OCR文字识别算法构建的文字识别模块,则所述训练单元,用于:
利用所述多个电子回单集,对多个初始识别模型的图像抓取模块进行训练,得到多个目标识别模型的图像抓取模块;
利用所述多个电子回单集,对多个初始识别模型的文字识别模块进行训练,得到多个目标识别模型的文字识别模块。
9.一种电子设备,其特征在于,包括存储器以及处理器,所述存储器用于存储支持处理器执行权利要求1至5任一项所述方法的程序,所述处理器被配置为用于执行所述存储器中存储的程序。
10.一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,其特征在于,计算机程序被处理器运行时执行上述权利要求1至5任一项所述方法的步骤。
CN202211404402.9A 2022-11-10 2022-11-10 一种银行电子回单的识别方法和装置 Pending CN115909348A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211404402.9A CN115909348A (zh) 2022-11-10 2022-11-10 一种银行电子回单的识别方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211404402.9A CN115909348A (zh) 2022-11-10 2022-11-10 一种银行电子回单的识别方法和装置

Publications (1)

Publication Number Publication Date
CN115909348A true CN115909348A (zh) 2023-04-04

Family

ID=86493158

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211404402.9A Pending CN115909348A (zh) 2022-11-10 2022-11-10 一种银行电子回单的识别方法和装置

Country Status (1)

Country Link
CN (1) CN115909348A (zh)

Similar Documents

Publication Publication Date Title
CN111177445B (zh) 标准图元的确定方法、图元识别方法、装置和电子设备
WO2020238054A1 (zh) Pdf文档中图表的定位方法、装置及计算机设备
CN109886928B (zh) 一种目标细胞标记方法、装置、存储介质及终端设备
CN110503054B (zh) 文本图像的处理方法及装置
CN111583180B (zh) 一种图像的篡改识别方法、装置、计算机设备及存储介质
CN108579094B (zh) 一种用户界面检测方法及相关装置、系统和存储介质
CN112052813B (zh) 染色体间易位识别方法、装置、电子设备及可读存储介质
WO2021232670A1 (zh) 一种pcb元件识别方法及装置
US20230215125A1 (en) Data identification method and apparatus
CN111027456A (zh) 基于图像识别的机械水表读数识别方法
CN114005126A (zh) 表格重构方法、装置、计算机设备及可读存储介质
CN112784220B (zh) 一种纸质合同防篡改校验方法及系统
CN114549993A (zh) 实验中线段图像的评分方法、系统、设备及可读存储介质
CN113034421A (zh) 一种图像检测方法、装置及存储介质
CN112464925A (zh) 基于机器学习的移动端开户资料银行信息自动提取方法
CN110796039B (zh) 一种面部瑕疵检测方法、装置、电子设备及存储介质
CN114648776B (zh) 一种财务报销数据处理方法和处理系统
CN111079480A (zh) 身份证信息的识别方法、装置及终端设备
CN109389050A (zh) 一种流程图连接关系识别方法
CN113255767B (zh) 票据分类方法、装置、设备及存储介质
CN111199240A (zh) 银行卡识别模型的训练方法、银行卡识别方法以及装置
JP7502570B2 (ja) 酒製品位置決め方法、酒製品情報管理方法及びその装置、デバイス及び記憶媒体
CN112613367A (zh) 票据信息文本框获取方法、系统、设备及存储介质
CN110992299B (zh) 一种检测浏览器兼容性的方法及装置
CN115909348A (zh) 一种银行电子回单的识别方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination