CN107480681A - 基于深度学习的高并发票据识别系统与方法 - Google Patents

基于深度学习的高并发票据识别系统与方法 Download PDF

Info

Publication number
CN107480681A
CN107480681A CN201710652440.9A CN201710652440A CN107480681A CN 107480681 A CN107480681 A CN 107480681A CN 201710652440 A CN201710652440 A CN 201710652440A CN 107480681 A CN107480681 A CN 107480681A
Authority
CN
China
Prior art keywords
bill
deep learning
bank slip
slip recognition
server
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710652440.9A
Other languages
English (en)
Inventor
牛小明
刘�东
唐军
池明辉
田标
肖欣庭
孙永强
蒲文龙
李雁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sichuan Changhong Electric Co Ltd
Original Assignee
Sichuan Changhong Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sichuan Changhong Electric Co Ltd filed Critical Sichuan Changhong Electric Co Ltd
Priority to CN201710652440.9A priority Critical patent/CN107480681A/zh
Publication of CN107480681A publication Critical patent/CN107480681A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1001Protocols in which an application is distributed across nodes in the network for accessing one among a plurality of replicated servers
    • H04L67/1004Server selection for load balancing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Abstract

本发明公开了一种基于深度学习的高并发票据识别系统与方法,统一API接口与票据分类系统相结合,使得该系统对任何票据的输入具有高兼容性;Nginx负载均衡服务器、HTTP SERVER集群、队列服务器与GPU票据识别集群的结合使得该票据识别系统具有高并发性;模板适配、序列定位系统与深度学习的字符识系统相结合使得该票据识别系统具有易操作性;票据分类系统、模板适配序列定位系统、深度学习的字符识别系统、票据字段匹配语义分析系统、票据小类提取语义分析系统和业务字段内容校正语义分析系统相结合使得该票据识别系统具有高的识别率。本发明相对于传统的票据识别系统,具有兼容性好、并发性高、操作性容易和识别率高等优点。

Description

基于深度学习的高并发票据识别系统与方法
技术领域
本发明涉及财务电子化技术领域,具体涉及一种基于深度学习的高并发票据识别系统与方法。
背景技术
近年来,随着我国经济的快速发展,票据的种类和数量呈逐年增多的趋势。财务系统对这些大量的票据进行手工处理,不仅会消耗大量的人力物力,而且工作效率低下。故实现票据的自动化处理,对单一的重复劳动有很大的实用价值,但是如果系统对票据中的有效内容识别率较低,不仅会带来业务风险,同时增加后续手工处理的工作量。因此,票据自动化识别系统需要具备高识别率抗干扰性以及实时性,才能保证其识别结果的可靠性;具有高并发性,才能针对多个客户端进行实时的访问及识别结果返回。
传统的票据识别是通过一系列的预处理操作实现对目标信息的定位和识
别,不断削弱外界干扰从而提高系统识别性能;票据种类繁多、版式多样,并且票据中的字符容易受印章等噪声的干扰,这就增加了票据字符识别的难度;对不同版面的票据进行自动化处理首先需要进行版面分析,实现对目标信息的准确定位与识别。北京文通科技有限公司、ABBYY、厦门云脉科技有限公司、上海合合技术有限公司、汉王、清华紫光等公司具有各自的票据识别系统,但是传统的识别系统对不同票据的不具有高兼容性(针对不同票据识别框架不同,识别接口不同)和高并发性(批量上传与并行处理)、可操作性(提前配置模板)相对较差,识别率有限。
发明内容
本发明克服了现有技术的不足,提供一种基于深度学习的高并发票据识别系统与方法,旨在提高系统效率和并发性。
考虑到现有技术的上述问题,根据本发明公开的一个方面,本发明采用以下技术方案:
一种基于深度学习的高并发票据识别系统,包括:
负载均衡服务器,用于接收客户端上传的待识别的票据图片,并将票据图片分发到不同的网站服务器;
网站服务器,用于将接收到的票据图片写入
队列服务器;
票据识别服务器,用于读取所述队列服务器中的票据图片并进行识别,以及将识别的结果写入所述队列服务器。
为了更好地实现本发明,进一步的技术方案是:
根据本发明的一个实施方案,所述负载均衡服务器上设置用于与客户端连接的统一数据接口。
根据本发明的另一个实施方案,所述票据识别服务器为GPU票据识别服务器。
根据本发明的另一个实施方案,所述票据识别服务器中包括:
票据分类系统,用于通过定义好的模版特征对票据进行识别分类。
根据本发明的另一个实施方案,所述票据识别服务器中包括票据识别框架和票据训练框架。
根据本发明的另一个实施方案,所述票据识别框架包括:
序列定位系统,用于将票据系统进行有效分割,将各个序列字符进行切分;或/和
基于深度学习的字符识别系统,用于将序列字符进行拆分成各个字符,分别进入深度学习的字符识别系统进行字符识别;或/和
票据字段匹配语义分析系统,用于将识别的结果进行拼凑,结合票据模板的位置信息,组合成key-value键值对进行输出;或/和
票据小类提取语义分析系统,用于结合票据的字符输出以及业务票据的类型特征,提取票据的小类名称;或/和
业务字段内容校正语义分析系统,用于根据业务的需求和数据库已有数据字段做模糊匹配,将输出不完全正确的字段进行校正。
根据本发明的另一个实施方案,所述票据训练框架包括:
集中了中文的常用简体字体,英文字符和阿拉伯数字以及大写数字,且对各类字符进行了多种图像预处理的字符样本集;或/和
含有大类和小类的票据模板样本库。
根据本发明的另一个实施方案,所述票据训练框架包括:
深度学习的字符训练系统,通过已知的字符及其结果,构建CNN模型,训练网络达到收敛,用于字符识别。
根据本发明的另一个实施方案,所述票据训练框架包括:
深度学习的模板适配、序列定位训练系统,用于在票据分类之后,通过已知的模板、序列及其结果,构建CNN模型,训练网络达到收敛;以及用于识别过程中自适应定位票据图像与模板样本集的适配。
本发明还可以是:
一种基于深度学习的高并发票据识别方法,包括:
负载均衡服务器将接收到的待识别的票据图片,分发到不同的网站服务器;
网站服务器将接收到的票据图片写入队列服务器;
票据识别服务器读取所述队列服务器中的票据图片并进行识别,以及将识别的结果写入所述队列服务器。
与现有技术相比,本发明的有益效果之一是:
本发明的一种基于深度学习的高并发票据识别系统与方法,可通过统一API接口与票据分类系统相结合,使得该系统对任何票据的输入具有高兼容性;Nginx负载均衡服务器、HTTP SERVER集群、队列服务器与GPU票据识别集群的结合使得该票据识别系统具有高并发性;模板适配、序列定位系统与深度学习的字符识系统相结合使得该票据识别系统具有易操作性;票据分类系统、模板适配序列定位系统、深度学习的字符识别系统、票据字段匹配语义分析系统、票据小类提取语义分析系统和业务字段内容校正语义分析系统相结合使得该票据识别系统具有高的识别率。
附图说明
为了更清楚的说明本申请文件实施例或现有技术中的技术方案,下面将对实施例或现有技术的描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅是对本申请文件中一些实施例的参考,对于本领域技术人员来讲,在不付出创造性劳动的情况下,还可以根据这些附图得到其它的附图。
图1为根据本发明一个实施例的高并发的票据识别系统架构框图。
图2为根据本发明一个实施例的深度学习GPU票据识别框架示意图。
图3为根据本发明一个实施例的深度学习GPU字符训练框架示意图。
具体实施方式
下面结合实施例对本发明作进一步地详细说明,但本发明的实施方式不限于此。
本发明提供了一种基于深度学习的高并发票据识别系统,对外暴露统一的票据识别接口,用于客户端上传待识别的票据;针对外围不同客户端高并发访问,Nginx作为负载均衡器,自动将图片分发到不同的HTTP SERVER中,当HTTPSERVER收到图片之后,会将该图片写入到队列服务器中;不同的GPU票据识别服务器不停地从队列服务器中读取图片,GPU的并发运算和票据识别深度学习框架将票据识别结果写入到队列服务器中;客户端通过输入的order_nuber去轮训读取票据识别的结果,该任务会借助负载均衡器分发到不同的HTTP SERVER中,然后去队列服务器中查询识别结果,并将结果返回。相对于传统的票据识别系统,该系统具有兼容性好、并发性高、操作性容易和识别率高等优点。
高并发的票据识别系统:
高并发的票据识别系统主要包括Nginx负载均衡服务器、HTTP SERVER集群、队列服务器、GPU深度学习票据识别集群几部分组成。
高并发上传图片流程:客户端借助统一API接口上传票据至票据识别系统;Nginx作为负载均衡器,针对外围不同客户端高并发访问,自动将图片分发到不同的HTTP SERVER(HTTP SERVER采用Nginx+uWsgi+Django架构)中,当HTTPSERVER收到图片之后,会将该图片写入到队列服务器中的QUEUE_IMAGE队列中;
高并发票据识别流程:不同的GPU票据识别服务器并发地从队列服务器QUEUE_IMAGE队列中读取图片,GPU的并发运算和票据识别深度学习框架将票据识别结果不停地写入到队列服务器QUEUE_RESULT队列中;
高并发识别结果返回流程:客户端通过输入的order_number(输入票据的唯一标识号)去轮训读取票据识别的结果,该任务会借助Nginx负载均衡器分发到不同的HTTPSERVER中,然后去队列服务器QUEUE_RESULT队列中查询识别结果,并将结果返回。
相对于传统的票据识别系统,该系统具有兼容性好、并发性高、操作性容易和识别率高等优点。
深度学习GPU票据识别系统:
深度学习GPU票据识别系统包含深度学习GPU票据识别框架和深度学习GPU字符训练框架两部分。
深度学习GPU票据识别框架:
深度学习GPU票据识别框架主要包含以下几部分:票据分类系统;模板适配、序列定位系统;基于深度学习的字符识别系统、票据字段匹配语义分析系统、票据小类提取语义分析系统、业务字段内容校正语义分析系统。
票据分类系统:通过定义好的模版特征对票据进行识别分类,比如中行转账电子回单的左上角的矩形框内,有圆形特征和序列特征。
序列定位系统:将票据系统进行有效分割,将各个序列字符切分出来,比如借助MSER算法。
基于深度学习的字符识别系统:将序列字符进行拆分成各个字符,分别进入深度学习的字符识别系统进行字符识别,深度学习的字符识别系统是借助CNN网络构建识别和训练。
票据字段匹配语义分析系统:主要是将识别的结果进行拼凑,结合票据模板的位置信息,组合成key-value键值对进行输出。
票据小类提取语义分析系统:主要是结合票据的字符输出以及业务票据的类型特征,将票据的小类名称提取出来;比如增值税电子普通发票,单据名称中包含“电子普通”字样。
业务字段内容校正语义分析系统:主要是结合业务的需求,和数据库已有数据字段做模糊匹配,将输出不完全正确的字段进行校正,得到正确结果,从而提升字符和字段识别率;比如销售方:四川长虹股份有限公司,识别成四川长红股份有限公司,结合数据库的模糊匹配,纠正为“四川长虹股份有限公司”。
深度学习GPU训练框架
深度学习GPU训练框架包含深度学习的字符训练系统和字符样本集;深度学习的模板适配、序列定位训练系统和模板样本集;
其中,字符样本集集中了中文的常用简体字体,英文字符和阿拉伯数字以及大写数字,且对各类字符进行了多种图像预处理,包含加噪、上下左右平移、旋转等操作,且构建形成了新的字符集合。
模板样本集包含了几十个大类、几百个小类的票据模板样本库。
深度学习的模板适配、序列定位训练系统用于在票据分类之后,通过已知的模板、序列及其结果,构建CNN模型,训练网络达到收敛;用于识别过程中自适应定位票据图像与模板样本集的适配,包括角度及位置;且将每个序列所在的位置及该序列准确提取出来,用于进一步的字符识别。
深度学习的字符训练系统是用于字符的训练,通过已知的字符及其结果,构建CNN模型,训练网络达到收敛,用于字符识别。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同相似部分相互参见即可。
在本说明书中所谈到的“一个实施例”、“另一个实施例”、“实施例”、等,指的是结合该实施例描述的具体特征、结构或者特点包括在本申请概括性描述的至少一个实施例中。在说明书中多个地方出现同种表述不是一定指的是同一个实施例。进一步来说,结合任一实施例描述一个具体特征、结构或者特点时,所要主张的是结合其他实施例来实现这种特征、结构或者特点也落在本发明的范围内。
尽管这里参照本发明的多个解释性实施例对本发明进行了描述,但是,应该理解,本领域技术人员可以设计出很多其他的修改和实施方式,这些修改和实施方式将落在本申请公开的原则范围和精神之内。更具体地说,在本申请公开和权利要求的范围内,可以对主题组合布局的组成部件和/或布局进行多种变型和改进。除了对组成部件和/或布局进行的变型和改进外,对于本领域技术人员来说,其他的用途也将是明显的。

Claims (10)

1.一种基于深度学习的高并发票据识别系统,其特征在于包括:
负载均衡服务器,用于接收客户端上传的待识别的票据图片,并将票据图片分发到不同的网站服务器;
网站服务器,用于将接收到的票据图片写入
队列服务器;
票据识别服务器,用于读取所述队列服务器中的票据图片并进行识别,以及将识别的结果写入所述队列服务器。
2.根据权利要求1所述的基于深度学习的高并发票据识别系统,其特征在于所述负载均衡服务器上设置用于与客户端连接的统一数据接口。
3.根据权利要求1所述的基于深度学习的高并发票据识别系统,其特征在于所述票据识别服务器为GPU票据识别服务器。
4.根据权利要求1所述的基于深度学习的高并发票据识别系统,其特征在于所述票据识别服务器中包括:
票据分类系统,用于通过定义好的模版特征对票据进行识别分类。
5.根据权利要求1所述的基于深度学习的高并发票据识别系统,其特征在于所述票据识别服务器中包括票据识别框架和票据训练框架。
6.根据权利要求5所述的基于深度学习的高并发票据识别系统,其特征在于所述票据识别框架包括:
序列定位系统,用于将票据系统进行有效分割,将各个序列字符进行切分;或/和
基于深度学习的字符识别系统,用于将序列字符进行拆分成各个字符,分别进入深度学习的字符识别系统进行字符识别;或/和
票据字段匹配语义分析系统,用于将识别的结果进行拼凑,结合票据模板的位置信息,组合成key-value键值对进行输出;或/和
票据小类提取语义分析系统,用于结合票据的字符输出以及业务票据的类型特征,提取票据的小类名称;或/和
业务字段内容校正语义分析系统,用于根据业务的需求和数据库已有数据字段做模糊匹配,将输出不完全正确的字段进行校正。
7.根据权利要求5所述的基于深度学习的高并发票据识别系统,其特征在于所述票据训练框架包括:
集中了中文的常用简体字体,英文字符和阿拉伯数字以及大写数字,且对各类字符进行了多种图像预处理的字符样本集;或/和
含有大类和小类的票据模板样本库。
8.根据权利要求5所述的基于深度学习的高并发票据识别系统,其特征在于所述票据训练框架包括:
深度学习的字符训练系统,通过已知的字符及其结果,构建CNN模型,训练网络达到收敛,用于字符识别。
9.根据权利要求5所述的基于深度学习的高并发票据识别系统,其特征在于所述票据训练框架包括:
深度学习的模板适配、序列定位训练系统,用于在票据分类之后,通过已知的模板、序列及其结果,构建CNN模型,训练网络达到收敛;以及用于识别过程中自适应定位票据图像与模板样本集的适配。
10.一种基于深度学习的高并发票据识别方法,其特征在于包括:
负载均衡服务器将接收到的待识别的票据图片,分发到不同的网站服务器;
网站服务器将接收到的票据图片写入队列服务器;
票据识别服务器读取所述队列服务器中的票据图片并进行识别,以及将识别的结果写入所述队列服务器。
CN201710652440.9A 2017-08-02 2017-08-02 基于深度学习的高并发票据识别系统与方法 Pending CN107480681A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710652440.9A CN107480681A (zh) 2017-08-02 2017-08-02 基于深度学习的高并发票据识别系统与方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710652440.9A CN107480681A (zh) 2017-08-02 2017-08-02 基于深度学习的高并发票据识别系统与方法

Publications (1)

Publication Number Publication Date
CN107480681A true CN107480681A (zh) 2017-12-15

Family

ID=60598220

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710652440.9A Pending CN107480681A (zh) 2017-08-02 2017-08-02 基于深度学习的高并发票据识别系统与方法

Country Status (1)

Country Link
CN (1) CN107480681A (zh)

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107977658A (zh) * 2017-12-27 2018-05-01 深圳Tcl新技术有限公司 图像文字区域的识别方法、电视机和可读存储介质
CN108268641A (zh) * 2018-01-18 2018-07-10 大象慧云信息技术有限公司 发票信息识别方法及发票信息识别装置、设备和存储介质
CN109064304A (zh) * 2018-08-03 2018-12-21 四川长虹电器股份有限公司 财务报销票据自动处理系统及方法
CN109086756A (zh) * 2018-06-15 2018-12-25 众安信息技术服务有限公司 一种基于深度神经网络的文本检测分析方法、装置及设备
CN109241271A (zh) * 2018-08-30 2019-01-18 天津做票君机器人科技有限公司 一种汇票交易机器人识别自然语言中汇票到期日的方法
CN110009796A (zh) * 2019-04-11 2019-07-12 北京邮电大学 发票类别识别方法、装置、电子设备及可读存储介质
CN110070665A (zh) * 2019-04-24 2019-07-30 武汉华创欣网科技有限公司 一种基于深度学习的保险票据分类方法
CN110457973A (zh) * 2018-05-07 2019-11-15 北京中海汇银财税服务有限公司 一种票据识别的方法及系统
CN110569835A (zh) * 2018-06-06 2019-12-13 北京搜狗科技发展有限公司 一种图像识别方法、装置和电子设备
CN111401221A (zh) * 2020-03-12 2020-07-10 重庆农村商业银行股份有限公司 一种卡票识别方法、装置、设备及存储介质
CN111783735A (zh) * 2020-07-22 2020-10-16 欧冶云商股份有限公司 一种基于人工智能的钢材单据解析系统
CN111931666A (zh) * 2020-08-13 2020-11-13 中国工商银行股份有限公司 凭证自动化处理系统及方法
CN112115934A (zh) * 2020-09-16 2020-12-22 四川长虹电器股份有限公司 基于深度学习实例分割的票据图像文本检测方法
CN112149654A (zh) * 2020-09-23 2020-12-29 四川长虹电器股份有限公司 基于深度学习的发票文本信息识别方法
CN113537225A (zh) * 2020-04-22 2021-10-22 华晨宝马汽车有限公司 用于字符识别的方法、电子设备和存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105654072A (zh) * 2016-03-24 2016-06-08 哈尔滨工业大学 一种低分辨率医疗票据图像的文字自动提取和识别系统与方法
CN106170016A (zh) * 2016-07-28 2016-11-30 深圳市创梦天地科技有限公司 一种处理高并发数据请求的方法和系统

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105654072A (zh) * 2016-03-24 2016-06-08 哈尔滨工业大学 一种低分辨率医疗票据图像的文字自动提取和识别系统与方法
CN106170016A (zh) * 2016-07-28 2016-11-30 深圳市创梦天地科技有限公司 一种处理高并发数据请求的方法和系统

Cited By (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107977658A (zh) * 2017-12-27 2018-05-01 深圳Tcl新技术有限公司 图像文字区域的识别方法、电视机和可读存储介质
CN108268641A (zh) * 2018-01-18 2018-07-10 大象慧云信息技术有限公司 发票信息识别方法及发票信息识别装置、设备和存储介质
CN110457973A (zh) * 2018-05-07 2019-11-15 北京中海汇银财税服务有限公司 一种票据识别的方法及系统
CN110569835B (zh) * 2018-06-06 2024-03-05 北京搜狗科技发展有限公司 一种图像识别方法、装置和电子设备
CN110569835A (zh) * 2018-06-06 2019-12-13 北京搜狗科技发展有限公司 一种图像识别方法、装置和电子设备
CN109086756A (zh) * 2018-06-15 2018-12-25 众安信息技术服务有限公司 一种基于深度神经网络的文本检测分析方法、装置及设备
WO2019238063A1 (zh) * 2018-06-15 2019-12-19 众安信息技术服务有限公司 文本检测分析方法、装置及设备
JP2020527260A (ja) * 2018-06-15 2020-09-03 ジョンアン インフォメーション テクノロジー サービシズ カンパニー リミテッド テキスト検出分析方法、装置及びデバイス
CN109086756B (zh) * 2018-06-15 2021-08-03 众安信息技术服务有限公司 一种基于深度神经网络的文本检测分析方法、装置及设备
CN109064304A (zh) * 2018-08-03 2018-12-21 四川长虹电器股份有限公司 财务报销票据自动处理系统及方法
CN109241271A (zh) * 2018-08-30 2019-01-18 天津做票君机器人科技有限公司 一种汇票交易机器人识别自然语言中汇票到期日的方法
CN109241271B (zh) * 2018-08-30 2021-09-17 天津做票君机器人科技有限公司 一种汇票交易机器人识别自然语言中汇票到期日的方法
CN110009796A (zh) * 2019-04-11 2019-07-12 北京邮电大学 发票类别识别方法、装置、电子设备及可读存储介质
CN110009796B (zh) * 2019-04-11 2020-12-04 北京邮电大学 发票类别识别方法、装置、电子设备及可读存储介质
CN110070665B (zh) * 2019-04-24 2021-05-28 武汉华创欣网科技有限公司 一种基于深度学习的保险票据分类方法
CN110070665A (zh) * 2019-04-24 2019-07-30 武汉华创欣网科技有限公司 一种基于深度学习的保险票据分类方法
CN111401221A (zh) * 2020-03-12 2020-07-10 重庆农村商业银行股份有限公司 一种卡票识别方法、装置、设备及存储介质
CN113537225A (zh) * 2020-04-22 2021-10-22 华晨宝马汽车有限公司 用于字符识别的方法、电子设备和存储介质
CN111783735B (zh) * 2020-07-22 2021-01-22 欧冶云商股份有限公司 一种基于人工智能的钢材单据解析系统
CN111783735A (zh) * 2020-07-22 2020-10-16 欧冶云商股份有限公司 一种基于人工智能的钢材单据解析系统
CN111931666A (zh) * 2020-08-13 2020-11-13 中国工商银行股份有限公司 凭证自动化处理系统及方法
CN111931666B (zh) * 2020-08-13 2024-02-13 中国工商银行股份有限公司 凭证自动化处理系统及方法
CN112115934A (zh) * 2020-09-16 2020-12-22 四川长虹电器股份有限公司 基于深度学习实例分割的票据图像文本检测方法
CN112149654A (zh) * 2020-09-23 2020-12-29 四川长虹电器股份有限公司 基于深度学习的发票文本信息识别方法

Similar Documents

Publication Publication Date Title
CN107480681A (zh) 基于深度学习的高并发票据识别系统与方法
CN107766371B (zh) 一种文本信息分类方法及其装置
US20200160050A1 (en) Layout-agnostic complex document processing system
WO2018010657A1 (zh) 结构化文本检测方法和系统、计算设备
US9384389B1 (en) Detecting errors in recognized text
CN109800761A (zh) 基于深度学习模型创建纸质文档结构化数据的方法和终端
US20220309549A1 (en) Identifying key-value pairs in documents
US9990544B1 (en) Data accuracy in OCR by leveraging user data and business rules to improve data accuracy at field level
CN112149663A (zh) 结合rpa和ai的图像文字的提取方法、装置及电子设备
CN111914729A (zh) 凭证关联方法、装置、计算机设备及存储介质
CN113723270A (zh) 基于rpa及ai的文件处理方法及装置
CN112766255A (zh) 一种光学文字识别方法、装置、设备及存储介质
WO2022126978A1 (zh) 发票信息抽取方法、装置、计算机设备及存储介质
Li et al. Historical Chinese character recognition method based on style transfer mapping
CN106384280A (zh) 一种人工智能记账系统及其计算方法
CN111651994A (zh) 一种信息抽取方法、装置、电子设备和存储介质
CN115171143A (zh) 一种电子发票全票面信息提取方法及系统
WO2022247231A1 (zh) 简历筛选方法、简历筛选装置、终端设备及存储介质
CN114185935A (zh) 结合rpa和ai的社保数据处理方法、装置及存储介质
US11120074B2 (en) Streamlining citations and references
Zhang et al. Research on fast text recognition method for financial ticket image
CN111414889A (zh) 基于文字识别的财务报表识别方法及装置
US11341760B2 (en) Form processing and analysis system
CN113807416B (zh) 一种模型训练方法、装置、电子设备以及存储介质
CN115880702A (zh) 数据处理方法、装置、设备、程序产品及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20171215

RJ01 Rejection of invention patent application after publication