CN109064304A - 财务报销票据自动处理系统及方法 - Google Patents

财务报销票据自动处理系统及方法 Download PDF

Info

Publication number
CN109064304A
CN109064304A CN201810877705.XA CN201810877705A CN109064304A CN 109064304 A CN109064304 A CN 109064304A CN 201810877705 A CN201810877705 A CN 201810877705A CN 109064304 A CN109064304 A CN 109064304A
Authority
CN
China
Prior art keywords
bill
picture
subsystem
module
classification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810877705.XA
Other languages
English (en)
Inventor
牛小明
刘�东
唐军
池明辉
肖欣庭
唐辉
胡嘉
展华益
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sichuan Changhong Electric Co Ltd
Original Assignee
Sichuan Changhong Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sichuan Changhong Electric Co Ltd filed Critical Sichuan Changhong Electric Co Ltd
Priority to CN201810877705.XA priority Critical patent/CN109064304A/zh
Publication of CN109064304A publication Critical patent/CN109064304A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/12Accounting
    • G06Q40/125Finance or payroll
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/48Program initiating; Program switching, e.g. by interrupt
    • G06F9/4806Task transfer initiation or dispatching
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • G06V10/267Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Multimedia (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Evolutionary Biology (AREA)
  • Biomedical Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Technology Law (AREA)
  • General Business, Economics & Management (AREA)
  • Character Discrimination (AREA)

Abstract

本发明涉及财务电子化技术领域,其公开了一种财务报销票据自动处理系统及方法,解决传统技术对票据的切分耗费人力,准确度低,需要设置多个票据识别接口,流程复杂的问题。该系统通过自动分割子系统对用户上传的票据图片进行自动分割;通过自动分类子系统对分割后的单张票据图片进行自动分类,通过票据识别子系统的负载均衡服务器根据单张票据图片的对应类别将所述单张票据图片发送给对应的票据识别服务模块进行票据识别,并收集识别结果。通过任务调度子系统轮询负载均衡服务器,获取负载均衡服务器收集的每张票据的识别结果展现给用户。本发明适用于财务报销票据的自动化处理。

Description

财务报销票据自动处理系统及方法
技术领域
本发明涉及财务电子化技术领域,具体涉及财务报销票据自动处理系统及方法。
背景技术
传统的财务报账OCR系统中,对于后台单据的切分通常需要人工进行切分,耗费人力,准确度低;且每类票据对应单独的票据识别子系统,意味着报账系统覆盖N类票据,内部则需对接N个票据识别接口,流程复杂;同时,票据识别采用传统的图像识别方式,识别率低。
发明内容
本发明所要解决的技术问题是:提出一种财务报销票据自动处理系统及方法,解决传统技术对票据的切分耗费人力,准确度低,需要设置多个票据识别接口,流程复杂的问题。
本发明进一步可解决采用传统图像识别方式识别率低的问题。
本发明解决上述技术问题采用的技术方案是:
财务报销票据自动处理系统,包括:
自动分割子系统,用于对用户上传的票据图片进行自动分割,将分割后的票据图片传送给任务调度子系统;
自动分类子系统,用于对分割后的单张票据图片进行自动分类,将分类的结果传送给任务调度子系统;
任务调度子系统,用于将经过自动分割子系统分割后的票据图片发送给自动分类子系统进行分类,将分类结果发送给票据识别子系统的负载均衡服务器,以及通过轮询负载均衡服务器,获取负载均衡服务器收集的每张票据的识别结果展现给用户;
票据识别子系统,包括负载均衡服务器和多个类别的票据识别服务模块,所述负载均衡器根据单张票据图片的对应类别将所述单张票据图片发送给对应的票据识别服务模块进行票据识别,并收集识别结果。
作为进一步优化,所述自动分割子系统包括特征提取模块、特征匹配模块、多框融合模块和分割输出模块;
所述特征提取模块用于对每一类票据样本进行特征提取并保存,在输入待分割的票据后,提取所述输入的票据的特征;
特征匹配模块,用于启用多线程将提取的所述输入的票据的特征与保存的每一类票据样本的特征进行匹配;
多框融合模块,用于根据各个线程的匹配结果在所述输入的票据图片上采用多个位置框框选对应位置的票据图片;
分割输出模块,用于根据所述多个位置框对输入的票据进行分割,输出分割的图像。
作为进一步优化,所述自动分类子系统包括票据分类样本集处理模块、样本训练模块和票据分类模块;
所述票据分类样本集处理模块,用于构建不同种类的票据样本集,并对每一类票据样本赋予对应的标签;
样本训练模块,用于针对每一类票据样本提取特征,利用支持向量机分类算法对提取的特征进行闭环训练分类,形成分类模型;
票据分类模块,用于利用分类模型对新输入的票据进行分类,获得票据分类结果。
作为进一步优化,所述任务调度子系统包括:调度模块和轮询模块;
所述调度模块,用于将经过自动分割子系统分割后的票据图片发送给自动分类子系统进行分类,将分类结果发送给票据识别子系统的负载均衡服务器;
所述轮询模块,用于通过轮询负载均衡服务器,获取负载均衡服务器收集的每张票据的识别结果展现给用户。
作为进一步优化,所述票据识别服务模块包括:图片预处理模块,票据版面分析模块,序列字符截取模块,序列识别模块和结构化输出模块;
所述图片预处理模块,用于对输入的票据图片进行预处理;
所述票据版面分析模块,用于对经过预处理的票据图片进行版面分析;
所述序列字符截取模块,用于对经过版面分析的图片进行序列字符定位和序列字符图片截取;
所述序列识别模块,用于利用深度学习算法对截取的序列字符图片进行序列识别;
结构化输出模块,用于将序列识别的结果进行结构化输出。
此外,本发明基于上述系统,还提出了一种财务报销票据自动处理方法,其包括以下实现步骤:
a.用户将票据图片上传至自动分割子系统;
b.自动分割子系统对票据图片自动分割,将分割后的票据图片传送给任务调度子系统;
c.任务调度子系统对分割后的票据图片进行校验核对,将核对后的票据图片发送给自动分类子系统;
d.自动分类子系统对单张票据图片进行自动分类,将分类的结果传送给任务调度子系统;
e.任务调度子系统对分类的结果进行校验核对后,将分类结果发送给票据识别子系统的负载均衡服务器;
f.票据识别子系统的负载均衡服务器根据单张票据图片的对应类别将所述单张票据图片发送给对应的票据识别服务模块进行票据识别,并收集识别结果;
g.任务调度子系统通过轮询负载均衡服务器,获取负载均衡服务器收集的每张票据的识别结果展现给用户。
作为进一步优化,步骤b中,所述自动分割子系统预先选取票面相对清晰的票据制作模板样本集,并对样本集中的对每一类票据样本进行特征提取并保存;在对输入的票据图片自动分割时,首先,提取输入的票据图片的特征;然后,启用多线程将提取的所述输入的票据图片的特征与保存的每一类票据样本的特征进行匹配;接着,根据各个线程的匹配结果在所述输入的票据图片上采用多个位置框框选对应位置的票据图片;最后根据所述多个位置框对输入的票据进行分割,输出分割的图像。
作为进一步优化,步骤d中,所述自动分类子系统预先构建不同种类的票据样本集,对每一类票据样本赋予对应的标签,并对每一类票据样本提取特征,利用支持向量机分类算法对提取的特征进行闭环训练分类,形成分类模型;在需要对单张票据图片进行分类时,利用训练好的分类模型对输入的单张票据进行分类,获得票据分类结果。
作为进一步优化,步骤f中,所述票据识别服务模块进行票据识别,具体包括:
对输入的票据图片进行预处理;
对经过预处理的票据图片进行版面分析;
对经过版面分析的图片进行序列字符定位和序列字符图片截取;
利用深度学习算法对截取的序列字符图片进行序列识别;
将序列识别的结果进行结构化输出。
作为进一步优化,所述序列识别具体包括:
基于深度学习模型,对序列字符图片经过卷积神经网络提取序列混合特征,对提取的序列混合特征经过双向LSTM网络进行初步预测,将初步预测结果输入至CTC网络进行预测,获得最终的序列识别结果;
所述深度学习模型的训练方法为:
通过中国的汉字、数字以及英文字母构建自造样本集;通过实际的票据构建固定样本集;将构建的数据集通过深度学习网络进行学习,并进行闭环训练形成深度学习模型;所述深度学习网络为:CNN+Bi-LSTM+CTC。
本发明的有益效果是:通过自动分割子系统可对单据上的多张票据进行自动分割,然后,分割后的票据经过自动分类,最后送入到基于深度学习的票据识别子系统。采用自动分割的方式大大节约了人工切分票据的时间,且提升了切分票据的准确度;自动分类子系统对票据进行自动分类,避免了人为操作带来的人类错误,同时节约了人力;最后基于深度学习的字符序列识别通过学习海量的票据字符序列,大大提高了票据字符的识别率。
附图说明
图1为本发明中的财务报销票据自动处理系统构架示意图;
图2为自动分割子系统的处理流程图;
图3为自动分类子系统的处理流程图;
图4为票据识别子系统的处理流程图;
图5为深度学习模型的训练流程图。
具体实施方式
本发明旨在提出一种财务报销票据自动处理系统及方法,解决传统技术对票据的切分耗费人力,准确度低,需要设置多个票据识别接口,流程复杂的问题。针对张贴多票据的报销单,本发明借助自动分割子系统可将此单据进行票据的自动分割,并将分割后的票据自动送入任务调度子系统进行校验核对,核对后的票据发送到自动分类子系统对其进行自动分类,且将分类后的结果返回到任务调度子系统对其进行校验核对;然后,任务调度子系统将分割后的图片和类别打包发送到识别系统的负载均衡服务器,并根据其分类的类别分发到不同的票据识别服务对其进行票据识别,并将识别后的结构化数据返回到识别负载均衡服务器;最后,任务调度子系统通过轮询识别负载均衡服务器取回每张票据的识别结果。
如图1所示,本发明中的财务报销票据自动处理系统包括:自动分割子系统、自动分类子系统、任务调度子系统和票据识别子系统四个部分;各部分的功能如下:
自动分割子系统,用于对用户上传的票据图片进行自动分割,将分割后的票据图片传送给任务调度子系统;
自动分类子系统,用于对分割后的单张票据图片进行自动分类,将分类的结果传送给任务调度子系统;
任务调度子系统,用于将经过自动分割子系统分割后的票据图片发送给自动分类子系统进行分类,将分类结果发送给票据识别子系统的负载均衡服务器,以及通过轮询负载均衡服务器,获取负载均衡服务器收集的每张票据的识别结果展现给用户;
票据识别子系统,包括负载均衡服务器和多个类别的票据识别服务模块,所述负载均衡器根据单张票据图片的对应类别将所述单张票据图片发送给对应的票据识别服务模块进行票据识别,并收集识别结果。
在具体实现上,所述自动分割子系统包括特征提取模块、特征匹配模块、多框融合模块和分割输出模块;
所述特征提取模块用于对每一类票据样本进行特征提取并保存,在输入待分割的票据后,提取所述输入的票据的特征;
特征匹配模块,用于启用多线程将提取的所述输入的票据的特征与保存的每一类票据样本的特征进行匹配;
多框融合模块,用于根据各个线程的匹配结果在所述输入的票据图片上采用多个位置框框选对应位置的票据图片;
分割输出模块,用于根据所述多个位置框对输入的票据进行分割,输出分割的图像。
所述自动分类子系统包括票据分类样本集处理模块、样本训练模块和票据分类模块;
所述票据分类样本集处理模块,用于构建不同种类的票据样本集,并对每一类票据样本赋予对应的标签;
样本训练模块,用于针对每一类票据样本提取特征,利用支持向量机分类算法对提取的特征进行闭环训练分类,形成分类模型;
票据分类模块,用于利用分类模型对新输入的票据进行分类,获得票据分类结果。
所述任务调度子系统包括:调度模块和轮询模块;
所述调度模块,用于将经过自动分割子系统分割后的票据图片发送给自动分类子系统进行分类,将分类结果发送给票据识别子系统的负载均衡服务器;
所述轮询模块,用于通过轮询负载均衡服务器,获取负载均衡服务器收集的每张票据的识别结果展现给用户。
所述票据识别服务模块包括:图片预处理模块,票据版面分析模块,序列字符截取模块,序列识别模块和结构化输出模块;
所述图片预处理模块,用于对输入的票据图片进行预处理;
所述票据版面分析模块,用于对经过预处理的票据图片进行版面分析;
所述序列字符截取模块,用于对经过版面分析的图片进行序列字符定位和序列字符图片截取;
所述序列识别模块,用于利用深度学习算法对截取的序列字符图片进行序列识别;
结构化输出模块,用于将序列识别的结果进行结构化输出。
基于上述系统,本发明实现的财务报销票据自动处理方法包括以下步骤:
1.用户将票据图片上传至自动分割子系统;
本步骤中,用户上传的票据图片为张贴多张票据的报销单的图片。
2.自动分割子系统对票据图片自动分割,将分割后的票据图片传送给任务调度子系统;
本步骤中,自动分割子系统对票据图片分割的处理流程如图2所示,其预先选取票面相对清晰的票据制作模板样本集,并对样本集中的对每一类票据样本进行特征提取并保存,用于自动分割时的特征比对;在对输入的票据图片自动分割时,首先,提取输入的票据图片的特征;然后,启用多线程将提取的所述输入的票据图片的特征与保存的每一类票据样本的特征进行匹配,从而能够确定输入的票据图片上粘贴的多张票据的各自区域位置;接着,根据各个线程的匹配结果在所述输入的票据图片上采用多个位置框框选对应位置区域的票据图片;最后根据所述多个位置框对输入的票据进行分割,输出分割的图像。
3.任务调度子系统对分割后的票据图片进行校验核对,将核对后的票据图片发送给自动分类子系统;
4.自动分类子系统对单张票据图片进行自动分类,将分类的结果传送给任务调度子系统;
本步骤中,自动分类子系统对单张票据图片进行分类的处理流程参见图3,其预先构建不同种类的票据样本集,对每一类票据样本赋予对应的标签,并对每一类票据样本提取特征,利用支持向量机分类算法对提取的特征进行闭环训练分类,形成分类模型;在需要对单张票据图片进行分类时,利用训练好的分类模型对输入的单张票据进行分类,获得票据分类结果。
5.任务调度子系统对分类的结果进行校验核对后,将分类结果发送给票据识别子系统的负载均衡服务器;
6.票据识别子系统的负载均衡服务器根据单张票据图片的对应类别将所述单张票据图片发送给对应的票据识别服务模块进行票据识别,并收集识别结果;
本步骤中,票据识别子系统进行票据识别的处理流程参见图4,其包括:对输入的票据图片进行预处理;对经过预处理的票据图片进行版面分析;对经过版面分析的图片进行序列字符定位和序列字符图片截取;利用深度学习算法对截取的序列字符图片进行序列识别;将序列识别的结果进行结构化输出。
在序列识别之前首先要进行深度学习模型的训练,如图5所示,通过中国的汉字、数字以及英文字母构建自造样本集;通过实际的票据构建固定样本集;将构建的数据集通过深度学习网络(CNN+Bi-LSTM+CTC)进行学习,并进行闭环训练形成深度学习模型。
在进行序列识别时,基于深度学习模型,对序列字符图片经过卷积神经网络提取序列混合特征,对提取的序列混合特征经过双向LSTM(Long Short-Term Memory)网络进行初步预测,将初步预测结果输入至CTC(Connectionist temporal classification)网络进行预测,获得最终的序列识别结果。该序列识别结果被结构化处理后反馈给负载均衡服务器。
7.任务调度子系统通过轮询负载均衡服务器,获取负载均衡服务器收集的每张票据的识别结果展现给用户。

Claims (10)

1.财务报销票据自动处理系统,其特征在于,包括:
自动分割子系统,用于对用户上传的票据图片进行自动分割,将分割后的票据图片传送给任务调度子系统;
自动分类子系统,用于对分割后的单张票据图片进行自动分类,将分类的结果传送给任务调度子系统;
任务调度子系统,用于将经过自动分割子系统分割后的票据图片发送给自动分类子系统进行分类,将分类结果发送给票据识别子系统的负载均衡服务器,以及通过轮询负载均衡服务器,获取负载均衡服务器收集的每张票据的识别结果展现给用户;
票据识别子系统,包括负载均衡服务器和多个类别的票据识别服务模块,所述负载均衡器根据单张票据图片的对应类别将所述单张票据图片发送给对应的票据识别服务模块进行票据识别,并收集识别结果。
2.如权利要求1所述的财务报销票据自动处理系统,其特征在于,所述自动分割子系统包括特征提取模块、特征匹配模块、多框融合模块和分割输出模块;
所述特征提取模块用于对每一类票据样本进行特征提取并保存,在输入待分割的票据后,提取所述输入的票据的特征;
特征匹配模块,用于启用多线程将提取的所述输入的票据的特征与保存的每一类票据样本的特征进行匹配;
多框融合模块,用于根据各个线程的匹配结果在所述输入的票据图片上采用多个位置框框选对应位置的票据图片;
分割输出模块,用于根据所述多个位置框对输入的票据进行分割,输出分割的图像。
3.如权利要求1所述的财务报销票据自动处理系统,其特征在于,所述自动分类子系统包括票据分类样本集处理模块、样本训练模块和票据分类模块;
所述票据分类样本集处理模块,用于构建不同种类的票据样本集,并对每一类票据样本赋予对应的标签;
样本训练模块,用于针对每一类票据样本提取特征,利用支持向量机分类算法对提取的特征进行闭环训练分类,形成分类模型;
票据分类模块,用于利用分类模型对新输入的票据进行分类,获得票据分类结果。
4.如权利要求1所述的财务报销票据自动处理系统,其特征在于,所述任务调度子系统包括:调度模块和轮询模块;
所述调度模块,用于将经过自动分割子系统分割后的票据图片发送给自动分类子系统进行分类,将分类结果发送给票据识别子系统的负载均衡服务器;
所述轮询模块,用于通过轮询负载均衡服务器,获取负载均衡服务器收集的每张票据的识别结果展现给用户。
5.如权利要求1所述的财务报销票据自动处理系统,其特征在于,所述票据识别服务模块包括:图片预处理模块,票据版面分析模块,序列字符截取模块,序列识别模块和结构化输出模块;
所述图片预处理模块,用于对输入的票据图片进行预处理;
所述票据版面分析模块,用于对经过预处理的票据图片进行版面分析;
所述序列字符截取模块,用于对经过版面分析的图片进行序列字符定位和序列字符图片截取;
所述序列识别模块,用于利用深度学习算法对截取的序列字符图片进行序列识别;
结构化输出模块,用于将序列识别的结果进行结构化输出。
6.财务报销票据自动处理方法,其特征在于,包括以下步骤:
a.用户将票据图片上传至自动分割子系统;
b.自动分割子系统对票据图片自动分割,将分割后的票据图片传送给任务调度子系统;
c.任务调度子系统对分割后的票据图片进行校验核对,将核对后的票据图片发送给自动分类子系统;
d.自动分类子系统对单张票据图片进行自动分类,将分类的结果传送给任务调度子系统;
e.任务调度子系统对分类的结果进行校验核对后,将分类结果发送给票据识别子系统的负载均衡服务器;
f.票据识别子系统的负载均衡服务器根据单张票据图片的对应类别将所述单张票据图片发送给对应的票据识别服务模块进行票据识别,并收集识别结果;
g.任务调度子系统通过轮询负载均衡服务器,获取负载均衡服务器收集的每张票据的识别结果展现给用户。
7.如权利要求6所述的财务报销票据自动处理方法,其特征在于,
步骤b中,所述自动分割子系统预先选取票面相对清晰的票据制作模板样本集,并对样本集中的对每一类票据样本进行特征提取并保存;在对输入的票据图片自动分割时,首先,提取输入的票据图片的特征;然后,启用多线程将提取的所述输入的票据图片的特征与保存的每一类票据样本的特征进行匹配;接着,根据各个线程的匹配结果在所述输入的票据图片上采用多个位置框框选对应位置的票据图片;最后根据所述多个位置框对输入的票据进行分割,输出分割的图像。
8.如权利要求6所述的财务报销票据自动处理方法,其特征在于,
步骤d中,所述自动分类子系统预先构建不同种类的票据样本集,对每一类票据样本赋予对应的标签,并对每一类票据样本提取特征,利用支持向量机分类算法对提取的特征进行闭环训练分类,形成分类模型;在需要对单张票据图片进行分类时,利用训练好的分类模型对输入的单张票据进行分类,获得票据分类结果。
9.如权利要求6所述的财务报销票据自动处理方法,其特征在于,
步骤f中,所述票据识别服务模块进行票据识别,具体包括:
对输入的票据图片进行预处理;
对经过预处理的票据图片进行版面分析;
对经过版面分析的图片进行序列字符定位和序列字符图片截取;
利用深度学习算法对截取的序列字符图片进行序列识别;
将序列识别的结果进行结构化输出。
10.如权利要求9所述的财务报销票据自动处理方法,其特征在于,
所述序列识别具体包括:
基于深度学习模型,对序列字符图片经过卷积神经网络提取序列混合特征,对提取的序列混合特征经过双向LSTM网络进行初步预测,将初步预测结果输入至CTC网络进行预测,获得最终的序列识别结果;
所述深度学习模型的训练方法为:
通过中国的汉字、数字以及英文字母构建自造样本集;通过实际的票据构建固定样本集;将构建的数据集通过深度学习网络进行学习,并进行闭环训练形成深度学习模型;所述深度学习网络为:CNN+Bi-LSTM+CTC。
CN201810877705.XA 2018-08-03 2018-08-03 财务报销票据自动处理系统及方法 Pending CN109064304A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810877705.XA CN109064304A (zh) 2018-08-03 2018-08-03 财务报销票据自动处理系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810877705.XA CN109064304A (zh) 2018-08-03 2018-08-03 财务报销票据自动处理系统及方法

Publications (1)

Publication Number Publication Date
CN109064304A true CN109064304A (zh) 2018-12-21

Family

ID=64833031

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810877705.XA Pending CN109064304A (zh) 2018-08-03 2018-08-03 财务报销票据自动处理系统及方法

Country Status (1)

Country Link
CN (1) CN109064304A (zh)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109740548A (zh) * 2019-01-08 2019-05-10 北京易道博识科技有限公司 一种报销票据图像分割方法及系统
CN109977957A (zh) * 2019-03-04 2019-07-05 苏宁易购集团股份有限公司 一种基于深度学习的发票识别方法及系统
CN110334640A (zh) * 2019-06-28 2019-10-15 苏宁云计算有限公司 一种票据审核方法及系统
CN110348346A (zh) * 2019-06-28 2019-10-18 苏宁云计算有限公司 一种票据分类识别方法及系统
CN110634223A (zh) * 2019-09-27 2019-12-31 中国银行股份有限公司 票据校验方法及装置
CN110781877A (zh) * 2019-10-28 2020-02-11 京东方科技集团股份有限公司 一种图像识别方法、设备及存储介质
CN110796145A (zh) * 2019-09-19 2020-02-14 平安科技(深圳)有限公司 基于智能决策的多证件分割关联方法及相关设备
CN111179044A (zh) * 2019-12-23 2020-05-19 望海康信(北京)科技股份公司 票据报销方法及装置
CN111325247A (zh) * 2020-02-10 2020-06-23 山东浪潮通软信息科技有限公司 一种基于最小二乘支持向量机的智能稽核的实现方法
CN111476067A (zh) * 2019-01-23 2020-07-31 腾讯科技(深圳)有限公司 图像的文字识别方法、装置、电子设备及可读存储介质
CN111753841A (zh) * 2020-06-28 2020-10-09 中国银行股份有限公司 基于路由分发的票据识别方法及装置
CN116403096A (zh) * 2023-06-06 2023-07-07 爱拜尔(北京)科技有限公司 一种基于ocr票据识别的智能财务工作方法及系统

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105632015A (zh) * 2015-12-24 2016-06-01 中钞实业有限公司 一种基于云平台的银行票据指纹特征防伪鉴别方法
CN105678612A (zh) * 2015-12-30 2016-06-15 远光软件股份有限公司 移动端原始凭证电子化智能填单系统及方法
CN105718928A (zh) * 2016-01-20 2016-06-29 淄博职业学院 一种会计票据处理方法
CN107480681A (zh) * 2017-08-02 2017-12-15 四川长虹电器股份有限公司 基于深度学习的高并发票据识别系统与方法
WO2018019176A1 (zh) * 2016-07-26 2018-02-01 四川长虹电器股份有限公司 基于xbrl的智能财务云平台系统、构建方法及业务实现方法
CN107766809A (zh) * 2017-10-09 2018-03-06 平安科技(深圳)有限公司 电子装置、票据信息识别方法和计算机可读存储介质
CN107945194A (zh) * 2017-10-31 2018-04-20 四川长虹电器股份有限公司 基于OpenCV技术的票据分割方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105632015A (zh) * 2015-12-24 2016-06-01 中钞实业有限公司 一种基于云平台的银行票据指纹特征防伪鉴别方法
CN105678612A (zh) * 2015-12-30 2016-06-15 远光软件股份有限公司 移动端原始凭证电子化智能填单系统及方法
CN105718928A (zh) * 2016-01-20 2016-06-29 淄博职业学院 一种会计票据处理方法
WO2018019176A1 (zh) * 2016-07-26 2018-02-01 四川长虹电器股份有限公司 基于xbrl的智能财务云平台系统、构建方法及业务实现方法
CN107480681A (zh) * 2017-08-02 2017-12-15 四川长虹电器股份有限公司 基于深度学习的高并发票据识别系统与方法
CN107766809A (zh) * 2017-10-09 2018-03-06 平安科技(深圳)有限公司 电子装置、票据信息识别方法和计算机可读存储介质
CN107945194A (zh) * 2017-10-31 2018-04-20 四川长虹电器股份有限公司 基于OpenCV技术的票据分割方法

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109740548A (zh) * 2019-01-08 2019-05-10 北京易道博识科技有限公司 一种报销票据图像分割方法及系统
CN109740548B (zh) * 2019-01-08 2020-12-08 北京易道博识科技有限公司 一种报销票据图像分割方法及系统
CN111476067B (zh) * 2019-01-23 2023-04-07 腾讯科技(深圳)有限公司 图像的文字识别方法、装置、电子设备及可读存储介质
CN111476067A (zh) * 2019-01-23 2020-07-31 腾讯科技(深圳)有限公司 图像的文字识别方法、装置、电子设备及可读存储介质
CN109977957A (zh) * 2019-03-04 2019-07-05 苏宁易购集团股份有限公司 一种基于深度学习的发票识别方法及系统
CN110334640A (zh) * 2019-06-28 2019-10-15 苏宁云计算有限公司 一种票据审核方法及系统
CN110348346A (zh) * 2019-06-28 2019-10-18 苏宁云计算有限公司 一种票据分类识别方法及系统
CN110796145A (zh) * 2019-09-19 2020-02-14 平安科技(深圳)有限公司 基于智能决策的多证件分割关联方法及相关设备
CN110796145B (zh) * 2019-09-19 2024-01-19 平安科技(深圳)有限公司 基于智能决策的多证件分割关联方法及相关设备
CN110634223A (zh) * 2019-09-27 2019-12-31 中国银行股份有限公司 票据校验方法及装置
CN110781877A (zh) * 2019-10-28 2020-02-11 京东方科技集团股份有限公司 一种图像识别方法、设备及存储介质
CN110781877B (zh) * 2019-10-28 2024-01-23 京东方科技集团股份有限公司 一种图像识别方法、设备及存储介质
CN111179044B (zh) * 2019-12-23 2023-08-29 望海康信(北京)科技股份公司 票据报销方法及装置
CN111179044A (zh) * 2019-12-23 2020-05-19 望海康信(北京)科技股份公司 票据报销方法及装置
CN111325247B (zh) * 2020-02-10 2022-08-02 浪潮通用软件有限公司 一种基于最小二乘支持向量机的智能稽核的实现方法
CN111325247A (zh) * 2020-02-10 2020-06-23 山东浪潮通软信息科技有限公司 一种基于最小二乘支持向量机的智能稽核的实现方法
CN111753841A (zh) * 2020-06-28 2020-10-09 中国银行股份有限公司 基于路由分发的票据识别方法及装置
CN111753841B (zh) * 2020-06-28 2023-09-19 中国银行股份有限公司 基于路由分发的票据识别方法及装置
CN116403096A (zh) * 2023-06-06 2023-07-07 爱拜尔(北京)科技有限公司 一种基于ocr票据识别的智能财务工作方法及系统
CN116403096B (zh) * 2023-06-06 2023-10-24 爱拜尔(北京)科技有限公司 一种基于ocr票据识别的智能财务工作方法及系统

Similar Documents

Publication Publication Date Title
CN109064304A (zh) 财务报销票据自动处理系统及方法
CN105303193B (zh) 一种基于单帧图像处理的人数统计系统
CN110119786A (zh) 文本话题分类方法及装置
CN109064454A (zh) 产品缺陷检测方法及系统
CN103927534A (zh) 一种基于卷积神经网络的喷码字符在线视觉检测方法
CN111652332B (zh) 基于二分类的深度学习手写中文字符识别方法及系统
CN109934255B (zh) 一种适用于饮料瓶回收机投递物分类识别的模型融合方法
CN112766334B (zh) 一种基于伪标签域适应的跨域图像分类方法
CN110472494A (zh) 脸部特征提取模型训练方法、脸部特征提取方法、装置、设备及存储介质
CN109635676A (zh) 一种从视频中定位音源的方法
CN106960176A (zh) 一种基于超限学习机和颜色特征融合的行人性别识别方法
CN110335262A (zh) 一种机器视觉中印刷品缺陷自动分类方法
CN108932712A (zh) 一种转子绕组质量检测系统及方法
CN106326451B (zh) 一种基于视觉特征提取的网页传感信息块判决方法
CN112749280A (zh) 网络舆情的分类方法、装置、电子装置和存储介质
CN109710930A (zh) 一种基于深度神经网络的中文简历解析方法
CN114677687A (zh) 一种融合ViT与卷积神经网络的毛笔字体类型快速识别方法
CN110472075A (zh) 一种基于机器学习的异构数据分类存储方法及系统
CN114066848A (zh) 一种fpca外观缺陷视觉检测系统
CN111339927A (zh) 一种电力营业厅人员工作状态智能识别系统
CN109471941A (zh) 一种应对类别不平衡的罪名分类方法
CN114005054A (zh) 一种ai智能评分系统
CN108805163A (zh) 衣服图像自动标注方法
CN114049500A (zh) 基于元学习重加权网络伪标签训练的图像评价方法及系统
CN114445875A (zh) 基于深度学习的身份识别与人脸比对系统及训练方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20181221