CN109872444B - 一种票据识别方法及装置 - Google Patents

一种票据识别方法及装置 Download PDF

Info

Publication number
CN109872444B
CN109872444B CN201910147606.0A CN201910147606A CN109872444B CN 109872444 B CN109872444 B CN 109872444B CN 201910147606 A CN201910147606 A CN 201910147606A CN 109872444 B CN109872444 B CN 109872444B
Authority
CN
China
Prior art keywords
area
final payment
payment amount
expense
bill
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910147606.0A
Other languages
English (en)
Other versions
CN109872444A (zh
Inventor
徐青松
李青
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Glority Software Ltd
Original Assignee
Hangzhou Glority Software Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Glority Software Ltd filed Critical Hangzhou Glority Software Ltd
Priority to CN201910147606.0A priority Critical patent/CN109872444B/zh
Publication of CN109872444A publication Critical patent/CN109872444A/zh
Priority to PCT/CN2019/103849 priority patent/WO2020173068A1/zh
Priority to US16/955,784 priority patent/US11966890B2/en
Application granted granted Critical
Publication of CN109872444B publication Critical patent/CN109872444B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q20/00Payment architectures, schemes or protocols
    • G06Q20/08Payment architectures
    • G06Q20/10Payment architectures specially adapted for electronic funds transfer [EFT] systems; specially adapted for home banking systems
    • G06Q20/102Bill distribution or payments
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q20/00Payment architectures, schemes or protocols
    • G06Q20/30Payment architectures, schemes or protocols characterised by the use of specific devices or networks
    • G06Q20/32Payment architectures, schemes or protocols characterised by the use of specific devices or networks using wireless devices
    • G06Q20/327Short range or proximity payments by means of M-devices
    • G06Q20/3276Short range or proximity payments by means of M-devices using a pictured code, e.g. barcode or QR-code, being read by the M-device
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/412Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/416Extracting the logical structure, e.g. chapters, sections or page numbers; Identifying elements of the document, e.g. authors
    • GPHYSICS
    • G07CHECKING-DEVICES
    • G07DHANDLING OF COINS OR VALUABLE PAPERS, e.g. TESTING, SORTING BY DENOMINATIONS, COUNTING, DISPENSING, CHANGING OR DEPOSITING
    • G07D7/00Testing specially adapted to determine the identity or genuineness of valuable papers or for segregating those which are unacceptable, e.g. banknotes that are alien to a currency
    • G07D7/20Testing patterns thereon
    • G07D7/202Testing patterns thereon using pattern matching
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Accounting & Taxation (AREA)
  • Theoretical Computer Science (AREA)
  • Finance (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
  • Character Discrimination (AREA)

Abstract

本发明提供了一种票据识别方法及装置,所述方法包括:获得待识别的票据的图像;采用预先训练的区域识别模型,识别所述图像中所述票据的最终付款区域;采用预先训练的字符识别模型,识别所述最终付款区域内的最终付款金额。应用本发明提供的方案可以实现对票据上付款金额的自动识别。

Description

一种票据识别方法及装置
技术领域
本发明涉及人工智能技术领域,尤其涉及一种票据识别方法、装置、电子设备和计算机可读存储介质。
背景技术
随着经济的不断发展,人们的消费水平不断的提高,为了维护人们的消费权益,票据成为了消费者的有力保障以及有效的报销凭证,因此财务人员每天需要处理大量的票据,而如何自动识别票据上的付款金额对财务人员来说是十分重要的。
发明内容
本发明的目的在于提供一种票据识别方法、装置、电子设备和计算机可读存储介质,以实现对票据上付款金额的自动识别。
为达到上述目的,本发明提供了一种票据识别方法,所述方法包括:
获得待识别的票据的图像;
采用预先训练的区域识别模型,识别所述图像中所述票据的最终付款区域;
采用预先训练的字符识别模型,识别所述最终付款区域内的最终付款金额。
可选的,所述方法还包括:
在识别出所述图像中所述票据的最终付款区域后,对所述最终付款区域进行切片处理;
输出所述最终付款区域的切片图片以及所述最终付款金额进行对照显示。
可选的,所述输出所述最终付款区域的切片图片以及所述最终付款金额进行对照显示,包括:
输出所述最终付款区域的切片图片以及所述最终付款金额,并使所述切片图片显示在所述最终付款金额的上方。
可选的,所述输出所述最终付款区域的切片图片以及所述最终付款金额进行对照显示,包括:
输出所述最终付款区域的切片图片以及所述最终付款金额,并使所述切片图片显示在所述最终付款金额的左侧。
可选的,若无法识别所述最终付款区域和/或无法识别所述最终付款区域内的最终付款金额,所述方法还包括:
采用所述区域识别模型,识别所述图像中所述票据的费用汇总区域;
采用所述字符识别模型,识别所述费用汇总区域内的字符内容;
根据预先设定的规则库,通过所述费用汇总区域的字符内容计算出所述最终付款金额。
可选的,所述方法还包括:
根据所述费用汇总区域内的字符内容,确定所述费用汇总区域中需要进行显示的子区域,并对该子区域进行切片处理;
输出所述最终付款金额以及所述子区域的切片图片进行对照显示。
可选的,若无法确定所述费用汇总区域中需要进行显示的子区域,所述方法还包括:
对整个所述费用汇总区域进行切片处理;
输出所述最终付款金额以及所述费用汇总区域的切片图片进行对照显示。
可选的,所述根据预先设定的规则库,通过所述费用汇总区域的字符内容计算出所述最终付款金额,包括:
通过所述费用汇总区域的字符内容,确定所述费用汇总区域所包含的费用类型及其对应的金额;
从预先设定的规则库中确定与所包含的费用类型相对应的规则,并利用所确定的规则以及费用类型对应的金额计算出所述最终付款金额。
可选的,所述费用类型包括:原价、服务费、小费、优惠、折扣、税费、币种、汇率、单价及数量、运费、燃油费。
为达到上述目的,本发明还提供了一种票据识别装置,所述装置包括:
获得模块,用于获得待识别的票据的图像;
第一识别模块,用于采用预先训练的区域识别模型,识别所述图像中所述票据的最终付款区域;
第二识别模块,用于采用预先训练的字符识别模型,识别所述最终付款区域内的最终付款金额。
可选的,所述装置还包括:
切片模块,用于在识别出所述图像中所述票据的最终付款区域后,对所述最终付款区域进行切片处理;
第一显示模块,用于输出所述最终付款区域的切片图片以及所述最终付款金额进行对照显示。
可选的,所述第一显示模块,具体用于:
输出所述最终付款区域的切片图片以及所述最终付款金额,并使所述切片图片显示在所述最终付款金额的上方。
可选的,所述第一显示模块,具体用于:
输出所述最终付款区域的切片图片以及所述最终付款金额,并使所述切片图片显示在所述最终付款金额的左侧。
可选的,若无法识别所述最终付款区域和/或无法识别所述最终付款区域内的最终付款金额,所述装置还包括:计算模块;
所述第一识别模块,还用于采用所述区域识别模型,识别所述图像中所述票据的费用汇总区域;
所述第二识别模块,还用于采用所述字符识别模型,识别所述费用汇总区域内的字符内容;
所述计算模块,用于根据预先设定的规则库,通过所述费用汇总区域的字符内容计算出所述最终付款金额。
可选的,所述装置还包括:
确定模块,用于根据所述费用汇总区域内的字符内容,确定所述费用汇总区域中需要进行显示的子区域,并利用切片模块对该子区域进行切片处理;
第二显示模块,还用于输出所述最终付款金额以及所述子区域的切片图片进行对照显示。
可选的,若无法确定所述费用汇总区域中需要进行显示的子区域,
所述确定模块,还用于利用切片模块对整个所述费用汇总区域进行切片处理;
所述第二显示模块,还用于输出所述最终付款金额以及所述费用汇总区域的切片图片进行对照显示。
可选的,所述计算模块,包括:
确定子模块,用于通过所述费用汇总区域的字符内容,确定所述费用汇总区域所包含的费用类型及其对应的金额;
计算子模块,用于从预先设定的规则库中确定与所包含的费用类型相对应的规则,并利用所确定的规则以及费用类型对应的金额计算出所述最终付款金额。
可选的,所述费用类型包括:原价、服务费、小费、优惠、折扣、税费、币种、汇率、单价及数量、运费、燃油费。
为达到上述目的,本发明还提供了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现如上任一所述的票据识别方法的步骤。
为达到上述目的,本发明还提供了一种计算机可读存储介质,其特征在于,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现如上任一项所述的票据识别方法的步骤。
与现有技术相比,本发明在进行票据识别时,采用区域识别模型对待识别的票据的图像进行识别,识别出最终付款区域,然后采用字符识别模型识别最终付款区域内的最终付款金额,实现了对票据上付款金额的自动识别和显示,提高了票据处理的效率。
附图说明
图1为本发明一实施例提供的票据识别方法的流程示意图;
图2A-图2B均为本发明一实施例提供的票据识别后输出结果的具体示例;
图3A-图3H均为本发明一实施例提供的票据的具体示例;
图4为本发明一实施例提供的票据识别装置的结构示意图;
图5为本发明一实施例提供的电子设备的结构示意图。
具体实施方式
以下结合附图和具体实施例对本发明提出的一种票据识别方法、装置、电子设备及计算机可读存储介质作进一步详细说明。根据权利要求书和下面说明,本发明的优点和特征将更清楚。
为解决现有技术的问题,本发明实施例提供了一种票据识别方法、装置、电子设备及计算机可读存储介质。
需要说明的是,本发明实施例的票据识别方法可应用于本发明实施例的票据识别装置,该票据识别装置可被配置于电子设备上。其中,该电子设备可以是个人计算机、移动终端等,该移动终端可以是手机、平板电脑等具有各种操作系统的硬件设备。
图1是本发明一实施例提供的一种票据识别方法的流程示意图。请参考图1,一种票据识别方法可以包括如下步骤:
步骤S101,获得待识别的票据的图像。
本发明所述的票据可以是发票、账单、税单、收据、购物清单、餐饮小票、保险单、报销单、快递单、行程单、车票等含有付款金额的单据。
步骤S102,采用预先训练的区域识别模型,识别所述图像中所述票据的最终付款区域。
票据的最终付款区域可以理解为此票据的最终付款金额所在的区域。例如,增值税发票中最终付款区域为“价税合计”区域;火车票中最终付款区域为票价的显示区域;定额发票中最终付款区域为显示发票金额的区域;购物小票中具有支付方式的区域优先作为最终付款区域,支付方式比如支付宝支付、信用卡支付、微信支付、在线支付、银联支付等,如图3C所示的购物小票,“支付宝:27.10”所在区域为最终付款区域。
将票据图像输入所述区域识别模型,所述区域识别模型可以识别出票据中的最终付款区域,还可以将识别出的最终付款区域标注出来,以及对最终付款区域进行切片处理,得到最终付款区域的切片图片。
步骤S103,采用预先训练的字符识别模型,识别所述最终付款区域内的最终付款金额。
在识别出最终付款区域后,可以将标注出最终付款区域的票据图像输入所述字符识别模型,或者直接将最终付款区域的切片图片输入所述字符识别模型,通过所述字符识别模型识别出最终付款区域内的最终付款金额。
在实际应用中,还可以输出所述最终付款区域的切片图片以及所述最终付款金额进行对照显示。在识别出最终付款区域以及最终付款金额后,输入最终付款区域的切片图片以及最终付款区域,将两者进行对照显示,便于用户查看以及核对识别结果是否正确。
具体而言,所述输出所述最终付款区域的切片图片以及所述最终付款金额进行对照显示的方式,可以为上下对照或者左右对照的方式,例如使所述切片图片显示在所述最终付款金额的上方,或者使所述切片图片显示在所述最终付款金额的左侧。图2A和图2B示出了票据识别后输出结果的示意图,如图2A所示,切片图片211显示在最终付款金额212的上方,如图2B所示,切片图片221显示在最终付款金额222的左侧。
进一步的,在实际应用中,若步骤S102中无法识别所述最终付款区域,和/或,步骤S103中无法识别所述最终付款区域内的最终付款金额,例如最终付款区域或最终付款金额破损、污染或字迹淡而无法识别,则本发明所述的方法还可以包括:采用所述区域识别模型,识别所述图像中所述票据的费用汇总区域;采用所述字符识别模型,识别所述费用汇总区域内的字符内容;根据预先设定的规则库,通过所述费用汇总区域的字符内容计算出所述最终付款金额。
然后,还可以根据所述费用汇总区域内的字符内容,确定所述费用汇总区域中需要进行显示的子区域,并对该子区域进行切片处理;输出所述最终付款金额以及所述子区域的切片图片进行对照显示。
票据的费用汇总区域可以理解为:显示有多种费用类型的区域。不同票据的费用汇总区域可以参见图3B-图3H所示的票据中标注有矩形框的区域。其中,所述费用类型包括但不限于:原价、服务费、小费、优惠、折扣、税费、币种、汇率、单价及数量、运费、燃油费等。
具体的,所述根据预先设定的规则库,通过所述费用汇总区域的字符内容计算出所述最终付款金额,可以包括:通过所述费用汇总区域的字符内容,确定所述费用汇总区域所包含的费用类型及其对应的金额;从预先设定的规则库中确定与所包含的费用类型相对应的规则,并利用所确定的规则以及费用类型对应的金额计算出所述最终付款金额。可以理解的是,规则库中的各个规则可以根据各种费用类型与最终付款金额之间的关系确定。
举例而言,若费用汇总区域所包含的费用类型为商品原价和优惠,则计算最终付款金额的规则应为商品原价减去优惠;又如,若费用汇总区域所包含的费用类型为商品原价、折扣和运费,则计算最终付款金额的规则应为商品原价乘以(1-折扣)再加上运费。
在计算出最终付款金额后,确定所述费用汇总区域中需要进行显示的子区域。需要进行显示的子区域可以理解为:所述费用汇总区域中的、与所计算出的最终付款金额相同的金额所在的区域。
在实际应用中,若无法确定所述费用汇总区域中需要进行显示的子区域,所述方法还可以包括:对整个所述费用汇总区域进行切片处理;输出所述最终付款金额以及所述费用汇总区域的切片图片进行对照显示。
下面以一些票据的具体示例对本发明所述的方法进行说明。
如图3A所示的增值税发票,可以根据区域识别模型识别出“价税合计”的大写金额区域311作为最终付款金额以及切片区域,如果大写金额区域311显示不清楚导致无法识别,例如大写金额部分311破损、污染或字迹淡而无法识别,也可以选择小写金额区域312作为切片区域。
如图3B所示的购物小票,根据区域识别模型识别出“应收金额”区域321作为最终付款区域并切片,如果此处无法识别,例如此区域或最终付款金额152.30处破损、污染或字迹淡而无法识别,则再识别出费用汇总区域322,根据规则分析最终付款金额应该是“单品折后总计”对应的金额,因此对“单品折后总计”及其金额所对应的区域323进行切片并显示。
如图3C所示的购物小票,其支付方式为支付宝,因此区域识别模型识别出“支付宝:27.10”所在区域331为最终付款区域并切片,如果此处无法识别,例如此区域或最终付款金额27.10处破损、污染或字迹淡而无法识别,则识别出费用汇总区域332,根据规则认定金额合计部分333应该为最终付款金额,对此区域进行切片并显示。
如图3D所示的票据,其中有两个total区域,分别为“total 16.18”和“total18.18”,根据规则默认靠下方的total区域341即为最终付款区域,进行切片并显示,若此区域无法识别,例如此区域或最终付款金额18.18处破损、污染或字迹淡而无法识别,则对费用汇总区域342进行识别,并识别出上方total为16.18、gratuity(小费)为2,从而计算出最终付款金额为18.18,并将图中所述费用汇总区域中需要进行显示的子区域343进行切片并对照显示。
如图3E所示的外卖单据,此外卖单据有点特殊,由于已经在线支付过因此票据上显示的应收金额为0,因此可以识别出费用汇总区域352,并识别出商品金额为42.1、优惠金额为22.0,从而计算出最终付款金额应该为20.1,将费用汇总区域352切片并显示。
如图3F所示的发票,由于图中区域361中打印的金额部分和左侧项目并未对齐,因此将整个区域361作为最终付款区域进行切片并对照显示。
如图3G所示的购物小票,“total$39.60”所在区域371为最终付款区域,若此区域无法识别,例如此区域或最终付款金额$39.60处破损、污染或字迹淡而无法识别,则识别费用汇总区域372,其中Subtotal(小计)为$38.64、Estimated Tax(税费)为$0.96,计算出最终付款金额为$39.60,然后将费用汇总区域372切片并与最终付款金额进行对照显示。
如图3H所示的票据,“total$89.25”所在区域381为最终付款区域,若此区域无法识别,例如此区域或最终付款金额$89.25处破损、污染或字迹淡而无法识别,则识别费用汇总区域382,其中Sub-total(小计)为$119.00、Discount(折扣)为25%,根据规则计算最终付款金额为$89.25,然后将费用汇总区域382切片并与最终付款金额进行对照显示。
下面再对所述区域识别模型、所述字符识别模型的训练过程进行简单介绍。
区域识别模型可以通过如下过程得到:对票据图像样本集中的每个票据图像样本进行标注处理,以标注出每个票据图像样本中的最终付款区域和/或费用汇总区域;以及通过经过标注处理的票据图像样本集,对神经网络进行训练,以得到区域识别模型。在标注出最终付款区域和/或费用汇总区域时,还可以标注出该区域为最终付款区域还是费用汇总区域。
字符识别模型可以通过如下过程得到:区域识别模型训练过程中所标注的最终付款区域和/或费用汇总区域进行标注处理,以标注出每个区域内的字符;以及通过经过标注处理的各个区域,对神经网络进行训练,以得到字符识别模型。
当然,字符识别模型的训练集也可以与区域识别模型的训练集不同,本发明对此不做限定。
综上,与现有技术相比,本发明在进行票据识别时,采用区域识别模型对待识别的票据的图像进行识别,识别出最终付款区域,然后采用字符识别模型识别最终付款区域内的最终付款金额,实现了对票据上付款金额的自动识别和显示,提高了票据处理的效率。
相应于上述票据识别方法实施例,本发明提供了一种票据识别装置,参见图4,该装置可以包括:
获得模块201,用于获得待识别的票据的图像;
第一识别模块202,用于采用预先训练的区域识别模型,识别所述图像中所述票据的最终付款区域;
第二识别模块203,用于采用预先训练的字符识别模型,识别所述最终付款区域内的最终付款金额。
可选的,所述装置还可以包括:
切片模块,用于在识别出所述图像中所述票据的最终付款区域后,对所述最终付款区域进行切片处理;
第一显示模块,用于输出所述最终付款区域的切片图片以及所述最终付款金额进行对照显示。
可选的,所述第一显示模块,具体用于:
输出所述最终付款区域的切片图片以及所述最终付款金额,并使所述切片图片显示在所述最终付款金额的上方。
可选的,所述第一显示模块,具体用于:
输出所述最终付款区域的切片图片以及所述最终付款金额,并使所述切片图片显示在所述最终付款金额的左侧。
可选的,若无法识别所述最终付款区域和/或无法识别所述最终付款区域内的最终付款金额,所述装置还可以包括:计算模块;
所述第一识别模块202,还用于采用所述区域识别模型,识别所述图像中所述票据的费用汇总区域;
所述第二识别模块203,还用于采用所述字符识别模型,识别所述费用汇总区域内的字符内容;
所述计算模块,用于根据预先设定的规则库,通过所述费用汇总区域的字符内容计算出所述最终付款金额。
可选的,所述装置还可以包括:
确定模块,用于根据所述费用汇总区域内的字符内容,确定所述费用汇总区域中需要进行显示的子区域,并利用切片模块对该子区域进行切片处理;
第二显示模块,还用于输出所述最终付款金额以及所述子区域的切片图片进行对照显示。
可选的,若无法确定所述费用汇总区域中需要进行显示的子区域,
所述确定模块,还可以利用切片模块用于对整个所述费用汇总区域进行切片处理;
所述第二显示模块,还可以用于输出所述最终付款金额以及所述费用汇总区域的切片图片进行对照显示。
可选的,所述计算模块,可以包括:
确定子模块,用于通过所述费用汇总区域的字符内容,确定所述费用汇总区域所包含的费用类型及其对应的金额;
计算子模块,用于从预先设定的规则库中确定与所包含的费用类型相对应的规则,并利用所确定的规则以及费用类型对应的金额计算出所述最终付款金额。
可选的,所述费用类型可以包括:原价、服务费、小费、优惠、折扣、税费、币种、汇率、单价及数量、运费、燃油费。
本发明还提供了一种电子设备,如图5所示,包括处理器301、通信接口302、存储器303和通信总线304,其中,处理器301,通信接口302,存储器303通过通信总线304完成相互间的通信,
存储器303,用于存放计算机程序;
处理器301,用于执行存储器303上所存放的程序时,实现如下步骤:
获得待识别的票据的图像;
采用预先训练的区域识别模型,识别所述图像中所述票据的最终付款区域;
采用预先训练的字符识别模型,识别所述最终付款区域内的最终付款金额。
关于该方法各个步骤的具体实现以及相关解释内容可以参见上述图1所示的方法实施例,在此不做赘述。
另外,处理器301执行存储器303上所存放的程序而实现的票据识别方法的其他实现方式,与前述方法实施例部分所提及的实现方式相同,这里也不再赘述。
上述电子设备提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect,PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
通信接口用于上述电子设备与其他设备之间的通信。
存储器可以包括随机存取存储器(Random Access Memory,RAM),也可以包括非易失性存储器(Non-Volatile Memory,NVM),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(Network Processor,NP)等;还可以是数字信号处理器(Digital SignalProcessing,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
本发明还提供了一种计算机可读存储介质,该计算机可读存储介质内存储有计算机程序,该计算机程序被处理器执行时实现上述的票据识别方法的步骤。
需要说明的是,本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置、电子设备、计算机可读存储介质实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
上述描述仅是对本发明较佳实施例的描述,并非对本发明范围的任何限定,本发明领域的普通技术人员根据上述揭示内容做的任何变更、修饰,均属于权利要求书的保护范围。

Claims (12)

1.一种票据识别方法,其特征在于,所述方法包括:
获得待识别的票据的图像;
采用预先训练的区域识别模型,识别所述图像中所述票据的最终付款区域;
采用预先训练的字符识别模型,识别所述最终付款区域内的最终付款金额;
在识别出所述图像中所述票据的最终付款区域后,对所述最终付款区域进行切片处理;
输出所述最终付款区域的切片图片以及所述最终付款金额进行对照显示;
若无法识别所述最终付款区域和/或无法识别所述最终付款区域内的最终付款金额,所述方法还包括:
采用所述区域识别模型,识别所述图像中所述票据的费用汇总区域;
采用所述字符识别模型,识别所述费用汇总区域内的字符内容;
根据预先设定的规则库,通过所述费用汇总区域的字符内容计算出所述最终付款金额;
根据所述费用汇总区域内的字符内容,确定所述费用汇总区域中需要进行显示的子区域,并对该子区域进行切片处理,输出所述最终付款金额以及所述子区域的切片图片进行对照显示;
其中,所述根据预先设定的规则库,通过所述费用汇总区域的字符内容计算出所述最终付款金额,包括:
通过所述费用汇总区域的字符内容,确定所述费用汇总区域所包含的费用类型及其对应的金额;
从预先设定的规则库中确定与所包含的费用类型相对应的规则,并利用所确定的规则以及费用类型对应的金额计算出所述最终付款金额。
2.如权利要求1所述的票据识别方法,其特征在于,所述输出所述最终付款区域的切片图片以及所述最终付款金额进行对照显示,包括:
输出所述最终付款区域的切片图片以及所述最终付款金额,并使所述切片图片显示在所述最终付款金额的上方。
3.如权利要求1所述的票据识别方法,其特征在于,所述输出所述最终付款区域的切片图片以及所述最终付款金额进行对照显示,包括:
输出所述最终付款区域的切片图片以及所述最终付款金额,并使所述切片图片显示在所述最终付款金额的左侧。
4.如权利要求1所述的票据识别方法,其特征在于,若无法确定所述费用汇总区域中需要进行显示的子区域,所述方法还包括:
对整个所述费用汇总区域进行切片处理;
输出所述最终付款金额以及所述费用汇总区域的切片图片进行对照显示。
5.如权利要求1所述的票据识别方法,其特征在于,所述费用类型包括:原价、服务费、小费、优惠、折扣、税费、币种、汇率、单价及数量、运费、燃油费。
6.一种票据识别装置,其特征在于,所述装置包括:
获得模块,用于获得待识别的票据的图像;
第一识别模块,用于采用预先训练的区域识别模型,识别所述图像中所述票据的最终付款区域;
第二识别模块,用于采用预先训练的字符识别模型,识别所述最终付款区域内的最终付款金额;
切片模块,用于在识别出所述图像中所述票据的最终付款区域后,对所述最终付款区域进行切片处理;
第一显示模块,用于输出所述最终付款区域的切片图片以及所述最终付款金额进行对照显示;
若无法识别所述最终付款区域和/或无法识别所述最终付款区域内的最终付款金额,所述装置还包括:计算模块、确定模块、第二显示模块;
所述第一识别模块,还用于采用所述区域识别模型,识别所述图像中所述票据的费用汇总区域;
所述第二识别模块,还用于采用所述字符识别模型,识别所述费用汇总区域内的字符内容;
所述计算模块,用于根据预先设定的规则库,通过所述费用汇总区域的字符内容计算出所述最终付款金额;
所述确定模块,用于根据所述费用汇总区域内的字符内容,确定所述费用汇总区域中需要进行显示的子区域,并利用切片模块对该子区域进行切片处理;
所述第二显示模块,用于输出所述最终付款金额以及所述子区域的切片图片进行对照显示;
其中,所述计算模块,包括:
确定子模块,用于通过所述费用汇总区域的字符内容,确定所述费用汇总区域所包含的费用类型及其对应的金额;
计算子模块,用于从预先设定的规则库中确定与所包含的费用类型相对应的规则,并利用所确定的规则以及费用类型对应的金额计算出所述最终付款金额。
7.如权利要求6所述的票据识别装置,其特征在于,所述第一显示模块,具体用于:
输出所述最终付款区域的切片图片以及所述最终付款金额,并使所述切片图片显示在所述最终付款金额的上方。
8.如权利要求6所述的票据识别装置,其特征在于,所述第一显示模块,具体用于:
输出所述最终付款区域的切片图片以及所述最终付款金额,并使所述切片图片显示在所述最终付款金额的左侧。
9.如权利要求6所述的票据识别装置,其特征在于,若无法确定所述费用汇总区域中需要进行显示的子区域,
所述确定模块,还用于利用切片模块对整个所述费用汇总区域进行切片处理;
所述第二显示模块,还用于输出所述最终付款金额以及所述费用汇总区域的切片图片进行对照显示。
10.如权利要求6所述的票据识别装置,其特征在于,所述费用类型包括:原价、服务费、小费、优惠、折扣、税费、币种、汇率、单价及数量、运费、燃油费。
11.一种电子设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现权利要求1-5任一所述的方法步骤。
12.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1-5任一项所述的方法步骤。
CN201910147606.0A 2019-02-27 2019-02-27 一种票据识别方法及装置 Active CN109872444B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN201910147606.0A CN109872444B (zh) 2019-02-27 2019-02-27 一种票据识别方法及装置
PCT/CN2019/103849 WO2020173068A1 (zh) 2019-02-27 2019-08-30 票据识别方法、装置、电子设备和计算机可读存储介质
US16/955,784 US11966890B2 (en) 2019-02-27 2019-08-30 Bill identification method, device, electronic device and computer-readable storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910147606.0A CN109872444B (zh) 2019-02-27 2019-02-27 一种票据识别方法及装置

Publications (2)

Publication Number Publication Date
CN109872444A CN109872444A (zh) 2019-06-11
CN109872444B true CN109872444B (zh) 2021-03-09

Family

ID=66919408

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910147606.0A Active CN109872444B (zh) 2019-02-27 2019-02-27 一种票据识别方法及装置

Country Status (3)

Country Link
US (1) US11966890B2 (zh)
CN (1) CN109872444B (zh)
WO (1) WO2020173068A1 (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109872444B (zh) 2019-02-27 2021-03-09 杭州睿琪软件有限公司 一种票据识别方法及装置
CN110728566B (zh) * 2019-09-17 2022-08-02 卓尔智联(武汉)研究院有限公司 报销文件中数据处理方法、装置、计算机设备和存储介质
CN111275037B (zh) * 2020-01-09 2021-06-08 上海知达教育科技有限公司 票据识别方法及装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104408403A (zh) * 2014-10-29 2015-03-11 中国建设银行股份有限公司 一种二次录入不一致的仲裁方法及装置
CN106326889A (zh) * 2016-08-19 2017-01-11 滨州学院 一种会计凭证图像扫描备案系统
CN107766809A (zh) * 2017-10-09 2018-03-06 平安科技(深圳)有限公司 电子装置、票据信息识别方法和计算机可读存储介质
CN107977665A (zh) * 2017-12-15 2018-05-01 北京科摩仕捷科技有限公司 一种发票中关键信息的识别方法及计算设备
CN108446621A (zh) * 2018-03-14 2018-08-24 平安科技(深圳)有限公司 票据识别方法、服务器及计算机可读存储介质

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US2932006A (en) * 1955-07-21 1960-04-05 Lab For Electronics Inc Symbol recognition system
US20070058856A1 (en) * 2005-09-15 2007-03-15 Honeywell International Inc. Character recoginition in video data
US9129197B1 (en) * 2012-08-29 2015-09-08 Intuit Inc. Highlight-based bill processing
US9552516B2 (en) * 2012-08-29 2017-01-24 Palo Alto Research Center Incorporated Document information extraction using geometric models
US20140268250A1 (en) * 2013-03-15 2014-09-18 Mitek Systems, Inc. Systems and methods for receipt-based mobile image capture
CN103824373B (zh) * 2014-01-27 2016-06-08 深圳辰通智能股份有限公司 一种票据图像金额分类方法及系统
US20170178149A1 (en) * 2015-12-16 2017-06-22 International Business Machines Corporation Method and system for purchase pattern extraction from point of sale data
US10467464B2 (en) * 2016-06-07 2019-11-05 The Neat Company, Inc. Document field detection and parsing
US10810420B2 (en) * 2018-09-28 2020-10-20 American Express Travel Related Services Company, Inc. Data extraction and duplicate detection
CN109872444B (zh) * 2019-02-27 2021-03-09 杭州睿琪软件有限公司 一种票据识别方法及装置
CN110956739A (zh) * 2019-05-09 2020-04-03 杭州睿琪软件有限公司 一种票据识别方法及装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104408403A (zh) * 2014-10-29 2015-03-11 中国建设银行股份有限公司 一种二次录入不一致的仲裁方法及装置
CN106326889A (zh) * 2016-08-19 2017-01-11 滨州学院 一种会计凭证图像扫描备案系统
CN107766809A (zh) * 2017-10-09 2018-03-06 平安科技(深圳)有限公司 电子装置、票据信息识别方法和计算机可读存储介质
CN107977665A (zh) * 2017-12-15 2018-05-01 北京科摩仕捷科技有限公司 一种发票中关键信息的识别方法及计算设备
CN108446621A (zh) * 2018-03-14 2018-08-24 平安科技(深圳)有限公司 票据识别方法、服务器及计算机可读存储介质

Also Published As

Publication number Publication date
WO2020173068A1 (zh) 2020-09-03
US11966890B2 (en) 2024-04-23
CN109872444A (zh) 2019-06-11
US20210256288A1 (en) 2021-08-19

Similar Documents

Publication Publication Date Title
US20220012488A1 (en) Receipt identification method, apparatus, electronic device and computer-readable storage medium
CN109872444B (zh) 一种票据识别方法及装置
US8671004B2 (en) System and method of providing spending information by foreign visitors using transaction records of financial presentation devices
US9436937B1 (en) Highlight-based bill processing
US20220067365A1 (en) System and method for domain aware document classification and information extraction from consumer documents
CN110648211A (zh) 数据验证
CN110648214A (zh) 一种确定异常账户的方法及装置
JP2022016658A (ja) 口座管理システム、口座管理方法、プログラム、および情報提供システム
JP2010244227A (ja) 会計入力保存装置
CN111428725A (zh) 数据结构化处理方法、装置和电子设备
KR102417698B1 (ko) 금융상품 정보 수집 플랫폼 시스템, 금융상품 정보 수집 방법 및 이를 위한 컴퓨터 프로그램
US11854032B1 (en) Merchant services statements and pricing
TWM568448U (zh) 智能查帳系統
US20150032523A1 (en) Credit source recommendation based on product level data analysis
Dydkowski Effectiveness of the urban services electronic payment systems on the example of Silesian card of public services
CN110223052A (zh) 数据处理方法、装置和机器可读介质
KR20150097837A (ko) 계정추천 및 전표생성을 위한 패턴생성시스템 및 그 제공방법
Dahlberg et al. Finnish consumers' expectations on developments and changes in payment habits: survey in connection with the research project" Finnish payment habits 2010"
CN113837855A (zh) 基于云网络的跨境增值税批量智能处理方法、装置及设备
KR20130127137A (ko) 지출 가이드 장치 및 방법
US20150348212A1 (en) Systems and Methods for Graphically Rendering Account Data
CN111210329A (zh) 会计凭证的生成方法、装置、存储介质和电子设备
US20180137578A1 (en) System and method for prediction of deduction claim success based on an analysis of electronic documents
KR20140073847A (ko) 모바일 어플리케이션을 이용한 금융 서비스 제공 시스템
JP7473900B2 (ja) フォーマット作成装置、フォーマット作成方法およびフォーマット作成プログラム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant