CN113239881A - 一种发票报销方法 - Google Patents

一种发票报销方法 Download PDF

Info

Publication number
CN113239881A
CN113239881A CN202110621237.1A CN202110621237A CN113239881A CN 113239881 A CN113239881 A CN 113239881A CN 202110621237 A CN202110621237 A CN 202110621237A CN 113239881 A CN113239881 A CN 113239881A
Authority
CN
China
Prior art keywords
invoice
reimbursed
information
reimbursement
code
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110621237.1A
Other languages
English (en)
Inventor
武孟华
衡成飞
徐浩
卢殿海
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Zhongtongji Network Technology Co Ltd
Original Assignee
Shanghai Zhongtongji Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Zhongtongji Network Technology Co Ltd filed Critical Shanghai Zhongtongji Network Technology Co Ltd
Priority to CN202110621237.1A priority Critical patent/CN113239881A/zh
Publication of CN113239881A publication Critical patent/CN113239881A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/416Extracting the logical structure, e.g. chapters, sections or page numbers; Identifying elements of the document, e.g. authors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/12Accounting
    • G06Q40/128Check-book balancing, updating or printing arrangements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/414Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Finance (AREA)
  • Artificial Intelligence (AREA)
  • Accounting & Taxation (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • Geometry (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Graphics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Technology Law (AREA)
  • General Business, Economics & Management (AREA)
  • Character Input (AREA)

Abstract

本发明公开了一种发票报销方法,属于发票报销领域;首先获取待报销发票的图像,然后基于光学字符识别采用机器学习的方式识别图像并得到发票信息;之后根据发票信息验证待报销发票是否可以报销,如果可以则进行报销。本申请方案采用识别发票图像的方式,无需人工填写发票信息,不易出错,效率高;识别的发票信息还可以验证是否可以报销,保证报销的有效性。

Description

一种发票报销方法
技术领域
本发明涉及发票报销领域,特别地,涉及一种发票报销方法。
背景技术
发票是指一切单位和个人在购销商品、提供或接受服务以及从事其他经营活动中,所开具和收取的业务凭证,是会计核算的原始依据,也是审计机关、税务机关执法检查的重要依据。简单来说,发票就是发生的成本、费用或收入的原始凭证。对于公司来讲,发票主要是公司做账的依据,同时也是缴税的费用凭证;而对于员工来讲,发票主要是用来报销的。
发票在我国社会经济活动中具有极其重要的意义和作用。发票具有合法性、真实性、统一性、及时性等特征,是最基本的会计原始凭证之一;发票是记录经济活动内容的载体,是财务管理的重要工具;发票是税务机关控制税源,征收税款的重要依据;发票是国家监督经济活动,维护经济秩序,保护国家财产安全的重要手段。
但是目前发票报销时采用人工将发票信息填写到表格中,纸质发票保存在信封里。人工填写发票信息容易出错,而且效率比较低,另一方面发票信息是否真实需要人工验证费时费力。
发明内容
为了克服现有技术的不足,本发明提供一种发票报销方法,以解决发明报销时,人工填写发票信息容易出错,而且效率比较低,另一方面发票信息是否真实需要人工验证费时费力的问题。
本发明解决其技术问题所采用的技术方案是:
一种发票报销方法,包括以下步骤:
获取待报销发票图像;
基于光学字符识别采用机器学习的方式识别所述图像并得到发票信息,所述发票信息包括报销金额、发票代码以及发票号码;
根据所述发票信息验证所述待报销发票是否可以报销;
如果可以,则按照所述报销金额对待报销发票进行报销。
进一步地,所述基于光学字符识别采用机器学习的方式识别所述图像并得到发票信息包括:
获取发票图像训练样本;
对训练样本的数据进行标注;
根据标注的数据构建识别模型;
将待报销发票的图像发送到识别模型中进行识别得到发票信息。
进一步地,所述将待报销发票的图像发送到识别模型中进行识别得到发票信息包括:
根据所述识别待报销发票的类型;
调用所述类型的模板获取每种发票信息的的位置区域;
对每个位置区域的发票信息进行提取得到发票信息。
进一步地,所述对每个位置区域的发票信息进行提取得到发票信息包括:
识别所述位置区域上的文字;
将识别的文字分割为单个字符;
获取每一个字符的含义;
根据所述字符的含义得到发票信息。
进一步地,还包括:
存储已报销发票的发票信息。
进一步地,所述根据所述发票信息验证所述待报销发票是否可以报销包括:
根据所述发票代码验证所述待报销发票是否是真发票;
如果是真发票,则根据所述发票代码和发票号码验证所述待报销发票是否重复报销;
如果是,则不可以报销;如果否,则可以进行报销。
进一步地,所述根据所述发票代码验证所述待报销发票是否是真发票包括:
将所述发票代码发送至国税发票真伪查验网站进行验证;
接收所述网站发送的验证结果。
进一步地,所述根据所述发票代码和发票号码验证所述待报销发票是否重复报销包括:
在存储的已报销发票的发票信息中搜索所述待报销发票的发票代码和发票号码;
判断所述存储的发票信息中是否存在已报销发票的发票代码和发票号码与待报销发票的发票代码和发票号码都一样;
如果存在,则是重复报销;如果不存在,则不是重复报销。
本申请采用以上技术方案,至少具备以下有益效果:
本申请技术方案提供一种发票报销方法,首先获取待报销发票的图像,然后基于光学字符识别采用机器学习的方式识别图像并得到发票信息;之后根据发票信息验证待报销发票是否可以报销,如果可以则进行报销。本申请方案采用识别发票图像的方式,无需人工填写发票信息,不易出错,效率高;识别的发票信息还可以验证是否可以报销,保证报销的有效性。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的一种发票报销方法流程图;
图2是本发明实施例提供的一种具体的发票报销方法流程图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面结合附图和实施例对本发明的技术方案进行详细的描述说明。显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所得到的所有其它实施方式,都属于本申请所保护的范围。
参照图1,本发明实施例提供一种发票报销方法,包括以下步骤:
获取待报销发票图像;
基于光学字符识别采用机器学习的方式识别图像并得到发票信息,发票信息包括报销金额、发票代码以及发票号码;
根据发票信息验证待报销发票是否可以报销;
如果可以,则按照报销金额对待报销发票进行报销。
本发明实施例提供的一种发票报销方法,首先获取待报销发票的图像,然后基于光学字符识别采用机器学习的方式识别图像并得到发票信息;之后根据发票信息验证待报销发票是否可以报销,如果可以则进行报销。本发明实施例提供的方法采用识别发票图像的方式,无需人工填写发票信息,不易出错,效率高;识别的发票信息还可以验证是否可以报销,保证报销的有效性。
作为对上述实施例的一种补充说明,本发明还提供一种具体的发票报销方法,如图2所示,
其中,基于光学字符识别采用机器学习的方式识别图像并得到发票信息包括:获取发票图像训练样本;对训练样本的数据进行标注;根据标注的数据构建识别模型;将待报销发票的图像发送到识别模型中进行识别得到发票信息。构建训练模型直接识别发票图像的发票信息,只需训练好模型即可自动识别图像中的发票信息,无需人工填写录入,效率高,而且不易出错。
训练模型识别图像中的发票信息包括:根据识别待报销发票的类型;调用类型的模板获取每种发票信息的的位置区域;对每个位置区域的发票信息进行提取得到发票信息。由于发票有多种类型,如增值税和普通发票的分类,即使同时普通发票的类型,各发票信息在发票上的位置也不相同,因此需要预先将发票根据版面布局分为多种类型。同一版面或者需要的发票信息布局相同的发票作为同一类发票。
其中,对每个位置区域的发票信息进行提取得到发票信息包括:识别位置区域上的文字;将识别的文字分割为单个字符;获取每一个字符的含义;根据字符的含义得到发票信息。
需要说明的是,如果发票报销完毕,将已报销发票的发票信息进行存储,以便进行查看。
在发票实际应用过程中,同一个地区的发票代码是一样的,发票号码每张都是不一样的。简单来说,发票代码是发票类型码,也就是不同的发票类型和版次,有不同的发票代码而发票号码则是同一发票代码下发票的顺序号。发票号码一般八位,发票代码一般12位;发票代码一样但是号码不一样,那么两个发票的版面应该是一样的,这样的发票应该是同一类型的发票,不同的票号同一类别(发票代码)写的发票,其号码应该都是不一样的,如果两份发票的发票代码一样,号码也一样,那么其中肯定有一个是假的。
因此,本发明实施例中,根据发票信息验证待报销发票是否可以报销包括:根据发票代码验证待报销发票是否是真发票;如果是真发票,则根据发票代码和发票号码验证待报销发票是否重复报销;如果是,则不可以报销;如果否,则可以进行报销。即先判断发票的真伪,如果是真则继续判断是否重复报销。
其中,根据发票代码验证待报销发票是否是真发票包括:将发票代码发送至国税发票真伪查验网站进行验证;接收网站发送的验证结果。
其中,根据发票代码和发票号码验证待报销发票是否重复报销包括:在存储的已报销发票的发票信息中搜索待报销发票的发票代码和发票号码;判断存储的发票信息中是否存在已报销发票的发票代码和发票号码与待报销发票的发票代码和发票号码都一样;如果存在,则是重复报销;如果不存在,则不是重复报销。
本发明实施例提供的发票报销方法,一方面可以通过光学字符识别提取发票信息可以大幅减少人工录入,具体地,基于机器学习的方式,采集发票中的数据,通过标注数据源,提高识别的速度和准确度.识别步骤上,包括文字侦测,字符切分,字符分类.文字侦测用于将图片上的文字与其他环境对象分离出来,字符切分用于将文字分割成一个个单一的字符,字符分类用于确定每一个字符是什么.通过对于文字的长度和位置的学习,通过机器学习可以对发票识别出发票代码,开票金额等。另一方面在提取出的发票信息,进行是否重复报销和发票真伪验证,提升验证效率。
可以理解的是,上述各实施例中相同或相似部分可以相互参考,在一些实施例中未详细说明的内容可以参见其他实施例中相同或相似的内容。
需要说明的是,在本申请的描述中,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性。此外,在本申请的描述中,除非另有说明,“多个”的含义是指至少两个。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本申请的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本申请的实施例所属技术领域的技术人员所理解。
应当理解,本申请的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序指令相关的硬件完成,的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本申请各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本申请的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
尽管上面已经示出和描述了本申请的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本申请的限制,本领域的普通技术人员在本申请的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims (8)

1.一种发票报销方法,其特征在于,包括以下步骤:
获取待报销发票图像;
基于光学字符识别采用机器学习的方式识别所述图像并得到发票信息,所述发票信息包括报销金额、发票代码以及发票号码;
根据所述发票信息验证所述待报销发票是否可以报销;
如果可以,则按照所述报销金额对待报销发票进行报销。
2.根据权利要求1所述的方法,其特征在于:所述基于光学字符识别采用机器学习的方式识别所述图像并得到发票信息包括:
获取发票图像训练样本;
对训练样本的数据进行标注;
根据标注的数据构建识别模型;
将待报销发票的图像发送到识别模型中进行识别得到发票信息。
3.根据权利要求2所述的方法,其特征在于:所述将待报销发票的图像发送到识别模型中进行识别得到发票信息包括:
根据所述识别待报销发票的类型;
调用所述类型的模板获取每种发票信息的的位置区域;
对每个位置区域的发票信息进行提取得到发票信息。
4.根据权利要求3所述的方法,其特征在于:所述对每个位置区域的发票信息进行提取得到发票信息包括:
识别所述位置区域上的文字;
将识别的文字分割为单个字符;
获取每一个字符的含义;
根据所述字符的含义得到发票信息。
5.根据权利要求1所述的方法,其特征在于,还包括:
存储已报销发票的发票信息。
6.根据权利要求5所述的方法,其特征在于:所述根据所述发票信息验证所述待报销发票是否可以报销包括:
根据所述发票代码验证所述待报销发票是否是真发票;
如果是真发票,则根据所述发票代码和发票号码验证所述待报销发票是否重复报销;
如果是,则不可以报销;如果否,则可以进行报销。
7.根据权利要求6所述的方法,其特征在于:所述根据所述发票代码验证所述待报销发票是否是真发票包括:
将所述发票代码发送至国税发票真伪查验网站进行验证;
接收所述网站发送的验证结果。
8.根据权利要求6所述的方法,其特征在于:所述根据所述发票代码和发票号码验证所述待报销发票是否重复报销包括:
在存储的已报销发票的发票信息中搜索所述待报销发票的发票代码和发票号码;
判断所述存储的发票信息中是否存在已报销发票的发票代码和发票号码与待报销发票的发票代码和发票号码都一样;
如果存在,则是重复报销;如果不存在,则不是重复报销。
CN202110621237.1A 2021-06-03 2021-06-03 一种发票报销方法 Pending CN113239881A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110621237.1A CN113239881A (zh) 2021-06-03 2021-06-03 一种发票报销方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110621237.1A CN113239881A (zh) 2021-06-03 2021-06-03 一种发票报销方法

Publications (1)

Publication Number Publication Date
CN113239881A true CN113239881A (zh) 2021-08-10

Family

ID=77136670

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110621237.1A Pending CN113239881A (zh) 2021-06-03 2021-06-03 一种发票报销方法

Country Status (1)

Country Link
CN (1) CN113239881A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117611363A (zh) * 2023-10-25 2024-02-27 浙江爱信诺航天信息技术有限公司 凭证在线校验方法及介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107545473A (zh) * 2016-11-23 2018-01-05 卢安迪 一种预防电子发票重复报销的方法
WO2020082673A1 (zh) * 2018-10-23 2020-04-30 深圳壹账通智能科技有限公司 发票检验方法、装置、计算设备和存储介质
CN112085578A (zh) * 2020-09-07 2020-12-15 杭州真内控科技有限公司 一种电子发票报销系统及电子发票夹装置
CN112801041A (zh) * 2021-03-08 2021-05-14 北京市商汤科技开发有限公司 财务数据的报销方法、装置、设备及存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107545473A (zh) * 2016-11-23 2018-01-05 卢安迪 一种预防电子发票重复报销的方法
WO2020082673A1 (zh) * 2018-10-23 2020-04-30 深圳壹账通智能科技有限公司 发票检验方法、装置、计算设备和存储介质
CN112085578A (zh) * 2020-09-07 2020-12-15 杭州真内控科技有限公司 一种电子发票报销系统及电子发票夹装置
CN112801041A (zh) * 2021-03-08 2021-05-14 北京市商汤科技开发有限公司 财务数据的报销方法、装置、设备及存储介质

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117611363A (zh) * 2023-10-25 2024-02-27 浙江爱信诺航天信息技术有限公司 凭证在线校验方法及介质

Similar Documents

Publication Publication Date Title
CN109887153B (zh) 一种财税处理方法和处理系统
CN111079755B (zh) 一种财务报销数据处理方法、装置及系统
CN110929580A (zh) 一种基于ocr的财务报表信息快速提取方法及系统
CN115204110A (zh) 从数字化文档提取可搜索的信息
US9454545B2 (en) Automated field position linking of indexed data to digital images
CN111428599A (zh) 票据识别方法、装置和设备
CN112395996A (zh) 财务票据ocr识别及影像处理方法、系统及可读存储介质
CN110599319B (zh) 自动审计方法、装置、终端及存储介质
CN109271951A (zh) 一种提升记账审核效率的方法及系统
CN112785404A (zh) 发票开具管理系统
CN112686307A (zh) 基于人工智能获取发票的方法、装置及存储介质
CN112613285A (zh) 一种基于分区域处理的招标文件审查分析方法
CN113918583B (zh) 一种业务单据中审核节点风险等级的确定方法及确定装置
CN113239881A (zh) 一种发票报销方法
CN114511866A (zh) 数据稽核方法、装置、系统、处理器及机器可读存储介质
CN113111829B (zh) 识别文档的方法和装置
CN117807967A (zh) 一种基于ocr智能填单的财务报账方法、装置及电子设备
CN117541180A (zh) 一种发票处理方法、装置及介质
CN115908062A (zh) 一种知识产权全周期管理系统
CN114387604B (zh) 一种纸质发票信息提取方法及装置
CN113807901A (zh) 一种电子发票检测方法、终端设备及存储介质
CN113807256A (zh) 票据数据处理方法、装置、电子设备和存储介质
CN113988793A (zh) 一种增值税电子发票的查验方法及系统
CN112287828A (zh) 一种基于机器学习的财务报表生成方法及装置
CN110648043A (zh) 基于地址信息的分析方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination