CN112132671A - 发票信息采集方法、装置、计算机设备和存储介质 - Google Patents
发票信息采集方法、装置、计算机设备和存储介质 Download PDFInfo
- Publication number
- CN112132671A CN112132671A CN202010903178.2A CN202010903178A CN112132671A CN 112132671 A CN112132671 A CN 112132671A CN 202010903178 A CN202010903178 A CN 202010903178A CN 112132671 A CN112132671 A CN 112132671A
- Authority
- CN
- China
- Prior art keywords
- invoice
- collected
- information
- interface
- receiving
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 68
- 238000004458 analytical method Methods 0.000 claims abstract description 128
- 238000012795 verification Methods 0.000 claims description 49
- 238000004590 computer program Methods 0.000 claims description 23
- 238000012015 optical character recognition Methods 0.000 claims description 17
- 238000005516 engineering process Methods 0.000 claims description 14
- 239000000284 extract Substances 0.000 claims description 7
- 230000008569 process Effects 0.000 description 16
- 238000010586 diagram Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 4
- 238000011160 research Methods 0.000 description 4
- 238000012545 processing Methods 0.000 description 3
- 230000001360 synchronised effect Effects 0.000 description 2
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 238000013475 authorization Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 210000001503 joint Anatomy 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000002688 persistence Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000026676 system process Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/12—Accounting
- G06Q40/128—Check-book balancing, updating or printing arrangements
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/10—Office automation; Time management
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/12—Protocols specially adapted for proprietary or special-purpose networking environments, e.g. medical networks, sensor networks, networks in vehicles or remote metering networks
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- General Business, Economics & Management (AREA)
- Entrepreneurship & Innovation (AREA)
- Marketing (AREA)
- Economics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Human Resources & Organizations (AREA)
- Computer Networks & Wireless Communication (AREA)
- Tourism & Hospitality (AREA)
- Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Development Economics (AREA)
- Data Mining & Analysis (AREA)
- Operations Research (AREA)
- Technology Law (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请涉及一种发票信息采集方法、装置、计算机设备和存储介质,所述方法包括:设置多个发票接收接口,各发票接收接口用于接收相同类型或者不同类型的待归集发票;根据各发票接收接口接收的待归集发票的类型设置各发票接收接口的发票信息解析方式;当任一发票接收接口接收到待归集发票时,根据该任一发票接收接口的发票信息解析方式对接收到的待归集发票进行信息采集,得到接收到的待归集发票的发票信息。上述方法能够提高发票的归集管理效率。
Description
技术领域
本申请涉及发票信息处理技术领域,特别是涉及一种发票信息采集方法、装置、计算机设备和存储介质。
背景技术
发票作为报销的重要凭证,在报销流程中应用广泛。最开始纸质发票十分普及,报销流程是围绕着纸质发票进行设计。虽然是线上的报销流程,但是发票仍然采用线下流转的方式,需要用户打印报销单,粘贴发票并寄送,操作十分不便。
随着电子发票的普及,越来越多的行业和领域采用电子发票。有的报销流程对电子发票应用仍采用线下流转的方式,需要用户将电子发票进行打印后流转。有的报销流程则开发简单的电子发票的PDF解析归集的程序,通过对电子发票的解析对电子发票进行流转。
综上可知,当下对于发票的归集管理极其不便利,耗费的人工操作量大并且发票的归集管理效率低。对于纸质发票而言,需要线下收集,在纸质发票的归集管理中还需要人工提取对纸质发票的发票信息。对于电子发票而言,虽然能够通过电子发票的解析对电子发票进行流转,但是电子发票的收集过程也没有统一的渠道,因而造成电子发票的归集管理的效率低。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提高发票的归集管理效率的发票信息采集方法、装置、计算机设备和存储介质。
一种发票信息采集方法,该方法包括:设置多个发票接收接口,各发票接收接口用于接收相同类型或者不同类型的待归集发票;根据各发票接收接口接收的待归集发票的类型设置各发票接收接口的发票信息解析方式;当任一发票接收接口接收到待归集发票时,根据该任一发票接收接口的发票信息解析方式对接收到的待归集发票进行信息采集,得到接收到的待归集发票的发票信息。
在其中一个实施例中,待归集发票的类型包括纸质发票的发票影像类型和电子发票类型,多个发票接收接口包括第一类型接口和第二类型接口,待归集发票的发票信息包括待归集发票的票面信息;根据各发票接收接口接收的待归集发票的类型设置各发票接收接口的发票信息解析方式,包括:当第一类型接口用于接收发票影像类型的待归集发票时,设置第一类型接口的发票信息解析方式为第一解析方式,第一解析方式用于指示通过影像识别技术对待归集发票进行信息采集;当第二类型接口用于接收电子发票类型的待归集发票时,设置第二类型接口的发票信息解析方式为第二解析方式,第二解析方式用于指示通过获取待归集发票的票面信息的方式对待归集发票进行信息采集。
在其中一个实施例中,当任一发票接收接口接收到待归集发票时,根据该任一发票接收接口的发票信息解析方式对接收到的待归集发票进行信息采集,得到接收到的待归集发票的发票信息,包括:当第一类型接口接收到第一待归集发票时,确定第一待归集发票的发票影像,基于第一解析方式调用光学字符识别服务对发票影像进行信息采集,得到第一待归集发票的票面信息。
在其中一个实施例中,第二类型接口包括第一子类型接口和第二子类型接口,当第二类型接口用于接收电子发票类型的待归集发票时,设置第二类型接口的发票信息解析方式为第二解析方式,包括:当第一子类型接口用于接收来自邮箱的电子发票类型的第二待归集发票时,设置第一子类型接口的发票信息解析方式为第二解析方式中的第一方式,第一方式用于指示从第二待归集发票中提取票面信息;当第二子类型接口用于接收来自应用程序的电子发票类型的第三待归集发票,设置第二子类型接口的发票信息解析方式为第二解析方式中的第二方式,第二方式用于指示接收来自应用程序的第三待归集发票的票面信息。
在其中一个实施例中,当任一发票接收接口接收到待归集发票时,根据该任一发票接收接口的发票信息解析方式对接收到的待归集发票进行信息采集,得到接收到的待归集发票的发票信息,包括:当第一子类型接口接收到来自第一邮箱的第二待归集发票时,判断第一邮箱是否已与用户信息进行绑定;若是,将第二待归集发票与用户信息进行绑定,并基于第一方式从第二待归集发票中提取票面信息,得到第二待归集发票的票面信息;若否,将第二待归集发票存储到公共发票池,并基于第一方式从第二待归集发票中提取票面信息,得到第二待归集发票的票面信息。
在其中一个实施例中,一种发票信息采集方法还包括:接收第一邮箱的绑定请求,绑定请求用于请求将用户信息与第一邮箱进行绑定;根据绑定请求生成第一验证码,通过第二邮箱向第一邮箱发送第一验证码;接收绑定请求的申请页面发送的第二验证码,判断第二验证码是否与第一验证码相同;若是,将第一邮箱与用户信息进行绑定;通过第一邮箱的邮箱账号查询公共发票池,从公共发票池获取绑定之前的第一邮箱的发票,将获取到的发票与用户信息进行绑定。
在其中一个实施例中,当任一发票接收接口接收到待归集发票时,根据该任一发票接收接口的发票信息解析方式对接收到的待归集发票进行信息采集,得到接收到的待归集发票的发票信息,包括:当第二子类型接口接收到客户端发送的自来应用程序的第三待归集发票时,基于第二方式通过接收客户端发送的来自应用程序的第三待归集发票的票面信息的方式得到第三待归集发票的票面信息;其中,客户端获得来自应用程序的第三待归集发票的票面信息的方式,包括:客户端通过应用程序的公众平台提供的应用账号和应用密钥调用公众平台的接口,通过调用的接口获取公众平台的全局唯一接口调用凭据;客户端通过全局唯一接口调用凭据调用公众平台的发票列表接口,通过发票列表接口获取公众平台的发票列表;客户端确认选择发票列表中的第三待归集发票,接收公众平台返回的第三待归集发票的票面信息。
在其中一个实施例中,一种发票信息采集方法还包括:对多个发票接收接口接收到的电子发票和/或纸质发票的发票影像进行归集;将归集后的电子发票和/或纸质发票的发票影像发布到消息队列,以使得报销系统从消息队列中提取电子发票和/或纸质发票的发票影像进行自动化报销。
一种发票信息采集装置,该装置包括:第一设置模块,用于设置多个发票接收接口,各发票接收接口用于接收相同类型或者不同类型的待归集发票;第二设置模块,用于根据各发票接收接口接收的待归集发票的类型设置各发票接收接口的发票信息解析方式;采集模块,用于当任一发票接收接口接收到待归集发票时,根据该任一发票接收接口的发票信息解析方式对接收到的待归集发票进行信息采集,得到接收到的待归集发票的发票信息。
一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述任一实施例方法的步骤。
一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述任一实施例方法的步骤。
上述发票信息采集方法、装置、计算机设备和存储介质,信息采集系统设置多个用于接收相同类型或者不同类型的待归集发票的发票接收接口,并且针对各发票接收接口设置对应的发票信息解析方式。当任一发票接收接口接收到待归集发票时,根据该任一发票接收接口的发票信息解析方式对接收到的待归集发票进行信息采集,得到接收到的待归集发票的发票信息。因此,不管待归集发票是什么类型的发票,例如是电子发票或者纸质发票,均提供有对应的发票接收接口,以接收对应类型的待归集发票。同时,针对对应的发票接收接口,设置有对应的发票信息解析方式,用于对发票接收接口接收到的待归集发票进行信息采集,从而得到待归集发票的发票信息。因此,实现了多渠道自动化发票归集,无需人工操作,能够提高发票归集管理的效率。
附图说明
图1为一个实施例中一种发票信息采集方法的应用环境图;
图2为一个实施例中一种发票信息采集方法的流程示意图;
图3为一个实施例中一种纸质发票的发票信息的收集的流程示意图;
图4为一个实施例中一种邮箱归集方式采集待归集发票的票面信息的流程示意图;
图5为一个实施例中一种微信发票归集的流程示意图;
图6为一个实施例中一种发票报销的流程示意图;
图7为一个实施例中一种发票信息采集装置的结构框图;
图8为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请提供的一种发票信息采集方法,应用于如图1所示的应用环境中。信息采集系统100用于实现本申请的一种发票信息采集方法。如图1所示,信息采集系统100设置多个发票接收接口,如接口102、接口104、接口106等。当然,多个发票接收接口也可以是系统内部设置的虚拟接口,如不同网络协议的通信接口或各种信息调用接口等。其中,各发票接收接口用于接收相同类型或者不同类型的待归集发票。待归集发票可以是纸质发票的影像或者是电子发票。信息采集系统100根据各发票接收接口接收的待归集发票的类型设置各发票接收接口的发票信息解析方式。当信息采集系统100的任一发票接收接口接收到来自终端设备发送的待归集发票时,根据该任一发票接收接口的发票信息解析方式对接收到的待归集发票进行信息采集,得到接收到的待归集发票的发票信息。最终,将各发票接收接口接收到的待归集发票的发票信息以及待归集发票进行归集,存储到数据库200中。其中,终端设备可以是台式计算机302、手机304以及平板电脑306等。
本申请提供一种发票信息采集方法,应用于如图1所示的信息采集系统。在一实施例中,如图2所示,一种发票信息采集方法,包括以下步骤:
S102,设置多个发票接收接口,各发票接收接口用于接收相同类型或者不同类型的待归集发票。
在本实施例中,信息采集系统设置多个发票接收接口,通过各发票接收接口接收相同类型或者不同类型的待归集发票。当发票接收接口的数量为两个时,各发票接收接口用于接收不同类型的待归集发票。当发票接收接口的数量大于两个时,多个发票接收接口中存在接收相同类型的待归集发票的发票接收接口,以及存在接收不同类型的待归集发票的发票接收接口。其中,待归集发票的类型包括电子发票类型和纸质发票的发票影像类型。当待归集发票的类型为纸质发票的发票影像类型时,待归集发票为纸质发票的发票影像。
S104,根据各发票接收接口接收的待归集发票的类型设置各发票接收接口的发票信息解析方式。
在本实施例中,信息采集系统针对各发票接收接口接收的待归集发票的类型设置对应的发票信息解析方式。各发票接收接口接收的待归集发票的类型不同,其对应的发票信息获取方式也不相同。具体地,第一发票接收接口接收纸质发票的发票影像类型时,设置第一发票信息获取方式,第一发票信息解析方式用于获取纸质发票的发票影像类型的待归集发票的信息。第二发票接收接口接收电子发票类型时,设置第二发票信息解析方式,第二发票信息解析方式用于获取电子发票类型的待归集发票的信息。此时,第一发票信息解析方式和第二发票信息解析方式不相同,也即是,通过不同方式获取到待归集发票的信息不同,因此可实现对不同类型的待归集发票的信息解析。
此外,各发票接收接口接收的待归集发票的类型相同,其对应的发票信息解析方式也可以不相同。具体地,第三发票接收接口接收电子发票类型时,设置第三发票信息解析方式,第三发票信息解析方式用于采用第一获取方式获取电子发票类型的待归集发票的信息。第四发票接收接口接收电子发票类型时,设置第四发票信息解析方式,第四发票信息解析方式用于采用第二获取方式获取电子发票类型的待归集发票的信息。其中,第一获取方式和第二获取方式不相同,第一获取方式根据第三发票接收接口接收到的具体的待归集发票的形式确定,第二获取方式根据第四发票接收接口接收到的具体的待归集发票的形式确定。例如,第三发票接收接口接收到的待归集发票为邮箱发送的PDF文件,此时第一获取方式根据邮箱形式发送的PDF文件确定信息获取方式。第四发票接收接口接收到的待归集发票为微信发送的PDF文件,此时第二获取方式根据微信形式发送的PDF文件确定信息获取方式。因此,信息采集系统可实现接收并获取多种渠道以及多种类型的待归集发票以及待归集发票的发票信息。
S106,当任一发票接收接口接收到待归集发票时,根据该任一发票接收接口的发票信息解析方式对接收到的待归集发票进行信息采集,得到接收到的待归集发票的发票信息。
在本实施例中,信息采集系统通过任一发票接收接口读取并接收到待归集发票时,根据该任一发票接收接口的发票信息解析方式对接收到的待归集发票进行信息采集,以获取接收到的待归集发票的发票信息。发票信息包括待归集发票的票面信息。例如,开票日期、发票号码、发票代码、购买方纳税人识别号、销售方纳税人识别号、金额、税额等要素信息。
上述发票信息采集方法,信息采集系统设置多个用于接收相同类型或者不同类型的待归集发票的发票接收接口,并且针对各发票接收接口设置对应的发票信息解析方式。当任一发票接收接口接收到待归集发票时,根据该任一发票接收接口的发票信息解析方式对接收到的待归集发票进行信息采集,得到接收到的待归集发票的发票信息。因此,不管待归集发票是什么类型的发票,例如是电子发票或者纸质发票,均提供有对应的发票接收接口,以接收对应类型的待归集发票。同时,针对对应的发票接收接口,设置有对应的发票信息解析方式,用于对发票接收接口接收到的待归集发票进行信息采集,从而得到待归集发票的发票信息。因此,实现了多渠道自动化发票归集,无需人工操作,能够提高发票归集管理的效率。
在一个实施例中,待归集发票的类型包括纸质发票的发票影像类型和电子发票类型,多个发票接收接口包括第一类型接口和第二类型接口,待归集发票的发票信息包括待归集发票的票面信息。S104包括:当第一类型接口用于接收发票影像类型的待归集发票时,设置第一类型接口的发票信息解析方式为第一解析方式,第一解析方式用于指示通过影像识别技术对待归集发票进行信息采集;当第二类型接口用于接收电子发票类型的待归集发票时,设置第二类型接口的发票信息解析方式为第二解析方式,第二解析方式用于指示通过获取待归集发票的票面信息的方式对待归集发票进行信息采集。
在该实施例中,信息采集系统接收纸质发票的发票影像和电子发票。此时,针对两种类型的发票,信息采集系统设置用于接收发票影像类型的待归集发票的第一类型接口和用于接收电子发票类型的待归集发票的第二类型接口。第一类型接口的发票信息解析方式为第一解析方式,第一解析方式用于指示通过影像识别技术对待归集发票进行信息采集。例如,影像识别技术可以是OCR(Optical Character Recognition,光学字符识别)服务技术。第一解析方式可以是指示采用OCR服务技术提取纸质发票的发票影像中的票面信息以进行信息采集。第二类型接口的发票信息解析方式为第二解析方式,第二解析方式用于指示通过获取待归集发票的票面信息的方式对待归集发票进行信息采集。获取待归集发票的票面信息的方式可以是直接解析电子发票的PDF文件,提取PDF文件中的票面信息。或者,获取待归集发票的票面信息的方式可以是直接接收发送端设备发送的包含待归集发票的票面信息。因此,可以实现信息采集系统接收纸质发票的发票影像和电子发票,并获得纸质发票的发票影像和电子发票对应的票面信息。
在一实施例中,S106包括:当第一类型接口接收到第一待归集发票时,确定第一待归集发票的发票影像,基于第一解析方式调用光学字符识别服务对发票影像进行信息采集,得到第一待归集发票的票面信息。
在该实施例中,第一待归集发票为纸质发票的发票影像,当信息采集系统的第一类型接口接收到发票影像时,基于第一解析方式调用光学字符识别服务对发票影像进行信息识别,提取发票影像中的票面信息。具体地,第一解析方式用于指示信息采集系统通过影像识别技术对待归集发票进行信息采集,此时信息采集系统调用光学字符识别服务对发票影像进行信息识别。
在一实施场景中,如图3所示。按照以下步骤实现纸质发票的发票信息的收集:
1)用户触发客户端拍照归集按钮以唤起相机,拍摄纸质发票全票面影像,确认影像后得到发票图片,客户端调用服务端发票影像识别接口,上传发票图片。
2)服务端接收到发票影像识别请求,暂存发票图片至OSS(云存储服务)中,可以设置1天后过期,并调用OCR服务以对发票图片进行识别。
3)OCR服务返回发票票面信息后,服务端校验发票五要素(发票代码、发票号码、发票日期、发票金额、校验码)是否完整以及格式是否正确,是则执行步骤4,否则执行步骤5。
4)调用发票查验服务,使用发票五要素进行发票查验,查验失败执行步骤6,查验成功执行步骤7。
5)返回OCR服务的发票五要素,客户端展示发票五要素,用户对发票五要素进行矫正,矫正后点击重试,调用接口进入步骤4进行发票查验。
6)返回查验失败信息至客户端,客户端展示查验失败信息,归集结束。
7)通过发票代码与发票号码查询数据库,校验发票是否已经归集,已被归集执行步骤8,否则执行步骤9。
8)返回发票基本信息及归集信息,客户端提示用户发票已被归集。
9)OSS暂存的发票影像设置为永久,作为发票的电子影像,调用归集通用服务,保存发票结构化数据即非结构化数据。
10)返回客户端发票基本信息,提示发票已成功归集。
因此,实现了纸质发票的拍照归集。
在一实施例中,第二类型接口包括第一子类型接口和第二子类型接口。当第二类型接口用于接收电子发票类型的待归集发票时,设置第二类型接口的发票信息解析方式为第二解析方式,包括:当第一子类型接口用于接收来自邮箱的电子发票类型的第二待归集发票时,设置第一子类型接口的发票信息解析方式为第二解析方式中的第一方式,第一方式用于指示从第二待归集发票中提取票面信息;当第二子类型接口用于接收来自应用程序的电子发票类型的第三待归集发票,设置第二子类型接口的发票信息解析方式为第二解析方式中的第二方式,第二方式用于指示接收来自应用程序的第三待归集发票的票面信息。
具体地,在一实施例中,S106包括:当第一子类型接口接收到来自第一邮箱的第二待归集发票时,判断第一邮箱是否已与用户信息进行绑定;若是,将第二待归集发票与用户信息进行绑定,并基于第一方式从第二待归集发票中提取票面信息,得到第二待归集发票的票面信息;若否,将第二待归集发票存储到公共发票池,并基于第一方式从第二待归集发票中提取票面信息,得到第二待归集发票的票面信息。
优选地,S106之前,还包括:接收第一邮箱的绑定请求,绑定请求用于请求将用户信息与第一邮箱进行绑定;根据绑定请求生成第一验证码,通过第二邮箱向第一邮箱发送第一验证码;接收绑定请求的申请页面发送的第二验证码,判断第二验证码是否与第一验证码相同;若是,将第一邮箱与用户信息进行绑定;通过第一邮箱的邮箱账号查询公共发票池,从公共发票池获取绑定之前的第一邮箱的发票,将获取到的发票与用户信息进行绑定。
在该实施例中,当第一子类型接口接收到来自第一邮箱的第二待归集发票时,先判断该第一邮箱是否与用户信息进行绑定。若是,将接收到的第二待归集发票与用户信息进行绑定。若否,则将第二待归集发票存储到公共发票池中,以等待第一邮箱与用户信息进行绑定时从公共发票池中提取对应的第二待归集发票与用户信息进行关联。
其中,第一邮箱与用户信息进行绑定的方式为:用户通过绑定请求的申请页面向服务端发送绑定请求,用于请求将用户信息与第一邮箱进行绑定。服务端接收到绑定请求后,生成对应的第一验证码,并通过第二邮箱向第一邮箱发送第一验证码。第二邮箱可以是设定的公共邮箱,用于接收第一邮箱发送的第二待归集发票。用户通过第一邮箱接收到第一验证码之后,在绑定请求的申请页面输入第二验证码并向服务端发送第二验证码。一般来说,输入的第二验证码为第一验证码。服务端接收到第二验证码之后,判断第二验证码和第一验证码是否相同,若是,则将第一邮箱与用户信息进行绑定。同时,从公共发票池中获取第一邮箱在绑定之前发送的第二待归集发票,将第二待归集发票与用户信息进行绑定。具体地,采用邮箱归集方式采集待归集发票的票面信息。具体地,采用转发公共邮箱的模式采集待归集发票的票面信息。此时,信息采集系统需要先申请一个公共邮箱。在具体实施过程中,第一邮箱可以是用户绑定的邮箱,第二邮箱可以是公共邮箱,参见图4所示,具体执行以下步骤:
1)用户在客户端上操作,点击绑定邮箱,进入邮箱绑定页面,填写邮箱地址,客户端调用邮箱绑定接口,向服务端发送邮箱绑定请求。
2)服务端接收到邮箱绑定请求,维护用户与邮箱的绑定关系,状态为带验证。为该邮箱生成一个验证码,具有一定有效期,存入缓存服务器中,用于绑定验证,使用公共邮箱向待绑定邮箱发送一封验证码邮件。
3)客户端跳转到验证码输入页面,用户输入待绑定邮箱收到的验证码,点击验证,客户端调用邮箱绑定验证接口。
4)服务端收到邮箱绑定验证请求,根据待验证邮箱查询缓存服务器中的验证码,验证校验码是否正确,验证不通过执行步骤5,验证通过执行步骤6。
5)返回验证不通过,客户端弹出对应的提示信息。
6)验证通过,维护用户邮箱绑定关系为已验证,查找公共发票池中是否有该邮箱对应的发票记录,如果有则为发票绑定用户关系,返回绑定成功。
7)邮箱绑定成功后,用户可以通过绑定的邮箱编辑邮件,添加发票PDF文件及其他需要的附件(如打车行程单),或者转发收到的含有发票及附件的邮件,至公共邮箱。
8)创建定时任务,定时获取未读取的公共邮箱中的邮件,获取邮件的uid,存入待解析队列中,更新邮件状态为已读。
9)每台服务器都启动一个邮件解析线程池,每个线程从待解析队列中获取待解析的邮件uid,放入解析中队列,执行步骤10,如果多次获取不到待解析任务,可以让线程休眠一段时间。
10)通过邮件uid获取邮件详细信息(包括邮件标题,发件人,邮件正文,附件等),判断附件是否含有电子发票,邮件附件不含电子发票,执行步骤11,邮件附件还有电子发票,执行步骤12。
11)添加一条邮件解析记录,记录邮件基础信息(邮件标题,发送人,时间等),设置为解析失败状态,记录解析失败的原因,方便用户查看,并发送消息提醒。
12)提取准确的电子发票5要素信息,通过发票号码、发票代码查询数据库校验发票是否已经归集,如果已经归集,执行步骤11,否则调用发票查验服务,如果发票查验失败,执行步骤13,否则执行步骤14。
13)获取发票查验失败的原因作为邮件解析失败的原因,执行步骤11。
14)将发票归集到公共发票池中,并将发票的发票信息进行存储。其中,发票信息包括结构化数据和非结构化数据。也即是,将发票的结构化数据和非结构化数据进行存储。进一步地,判断邮箱是否绑定用户,已绑定用户时将公共发票池中的发票存储到用户发票列表,以维护用户发票关系,最后添加一条邮件解析记录,记录邮件基础信息(邮件标题,发送人,时间等),设置邮件解析状态为成功,发送消息提醒。
在一实施例中,S106之前,还包括:接收第三邮箱的账号和密码信息。S106包括:根据第三邮箱的账号和密码信息通过第一子类型接口读取并接收来自第三邮箱的第四待归集发票时,基于第一方式从第四待归集发票中提取票面信息,得到第四待归集发票的票面信息。
在该实施例中,设置直连用户邮箱方案。具体地,获取用户授权,服务端保存用户的邮箱账号与密码,通过定时任务自动连接用户邮箱,解析邮件得到第四待归集发票。基于第一方式从第四待归集发票中提取票面信息,得到第四待归集发票的票面信息。该方案便利性较高,兼容性较高,但是安全性不高,有密码泄漏的风险,并且随着绑定邮箱的增加,处理效率不能得到保障。
在一实施例中,S106之前,还包括:与邮箱网关连接。S106包括:当接收来自邮箱网关提供的满足发票规则的第五待归集发票时,基于第一方式从第五待归集发票中提取票面信息,得到第五待归集发票的票面信息。
在该实施例中,设置邮箱网关推送方案。具体地,该方案需要与邮箱网关对接,由邮箱网关提供对所有接收到的邮件进行规则校验的能力,满足发票规则的,通过消息队列等形式,将邮件推送到服务器,服务器对邮件进行解析。该方案便利性极高,无需用户操作,安全性高,兼容性一般,需要邮箱网关的支持,并且用户体系如果与邮箱用户体系不同,还需要绑定用户体系间的映射关系。
上述三种邮箱归集方案,各有优缺点,可以根据实际情况进行选择。
在一实施例中,S106包括:当第二子类型接口接收到客户端发送的自来应用程序的第三待归集发票时,基于第二方式通过接收客户端发送的来自应用程序的第三待归集发票的票面信息的方式得到第三待归集发票的票面信息;其中,客户端获得来自应用程序的第三待归集发票的票面信息的方式,包括:客户端通过应用程序的公众平台提供的应用账号和应用密钥调用公众平台的接口,通过调用的接口获取公众平台的全局唯一接口调用凭据;客户端通过全局唯一接口调用凭据调用公众平台的发票列表接口,通过发票列表接口获取公众平台的发票列表;客户端确认选择发票列表中的第三待归集发票,接收公众平台返回的第三待归集发票的票面信息。
在该实施例中,应用程序可以是微信。客户端可以是信息采集系统的服务端对应设置的客户端。其中,要实现微信发票归集功能,首先需要注册微信公众平台,获取appId(应用账号)以及appSecret(应用密钥)。具体地,如图5所示,微信发票归集的操作为:
1)客户端通过appId以及appSecret调用微信公众平台接口,获取access_token(全局唯一接口调用凭据),后续调用其他微信公众平台接口需要使用access_token。
2)客户端调用微信公众平台-外部app拉起发票列表接口,拉起微信发票列表。
3)用户选择需要归集的发票,点击确定后,微信会返回所选发票对应的card_id(列表中对应的识别号)和encrypt_code(加密密码)。
4)客户端通过card_id和encrypt_code调用微信公众平台-批量查询发票详细信息接口,获取用户所选发票的详细信息。其中,发票的详细信息包括发票的票面信息以及其电子发票。
5)客户端调用服务端接口,将发票详细信息发送至服务端进行归集。
6)服务端校验待归集发票,通过发票号码、发票代码查询数据库过滤已归集的发票,归集过滤后的发票,返回客户端归集成功信息与归集失败信息。
7)客户端展示归集成功信息与归集失败信息。
因此,上述多个实施例提供了多渠道的发票归集方式,包括纸质发票的归集和电子发票的归集。
在一实施例中,S106之后,还包括:对多个发票接收接口接收到的电子发票和/或纸质发票的发票影像进行归集;将归集后的电子发票和/或纸质发票的发票影像发布到消息队列,以使得报销系统从消息队列中提取电子发票和/或纸质发票的发票影像进行自动化报销。
具体地,参见图6所示。在用户起草报销时,向报销系统提供WEB SDK,用于便捷的选择待报销的发票,报销系统引入该组件,初始化后提供一个回调函数,该回调函数会传入用户选择的发票数据,用于报销系统处理发票选择后的逻辑。用户起草报销流程,选择发票,通过报销流程校验后,提交流程,报销系统调用服务端接口,更新发票状态为报销中。流程不合规,被驳回,此时调用服务端接口,更新发票状态为待报销。流程审批通过,流程结束,此时调用服务端接口,更新发票状态为已报销。考虑到流程通过可能需要处理多个事件(比如记账等),如果在处理其他事件时出现异常,流程无法正常结束,但是已经调用服务端接口更新发票状态为已报销,此时可以通过接口返回的token,在有效期内可以通过该token调用回滚接口。
对于自动化报销流程:发票归集成功后,服务端将发票信息发布到消息队列中,有自动报销需求的报销系统可以订阅对应的主题,获取到发票信息后,可以根据归集用户及发票信息进行业务校验,如果满足自动报销条件,自动为用户起草报销流程。
需要说明的是,图6中的客户端不仅用于拉取微信接口的电子发票的电票数据,还提供拍照功能以获取纸质发票的发票影像。也即是,客户端采集纸票影像和电票数据。
结合图6中的方案以及上述多个实施例所述的方案,可采用以下具体实施:
采用关系型数据库(Oracle/DB2/SQLServer/MySQL等)作为数据持久化存储,负责保存各项实体定义,如发票主体信息,发票行信息,发票绑定用户信息等。
采用内存数据库(Redis/Memcache等)作为缓存服务,缓存验证码,发票查验结果,邮件解析队列等。
OCR服务与查验服务,目前均有成熟的服务提供方,有自研能力的也可采用自研服务。
消息队列可以采用常用的消息队列(RabbitMQ/ActiveMQ/RocketMQ等),有自研能力的也可采用自研消息队列。
邮箱协议,发送邮件采用SMTP,获取邮件建议采用IMAP。
使用B/S或C/S架构实现均可,推荐(但不限于)使用符合JEE技术规范的框架和技术栈实现Server端应用,例如SpringBoot+MyBatis。较为流行的.NET/C#等技术栈也可。
为防止单点故障,可将应用集群部署,通过Apache/Nginx/F5等进行软/硬负载均衡。从成本和重要程度上考量,一般使用Apache/Nginx做软负载均衡即可。
应该理解的是,虽然流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,附图中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
本申请还提供一种发票信息采集装置,如图7所示,该装置包括第一设置模块10、第二设置模块20以及采集模块30。第一设置模块10,用于设置多个发票接收接口,各发票接收接口用于接收相同类型或者不同类型的待归集发票;第二设置模块20,用于根据各发票接收接口接收的待归集发票的类型设置各发票接收接口的发票信息解析方式;采集模块30,用于当任一发票接收接口接收到待归集发票时,根据该任一发票接收接口的发票信息解析方式对接收到的待归集发票进行信息采集,得到接收到的待归集发票的发票信息。
在其中一个实施例中,待归集发票的类型包括纸质发票的发票影像类型和电子发票类型,多个发票接收接口包括第一类型接口和第二类型接口,待归集发票的发票信息包括待归集发票的票面信息;第二设置模块20具体还用于当第一类型接口用于接收发票影像类型的待归集发票时,设置第一类型接口的发票信息解析方式为第一解析方式,第一解析方式用于指示通过影像识别技术对待归集发票进行信息采集;当第二类型接口用于接收电子发票类型的待归集发票时,设置第二类型接口的发票信息解析方式为第二解析方式,第二解析方式用于指示通过获取待归集发票的票面信息的方式对待归集发票进行信息采集。
在其中一个实施例中,采集模块30具体还用于当第一类型接口接收到第一待归集发票时,确定第一待归集发票的发票影像,基于第一解析方式调用光学字符识别服务对发票影像进行信息采集,得到第一待归集发票的票面信息。
在其中一个实施例中,第二类型接口包括第一子类型接口和第二子类型接口,第二设置模块20具体还用于当第一子类型接口用于接收来自邮箱的电子发票类型的第二待归集发票时,设置第一子类型接口的发票信息解析方式为第二解析方式中的第一方式,第一方式用于指示从第二待归集发票中提取票面信息;当第二子类型接口用于接收来自应用程序的电子发票类型的第三待归集发票,设置第二子类型接口的发票信息解析方式为第二解析方式中的第二方式,第二方式用于指示接收来自应用程序的第三待归集发票的票面信息。
在其中一个实施例中,采集模块30具体还用于当第一子类型接口接收到来自第一邮箱的第二待归集发票时,判断第一邮箱是否已与用户信息进行绑定;若是,将第二待归集发票与用户信息进行绑定,并基于第一方式从第二待归集发票中提取票面信息,得到第二待归集发票的票面信息;若否,将第二待归集发票存储到公共发票池,并基于第一方式从第二待归集发票中提取票面信息,得到第二待归集发票的票面信息。
在其中一个实施例中,一种发票信息采集装置还包括绑定模块,用于接收第一邮箱的绑定请求,绑定请求用于请求将用户信息与第一邮箱进行绑定;根据绑定请求生成第一验证码,通过第二邮箱向第一邮箱发送第一验证码;接收绑定请求的申请页面发送的第二验证码,判断第二验证码是否与第一验证码相同;若是,将第一邮箱与用户信息进行绑定;通过第一邮箱的邮箱账号查询公共发票池,从公共发票池获取绑定之前的第一邮箱的发票,将获取到的发票与用户信息进行绑定。
在其中一个实施例中,采集模块30具体还用于当第二子类型接口接收到客户端发送的自来应用程序的第三待归集发票时,基于第二方式通过接收客户端发送的来自应用程序的第三待归集发票的票面信息的方式得到第三待归集发票的票面信息;其中,客户端获得来自应用程序的第三待归集发票的票面信息的方式,包括:客户端通过应用程序的公众平台提供的应用账号和应用密钥调用公众平台的接口,通过调用的接口获取公众平台的全局唯一接口调用凭据;客户端通过全局唯一接口调用凭据调用公众平台的发票列表接口,通过发票列表接口获取公众平台的发票列表;客户端确认选择发票列表中的第三待归集发票,接收公众平台返回的第三待归集发票的票面信息。
在其中一个实施例中,一种发票信息采集装置还包括报销模块,用于对多个发票接收接口接收到的电子发票和/或纸质发票的发票影像进行归集;将归集后的电子发票和/或纸质发票的发票影像发布到消息队列,以使得报销系统从消息队列中提取电子发票和/或纸质发票的发票影像进行自动化报销。
关于发票信息采集装置的具体限定可以参见上文中对于发票信息采集方法的限定,在此不再赘述。上述发票信息采集装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是信息采集系统运行的服务器,其内部结构图可以如图8所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端连接,以与终端进行外部信息数据的交互。该计算机程序被处理器执行时以实现一种发票信息采集方法。
本领域技术人员可以理解,图8中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现以下步骤:设置多个发票接收接口,各发票接收接口用于接收相同类型或者不同类型的待归集发票;根据各发票接收接口接收的待归集发票的类型设置各发票接收接口的发票信息解析方式;当任一发票接收接口接收到待归集发票时,根据该任一发票接收接口的发票信息解析方式对接收到的待归集发票进行信息采集,得到接收到的待归集发票的发票信息。
在其中一个实施例中,待归集发票的类型包括纸质发票的发票影像类型和电子发票类型,多个发票接收接口包括第一类型接口和第二类型接口,待归集发票的发票信息包括待归集发票的票面信息;处理器执行计算机程序实现上述的根据各发票接收接口接收的待归集发票的类型设置各发票接收接口的发票信息解析方式步骤时,具体实现以下步骤:当第一类型接口用于接收发票影像类型的待归集发票时,设置第一类型接口的发票信息解析方式为第一解析方式,第一解析方式用于指示通过影像识别技术对待归集发票进行信息采集;当第二类型接口用于接收电子发票类型的待归集发票时,设置第二类型接口的发票信息解析方式为第二解析方式,第二解析方式用于指示通过获取待归集发票的票面信息的方式对待归集发票进行信息采集。
在其中一个实施例中,处理器执行计算机程序实现上述的当任一发票接收接口接收到待归集发票时,根据该任一发票接收接口的发票信息解析方式对接收到的待归集发票进行信息采集,得到接收到的待归集发票的发票信息步骤时,具体实现以下步骤:当第一类型接口接收到第一待归集发票时,确定第一待归集发票的发票影像,基于第一解析方式调用光学字符识别服务对发票影像进行信息采集,得到第一待归集发票的票面信息。
在其中一个实施例中,第二类型接口包括第一子类型接口和第二子类型接口;处理器执行计算机程序实现上述的当第二类型接口用于接收电子发票类型的待归集发票时,设置第二类型接口的发票信息解析方式为第二解析方式步骤时,具体实现以下步骤:当第一子类型接口用于接收来自邮箱的电子发票类型的第二待归集发票时,设置第一子类型接口的发票信息解析方式为第二解析方式中的第一方式,第一方式用于指示从第二待归集发票中提取票面信息;当第二子类型接口用于接收来自应用程序的电子发票类型的第三待归集发票,设置第二子类型接口的发票信息解析方式为第二解析方式中的第二方式,第二方式用于指示接收来自应用程序的第三待归集发票的票面信息。
在其中一个实施例中,处理器执行计算机程序实现上述的当任一发票接收接口接收到待归集发票时,根据该任一发票接收接口的发票信息解析方式对接收到的待归集发票进行信息采集,得到接收到的待归集发票的发票信息步骤时,具体实现以下步骤:当第一子类型接口接收到来自第一邮箱的第二待归集发票时,判断第一邮箱是否已与用户信息进行绑定;若是,将第二待归集发票与用户信息进行绑定,并基于第一方式从第二待归集发票中提取票面信息,得到第二待归集发票的票面信息;若否,将第二待归集发票存储到公共发票池,并基于第一方式从第二待归集发票中提取票面信息,得到第二待归集发票的票面信息。
在其中一个实施例中,处理器执行计算机程序时实现以下步骤:接收第一邮箱的绑定请求,绑定请求用于请求将用户信息与第一邮箱进行绑定;根据绑定请求生成第一验证码,通过第二邮箱向第一邮箱发送第一验证码;接收绑定请求的申请页面发送的第二验证码,判断第二验证码是否与第一验证码相同;若是,将第一邮箱与用户信息进行绑定;通过第一邮箱的邮箱账号查询公共发票池,从公共发票池获取绑定之前的第一邮箱的发票,将获取到的发票与用户信息进行绑定。
在其中一个实施例中,处理器执行计算机程序实现上述的当任一发票接收接口接收到待归集发票时,根据该任一发票接收接口的发票信息解析方式对接收到的待归集发票进行信息采集,得到接收到的待归集发票的发票信息步骤时,具体实现以下步骤:当第二子类型接口接收到客户端发送的自来应用程序的第三待归集发票时,基于第二方式通过接收客户端发送的来自应用程序的第三待归集发票的票面信息的方式得到第三待归集发票的票面信息;其中,客户端获得来自应用程序的第三待归集发票的票面信息的方式,包括:客户端通过应用程序的公众平台提供的应用账号和应用密钥调用公众平台的接口,通过调用的接口获取公众平台的全局唯一接口调用凭据;客户端通过全局唯一接口调用凭据调用公众平台的发票列表接口,通过发票列表接口获取公众平台的发票列表;客户端确认选择发票列表中的第三待归集发票,接收公众平台返回的第三待归集发票的票面信息。
在其中一个实施例中,处理器执行计算机程序时实现以下步骤:对多个发票接收接口接收到的电子发票和/或纸质发票的发票影像进行归集;将归集后的电子发票和/或纸质发票的发票影像发布到消息队列,以使得报销系统从消息队列中提取电子发票和/或纸质发票的发票影像进行自动化报销。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:设置多个发票接收接口,各发票接收接口用于接收相同类型或者不同类型的待归集发票;根据各发票接收接口接收的待归集发票的类型设置各发票接收接口的发票信息解析方式;当任一发票接收接口接收到待归集发票时,根据该任一发票接收接口的发票信息解析方式对接收到的待归集发票进行信息采集,得到接收到的待归集发票的发票信息。
在其中一个实施例中,待归集发票的类型包括纸质发票的发票影像类型和电子发票类型,多个发票接收接口包括第一类型接口和第二类型接口,待归集发票的发票信息包括待归集发票的票面信息;计算机程序被处理器执行实现上述的根据各发票接收接口接收的待归集发票的类型设置各发票接收接口的发票信息解析方式步骤时,具体实现以下步骤:当第一类型接口用于接收发票影像类型的待归集发票时,设置第一类型接口的发票信息解析方式为第一解析方式,第一解析方式用于指示通过影像识别技术对待归集发票进行信息采集;当第二类型接口用于接收电子发票类型的待归集发票时,设置第二类型接口的发票信息解析方式为第二解析方式,第二解析方式用于指示通过获取待归集发票的票面信息的方式对待归集发票进行信息采集。
在其中一个实施例中,计算机程序被处理器执行实现上述的当任一发票接收接口接收到待归集发票时,根据该任一发票接收接口的发票信息解析方式对接收到的待归集发票进行信息采集,得到接收到的待归集发票的发票信息步骤时,具体实现以下步骤:当第一类型接口接收到第一待归集发票时,确定第一待归集发票的发票影像,基于第一解析方式调用光学字符识别服务对发票影像进行信息采集,得到第一待归集发票的票面信息。
在其中一个实施例中,第二类型接口包括第一子类型接口和第二子类型接口;计算机程序被处理器执行实现上述的当第二类型接口用于接收电子发票类型的待归集发票时,设置第二类型接口的发票信息解析方式为第二解析方式步骤时,具体实现以下步骤:当第一子类型接口用于接收来自邮箱的电子发票类型的第二待归集发票时,设置第一子类型接口的发票信息解析方式为第二解析方式中的第一方式,第一方式用于指示从第二待归集发票中提取票面信息;当第二子类型接口用于接收来自应用程序的电子发票类型的第三待归集发票,设置第二子类型接口的发票信息解析方式为第二解析方式中的第二方式,第二方式用于指示接收来自应用程序的第三待归集发票的票面信息。
在其中一个实施例中,计算机程序被处理器执行实现上述的当任一发票接收接口接收到待归集发票时,根据该任一发票接收接口的发票信息解析方式对接收到的待归集发票进行信息采集,得到接收到的待归集发票的发票信息步骤时,具体实现以下步骤:当第一子类型接口接收到来自第一邮箱的第二待归集发票时,判断第一邮箱是否已与用户信息进行绑定;若是,将第二待归集发票与用户信息进行绑定,并基于第一方式从第二待归集发票中提取票面信息,得到第二待归集发票的票面信息;若否,将第二待归集发票存储到公共发票池,并基于第一方式从第二待归集发票中提取票面信息,得到第二待归集发票的票面信息。
在其中一个实施例中,计算机程序被处理器执行时实现以下步骤:接收第一邮箱的绑定请求,绑定请求用于请求将用户信息与第一邮箱进行绑定;根据绑定请求生成第一验证码,通过第二邮箱向第一邮箱发送第一验证码;接收绑定请求的申请页面发送的第二验证码,判断第二验证码是否与第一验证码相同;若是,将第一邮箱与用户信息进行绑定;通过第一邮箱的邮箱账号查询公共发票池,从公共发票池获取绑定之前的第一邮箱的发票,将获取到的发票与用户信息进行绑定。
在其中一个实施例中,计算机程序被处理器执行实现上述的当任一发票接收接口接收到待归集发票时,根据该任一发票接收接口的发票信息解析方式对接收到的待归集发票进行信息采集,得到接收到的待归集发票的发票信息步骤时,具体实现以下步骤:当第二子类型接口接收到客户端发送的自来应用程序的第三待归集发票时,基于第二方式通过接收客户端发送的来自应用程序的第三待归集发票的票面信息的方式得到第三待归集发票的票面信息;其中,客户端获得来自应用程序的第三待归集发票的票面信息的方式,包括:客户端通过应用程序的公众平台提供的应用账号和应用密钥调用公众平台的接口,通过调用的接口获取公众平台的全局唯一接口调用凭据;客户端通过全局唯一接口调用凭据调用公众平台的发票列表接口,通过发票列表接口获取公众平台的发票列表;客户端确认选择发票列表中的第三待归集发票,接收公众平台返回的第三待归集发票的票面信息。
在其中一个实施例中,计算机程序被处理器执行时实现以下步骤:对多个发票接收接口接收到的电子发票和/或纸质发票的发票影像进行归集;将归集后的电子发票和/或纸质发票的发票影像发布到消息队列,以使得报销系统从消息队列中提取电子发票和/或纸质发票的发票影像进行自动化报销。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (10)
1.一种发票信息采集方法,所述方法包括:
设置多个发票接收接口,各所述发票接收接口用于接收相同类型或者不同类型的待归集发票;
根据各所述发票接收接口接收的所述待归集发票的类型设置各所述发票接收接口的发票信息解析方式;
当任一所述发票接收接口接收到所述待归集发票时,根据该任一所述发票接收接口的所述发票信息解析方式对接收到的所述待归集发票进行信息采集,得到接收到的所述待归集发票的发票信息。
2.根据权利要求1所述的方法,其特征在于,所述待归集发票的类型包括纸质发票的发票影像类型和电子发票类型,所述多个发票接收接口包括第一类型接口和第二类型接口,所述待归集发票的发票信息包括所述待归集发票的票面信息;
所述根据各所述发票接收接口接收的所述待归集发票的类型设置各所述发票接收接口的发票信息解析方式,包括:
当所述第一类型接口用于接收所述发票影像类型的待归集发票时,设置所述第一类型接口的发票信息解析方式为第一解析方式,所述第一解析方式用于指示通过影像识别技术对待归集发票进行信息采集;
当所述第二类型接口用于接收所述电子发票类型的待归集发票时,设置所述第二类型接口的发票信息解析方式为第二解析方式,所述第二解析方式用于指示通过获取待归集发票的票面信息的方式对待归集发票进行信息采集。
3.根据权利要求2所述的方法,其特征在于,所述当任一所述发票接收接口接收到所述待归集发票时,根据该任一所述发票接收接口的所述发票信息解析方式对接收到的所述待归集发票进行信息采集,得到接收到的所述待归集发票的发票信息,包括:
当所述第一类型接口接收到第一待归集发票时,确定所述第一待归集发票的发票影像,基于所述第一解析方式调用光学字符识别服务对所述发票影像进行信息采集,得到所述第一待归集发票的票面信息。
4.根据权利要求2所述的方法,其特征在于,所述第二类型接口包括第一子类型接口和第二子类型接口,所述当所述第二类型接口用于接收所述电子发票类型的待归集发票时,设置所述第二类型接口的发票信息解析方式为第二解析方式,包括:
当所述第一子类型接口用于接收来自邮箱的电子发票类型的第二待归集发票时,设置所述第一子类型接口的发票信息解析方式为所述第二解析方式中的第一方式,所述第一方式用于指示从所述第二待归集发票中提取票面信息;
当所述第二子类型接口用于接收来自应用程序的所述电子发票类型的第三待归集发票,设置所述第二子类型接口的发票信息解析方式为所述第二解析方式中的第二方式,所述第二方式用于指示接收来自所述应用程序的所述第三待归集发票的票面信息。
5.根据权利要求4所述的方法,其特征在于,所述当任一所述发票接收接口接收到所述待归集发票时,根据该任一所述发票接收接口的所述发票信息解析方式对接收到的所述待归集发票进行信息采集,得到接收到的所述待归集发票的发票信息,包括:
当所述第一子类型接口接收到来自第一邮箱的所述第二待归集发票时,判断所述第一邮箱是否已与用户信息进行绑定;
若是,将所述第二待归集发票与所述用户信息进行绑定,并基于所述第一方式从所述第二待归集发票中提取票面信息,得到所述第二待归集发票的票面信息;
若否,将所述第二待归集发票存储到公共发票池,并基于所述第一方式从所述第二待归集发票中提取票面信息,得到所述第二待归集发票的票面信息;
优选地,所述方法还包括:接收所述第一邮箱的绑定请求,所述绑定请求用于请求将所述用户信息与所述第一邮箱进行绑定;
根据所述绑定请求生成第一验证码,通过第二邮箱向所述第一邮箱发送所述第一验证码;
接收所述绑定请求的申请页面发送的第二验证码,判断所述第二验证码是否与所述第一验证码相同;
若是,将所述第一邮箱与所述用户信息进行绑定;
通过所述第一邮箱的邮箱账号查询公共发票池,从所述公共发票池获取绑定之前的所述第一邮箱的发票,将获取到的发票与所述用户信息进行绑定。
6.根据权利要求4所述的方法,其特征在于,所述当任一所述发票接收接口接收到所述待归集发票时,根据该任一所述发票接收接口的所述发票信息解析方式对接收到的所述待归集发票进行信息采集,得到接收到的所述待归集发票的发票信息,包括:
当所述第二子类型接口接收到客户端发送的自来所述应用程序的所述第三待归集发票时,基于所述第二方式通过接收客户端发送的来自所述应用程序的所述第三待归集发票的票面信息的方式得到所述第三待归集发票的票面信息;
其中,所述客户端获得所述来自所述应用程序的所述第三待归集发票的票面信息的方式,包括:
所述客户端通过所述应用程序的公众平台提供的应用账号和应用密钥调用所述公众平台的接口,通过调用的接口获取所述公众平台的全局唯一接口调用凭据;
所述客户端通过所述全局唯一接口调用凭据调用所述公众平台的发票列表接口,通过所述发票列表接口获取所述公众平台的发票列表;
所述客户端确认选择所述发票列表中的所述第三待归集发票,接收所述公众平台返回的所述第三待归集发票的票面信息。
7.根据权利要求1所述的方法,其特征在于,所述方法还包括:
对所述多个发票接收接口接收到的电子发票和/或纸质发票的发票影像进行归集;
将归集后的电子发票和/或纸质发票的发票影像发布到消息队列,以使得报销系统从所述消息队列中提取所述电子发票和/或纸质发票的发票影像进行自动化报销。
8.一种发票信息采集装置,其特征在于,所述装置包括:
第一设置模块,用于设置多个发票接收接口,各所述发票接收接口用于接收相同类型或者不同类型的待归集发票;
第二设置模块,用于根据各所述发票接收接口接收的所述待归集发票的类型设置各所述发票接收接口的发票信息解析方式;
采集模块,用于当任一所述发票接收接口接收到所述待归集发票时,根据该任一所述发票接收接口的所述发票信息解析方式对接收到的所述待归集发票进行信息采集,得到接收到的所述待归集发票的发票信息。
9.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010903178.2A CN112132671A (zh) | 2020-09-01 | 2020-09-01 | 发票信息采集方法、装置、计算机设备和存储介质 |
CA3129517A CA3129517A1 (en) | 2020-09-01 | 2021-08-31 | Invoice information acquisition method and device, computer equipment and storage medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010903178.2A CN112132671A (zh) | 2020-09-01 | 2020-09-01 | 发票信息采集方法、装置、计算机设备和存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112132671A true CN112132671A (zh) | 2020-12-25 |
Family
ID=73847718
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010903178.2A Pending CN112132671A (zh) | 2020-09-01 | 2020-09-01 | 发票信息采集方法、装置、计算机设备和存储介质 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN112132671A (zh) |
CA (1) | CA3129517A1 (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113435862A (zh) * | 2021-07-20 | 2021-09-24 | 支付宝(杭州)信息技术有限公司 | 基于邮箱的票据处理方法及装置 |
CN114418551A (zh) * | 2022-01-29 | 2022-04-29 | 北京字跳网络技术有限公司 | 一种票据处理方法、装置、电子设备和存储介质 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160098779A1 (en) * | 2014-10-02 | 2016-04-07 | Coupa Software Incorporated | Providing access to a networked application without authentication |
CN108280698A (zh) * | 2018-01-19 | 2018-07-13 | 大象慧云信息技术有限公司 | 一种发票自定义分类管理方法及系统 |
-
2020
- 2020-09-01 CN CN202010903178.2A patent/CN112132671A/zh active Pending
-
2021
- 2021-08-31 CA CA3129517A patent/CA3129517A1/en active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160098779A1 (en) * | 2014-10-02 | 2016-04-07 | Coupa Software Incorporated | Providing access to a networked application without authentication |
CN108280698A (zh) * | 2018-01-19 | 2018-07-13 | 大象慧云信息技术有限公司 | 一种发票自定义分类管理方法及系统 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113435862A (zh) * | 2021-07-20 | 2021-09-24 | 支付宝(杭州)信息技术有限公司 | 基于邮箱的票据处理方法及装置 |
WO2023000952A1 (zh) * | 2021-07-20 | 2023-01-26 | 支付宝(杭州)信息技术有限公司 | 基于邮箱的票据处理 |
CN114418551A (zh) * | 2022-01-29 | 2022-04-29 | 北京字跳网络技术有限公司 | 一种票据处理方法、装置、电子设备和存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CA3129517A1 (en) | 2022-03-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111866769B (zh) | 一种消息发送方法、装置、服务器及介质 | |
US10942974B2 (en) | System for synchronous document captures into an asynchronous archive and document-level archiving reconciliation | |
US20140244455A1 (en) | Presentation of image of source of tax data through tax preparation application | |
US20140244456A1 (en) | Tax document imaging and processing | |
US9721106B2 (en) | Method and system for scanning a computer system for sensitive content | |
CN107403385B (zh) | 投保信息审核方法和装置 | |
CN112132671A (zh) | 发票信息采集方法、装置、计算机设备和存储介质 | |
CN110503559B (zh) | 基于区块链的清算方法、装置、设备及计算机存储介质 | |
CN107871251A (zh) | 一种进项增值税发票管理系统及方法 | |
CN114331315A (zh) | 结合rpa和ai的社保业务处理方法及装置 | |
JP6307641B1 (ja) | 銀行システム、および銀行システムで実行される方法 | |
CN110928534B (zh) | 一种基于区块链的工作流节点认证方法及装置 | |
CN101931660B (zh) | 登记信息通知目的地的数据处理装置及其方法 | |
US11741181B2 (en) | Browser-based mobile image capture | |
KR102385819B1 (ko) | 업무 프로세스과정에서 생성되는 문서를 관리 및 공유하는 장치 및 방법 | |
JP2020161180A (ja) | スクレイピングを通じた資金振替・振込方法とそのシステム及びコンピュータプログラム | |
CN115510366A (zh) | 业务消息推送方法、装置、计算机设备和存储介质 | |
CN112565064B (zh) | 基于远程多媒体的业务处理方法、装置、设备和介质 | |
JP3643078B2 (ja) | 設備情報のシステム間照合装置及び方法 | |
CN113239297A (zh) | 消息推送方法、系统及存储介质 | |
CN111950284A (zh) | 录单自动识别寄件人实名信息方法、系统、设备和存储介质 | |
CN114371866A (zh) | 业务系统的版本重构测试方法、装置和设备 | |
KR102052454B1 (ko) | 거래 내역 db 기반의 영수증 처리 기능을 구비한 회계 관리 시스템 및 방법 | |
CN105450590A (zh) | 一种提供资源的方法和设备 | |
CN115733657B (zh) | 数据验证方法、装置、电子设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20230106 Address after: Room 302, Floor 3, Building B, Software Building, No. 9, Xinghuo Road, Jiangbei New District, Nanjing, Jiangsu, 210000 Applicant after: Nanjing Suning Yuncai Information Technology Co.,Ltd. Address before: No.1-1 Suning Avenue, Xuzhuang Software Park, Xuanwu District, Nanjing, Jiangsu Province, 210000 Applicant before: Suning Cloud Computing Co.,Ltd. |
|
TA01 | Transfer of patent application right | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20201225 |
|
RJ01 | Rejection of invention patent application after publication |