CN114049192A - 基于智能算法的发票数据处理方法及装置 - Google Patents
基于智能算法的发票数据处理方法及装置 Download PDFInfo
- Publication number
- CN114049192A CN114049192A CN202210032265.4A CN202210032265A CN114049192A CN 114049192 A CN114049192 A CN 114049192A CN 202210032265 A CN202210032265 A CN 202210032265A CN 114049192 A CN114049192 A CN 114049192A
- Authority
- CN
- China
- Prior art keywords
- transaction
- invoice
- reimbursement
- information
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/12—Accounting
- G06Q40/125—Finance or payroll
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/10—Office automation; Time management
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- Strategic Management (AREA)
- Computing Systems (AREA)
- Computational Linguistics (AREA)
- Entrepreneurship & Innovation (AREA)
- General Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Software Systems (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Economics (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Tourism & Hospitality (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Development Economics (AREA)
- Technology Law (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Abstract
本发明公开了一种基于智能算法的发票数据处理方法及装置,其中该方法包括:获取目标用户的交易数据;根据所述交易数据,以及预设的发票生成神经网络模型,确定发票凭证数据;获取所述目标用户的报销请求和工作记录信息,根据所述交易数据、所述报销请求和所述工作记录信息,确定所述目标用户的报销指令,并将所述报销指令发送至报销服务器以使得所述报销服务器将所述交易数据对应的交易金额报销至所述目标用户的金融账户;将所述交易数据、所述报销指令和所述发票凭证数据关联至所述目标用户对应的经营主体,并储存到数据库中。可见,本发明能够通过精确先进的数据分析算法,实现更加精确更加合理的发票数据处理。
Description
技术领域
本发明涉及财务数据算法技术领域,尤其涉及一种基于智能算法的发票数据处理方法及装置。
背景技术
随着企业无纸化办公政策的推行,以及算法技术的演进,越来越多的财务数据和交易数据都采用电子数据的形式进行处理,以提高办公效率。但现有的发票数据处理技术,仍然停留在人工处理或简单的数据运算规则如EXCEL表内的公式,但这样的做法只能实现简单的数据处理,无法针对用户的请求实现智能化的处理,可见现有技术存在缺陷,亟待解决。
发明内容
本发明所要解决的技术问题在于,提供一种基于智能算法的发票数据处理方法及装置,能够通过精确先进的数据分析算法,实现更加精确更加合理的发票数据处理。
为了解决上述技术问题,本发明第一方面公开了一种基于智能算法的发票数据处理方法,所述方法包括:
获取目标用户的交易数据;
根据所述交易数据,以及预设的发票生成神经网络模型,确定发票凭证数据;
获取所述目标用户的报销请求和工作记录信息,根据所述交易数据、所述报销请求和所述工作记录信息,确定所述目标用户的报销指令,并将所述报销指令发送至报销服务器以使得所述报销服务器将所述交易数据对应的交易金额报销至所述目标用户的金融账户;
将所述交易数据、所述报销指令和所述发票凭证数据关联至所述目标用户对应的经营主体,并储存到数据库中。
作为一种可选的实施方式,在本发明第一方面中,所述交易数据包括交易信息和交易标识;所述交易信息包括当次交易的交易对象信息、交易内容信息、交易金额信息、交易时间信息和交易方式信息;所述交易标识用于指示所述交易数据的交易类型。
作为一种可选的实施方式,在本发明第一方面中,所述根据所述交易数据,以及预设的发票生成神经网络模型,确定发票凭证数据,包括:
基于预设的向量转化算法,将所述交易信息中的多种信息转化为多个交易向量;
确定每一所述交易向量对应的权重,计算所述多个交易向量的加权求和结果,以得到交易特征数据;所述权重与所述交易向量对应的交易信息的信息长度成正比;
将所述交易特征数据输入至所述交易类型对应的发票生成神经网络模型,以得到所述发票生成神经网络模型输出的发票信息;所述发票生成神经网络模型通过包括有对应于任一所述交易类型的多个历史交易特征数据和对应的历史发票信息的训练数据集训练得到;所述发票生成神经网络模型包括特征提取网络和特征重构网络和分类网络;
将所述发票信息发送至开票服务器以获取所述开票服务器根据所述发票信息生成的发票凭证数据。
作为一种可选的实施方式,在本发明第一方面中,所述获取所述目标用户的报销请求和工作记录信息,根据所述交易数据、所述报销请求和所述工作记录信息,确定所述目标用户的报销指令,并将所述报销指令发送至报销服务器以使得所述报销服务器将所述交易数据对应的交易金额报销至所述目标用户的金融账户,包括:
获取所述目标用户的工作记录信息;
将所述交易信息与所述工作记录信息进行匹配,以判断所述交易数据是否为工作相关交易数据;
若判断结果为是,生成所述交易数据对应的报销记录;
获取所述目标用户发送的报销请求,根据所述报销请求和所述报销记录,确定所述目标用户的报销指令,并将所述报销指令发送至报销服务器以使得所述报销服务器将所述交易数据对应的交易金额报销至所述目标用户的金融账户。
作为一种可选的实施方式,在本发明第一方面中,所述工作记录信息中包括所述目标用户在多个工作时间段中的多个工作任务信息,以及,所述将所述交易信息与所述工作记录信息进行匹配,以判断所述交易数据是否为工作相关交易数据,包括:
根据所述交易信息中的交易时间信息,确定在所述交易时间信息的预设的时间误差范围内的所述工作时间段作为目标工作时间段;
将所述交易信息中除所述交易时间信息外的其他信息作为第一字符集合,将所有所述目标工作时间段中的所述工作任务信息作为第二字符集合,计算所述第一字符集合和所述第二字符集合的余弦相似度;
判断所述余弦相似度是否大于预设的相似度阈值,若是,则判断所述交易数据为工作相关交易数据。
作为一种可选的实施方式,在本发明第一方面中,所述方法还包括:
对于目标经营主体,从所述数据库中确定所述目标经营主体在历史时间段的所述交易数据、所述报销指令和所述发票凭证数据;
根据所述目标经营主体在历史时间段的所述交易数据、所述报销指令和所述发票凭证数据,确定所述目标经营主体对应的交易相关的算法稳定情况;所述算法稳定情况用于指示所述目标经营主体的服务器中用于交易运算的算法的有效性。
作为一种可选的实施方式,在本发明第一方面中,所述根据所述目标经营主体在历史时间段的所述交易数据、所述报销指令和所述发票凭证数据,确定所述目标经营主体对应的交易相关的算法稳定情况,包括:
对于任一所述报销指令,计算所述报销指令的生成时间和报销完成时间之间的时间差以得到报销用时;所述报销完成时间通过与所述报销服务器通信以进行获取;
对于任一所述发票凭证数据,确定所述发票凭证数据对应的报税与否信息;
对于任一所述交易数据,基于更优发票生成模型,确定所述交易数据对应的更优发票信息,并计算所述更优发票信息和所述交易数据对应的所述发票信息之间的发票相似度;所述更优发票生成模型和所述发票生成神经网络模型的结构一致;所述更优发票生成模型根据对应于所述目标经营主体的训练数据集训练得到;
根据所述目标经营主体在历史时间段的所有所述交易数据的所述发票相似度、所有所述报销指令的所述报销用时和所有所述发票凭证数据的所述报税与否信息,计算所述目标经营主体对应的算法稳定系数;
判断所述算法稳定系数是否高于预设的系数阈值,若是,则判断所述目标经营主体对应的交易相关的算法稳定情况为稳定情况,否则判断为不稳定情况。
作为一种可选的实施方式,在本发明第一方面中,所述报税与否信息在已报税时为预设非零值,在未报税时为零;所述根据所述目标经营主体在历史时间段的所有所述交易数据的所述发票相似度、所有所述报销指令的所述报销用时和所有所述发票凭证数据的所述报税与否信息,计算所述目标经营主体对应的算法稳定系数,包括:
计算所述目标经营主体对应的所有所述报销指令的所述报销用时的时间平均值;
计算所述目标经营主体在历史时间段的所有所述报销指令的所述报销用时与所述时间平均值之间的时间差的总和,得到报销时间系数;
计算所述目标经营主体在历史时间段的所有所述交易数据的所述发票相似度之和,得到发票正误系数;
计算所述目标经营主体在历史时间段的所有所述发票凭证数据的所述报税与否信息之和,得到发票有效系数;
对所述报销时间系数、所述发票正误系数和所述发票有效系数进行归一化处理后进行加权求和,以得到所述目标经营主体对应的算法稳定系数;其中所述报销时间系数、所述发票正误系数和所述发票有效系数对应的权重之和为1;所述报销时间系数或所述发票正误系数对应的权重大于所述发票有效系数对应的权重。
本发明第二方面公开了一种基于智能算法的发票数据处理装置,其包括:
获取模块,用于获取目标用户的交易数据;
第一确定模块,用于根据所述交易数据,以及预设的发票生成神经网络模型,确定发票凭证数据;
第二确定模块,用于获取所述目标用户的报销请求和工作记录信息,根据所述交易数据、所述报销请求和所述工作记录信息,确定所述目标用户的报销指令,并将所述报销指令发送至报销服务器以使得所述报销服务器将所述交易数据对应的交易金额报销至所述目标用户的金融账户;
储存模块,用于将所述交易数据、所述报销指令和所述发票凭证数据关联至所述目标用户对应的经营主体,并储存到数据库中。
作为一种可选的实施方式,在本发明第二方面中,所述交易数据包括交易信息和交易标识;所述交易信息包括当次交易的交易对象信息、交易内容信息、交易金额信息、交易时间信息和交易方式信息;所述交易标识用于指示所述交易数据的交易类型。
作为一种可选的实施方式,在本发明第二方面中,所述第一确定模块根据所述交易数据,以及预设的发票生成神经网络模型,确定发票凭证数据的具体方式,包括:
基于预设的向量转化算法,将所述交易信息中的多种信息转化为多个交易向量;
确定每一所述交易向量对应的权重,计算所述多个交易向量的加权求和结果,以得到交易特征数据;所述权重与所述交易向量对应的交易信息的信息长度成正比;
将所述交易特征数据输入至所述交易类型对应的发票生成神经网络模型,以得到所述发票生成神经网络模型输出的发票信息;所述发票生成神经网络模型通过包括有对应于任一所述交易类型的多个历史交易特征数据和对应的历史发票信息的训练数据集训练得到;所述发票生成神经网络模型包括特征提取网络和特征重构网络和分类网络;
将所述发票信息发送至开票服务器以获取所述开票服务器根据所述发票信息生成的发票凭证数据。
作为一种可选的实施方式,在本发明第二方面中,所述第二确定模块获取所述目标用户的报销请求和工作记录信息,根据所述交易数据、所述报销请求和所述工作记录信息,确定所述目标用户的报销指令,并将所述报销指令发送至报销服务器以使得所述报销服务器将所述交易数据对应的交易金额报销至所述目标用户的金融账户的具体方式,包括:
获取所述目标用户的工作记录信息;
将所述交易信息与所述工作记录信息进行匹配,以判断所述交易数据是否为工作相关交易数据;
若判断结果为是,生成所述交易数据对应的报销记录;
获取所述目标用户发送的报销请求,根据所述报销请求和所述报销记录,确定所述目标用户的报销指令,并将所述报销指令发送至报销服务器以使得所述报销服务器将所述交易数据对应的交易金额报销至所述目标用户的金融账户。
作为一种可选的实施方式,在本发明第二方面中,所述工作记录信息中包括所述目标用户在多个工作时间段中的多个工作任务信息,以及,所述第二确定模块将所述交易信息与所述工作记录信息进行匹配,以判断所述交易数据是否为工作相关交易数据的具体方式,包括:
根据所述交易信息中的交易时间信息,确定在所述交易时间信息的预设的时间误差范围内的所述工作时间段作为目标工作时间段;
将所述交易信息中除所述交易时间信息外的其他信息作为第一字符集合,将所有所述目标工作时间段中的所述工作任务信息作为第二字符集合,计算所述第一字符集合和所述第二字符集合的余弦相似度;
判断所述余弦相似度是否大于预设的相似度阈值,若是,则判断所述交易数据为工作相关交易数据。
作为一种可选的实施方式,在本发明第二方面中,所述装置还包括第三确定模块,用于执行以下步骤:
对于目标经营主体,从所述数据库中确定所述目标经营主体在历史时间段的所述交易数据、所述报销指令和所述发票凭证数据;
根据所述目标经营主体在历史时间段的所述交易数据、所述报销指令和所述发票凭证数据,确定所述目标经营主体对应的交易相关的算法稳定情况;所述算法稳定情况用于指示所述目标经营主体的服务器中用于交易运算的算法的有效性。
作为一种可选的实施方式,在本发明第二方面中,所述第三确定模块根据所述目标经营主体在历史时间段的所述交易数据、所述报销指令和所述发票凭证数据,确定所述目标经营主体对应的交易相关的算法稳定情况的具体方式,包括:
对于任一所述报销指令,计算所述报销指令的生成时间和报销完成时间之间的时间差以得到报销用时;所述报销完成时间通过与所述报销服务器通信以进行获取;
对于任一所述发票凭证数据,确定所述发票凭证数据对应的报税与否信息;
对于任一所述交易数据,基于更优发票生成模型,确定所述交易数据对应的更优发票信息,并计算所述更优发票信息和所述交易数据对应的所述发票信息之间的发票相似度;所述更优发票生成模型和所述发票生成神经网络模型的结构一致;所述更优发票生成模型根据对应于所述目标经营主体的训练数据集训练得到;
根据所述目标经营主体在历史时间段的所有所述交易数据的所述发票相似度、所有所述报销指令的所述报销用时和所有所述发票凭证数据的所述报税与否信息,计算所述目标经营主体对应的算法稳定系数;
判断所述算法稳定系数是否高于预设的系数阈值,若是,则判断所述目标经营主体对应的交易相关的算法稳定情况为稳定情况,否则判断为不稳定情况。
作为一种可选的实施方式,在本发明第二方面中,所述报税与否信息在已报税时为预设非零值,在未报税时为零;所述第三确定模块根据所述目标经营主体在历史时间段的所有所述交易数据的所述发票相似度、所有所述报销指令的所述报销用时和所有所述发票凭证数据的所述报税与否信息,计算所述目标经营主体对应的算法稳定系数的具体方式,包括:
计算所述目标经营主体对应的所有所述报销指令的所述报销用时的时间平均值;
计算所述目标经营主体在历史时间段的所有所述报销指令的所述报销用时与所述时间平均值之间的时间差的总和,得到报销时间系数;
计算所述目标经营主体在历史时间段的所有所述交易数据的所述发票相似度之和,得到发票正误系数;
计算所述目标经营主体在历史时间段的所有所述发票凭证数据的所述报税与否信息之和,得到发票有效系数;
对所述报销时间系数、所述发票正误系数和所述发票有效系数进行归一化处理后进行加权求和,以得到所述目标经营主体对应的算法稳定系数;其中所述报销时间系数、所述发票正误系数和所述发票有效系数对应的权重之和为1;所述报销时间系数或所述发票正误系数对应的权重大于所述发票有效系数对应的权重。
本发明第三方面公开了另一种基于智能算法的发票数据处理装置,所述装置包括:
存储有可执行程序代码的存储器;
与所述存储器耦合的处理器;
所述处理器调用所述存储器中存储的所述可执行程序代码,执行本发明实施例第一方面公开的基于智能算法的发票数据处理方法中的部分或全部步骤。
与现有技术相比,本发明实施例具有以下有益效果:
本发明实施例中,获取目标用户的交易数据;根据所述交易数据,以及预设的发票生成神经网络模型,确定发票凭证数据;获取所述目标用户的报销请求和工作记录信息,根据所述交易数据、所述报销请求和所述工作记录信息,确定所述目标用户的报销指令,并将所述报销指令发送至报销服务器以使得所述报销服务器将所述交易数据对应的交易金额报销至所述目标用户的金融账户;将所述交易数据、所述报销指令和所述发票凭证数据关联至所述目标用户对应的经营主体,并储存到数据库中。可见,本发明能够通过精确先进的数据分析算法,实现更加精确更加合理的发票数据处理。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例公开的一种基于智能算法的发票数据处理方法的流程示意图;
图2是本发明实施例公开的一种基于智能算法的发票数据处理装置的结构示意图;
图3是本发明实施例公开的另一种基于智能算法的发票数据处理装置的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、装置、产品或端没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或端固有的其他步骤或单元。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本发明的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
本发明公开了一种基于智能算法的发票数据处理方法及装置,能够通过精确先进的数据分析算法,实现更加精确更加合理的发票数据处理。以下分别进行详细说明。
实施例一
请参阅图1,图1是本发明实施例公开的一种基于智能算法的发票数据处理方法的流程示意图。其中,图1所描述的方法可以应用于相应的财务数据核算终端、财务数据核算设备或财务数据核算服务器中,且该服务器可以是本地服务器,也可以是云服务器。具体地,如图1所示,该基于智能算法的发票数据处理方法可以包括以下操作:
101、获取目标用户的交易数据。
可选的,交易数据可以包括交易信息和交易标识,其中,交易信息包括当次交易的交易对象信息、交易内容信息、交易金额信息、交易时间信息和交易方式信息,而交易标识用于指示交易数据的交易类型。可选的,交易对象信息可以为特定商家或经营主体或是政府机构,交易内容信息用于指示本次交易的交易商品或交易服务的内容,交易方式信息可以为线上交易、线下交易、银行卡支付、支付宝或微信等软件支付等方式,本发明不做限定。一般而言,本发明所针对的目标用户为企业的员工,该交易数据为该员工为企业工作进行消费垫款的交易。可选的,交易类型可以为预设的几种分类,例如是基于工作性质的几种分类,包括差旅、会客宴饮、办公用品选购或原材料采购等类型,或是基于交易内容性质的几种分类,例如餐饮、加油、网约车或电子仪器采购等类型。
102、根据交易数据,以及预设的发票生成神经网络模型,确定发票凭证数据。
103、获取目标用户的报销请求和工作记录信息,根据交易信息、报销请求和工作记录信息,确定目标用户的报销指令,并将报销指令发送至报销服务器以使得报销服务器将交易数据对应的交易金额报销至目标用户的金融账户。
可选的,报销服务器中可以内置有自动化程序,其可以根据报销指令确定出目标用户的金融账户地址,并执行汇款操作将交易金额对应的款项汇至该金融账户地址。其中,金融账户可以为借记卡账户、信用卡账户或支付软件账户。
104、将交易数据、报销指令和发票凭证数据关联至目标用户对应的经营主体,并储存到数据库中。
通过这一步,可以将经营主体对应的相关财务数据信息进行关联并储存,以便于后续的进一步的数据分析。
作为一种可选的实施方式,上述步骤102中的,根据交易数据,以及预设的发票生成神经网络模型,确定发票凭证数据,包括:
基于预设的向量转化算法,将交易信息中的多种信息转化为多个交易向量;
确定每一交易向量对应的权重,计算多个交易向量的加权求和结果,以得到交易特征数据;
将交易特征数据输入至交易类型对应的发票生成神经网络模型,以得到发票生成神经网络模型输出的发票信息;
将发票信息发送至开票服务器以获取开票服务器根据发票信息生成的发票凭证数据。
可选的,向量转化算法可以根据交易信息中的信息的类型来确定相应的算法,如交易信息中的交易对象信息、交易内容信息和交易方式信息一般为文本信息,则需要采用文本向量转化算法,如腾讯词向量算法,来执行向量转化。而交易信息中的交易金额信息、交易时间信息一般为数字信息,可以直接用字符向量转化模型或映射关系进行转化。
可选的,其中,每一交易向量对应的权重与交易向量对应的交易信息的信息长度成正比,其中,如上所述,交易信息可以为交易对象信息、交易内容信息、交易金额信息、交易时间信息或交易方式信息,而此处的信息长度指的是该交易信息的字符长度,其字符长度度量单位可以根据实际情况制定,但其应当采用统一的度量单位,如字节。
可选的,发票生成神经网络模型通过包括有对应于任一交易类型的多个历史交易特征数据和对应的历史发票信息的训练数据集训练得到,其中,历史交易特征数据也是根据对应的历史发票信息对应的历史交易信息通过上述向量转化算法和加权求和计算得到的,在此不作赘述。可选的,发票生成神经网络模型包括特征提取网络和特征重构网络和分类网络,可选的,特征提取网络可以为卷积网络或上下文特征提取网络如BERT网络编码器,而特征重构网络可以为BERT网络的解码器,而分类网络可以为采用softmax函数的全连接层。可选的,确定出一个包括发票生成神经网络模型、损失函数计算模块和参数优化模块的训练模型,将训练数据集的训练数据连续输入至训练模型,通过该损失函数计算模块计算该发票生成神经网络模型输出的预测结果和训练数据之间的交叉熵损失函数值,并通过参数优化模块基于梯度下降法不断优化训练模型的模型参数,以使得该交叉熵损失函数值收敛,直至训练完成,如此即可以得到训练好的发票生成神经网络模型。
作为一种可选的实施方式,上述步骤103中的,获取目标用户的报销请求和工作记录信息,根据交易信息、报销请求和工作记录信息,确定目标用户的报销指令,并将报销指令发送至报销服务器以使得报销服务器将交易数据对应的交易金额报销至目标用户的金融账户,包括:
获取目标用户的工作记录信息;
将交易信息与工作记录信息进行匹配,以判断交易数据是否为工作相关交易数据;
若判断结果为是,生成交易数据对应的报销记录;
获取目标用户发送的报销请求,根据报销请求和报销记录,确定目标用户的报销指令,并将报销指令发送至报销服务器以使得报销服务器将交易数据对应的交易金额报销至目标用户的金融账户。
作为一种可选的实施方式,工作记录信息中包括目标用户在多个工作时间段中的多个工作任务信息,可选的,工作任务信息中可以包括目标用户在任一工作时间段执行的工作任务的任务描述信息,该任务描述信息可以包括该工作任务的任务内容、任务对象、任务预期花费和任务执行时间等信息。
可选的,上述步骤中的,将交易信息与工作记录信息进行匹配,以判断交易数据是否为工作相关交易数据,包括:
根据交易信息中的交易时间信息,确定在交易时间信息的预设的时间误差范围内的工作时间段作为目标工作时间段;
将交易信息中除交易时间信息外的其他信息作为第一字符集合,将所有目标工作时间段中的工作任务信息作为第二字符集合,计算第一字符集合和第二字符集合的余弦相似度;
判断余弦相似度是否大于预设的相似度阈值,若是,则判断交易数据为工作相关交易数据。
可选的,预设的时间误差范围可以为交易时间信息加上前后各一个预设时间段组成的时间区间,其中预设时间段的大小可以由操作人员根据经验值或实验值进行制定,其也以与该目标用户的历史工作准时度,也即该目标用户在任意历史时间段内的完成工作节点的时间与预期完成时间的差距,成反比,即,该目标用户的历史工作准时度越高,也即该目标用户在任意历史时间段内的完成工作节点的时间与预期完成时间的差距越小,则该预设时间段越小,反之亦然。该用户的历史工作准时度可以根据该目标用户的历史工作记录确定。
作为一种可选的实施方式,该方法还包括:
对于目标经营主体,从数据库中确定目标经营主体在历史时间段的交易数据、报销指令和发票凭证数据;
根据目标经营主体在历史时间段的交易数据、报销指令和发票凭证数据,确定目标经营主体对应的交易相关的算法稳定情况。
其中,算法稳定情况用于指示目标经营主体的服务器中用于交易运算的算法的有效性,这一算法稳定情况可以在后续用于评估多个指标,例如目标经营主体的服务器的稳定指标,目标经营主体的算法结构的中的部分或全部模块的稳定指标,其可以在宏观层面体现目标经营主体的算法的稳定性。
可选的,根据先前的实施方式或实施例,数据库中储存有多个经营主体关联的跟特定用户有关的交易数据、报销指令和发票凭证数据,这只需要对多个用户执行上述方法即可实现。可选的,数据库可以采用现有的数据库架构和数据储存架构对上述数据进行储存,如可以利用键-值结构(key-value)进行保存,将键的值保存为经营主体的标识,而值的值保存为对应的交易数据、报销指令和发票凭证数据,可选的还可以添加其他的标识符用于标识时间段、用户等信息。
作为一种可选的实施方式,上述步骤中的,根据目标经营主体在历史时间段的交易数据、报销指令和发票凭证数据,确定目标经营主体对应的交易相关的算法稳定情况,包括:
对于任一报销指令,计算报销指令的生成时间和报销完成时间之间的时间差以得到报销用时;
对于任一发票凭证数据,确定发票凭证数据对应的报税与否信息;
对于任一交易数据,基于更优发票生成模型,确定交易数据对应的更优发票信息,并计算更优发票信息和交易数据对应的发票信息之间的发票相似度;
根据目标经营主体在历史时间段的所有交易数据的发票相似度、所有报销指令的报销用时和所有发票凭证数据的报税与否信息,计算目标经营主体对应的算法稳定系数;
判断算法稳定系数是否高于预设的系数阈值,若是,则判断目标经营主体对应的交易相关的算法稳定情况为稳定情况,否则判断为不稳定情况。
可选的,报销完成时间可以通过与报销服务器通信以进行获取,具体的,其可以用于指代报销服务器发起汇款操作的时间或汇款完成的时间。
可选的,更优发票生成模型和发票生成神经网络模型的结构一致,可以参照上述对于发票生成神经网络模型的结构的表述,但区别在于,更优发票生成模型根据对应于目标经营主体的训练数据集训练得到,因此其更具有针对性,因此其预测效果更优,可以用于根据其预测结果(也即更优发票信息)与发票信息的对比(也即发票相似度),来后续判断目标经营主体对应的发票生成神经网络模型的算法稳定性和效果。
作为一种可选的实施方式,报税与否信息在已报税时为预设非零值,在未报税时为零,例如可以在确认报税已否信息为已报税信息时,将其值置为1,或在相反的情况下置为0,以便后续的系数运算。
可选的,上述步骤中的,根据目标经营主体在历史时间段的所有交易数据的发票相似度、所有报销指令的报销用时和所有发票凭证数据的报税与否信息,计算目标经营主体对应的算法稳定系数,包括:
计算目标经营主体对应的所有报销指令的报销用时的时间平均值;
计算目标经营主体在历史时间段的所有报销指令的报销用时与时间平均值之间的时间差的总和,得到报销时间系数;
计算目标经营主体在历史时间段的所有交易数据的发票相似度之和,得到发票正误系数;
计算目标经营主体在历史时间段的所有发票凭证数据的报税与否信息之和,得到发票有效系数;
对报销时间系数、发票正误系数和发票有效系数进行归一化处理后进行加权求和,以得到目标经营主体对应的算法稳定系数。
可选的,其中报销时间系数、发票正误系数和发票有效系数对应的权重之和为1,且报销时间系数或发票正误系数对应的权重大于发票有效系数对应的权重,这一设置的目的在于报销时间系数或发票正误系数更能体现系统上算法稳定,因此其重要性更高,权重也应更大。
实施例二
请参阅图2,图2是本发明实施例公开的一种基于智能算法的发票数据处理装置的结构示意图。其中,图2所描述的装置可以应用于相应的财务数据核算终端、财务数据核算设备或财务数据核算服务器中,且该服务器可以是本地服务器,也可以是云服务器,本发明实施例不做限定。具体地,如图2所示,该装置可以包括:
获取模块201,用于获取目标用户的交易数据。
可选的,交易数据可以包括交易信息和交易标识,其中,交易信息包括当次交易的交易对象信息、交易内容信息、交易金额信息、交易时间信息和交易方式信息,而交易标识用于指示交易数据的交易类型。可选的,交易对象信息可以为特定商家或经营主体或是政府机构,交易内容信息用于指示本次交易的交易商品或交易服务的内容,交易方式信息可以为线上交易、线下交易、银行卡支付、支付宝或微信等软件支付等方式,本发明不做限定。一般而言,本发明所针对的目标用户为企业的员工,该交易数据为该员工为企业工作进行消费垫款的交易。可选的,交易类型可以为预设的几种分类,例如是基于工作性质的几种分类,包括差旅、会客宴饮、办公用品选购或原材料采购等类型,或是基于交易内容性质的几种分类,例如餐饮、加油、网约车或电子仪器采购等类型。
第一确定模块202,用于根据交易数据,以及预设的发票生成神经网络模型,确定发票凭证数据。
第二确定模块203,用于获取目标用户的报销请求和工作记录信息,根据交易信息、报销请求和工作记录信息,确定目标用户的报销指令,并将报销指令发送至报销服务器以使得报销服务器将交易数据对应的交易金额报销至目标用户的金融账户。
可选的,报销服务器中可以内置有自动化程序,其可以根据报销指令确定出目标用户的金融账户地址,并执行汇款操作将交易金额对应的款项汇至该金融账户地址。其中,金融账户可以为借记卡账户、信用卡账户或支付软件账户。
储存模块204,用于将交易数据、报销指令和发票凭证数据关联至目标用户对应的经营主体,并储存到数据库中。
作为一种可选的实施方式,第一确定模块202根据交易数据,以及预设的发票生成神经网络模型,确定发票凭证数据的具体方式,包括:
基于预设的向量转化算法,将交易信息中的多种信息转化为多个交易向量;
确定每一交易向量对应的权重,计算多个交易向量的加权求和结果,以得到交易特征数据;
将交易特征数据输入至交易类型对应的发票生成神经网络模型,以得到发票生成神经网络模型输出的发票信息;
将发票信息发送至开票服务器以获取开票服务器根据发票信息生成的发票凭证数据。
可选的,向量转化算法可以根据交易信息中的信息的类型来确定相应的算法,如交易信息中的交易对象信息、交易内容信息和交易方式信息一般为文本信息,则需要采用文本向量转化算法,如腾讯词向量算法,来执行向量转化。而交易信息中的交易金额信息、交易时间信息一般为数字信息,可以直接用字符向量转化模型或映射关系进行转化。
可选的,其中,每一交易向量对应的权重与交易向量对应的交易信息的信息长度成正比,其中,如上所述,交易信息可以为交易对象信息、交易内容信息、交易金额信息、交易时间信息或交易方式信息,而此处的信息长度指的是该交易信息的字符长度,其字符长度度量单位可以根据实际情况制定,但其应当采用统一的度量单位,如字节。
可选的,发票生成神经网络模型通过包括有对应于任一交易类型的多个历史交易特征数据和对应的历史发票信息的训练数据集训练得到,其中,历史交易特征数据也是根据对应的历史发票信息对应的历史交易信息通过上述向量转化算法和加权求和计算得到的,在此不作赘述。可选的,发票生成神经网络模型包括特征提取网络和特征重构网络和分类网络,可选的,特征提取网络可以为卷积网络或上下文特征提取网络如BERT网络编码器,而特征重构网络可以为BERT网络的解码器,而分类网络可以为采用softmax函数的全连接层。可选的,确定出一个包括发票生成神经网络模型、损失函数计算模块和参数优化模块的训练模型,将训练数据集的训练数据连续输入至训练模型,通过该损失函数计算模块计算该发票生成神经网络模型输出的预测结果和训练数据之间的交叉熵损失函数值,并通过参数优化模块基于梯度下降法不断优化训练模型的模型参数,以使得该交叉熵损失函数值收敛,直至训练完成,如此即可以得到训练好的发票生成神经网络模型。
作为一种可选的实施方式,第二确定模块203获取目标用户的报销请求和工作记录信息,根据交易信息、报销请求和工作记录信息,确定目标用户的报销指令,并将报销指令发送至报销服务器以使得报销服务器将交易数据对应的交易金额报销至目标用户的金融账户的具体方式,包括:
获取目标用户的工作记录信息;
将交易信息与工作记录信息进行匹配,以判断交易数据是否为工作相关交易数据;
若判断结果为是,生成交易数据对应的报销记录;
获取目标用户发送的报销请求,根据报销请求和报销记录,确定目标用户的报销指令,并将报销指令发送至报销服务器以使得报销服务器将交易数据对应的交易金额报销至目标用户的金融账户。
作为一种可选的实施方式,工作记录信息中包括目标用户在多个工作时间段中的多个工作任务信息,可选的,工作任务信息中可以包括目标用户在任一工作时间段执行的工作任务的任务描述信息,该任务描述信息可以包括该工作任务的任务内容、任务对象、任务预期花费和任务执行时间等信息。
可选的,第二确定模块203将交易信息与工作记录信息进行匹配,以判断交易数据是否为工作相关交易数据的具体方式,包括:
根据交易信息中的交易时间信息,确定在交易时间信息的预设的时间误差范围内的工作时间段作为目标工作时间段;
将交易信息中除交易时间信息外的其他信息作为第一字符集合,将所有目标工作时间段中的工作任务信息作为第二字符集合,计算第一字符集合和第二字符集合的余弦相似度;
判断余弦相似度是否大于预设的相似度阈值,若是,则判断交易数据为工作相关交易数据。
可选的,预设的时间误差范围可以为交易时间信息加上前后各一个预设时间段组成的时间区间,其中预设时间段的大小可以由操作人员根据经验值或实验值进行制定,其也以与该目标用户的历史工作准时度,也即该目标用户在任意历史时间段内的完成工作节点的时间与预期完成时间的差距,成反比,即,该目标用户的历史工作准时度越高,也即该目标用户在任意历史时间段内的完成工作节点的时间与预期完成时间的差距越小,则该预设时间段越小,反之亦然。该用户的历史工作准时度可以根据该目标用户的历史工作记录确定。
作为一种可选的实施方式,该装置还包括第三确定模块,用于执行以下步骤:
对于目标经营主体,从数据库中确定目标经营主体在历史时间段的交易数据、报销指令和发票凭证数据;
根据目标经营主体在历史时间段的交易数据、报销指令和发票凭证数据,确定目标经营主体对应的交易相关的算法稳定情况。
其中,算法稳定情况用于指示目标经营主体的服务器中用于交易运算的算法的有效性,这一算法稳定情况可以在后续用于评估多个指标,例如目标经营主体的服务器的稳定指标,目标经营主体的算法结构的中的部分或全部模块的稳定指标,其可以在宏观层面体现目标经营主体的算法的稳定性。
可选的,根据先前的实施方式或实施例,数据库中储存有多个经营主体关联的跟特定用户有关的交易数据、报销指令和发票凭证数据,这只需要对多个用户执行上述方法即可实现。可选的,数据库可以采用现有的数据库架构和数据储存架构对上述数据进行储存,如可以利用键-值结构(key-value)进行保存,将键的值保存为经营主体的标识,而值的值保存为对应的交易数据、报销指令和发票凭证数据,可选的还可以添加其他的标识符用于标识时间段、用户等信息。
作为一种可选的实施方式,第三确定模块根据目标经营主体在历史时间段的交易数据、报销指令和发票凭证数据,确定目标经营主体对应的交易相关的算法稳定情况的具体方式,包括:
对于任一报销指令,计算报销指令的生成时间和报销完成时间之间的时间差以得到报销用时;
对于任一发票凭证数据,确定发票凭证数据对应的报税与否信息;
对于任一交易数据,基于更优发票生成模型,确定交易数据对应的更优发票信息,并计算更优发票信息和交易数据对应的发票信息之间的发票相似度;
根据目标经营主体在历史时间段的所有交易数据的发票相似度、所有报销指令的报销用时和所有发票凭证数据的报税与否信息,计算目标经营主体对应的算法稳定系数;
判断算法稳定系数是否高于预设的系数阈值,若是,则判断目标经营主体对应的交易相关的算法稳定情况为稳定情况,否则判断为不稳定情况。
可选的,报销完成时间可以通过与报销服务器通信以进行获取,具体的,其可以用于指代报销服务器发起汇款操作的时间或汇款完成的时间。
可选的,更优发票生成模型和发票生成神经网络模型的结构一致,可以参照上述对于发票生成神经网络模型的结构的表述,但区别在于,更优发票生成模型根据对应于目标经营主体的训练数据集训练得到,因此其更具有针对性,因此其预测效果更优,可以用于根据其预测结果(也即更优发票信息)与发票信息的对比(也即发票相似度),来后续判断目标经营主体对应的发票生成神经网络模型的算法稳定性和效果。
作为一种可选的实施方式,报税与否信息在已报税时为预设非零值,在未报税时为零,例如可以在确认报税已否信息为已报税信息时,将其值置为1,或在相反的情况下置为0,以便后续的系数运算。
可选的,第三确定模块根据目标经营主体在历史时间段的所有交易数据的发票相似度、所有报销指令的报销用时和所有发票凭证数据的报税与否信息,计算目标经营主体对应的算法稳定系数的具体方式,包括:
计算目标经营主体对应的所有报销指令的报销用时的时间平均值;
计算目标经营主体在历史时间段的所有报销指令的报销用时与时间平均值之间的时间差的总和,得到报销时间系数;
计算目标经营主体在历史时间段的所有交易数据的发票相似度之和,得到发票正误系数;
计算目标经营主体在历史时间段的所有发票凭证数据的报税与否信息之和,得到发票有效系数;
对报销时间系数、发票正误系数和发票有效系数进行归一化处理后进行加权求和,以得到目标经营主体对应的算法稳定系数。
可选的,其中报销时间系数、发票正误系数和发票有效系数对应的权重之和为1,且报销时间系数或发票正误系数对应的权重大于发票有效系数对应的权重,这一设置的目的在于报销时间系数或发票正误系数更能体现系统上算法稳定,因此其重要性更高,权重也应更大。
实施例三
请参阅图3,图3是本发明实施例公开的又一种基于智能算法的发票数据处理装置的结构示意图。如图3所示,该装置可以包括:
存储有可执行程序代码的存储器301;
与存储器301耦合的处理器302;
处理器302调用存储器301中存储的可执行程序代码,执行本发明实施例一公开的基于智能算法的发票数据处理方法中的部分或全部步骤。
实施例四
本发明实施例公开了一种计算机存储介质,该计算机存储介质存储有计算机指令,该计算机指令被调用时,用于执行本发明实施例一公开的基于智能算法的发票数据处理方法中的部分或全部步骤。
上述对本说明书特定实施例进行了描述,其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,附图中描绘的过程不一定必须按照示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置、设备、非易失性计算机可读存储介质实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本说明书实施例提供的装置、设备、非易失性计算机可读存储介质与方法是对应的,因此,装置、设备、非易失性计算机存储介质也具有与对应方法类似的有益技术效果,由于上面已经对方法的有益技术效果进行了详细说明,因此,这里不再赘述对应装置、设备、非易失性计算机存储介质的有益技术效果。
在20世纪90年代,对于一个技术的改进可以很明显地区分是硬件上的改进(例如,对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而,随着技术的发展,当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此,不能说一个方法流程的改进就不能用硬件实体模块来实现。例如,可编程逻辑器件(Programmable Logic Device,PLD)(例如现场可编程门阵列(Field ProgrammableGateArray, FPGA))就是这样一种集成电路,其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字系统“集成”在一片PLD上,而不需要请芯片制造厂商来设计和制作专用的集成电路芯片。而且,如今,取代手工地制作集成电路芯片,这种编程也多半改用“逻辑编译器(logic compiler)”软件来实现,它与程序开发撰写时所用的软件编译器相类似,而要编译之前的原始代码也得用特定的编程语言来撰写,此称之为硬件描述语言(Hardware Description Language,HDL),而HDL也并非仅有一种,而是有许多种,如ABEL(Advanced Boolean Expression Language)、AHDL(Altera HardwareDescriptionLanguage)、 Confluence、CUPL(Cornell University ProgrammingLanguage)、HDCal、JHDL (Java Hardware Description Language)、Lava、Lola、MyHDL、PALASM、RHDL (RubyHardware Description Language)等,目前最普遍使用的是VHDL(Very-High-SpeedIntegrated Circuit Hardware Description Language)与Verilog。本领域技术人员也应该清楚,只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中,就可以很容易得到实现该逻辑方法流程的硬件电路。
控制器可以按任何适当的方式实现,例如,控制器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程逻辑控制器和嵌入微控制器的形式,控制器的例子包括但不限于以下微控制器:ARC 625D、Atmel AT91SAM、Microchip PIC18F26K20以及Silicone Labs C8051F320,存储器控制器还可以被实现为存储器的控制逻辑的一部分。本领域技术人员也知道,除了以纯计算机可读程序代码方式实现控制器以外,完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件,而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本说明书时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
本领域内的技术人员应明白,本说明书实施例可提供为方法、系统、或计算机程序产品。因此,本说明书实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本说明书实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本说明书是参照根据本说明书实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器 (RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带式磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本说明书可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本说明书,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
最后应说明的是:本发明实施例公开的一种基于智能算法的发票数据处理方法及装置所揭露的仅为本发明较佳实施例而已,仅用于说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解;其依然可以对前述各项实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或替换,并不使相应的技术方案的本质脱离本发明各项实施例技术方案的精神和范围。
Claims (10)
1.一种基于智能算法的发票数据处理方法,其特征在于,所述方法包括:
获取目标用户的交易数据;
根据所述交易数据,以及预设的发票生成神经网络模型,确定发票凭证数据;
获取所述目标用户的报销请求和工作记录信息,根据所述交易数据、所述报销请求和所述工作记录信息,确定所述目标用户的报销指令,并将所述报销指令发送至报销服务器以使得所述报销服务器将所述交易数据对应的交易金额报销至所述目标用户的金融账户;
将所述交易数据、所述报销指令和所述发票凭证数据关联至所述目标用户对应的经营主体,并储存到数据库中。
2.根据权利要求1所述的基于智能算法的发票数据处理方法,其特征在于,所述交易数据包括交易信息和交易标识;所述交易信息包括当次交易的交易对象信息、交易内容信息、交易金额信息、交易时间信息和交易方式信息;所述交易标识用于指示所述交易数据的交易类型。
3.根据权利要求2所述的基于智能算法的发票数据处理方法,其特征在于,所述根据所述交易数据,以及预设的发票生成神经网络模型,确定发票凭证数据,包括:
基于预设的向量转化算法,将所述交易信息中的多种信息转化为多个交易向量;
确定每一所述交易向量对应的权重,计算所述多个交易向量的加权求和结果,以得到交易特征数据;所述权重与所述交易向量对应的交易信息的信息长度成正比;
将所述交易特征数据输入至所述交易类型对应的发票生成神经网络模型,以得到所述发票生成神经网络模型输出的发票信息;所述发票生成神经网络模型通过包括有对应于任一所述交易类型的多个历史交易特征数据和对应的历史发票信息的训练数据集训练得到;所述发票生成神经网络模型包括特征提取网络和特征重构网络和分类网络;
将所述发票信息发送至开票服务器以获取所述开票服务器根据所述发票信息生成的发票凭证数据。
4.根据权利要求3所述的基于智能算法的发票数据处理方法,其特征在于,所述获取所述目标用户的报销请求和工作记录信息,根据所述交易数据、所述报销请求和所述工作记录信息,确定所述目标用户的报销指令,并将所述报销指令发送至报销服务器以使得所述报销服务器将所述交易数据对应的交易金额报销至所述目标用户的金融账户,包括:
获取所述目标用户的工作记录信息;
将所述交易信息与所述工作记录信息进行匹配,以判断所述交易数据是否为工作相关交易数据;
若判断结果为是,生成所述交易数据对应的报销记录;
获取所述目标用户发送的报销请求,根据所述报销请求和所述报销记录,确定所述目标用户的报销指令,并将所述报销指令发送至报销服务器以使得所述报销服务器将所述交易数据对应的交易金额报销至所述目标用户的金融账户。
5.根据权利要求4所述的基于智能算法的发票数据处理方法,其特征在于,所述工作记录信息中包括所述目标用户在多个工作时间段中的多个工作任务信息,以及,所述将所述交易信息与所述工作记录信息进行匹配,以判断所述交易数据是否为工作相关交易数据,包括:
根据所述交易信息中的交易时间信息,确定在所述交易时间信息的预设的时间误差范围内的所述工作时间段作为目标工作时间段;
将所述交易信息中除所述交易时间信息外的其他信息作为第一字符集合,将所有所述目标工作时间段中的所述工作任务信息作为第二字符集合,计算所述第一字符集合和所述第二字符集合的余弦相似度;
判断所述余弦相似度是否大于预设的相似度阈值,若是,则判断所述交易数据为工作相关交易数据。
6.根据权利要求1所述的基于智能算法的发票数据处理方法,其特征在于,所述方法还包括:
对于目标经营主体,从所述数据库中确定所述目标经营主体在历史时间段的所述交易数据、所述报销指令和所述发票凭证数据;
根据所述目标经营主体在历史时间段的所述交易数据、所述报销指令和所述发票凭证数据,确定所述目标经营主体对应的交易相关的算法稳定情况;所述算法稳定情况用于指示所述目标经营主体的服务器中用于交易运算的算法的有效性。
7.根据权利要求6所述的基于智能算法的发票数据处理方法,其特征在于,所述根据所述目标经营主体在历史时间段的所述交易数据、所述报销指令和所述发票凭证数据,确定所述目标经营主体对应的交易相关的算法稳定情况,包括:
对于任一所述报销指令,计算所述报销指令的生成时间和报销完成时间之间的时间差以得到报销用时;所述报销完成时间通过与所述报销服务器通信以进行获取;
对于任一所述发票凭证数据,确定所述发票凭证数据对应的报税与否信息;
对于任一所述交易数据,基于更优发票生成模型,确定所述交易数据对应的更优发票信息,并计算所述更优发票信息和所述交易数据对应的所述发票信息之间的发票相似度;所述更优发票生成模型和所述发票生成神经网络模型的结构一致;所述更优发票生成模型根据对应于所述目标经营主体的训练数据集训练得到;
根据所述目标经营主体在历史时间段的所有所述交易数据的所述发票相似度、所有所述报销指令的所述报销用时和所有所述发票凭证数据的所述报税与否信息,计算所述目标经营主体对应的算法稳定系数;
判断所述算法稳定系数是否高于预设的系数阈值,若是,则判断所述目标经营主体对应的交易相关的算法稳定情况为稳定情况,否则判断为不稳定情况。
8.根据权利要求7所述的基于智能算法的发票数据处理方法,其特征在于,所述报税与否信息在已报税时为预设非零值,在未报税时为零;所述根据所述目标经营主体在历史时间段的所有所述交易数据的所述发票相似度、所有所述报销指令的所述报销用时和所有所述发票凭证数据的所述报税与否信息,计算所述目标经营主体对应的算法稳定系数,包括:
计算所述目标经营主体对应的所有所述报销指令的所述报销用时的时间平均值;
计算所述目标经营主体在历史时间段的所有所述报销指令的所述报销用时与所述时间平均值之间的时间差的总和,得到报销时间系数;
计算所述目标经营主体在历史时间段的所有所述交易数据的所述发票相似度之和,得到发票正误系数;
计算所述目标经营主体在历史时间段的所有所述发票凭证数据的所述报税与否信息之和,得到发票有效系数;
对所述报销时间系数、所述发票正误系数和所述发票有效系数进行归一化处理后进行加权求和,以得到所述目标经营主体对应的算法稳定系数;其中所述报销时间系数、所述发票正误系数和所述发票有效系数对应的权重之和为1;所述报销时间系数或所述发票正误系数对应的权重大于所述发票有效系数对应的权重。
9.一种基于智能算法的发票数据处理装置,其特征在于,所述装置包括:
获取模块,用于获取目标用户的交易数据;
第一确定模块,用于根据所述交易数据,以及预设的发票生成神经网络模型,确定发票凭证数据;
第二确定模块,用于获取所述目标用户的报销请求和工作记录信息,根据所述交易数据、所述报销请求和所述工作记录信息,确定所述目标用户的报销指令,并将所述报销指令发送至报销服务器以使得所述报销服务器将所述交易数据对应的交易金额报销至所述目标用户的金融账户;
储存模块,用于将所述交易数据、所述报销指令和所述发票凭证数据关联至所述目标用户对应的经营主体,并储存到数据库中。
10.一种基于智能算法的发票数据处理装置,其特征在于,所述装置包括:
存储有可执行程序代码的存储器;
与所述存储器耦合的处理器;
所述处理器调用所述存储器中存储的所述可执行程序代码,执行如权利要求1-8任一项所述的基于智能算法的发票数据处理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210032265.4A CN114049192B (zh) | 2022-01-12 | 2022-01-12 | 基于智能算法的发票数据处理方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210032265.4A CN114049192B (zh) | 2022-01-12 | 2022-01-12 | 基于智能算法的发票数据处理方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114049192A true CN114049192A (zh) | 2022-02-15 |
CN114049192B CN114049192B (zh) | 2022-04-12 |
Family
ID=80196326
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210032265.4A Active CN114049192B (zh) | 2022-01-12 | 2022-01-12 | 基于智能算法的发票数据处理方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114049192B (zh) |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101251913A (zh) * | 2008-04-10 | 2008-08-27 | 华为技术有限公司 | 一种自助报销管理系统及方法 |
CN108345880A (zh) * | 2018-01-26 | 2018-07-31 | 金蝶软件(中国)有限公司 | 发票识别方法、装置、计算机设备和存储介质 |
CN111178219A (zh) * | 2019-12-24 | 2020-05-19 | 泰康保险集团股份有限公司 | 票据识别管理方法、装置、存储介质及电子设备 |
CN111192019A (zh) * | 2019-12-30 | 2020-05-22 | 武汉佰钧成技术有限责任公司 | 一种目标票据的报销处理方法及相关设备 |
JP2020098494A (ja) * | 2018-12-18 | 2020-06-25 | 日本電気株式会社 | 処理システム、処理装置、処理方法及びプログラム |
TW202025045A (zh) * | 2018-12-25 | 2020-07-01 | 香港商阿里巴巴集團服務有限公司 | 基於區塊鏈的發票報銷方法及裝置、電子設備 |
CN113222555A (zh) * | 2021-05-28 | 2021-08-06 | 支付宝(杭州)信息技术有限公司 | 数据处理方法、装置、设备及系统 |
CN113506162A (zh) * | 2021-08-10 | 2021-10-15 | 汇正(广州)企业管理咨询有限公司 | 一种基于大数据的财务无纸化报销管理方法及系统 |
CN113569998A (zh) * | 2021-08-31 | 2021-10-29 | 平安医疗健康管理股份有限公司 | 票据自动识别方法、装置、计算机设备及存储介质 |
-
2022
- 2022-01-12 CN CN202210032265.4A patent/CN114049192B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101251913A (zh) * | 2008-04-10 | 2008-08-27 | 华为技术有限公司 | 一种自助报销管理系统及方法 |
CN108345880A (zh) * | 2018-01-26 | 2018-07-31 | 金蝶软件(中国)有限公司 | 发票识别方法、装置、计算机设备和存储介质 |
JP2020098494A (ja) * | 2018-12-18 | 2020-06-25 | 日本電気株式会社 | 処理システム、処理装置、処理方法及びプログラム |
TW202025045A (zh) * | 2018-12-25 | 2020-07-01 | 香港商阿里巴巴集團服務有限公司 | 基於區塊鏈的發票報銷方法及裝置、電子設備 |
CN111178219A (zh) * | 2019-12-24 | 2020-05-19 | 泰康保险集团股份有限公司 | 票据识别管理方法、装置、存储介质及电子设备 |
CN111192019A (zh) * | 2019-12-30 | 2020-05-22 | 武汉佰钧成技术有限责任公司 | 一种目标票据的报销处理方法及相关设备 |
CN113222555A (zh) * | 2021-05-28 | 2021-08-06 | 支付宝(杭州)信息技术有限公司 | 数据处理方法、装置、设备及系统 |
CN113506162A (zh) * | 2021-08-10 | 2021-10-15 | 汇正(广州)企业管理咨询有限公司 | 一种基于大数据的财务无纸化报销管理方法及系统 |
CN113569998A (zh) * | 2021-08-31 | 2021-10-29 | 平安医疗健康管理股份有限公司 | 票据自动识别方法、装置、计算机设备及存储介质 |
Non-Patent Citations (2)
Title |
---|
YANHUI FENG等: "Study of recognition of electronic invoice image", 《2021 IEEE 5TH INFORMATION TECHNOLOGY,NETWORKING,ELECTRONIC AND AUTOMATION CONTROL CONFERENCE》 * |
徐超 等: "大数据技术与方法在审计监督中的应用研究", 《数量经济技术经济研究》 * |
Also Published As
Publication number | Publication date |
---|---|
CN114049192B (zh) | 2022-04-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109191110B (zh) | 后付费交易数据处理方法、装置、处理设备、及服务器 | |
CN108460523B (zh) | 一种风控规则生成方法和装置 | |
CN107563757B (zh) | 数据风险识别的方法及装置 | |
US11682093B2 (en) | Document term recognition and analytics | |
US10832250B2 (en) | Long-term short-term cascade modeling for fraud detection | |
CN108921566B (zh) | 一种基于图结构模型的虚假交易识别方法和装置 | |
CN111080304B (zh) | 一种可信关系识别方法、装置及设备 | |
CN110020427B (zh) | 策略确定方法和装置 | |
WO2021259147A1 (zh) | 基于区块链的资源转移方法、装置及设备 | |
CN110069545B (zh) | 一种行为数据评估方法及装置 | |
CN109308616B (zh) | 一种交易记录的风险判定方法及装置 | |
CN112214652B (zh) | 一种报文生成方法、装置及设备 | |
CN113688313A (zh) | 一种预测模型的训练方法、信息推送的方法及装置 | |
CN113516480A (zh) | 一种支付风险识别方法、装置及设备 | |
CN111383030A (zh) | 一种交易风险的检测方法、装置及设备 | |
CN110134860B (zh) | 用户画像生成方法、装置和设备 | |
CN110033092B (zh) | 数据标签生成、模型训练、事件识别方法和装置 | |
CN114049192B (zh) | 基于智能算法的发票数据处理方法及装置 | |
CN110008252B (zh) | 数据核对方法及装置 | |
CN115456801B (zh) | 个人信用的人工智能大数据风控系统、方法和存储介质 | |
CN114445207B (zh) | 基于数字人民币的税务管理系统 | |
CN115660105A (zh) | 一种模型训练的方法、业务风控的方法及装置 | |
CN108595395B (zh) | 一种昵称的生成方法、装置及设备 | |
CN111401641B (zh) | 业务数据处理方法、装置及电子设备 | |
CN115423461A (zh) | 账单处理方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |