CN112528620A - 财务凭证生成方法、装置、设备及存储介质 - Google Patents
财务凭证生成方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN112528620A CN112528620A CN202011539101.8A CN202011539101A CN112528620A CN 112528620 A CN112528620 A CN 112528620A CN 202011539101 A CN202011539101 A CN 202011539101A CN 112528620 A CN112528620 A CN 112528620A
- Authority
- CN
- China
- Prior art keywords
- financial
- information
- configuration
- field
- fields
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 56
- 238000003860 storage Methods 0.000 title claims abstract description 21
- 230000008569 process Effects 0.000 claims abstract description 20
- 239000011159 matrix material Substances 0.000 claims description 28
- 238000000605 extraction Methods 0.000 claims description 13
- 230000004927 fusion Effects 0.000 claims description 9
- 238000004140 cleaning Methods 0.000 claims description 6
- 238000004806 packaging method and process Methods 0.000 claims description 5
- 230000011218 segmentation Effects 0.000 claims description 5
- 238000002372 labelling Methods 0.000 claims description 4
- 238000004590 computer program Methods 0.000 claims 2
- 238000005516 engineering process Methods 0.000 abstract description 5
- 238000011161 development Methods 0.000 abstract description 4
- 238000004519 manufacturing process Methods 0.000 abstract description 2
- 238000010586 diagram Methods 0.000 description 6
- 238000012545 processing Methods 0.000 description 6
- 238000006243 chemical reaction Methods 0.000 description 3
- 230000018109 developmental process Effects 0.000 description 3
- 238000013507 mapping Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000005538 encapsulation Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000005065 mining Methods 0.000 description 2
- 239000003607 modifier Substances 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 238000007635 classification algorithm Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 238000007711 solidification Methods 0.000 description 1
- 230000008023 solidification Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000011426 transformation method Methods 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/166—Editing, e.g. inserting or deleting
- G06F40/186—Templates
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
- G06F16/215—Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/38—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/383—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/253—Fusion techniques of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/12—Accounting
- G06Q40/125—Finance or payroll
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Business, Economics & Management (AREA)
- General Engineering & Computer Science (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- Databases & Information Systems (AREA)
- Library & Information Science (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Strategic Management (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Marketing (AREA)
- Quality & Reliability (AREA)
- Technology Law (AREA)
- General Business, Economics & Management (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Abstract
本发明涉及大数据领域,公开了一种财务凭证生成方法、装置、设备及存储介质。该方法包括:获取多个目标业务流程中产生的业务数据,并提取业务数据中的财务信息;采用预置分割规则,将财务信息划分为固定信息和可变信息;从预置数据库中匹配固定信息对应的财务凭证模板,并将固定信息写入财务凭证模板中;对可变信息进行正则化,得到对应的正则化信息,并从数据库中选取与正则化信息相关联的财务配置字段;将财务配置字段固化至已写入固定信息的财务凭证模板中,得到目标业务的财务凭证。本发明还涉及区块链技术,所述业务数据存储于区块链中。本发明实现了不同场景下财务凭证的自动生成,降低了财务凭证的生产成本,提升了财务凭证的开发效率。
Description
技术领域
本发明涉及大数据领域,尤其涉及一种财务凭证生成方法、装置、设备及存储介质。
背景技术
财务部门对于系统产生的计提数据,交易数据,资金数据,及法人相关联交易数据进行财务凭证的生成,由于不同法人,不同数据场景,生成的财务凭证非常繁多,且单个财务凭证的会计准则比较繁杂,比如一笔交易映射到财务凭证会存在借贷方科目及相关财务信息字段,每笔交易的财务信息都因不同交易而有着不同的财务信息值。
当前行业中系统生成财务凭证的规则是,针对不同的财务凭证,会在代码层面中实现相对应的生成逻辑,并关联相关财务信息配置表,最终生成财务凭证,插入到数据库中。现有技术的生成规则中,无法满足自动化生成财务凭证,一旦有新的场景交易发生,就必须在代码中实现相关功能模块,而开发人员对于财务凭证跨专业知识需要进行额外学习培训,综合的开发成本较高,开发时效低,无法满足快速实现财务部门的诉求。综上所述,现有的财务凭证生成技术无法正对不同业务场景自动生成财务凭证。
发明内容
本发明的主要目的在于解决现有的财务凭证生成技术无法针对不同业务场景自动生成财务凭证的技术问题。
本发明第一方面提供了一种财务凭证生成方法,包括:
获取多个目标业务流程中产生的业务数据,并提取所述业务数据中的财务信息;
采用预置分割规则,将所述财务信息划分为固定信息和可变信息;
从预置数据库中匹配所述固定信息对应的财务凭证模板,并将所述固定信息写入所述财务凭证模板中;
对所述可变信息进行正则化处理,得到对应的正则化信息,并从所述数据库中选取与所述正则化信息相关联的财务配置字段;
将所述财务配置字段固化至已写入固定信息的财务凭证模板中,得到目标业务的财务凭证。
可选的,在本发明第一方面的第一种实现方式中,所述提取所述业务数据中的财务信息包括:
对所述业务数据进行清洗,以剔除所述业务数据中的噪音数据,并基于预置先验知识,提取清洗后的业务数据中的文本属性特征;
将所述文本属性特征转化为第一特征矩阵,并对相同属性类型的文本属性特征对应的第一特征矩阵进行特征融合,得到所述业务数据的第二特征矩阵;
基于所述第二特征矩阵,确定所述业务数据中的财务信息。
可选的,在本发明第一方面的第二种实现方式中,所述对所述可变信息进行正则化处理,得到对应的正则化信息包括:
按照预设粒度对所述可变信息进行分割,得到多个可变字段,并将所述各可变字段进行标签化处理,得到对应的字段标签信息;
依次将所述各字段标签信息输入预置文本正则化模型进行正则化处理,得到所述各字段标签信息对应的字段类别信息;
基于所述字段类别信息,对所述各可变字段进行重新组合,得到所述可变信息的正则化信息。
可选的,在本发明第一方面的第三种实现方式中,所述从所述数据库中选取与所述正则化信息相关联的财务配置字段包括:
提取所述正则化信息中各文本字段的标识信息,并确定所述各标识信息对应的键值;
从所述数据库中查找所述键值映射的配置字段,并判断所述配置字段是否与其他配置字段相关联;
若相关联,则将所述配置字段和所述其他配置字段作为财务配置字段,否则将所述配置字段作为财务配置字段。
可选的,在本发明第一方面的第四种实现方式中,所述将所述财务配置字段固化至已写入固定信息的财务凭证模板中,得到目标业务的财务凭证包括:
将所述各财务配置字段转化为预置文本格式的只读字段;
对所述各只读字段进行封装,并将封装后的只读字段进行数字签名加密,得到加密文本;
将所述加密文本写入已写入固定信息的所述财务凭证模板中,得到目标业务的财务凭证。
本发明第二方面提供了一种财务凭证生成装置,包括:
提取模块,用于获取多个目标业务流程中产生的业务数据,并提取所述业务数据中的财务信息;
划分模块,用于采用预置分割规则,将所述财务信息划分为固定信息和可变信息;
匹配模块,用于从预置数据库中匹配所述固定信息对应的财务凭证模板,并将所述固定信息写入所述财务凭证模板中;
正则化模块,用于对所述可变信息进行正则化处理,得到对应的正则化信息,并从所述数据库中选取与所述正则化信息相关联的财务配置字段;
固化模块,用于将所述财务配置字段固化至已写入固定信息的财务凭证模板中,得到目标业务的财务凭证。
可选的,在本发明第二方面的第一种实现方式中,所述提取模块包括:
第一提取单元,用于对所述业务数据进行清洗,以剔除所述业务数据中的噪音数据,并基于预置先验知识,提取清洗后的业务数据中的文本属性特征;
融合单元,用于将所述文本属性特征转化为第一特征矩阵,并对相同属性类型的文本属性特征对应的第一特征矩阵进行特征融合,得到所述业务数据的第二特征矩阵;
确定单元,用于基于所述第二特征矩阵,确定所述业务数据中的财务信息。
可选的,在本发明第二方面的第二种实现方式中,所述正则化模块包括:
分割单元,用于按照预设粒度对所述可变信息进行分割,得到多个可变字段,并将所述各可变字段进行标签化处理,得到对应的字段标签信息;
正则化单元,用于依次将所述各字段标签信息输入预置文本正则化模型进行正则化处理,得到所述各字段标签信息对应的字段类别信息;
组合单元,用于基于所述字段类别信息,对所述各可变字段进行重新组合,得到所述可变信息的正则化信息。
可选的,在本发明第二方面的第三种实现方式中,所述正则化模块还包括:
第二提取单元,用于提取所述正则化信息中各文本字段的标识信息,并确定所述各标识信息对应的键值;
判别单元,用于从所述数据库中查找所述键值映射的配置字段,并判断所述配置字段是否与其他配置字段相关联;若相关联,则将所述配置字段和所述其他配置字段作为财务配置字段,否则将所述配置字段作为财务配置字段。
可选的,在本发明第二方面的第四种实现方式中,所述固化模块包括:
转化单元,用于将所述各财务配置字段转化为预置文本格式的只读字段;
封装单元,用于对所述各只读字段进行封装,并将封装后的只读字段进行数字签名加密,得到加密文本;
写入单元,用于将所述加密文本写入已写入固定信息的所述财务凭证模板中,得到目标业务的财务凭证。
本发明第三方面提供了一种财务凭证生成设备,包括:存储器和至少一个处理器,所述存储器中存储有指令;所述至少一个处理器调用所述存储器中的所述指令,以使得所述财务凭证生成设备执行上述的财务凭证生成方法。
本发明的第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述的财务凭证生成方法。
本发明提供的技术方案中,通过获取在多个目标业务流程中产生的业务数据,并提取业务数据中的财务信息;然后采用预置分割规则,将财务信息划分为固定信息和可变信息;其中,固定信息可用于从预置数据库中匹配对应的财务凭证模板,并先将固定信息写入财务凭证模板中;而对于可变信息,需先进行正则化,将相同类型的可变信息转化为正则化信息,并从数据库中选取与与正则化信息相关联的财务配置字段;将财务配置字段固化至已写入固定信息的财务凭证模板中,即可得到目标业务的财务凭证,以达到灵活生成不同场景下的财务凭证。
附图说明
图1为本发明实施例中财务凭证生成方法的一个实施例示意图;
图2为本发明实施例中财务凭证生成方法的另一个实施例示意图;
图3为本发明实施例中财务凭证生成装置的一个实施例示意图;
图4为本发明实施例中财务凭证生成装置的另一个实施例示意图;
图5为本发明实施例中财务凭证生成设备的一个实施例示意图。
具体实施方式
本发明实施例提供了一种财务凭证生成方法、装置、设备及存储介质,获取多个目标业务流程中产生的业务数据,并提取业务数据中的财务信息;采用预置分割规则,将财务信息划分为固定信息和可变信息;从预置数据库中匹配固定信息对应的财务凭证模板,并将固定信息写入财务凭证模板中;对可变信息进行正则化,得到对应的正则化信息,并从数据库中选取与正则化信息相关联的财务配置字段;将财务配置字段固化至已写入固定信息的财务凭证模板中,得到目标业务的财务凭证。本发明还涉及区块链技术,所述业务数据存储于区块链中。本发明实现了不同场景下财务凭证的自动生成,降低了财务凭证的生产成本,提升了财务凭证的开发效率。
本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外,术语“包括”或“具有”及其任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
为便于理解,下面对本发明实施例的具体流程进行描述,请参阅图1,本发明实施例中财务凭证生成方法的第一个实施例包括:
101、获取多个目标业务流程中产生的业务数据,并提取所述业务数据中的财务信息;
可以理解的是,本发明的执行主体可以为财务凭证生成装置,还可以是终端或者服务器,具体此处不做限定。本发明实施例以服务器为执行主体为例进行说明。需要强调的是,为进一步保证上述业务数据的私密和安全性,上述业务数据还可以存储于一区块链的节点中。
本实施例中,为了生成财务凭证,需要获取财务凭证的相关内容,此时则可以从放款流程之前多各目标业务流程中产生的业务数据中提取,其中,目标业务流程中产生的业务信息包括:在开立结算账户时的个人基本信息或公司基本信息;在提出贷款申请时申报的需求、抵押、受申请方;贷款调查时用户或个人的真实担保物;贷款审查审批时的审查意见;落实担保条件时的担保内容;贷款签约和发放时的贷款金额;贷款资金划转时的划转金额与证明文件;依照合同约定偿还利息的计算内容。而提取得到的财务信息包括财务帐套,科目代码,凭证类型,产品类型,交易类型,费用类型等。
102、采用预置分割规则,将所述财务信息划分为固定信息和可变信息;
本实施例中,对于相同业务场景、相同的门店信息、科目代码、相同的入款人等,均可以直接作为固定信息,一方面可以用于确定当前业务需要开具的财务凭证类型,另一方面无需再识别固定信息中各字段具体的字段值,直接写入财务凭证中即可。而可变信息则可以与过往的目标业务流程中的记录信息不同,比如在贷款业务中,每月还款项虽然可以预先设立,但是可能由于逾期还款而产生额外的罚金,此时每月还款项作为可变信息的内容与对应的金额则有所不同,需根据当前数据库记载的内容进行更新。
103、从预置数据库中匹配所述固定信息对应的财务凭证模板,并将所述固定信息写入所述财务凭证模板中;
本实施例中,开发人员预先配置好各类型财务凭证的模板,并存储在预置数据库中,并以业务场景、门店信息、科目代码等的映射作为键值;故在应用阶段,通过固定信息中呈现的业务场景、相同的门店信息、科目代码等条件,可以最终确定与之相匹配的财务凭证模板。
104、对所述可变信息进行正则化处理,得到对应的正则化信息,并从所述数据库中选取与所述正则化信息相关联的财务配置字段;
本实施例中,通过对可变信息的正则化,将临近类型财务字段进行统一以归入相同的财务凭证模板中;而财务配置字段则是与正则化信息中各正则化字段在数据库中具体配置字段内容的映射。
105、将所述财务配置字段固化至已写入固定信息的财务凭证模板中,得到目标业务的财务凭证。
本实施例中,对于财务凭证中的财务配置字段因涉及业务实际操作中的财务内容,比如贷款时还款类型为本金、利息、罚息或者是先缴金,涉及的具体金额,均为重要的内容,需进行格式转换,生成财务凭证后不可修改,并进行加密处理,防止后期遭修改,此过程成为财务配置字段的固化。
本发明实施例中,通过获取在多个目标业务流程中产生的业务数据,并提取业务数据中的财务信息;然后采用预置分割规则,将财务信息划分为固定信息和可变信息;其中,固定信息可用于从预置数据库中匹配对应的财务凭证模板,并先将固定信息写入财务凭证模板中;而对于可变信息,需先进行正则化,将相同类型的可变信息转化为正则化信息,并从数据库中选取与与正则化信息相关联的财务配置字段;将财务配置字段固化至已写入固定信息的财务凭证模板中,即可得到目标业务的财务凭证,以达到灵活生成不同场景下的财务凭证。
请参阅图2,本发明实施例中财务凭证生成方法的第二个实施例包括:
201、获取多个目标业务流程中产生的业务数据;
202、对所述业务数据进行清洗,以剔除所述业务数据中的噪音数据,并基于预置先验知识,提取清洗后的业务数据中的文本属性特征;
203、将所述文本属性特征转化为第一特征矩阵,并对相同属性类型的文本属性特征对应的第一特征矩阵进行特征融合,得到所述业务数据的第二特征矩阵;
204、基于所述第二特征矩阵,确定所述业务数据中的财务信息;
本实施例中,在进行数据清洗时,剔除噪声文档以改进挖掘精度,或者在业务数据的数量过多时仅选取一部分样本以提高挖掘效率。例如业务数据中存在很多不必要的信息,比如审查意见、提出贷款申请时申报的需求、抵押等。
然后对于清洗后的业务数据,跟先验知识表现的业务领域专家经验,从业务数据中挑选出最有影响力的字段作为文本属性特征,根据括财务帐套,科目代码,凭证类型无模式,产品类型,交易类型,费用类型等属性进行划分。通过惯用的聚类算法将不同属性类型的文本属性特征进行划分,并分别将各文本属性转化为对应的第一特征矩阵,比如层次聚类法、平面划分法、简单贝叶斯聚类法、K-最近邻聚类法、分级聚类法等
接着再通过常规的分类方法对第一特征矩阵进行分类并融合即可得到对应的第二特征矩阵,比如简单贝叶斯分类法,矩阵变换法、K-最近邻参照分类算法以及支持向量机分类方法等。
205、采用预置分割规则,将所述财务信息划分为固定信息和可变信息;
206、从预置数据库中匹配所述固定信息对应的财务凭证模板,并将所述固定信息写入所述财务凭证模板中;
207、按照预设粒度对所述可变信息进行分割,得到多个可变字段,并将所述各可变字段进行标签化处理,得到对应的字段标签信息;
208、依次将所述各字段标签信息输入预置文本正则化模型进行正则化处理,得到所述各字段标签信息对应的字段类别信息;
209、基于所述字段类别信息,对所述各可变字段进行重新组合,得到所述可变信息的正则化信息;
本实施例中,预设粒度可以是单个汉字、单个符号、连续数字、连续字母,将可变信息拆分为仅具有一种正则化结果和具有至少两种正则化结果的汉字字符或者非汉字字符,然后根据其字符特征标注对应的标签,包括产品类型,交易类型,费用类型,费用等。预先设置多个字段值范围,并定义一个正则化类别信息,比如对于产品类型,可将车贷、房贷、信用贷等归为带宽的正则化类别。接着将同一字段类别信息的原字段进行归类并按预置的字段类别顺序进行组合,再分别映射至同一个正则表达字段中,即可得到可变信息的正则化信息。
210、提取所述正则化信息中各文本字段的标识信息,并确定所述各标识信息对应的键值;
211、从所述数据库中查找所述键值映射的配置字段,并判断所述配置字段是否与其他配置字段相关联;
212、若相关联,则将所述配置字段和所述其他配置字段作为财务配置字段,否则将所述配置字段作为财务配置字段;
本实施例中,正则化字段类型亦包括产品类型,交易类型,费用类型,费用等类型,在每个财务凭证开单时,各类型的具体财务配置值可能有所不同,如果各类型中的财务配置字段与同类型本不属于财务凭证内容的其他项的财务配置字段关联,则需将其他项的财务配置字段同时写入财务凭证模板中。比如在贷款后用户还款时,系统核算还款时间逾期,除了本金、利息之外,还以本金为基础生成罚金,故费用类型和具体费用项目包括原本的本金、利息,还包括关联的罚金。
213、将所述各财务配置字段转化为预置文本格式的只读字段;
214、对所述各只读字段进行封装,并将封装后的只读字段进行数字签名加密,得到加密文本;
215、将所述加密文本写入已写入固定信息的所述财务凭证模板中,得到目标业务的财务凭证。
本实施例中,为了保证财务配置字段不可改变,使用readonly修饰符声明,如果以类进行修饰,则需要把static修饰符分配给该字段。对于只读字段的封装,则先将各只读字段转换为数据包或数据报,并在报头中放上逻辑地址,这样每一个数据包都可以通过互联网络进行传输;数据包或数据报转换为帧,以便在本地网络中传输;在本地网段上,使用硬件地址唯一标识每一台主机;帧转换为比特流,并采用数字编码和时钟方案,即得到封装后的只读字段。
另外,对于封装后的只读字段,通过一个哈希函数从文本中生成报文摘要,然后用出款账号的私钥对这个摘要进行加密,这个加密后的摘要将作为报文的数字签名和报文一起发送给收款账号(业务方),收款账号首先用与出款账号一样的哈希函数从接收到的原始文本中计算出报文摘要,接着再公钥来对文本附加的数字签名进行解密,如果这两个摘要相同,那么财务配置字段即可固化至财务凭证模板中。
本发明实施例中,详细介绍了财务信息的提取过程,再对财务信息中的可变信息进行正则化,并选取与正则化信息相关联的财务配置字段,并固化至财务凭证模板中,以实现对财务凭证的开具,面对不同的业务场景均可自动选取适当的财务凭证模板,获取对应的财务配置字段,最后生成准确的财务凭证。
上面对本发明实施例中财务凭证生成方法进行了描述,下面对本发明实施例中财务凭证生成装置进行描述,请参阅图3,本发明实施例中财务凭证生成装置一个实施例包括:
提取模块301,用于获取多个目标业务流程中产生的业务数据,并提取所述业务数据中的财务信息;
划分模块302,用于采用预置分割规则,将所述财务信息划分为固定信息和可变信息;
匹配模块303,用于从预置数据库中匹配所述固定信息对应的财务凭证模板,并将所述固定信息写入所述财务凭证模板中;
正则化模块304,用于对所述可变信息进行正则化处理,得到对应的正则化信息,并从所述数据库中选取与所述正则化信息相关联的财务配置字段;
固化模块305,用于将所述财务配置字段固化至已写入固定信息的财务凭证模板中,得到目标业务的财务凭证。
本发明实施例中,通过获取在多个目标业务流程中产生的业务数据,并提取业务数据中的财务信息;然后采用预置分割规则,将财务信息划分为固定信息和可变信息;其中,固定信息可用于从预置数据库中匹配对应的财务凭证模板,并先将固定信息写入财务凭证模板中;而对于可变信息,需先进行正则化,将相同类型的可变信息转化为正则化信息,并从数据库中选取与与正则化信息相关联的财务配置字段;将财务配置字段固化至已写入固定信息的财务凭证模板中,即可得到目标业务的财务凭证,以达到灵活生成不同场景下的财务凭证。
请参阅图4,本发明实施例中财务凭证生成装置的另一个实施例包括:
提取模块301,用于获取多个目标业务流程中产生的业务数据,并提取所述业务数据中的财务信息;
划分模块302,用于采用预置分割规则,将所述财务信息划分为固定信息和可变信息;
匹配模块303,用于从预置数据库中匹配所述固定信息对应的财务凭证模板,并将所述固定信息写入所述财务凭证模板中;
正则化模块304,用于对所述可变信息进行正则化处理,得到对应的正则化信息,并从所述数据库中选取与所述正则化信息相关联的财务配置字段;
固化模块305,用于将所述财务配置字段固化至已写入固定信息的财务凭证模板中,得到目标业务的财务凭证。
具体的,所述提取模块301包括:
第一提取单元3011,用于对所述业务数据进行清洗,以剔除所述业务数据中的噪音数据,并基于预置先验知识,提取清洗后的业务数据中的文本属性特征;
融合单元3012,用于将所述文本属性特征转化为第一特征矩阵,并对相同属性类型的文本属性特征对应的第一特征矩阵进行特征融合,得到所述业务数据的第二特征矩阵;
确定单元3013,用于基于所述第二特征矩阵,确定所述业务数据中的财务信息。
具体的,所述正则化模块304包括:
分割单元3041,用于按照预设粒度对所述可变信息进行分割,得到多个可变字段,并将所述各可变字段进行标签化处理,得到对应的字段标签信息;
正则化单元3042,用于依次将所述各字段标签信息输入预置文本正则化模型进行正则化处理,得到所述各字段标签信息对应的字段类别信息;
组合单元3043,用于基于所述字段类别信息,对所述各可变字段进行重新组合,得到所述可变信息的正则化信息。
具体的,所述正则化模块304还包括:
第二提取单元3044,用于提取所述正则化信息中各文本字段的标识信息,并确定所述各标识信息对应的键值;
判别单元3045,用于从所述数据库中查找所述键值映射的配置字段,并判断所述配置字段是否与其他配置字段相关联;若相关联,则将所述配置字段和所述其他配置字段作为财务配置字段,否则将所述配置字段作为财务配置字段。
具体的,所述固化模块305包括:
转化单元3051,用于将所述各财务配置字段转化为预置文本格式的只读字段;
封装单元3052,用于对所述各只读字段进行封装,并将封装后的只读字段进行数字签名加密,得到加密文本;
写入单元3053,用于将所述加密文本写入已写入固定信息的所述财务凭证模板中,得到目标业务的财务凭证。
本发明实施例中,详细介绍了财务信息的提取过程,再对财务信息中的可变信息进行正则化,并选取与正则化信息相关联的财务配置字段,并固化至财务凭证模板中,以实现对财务凭证的开具,面对不同的业务场景均可自动选取适当的财务凭证模板,获取对应的财务配置字段,最后生成准确的财务凭证。
上面图3和图4从模块化功能实体的角度对本发明实施例中的财务凭证生成装置进行详细描述,下面从硬件处理的角度对本发明实施例中财务凭证生成设备进行详细描述。
图5是本发明实施例提供的一种财务凭证生成设备的结构示意图,该财务凭证生成设备500可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器(central processing units,CPU)510(例如,一个或一个以上处理器)和存储器520,一个或一个以上存储应用程序533或数据532的存储介质530(例如一个或一个以上海量存储设备)。其中,存储器520和存储介质530可以是短暂存储或持久存储。存储在存储介质530的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对财务凭证生成设备500中的一系列指令操作。更进一步地,处理器510可以设置为与存储介质530通信,在财务凭证生成设备500上执行存储介质530中的一系列指令操作。
财务凭证生成设备500还可以包括一个或一个以上电源540,一个或一个以上有线或无线网络接口550,一个或一个以上输入输出接口560,和/或,一个或一个以上操作系统531,例如Windows Serve,Mac OS X,Unix,Linux,FreeBSD等等。本领域技术人员可以理解,图5示出的财务凭证生成设备结构并不构成对财务凭证生成设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
本发明还提供一种计算机可读存储介质,该计算机可读存储介质可以为非易失性计算机可读存储介质,该计算机可读存储介质也可以为易失性计算机可读存储介质,所述计算机可读存储介质中存储有指令,当所述指令在计算机上运行时,使得计算机执行所述财务凭证生成方法的步骤。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(read-only memory,ROM)、随机存取存储器(random access memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
本发明所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
以上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (10)
1.一种财务凭证生成方法,其特征在于,所述财务凭证生成方法包括:
获取多个目标业务流程中产生的业务数据,并提取所述业务数据中的财务信息;
采用预置分割规则,将所述财务信息划分为固定信息和可变信息;
从预置数据库中匹配所述固定信息对应的财务凭证模板,并将所述固定信息写入所述财务凭证模板中;
对所述可变信息进行正则化处理,得到对应的正则化信息,并从所述数据库中选取与所述正则化信息相关联的财务配置字段;
将所述财务配置字段固化至已写入固定信息的财务凭证模板中,得到目标业务的财务凭证。
2.根据权利要求1所述的财务凭证生成方法,其特征在于,所述提取所述业务数据中的财务信息包括:
对所述业务数据进行清洗,以剔除所述业务数据中的噪音数据,并基于预置先验知识,提取清洗后的业务数据中的文本属性特征;
将所述文本属性特征转化为第一特征矩阵,并对相同属性类型的文本属性特征对应的第一特征矩阵进行特征融合,得到所述业务数据的第二特征矩阵;
基于所述第二特征矩阵,确定所述业务数据中的财务信息。
3.根据权利要求1所述的财务凭证生成方法,其特征在于,所述对所述可变信息进行正则化处理,得到对应的正则化信息包括:
按照预设粒度对所述可变信息进行分割,得到多个可变字段,并将所述各可变字段进行标签化处理,得到对应的字段标签信息;
依次将所述各字段标签信息输入预置文本正则化模型进行正则化处理,得到所述各字段标签信息对应的字段类别信息;
基于所述字段类别信息,对所述各可变字段进行重新组合,得到所述可变信息的正则化信息。
4.根据权利要求1所述的财务凭证生成方法,其特征在于,所述从所述数据库中选取与所述正则化信息相关联的财务配置字段包括:
提取所述正则化信息中各文本字段的标识信息,并确定所述各标识信息对应的键值;
从所述数据库中查找所述键值映射的配置字段,并判断所述配置字段是否与其他配置字段相关联;
若相关联,则将所述配置字段和所述其他配置字段作为财务配置字段,否则将所述配置字段作为财务配置字段。
5.根据权利要求1-4中任一项所述的财务凭证生成方法,其特征在于,所述将所述财务配置字段固化至已写入固定信息的财务凭证模板中,得到目标业务的财务凭证包括:
将所述各财务配置字段转化为预置文本格式的只读字段;
对所述各只读字段进行封装,并将封装后的只读字段进行数字签名加密,得到加密文本;
将所述加密文本写入已写入固定信息的所述财务凭证模板中,得到目标业务的财务凭证。
6.一种财务凭证生成装置,其特征在于,所述财务凭证生成装置包括:
提取模块,用于获取多个目标业务流程中产生的业务数据,并提取所述业务数据中的财务信息;
划分模块,用于采用预置分割规则,将所述财务信息划分为固定信息和可变信息;
匹配模块,用于从预置数据库中匹配所述固定信息对应的财务凭证模板,并将所述固定信息写入所述财务凭证模板中;
正则化模块,用于对所述可变信息进行正则化处理,得到对应的正则化信息,并从所述数据库中选取与所述正则化信息相关联的财务配置字段;
固化模块,用于将所述财务配置字段固化至已写入固定信息的财务凭证模板中,得到目标业务的财务凭证。
7.根据权利要求6所述的财务凭证生成装置,其特征在于,所述提取模块包括:
第一提取单元,用于对所述业务数据进行清洗,以剔除所述业务数据中的噪音数据,并基于预置先验知识,提取清洗后的业务数据中的文本属性特征;
融合单元,用于将所述文本属性特征转化为第一特征矩阵,并对相同属性类型的文本属性特征对应的第一特征矩阵进行特征融合,得到所述业务数据的第二特征矩阵;
确定单元,用于基于所述第二特征矩阵,确定所述业务数据中的财务信息。
8.根据权利要求6所述的财务凭证生成装置,其特征在于,所述正则化模块还包括:
第二提取单元,用于提取所述正则化信息中各文本字段的标识信息,并确定所述各标识信息对应的键值;
判别单元,用于从所述数据库中查找所述键值映射的配置字段,并判断所述配置字段是否与其他配置字段相关联;若相关联,则将所述配置字段和所述其他配置字段作为财务配置字段,否则将所述配置字段作为财务配置字段。
9.一种财务凭证生成设备,其特征在于,所述财务凭证生成设备包括:存储器和至少一个处理器,所述存储器中存储有指令;
所述至少一个处理器调用所述存储器中的所述指令,以使得所述财务凭证生成设备执行如权利要求1-5中任一项所述的财务凭证生成方法。
10.一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-5中任一项所述的财务凭证生成方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011539101.8A CN112528620A (zh) | 2020-12-23 | 2020-12-23 | 财务凭证生成方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011539101.8A CN112528620A (zh) | 2020-12-23 | 2020-12-23 | 财务凭证生成方法、装置、设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112528620A true CN112528620A (zh) | 2021-03-19 |
Family
ID=74975910
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011539101.8A Pending CN112528620A (zh) | 2020-12-23 | 2020-12-23 | 财务凭证生成方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112528620A (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113139373A (zh) * | 2021-04-23 | 2021-07-20 | 上海中通吉网络技术有限公司 | 基于动态建模生成业财凭证的方法、系统及设备 |
CN113313492A (zh) * | 2021-06-24 | 2021-08-27 | 中国农业银行股份有限公司 | 电子凭证的生成方法及相关装置 |
CN113505574A (zh) * | 2021-07-07 | 2021-10-15 | 杭州每刻科技有限公司 | 一种动态凭证配置方法和系统 |
CN114004198A (zh) * | 2021-10-29 | 2022-02-01 | 土巴兔集团股份有限公司 | 凭证生成方法以及相关装置 |
CN114462982A (zh) * | 2022-04-12 | 2022-05-10 | 滨州市社会保险事业中心 | 一种财务凭证自动生成方法及装置、电子设备及存储介质 |
CN115239338A (zh) * | 2022-08-01 | 2022-10-25 | 中科泰岳(北京)科技有限公司 | 一种数据自动上传的业财一体化收费系统 |
-
2020
- 2020-12-23 CN CN202011539101.8A patent/CN112528620A/zh active Pending
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113139373A (zh) * | 2021-04-23 | 2021-07-20 | 上海中通吉网络技术有限公司 | 基于动态建模生成业财凭证的方法、系统及设备 |
CN113313492A (zh) * | 2021-06-24 | 2021-08-27 | 中国农业银行股份有限公司 | 电子凭证的生成方法及相关装置 |
CN113505574A (zh) * | 2021-07-07 | 2021-10-15 | 杭州每刻科技有限公司 | 一种动态凭证配置方法和系统 |
CN114004198A (zh) * | 2021-10-29 | 2022-02-01 | 土巴兔集团股份有限公司 | 凭证生成方法以及相关装置 |
CN114462982A (zh) * | 2022-04-12 | 2022-05-10 | 滨州市社会保险事业中心 | 一种财务凭证自动生成方法及装置、电子设备及存储介质 |
CN114462982B (zh) * | 2022-04-12 | 2022-07-01 | 滨州市社会保险事业中心 | 一种财务凭证自动生成方法及装置、电子设备及存储介质 |
CN115239338A (zh) * | 2022-08-01 | 2022-10-25 | 中科泰岳(北京)科技有限公司 | 一种数据自动上传的业财一体化收费系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112528620A (zh) | 财务凭证生成方法、装置、设备及存储介质 | |
WO2022134588A1 (zh) | 信息审核分类模型的构建方法和信息审核方法 | |
US11663654B2 (en) | System and method for processing transaction records for users | |
US6021202A (en) | Method and system for processing electronic documents | |
CN111475513B (zh) | 表单生成方法、装置、电子设备及介质 | |
AU2019349581B2 (en) | Method and system for user data driven financial transaction description dictionary construction | |
CN106776897B (zh) | 一种用户画像标签确定方法及装置 | |
JP2022506866A (ja) | トレーニングセットとして用いる文書からの機密データの除去 | |
US20220067365A1 (en) | System and method for domain aware document classification and information extraction from consumer documents | |
JP2008262601A (ja) | 金融詐欺リスクを分散方式で評価する分散型リスク評価システムおよび方法 | |
WO2019246294A1 (en) | Methods, devices and systems for data augmentation to improve fraud detection | |
CN112528616B (zh) | 业务表单生成方法、装置、电子设备及计算机存储介质 | |
EP3526684A1 (en) | System and method for identification of missing data elements in electronic documents | |
US20220129688A1 (en) | Content extraction based on graph modeling | |
CN113064973A (zh) | 文本分类方法、装置、设备及存储介质 | |
US20220224540A1 (en) | Blockchain Enabled Service Provider System | |
CN113139876A (zh) | 风险模型训练方法、装置、计算机设备及可读存储介质 | |
US20020161710A1 (en) | Document, document processing system and document generating system | |
Karatzoglou et al. | Kernel-based machine learning for fast text mining in R | |
CN110597984A (zh) | 异常行为用户信息的确定方法及装置、存储介质、终端 | |
CN112434506A (zh) | 电子协议签订处理方法、装置、计算机设备及介质 | |
CN111144855A (zh) | 一种业务数据存储方法及装置 | |
US20160162639A1 (en) | Digital image analysis and classification | |
CN116402056A (zh) | 文档信息的处理方法、装置及电子设备 | |
KR20230169538A (ko) | 금융 마이데이터 기반 기계학습을 위한 말뭉치를 이용한 거래 적요 데이터 분석 장치 및 방법과 이를 위한 컴퓨터 프로그램 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |