CN113935723B - 一种基于优化损失的记账凭证生成方法、装置及存储介质 - Google Patents

一种基于优化损失的记账凭证生成方法、装置及存储介质 Download PDF

Info

Publication number
CN113935723B
CN113935723B CN202111546442.2A CN202111546442A CN113935723B CN 113935723 B CN113935723 B CN 113935723B CN 202111546442 A CN202111546442 A CN 202111546442A CN 113935723 B CN113935723 B CN 113935723B
Authority
CN
China
Prior art keywords
accounting
data
payable
tax
processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111546442.2A
Other languages
English (en)
Other versions
CN113935723A (zh
Inventor
黄斌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
CHANJET INFORMATION TECHNOLOGY CO LTD
Original Assignee
CHANJET INFORMATION TECHNOLOGY CO LTD
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by CHANJET INFORMATION TECHNOLOGY CO LTD filed Critical CHANJET INFORMATION TECHNOLOGY CO LTD
Priority to CN202111546442.2A priority Critical patent/CN113935723B/zh
Publication of CN113935723A publication Critical patent/CN113935723A/zh
Application granted granted Critical
Publication of CN113935723B publication Critical patent/CN113935723B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/12Accounting
    • G06Q40/123Tax preparation or submission

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • General Business, Economics & Management (AREA)
  • Evolutionary Computation (AREA)
  • Tourism & Hospitality (AREA)
  • Quality & Reliability (AREA)
  • General Engineering & Computer Science (AREA)
  • Operations Research (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Mathematical Physics (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Technology Law (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Game Theory and Decision Science (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

本发明提出了一种基于优化损失的记账凭证生成方法、装置及存储介质,该方法包括:优化步骤,使用优化的损失函数基于历史数据训练初始化的预测模型得到训练后的优化预测模型;识别步骤,使用所述优化预测模型对日记账数据进行预测分类,得到所述日记账数据的类别;选择步骤,从预置的策略对应关系表中选择与预测得到的日记账数据的类别对应的一处理策略;处理步骤,基于所选择的处理策略对所述日记账数据进行处理生成记账凭证。本发明中对传统的损失函数进行了优化,将n个样本中按照
Figure DEST_PATH_IMAGE001
从小到大排序中的前k个进行方差计算,然后,对于方差值较大的后n‑k的样本,采用
Figure 796427DEST_PATH_IMAGE002
进行计算,提升了整体凭证生成的准确率。

Description

一种基于优化损失的记账凭证生成方法、装置及存储介质
技术领域
本发明涉及人工智能技术领域,具体涉及一种基于优化损失的记账凭证生成方法、装置及存储介质。
背景技术
现有的财务软件处理流程,都在通过RPA、OCR、银企互联等能力自动生成银行日记账,提升整体财务处理效率。而银行日记账,通过人工智能、用户记忆等方法可用于凭证的自动化生成,但在涉及社保、增值税的凭证生成中存在准确率不高的问题。
经过研究发现,导致这种缺陷的主要原因是人工智能软件直接生成记账凭证,由于社保、税费记账规则复杂,难以准确生成,且现有技术中,分类模型没有基于记账数据的特点进行改进,导致分类预测的准确性较差。
且现有技术中,由于没有制定针对社保、缴税记账的具体处理规则,这也导致记账的准确性差,这是现有技术的缺陷。
发明内容
本发明针对上述现有技术中一个或多个技术缺陷,提出了如下技术方案。
一种基于优化损失的记账凭证生成方法,该方法包括:
优化步骤,使用优化的损失函数基于历史数据训练初始化的预测模型得到训练后的优化预测模型;
识别步骤,使用所述优化预测模型对日记账数据进行预测分类,得到所述日记账数据的类别;
选择步骤,从预置的策略对应关系表中选择与预测得到的日记账数据的类别对应的一处理策略;
处理步骤,基于所选择的处理策略对所述日记账数据进行处理生成记账凭证;其 中,所述优化的损失函数
Figure 708620DEST_PATH_IMAGE001
Figure 429451DEST_PATH_IMAGE002
其中,n表示训练样本的个数,
Figure 594853DEST_PATH_IMAGE003
Figure 442854DEST_PATH_IMAGE004
表示样本的真值,
Figure 275681DEST_PATH_IMAGE005
Figure 167414DEST_PATH_IMAGE006
表示样本的预测 值,MIN(,)表示求两个数中的最小的一个,k表示n个样本中按照
Figure 85691DEST_PATH_IMAGE007
从小到大排序 中的前k个,k<n。
更进一步地,在所述选择步骤中,如果日记账数据的类别为社保,则从策略对应关系表中选择社保处理策略,所述社保处理策略为:基于工资表数据确定‘应付职工薪酬—应付社会保险费-单位部分’与‘其他应付款—社会保险费-个人部分’用于生成记账凭证;在所述选择步骤中,如果日记账数据的类别为增值税,则从策略对应关系表中选择增值税处理策略,所述增值税处理策略为:基于日记账数据的缴税金额进行增值税四科目拆分用于生成记账凭证。
更进一步地,在所述处理步骤中,基于社保处理策略对日记账数据的处理为:在日记账数据中查找工资表数据,如果存在工资表数据,则在工资表数据中查找社保总金额是否等于上月社保的单位+个人费用,若是,则按单位+个人自动记账,若否,继续查找社保总金额是否等于本月社保的单位+个人费用,若是则按单位+个人自动记账,若社保总金额不等于上月或本月的社保的单位+个人费用,则以个人部分全额优先、单位部分做差值的方式进行记账,若个人部分超过总金额,则按个人部分为总金额的方式进行记账;若不存在工资表数据,则不进行拆分社保单位部分和个人部分,按民非会计准则,优先匹配‘应付职工薪酬—应付社会保险费’,如果没有该项记录,则自动创建该项记录;在个人部分的处理规则为:优先匹配‘其他应付款-社会保险费’如果有该项,则进行记录,如没有该项,且其他应付款有明细科目的,自动创建此明细科目数据记录,如没有该项,且其他应付款有辅助核算的,则需要用户自己选择数据记录,如没有此项,且其他应付款科目没有明细科目和辅助核算,则使用其他应付款进行记录;在单位部分的处理规则为:按民非会计准则,优先匹配‘应付职工薪酬—应付社会保险费’,如有该项则进行记录,如没有,则自动创建该项记录,然后从数据库获取对方科目及金额,加上上述记录及当前日记账账户对应的科目及金额生成记账凭证。
更进一步地,在所述处理步骤中,基于增值税处理策略对日记账数据的处理为:获取日记账数据的税金总额,按明细金额,查找上月对应的科目贷方发生额,若与四科目合计相等,则按四科目拆分进行记账;若与四科目间的任意组合的合计相等,按对应科目拆分进行记账;如果不相等,则直接计入增值税对应科目,然后从数据库获取对方科目及金额,加上当前日记账账户对应的科目及金额生成记账凭证;所述四科目为:增值税、应交税费—应交城市维护建设税、应交税费-教育费附加和应交税费-应交地方教育附加,所述增值税的项目包括:应交税费-应交增值税-小规模纳税人、应交税费-未交增值税-一般纳税人和应交税费-未交增值税-民非。
本发明还提出了一种基于优化损失的记账凭证生成装置,该装置包括:
优化单元,使用优化的损失函数基于历史数据训练初始化的预测模型得到训练后的优化预测模型;
识别单元,使用所述优化预测模型对日记账数据进行预测分类,得到所述日记账数据的类别;
选择单元,从预置的策略对应关系表中选择与预测得到的日记账数据的类别对应的一处理策略;
处理单元,基于所选择的处理策略对所述日记账数据进行处理生成记账凭证;
其中,所述优化的损失函数
Figure 737384DEST_PATH_IMAGE001
Figure 159138DEST_PATH_IMAGE002
其中,n表示训练样本的个数,
Figure 487351DEST_PATH_IMAGE003
Figure 627345DEST_PATH_IMAGE004
表示样本的真值,
Figure 817149DEST_PATH_IMAGE005
Figure 358989DEST_PATH_IMAGE006
表示样本的预测 值,MIN(,)表示求两个数中的最小的一个,k表示n个样本中按照
Figure 858103DEST_PATH_IMAGE007
从小到大排序 中的前k个,k<n。
更进一步地,在所述选择单元中,如果日记账数据的类别为社保,则从策略对应关系表中选择社保处理策略,所述社保处理策略为:基于工资表数据确定‘应付职工薪酬—应付社会保险费-单位部分’与‘其他应付款—社会保险费-个人部分’用于生成记账凭证;在所述选择单元中,如果日记账数据的类别为增值税,则从策略对应关系表中选择增值税处理策略,所述增值税处理策略为:基于日记账数据的缴税金额进行增值税四科目拆分用于生成记账凭证。
更进一步地,在所述处理单元中,基于社保处理策略对日记账数据的处理为:在日记账数据中查找工资表数据,如果存在工资表数据,则在工资表数据中查找社保总金额是否等于上月社保的单位+个人费用,若是,则按单位+个人自动记账,若否,继续查找社保总金额是否等于本月社保的单位+个人费用,若是则按单位+个人自动记账,若社保总金额不等于上月或本月的社保的单位+个人费用,则以个人部分全额优先、单位部分做差值的方式进行记账,若个人部分超过总金额,则按个人部分为总金额的方式进行记账;若不存在工资表数据,则不进行拆分社保单位部分和个人部分,按民非会计准则,优先匹配‘应付职工薪酬—应付社会保险费’,如果没有该项记录,则自动创建该项记录;在个人部分的处理规则为:优先匹配‘其他应付款-社会保险费’如果有该项,则进行记录,如没有该项,且其他应付款有明细科目的,自动创建此明细科目数据记录,如没有该项,且其他应付款有辅助核算的,则需要用户自己选择数据记录,如没有此项,且其他应付款科目没有明细科目和辅助核算,则使用其他应付款进行记录;在单位部分的处理规则为:按民非会计准则,优先匹配‘应付职工薪酬—应付社会保险费’,如有该项则进行记录,如没有,则自动创建该项记录,然后从数据库获取对方科目及金额,加上上述记录及当前日记账账户对应的科目及金额生成记账凭证。
更进一步地,在所述处理单元中,基于增值税处理策略对日记账数据的处理为:获取日记账数据的税金总额,按明细金额,查找上月对应的科目贷方发生额,若与四科目合计相等,则按四科目拆分进行记账;若与四科目间的任意组合的合计相等,按对应科目拆分进行记账;如果不相等,则直接计入增值税对应科目,然后从数据库获取对方科目及金额,加上当前日记账账户对应的科目及金额生成记账凭证;所述四科目为:增值税、应交税费—应交城市维护建设税、应交税费-教育费附加和应交税费-应交地方教育附加,所述增值税的项目包括:应交税费-应交增值税-小规模纳税人、应交税费-未交增值税-一般纳税人和应交税费-未交增值税-民非。
本发明还提出了一种计算机可读存储介质,所述存储介质上存储有计算机程序代码,当所述计算机程序代码被计算机执行时执行上述之任一的方法。
本发明的技术效果在于:本发明的一种基于优化损失的记账凭证生成方法、装置 及存储介质,该方法包括:优化步骤,使用优化的损失函数基于历史数据训练初始化的预测 模型得到训练后的优化预测模型;识别步骤,使用所述优化预测模型对日记账数据进行预 测分类,得到所述日记账数据的类别;选择步骤,从预置的策略对应关系表中选择与预测得 到的日记账数据的类别对应的一处理策略;处理步骤,基于所选择的处理策略对所述日记 账数据进行处理生成记账凭证。本发明中对传统的损失函数进行了优化,将n个样本中按照
Figure 427273DEST_PATH_IMAGE007
从小到大排序中的前k个进行方差计算,然后,对于方差值较大的后n-k的样本, 采用
Figure 201194DEST_PATH_IMAGE008
进行计算,从而使模型训练的收敛速度较快,泛 化能力较好,训练后的模型不容易过拟合,从而提高了生成记账凭证的准确性,即本发明的 重要发明点是基于账目数据的特点改进了模型训练的损失函数,本发明中,采用优化的损 失函数训练的优化预测模型对日记账明细进行分类预测,得到比较准确的预测结果,而非 直接生成凭证,然后基于记账的类别执行匹配的生成方法,本发明提供为社保、缴税账目提 供具体的执行策略,从而更加准确为该分类基于独立的个性化执行策略生成记账凭证,提 升了整体凭证生成的准确率,这是本发明的另一个重要发明点。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显。
图1是根据本发明的实施例的一种基于优化损失的记账凭证生成方法的流程图。
图2是根据本发明的实施例的一种基于优化损失的记账凭证生成装置的结构图。
具体实施方式
下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
图1示出了本发明的一种基于优化损失的记账凭证生成方法,该方法包括:
优化步骤S101,使用优化的损失函数基于历史数据训练初始化的预测模型得到训练后的优化预测模型;本发明中所使用的网络模型为神经网络模型,比如CNN、LSTM等,神经网络模型初始化时具有初始的参数,比如各权重,但是初始化的模型需要训练才能使用,也就是需要使用历史数据对其进行训练。本发明中的业务现有数据,即历史数据为:每行记录为(日记账摘要信息,对方科目编码、对方科目名称)。
识别步骤S102,使用所述优化预测模型对日记账数据进行预测分类,得到所述日记账数据的类别;
选择步骤S103,从预置的策略对应关系表中选择与预测得到的日记账数据的类别对应的一处理策略;
处理步骤S104,基于所选择的处理策略对所述日记账数据进行处理生成记账凭证。
本发明中使用优化的损失函数对预测模型进行优化训练,相较于非优化的损失函数,训练的收敛速度较快,泛化能力较好,训练后的模型不容易过拟合,从而提高了生成记账凭证的准确性,这是本发明的一个重要发明点。
在一个实施例中,本发明所采用的所述优化的损失函数
Figure 597540DEST_PATH_IMAGE001
Figure 283868DEST_PATH_IMAGE002
其中,n表示训练样本的个数,
Figure 664033DEST_PATH_IMAGE003
Figure 444908DEST_PATH_IMAGE004
表示样本的真值,
Figure 446493DEST_PATH_IMAGE005
Figure 349727DEST_PATH_IMAGE006
表示样本的预测 值,MIN(,)表示求两个数中的最小的一个,k表示n个样本中按照
Figure 686030DEST_PATH_IMAGE007
从小到大排序 中的前k个,k<n。
传统的机器学习采用的损失函数为:
Figure 21328DEST_PATH_IMAGE009
,n表示训练样本的 个数,本发明中对传统的损失函数进行了优化,将n个样本中按照
Figure 126687DEST_PATH_IMAGE007
从小到大排序 中的前k个进行方差计算,然后,对于方差值较大的后n-k的样本,采用
Figure 138505DEST_PATH_IMAGE008
进行计算,从而使模型训练的收敛速度较快,泛化能 力较好,训练后的模型不容易过拟合,从而提高了生成记账凭证的准确性,即本发明的重要 发明点是基于账目数据的特点改进了模型训练的损失函数,这是本发明的一个重要发明 点。
在一个实施例中,在所述选择步骤S103中,如果日记账数据的类别为社保,则从策略对应关系表中选择社保处理策略,所述社保处理策略为:基于工资表数据确定‘应付职工薪酬—应付社会保险费-单位部分’与‘其他应付款—社会保险费-个人部分’用于生成记账凭证;在所述选择步骤中,如果日记账数据的类别为增值税,则从策略对应关系表中选择增值税处理策略,所述增值税处理策略为:基于日记账数据的缴税金额进行增值税四科目拆分用于生成记账凭证。
本发明中,采用优化的损失函数训练的优化预测模型对日记账明细进行分类预测,得到比较准确的预测结果,而非直接生成凭证,然后基于记账的类别执行匹配的生成方法,本发明提供为社保、缴税账目提供具体的执行策略,从而更加准确为该分类基于独立的个性化执行策略生成记账凭证,提升了整体凭证生成的准确率,这是本发明的另一个重要发明点。
在一个实施例中,在所述处理步骤S104中,基于社保处理策略对日记账数据的处理为:在日记账数据中查找工资表数据,如果存在工资表数据,则在工资表数据中查找社保总金额是否等于上月社保的单位+个人费用,若是,则按单位+个人自动记账,若否,继续查找社保总金额是否等于本月社保的单位+个人费用,若是则按单位+个人自动记账,若社保总金额不等于上月或本月的社保的单位+个人费用,则以个人部分全额优先、单位部分做差值的方式进行记账,若个人部分超过总金额,则按个人部分为总金额的方式进行记账;若不存在工资表数据,则不进行拆分社保单位部分和个人部分,按民非会计准则,优先匹配‘应付职工薪酬—应付社会保险费’,如果没有该项记录,则自动创建该项记录;在个人部分的处理规则为:优先匹配‘其他应付款-社会保险费’如果有该项,则进行记录,如没有该项,且其他应付款有明细科目的,自动创建此明细科目数据记录,如没有该项,且其他应付款有辅助核算的,则需要用户自己选择数据记录,如没有此项,且其他应付款科目没有明细科目和辅助核算,则使用其他应付款进行记录;在单位部分的处理规则为:按民非会计准则,优先匹配‘应付职工薪酬—应付社会保险费’,如有该项则进行记录,如没有,则自动创建该项记录,然后从数据库获取对方科目及金额,加上上述记录及当前日记账账户对应的科目及金额生成记账凭证。
本发明中,设计了具体的社保记账凭证生成的处理策略,解决了现有技术中由于社保记账较为复杂,难以自动生成记账凭证的缺陷,这是本发明的另一个重要发明点。
在一个实施例中,在所述处理步骤S104中,基于增值税处理策略对日记账数据的处理为:获取日记账数据的税金总额,按明细金额,查找上月对应的科目贷方发生额,若与四科目合计相等,则按四科目拆分进行记账;若与四科目间的任意组合的合计相等,按对应科目拆分进行记账;如果不相等,则直接计入增值税对应科目,然后从数据库获取对方科目及金额,加上当前日记账账户对应的科目及金额生成记账凭证;所述四科目为:增值税、应交税费—应交城市维护建设税、应交税费-教育费附加和应交税费-应交地方教育附加,所述增值税的项目包括:应交税费-应交增值税-小规模纳税人、应交税费-未交增值税-一般纳税人和应交税费-未交增值税-民非。
本发明中,设计了具体的缴税记账凭证生成的处理策略,解决了现有技术中由于社保记账较为复杂,难以自动生成记账凭证的缺陷,这是本发明的另一个重要发明点。
图2示出了本发明的一种基于优化损失的记账凭证生成装置,该装置包括:
优化单元201,使用优化的损失函数基于历史数据训练初始化的预测模型得到训练后的优化预测模型;本发明中所使用的网络模型为神经网络模型,比如CNN、LSTM等,神经网络模型初始化时具有初始的参数,比如各权重,但是初始化的模型需要训练才能使用,也就是需要使用历史数据对其进行训练。本发明中的业务现有数据,即历史数据为:每行记录为(日记账摘要信息,对方科目编码、对方科目名称)。
识别单元202,使用所述优化预测模型对日记账数据进行预测分类,得到所述日记账数据的类别;
选择单元203,从预置的策略对应关系表中选择与预测得到的日记账数据的类别对应的一处理策略;
处理单元204,基于所选择的处理策略对所述日记账数据进行处理生成记账凭证。
本发明中使用优化的损失函数对预测模型进行优化训练,相较于非优化的损失函数,训练的收敛速度较快,泛化能力较好,训练后的模型不容易过拟合,从而提高了生成记账凭证的准确性,这是本发明的一个重要发明点。
在一个实施例中,本发明所采用的所述优化的损失函数
Figure 520027DEST_PATH_IMAGE001
Figure 908283DEST_PATH_IMAGE002
其中,n表示训练样本的个数,
Figure 133728DEST_PATH_IMAGE003
Figure 67180DEST_PATH_IMAGE004
表示样本的真值,
Figure 643655DEST_PATH_IMAGE005
Figure 570023DEST_PATH_IMAGE006
表示样本的预测 值,MIN(,)表示求两个数中的最小的一个,k表示n个样本中按照
Figure 649974DEST_PATH_IMAGE007
从小到大排序 中的前k个,k<n。
传统的机器学习采用的损失函数为:
Figure 266245DEST_PATH_IMAGE009
,n表示训练样本的 个数,本发明中对传统的损失函数进行了优化,将n个样本中按照
Figure 64436DEST_PATH_IMAGE007
从小到大排序 中的前k个进行方差计算,然后,对于方差值较大的后n-k的样本,采用
Figure 60074DEST_PATH_IMAGE008
进行计算,从而使模型训练的收敛速度较快,泛化能 力较好,训练后的模型不容易过拟合,从而提高了生成记账凭证的准确性,即本发明的重要 发明点是基于账目数据的特点改进了模型训练的损失函数,这是本发明的一个重要发明 点。
在一个实施例中,在所述选择单元203中,如果日记账数据的类别为社保,则从策略对应关系表中选择社保处理策略,所述社保处理策略为:基于工资表数据确定‘应付职工薪酬—应付社会保险费-单位部分’与‘其他应付款—社会保险费-个人部分’用于生成记账凭证;在所述选择步骤中,如果日记账数据的类别为增值税,则从策略对应关系表中选择增值税处理策略,所述增值税处理策略为:基于日记账数据的缴税金额进行增值税四科目拆分用于生成记账凭证。
本发明中,采用优化的损失函数训练的优化预测模型对日记账明细进行分类预测,得到比较准确的预测结果,而非直接生成凭证,然后基于记账的类别执行匹配的生成方法,本发明提供为社保、缴税账目提供具体的执行策略,从而更加准确为该分类基于独立的个性化执行策略生成记账凭证,提升了整体凭证生成的准确率,这是本发明的另一个重要发明点。
在一个实施例中,在所述处理单元204中,基于社保处理策略对日记账数据的处理为:在日记账数据中查找工资表数据,如果存在工资表数据,则在工资表数据中查找社保总金额是否等于上月社保的单位+个人费用,若是,则按单位+个人自动记账,若否,继续查找社保总金额是否等于本月社保的单位+个人费用,若是则按单位+个人自动记账,若社保总金额不等于上月或本月的社保的单位+个人费用,则以个人部分全额优先、单位部分做差值的方式进行记账,若个人部分超过总金额,则按个人部分为总金额的方式进行记账;若不存在工资表数据,则不进行拆分社保单位部分和个人部分,按民非会计准则,优先匹配‘应付职工薪酬—应付社会保险费’,如果没有该项记录,则自动创建该项记录;在个人部分的处理规则为:优先匹配‘其他应付款-社会保险费’如果有该项,则进行记录,如没有该项,且其他应付款有明细科目的,自动创建此明细科目数据记录,如没有该项,且其他应付款有辅助核算的,则需要用户自己选择数据记录,如没有此项,且其他应付款科目没有明细科目和辅助核算,则使用其他应付款进行记录;在单位部分的处理规则为:按民非会计准则,优先匹配‘应付职工薪酬—应付社会保险费’,如有该项则进行记录,如没有,则自动创建该项记录,然后从数据库获取对方科目及金额,加上上述记录及当前日记账账户对应的科目及金额生成记账凭证。
本发明中,设计了具体的社保记账凭证生成的处理策略,解决了现有技术中由于社保记账较为复杂,难以自动生成记账凭证的缺陷,这是本发明的另一个重要发明点。
在一个实施例中,在所述处理单元204中,基于增值税处理策略对日记账数据的处理为:获取日记账数据的税金总额,按明细金额,查找上月对应的科目贷方发生额,若与四科目合计相等,则按四科目拆分进行记账;若与四科目间的任意组合的合计相等,按对应科目拆分进行记账;如果不相等,则直接计入增值税对应科目,然后从数据库获取对方科目及金额,加上当前日记账账户对应的科目及金额生成记账凭证;所述四科目为:增值税、应交税费—应交城市维护建设税、应交税费-教育费附加和应交税费-应交地方教育附加,所述增值税的项目包括:应交税费-应交增值税-小规模纳税人、应交税费-未交增值税-一般纳税人和应交税费-未交增值税-民非。
本发明中,设计了具体的缴税记账凭证生成的处理策略,解决了现有技术中由于社保记账较为复杂,难以自动生成记账凭证的缺陷,这是本发明的另一个重要发明点。
本发明一个实施例中提出了一种基于优化损失的记账凭证生成设备,所述设备包括处理器和存储器,所述处理器与所述处理器通过总线连接,所述存储器上存储有计算机程序,所述处理器执行所述存储器上的计算机程序时实现上述的方法,该设备可以是台式计算机、服务器、笔记本、智能终端等等。
本发明一个实施例中提出了一种计算机存储介质,所述计算机存储介质上存储有计算机程序,当所述计算机存储介质上的计算机程序被处理器执行时实现上述的方法,该计算机存储介质可以是硬盘、DVD、CD、闪存等等存储器。
本发明的为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本申请时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本申请可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例或者实施例的某些部分所述的装置。
最后所应说明的是:以上实施例仅以说明而非限制本发明的技术方案,尽管参照上述实施例对本发明进行了详细说明,本领域的普通技术人员应当理解:依然可以对本发明进行修改或者等同替换,而不脱离本发明的精神和范围的任何修改或局部替换,其均应涵盖在本发明的权利要求范围当中。

Claims (9)

1.一种基于优化损失的记账凭证生成方法,其特征在于,该方法包括:
优化步骤,使用优化的损失函数基于历史数据训练初始化的预测模型得到训练后的优化预测模型;
识别步骤,使用所述优化预测模型对日记账数据进行预测分类,得到所述日记账数据的类别;
选择步骤,从预置的策略对应关系表中选择与预测得到的日记账数据的类别对应的一处理策略;
处理步骤,基于所选择的处理策略对所述日记账数据进行处理生成记账凭证;其中,所述优化的损失函数为:
Figure 592129DEST_PATH_IMAGE002
其中,n表示训练样本的个数,
Figure DEST_PATH_IMAGE003
Figure 696220DEST_PATH_IMAGE004
表示样本的真值,
Figure DEST_PATH_IMAGE005
Figure 413640DEST_PATH_IMAGE006
表示样本的预测值, MIN(,)表示求两个数中的最小的一个,k表示n个样本中按照
Figure DEST_PATH_IMAGE007
从小到大排序中的 前k个,k<n。
2.根据权利要求1所述的方法,其特征在于,在所述选择步骤中,如果日记账数据的类别为社保,则从策略对应关系表中选择社保处理策略,所述社保处理策略为:基于工资表数据确定‘应付职工薪酬—应付社会保险费-单位部分’与‘其他应付款—社会保险费-个人部分’用于生成记账凭证;在所述选择步骤中,如果日记账数据的类别为增值税,则从策略对应关系表中选择增值税处理策略,所述增值税处理策略为:基于日记账数据的缴税金额进行增值税四科目拆分用于生成记账凭证。
3.根据权利要求2所述的方法,其特征在于,在所述处理步骤中,基于社保处理策略对日记账数据的处理为:在日记账数据中查找工资表数据,如果存在工资表数据,则在工资表数据中查找社保总金额是否等于上月社保的单位+个人费用,若是,则按单位+个人自动记账,若否,继续查找社保总金额是否等于本月社保的单位+个人费用,若是则按单位+个人自动记账,若社保总金额不等于上月或本月的社保的单位+个人费用,则以个人部分全额优先、单位部分做差值的方式进行记账,若个人部分超过总金额,则按个人部分为总金额的方式进行记账;若不存在工资表数据,则不进行拆分社保单位部分和个人部分,按民非会计准则,优先匹配‘应付职工薪酬—应付社会保险费’,如果没有该项记录,则自动创建该项记录;在个人部分的处理规则为:优先匹配‘其他应付款-社会保险费’如果有该项,则进行记录,如没有该项,且其他应付款有明细科目的,自动创建此明细科目数据记录,如没有该项,且其他应付款有辅助核算的,则需要用户自己选择数据记录,如没有此项,且其他应付款科目没有明细科目和辅助核算,则使用其他应付款进行记录;在单位部分的处理规则为:按民非会计准则,优先匹配‘应付职工薪酬—应付社会保险费’,如有该项则进行记录,如没有,则自动创建该项记录,然后从数据库获取对方科目及金额,加上上述记录及当前日记账账户对应的科目及金额生成记账凭证。
4.根据权利要求2所述的方法,其特征在于,在所述处理步骤中,基于增值税处理策略对日记账数据的处理为:获取日记账数据的税金总额,按明细金额,查找上月对应的科目贷方发生额,若与四科目合计相等,则按四科目拆分进行记账;若与四科目间的任意组合的合计相等,按对应科目拆分进行记账;如果不相等,则直接计入增值税对应科目,然后从数据库获取对方科目及金额,加上当前日记账账户对应的科目及金额生成记账凭证;所述四科目为:增值税、应交税费—应交城市维护建设税、应交税费-教育费附加和应交税费-应交地方教育附加,所述增值税的项目包括:应交税费-应交增值税-小规模纳税人、应交税费-未交增值税-一般纳税人和应交税费-未交增值税-民非。
5.一种基于优化损失的记账凭证生成装置,其特征在于,该装置包括:
优化单元,使用优化的损失函数基于历史数据训练初始化的预测模型得到训练后的优化预测模型;
识别单元,使用所述优化预测模型对日记账数据进行预测分类,得到所述日记账数据的类别;
选择单元,从预置的策略对应关系表中选择与预测得到的日记账数据的类别对应的一处理策略;
处理单元,基于所选择的处理策略对所述日记账数据进行处理生成记账凭证;
其中,所述优化的损失函数为:
Figure 12112DEST_PATH_IMAGE008
其中,n表示训练样本的个数,
Figure 40199DEST_PATH_IMAGE003
Figure 331503DEST_PATH_IMAGE004
表示样本的真值,
Figure 67378DEST_PATH_IMAGE005
Figure 699DEST_PATH_IMAGE006
表示样本的预测值, MIN(,)表示求两个数中的最小的一个,k表示n个样本中按照
Figure 387686DEST_PATH_IMAGE007
从小到大排序中的 前k个,k<n。
6.根据权利要求5所述的装置,其特征在于,在所述选择单元中,如果日记账数据的类别为社保,则从策略对应关系表中选择社保处理策略,所述社保处理策略为:基于工资表数据确定‘应付职工薪酬—应付社会保险费-单位部分’与‘其他应付款—社会保险费-个人部分’用于生成记账凭证;在所述选择单元中,如果日记账数据的类别为增值税,则从策略对应关系表中选择增值税处理策略,所述增值税处理策略为:基于日记账数据的缴税金额进行增值税四科目拆分用于生成记账凭证。
7.根据权利要求6所述的装置,其特征在于,在所述处理单元中,基于社保处理策略对日记账数据的处理为:在日记账数据中查找工资表数据,如果存在工资表数据,则在工资表数据中查找社保总金额是否等于上月社保的单位+个人费用,若是,则按单位+个人自动记账,若否,继续查找社保总金额是否等于本月社保的单位+个人费用,若是则按单位+个人自动记账,若社保总金额不等于上月或本月的社保的单位+个人费用,则以个人部分全额优先、单位部分做差值的方式进行记账,若个人部分超过总金额,则按个人部分为总金额的方式进行记账;若不存在工资表数据,则不进行拆分社保单位部分和个人部分,按民非会计准则,优先匹配‘应付职工薪酬—应付社会保险费’,如果没有该项记录,则自动创建该项记录;在个人部分的处理规则为:优先匹配‘其他应付款-社会保险费’如果有该项,则进行记录,如没有该项,且其他应付款有明细科目的,自动创建此明细科目数据记录,如没有该项,且其他应付款有辅助核算的,则需要用户自己选择数据记录,如没有此项,且其他应付款科目没有明细科目和辅助核算,则使用其他应付款进行记录;在单位部分的处理规则为:按民非会计准则,优先匹配‘应付职工薪酬—应付社会保险费’,如有该项则进行记录,如没有,则自动创建该项记录,然后从数据库获取对方科目及金额,加上上述记录及当前日记账账户对应的科目及金额生成记账凭证。
8.根据权利要求7所述的装置,其特征在于,在所述处理单元中,基于增值税处理策略对日记账数据的处理为:获取日记账数据的税金总额,按明细金额,查找上月对应的科目贷方发生额,若与四科目合计相等,则按四科目拆分进行记账;若与四科目间的任意组合的合计相等,按对应科目拆分进行记账;如果不相等,则直接计入增值税对应科目,然后从数据库获取对方科目及金额,加上当前日记账账户对应的科目及金额生成记账凭证;所述四科目为:增值税、应交税费—应交城市维护建设税、应交税费-教育费附加和应交税费-应交地方教育附加,所述增值税的项目包括:应交税费-应交增值税-小规模纳税人、应交税费-未交增值税-一般纳税人和应交税费-未交增值税-民非。
9.一种计算机存储介质,其特征在于,所述计算机存储介质上存储有计算机程序,当所述计算机存储介质上的计算机程序被处理器执行时实现权利要求1-4任一项所述的方法。
CN202111546442.2A 2021-12-17 2021-12-17 一种基于优化损失的记账凭证生成方法、装置及存储介质 Active CN113935723B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111546442.2A CN113935723B (zh) 2021-12-17 2021-12-17 一种基于优化损失的记账凭证生成方法、装置及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111546442.2A CN113935723B (zh) 2021-12-17 2021-12-17 一种基于优化损失的记账凭证生成方法、装置及存储介质

Publications (2)

Publication Number Publication Date
CN113935723A CN113935723A (zh) 2022-01-14
CN113935723B true CN113935723B (zh) 2022-02-25

Family

ID=79289191

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111546442.2A Active CN113935723B (zh) 2021-12-17 2021-12-17 一种基于优化损失的记账凭证生成方法、装置及存储介质

Country Status (1)

Country Link
CN (1) CN113935723B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116128668B (zh) * 2023-04-04 2023-07-21 畅捷通信息技术股份有限公司 一种匹配银行凭证科目的方法、系统及计算机存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110119977A (zh) * 2019-05-10 2019-08-13 极智(上海)企业管理咨询有限公司 财务记账凭证自动生成方法、系统、介质和电子设备
CN110517130A (zh) * 2019-09-04 2019-11-29 厦门商集网络科技有限责任公司 一种智能记账方法及其系统
CN111652703A (zh) * 2020-06-04 2020-09-11 策拉人工智能科技(云南)有限公司 一种人工智能会计自动记账、报税的方法及系统
CN111861690A (zh) * 2020-07-23 2020-10-30 金蝶软件(中国)有限公司 账务数据核对方法及账务数据核对装置
CN112529680A (zh) * 2021-01-07 2021-03-19 信阳农林学院 一种财务数据处理系统

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050086135A1 (en) * 2003-10-20 2005-04-21 Li-Chin Lu Automatic bookkeeping system
US11741511B2 (en) * 2020-02-03 2023-08-29 Intuit Inc. Systems and methods of business categorization and service recommendation

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110119977A (zh) * 2019-05-10 2019-08-13 极智(上海)企业管理咨询有限公司 财务记账凭证自动生成方法、系统、介质和电子设备
CN110517130A (zh) * 2019-09-04 2019-11-29 厦门商集网络科技有限责任公司 一种智能记账方法及其系统
CN111652703A (zh) * 2020-06-04 2020-09-11 策拉人工智能科技(云南)有限公司 一种人工智能会计自动记账、报税的方法及系统
CN111861690A (zh) * 2020-07-23 2020-10-30 金蝶软件(中国)有限公司 账务数据核对方法及账务数据核对装置
CN112529680A (zh) * 2021-01-07 2021-03-19 信阳农林学院 一种财务数据处理系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
The C-loss function for pattern classification;Abhishek Singh等;《Pattern Recognition》;20140131;第441--453页 *

Also Published As

Publication number Publication date
CN113935723A (zh) 2022-01-14

Similar Documents

Publication Publication Date Title
US11687937B1 (en) Reducing false positives using customer data and machine learning
US8060423B1 (en) Method and system for automatic categorization of financial transaction data based on financial data from similarly situated users
CN111699486A (zh) 一种记账方法、会计核算系统、账户系统及支付系统
US20080294547A1 (en) Systems and methods for establishing business credit and improving personal credit
WO2009065134A1 (en) Method for deal-based pricing and estimation of deal winning probability using multiple prospective models
CN114119137A (zh) 风险控制方法和装置
US10984446B1 (en) Method and system for predicting relevant offerings for users of data management systems using machine learning processes
US20150161741A1 (en) Automatic determination of periodic payments based on transaction information
CN111080338A (zh) 用户数据的处理方法、装置、电子设备及存储介质
US11587148B2 (en) Item level data determination device, method, and non-transitory computer-readable media
US20210201316A1 (en) Multi-layered credit card with transaction-dependent source selection
CN113935723B (zh) 一种基于优化损失的记账凭证生成方法、装置及存储介质
Hu Predicting and improving invoice-to-cash collection through machine learning
KR20180023603A (ko) 대출 중개 시스템 및 이에 이용되는 중개 서버
US20230316284A1 (en) Reducing false positives using customer data and machine learning
TWI530901B (zh) 自動化財務管理診斷方法及其系統
US20230088840A1 (en) Dynamic assessment of cryptocurrency transactions and technology adaptation metrics
CN113888143B (zh) 一种对账单数据处理方法、装置及存储介质
CN114493822A (zh) 一种基于迁移学习的用户违约预测定价方法和系统
US8219504B1 (en) Method and system for estimating the actual cost of a product or service using financial data
TW200411457A (en) Notes receivable management system and method
KR102547073B1 (ko) 메디칼 세무 회계 리스크 관리가 가능한 자동 장부 서비스의 제공 장치 및 방법
US20230040705A1 (en) Risk management network
US20240070779A1 (en) Data mapping method and system
US20240169355A1 (en) Settlement card having locked-in card specific merchant and rule-based authorization for each transaction

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant