CN117911179A - 一种财税数据审核方法及系统 - Google Patents

一种财税数据审核方法及系统 Download PDF

Info

Publication number
CN117911179A
CN117911179A CN202410099211.9A CN202410099211A CN117911179A CN 117911179 A CN117911179 A CN 117911179A CN 202410099211 A CN202410099211 A CN 202410099211A CN 117911179 A CN117911179 A CN 117911179A
Authority
CN
China
Prior art keywords
data
financial
tax data
audited
financial tax
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202410099211.9A
Other languages
English (en)
Inventor
屠磊
张明德
刘宁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Chile Payroll Technology Service Co ltd
Original Assignee
China Chile Payroll Technology Service Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Chile Payroll Technology Service Co ltd filed Critical China Chile Payroll Technology Service Co ltd
Priority to CN202410099211.9A priority Critical patent/CN117911179A/zh
Publication of CN117911179A publication Critical patent/CN117911179A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/12Accounting
    • G06Q40/123Tax preparation or submission
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/215Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/31Indexing; Data structures therefor; Storage structures
    • G06F16/313Selection or weighting of terms for indexing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/10Machine learning using kernel methods, e.g. support vector machines [SVM]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/20Ensemble learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • G06Q10/103Workflow collaboration or project management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/12Accounting
    • G06Q40/125Finance or payroll

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Marketing (AREA)
  • Human Resources & Organizations (AREA)
  • Development Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Mathematical Physics (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Computing Systems (AREA)
  • Databases & Information Systems (AREA)
  • Economics (AREA)
  • Quality & Reliability (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Technology Law (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Operations Research (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Tourism & Hospitality (AREA)
  • General Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

本发明公开了一种财税数据审核方法及系统,方法包括:首先获取待审核财税数据和待审核财税数据对应的至少一条验证数据,然后基于至少一条验证数据计算待审核财税数据的属性特征值,利用基于预设训练方法训练的财税数据审核模型,并根据属性特征值来获取待审核财税数据的目标审核结果。它能够利用基于人工智能的财税数据审核模型来获取待审核财税数据的审核结果,有助于企业及时发现和纠正财税数据问题,提高处理效率。

Description

一种财税数据审核方法及系统
技术领域
本发明属于数据处理技术领域,特别是一种财税数据审核方法及系统。
背景技术
财税数据是指与财务和税务相关的数据,包括但不限于财务报表、税务申报数据、发票和凭证等。这些数据反映了企业的经济活动和经营状况,是企业经营管理的重要依据。财税数据的处理和分析对于企业的财务管理和税务管理非常重要,通过对财税数据的分析,企业可以了解自身的经营状况,评估财务风险和税务风险,制定合理的财务和税务策略。同时,财税数据也是企业向外部机构证明自身实力和信誉的重要依据。
财税数据审核是指对企业的财务和税务数据进行审查和核实,以确保数据的真实、准确和合规性。财税数据审核是财务管理和税务管理中的重要环节,有助于企业及时发现和纠正财务和税务问题,保障企业的合规经营和良好信誉。传统的财税数据审核主要依靠人工审查,这种方法既耗时又耗力,而且容易出错,在处理大量数据时,效率问题更加突出,这成为急需解决的技术问题。
发明内容
本发明的目的是提供一种财税数据审核方法及系统,以解决现有技术中的不足,它能够利用基于人工智能的财税数据审核模型来获取待审核财税数据的审核结果,有助于企业及时发现和纠正财税数据问题,提高处理效率。
本申请的一个实施例提供了一种财税数据审核方法,所述方法包括:
获取待审核财税数据和所述待审核财税数据对应的至少一条验证数据,其中,所述待审核财税数据包括财税数据待审核项的属性数据,所述至少一条验证数据用于验证所述属性数据;
基于所述至少一条验证数据计算所述待审核财税数据的属性特征值;
利用基于预设训练方法训练的财税数据审核模型,并根据所述属性特征值来获取待审核财税数据的目标审核结果。
可选的,所述获取待审核财税数据和所述待审核财税数据对应的至少一条验证数据之后,所述方法还包括:
对获取到的所述待审核财税数据进行信息提取,并根据提取到的信息构建目标矩阵,其中,所述目标矩阵的列向量和行向量分别用于表示待审核财税数据的属性数据和验证数据。
可选的,所述基于所述至少一条验证数据计算所述待审核财税数据的属性特征值,包括:
将所述验证数据输入数据处理模块生成结构化数据,其中,所述数据处理模块基于Word2Vec构成;
对所述结构化数据进行预处理,并将预处理后的结果数据输入到数据计算模块中,以输出所述待审核财税数据的属性特征值,其中,所述数据计算模块基于集成学习算法模型构成。
可选的,所述财税数据审核模型包括根据若干财税数据集并基于所述预设训练方法训练得到的,所述财税数据集包括预设数量的财税数据审核结果为审核合格的样本企业的财税数据,所述预设训练方法包括神经网络算法、随机森林算法、支持向量机算法中的一种或多种。
可选的,所述财税数据审核模型的目标函数,包括:
通过以下算式表示财税数据审核模型的目标函数:
其中,f(x)表示财税数据审核模型的目标函数,C表示预设常数,M表示样本数量,L(h(xi))表示预设损失函数,h(xi)表示财税数据审核模型的预测值,xi表示第i个样本的属性特征值。
可选的,所述利用基于预设训练方法训练的财税数据审核模型,并根据所述属性特征值来获取待审核财税数据的目标审核结果之后,所述方法还包括:
获取待审核财税数据的人工复核结果,其中,所述人工复核结果包括所述待审核财税数据的标签;
将所述人工复核结果作为样本、将所述标签作为所述样本的标签,对应添加至所述财税数据审核模型的财税数据集,以实现对所述财税数据审核模型的财税数据集进行更新;
基于更新后的所述财税数据审核模型的财税数据集,对所述财税数据审核模型进行迭代,以对所述财税数据审核模型进行在线更新。
本申请的又一实施例提供了一种财税数据审核系统,所述系统包括:
第一获取模块,用于获取待审核财税数据和所述待审核财税数据对应的至少一条验证数据,其中,所述待审核财税数据包括财税数据待审核项的属性数据,所述至少一条验证数据用于验证所述属性数据;
计算模块,用于基于所述至少一条验证数据计算所述待审核财税数据的属性特征值;
第二获取模块,用于利用基于预设训练方法训练的财税数据审核模型,并根据所述属性特征值来获取待审核财税数据的目标审核结果。
可选的,所述第一获取模块之后,所述系统还包括:
提取模块,用于对获取到的所述待审核财税数据进行信息提取,并根据提取到的信息构建目标矩阵,其中,所述目标矩阵的列向量和行向量分别用于表示待审核财税数据的属性数据和验证数据。
本申请的又一实施例提供了一种存储介质,所述存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时实现上述任一项所述的方法。
本申请的又一实施例提供了一种电子设备,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以实现上述任一项所述的方法。
与现有技术相比,本发明首先获取待审核财税数据和待审核财税数据对应的至少一条验证数据,然后基于至少一条验证数据计算待审核财税数据的属性特征值,利用基于预设训练方法训练的财税数据审核模型,并根据属性特征值来获取待审核财税数据的目标审核结果。它能够利用基于人工智能的财税数据审核模型来获取待审核财税数据的审核结果,有助于企业及时发现和纠正财税数据问题,提高处理效率。
附图说明
图1为本发明实施例提供的一种财税数据审核方法的计算机终端的硬件结构框图;
图2为本发明实施例提供的一种财税数据审核方法的流程示意图;
图3为本发明实施例提供的一种财税数据审核系统的结构示意图。
具体实施方式
下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能解释为对本发明的限制。
本发明实施例首先提供了一种财税数据审核方法,该方法可以应用于电子设备,如计算机终端,具体如普通电脑、量子计算机等。
下面以运行在计算机终端上为例对其进行详细说明。图1为本发明实施例提供的一种财税数据审核方法的计算机终端的硬件结构框图。如图1所示,计算机终端可以包括一个或多个(图1中仅示出一个)处理器102(处理器102可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)和用于存储数据的存储器104,可选地,上述计算机终端还可以包括用于通信功能的传输装置106以及输入输出设备108。本领域普通技术人员可以理解,图1所示的结构仅为示意,其并不对上述计算机终端的结构造成限定。例如,计算机终端还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。
存储器104可用于存储应用软件的软件程序以及模块,如本申请实施例中的财税数据审核方法对应的程序指令/模块,处理器102通过运行存储在存储器104内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的方法。存储器104可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器104可进一步包括相对于处理器102远程设置的存储器,这些远程存储器可以通过网络连接至计算机终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
传输装置106用于经由一个网络接收或者发送数据。上述的网络具体实例可包括计算机终端的通信供应商提供的无线网络。在一个实例中,传输装置106包括一个网络适配器(Network Interface Controller,NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输装置106可以为射频(Radio Frequency,RF)模块,其用于通过无线方式与互联网进行通讯。
审核财税数据是确保企业财务报告和税务申报准确性的重要过程。它涉及对财务报表、税务申报表以及其他相关文件进行仔细的审查和核对,以确保所有的数据、信息和披露都符合会计准则、税法和其他相关法规的要求。
参见图2,图2为本发明实施例提供的一种财税数据审核方法的流程示意图,可以包括如下步骤:
S201:获取待审核财税数据和所述待审核财税数据对应的至少一条验证数据,其中,所述待审核财税数据包括财税数据待审核项的属性数据,所述至少一条验证数据用于验证所述属性数据。
在获取待审核财税数据和对应的验证数据时,可以首先确定待审核财税数据的范围和内容,明确需要审核的财税数据项,可以包括财务报表、税务申报表以及其他相关文件。然后从可靠来源获取与待审核财税数据相关的验证数据,例如验证数据可以证明待审核财税数据的准确性和合规性,将待审核财税数据与收集到的验证数据进行匹配和整理,确保两者之间有明确的对应关系。从待审核财税数据中提取出属性数据,并与验证数据进行对比和分析,属性数据可以是财务报表中的特定指标、税务申报表中的特定税项等。通过对比和分析,验证待审核财税数据的属性数据是否符合会计准则、税法和其他相关法规的要求,以及是否与验证数据一致。将审核过程和结果进行记录,并生成相应的报告,报告中应包括待审核财税数据的属性数据、验证数据的对比分析结果以及任何发现的问题和建议。最后根据审核结果和报告,对财务管理和税务管理流程进行持续改进,提高数据质量和审核水平。在整个过程中,需要注意数据的准确性和完整性,确保审核结果的可靠性和有效性。同时,应遵循相关法规和准则的要求,确保审核过程的合规性。
在一种可选的实施方式中,所述获取待审核财税数据和所述待审核财税数据对应的至少一条验证数据之后,所述方法还可以包括:
对获取到的所述待审核财税数据进行信息提取,并根据提取到的信息构建目标矩阵,其中,所述目标矩阵的列向量和行向量分别用于表示待审核财税数据的属性数据和验证数据。
具体的,对获取到的待审核财税数据进行信息提取是构建目标矩阵的重要步骤。首先,对待审核财税数据进行清洗和预处理,以消除异常值、缺失值和格式不一致等问题。这一步骤确保数据的质量和一致性。然后从待审核财税数据中提取出与财税相关的属性特征,这些特征可以是财务报表中的特定指标、税务申报表中的特定税项等,特征提取的目的是识别和提取与财税数据审核任务相关的关键信息。随后根据提取到的信息,构建一个目标矩阵,这个矩阵的列向量表示待审核财税数据的属性数据,而行向量表示验证数据,以确保目标矩阵的构建遵循正确的维度对应关系,便于后续的数据分析和处理。在构建目标矩阵时,需要对数据进行适当的转换和整合,例如,将不同单位或不同格式的数据进行统一化处理,以便于比较和分析。在构建目标矩阵的过程中,对于异常值进行适当的处理也是非常重要的,根据具体情况,可以选择忽略、填充或使用特定的方法来处理异常值,以确保目标矩阵的准确性和可靠性。
通过以上步骤,可以有效地对获取到的待审核财税数据进行信息提取,并根据提取到的信息构建目标矩阵,这个目标矩阵可以用于后续的数据分析和模型训练,以实现待审核财税数据的准确性和合规性验证。
S202:基于所述至少一条验证数据计算所述待审核财税数据的属性特征值。
具体的,基于验证数据计算待审核财税数据的属性特征值是财税数据审核的关键步骤。通过这一过程,可以评估待审核财税数据的准确性和合规性。首先,将待审核的财税数据与验证数据进行匹配和整理,确保两者之间有明确的对应关系,这有助于确保后续计算的准确性和一致性。从待审核财税数据中提取出相关的属性特征并基于提取出的属性特征,利用适当的算法或统计方法计算每个特征的值。这些特征值将用于评估待审核财税数据的属性特征表现。然后将计算出的属性特征值与验证数据进行对比分析,以评估待审核财税数据的准确性和合规性。通过对比,可以发现任何不一致或异常之处,并进行相应的处理。基于对比结果,对待审核财税数据的属性特征值进行综合评估,这一步骤可以根据具体的需求和标准,采用适当的评估指标和方法,以得出准确的评估结果。将计算和评估结果进行整理和输出,并生成相应的报告。报告中应包括待审核财税数据的属性特征值、与验证数据的对比分析结果以及任何发现的问题和建议。这一过程需要综合考虑财税数据的特点和业务需求,选择适合的计算方法和评估指标。同时,保持数据的准确性和完整性至关重要,以确保计算结果的可靠性和有效性。
在一种可选的实施方式中,所述基于所述至少一条验证数据计算所述待审核财税数据的属性特征值,可以包括:
1.将所述验证数据输入数据处理模块生成结构化数据,其中,所述数据处理模块基于Word2Vec构成。
具体的,Word2Vec是一种常用的文本向量化方法,能够将文本中的词或短语转换为固定维度的向量。这种方法通过学习词与词之间的相似性和关联性,将非结构化的文本数据转化为结构化的数值数据,便于进行机器学习和数据分析。Word2Vec通过训练学习,能够捕获词汇之间的语义和语法关系。这使得模型能够更好地理解文本数据的意义,而不仅仅是单个词汇的字面含义。虽然Word2Vec主要用于文本向量化,但在财税数据审核场景中,它还可以作为一个预处理工具。通过将验证数据转换为结构化形式,可以进一步简化后续的数据处理和分析步骤。一旦验证数据被转换为结构化格式,就可以更方便地与其它结构化数据进行整合和处理。这种集成化的处理方式有助于提高数据处理的速度和效率。结构化数据更适合于机器学习算法的处理,通过将验证数据转换为结构化数据,可以为后续的模型训练和数据分析提供更好的支持。Word2Vec模型可以灵活地调整以适应不同的数据集和任务,通过调整模型参数和训练方法,可以进一步提高数据处理的效果和准确性。
综上所述,使用基于Word2Vec的数据处理模块来生成结构化数据能够提供更深入的语义理解、更高效的数据处理能力,以及更好的算法支持,从而有助于提高财税数据审核的准确性和效率。
2.对所述结构化数据进行预处理,并将预处理后的结果数据输入到数据计算模块中,以输出所述待审核财税数据的属性特征值,其中,所述数据计算模块基于集成学习算法模型构成。
具体的,预处理的第一步是对结构化数据进行清洗,清洗过程中,需要去除无关数据、填充缺失值、纠正错误值等。这有助于提高数据的质量和准确性,为后续分析提供可靠的基础。根据财税数据的属性和业务需求,选择与待审核财税数据相关的特征,这些特征可以包括财务报表中的财务指标、税务申报表中的特定字段等。提取特征的目的是为了从数据中获取有价值的信息,为后续分析提供依据。在特征提取后,可能需要对数据进行适当的转换,以适应模型的需求,这包括特征的归一化、标准化、编码转换等,正确的数据转换方法有助于提高模型的稳定性和准确性。将预处理后的结构化数据输入到基于集成学习算法模型的数据计算模块中,集成学习通过将多个模型的预测结果组合起来,通常可以获得比单一模型更好的性能,它通过构建多个模型并将它们的预测结果进行综合,能够提高预测的准确性和稳定性。在数据计算模块中,利用集成学习算法模型对输入的数据进行处理和计算,根据特定的评估指标和方法,计算出待审核财税数据的属性特征值,这些特征值反映了财税数据的属性特征表现,可以用于评估数据的准确性和合规性。最后将计算出的待审核财税数据的属性特征值输出,这些结果可以以报告的形式呈现,包括数据的属性特征值、与验证数据的对比分析结果以及任何发现的问题和建议。
通过上述步骤,可以对结构化数据进行预处理,并将预处理后的结果数据输入到基于集成学习算法模型的数据计算模块中,以输出待审核财税数据的属性特征值,这种方法结合了数据处理和机器学习的技术,能够更准确地评估财税数据的准确性和合规性,为企业的财务管理和税务管理提供有力支持。
S203:利用基于预设训练方法训练的财税数据审核模型,并根据所述属性特征值来获取待审核财税数据的目标审核结果。
首先,使用预设的训练方法对财税数据审核模型进行训练,这通常涉及收集大量的历史财税数据作为训练集,并使用这些数据来训练和优化模型。训练过程中,可以采用各种机器学习算法和技术,以构建一个能够准确识别和评估财税数据合规性的模型。在模型训练完成后,将待审核财税数据的属性特征值输入到财税数据审核模型中,这些特征值是通过前面的步骤计算得出的,反映了待审核财税数据的属性特征表现。财税数据审核模型根据输入的属性特征值进行预测和评估,模型将利用其训练时学到的知识和算法,对属性特征值进行分析和判断,以得出对财税数据的合规性评估结果。基于模型的预测和评估结果,生成待审核财税数据的目标审核结果,该结果可以是一个或多个关于数据合规性的结论或指标,例如,目标审核结果可以指出数据的准确性、完整性、合规性等方面的问题,并提供相应的建议或修正措施。将目标审核结果输出并生成相应的报告。报告中应包括待审核财税数据的属性特征值、模型的预测结果、合规性评估以及任何发现的问题和建议。报告可以为企业财务管理和税务管理提供决策支持,帮助企业更好地了解和处理财税数据问题。
通过上述步骤,可以利用基于预设训练方法训练的财税数据审核模型,根据属性特征值获取待审核财税数据的目标审核结果,这种方法结合了机器学习和数据处理技术,能够提高财税数据的处理效率和准确性,为企业财务管理和税务管理提供有力支持。
需要说明的是,所述财税数据审核模型包括根据若干财税数据集并基于所述预设训练方法训练得到的,所述财税数据集包括预设数量的财税数据审核结果为审核合格的样本企业的财税数据,所述预设训练方法包括神经网络算法、随机森林算法、支持向量机算法中的一种或多种。
财税数据审核模型是根据若干财税数据集并基于预设训练方法训练得到的。这些财税数据集包含了预设数量的样本企业的财税数据,而这些样本企业的财税数据审核结果为合格。在训练过程中,可以采用多种算法和技术,例如神经网络算法、随机森林算法、支持向量机算法等。
具体的,上述算法可以单独使用或结合使用,以构建一个能够准确识别和评估财税数据合规性的模型。通过使用这些算法,模型能够学习到财税数据的内在规律和特征,并根据这些特征进行预测和分类。在训练过程中,可以使用历史财税数据作为训练集,对模型进行反复训练和调整,以提高模型的准确性和稳定性。同时,还可以使用验证集对模型进行验证,以确保模型在未知数据上的表现可靠。通过这种基于预设训练方法的训练过程,可以构建出一个具有较高准确性和稳定性的财税数据审核模型。该模型可以根据输入的待审核财税数据的属性特征值,快速得出相应的审核结果,为企业财税管理提供有力支持。
在一种可选的实施方式中,所述财税数据审核模型的目标函数,可以包括:
通过以下算式表示财税数据审核模型的目标函数:
其中,f(x)表示财税数据审核模型的目标函数,C表示预设常数,M表示样本数量,L(h(xi))表示预设损失函数,h(xi)表示财税数据审核模型的预测值,xi表示第i个样本的属性特征值。
所述利用基于预设训练方法训练的财税数据审核模型,并根据所述属性特征值来获取待审核财税数据的目标审核结果之后,所述方法还可以包括:
步骤1:获取待审核财税数据的人工复核结果,其中,所述人工复核结果包括所述待审核财税数据的标签。
在财税数据审核过程中,除了利用财税数据审核模型进行自动审核外,人工复核也是非常重要的一环。人工复核可以弥补模型自动审核的不足,提高数据审核的准确性和可靠性。具体来说,人工复核结果是对待审核财税数据进行人工检查和核实的结果,包括对数据贴标签,标签是对财税数据进行分类或标记的依据,通常根据财税法规和标准进行定义。通过人工复核,可以针对模型无法覆盖或难以判断的情况进行深入检查,并对数据进行合理的标签。
在实际操作中,人工复核结果的获取可以通过以下步骤实现:
首先,从待审核财税数据中筛选出需要人工复核的部分。这可能是由于某些原因导致模型无法准确判断或存在疑似错误的数据。对于筛选出来的数据,由专业人员进行人工核查。核查过程中,根据财税法规和标准,对数据进行逐项检查和评估,并为其打上相应的标签。将人工复核的结果详细记录下来,包括数据的标签、核查中发现的问题、建议等,这些结果将作为后续处理的依据。最后将人工复核的结果反馈给财税数据审核模型的开发和维护团队,以便对模型进行持续优化和调整,同时,对于人工复核中发现的问题,也可以进行相应的数据清洗和修正。通过结合财税数据审核模型和人工复核,可以更全面地评估待审核财税数据的合规性和准确性。模型和人工的结合可以发挥各自的优势,相互补充,从而提高整个财税数据审核流程的效率和准确性。
步骤2:将所述人工复核结果作为样本、将所述标签作为所述样本的标签,对应添加至所述财税数据审核模型的财税数据集,以实现对所述财税数据审核模型的财税数据集进行更新。
将人工复核结果作为样本,将标签作为样本的标签,对应添加到财税数据审核模型的财税数据集中,可以实现对财税数据审核模型的财税数据集进行更新。这种更新过程有助于提高模型的性能和准确性,使其更好地适应不断变化的财税数据和业务需求。
具体来说,从人工复核结果中筛选出需要添加到财税数据集的样本,这些样本应该是经过人工核查和确认的,具有较高的准确性和代表性。将筛选出的样本添加到财税数据审核模型的财税数据集中,在添加过程中,确保样本的标签正确对应,以便模型能够正确学习和识别这些新的样本。对于新添加的样本,可能需要进行必要的数据预处理,如填充缺失值、异常值处理、特征转换等。这一步骤可以确保样本数据的完整性和一致性。在添加新的样本后,可以对财税数据审核模型进行再训练,使其能够学习新的数据和适应变化,再训练的过程可以通过使用现有的训练方法和技术实现,确保模型能够持续改进和优化。在模型再训练后,使用验证集对模型进行验证和测试,以确保其性能和准确性的提升。通过对比新旧模型的表现,可以评估更新后的财税数据集对模型性能的影响。根据验证和测试的结果,对财税数据集的更新进行必要的调整,这可能包括添加更多样本、调整样本权重、优化特征选择等,通过不断迭代和优化,可以提高财税数据审核模型的性能和满足企业财税管理的实际需求。
通过上述步骤,可以实现将人工复核结果作为样本添加到财税数据审核模型的财税数据集中,以实现对财税数据审核模型的财税数据集进行更新。这种更新过程可以持续优化财税数据审核模型的性能,提高其准确性和适应性,为企业财税管理提供更可靠的支持。
步骤3:基于更新后的所述财税数据审核模型的财税数据集,对所述财税数据审核模型进行迭代,以对所述财税数据审核模型进行在线更新。
基于更新后的财税数据审核模型的财税数据集,可以对财税数据审核模型进行迭代,以实现模型的在线更新。在线更新是一种持续改进模型性能的方法,可以在不停止模型运行的情况下,实时地更新和优化模型。
具体来说,首先,根据人工复核结果和其他数据源,持续更新财税数据集。确保数据集中包含最新的财税数据和相应的标签。在更新数据集后,对财税数据审核模型进行迭代训练。迭代训练是指不断重复训练和优化模型的过程,以逐步提高模型的性能。可以使用不同的算法和技术进行迭代,例如梯度下降法、随机梯度下降法等。通过在线更新机制,将迭代训练得到的模型参数和结构实时应用到财税数据审核模型中。这种在线更新的方式可以在不中断现有服务的情况下,逐步改进模型的性能。在模型迭代和在线更新的过程中,实时监控模型的性能表现,并根据实际应用情况和业务需求进行必要的调整和反馈。通过实时监控和反馈,可以更好地了解模型的不足和潜在问题,并进行针对性的优化。通过迭代和在线更新的方式,持续改进财税数据审核模型的性能和适应性。随着业务需求的变化和财税数据的更新,不断调整和优化模型,以满足企业财税管理的实际需求。
通过上述步骤,可以实现基于更新后的财税数据审核模型的财税数据集对财税数据审核模型的迭代和在线更新。这种迭代和在线更新的机制有助于提高财税数据审核模型的性能和准确性,为企业财税管理提供更可靠的支持。
可见,本发明首先获取待审核财税数据和待审核财税数据对应的至少一条验证数据,然后基于至少一条验证数据计算待审核财税数据的属性特征值,利用基于预设训练方法训练的财税数据审核模型,并根据属性特征值来获取待审核财税数据的目标审核结果。它能够利用基于人工智能的财税数据审核模型来获取待审核财税数据的审核结果,有助于企业及时发现和纠正财税数据问题,提高处理效率。
本申请的又一实施例提供了一种财税数据审核系统,如图3所示的一种财税数据审核系统的结构示意图,所述系统包括:
第一获取模块301,用于获取待审核财税数据和所述待审核财税数据对应的至少一条验证数据,其中,所述待审核财税数据包括财税数据待审核项的属性数据,所述至少一条验证数据用于验证所述属性数据;
计算模块302,用于基于所述至少一条验证数据计算所述待审核财税数据的属性特征值;
第二获取模块303,用于利用基于预设训练方法训练的财税数据审核模型,并根据所述属性特征值来获取待审核财税数据的目标审核结果。
具体的,所述第一获取模块之后,所述系统还包括:
提取模块,用于对获取到的所述待审核财税数据进行信息提取,并根据提取到的信息构建目标矩阵,其中,所述目标矩阵的列向量和行向量分别用于表示待审核财税数据的属性数据和验证数据。
与现有技术相比,本发明首先获取待审核财税数据和待审核财税数据对应的至少一条验证数据,然后基于至少一条验证数据计算待审核财税数据的属性特征值,利用基于预设训练方法训练的财税数据审核模型,并根据属性特征值来获取待审核财税数据的目标审核结果。它能够利用基于人工智能的财税数据审核模型来获取待审核财税数据的审核结果,有助于企业及时发现和纠正财税数据问题,提高处理效率。
本发明实施例还提供了一种存储介质,所述存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时实现上述方法实施例中的步骤。
具体的,在本实施例中,上述存储介质可以被设置为存储用于执行以下步骤的计算机程序:
S201:获取待审核财税数据和所述待审核财税数据对应的至少一条验证数据,其中,所述待审核财税数据包括财税数据待审核项的属性数据,所述至少一条验证数据用于验证所述属性数据;
S202:基于所述至少一条验证数据计算所述待审核财税数据的属性特征值;
S203:利用基于预设训练方法训练的财税数据审核模型,并根据所述属性特征值来获取待审核财税数据的目标审核结果。
具体的,在本实施例中,上述存储介质可以包括但不限于:U盘、只读存储器(Read-Only Memory,简称为ROM)、随机存取存储器(Random Access Memory,简称为RAM)、移动硬盘、磁碟或者光盘等各种可以存储计算机程序的介质。
与现有技术相比,本发明首先获取待审核财税数据和待审核财税数据对应的至少一条验证数据,然后基于至少一条验证数据计算待审核财税数据的属性特征值,利用基于预设训练方法训练的财税数据审核模型,并根据属性特征值来获取待审核财税数据的目标审核结果。它能够利用基于人工智能的财税数据审核模型来获取待审核财税数据的审核结果,有助于企业及时发现和纠正财税数据问题,提高处理效率。
本发明实施例还提供了一种电子设备,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行上述方法实施例中的步骤。
具体的,上述电子设备还可以包括传输设备以及输入输出设备,其中,该传输设备和上述处理器连接,该输入输出设备和上述处理器连接。
具体的,在本实施例中,上述处理器可以被设置为通过计算机程序执行以下步骤:
S201:获取待审核财税数据和所述待审核财税数据对应的至少一条验证数据,其中,所述待审核财税数据包括财税数据待审核项的属性数据,所述至少一条验证数据用于验证所述属性数据;
S202:基于所述至少一条验证数据计算所述待审核财税数据的属性特征值;
S203:利用基于预设训练方法训练的财税数据审核模型,并根据所述属性特征值来获取待审核财税数据的目标审核结果。
与现有技术相比,本发明首先获取待审核财税数据和待审核财税数据对应的至少一条验证数据,然后基于至少一条验证数据计算待审核财税数据的属性特征值,利用基于预设训练方法训练的财税数据审核模型,并根据属性特征值来获取待审核财税数据的目标审核结果。它能够利用基于人工智能的财税数据审核模型来获取待审核财税数据的审核结果,有助于企业及时发现和纠正财税数据问题,提高处理效率。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本发明所提供的几个实施例中,应该理解到,所揭露的装置,可通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如上述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性或其它的形式。
上述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
上述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储器中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储器中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例上述方法的全部或部分步骤。而前述的存储器包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
以上对本发明实施例进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (10)

1.一种财税数据审核方法,其特征在于,所述方法包括:
获取待审核财税数据和所述待审核财税数据对应的至少一条验证数据,其中,所述待审核财税数据包括财税数据待审核项的属性数据,所述至少一条验证数据用于验证所述属性数据;
基于所述至少一条验证数据计算所述待审核财税数据的属性特征值;
利用基于预设训练方法训练的财税数据审核模型,并根据所述属性特征值来获取待审核财税数据的目标审核结果。
2.根据权利要求1所述的方法,其特征在于,所述获取待审核财税数据和所述待审核财税数据对应的至少一条验证数据之后,所述方法还包括:
对获取到的所述待审核财税数据进行信息提取,并根据提取到的信息构建目标矩阵,其中,所述目标矩阵的列向量和行向量分别用于表示待审核财税数据的属性数据和验证数据。
3.根据权利要求2所述的方法,其特征在于,所述基于所述至少一条验证数据计算所述待审核财税数据的属性特征值,包括:
将所述验证数据输入数据处理模块生成结构化数据,其中,所述数据处理模块基于Word2Vec构成;
对所述结构化数据进行预处理,并将预处理后的结果数据输入到数据计算模块中,以输出所述待审核财税数据的属性特征值,其中,所述数据计算模块基于集成学习算法模型构成。
4.根据权利要求3所述的方法,其特征在于,所述财税数据审核模型包括根据若干财税数据集并基于所述预设训练方法训练得到的,所述财税数据集包括预设数量的财税数据审核结果为审核合格的样本企业的财税数据,所述预设训练方法包括神经网络算法、随机森林算法、支持向量机算法中的一种或多种。
5.根据权利要求4所述的方法,其特征在于,所述财税数据审核模型的目标函数,包括:
通过以下算式表示财税数据审核模型的目标函数:
其中,f(x)表示财税数据审核模型的目标函数,C表示预设常数,M表示样本数量,L(h(xi))表示预设损失函数,h(xi)表示财税数据审核模型的预测值,xi表示第i个样本的属性特征值。
6.根据权利要求5所述的方法,其特征在于,所述利用基于预设训练方法训练的财税数据审核模型,并根据所述属性特征值来获取待审核财税数据的目标审核结果之后,所述方法还包括:
获取待审核财税数据的人工复核结果,其中,所述人工复核结果包括所述待审核财税数据的标签;
将所述人工复核结果作为样本、将所述标签作为所述样本的标签,对应添加至所述财税数据审核模型的财税数据集,以实现对所述财税数据审核模型的财税数据集进行更新;
基于更新后的所述财税数据审核模型的财税数据集,对所述财税数据审核模型进行迭代,以对所述财税数据审核模型进行在线更新。
7.一种财税数据审核系统,其特征在于,所述系统包括:
第一获取模块,用于获取待审核财税数据和所述待审核财税数据对应的至少一条验证数据,其中,所述待审核财税数据包括财税数据待审核项的属性数据,所述至少一条验证数据用于验证所述属性数据;
计算模块,用于基于所述至少一条验证数据计算所述待审核财税数据的属性特征值;
第二获取模块,用于利用基于预设训练方法训练的财税数据审核模型,并根据所述属性特征值来获取待审核财税数据的目标审核结果。
8.根据权利要求7所述的系统,其特征在于,所述第一获取模块之后,所述系统还包括:
提取模块,用于对获取到的所述待审核财税数据进行信息提取,并根据提取到的信息构建目标矩阵,其中,所述目标矩阵的列向量和行向量分别用于表示待审核财税数据的属性数据和验证数据。
9.一种存储介质,其特征在于,所述存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时实现所述权利要求1至6中任一项所述的方法。
10.一种电子设备,包括存储器和处理器,其特征在于,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以实现所述权利要求1至6中任一项所述的方法。
CN202410099211.9A 2024-01-24 2024-01-24 一种财税数据审核方法及系统 Pending CN117911179A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410099211.9A CN117911179A (zh) 2024-01-24 2024-01-24 一种财税数据审核方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202410099211.9A CN117911179A (zh) 2024-01-24 2024-01-24 一种财税数据审核方法及系统

Publications (1)

Publication Number Publication Date
CN117911179A true CN117911179A (zh) 2024-04-19

Family

ID=90693755

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202410099211.9A Pending CN117911179A (zh) 2024-01-24 2024-01-24 一种财税数据审核方法及系统

Country Status (1)

Country Link
CN (1) CN117911179A (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106096657A (zh) * 2016-06-13 2016-11-09 北京物思创想科技有限公司 基于机器学习来预测数据审核目标的方法及系统
WO2019109523A1 (zh) * 2017-12-08 2019-06-13 深圳壹账通智能科技有限公司 经营数据审核方法、装置、设备及计算机可读存储介质
CN113887933A (zh) * 2021-09-29 2022-01-04 平安国际智慧城市科技股份有限公司 基于人工智能的数据处理方法、装置、设备及存储介质
CN117422573A (zh) * 2023-10-30 2024-01-19 广州金财智链数字科技有限公司 基于动态神经网络的财税数据预测方法及系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106096657A (zh) * 2016-06-13 2016-11-09 北京物思创想科技有限公司 基于机器学习来预测数据审核目标的方法及系统
CN109993233A (zh) * 2016-06-13 2019-07-09 第四范式(北京)技术有限公司 基于机器学习来预测数据审核目标的方法及系统
WO2019109523A1 (zh) * 2017-12-08 2019-06-13 深圳壹账通智能科技有限公司 经营数据审核方法、装置、设备及计算机可读存储介质
CN113887933A (zh) * 2021-09-29 2022-01-04 平安国际智慧城市科技股份有限公司 基于人工智能的数据处理方法、装置、设备及存储介质
CN117422573A (zh) * 2023-10-30 2024-01-19 广州金财智链数字科技有限公司 基于动态神经网络的财税数据预测方法及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
杨聪: "《能网联汽车研究与开发丛书 智能座舱开发与实践》", 28 February 2022, 北京:机械工业出版社, pages: 88 *

Similar Documents

Publication Publication Date Title
CN108256074B (zh) 校验处理的方法、装置、电子设备和存储介质
CN105160038B (zh) 一种基于审计知识库的数据分析方法及系统
Castaño et al. Exploring the Carbon Footprint of Hugging Face's ML Models: A Repository Mining Study
CN116993306A (zh) 基于知识图谱的网络协同制造系统的构建方法和装置
CN117453764A (zh) 一种数据挖掘分析方法
CN117726300B (zh) 用于招标代理业务资料校验的自动化智能处理系统
CN117493797A (zh) 一种物联网设备的故障预测方法及装置、电子设备、存储介质
CN117193778A (zh) 一种基于语言模型的代码审查方法及系统
WO2024065776A1 (en) Method for data processing, apparatus for data processing, electronic device, and storage medium
CN117911179A (zh) 一种财税数据审核方法及系统
Restat et al. Towards a Holistic Data Preparation Tool.
CN111612302A (zh) 一种集团级数据管理方法和设备
CN118410186B (zh) 一种用于信息系统集成服务展示的产业链图谱构建方法
CN117056209B (zh) 软件缺陷预测模型、解释方法以及量化评估方法
CN117390139B (zh) 基于知识图谱的变电工作票工作内容准确性评估的方法
CN117076454B (zh) 一种工程质量验收表单数据结构化存储方法及系统
US20230385825A1 (en) Agile iteration for data mining using artificial intelligence
CN118333236A (zh) 企业行为欺诈风险预测方法、装置及电子设备
CN117592943A (zh) 基于互联网的科技服务数据协作系统
CN117745134A (zh) 涉企案件生产经营影响评估方法及系统
CN118860883A (zh) 一种软件测试用例自动生成方法及系统
Castaño Fernandez et al. Exploring the carbon footprint of Hugging Face's ML models: a repository mining study
CN118709020A (zh) 客服工单台账数据分析方法、分析系统、设备及介质
CN118780690A (zh) 一种配电网建设竣工验收管理方法及系统
CN117875706A (zh) 一种基于ai的评级工艺数字化管理方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination