CN117541411B - 一种基于大数据处理的财务预测模型的构建方法及系统 - Google Patents

一种基于大数据处理的财务预测模型的构建方法及系统 Download PDF

Info

Publication number
CN117541411B
CN117541411B CN202311481573.6A CN202311481573A CN117541411B CN 117541411 B CN117541411 B CN 117541411B CN 202311481573 A CN202311481573 A CN 202311481573A CN 117541411 B CN117541411 B CN 117541411B
Authority
CN
China
Prior art keywords
data
financial
enterprise
sample
prediction model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202311481573.6A
Other languages
English (en)
Other versions
CN117541411A (zh
Inventor
花鲜美
占欣荣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xiamen Institute of Technology
Original Assignee
Xiamen Institute of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xiamen Institute of Technology filed Critical Xiamen Institute of Technology
Priority to CN202311481573.6A priority Critical patent/CN117541411B/zh
Publication of CN117541411A publication Critical patent/CN117541411A/zh
Application granted granted Critical
Publication of CN117541411B publication Critical patent/CN117541411B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/12Accounting
    • G06Q40/125Finance or payroll
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • General Physics & Mathematics (AREA)
  • Human Resources & Organizations (AREA)
  • Development Economics (AREA)
  • Data Mining & Analysis (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Artificial Intelligence (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Game Theory and Decision Science (AREA)
  • Technology Law (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请提供了一种基于大数据处理的财务预测模型的构建方法及系统,涉及数据处理技术领域,用于提高财务数据预测的准确度。该方法主要包括:财务数据处理装置根据预置映射表确定与目标企业的企业规模以及企业类型对应的目标财务预测模型训练装置,目标财务预测模型训练装置根据企业历史财务数据确定样本数据以及样本标签,并基于企业历史相关数据和样本数据确定样本数据中各数据项分别对应的权重系数;目标财务预测模型训练装置基于样本数据和各数据项分别对应的权重系数生成样本特征数据矩阵,并根据样本特征数据矩阵以及样本标签进行模型训练得到财务预测模型;基于待预测企业的企业历史财务数据以及企业相关数据,预测待预测企业的财务数据。

Description

一种基于大数据处理的财务预测模型的构建方法及系统
技术领域
本申请涉及数据处理技术领域,尤其涉及一种基于大数据处理的财务预测模型的构建方法及系统。
背景技术
财务预测是帮助财务人员认识和控制未来的不确定性,使对未来的无知降到最低限度,使财务计划的预期目标同可能变化的周围环境和经济条件保持一致,并对财务计划的实施效果做到心中有数。
目前,通常由财务工作人员对企业用户的财务状况进行预测,但是由于财务状况分析常常会与财务人员的主观性相关联,导致预测结果具有较大的误差,且财务人员也可在进行财务状况分析时,对财务数据进行篡改,进而将进一步降低财务预测的准确性。
发明内容
本申请实施例提供一种基于大数据处理的财务预测模型的构建方法及系统,用于提高财务预测的准确度以及效率。
本发明实施例提供一种基于大数据处理的财务预测模型的构建方法,所述构建方法应用于构建系统,所述构建系统包括财务数据处理装置、财务预测模型训练装置以及财务预测模型识别装置;所述构建方法包括:
所述财务数据处理装置获取目标企业的企业历史财务数据以及企业历史相关数据,根据预置映射表确定与所述目标企业的企业规模以及企业类型对应的目标财务预测模型训练装置,并将所述目标企业的企业历史财务数据及企业历史相关数据发送给所述目标财务预测模型训练装置,所述预置映射表中存储有不同企业规模以及企业类型分别对应的财务预测模型训练装置的对应关系;
所述目标财务预测模型训练装置根据所述企业历史财务数据确定样本数据以及样本标签,并基于所述企业历史相关数据和所述样本数据确定样本数据中各数据项分别对应的权重系数;所述样本数据中包括连续的n天的财务数据发生时间、财务数据组成,所述样本标签为第n+1天的财务数据;
所述目标财务预测模型训练装置基于所述样本数据和各数据项分别对应的权重系数生成样本特征数据矩阵,并根据所述样本特征数据矩阵以及所述样本标签进行模型训练得到财务预测模型;
所述财务预测模型识别装置获取所述财务数据处理装置发送的待预测企业的财务预测请求,所述财务预测请求中包括待预测企业的企业历史财务数据以及企业相关数据;
所述财务预测模型识别装置基于所述待预测企业的企业历史财务数据以及企业相关数据,预测所述待预测企业的财务数据。
在本发明提供的一个可选实施例中,所述基于所述企业历史相关数据和所述样本数据确定样本数据中各数据项分别对应的权重系数,包括:
基于所述样本数据中的财务数据发生时间,获取所述企业历史相关数据中对应时间段的企业历史相关数据;
将所述对应时间段的企业历史相关数据以及所述样本数据转换成对应的第一数据特征;
将所述第一数据特征输入到权重系数确定模型中,得到所述样本数据中各数据项分别对应的权重系数。
在本发明提供的一个可选实施例中,所述权重系数确定模型的训练过程包括:
基于所述企业历史相关数据,获取每个样本数据分别对应的对应时间段的企业历史相关数据;
根据每个样本数据及其对应时间段的企业历史相关数据之间的数据关系确定权重标签;
通过每个样本数据对应的第一数据特征以及权重标签进行模型训练得到所述权重系数确定模型。
在本发明提供的一个可选实施例中,所述目标财务预测模型训练装置基于所述样本数据和各数据项分别对应的权重系数生成样本特征数据矩阵,包括:
将所述样本数据转换成第一数据矩阵,所述第一数据矩阵中的每行代表一天的财务数据,每列代表一个数据项;
对所述第一数据中的每个数据项乘以对应的权重系数得到所述样本特征数据矩阵。
在本发明提供的一个可选实施例中,根据所述样本特征数据矩阵以及所述样本标签进行模型训练得到财务预测模型,包括:
将所述样本特征数据矩阵输入到所述财务预测模型得到所述样本特征数据矩阵对应的预测标签;
计算所述样本特征数据矩阵的预测标签和样本标签之间的损失值,所述损失值根据所述样本数据中各个数据项的预测值和实际值之间的差异值计算得到;
当所述损失值满足预置条件,完成所述财务预测模型的训练。
在本发明提供的一个可选实施例中,所述计算所述样本特征数据矩阵的预测标签和样本标签之间的损失值,包括:
获取所述预测标签中每个数据项对应的预测值,以及获取所述样本标签中每个数据项对应的实际值;
根据所述预测值与所述实际值计算得到每个数据项的差值绝对值;
对所有数据项的差值绝对值与其对应的权重系数进行加权计算得到所述损失值。
在本发明提供的一个可选实施例中,所述计算所述样本特征数据矩阵的预测标签和样本标签之间的损失值,包括:
获取所述预测标签中每个数据项对应的预测值,以及获取所述样本标签中每个数据项对应的实际值;
根据所述预测值与所述实际值计算得到每个数据项的差值绝对值;并根据所述预测值对应的概率值以及权重系数计算得到损失系数;
根据所述损失系数对所有数据项的差值绝对值进行加权计算得到所述损失值。
在本发明提供的一个可选实施例中,所述财务预测模型识别装置基于所述待预测企业的企业历史财务数据以及企业相关数据,预测所述待预测企业的财务数据,包括:
基于所述待预测企业的企业历史财务数据确定多个历史特征数据矩阵以及当前特征数据矩阵,每个历史特征数据矩阵中根据连续的n天的财务数据发生时间、财务数据确定;
将每个历史特征数据矩阵输入到训练好的财务预测模型,分别得到第n+1天的财务预测值;
根据每个历史特征数据矩阵对应的第n+1天的财务预测值及财务实际值的差值,计算财务数据差值平均值;
根据所述财务数据差值平均值以及所述当前特征数据矩阵,预测所述待预测企业的财务数据。
在本发明提供的一个可选实施例中,所述根据所述财务数据差值平均值以及所述当前特征数据矩阵,预测所述待预测企业的财务数据,包括:
将所述当前特征数据矩阵输入到训练好的财务预测模型,得到目标财务预测值;
计算所述目标财务预测值和所述财务数据差值平均值的差值,得到所述待预测企业的财务数据。
本发明实施例提供一种基于大数据处理的财务预测模型的构建系统,所述构建系统包括:财务数据处理装置、财务预测模型训练装置以及财务预测模型识别装置;
所述财务数据处理装置,用于获取目标企业的企业历史财务数据以及企业历史相关数据,根据预置映射表确定与所述目标企业的企业规模以及企业类型对应的目标财务预测模型训练装置,并将所述目标企业的企业历史财务数据及企业历史相关数据发送给所述目标财务预测模型训练装置,所述预置映射表中存储有不同企业规模以及企业类型分别对应的财务预测模型训练装置的对应关系;
所述目标财务预测模型训练装置,用于根据所述企业历史财务数据确定样本数据以及样本标签,并基于所述企业历史相关数据和所述样本数据确定样本数据中各数据项分别对应的权重系数;所述样本数据中包括连续的n天的财务数据发生时间、财务数据组成,所述样本标签为第n+1天的财务数据;
所述目标财务预测模型训练装置,用于基于所述样本数据和各数据项分别对应的权重系数生成样本特征数据矩阵,并根据所述样本特征数据矩阵以及所述样本标签进行模型训练得到财务预测模型;
所述财务预测模型识别装置,用于获取所述财务数据处理装置发送的待预测企业的财务预测请求,所述财务预测请求中包括待预测企业的企业历史财务数据以及企业相关数据;
所述财务预测模型识别装置,用于基于所述待预测企业的企业历史财务数据以及企业相关数据,预测所述待预测企业的财务数据。
本发明提供一种基于大数据处理的财务预测模型的构建方法及系统,包括财务数据处理装置、财务预测模型训练装置以及财务预测模型识别装置。其中,财务数据处理装置获取目标企业的企业历史财务数据以及企业历史相关数据,根据预置映射表确定与所述目标企业的企业规模以及企业类型对应的目标财务预测模型训练装置,并将所述目标企业的企业历史财务数据及企业历史相关数据发送给所述目标财务预测模型训练装置;目标财务预测模型训练装置根据所述企业历史财务数据确定样本数据以及样本标签,并基于企业历史相关数据和样本数据确定样本数据中各数据项分别对应的权重系数;目标财务预测模型训练装置基于样本数据和各数据项分别对应的权重系数生成样本特征数据矩阵,并根据样本特征数据矩阵以及所述样本标签进行模型训练得到财务预测模型;财务预测模型识别装置基于待预测企业的企业历史财务数据以及企业相关数据,预测待预测企业的财务数据。本发明通过训练得到的财务预测模型便可以预测企业的财务数据,相对于现有技术通过财务工作人员对企业用户的财务状况进行预测,通过本发明可在减少工作人员的工作量的同时,提高财务预测的准确度以及效率。
附图说明
图1为本申请提供的一种基于大数据处理的财务预测模型的构建方法流程图;
图2为本申请提供的一种基于大数据处理的财务预测模型的构建系统框图;
图3为本申请提供的一种预测待预测企业的财务数据的流程图。
具体实施方式
为了更好的理解上述技术方案,下面通过附图以及具体实施例对本申请实施例的技术方案做详细的说明,应当理解本申请实施例以及实施例中的具体特征是对本申请实施例技术方案的详细的说明,而不是对本申请技术方案的限定,在不冲突的情况下,本申请实施例以及实施例中的技术特征可以相互组合。
请参阅图1所示,为本发明实施例提供的一种基于大数据处理的财务预测模型的构建方法,所述构建方法应用于如图2所示的构建系统,该构建系统包括财务数据处理装置、财务预测模型训练装置以及财务预测模型识别装置;所述构建方法包括:
步骤101,财务数据处理装置获取目标企业的企业历史财务数据以及企业历史相关数据,根据预置映射表确定与目标企业的企业规模以及企业类型对应的目标财务预测模型训练装置,并将目标企业的企业历史财务数据及企业历史相关数据发送给目标财务预测模型训练装置。
其中,企业历史财务数据可以包括销售数据、成本数据、利润数据等;企业历史相关数据可以为季度数据、财务报表、突然事件、人员变动数据等,本实施例对此不做具体限定。需要说明的是,本实施例中的预置映射表中存储有不同企业规模以及企业类型分别对应的财务预测模型训练装置的对应关系。即本实施例在获取到目标企业的企业历史财务数据以及企业历史相关数据之后,从企业历史财务数据以及企业历史相关数据中确定目标企业的企业规模以及企业类型确定对应的目标财务预测模型训练装置,以便于将目标企业的企业历史财务数据及企业历史相关数据发送给目标财务预测模型训练装置。
在本实施例中,企业规模具体为按照工作人员数量、年收入金额、生产量等数据确定;企业类型为企业经营的类型,如企业类型可以为生产类、销售类、服务类等,具体的针对每一个大类还可以细分具体的小类,如生产类下分软件开发、机械制造等,本实施例对此不做具体限定。
步骤102,目标财务预测模型训练装置根据企业历史财务数据确定样本数据以及样本标签,并基于企业历史相关数据和样本数据确定样本数据中各数据项分别对应的权重系数。
其中,所述样本数据中包括连续的n天的财务数据发生时间、财务数据组成,所述样本标签为第n+1天的财务数据。例如,企业历史财务数据包括7月1日至7月31日的财务数据,则可以按照时间窗(时间窗的长度即n的大小)的方式确定多个样本数据,若n为10步长为5,则获取的样本数据1为7月1日至7月10日的财务数据发生时间、财务数据,样本数据1的标签为7月11日的财务数据,样本数据2为7月6日至7月15日的财务数据发生时间、财务数据,样本数据2的标签为7月16日的财务数据,样本数据3为7月11日至7月20日的财务数据发生时间、财务数据,样本数据3的标签为7月21日的财务数据,样本数据4为7月16日至7月25日的财务数据发生时间、财务数据,样本数据4的标签为7月26日的财务数据,样本数据5为7月21日至7月30日的财务数据发生时间、财务数据,样本数据5的标签为7月31日的财务数据。
在本发明提供的一个可选实施例中,所述基于所述企业历史相关数据和所述样本数据确定样本数据中各数据项分别对应的权重系数,包括:
步骤1021,基于所述样本数据中的财务数据发生时间,获取所述企业历史相关数据中对应时间段的企业历史相关数据。
例如,财务数据发生时间为7月1日至7月10日,则获取企业历史相关数据中时间为7月1日至7月10日的企业历史相关数据。
步骤1022,将对应时间段的企业历史相关数据以及所述样本数据转换成对应的第一数据特征。
步骤1023,将所述第一数据特征输入到权重系数确定模型中,得到样本数据中各数据项分别对应的权重系数。
其中,样本数据中包括多个数据项,该数据项具体可以为销售数据、利润数据以及成本数据等。权重系数用于表示数据项对应数据对未来数据预测的影响程度。具体的,本实施例可以根据每个样本数据及其对应时间段的企业历史相关数据之间的数据关系确定权重系数,即对应时间段的企业历史相关数据对样本数据中的某个数据项影响越大,该数据项对应的权重系数越大。例如,企业历史相关数据中关于购买进货商的商品价格提高,相应的成本数据增加,即该成本数据对应的权重系数设置的越大。
在本发明提供的一个实施例中,所述权重系数确定模型的训练过程包括:基于所述企业历史相关数据,获取每个样本数据分别对应的对应时间段的企业历史相关数据;根据每个样本数据及其对应时间段的企业历史相关数据之间的数据关系确定权重标签;通过每个样本数据对应的第一数据特征以及权重标签进行模型训练得到所述权重系数确定模型。
在本实施例中,权重标签为管理人员根据每个样本数据及其对应时间段的企业历史相关数据之间的数据关系确定的。
步骤103,目标财务预测模型训练装置基于所述样本数据和各数据项分别对应的权重系数生成样本特征数据矩阵,并根据所述样本特征数据矩阵以及所述样本标签进行模型训练得到财务预测模型。
具体的,可通过Xm={A1B1,A2B2,…AnBn}表示样本特征数据矩阵,即Xm为第m个样本数据,A1为样本数据中第一天财务数据中数据项A的具体取值,B1为样本数据中第一天财务数据中数据项A对应的权重系数,每个样本数据中均包含n天的财务数据。
需要说明的是,若财务数据中包括多个数据项,则样本特征数据矩阵还可以表示为:
其中,A11为样本数据中第一天财务数据中第一个数据项的具体取值,B11为样本数据中第一天财务数据中第一个数据项对应的权重系数,p为数据项的个数,n为一个样本数据中包含的n提案财务数据。
在本发明提供的一个可选实施例中,所述目标财务预测模型训练装置基于所述样本数据和各数据项分别对应的权重系数生成样本特征数据矩阵,包括:将所述样本数据转换成第一数据矩阵,所述第一数据矩阵中的每行代表一天的财务数据,每列代表一个数据项;对所述第一数据矩阵中的每个数据项乘以对应的权重系数得到所述样本特征数据矩阵。
如上述公式,每行代表一天的财务数据,每列为每个数据项乘以对应的权重系数。
在本发明提供的一个可选实施例中,根据所述样本特征数据矩阵以及所述样本标签进行模型训练得到财务预测模型,包括:
步骤1031,将所述样本特征数据矩阵输入到所述财务预测模型得到所述样本特征数据矩阵对应的预测标签。
步骤1032,计算所述样本特征数据矩阵的预测标签和样本标签之间的损失值,所述损失值根据所述样本数据中各个数据项的预测值和实际值之间的差异值计算得到。
在本发明提供的一个可选实施例中,所述计算所述样本特征数据矩阵的预测标签和样本标签之间的损失值,包括:获取所述预测标签中每个数据项对应的预测值,以及获取所述样本标签中每个数据项对应的实际值;根据所述预测值与所述实际值计算得到每个数据项的差值绝对值;对所有数据项的差值绝对值与其对应的权重系数进行加权计算得到所述损失值。
在本发明提供的另一个可选实施例中,所述计算所述样本特征数据矩阵的预测标签和样本标签之间的损失值,包括:获取所述预测标签中每个数据项对应的预测值,以及获取所述样本标签中每个数据项对应的实际值;根据所述预测值与所述实际值计算得到每个数据项的差值绝对值;并根据所述预测值对应的概率值以及权重系数计算得到损失系数;根据所述损失系数对所有数据项的差值绝对值进行加权计算得到所述损失值。
具体的,可以对预测值对应的概率值以及权重系数进行相乘得到损失系数,然后根据损失系数对所有数据项的差值绝对值进行加权计算得到所述损失值。
步骤1033,当所述损失值满足预置条件,完成所述财务预测模型的训练。
其中,预置条件为设置的一个具体的数值,如该损失值小于该数值时,该财务预测模型训练完成,否则继续使用样本数据对财务预测模型进行训练,直至模型的损失值小于该数值。
步骤104,财务预测模型识别装置获取财务数据处理装置发送的待预测企业的财务预测请求,财务预测请求中包括待预测企业的企业历史财务数据以及企业相关数据。
步骤105,财务预测模型识别装置基于待预测企业的企业历史财务数据以及企业相关数据,预测待预测企业的财务数据。
在本实施例中,财务预测模型识别装置首先根据预置映射表确定待预测企业的企业历史财务数据确定对应的财务预测模型,根据待预测企业的企业历史财务数据以及企业相关数据确定特征数据矩阵(特征数据矩阵的确定方式同步骤101-步骤103),然后将特征数据矩阵输入到对应的财务预测模型,便可以预测待预测企业的财务数据。
本发明实施例提供一种基于大数据处理的财务预测模型的构建方法,财务数据处理装置获取目标企业的企业历史财务数据以及企业历史相关数据,根据预置映射表确定与所述目标企业的企业规模以及企业类型对应的目标财务预测模型训练装置,并将所述目标企业的企业历史财务数据及企业历史相关数据发送给所述目标财务预测模型训练装置;目标财务预测模型训练装置根据所述企业历史财务数据确定样本数据以及样本标签,并基于企业历史相关数据和样本数据确定样本数据中各数据项分别对应的权重系数;目标财务预测模型训练装置基于样本数据和各数据项分别对应的权重系数生成样本特征数据矩阵,并根据样本特征数据矩阵以及所述样本标签进行模型训练得到财务预测模型;财务预测模型识别装置基于待预测企业的企业历史财务数据以及企业相关数据,预测待预测企业的财务数据。本发明通过训练得到的财务预测模型便可以预测企业的财务数据,相对于现有技术通过财务工作人员对企业用户的财务状况进行预测,通过本发明可在减少工作人员的工作量的同时,提高财务预测的准确度以及效率。
在本发明提供的一个可选实施例中,所述财务预测模型识别装置基于所述待预测企业的企业历史财务数据以及企业相关数据,预测所述待预测企业的财务数据,包括:
步骤1051,基于所述待预测企业的企业历史财务数据确定多个历史特征数据矩阵以及当前特征数据矩阵,每个历史特征数据矩阵中根据连续的n天的财务数据发生时间、财务数据确定。
其中,当前特征数据矩阵为与当前时间最近的连续的n天的财务数据发生时间、财务数据。
步骤1052,将每个历史特征数据矩阵输入到训练好的财务预测模型,分别得到第n+1天的财务预测值。
步骤1053,根据每个历史特征数据矩阵对应的第n+1天的财务预测值及财务实际值的差值,计算财务数据差值平均值。
步骤1054,根据所述财务数据差值平均值以及所述当前特征数据矩阵,预测所述待预测企业的财务数据。
具体的,所述根据所述财务数据差值平均值以及所述当前特征数据矩阵,预测所述待预测企业的财务数据,包括:将所述当前特征数据矩阵输入到训练好的财务预测模型,得到目标财务预测值;计算所述目标财务预测值和所述财务数据差值平均值的差值,得到所述待预测企业的财务数据。
例如,待预测企业的企业历史财务数据包括7月1日至7月21日的财务数据,则可以按照时间窗(时间窗的长度即n的大小)的方式确定多个历史特征数据矩阵,若n为10,步长为5,则获取的历史特征数据矩阵1为7月1日至7月10日的财务数据发生时间、财务数据,历史特征数据矩阵1的财务实际值为7月11日的财务数据,历史特征数据矩阵2为7月6日至7月15日的财务数据发生时间、财务数据,历史特征数据矩阵2的财务实际值为7月16日的财务数据,历史特征数据矩阵3为7月11日至7月20日的财务数据发生时间、财务数据,历史特征数据矩阵3的财务实际值为7月21日的财务数据。然后将历史特征数据矩阵1、历史特征数据矩阵2、历史特征数据矩阵3分别输入到对应的训练好的财务预测模型,分别得到7月11、7月16日、7月21日的财务预测值,之后计算7月11、7月16日、7月21日的财务预测值与财务实际值的差值,并对所有差值求平均得到财务数据差值平均值。
当前特征数据矩阵为7月11日至7月21日的财务数据发生时间、财务数据,将前特征数据矩阵输入到训练好的财务预测模型,得到目标财务预测值,之后计算目标财务预测值和所述财务数据差值平均值的差值,得到所述待预测企业的财务数据。
以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。

Claims (4)

1.一种基于大数据处理的财务预测模型的构建方法,其特征在于,所述构建方法应用于构建系统,所述构建系统包括财务数据处理装置、财务预测模型训练装置以及财务预测模型识别装置;所述构建方法包括:
所述财务数据处理装置获取目标企业的企业历史财务数据以及企业历史相关数据,根据预置映射表确定与所述目标企业的企业规模以及企业类型对应的目标财务预测模型训练装置,并将所述目标企业的企业历史财务数据及企业历史相关数据发送给所述目标财务预测模型训练装置,所述预置映射表中存储有不同企业规模以及企业类型分别对应的财务预测模型训练装置的对应关系;
所述目标财务预测模型训练装置根据所述企业历史财务数据确定样本数据以及样本标签,并基于所述企业历史相关数据和所述样本数据确定样本数据中各数据项分别对应的权重系数;所述样本数据中包括连续的n天的财务数据发生时间、财务数据组成,所述样本标签为第n+1天的财务数据;
所述目标财务预测模型训练装置基于所述样本数据和各数据项分别对应的权重系数生成样本特征数据矩阵,并根据所述样本特征数据矩阵以及所述样本标签进行模型训练得到财务预测模型;
所述财务预测模型识别装置获取所述财务数据处理装置发送的待预测企业的财务预测请求,所述财务预测请求中包括待预测企业的企业历史财务数据以及企业相关数据;
所述财务预测模型识别装置基于所述待预测企业的企业历史财务数据以及企业相关数据,预测所述待预测企业的财务数据;
所述基于所述企业历史相关数据和所述样本数据确定样本数据中各数据项分别对应的权重系数,包括:
基于所述样本数据中的财务数据发生时间,获取所述企业历史相关数据中对应时间段的企业历史相关数据;
将所述对应时间段的企业历史相关数据以及所述样本数据转换成对应的第一数据特征;
将所述第一数据特征输入到权重系数确定模型中,得到所述样本数据中各数据项分别对应的权重系数;
所述权重系数确定模型的训练过程包括:
基于所述企业历史相关数据,获取每个样本数据分别对应的对应时间段的企业历史相关数据;
根据每个样本数据及其对应时间段的企业历史相关数据之间的数据关系确定权重标签;
通过每个样本数据对应的第一数据特征以及权重标签进行模型训练得到所述权重系数确定模型;
所述目标财务预测模型训练装置基于所述样本数据和各数据项分别对应的权重系数生成样本特征数据矩阵,包括:
将所述样本数据转换成第一数据矩阵,所述第一数据矩阵中的每行代表一天的财务数据,每列代表一个数据项;
对所述第一数据中的每个数据项乘以对应的权重系数得到所述样本特征数据矩阵;
根据所述样本特征数据矩阵以及所述样本标签进行模型训练得到财务预测模型,包括:
将所述样本特征数据矩阵输入到所述财务预测模型得到所述样本特征数据矩阵对应的预测标签;
计算所述样本特征数据矩阵的预测标签和样本标签之间的损失值,所述损失值根据所述样本数据中各个数据项的预测值和实际值之间的差异值计算得到;
当所述损失值满足预置条件,完成所述财务预测模型的训练;
所述计算所述样本特征数据矩阵的预测标签和样本标签之间的损失值,包括:
获取所述预测标签中每个数据项对应的预测值,以及获取所述样本标签中每个数据项对应的实际值;
根据所述预测值与所述实际值计算得到每个数据项的差值绝对值;
对所有数据项的差值绝对值与其对应的权重系数进行加权计算得到所述损失值;
所述计算所述样本特征数据矩阵的预测标签和样本标签之间的损失值,包括:
获取所述预测标签中每个数据项对应的预测值,以及获取所述样本标签中每个数据项对应的实际值;
根据所述预测值与所述实际值计算得到每个数据项的差值绝对值;并根据所述预测值对应的概率值以及权重系数计算得到损失系数;
根据所述损失系数对所有数据项的差值绝对值进行加权计算得到所述损失值。
2.根据权利要求1所述的构建方法,其特征在于,所述财务预测模型识别装置基于所述待预测企业的企业历史财务数据以及企业相关数据,预测所述待预测企业的财务数据,包括:
基于所述待预测企业的企业历史财务数据确定多个历史特征数据矩阵以及当前特征数据矩阵,每个历史特征数据矩阵中根据连续的n天的财务数据发生时间、财务数据确定;
将每个历史特征数据矩阵输入到训练好的财务预测模型,分别得到第n+1天的财务预测值;
根据每个历史特征数据矩阵对应的第n+1天的财务预测值及财务实际值的差值,计算财务数据差值平均值;
根据所述财务数据差值平均值以及所述当前特征数据矩阵,预测所述待预测企业的财务数据。
3.根据权利要求2所述的构建方法,其特征在于,所述根据所述财务数据差值平均值以及所述当前特征数据矩阵,预测所述待预测企业的财务数据,包括:
将所述当前特征数据矩阵输入到训练好的财务预测模型,得到目标财务预测值;
计算所述目标财务预测值和所述财务数据差值平均值的差值,得到所述待预测企业的财务数据。
4.一种基于大数据处理的财务预测模型的构建系统,该系统实现如权利要求1所述的方法,其特征在于,所述构建系统包括:财务数据处理装置、财务预测模型训练装置以及财务预测模型识别装置;
所述财务数据处理装置,用于获取目标企业的企业历史财务数据以及企业历史相关数据,根据预置映射表确定与所述目标企业的企业规模以及企业类型对应的目标财务预测模型训练装置,并将所述目标企业的企业历史财务数据及企业历史相关数据发送给所述目标财务预测模型训练装置,所述预置映射表中存储有不同企业规模以及企业类型分别对应的财务预测模型训练装置的对应关系;
所述目标财务预测模型训练装置,用于根据所述企业历史财务数据确定样本数据以及样本标签,并基于所述企业历史相关数据和所述样本数据确定样本数据中各数据项分别对应的权重系数;所述样本数据中包括连续的n天的财务数据发生时间、财务数据组成,所述样本标签为第n+1天的财务数据;
所述目标财务预测模型训练装置,用于基于所述样本数据和各数据项分别对应的权重系数生成样本特征数据矩阵,并根据所述样本特征数据矩阵以及所述样本标签进行模型训练得到财务预测模型;
所述财务预测模型识别装置,用于获取所述财务数据处理装置发送的待预测企业的财务预测请求,所述财务预测请求中包括待预测企业的企业历史财务数据以及企业相关数据;
所述财务预测模型识别装置,用于基于所述待预测企业的企业历史财务数据以及企业相关数据,预测所述待预测企业的财务数据。
CN202311481573.6A 2023-11-08 2023-11-08 一种基于大数据处理的财务预测模型的构建方法及系统 Active CN117541411B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311481573.6A CN117541411B (zh) 2023-11-08 2023-11-08 一种基于大数据处理的财务预测模型的构建方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311481573.6A CN117541411B (zh) 2023-11-08 2023-11-08 一种基于大数据处理的财务预测模型的构建方法及系统

Publications (2)

Publication Number Publication Date
CN117541411A CN117541411A (zh) 2024-02-09
CN117541411B true CN117541411B (zh) 2024-06-11

Family

ID=89793046

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311481573.6A Active CN117541411B (zh) 2023-11-08 2023-11-08 一种基于大数据处理的财务预测模型的构建方法及系统

Country Status (1)

Country Link
CN (1) CN117541411B (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6124232B1 (ja) * 2016-11-15 2017-05-10 シーロムパートナーズ税理士法人 財務予測システム、財務予測方法、及び財務予測プログラム
CN112905839A (zh) * 2021-02-10 2021-06-04 北京有竹居网络技术有限公司 模型训练方法、模型使用方法、装置、存储介质及设备
CN112950004A (zh) * 2021-02-07 2021-06-11 成都工业职业技术学院 一种企业财务风险预警方法、装置及计算机可读存储介质
CN113269359A (zh) * 2021-05-20 2021-08-17 深圳易财信息技术有限公司 用户财务状况预测方法、设备、介质及计算机程序产品
CN114048436A (zh) * 2021-11-11 2022-02-15 北京道口金科科技有限公司 一种预测企业财务数据模型构建方法及构建装置
CN114118526A (zh) * 2021-10-29 2022-03-01 中国建设银行股份有限公司 一种企业风险预测方法、装置、设备及存储介质
CN114155072A (zh) * 2021-11-23 2022-03-08 安徽经邦软件技术有限公司 基于大数据分析的财务预测模型构建方法及系统
CN116402630A (zh) * 2023-06-09 2023-07-07 深圳市迪博企业风险管理技术有限公司 一种基于表征学习的财务风险预测方法及系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20230259440A1 (en) * 2022-02-14 2023-08-17 Bank Of America Corporation Dynamically Providing Real-Time Configuration of Data Research Control Limits

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6124232B1 (ja) * 2016-11-15 2017-05-10 シーロムパートナーズ税理士法人 財務予測システム、財務予測方法、及び財務予測プログラム
CN112950004A (zh) * 2021-02-07 2021-06-11 成都工业职业技术学院 一种企业财务风险预警方法、装置及计算机可读存储介质
CN112905839A (zh) * 2021-02-10 2021-06-04 北京有竹居网络技术有限公司 模型训练方法、模型使用方法、装置、存储介质及设备
CN113269359A (zh) * 2021-05-20 2021-08-17 深圳易财信息技术有限公司 用户财务状况预测方法、设备、介质及计算机程序产品
CN114118526A (zh) * 2021-10-29 2022-03-01 中国建设银行股份有限公司 一种企业风险预测方法、装置、设备及存储介质
CN114048436A (zh) * 2021-11-11 2022-02-15 北京道口金科科技有限公司 一种预测企业财务数据模型构建方法及构建装置
CN114155072A (zh) * 2021-11-23 2022-03-08 安徽经邦软件技术有限公司 基于大数据分析的财务预测模型构建方法及系统
CN116402630A (zh) * 2023-06-09 2023-07-07 深圳市迪博企业风险管理技术有限公司 一种基于表征学习的财务风险预测方法及系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
基于数据包络和数据挖掘的财务危机预测模型研究;赵智繁;曹倩;;计算机科学;20161115(第S2期);全文 *
机械制造业上市公司财务预警模型实证研究;景欣;张铁山;;北方工业大学学报;20100615(第02期);全文 *

Also Published As

Publication number Publication date
CN117541411A (zh) 2024-02-09

Similar Documents

Publication Publication Date Title
CN110392899B (zh) 用于模型生成的动态特征选择
US10936947B1 (en) Recurrent neural network-based artificial intelligence system for time series predictions
US5521813A (en) System and method for the advanced prediction of weather impact on managerial planning applications
US8374903B2 (en) Information criterion-based systems and methods for constructing combining weights for multimodel forecasting and prediction
US20200111109A1 (en) Flexible Feature Regularization for Demand Model Generation
Krishna et al. Sales-forecasting of retail stores using machine learning techniques
WO2019089146A1 (en) Demand forecasting using weighted mixed machine learning models
JP6514342B2 (ja) オンライン予測システムおよび方法
Siregar et al. Forecasting of raw material needed for plastic products based in income data using ARIMA method
van Donselaar et al. Heuristics for setting reorder levels in periodic review inventory systems with an aggregate service constraint
JP5031715B2 (ja) 商品需要予測システム、商品の売上数調整システム
US20210304243A1 (en) Optimization of markdown schedules for clearance items at physical retail stores
CN117541411B (zh) 一种基于大数据处理的财务预测模型的构建方法及系统
US20210117828A1 (en) Information processing apparatus, information processing method, and program
Tunacan et al. The impact of information sharing on different performance indicators in a multi-level supply chain
JP6807415B2 (ja) 情報処理装置、情報処理方法及びプログラム
CN111242532A (zh) 一种采购管理方法、装置和电子设备
CN113762842B (zh) 仓储调度方法、服务器和系统
De Kok Buffering against uncertainty in high-tech supply chains
JP2022053055A (ja) 受注予測モデル作成方法、受注予測モデル作成装置、受注予測方法および受注予測装置
CN114626660A (zh) 用于激增调整预报的方法和装置
JP6825479B2 (ja) 推定プログラム、推定装置、及び推定方法
Shaheen ean aaea ee e a uaenneaan eh
Dai et al. Data-Driven Demand Forecast for Online-to-Offline Operations: An Adaptive Hierarchical Incremental Approach
Okadome et al. Demand-prediction architecture for distribution businesses based on multiple rnns with alternative weight update

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant