CN116128135A - 数据处理方法及装置、电子设备和存储介质 - Google Patents

数据处理方法及装置、电子设备和存储介质 Download PDF

Info

Publication number
CN116128135A
CN116128135A CN202310083014.3A CN202310083014A CN116128135A CN 116128135 A CN116128135 A CN 116128135A CN 202310083014 A CN202310083014 A CN 202310083014A CN 116128135 A CN116128135 A CN 116128135A
Authority
CN
China
Prior art keywords
data
financial data
prediction
historical financial
predicting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310083014.3A
Other languages
English (en)
Inventor
吴博
卢刚
朱富荣
庄佳和
林宜领
何易超
张睿翔
刘鑫
李博尊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Construction Bank Corp
CCB Finetech Co Ltd
Original Assignee
China Construction Bank Corp
CCB Finetech Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Construction Bank Corp, CCB Finetech Co Ltd filed Critical China Construction Bank Corp
Priority to CN202310083014.3A priority Critical patent/CN116128135A/zh
Publication of CN116128135A publication Critical patent/CN116128135A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/12Accounting
    • G06Q40/125Finance or payroll

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Finance (AREA)
  • Economics (AREA)
  • Accounting & Taxation (AREA)
  • Theoretical Computer Science (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Development Economics (AREA)
  • Human Resources & Organizations (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Operations Research (AREA)
  • Technology Law (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本公开公开了一种数据处理方法及装置、电子设备和存储介质,涉及大数据及数据预处理技术领域。所述方法包括:对于目标行业,获取多个企业的历史财务数据;分别基于多种预测方法对所述历史财务数据进行预测,得到各所述预测方法对应的预测值;基于所述预测值及所述历史财务数据的真实值确定各所述预测方法的预测误差率;依据所述预测误差率在多种所述预测方法中确定用于预测所述目标行业的企业财务数据的目标预测方法,以基于所述目标预测方法对所述目标行业的企业财务数据的空值进行预测。本公开可以为目标行业从多种预测方法中选出误差最小的预测方法,提高了数据预测的准确度。

Description

数据处理方法及装置、电子设备和存储介质
技术领域
本公开涉及大数据及数据预处理技术领域,尤其涉及一种数据处理方法、数据处理装置、电子设备及存储介质。
背景技术
数据分析与处理对于当今社会各行各业的发展都有着重要作用。例如,基于企业的历年财务数据可以对企业的价值进行评估。然而,实际情况中,由于各种主客观原因,存在发布的财务数据不规范不全面的情况,而财务数据重要科目的缺失,可能会对企业估值结果的准确性产生较大的影响。
相关技术中,通常会将财务数据的空值设置为零或前一期次财务数据中该科目的值,没有提供科学的空值预测方法,误差率较高。
为了解决上述问题,本公开实施例提供了一种数据处理方法、数据处理装置、电子设备及存储介质。
发明内容
本公开提供了一种数据处理方法及装置、电子设备和存储介质,主要目的在于解决相关技术中将财务数据的空值设置为零或前一期次财务数据中该科目的值,没有提供科学的空值预测方法,误差率较高等问题。
根据本公开的一方面,提供了一种数据处理方法,包括:对于目标行业,获取多个企业的历史财务数据;基于多种预测方法对所述历史财务数据进行预测,得到各所述预测方法对应的预测值;基于所述预测值及所述历史财务数据的真实值确定各所述预测方法的预测误差率;依据所述预测误差率在多种所述预测方法中确定用于预测所述目标行业的企业财务数据的目标预测方法,以基于所述目标预测方法对所述目标行业的企业财务数据的空值进行预测。
在本公开实施例中,所述基于多种预测方法对所述历史财务数据进行预测,得到各所述预测方法对应的预测值,包括:确定所述历史财务数据的统计数据,所述统计数据包括所述历史财务数据的增长率及平均值,所述目标行业的行业增长率;基于所述统计数据确定多种所述预测方法,并基于所述预测方法对所述历史财务数据进行预测,得到各所述预测方法对应的预测值。
在本公开实施例中,所述基于所述统计数据确定多种所述预测方法,并基于所述预测方法对所述历史财务数据进行预测,包括:
依据所述历史财务数据的前三期数据的平均值对所述历史财务数据的本期数据进行预测;或者
依据所述历史财务数据的前一期数据及前三期增长率的平均值对所述历史财务数据的本期数据进行预测;或者
依据所述历史财务数据的前一期数据及前一期增长率对所述历史财务数据的本期数据进行预测;或者
依据所述历史财务数据的前三期数据及当前增长率对所述历史财务数据的本期数据进行预测;或者
按照预设比例对所述历史财务数据的前三期数据进行运算,以运算结果预测所述历史财务数据的本期数据;或者
按照预设比例对所述历史财务数据的前三期数据进行运算,依据运算结果及当前增长率预测所述历史财务数据的本期数据;或者
按照预设比例对所述历史财务数据的前三期数据进行运算,依据运算结果及前三期数据的平均值预测所述历史财务数据的本期数据;或者
按照预设比例对所述历史财务数据的前三期增长率进行运算,以运算结果预测所述历史财务数据的本期数据;或者
依据所述目标行业的所述行业增长率及所述历史财务数据的前一期数据预测所述历史财务数据的本期数据。
在本公开实施例中,所述基于所述预测值及所述历史财务数据的真实值确定各所述预测方法的预测误差率,包括:确定所述真实值及所述预测值的误差,并依据所述误差及真实值的比值确定所述预测误差率。
在本公开实施例中,所述方法还包括:接收企业财务数据,并对所述企业财务数据进行数据预处理,所述数据预处理包括异常值处理及空值处理,所述空值处理基于所述预测方法进行;将处理后的所述企业财务数据输入估值模型,得到对应企业的估值结果。
在本公开实施例中,所述空值处理基于所述预测方法进行,包括:依据所述企业财务数据所属的所述目标行业确定对应的所述目标预测方法;依据所述目标预测方法对所述企业财务数据中的空值进行预测,并将预测结果补充至所述财务数据。
根据本公开的另一方面,提供了一种数据处理装置,包括:数据获取模块,被配置为执行对于目标行业,获取多个企业的历史财务数据;预测值确定模块,被配置为执行基于多种预测方法对所述历史财务数据进行预测,得到各所述预测方法对应的预测值;误差确定模块,被配置为执行基于所述预测值及所述历史财务数据的真实值确定各所述预测方法的预测误差率;预测方法选择模块,被配置为执行依据所述预测误差率在多种所述预测方法中确定用于预测所述目标行业的企业财务数据的目标预测方法,以基于所述目标预测方法对所述目标行业的企业财务数据的空值进行预测。
在本公开实施例中,所述数据处理装置还包括估值模块,所述估值模块包括预处理单元及估值单元,其中:所述预处理单元,被配置为执行接收企业财务数据,并对所述企业财务数据进行数据预处理,所述数据预处理包括异常值处理及空值处理,所述空值处理基于所述预测方法进行;所述估值单元,被配置为执行将处理后的所述企业财务数据输入估值模型,得到对应企业的估值结果。
在本公开实施例中,所述预处理单元通过执行以下方法实现基于所述预测方法进行空值处理:依据所述企业财务数据所属的所述目标行业确定对应的所述目标预测方法;依据所述目标预测方法对所述企业财务数据中的空值进行预测,并将预测结果补充至所述财务数据。
在本公开实施例中,所述预测值确定模块具体用于:确定所述历史财务数据的统计数据,所述统计数据包括所述历史财务数据的增长率及平均值,所述目标行业的行业增长率;基于所述统计数据确定多种所述预测方法,并基于所述预测方法对所述历史财务数据进行预测,得到各所述预测方法对应的预测值。
在本公开实施例中,所述预测值确定模块通过执行以下方法实现所述基于所述统计数据确定多种所述预测方法,并基于所述预测方法对所述历史财务数据进行预测:
依据所述历史财务数据的前三期数据的平均值对所述历史财务数据的本期数据进行预测;或者
依据所述历史财务数据的前一期数据及前三期增长率的平均值对所述历史财务数据的本期数据进行预测;或者
依据所述历史财务数据的前一期数据及前一期增长率对所述历史财务数据的本期数据进行预测;或者
依据所述历史财务数据的前三期数据及当前增长率对所述历史财务数据的本期数据进行预测;或者
按照预设比例对所述历史财务数据的前三期数据进行运算,以运算结果预测所述历史财务数据的本期数据;或者
按照预设比例对所述历史财务数据的前三期数据进行运算,依据运算结果及当前增长率预测所述历史财务数据的本期数据;或者
按照预设比例对所述历史财务数据的前三期数据进行运算,依据运算结果及前三期数据的平均值预测所述历史财务数据的本期数据;或者
按照预设比例对所述历史财务数据的前三期增长率进行运算,以运算结果预测所述历史财务数据的本期数据;或者
依据所述目标行业的所述行业增长率及所述历史财务数据的前一期数据预测所述历史财务数据的本期数据。
在本公开实施例中,上述误差确定模块具体用于:确定所述真实值及所述预测值的误差,并依据所述误差及真实值的比值确定所述预测误差率。
根据本公开的另一方面,提供了一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行前述一方面中任一项所述的方法。
根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行前述一方面中任一项所述的方法。
根据本公开的另一方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现前述一方面中任一项所述的方法。
在本公开一个或多个实施例中,对于目标行业,获取多个企业的历史财务数据;分别基于多种预测方法对所述历史财务数据进行预测,得到各所述预测方法对应的预测值;基于所述预测值及所述历史财务数据的真实值确定各所述预测方法的预测误差率;依据所述预测误差率在多种所述预测方法中确定用于预测所述目标行业的企业财务数据的目标预测方法,以基于所述目标预测方法对所述目标行业的企业财务数据的空值进行预测。本公开可以为目标行业从多种预测方法中选出误差最小的预测方法,提高了数据预测的准确度。
应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
附图用于更好地理解本方案,不构成对本公开的限定。其中:
图1示出了可以应用本公开实施例的一种数据处理方法及装置的示例性系统架构的示意图;
图2示出了适于用来实现本公开实施例的电子设备的计算机系统的结构示意图;
图3示意性示出了根据本公开的一个实施例的数据处理方法的流程示意图;
图4示意性示出了根据本公开的一个实施例的企业估值模型的运行流程图;
图5示意性示出了根据本公开的一个具体应用场景的企业估值方法的流程示意图;
图6示意性示出了根据本公开的一个具体应用场景的数据处理方法的流程示意图;
图7示意性示出了根据本公开的一个实施例的数据处理装置的框图。
具体实施方式
现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本公开将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施方式中。在下面的描述中,提供许多具体细节从而给出对本公开的实施方式的充分理解。然而,本领域技术人员将意识到,可以实践本公开的技术方案而省略所述特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知技术方案以避免喧宾夺主而使得本公开的各方面变得模糊。
此外,附图仅为本公开的示意性图解,并非一定是按比例绘制。图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。附图中所示的一些方框图是功能实体,不一定必须与物理或逻辑上独立的实体相对应。可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
图1示出了可以应用本公开实施例的一种数据处理方法及装置的示例性应用环境的系统架构的示意图。
如图1所示,系统架构100可以包括终端设备101、102、103中的一个或多个,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。终端设备101、102、103包括但不限于台式计算机、便携式计算机、智能手机和平板电脑等等。应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。比如服务器105可以是多个服务器组成的服务器集群等。
本公开实施例所提供的数据处理方法可以由终端设备101、102、103执行,相应地,数据处理装置可以设置于终端设备101、102、103中。本公开实施例所提供的数据处理方法可以由服务器105执行,相应地,数据处理装置可以设置于服务器105中。本公开实施例所提供的数据处理方法也可以由终端设备101、102、103与服务器105共同执行,相应地,数据处理装置可以设置于终端设备101、102、103与服务器105中,本示例性实施例中对此不做特殊限定。
例如,在本示例实施方式中,上述数据处理方法可以由服务器105执行。针对某一目标行业,服务器105获取多个历史财务数据;基于多种预测方法对历史财务数据进行预测,得到各预测方法对应的预测值;基于所述预测值及所述历史财务数据的真实值确定各所述预测方法的预测误差率;依据预测误差率在多种预测方法中确定用于预测目标行业的企业财务数据的目标预测方法,以基于目标预测方法对目标行业的企业财务数据的空值进行预测。
图2示出了适于用来实现本公开实施例的电子设备的计算机系统的结构示意图。
需要说明的是,图2示出的电子设备的计算机系统200仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图2所示,计算机系统200包括中央处理单元(CPU)201,其可以根据存储在只读存储器(ROM)202中的程序或者从存储部分208加载到随机访问存储器(RAM)203中的程序而执行各种适当的动作和处理。在RAM 203中,还存储有系统操作所需的各种程序和数据。CPU201、ROM 202以及RAM 203通过总线204彼此相连。输入/输出(I/O)接口205也连接至总线204。
以下部件连接至I/O接口205:包括键盘、鼠标等的输入部分206;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分207;包括硬盘等的存储部分208;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分209。通信部分209经由诸如因特网的网络执行通信处理。驱动器210也根据需要连接至I/O接口205。可拆卸介质211,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器210上,以便于从其上读出的计算机程序根据需要被安装入存储部分208。
数据分析与处理对于当今社会各行各业的发展都有着重要作用。例如,基于企业的历年财务数据可以对企业的价值进行评估。然而,实际情况中,由于各种主客观原因,存在发布的财务数据不规范不全面的情况,而财务数据重要科目的缺失,可能会对企业估值结果的准确性产生较大的影响。
相关技术中,通常会将财务数据的空值设置为零或前一期次财务数据中该科目的值,没有提供科学的空值预测方法,误差率较高。
为了解决上述方法中存在的问题,本示例实施方式提出了一种数据处理方法、数据处理装置、电子设备以及计算机可读存储介质。以下对本公开实施例的技术方案进行详细阐述:
本示例实施方式首先提供了一种数据处理方法。参考图3所示,该数据处理方法具体包括以下步骤:
步骤S310:对于目标行业,获取多个企业的历史财务数据;
步骤S320:基于多种预测方法对历史财务数据进行预测,得到各预测方法对应的预测值;
步骤S330:基于预测值及历史财务数据的真实值确定各预测方法的预测误差率;
步骤S340:依据预测误差率在多种预测方法中确定用于预测目标行业的企业财务数据的目标预测方法,以基于目标预测方法对目标行业的企业财务数据的空值进行预测。
本公开实施例所提供的数据处理方法通过多种预测方法对作为训练数据集的企业历史财务数据的数值进行预测,并基于预测值及真实值确定误差率,从而可以依据误差率为当前目标行业从多种预测方法中选出误差最小的预测方法,提高了数据预测的准确度。
下面,在另一实施例中,对上述步骤进行更加详细的说明。
在步骤S310中,对于目标行业,获取多个企业的历史财务数据。
本公开实施例所提供的数据处理方法可以用于企业估值场景中,对企业财务数据空值的预测。企业价值评估是对企业整体价值进行分析和估算的过程,一般情况下通过将企业的财务数据输入企业价值评估模型实现。在现实场景中,企业发布的财务数据可能存在由于各种原因存在部分科目值缺失不全的情况,本公开实施例提供的数据处理方法在这种情况下,可以对企业发布的财务数据中的空值进行精确度较高的预测,以便提高企业估值结果的可信度。
在本公开实施例中,上述目标行业为需要进行数据预测的行业,上述企业为属于上述目标行业的企业,上述历史财务数据为获取到的属于目标行业的企业的历史财务数据。以上述企业价值预估场景为例,上述目标行业可以为农、林、牧、渔业、采矿业、食品类、建筑业、零售业、交通运输、仓储及邮政业、住宿和餐饮业及租赁和商业服务业,以及信息传输、软件和信息技术服务业等行业领域。当目标行业为信息传输、软件和信息技术服务业时,上述企业即为属于该行业领域的企业。
上述对于目标行业,获取多个企业的历史财务数据即为获取属于该行业领域的企业历年发表的财务数据,其中,历年财务数据可以包括外部经济数据和企业内部财务数据,上述外部经济数据包含宏观经济指数、金融市场数据、要素价格指数、行业经济数据等,上述企业内部财务数据包含资产负债表、利润表、现金流量表和财务附注等。
在步骤S320中,基于多种预测方法对历史财务数据进行预测,得到各预测方法对应的预测值。
在本公开实施例中,将通过步骤S310获取到的历史财务数据作为训练数据集,并通过预设的多种预测方法对上述历史财务数据的数值进行预测,上述预测值即为通过各预测方法计算得到的历史财务数据的值。
上述将历史财务数据作为训练数据集,分别基于多种预测方法对历史财务数据进行预测,得到各预测方法对应的预测值可以实现如下:确定历史财务数据的统计数据,该统计数据可以包括历史财务数据的增长率及平均值,以及目标行业的行业增长率;基于统计数据确定多种预测方法,并基于预测方法对历史财务数据进行预测,得到各预测方法对应的预测值。
示例性地,本公开实施例提供了九种预测方法,分别为:
(1)依据历史财务数据的前三期数据的平均值对历史财务数据的本期数据进行预测;
(2)依据历史财务数据的前一期数据及前三期增长率的平均值对历史财务数据的本期数据进行预测;
(3)依据历史财务数据的前一期数据及前一期增长率对历史财务数据的本期数据进行预测;
(4)依据历史财务数据的前三期数据及当前增长率对历史财务数据的本期数据进行预测;
(5)按照预设比例对历史财务数据的前三期数据进行运算,以运算结果预测历史财务数据的本期数据;
(6)按照预设比例对历史财务数据的前三期数据进行运算,依据运算结果及当前增长率预测历史财务数据的本期数据;
(7)按照预设比例对历史财务数据的前三期数据进行运算,依据运算结果及前三期数据的平均值预测历史财务数据的本期数据;
(8)按照预设比例对历史财务数据的前三期增长率进行运算,以运算结果预测历史财务数据的本期数据;
(9)依据目标行业的行业增长率及历史财务数据的前一期数据预测历史财务数据的本期数据。
则在本公开实施例中,本步骤通过上述九种预测方法依次对上述历史财务数据进行预测,得到对应的预测值。具体地,上述九种预测方法的运算规则可以依次对应于下表1:
表1:
Figure BDA0004068113170000101
Figure BDA0004068113170000111
上述九种预测方法分别从不同的业务角度对企业财务数据的空值进行预测,不同预测方法适用于不同的场景。例如,上述三年平均预测方法适合于预测企业长期变化不大的财务报表科目;上述三年比例预测方法适合于预测企业稳定增长和变化的财务报表科目;上述最新比例预测方法适合于预测企业将继续维持最近的增长和变化的财务报表科目;上述行业增长率预测方法适合于预测企业将按照行业增长率变化的财务报表科目。
其中,上述行业增长率可以国家统计局发布的数据获取,示例性地,2018年至2020年部分上述目标行业的行业增长率如表2所示:
表2:
行业类别 2020年 2019年 2018年
农林牧渔业 103.1 103.2 103.6
工业 102.4 104.8 106.1
建筑业 103.5 105.2 104.8
批发和零售业 98.7 105.6 106.7
交通运输、仓储和邮政业 100.5 106.5 108.3
住宿和餐饮业 86.9 105.5 106.7
金融业 107 106.6 104.8
房地产业 102.9 102.6 103.5
需要说明的是,上述场景只是一种示例性说明,本示例实施方式所提供的数据处理方法的保护范畴并不以此为限。例如,上述预测方法可以为其他运算规则。
在步骤S330中,基于预测值及历史财务数据的真实值确定各预测方法的预测误差率。
在本公开实施例中,上述预测误差率用于衡量通过各预测方法得到的预测值的准确度。在通过步骤S320提供的各预测方法计算得到对应的预测值后,该步骤用于确定各预测方法的预测误差率。示例性地,可以通过以下方法确定预测误差率:确定真实值及预测值的误差,并依据误差及真实值的比值确定预测误差率。
其中,上述误差是真实值和预测值之间的差值,用于衡量预测结果的准确度。上述依据误差及真实值的比值确定预测误差率的公式可以如下:误差率(绝对值)=绝对值(真实值-预测值)/真实值*100%。
在步骤S340中,依据预测误差率在多种预测方法中确定用于预测目标行业的企业财务数据的目标预测方法,以基于目标预测方法对目标行业的企业财务数据的空值进行预测。
在本公开实施例中,上述目标预测方法为从上述多种预测方法选出的用于对属于目标行业的企业的财务数据中的空值进行预测的预测方法。在经过上述步骤S310至步骤S330得到各种预测方法的预测误差率后,本步骤依据所确定的预测误差率选择上述目标预测方法。示例性地,可以从预测方法中选择预测误差率最低的预测方法作为目标预测方法。
以上述九种预测方法为例,对于各目标行业,假设以上述历史财务数据作为测试数据,通过步骤S330计算得到的预测误差率如下表3所示:
表3:
Figure BDA0004068113170000121
上述表3部分地展示了各预测方法用于目标行业的企业财务数据预测的预测误差率,针对各目标行业,可以从中选择预测误差率最小的预测方法作为该目标行业的企业财务数据预测的目标预测方法。
在本公开实施例的另一实施例中,在选定上述目标预测方法后,可以基于选定的目标预测方法在企业估值的过程中对企业财务数据的空值进行预测。
示例性地,上述企业估值可以通过以下过程实现:接收企业财务数据,并对企业财务数据进行数据预处理,上述数据预处理包括异常值处理及空值处理,其中,空值处理基于上述选定的目标预测方法进行;将处理后的企业财务数据输入估值模型,得到对应企业的估值结果。
其中,上述预处理过程中的空值处理可以实现如下:依据企业财务数据所属的目标行业确定对应的目标预测方法;依据目标预测方法对企业财务数据中的空值进行预测,并将预测结果补充至财务数据。
下面,在企业估值的具体应用场景中,对上述数据处理方法在企业估值中所起的作用进行说明:
如图4所示,为企业估值模型的运行流程图。结合图4,该企业估值方法如图5所示,包括以下流程:
在步骤S510中:接收企业财务数据。
上述企业财务数据为用于企业估值的估值数据,包括外部经济数据和企业内部财务数据。其中,外部经济数据有宏观经济指数、金融市场数据、要素价格指数、行业经济数据等。而企业内部财务数据有资产负债表、利润表、现金流量表和财务附注等。
在步骤S520中,对企业财务数据进行预处理。
该估值预处理是对估值数据进行检核加工,可以包括空值处理及异常值处理等。此外,该步骤还用于根据企业的特征选择出适合企业的估值模型。其中,上述估值模型可以包括现金流量模型(DCF)、资本资产定价模型(CAPM)、相对估值PE模型、相对估值PB模型、相对估值PS模型和资产基础法等。
其中,空值处理可以通过上述数据处理方法实现,在该具体应用场景中,可以通过图6所示的流程实现:
在步骤S610中,获取历史财务数据。
在该步骤中,上述历史财务数据包括多个企业的历年财务报表数据。该企业财务报表包括资产负债表、利润表、现金流量表和财务附注等;而财务报表由会计科目组成,不同的会计科目从不同的财务角度观察和量化企业当期的财务特征。
在步骤S620中,将历史财务数据对应的各企业按所属行业进行分组。
由于同行业的企业往往具有相似的经营范围和经营模式,其财务状况也会随着行业景气的波动受到类似的影响。所以,本步骤将所有企业按照国标行业进行分组。示例性地,分组结果可如下表4所示:
表4:
企业名称 所属行业类别
A企业 农、林、牧、渔业
B企业 农、林、牧、渔业
C企业 采矿业
D企业 食品类
E企业 建筑业
F企业 零售业
G企业 交通运输、仓储及邮政业
H企业 住宿和餐饮业及租赁和商业服务业
I企业 信息传输、软件和信息技术服务业
在步骤S630中,基于不同预测方法对历史财务数据进行预测,并计算对应的预测误差率。
在步骤S640中,选择误差率最小的预测方法作为目标预测方法。
在步骤S650中,依据目标预测方法对上述企业财务数据中的空值进行预测。
其中,上述步骤S610至步骤S650的具体实现细节已在上述数据处理方法的对应位置进行了详细说明,故在此不再赘述。
在步骤S530中,将经过预处理的企业财务数据输入所选的企业估值模型,得到估值结果。
在该步骤中,将经过预处理的企业财务数据输入所选的企业估值模型,得到估值结果,并对估值结果进行分析及检查,验证预测结果的合理性,最终反馈给用户使用。
应当注意,尽管在附图中以特定顺序描述了本公开中方法的各个步骤,但是,这并非要求或者暗示必须按照该特定顺序来执行这些步骤,或是必须执行全部所示的步骤才能实现期望的结果。附加的或备选的,可以省略某些步骤,将多个步骤合并为一个步骤执行,以及/或者将一个步骤分解为多个步骤执行等。
下述为本公开装置实施例,可以用于执行本公开方法实施例。对于本公开装置实施例中未披露的细节,请参照本公开方法实施例。
请参见图7,其示出了用来实现本公开实施例的数据处理装置。该数据处理装置可以通过软件、硬件或者两者的结合实现成为装置的全部或一部分。该数据处理装置700包括数据获取模块710、预测值确定模块720、误差确定模块730以及预测方法选择模块740,其中:
数据获取模块710,被配置为执行对于目标行业,获取多个企业的历史财务数据;
预测值确定模块720,被配置为执行分别基于多种预测方法对历史财务数据进行预测,得到各预测方法对应的预测值;
误差确定模块730,被配置为执行基于预测值及历史财务数据的真实值确定各预测方法的预测误差率;
预测方法选择模块740,被配置为执行依据预测误差率在多种预测方法中确定用于预测目标行业的企业财务数据的目标预测方法,以基于目标预测方法对目标行业的企业财务数据的空值进行预测。
在本公开实施例中,上述数据处理装置还包括估值模块,该估值模块包括预处理单元及估值单元,其中:预处理单元,被配置为执行接收企业财务数据,并对企业财务数据进行数据预处理,上述数据预处理包括异常值处理及空值处理,其中,空值处理基于预测方法进行;上述估值单元,被配置为执行将处理后的企业财务数据输入估值模型,得到对应企业的估值结果。
在本公开实施例中,上述预处理单元通过执行以下方法实现空值处理:依据企业财务数据所属的目标行业确定对应的目标预测方法;依据目标预测方法对企业财务数据中的空值进行预测,并将预测结果补充至财务数据。
在本公开实施例中,上述预测值确定模块具体用于:确定历史财务数据的统计数据,该统计数据包括历史财务数据的增长率及平均值,目标行业的行业增长率;基于统计数据确定多种预测方法,并基于各预测方法对历史财务数据进行预测,得到各预测方法对应的预测值。
在本公开实施例中,上述预测值确定模块通过执行以下方法实现基于统计数据确定多种预测方法,并基于各预测方法对历史财务数据进行预测:
依据历史财务数据的前三期数据的平均值对历史财务数据的本期数据进行预测;或者
依据历史财务数据的前一期数据及前三期增长率的平均值对历史财务数据的本期数据进行预测;或者
依据历史财务数据的前一期数据及前一期增长率对历史财务数据的本期数据进行预测;或者
依据历史财务数据的前三期数据及当前增长率对历史财务数据的本期数据进行预测;或者
按照预设比例对历史财务数据的前三期数据进行运算,以运算结果预测历史财务数据的本期数据;或者
按照预设比例对历史财务数据的前三期数据进行运算,依据运算结果及当前增长率预测历史财务数据的本期数据;或者
按照预设比例对历史财务数据的前三期数据进行运算,依据运算结果及前三期数据的平均值预测历史财务数据的本期数据;或者
按照预设比例对历史财务数据的前三期增长率进行运算,以运算结果预测历史财务数据的本期数据;或者
依据目标行业的行业增长率及历史财务数据的前一期数据预测历史财务数据的本期数据。
在本公开实施例中,上述误差确定模块具体用于:确定真实值及预测值的误差,并依据误差及真实值的比值确定预测误差率。
应当注意,尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本公开的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。
作为另一方面,本申请还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该电子设备执行时,使得该电子设备实现如下述实施例中所述的方法。
需要说明的是,本公开所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims (10)

1.一种数据处理方法,其特征在于,包括:
对于目标行业,获取多个企业的历史财务数据;
基于多种预测方法对所述历史财务数据进行预测,得到各所述预测方法对应的预测值;
基于所述预测值及所述历史财务数据的真实值确定各所述预测方法的预测误差率;
依据所述预测误差率在多种所述预测方法中确定用于预测所述目标行业的企业财务数据的目标预测方法,以基于所述目标预测方法对所述目标行业的企业财务数据的空值进行预测。
2.根据权利要求1所述的数据处理方法,其特征在于,所述基于多种预测方法对所述历史财务数据进行预测,得到各所述预测方法对应的预测值,包括:
确定所述历史财务数据的统计数据,所述统计数据包括所述历史财务数据的增长率及平均值,所述目标行业的行业增长率;
基于所述统计数据确定多种所述预测方法,并基于所述预测方法对所述历史财务数据进行预测,得到各所述预测方法对应的预测值。
3.根据权利要求2所述的数据处理方法,其特征在于,所述基于所述统计数据确定多种所述预测方法,并基于所述预测方法对所述历史财务数据进行预测,包括:
依据所述历史财务数据的前三期数据的平均值对所述历史财务数据的本期数据进行预测;或者
依据所述历史财务数据的前一期数据及前三期增长率的平均值对所述历史财务数据的本期数据进行预测;或者
依据所述历史财务数据的前一期数据及前一期增长率对所述历史财务数据的本期数据进行预测;或者
依据所述历史财务数据的前三期数据及当前增长率对所述历史财务数据的本期数据进行预测;或者
按照预设比例对所述历史财务数据的前三期数据进行运算,以运算结果预测所述历史财务数据的本期数据;或者
按照预设比例对所述历史财务数据的前三期数据进行运算,依据运算结果及当前增长率预测所述历史财务数据的本期数据;或者
按照预设比例对所述历史财务数据的前三期数据进行运算,依据运算结果及前三期数据的平均值预测所述历史财务数据的本期数据;或者
按照预设比例对所述历史财务数据的前三期增长率进行运算,以运算结果预测所述历史财务数据的本期数据;或者
依据所述目标行业的所述行业增长率及所述历史财务数据的前一期数据预测所述历史财务数据的本期数据。
4.根据权利要求1所述的数据处理方法,其特征在于,所述基于所述预测值及所述历史财务数据的真实值确定各所述预测方法的预测误差率,包括:
确定所述真实值及所述预测值的误差,并依据所述误差及真实值的比值确定所述预测误差率。
5.根据权利要求1所述的数据处理方法,其特征在于,所述方法还包括:
接收企业财务数据,并对所述企业财务数据进行数据预处理,所述数据预处理包括异常值处理及空值处理,所述空值处理基于所述预测方法进行;
将处理后的所述企业财务数据输入估值模型,得到对应企业的估值结果。
6.根据权利要求5所述的数据处理方法,其特征在于,所述空值处理基于所述预测方法进行,包括:
依据所述企业财务数据所属的所述目标行业确定对应的所述目标预测方法;
依据所述目标预测方法对所述企业财务数据中的空值进行预测,并将预测结果补充至所述财务数据。
7.一种数据处理装置,其特征在于,包括:
数据获取模块,被配置为执行对于目标行业,获取多个企业的历史财务数据;
预测值确定模块,被配置为执行基于多种预测方法对所述历史财务数据进行预测,得到各所述预测方法对应的预测值;
误差确定模块,被配置为执行基于所述预测值及所述历史财务数据的真实值确定各所述预测方法的预测误差率;
预测方法选择模块,被配置为执行依据所述预测误差率在多种所述预测方法中确定用于预测所述目标行业的企业财务数据的目标预测方法,以基于所述目标预测方法对所述目标行业的企业财务数据的空值进行预测。
8.根据权利要求7所述的数据处理装置,其特征在于,所述数据处理装置还包括估值模块,所述估值模块包括预处理单元及估值单元,其中:
所述预处理单元,被配置为执行接收企业财务数据,并对所述企业财务数据进行数据预处理,所述数据预处理包括异常值处理及空值处理,所述空值处理基于所述预测方法进行;
所述估值单元,被配置为执行将处理后的所述企业财务数据输入估值模型,得到对应企业的估值结果。
9.一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其特征在于,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-6中任一项所述的方法。
10.一种存储有计算机指令的非瞬时计算机可读存储介质,其特征在于,所述计算机指令用于使所述计算机执行根据权利要求1-6中任一项所述的方法。
CN202310083014.3A 2023-01-19 2023-01-19 数据处理方法及装置、电子设备和存储介质 Pending CN116128135A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310083014.3A CN116128135A (zh) 2023-01-19 2023-01-19 数据处理方法及装置、电子设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310083014.3A CN116128135A (zh) 2023-01-19 2023-01-19 数据处理方法及装置、电子设备和存储介质

Publications (1)

Publication Number Publication Date
CN116128135A true CN116128135A (zh) 2023-05-16

Family

ID=86302577

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310083014.3A Pending CN116128135A (zh) 2023-01-19 2023-01-19 数据处理方法及装置、电子设备和存储介质

Country Status (1)

Country Link
CN (1) CN116128135A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116757334A (zh) * 2023-08-16 2023-09-15 江西科技学院 财务数据处理方法、系统、可读存储介质及计算机
CN118071528A (zh) * 2024-04-25 2024-05-24 深圳希施玛数据科技有限公司 数据处理方法及相关装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116757334A (zh) * 2023-08-16 2023-09-15 江西科技学院 财务数据处理方法、系统、可读存储介质及计算机
CN116757334B (zh) * 2023-08-16 2023-11-24 江西科技学院 财务数据处理方法、系统、可读存储介质及计算机
CN118071528A (zh) * 2024-04-25 2024-05-24 深圳希施玛数据科技有限公司 数据处理方法及相关装置

Similar Documents

Publication Publication Date Title
CN108880931B (zh) 用于输出信息的方法和装置
CN116128135A (zh) 数据处理方法及装置、电子设备和存储介质
CN110390408A (zh) 交易对象预测方法和装置
CN110163457A (zh) 一种业务指标的异常定位方法和装置
CN113095893A (zh) 确定物品销量的方法和装置
CN112446764A (zh) 游戏商品推荐方法、装置及电子设备
WO2023134188A1 (zh) 指标确定方法、装置、电子设备和计算机可读介质
CN113780912A (zh) 一种确定安全库存的方法及装置
CN113780703B (zh) 一种指标调整方法和装置
CN115062687A (zh) 企业信用监控方法、装置、设备及存储介质
CN110880119A (zh) 一种数据处理方法和装置
CN112132722B (zh) 政务热线数量趋势异常确定方法、装置、电子设备及介质
CN114723239A (zh) 一种多方协同建模方法、装置、设备、介质及程序产品
CN113592558A (zh) 一种信息处理方法和装置
CN113052509A (zh) 模型评估方法、模型评估装置、电子设备和存储介质
CN112784213A (zh) 一种生成信息的方法和装置
CN112906723A (zh) 一种特征选择的方法和装置
CN110019165A (zh) 一种清洗异常数据的方法和装置
CN115170179B (zh) 贸易政策不确定性指数确定方法、装置、设备及介质
CN109189689B (zh) 用于测试的方法和装置
CN110163706A (zh) 用于生成信息的方法和装置
CN113435623B (zh) 一种预警方法和装置
CN112613752B (zh) 用于车辆调度的方法、电子设备和存储介质
CN113743972B (zh) 一种生成物品信息的方法和装置
CN109934604A (zh) 获取畅销品名单的方法、系统、存储介质及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination