CN118071528A - 数据处理方法及相关装置 - Google Patents

数据处理方法及相关装置 Download PDF

Info

Publication number
CN118071528A
CN118071528A CN202410505810.6A CN202410505810A CN118071528A CN 118071528 A CN118071528 A CN 118071528A CN 202410505810 A CN202410505810 A CN 202410505810A CN 118071528 A CN118071528 A CN 118071528A
Authority
CN
China
Prior art keywords
target data
target
data
value
component
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202410505810.6A
Other languages
English (en)
Inventor
金利杰
穆旖旎
叶振东
刘威
张中岩
李彦东
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Xishima Data Technology Co ltd
Original Assignee
Shenzhen Xishima Data Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Xishima Data Technology Co ltd filed Critical Shenzhen Xishima Data Technology Co ltd
Priority to CN202410505810.6A priority Critical patent/CN118071528A/zh
Publication of CN118071528A publication Critical patent/CN118071528A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

本申请提供了一种数据处理方法及相关装置,包括获取目标对象在预设时段内的多个第一目标数据;针对所述每个第一目标数据执行以下操作:根据所述第一目标数据中包括的多个数据点的值获取第一分量的值;获取多个参考对象在目标时段内的多个第二目标数据;根据所述多个第二目标数据和所述第一目标数据获取第二分量的值;根据第一置信区间和所述第一目标数据获取第三分量的值;获取所述第一目标数据的目标向量,所述目标向量用于计算所述目标对象的财务异常类型。可以提高对财务异常类型的判断的效率和准确度。

Description

数据处理方法及相关装置
技术领域
本申请属于数据处理领域,具体涉及一种数据处理方法及相关装置。
背景技术
财务数据通常包括收入、支出、资产、负债等信息。这些数据用于监控财务健康状况、制定预算、进行财务规划以及做出经济决策。当前在对组织或个人的财务情况进行分析时,需要同时分析多个财务数据表,以及还需要结合多个财务数据表进行综合分析才能得出公司财务情况。不仅需要消耗大量的时间资源,而且由于数据量庞大且复杂,容易出现判断错误的情况。
发明内容
本申请实施例提供了一种数据处理方法及相关装置,以提高对财务异常类型的判断的准确度和判断效率。
第一方面,本申请实施例提供了一种数据处理方法,包括:
获取目标对象在预设时段内的多个第一目标数据,所述多个第一目标数据中每个第一目标数据中包括多个数据点,所述多个数据点用于综合计算得到所述第一目标数据,目标数据为反映所述目标对象的财务状况和经营活动的数据;
针对所述每个第一目标数据执行以下操作:
根据所述第一目标数据中包括的多个数据点的值获取第一分量的值,所述第一分量的值用于指示所述第一目标数据的公开充分程度;
获取多个参考对象在目标时段内的多个第二目标数据,第二目标数据与所述第一目标数据对应的数据类型相同,所述目标时段为所述第一目标数据所属的时段,所述多个参考对象与所述目标对象对应的公司类型相同;
根据所述多个第二目标数据和所述第一目标数据获取第二分量的值,所述第二分量的值用于指示所述第一目标数据的值相对于所述目标对象的合理程度;
根据第一置信区间和所述第一目标数据获取第三分量的值,所述第一置信区间基于所述多个第一目标数据的中位数确定,所述第三分量的值用于指示所述第一目标数据的增长幅度的异常程度;
获取所述第一目标数据的目标向量,所述目标向量中包括的三个分量的值分别为所述第一分量的值、所述第二分量的值和所述第三分量的值,所述目标向量用于计算所述目标对象的财务异常类型。
第二方面,本申请实施例提供了一种数据处理装置,包括:
获取单元,用于获取目标对象在预设时段内的多个第一目标数据,所述多个第一目标数据中每个第一目标数据中包括多个数据点,所述多个数据点用于综合计算得到所述第一目标数据,目标数据为反映所述目标对象的财务状况和经营活动的数据;
执行单元,用于针对所述每个第一目标数据执行以下操作:根据所述第一目标数据中包括的多个数据点的值获取第一分量的值,所述第一分量的值用于指示所述第一目标数据的公开充分程度;以及用于获取多个参考对象在目标时段内的多个第二目标数据,第二目标数据与所述第一目标数据对应的数据类型相同,所述目标时段为所述第一目标数据所属的时段,所述多个参考对象与所述目标对象对应的公司类型相同;以及用于根据所述多个第二目标数据和所述第一目标数据获取第二分量的值,所述第二分量的值用于指示所述第一目标数据的值相对于所述目标对象的合理程度;以及用于根据第一置信区间和所述第一目标数据获取第三分量的值,所述第一置信区间基于所述多个第一目标数据的中位数确定,所述第三分量的值用于指示所述第一目标数据的增长幅度的异常程度;以及用于获取所述第一目标数据的目标向量,所述目标向量中包括的三个分量的值分别为所述第一分量的值、所述第二分量的值和所述第三分量的值,所述目标向量用于计算所述目标对象的财务异常类型。
第三方面,本申请实施例提供了一种电子设备,包括处理器、存储器、通信接口,以及一个或多个程序,所述一个或多个程序被存储在所述存储器中,并且被配置由所述处理器执行,所述程序包括用于执行本申请实施例第一方面中的步骤的指令。
第四方面,本申请实施例提供了一种计算机可读存储介质,其上存储有计算机程序或指令,所述计算机程序或指令被处理器执行实现本申请实施例第一方面中的步骤。
可见,本实施例中,电子设备首先获取目标对象在预设时段内的多个第一目标数据,然后针对所述每个第一目标数据执行以下操作:首先根据所述第一目标数据中包括的多个数据点的值获取第一分量的值,然后获取多个参考对象在目标时段内的多个第二目标数据,再然后根据所述多个第二目标数据和所述第一目标数据获取第二分量的值,再然后根据第一置信区间和所述第一目标数据获取第三分量的值,最后获取所述第一目标数据的目标向量。本方案实现了将财务相关数据转换为向量,并基于向量直接判断财务异常类型的功能,保证了对财务相关数据的分析的全面性,可以提高对财务异常类型的判断的效率和准确度。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的一种电子设备的结构示意图;
图2是本申请实施例提供的一种数据处理方法的流程示意图;
图3是本申请实施例提供的一种数据处理装置的功能单元组成框图;
图4是本申请实施例提供的另一种数据处理装置的功能单元组成框图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其他步骤或单元。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
声明:本方案中获取的数据均来源于合法途径,并用于合法用途。
当前在对组织或个人的财务情况进行分析时,需要同时分析多个财务数据表,以及还需要结合多个财务数据表进行综合分析才能得出公司财务情况。不仅需要消耗大量的时间资源,而且由于数据量庞大且复杂,容易出现判断错误的情况。
针对上述问题,本申请实施例提供了一种数据处理方法及相关装置,下面结合附图对本申请实施例进详细说明。
请参阅图1,图1是本申请提供的一种电子设备的结构示意图。该电子设备10包括处理器120、存储器130、通信接口140以及一个或多个程序131,其中,所述一个或多个程序131被存储在上述存储器130中,且被配置由上述处理器120执行,所述一个或多个程序131包括用于执行下述方法实施例中任一步骤的指令。具体实现中,所述处理器120用于执行如下述方法实施例中由电子设备执行的任一步骤,且在执行诸如发送等数据传输时,可选择的调用所述通信接口140来完成相应操作。
请参阅图2,图2是本申请实施例提供的一种数据处理方法的流程示意图。应用于上述电子设备,该财务处理方法包括以下步骤。
S201,获取目标对象在预设时段内的多个第一目标数据。
其中,所述多个第一目标数据中每个第一目标数据中包括多个数据点,所述多个数据点用于综合计算得到所述第一目标数据,目标数据为反映所述目标对象的财务状况和经营活动的数据。例如第一目标数据为经营负债比率,则该第一目标数据包括的多个数据点分别流动负债合计值、短期借款值、一年内到期的非流动负债值、交易性金融负债值和衍生金融负债值。每个第一目标数据对应一个时间段内的一个类型的数据。
在一个可能的实施例中,所述获取目标对象在预设时段内的多个第一目标数据之后,所述方法还包括:分别确定所述每个第一目标数据对应的目标数据点的数量,所述目标数据点为所述多个数据点中对应的值为非空值的数据点;确定所述每个第一目标数据中所述目标数据点在所述多个数据点中的占比;将所述多个第一目标数据中,所述占比小于预设占比的第一目标数据删除。
其中,在获取到多个第一目标数据之后,还可以先对获取的数据进行清洗,删除掉无效的数据。当一个目标数据对应的空值的数据点的占比过高时,则认为该目标数据无效,则将该数据删除,不用于后续计算。该非空值的占比可以是80%,即当一个目标数据中数据点为空值的比率大于20%时,则将该数据进行删除。
可见,本实施例中,先根据目标数据中包括的非空值数据点的比例,对目标数据进行清洗,可以提高后续用于判断财务异常类型的数据的有效性,提高判断结果的准确度。
针对所述每个第一目标数据执行以下S202-S206的步骤。
S202,根据所述第一目标数据中包括的多个数据点的值获取第一分量的值。
其中,所述第一分量的值用于指示所述第一目标数据的公开充分程度。在删除无效指标后,若当前分析的第一目标数据的数据点中包含空值数据点,则可以认为该数据公开不充分,此时可以根据该数据中包含的空值数据点的比例确定该第一分量的值,若当前分析的第一目标数据的数据点中不包含空值数据点,则认为该目标数据公开充分,确定该第一分量的值为0。
S203,获取多个参考对象在目标时段内的多个第二目标数据。
其中,第二目标数据与所述第一目标数据对应的数据类型相同,所述目标时段为所述第一目标数据所属的时段,所述多个参考对象与所述目标对象对应的公司类型相同。该公司类型可以用于指示目标对象是否上市,或者目标对象的经营范围等。该目标时段可以是指一年或一个月等。
S204,根据所述多个第二目标数据和所述第一目标数据获取第二分量的值。
其中,所述第二分量的值用于指示所述第一目标数据的值相对于所述目标对象的合理程度。可以将第二目标数据与第一目标数据进行比较,若差异较大,则认为不合理。
在一个可能实施例中,所述根据所述多个第二目标数据和所述第一目标数据获取第二分量的值,包括:分别获取多个第三目标数据,所述多个第三目标数据分别为所述多个参考对象在目标时段内的多个预设财务类型对应的数据;将所述多个第二目标数据作为因变量,依次对多个第三目标数据进行回归,得到回归模型;获取所述回归模型的回归残差;获取所述目标对象在所述目标时段内所述多个预设财务类型对应的多个第四目标数据;根据所述第四目标数据和所述回归模型获取预测数据;根据所述预测数据、所述第一目标数据和所述回归残差确定获取所述第二分量的值。
其中,第三目标数据可以包括上市公司规模(即资产总计的对数)、资产总计、国有化标识、成立年限、上市年限、资产负债率、固定资产比率、现金资产比率、速动比率、资产回报率等等。该回归残差为回归模型的预测值与实际值的差距。该第四目标数据与第三目标数据包括的数据内容相同,只是一个是参考对象的相关数据,一个是目标对象的相关数据。若基于回归模型获取的预测值与第一目标数据的差值位于残差值的预设倍数以外,则认为该第一目标数据不合理,离得越远,则越不合理。若位于残差值的预设倍数以内,则认为第一目标数据合理,则第二分量的值为0。例如该残差值的预设倍数可以是3-sigma。特别地,若第一目标数据的财务类型与三目标数据中的财务类型重叠,则直接认为该第一目标数据合理。即例如第一目标数据是资产总计,而第三目标数据中也包括资产总计,则认为第一目标数据合理。
可见,本实施例中,基于同类型的对象的财务相关数据对第一目标数据进行分析,可以排除不同的财务数据对不同的对象的共性影响,提高对目标数据的合理性的分析的客观性和准确度。
S205,根据第一置信区间和所述第一目标数据获取第三分量的值。
其中,所述第一置信区间基于所述多个第一目标数据的中位数确定,所述第三分量的值用于指示所述第一目标数据的增长幅度的异常程度。
在一个可能的实施例中,所述根据第一置信区间和所述第一目标数据获取第三分量的值之前,所述方法还包括:获取所述多个参考第一目标数据的中位数,所述多个参考第一目标数据为所述多个第一目标数据中与所述第一目标数据所属的财务类型相同的数据;分别获取所述每个第一目标数据与所述参考第一目标数据的中位数的差值;根据所述多个第一目标数据的数量和所述差值获取标准值;根据所述标准值和预设指数获取第一置信区间。
其中,该标准值还包括左侧标准值和右侧标准值,该标准值为所有参考第一目标数据点与中位数之间的差的平均值的平方根。该左侧标准值为所有小于中位数的参考第一目标数据点与中位数之间的差的平均值的平方根,该右侧标准值为所有大于中位数的参考第一目标数据点与中位数之间的差的平均值的平方根。该左侧标准值和右侧标注值组成的范围即第一置信区间。
可见,本实施例中,基于中位数计算第一置信区间可以排除掉极端值和偏态分布对区间的干扰,提高计算出的第一置信区间的准确度,增强判断结果的准确度。
在一个可能的实施例中,所述根据第一置信区间和所述第一目标数据获取第三分量的值之前,所述方法还包括:从所述第一目标数据包括的多个数据点中获取目标数据点,所述目标数据点为所述多个数据点中对应的值为非空值的数据点;确定所述目标数据点的数量是否小于第一预设值;若所述目标数据点的数量小于所述第一预设值,则确定所述第三分量的值为目标值,所述目标值用于指示所述第一目标数据的增长幅度为正常;若所述目标数据点的数量大于或等于所述第一预设值,则根据第一置信区间和所述第一目标数据获取第三分量的值。
其中,若第一目标数据中包括的非空值数据点的小于预设值,则认为该第一目标数据不适合判断是否存在增长幅度异常程度,直接确定该第一目标数据为增长幅度正常,可以将第三分量的值确定为目标值,该目标值可以是0。根据第一置信区间和所述第一目标数据获取第三分量的值,包括:确定第一目标数据在第一置信区间值的位置,根据位置确定第三分量的值。例如第一目标数据落入m倍标准差的范围内,则对应一个值,不同的倍数对应不同的值。例如m为1.64、1.96和2.58等。
可见,本实施例中,根据第一目标数据中非空值的数据点的数量提前确定第一目标数据的第三分量的值,可以减小计算量,提高对财务异常类型的判断效率。
在一个可能的实施例中,在所述第三分量的值不为所述目标值时,所述方法还包括:在所述目标数据点的数量等于所述第一预设值时,根据所述目标时段从所述多个第一目标数据中获取第一历史数据和第二历史数据,所述第一历史数据所属的时段早于所述第二历史数据,所述第二历史数据所属的时段早于所述第一目标数据,所述第一历史数据和所述第二历史数据对应的财务类型与所述第一目标数据相同;根据所述第二历史数据和所述第一目标数据获取第一涨幅;根据所述第一历史数据和所述第二历史数据获取第二涨幅;在所述第一涨幅和所述第二涨幅的比值属于预设范围时,将所述第三分量的值修改为所述目标值。
其中,若确定出第三分量的值不是目标值,即第一目标数据存在增长幅度异常的情况,则可以对该计算结果进行复核,以进一步确定第三分量的值。在第一目标数据中包括的非空值的数量等于预设值时,可以直接根据本期涨幅和上期涨幅的比值来确定是否合理,若本期涨幅与上期涨幅的比值落入预设范围内,则认为第一目标数据合理,此时可以将第一目标数据对应的第三分量的值改为目标值。该本期涨幅即第一涨幅,上期涨幅即第二涨幅。在确定第一历史数据和第二历史数据时,可以根据第一目标数据所属的时间段的跨度确定。若该所所属的时间段的跨度大,则第一历史数据可以是在多个与第一目标数据相同财务类型的数据中与第一目标数据的时间相邻的数据。例如第一目标数据的时间跨度为一年,则第一历史数据就可以是前一年的数据,若第一目标数据的时间跨度为1个月,则第一历史数据则可以是半年前的数据等。
可见,本实施例中,基于上期涨幅和本期涨幅对第三分量的值进行复核,可以提高对第三分量的值的确定的准确度,提高判断结果的准确度。
在一个可能实施例中,在所述目标数据点的数量大于所述第一预设值时,所述方法还包括:根据所述多个参考第一目标数据获取所述每个参考第一目标数据对应的目标涨幅;根据所述每个参考第一目标数据对应的目标涨幅获取目标涨幅的中位数;根据所述每个参考第一目标数据对应的目标涨幅和所述目标涨幅的中位数获取第二置信区间;分别确定所述第一涨幅和所述第二涨幅的符号;在所述第一涨幅位于所述第二置信区间,且所述第一涨幅和所述第二涨幅的符合相同时,将所述第三分量的值修改为所述目标值。
其中,每个参考第一目标数据对应的目标涨幅,即每个参考第一目标数据对应的本期涨幅。与上述计算第二置信区间与上述计算第一置信区间的方法相同,再此不再赘述。当第一目标数据的第一涨幅落入预设置信区间内,且第一目标数据的本期涨幅和上期涨幅的符合相同时,就将该第一目标数据的第三分量的值改为目标值。
可见,本实例中,根据第一目标数据的涨幅对第三分量的值进行复核,可以提高对第三分量的值的确定的准确度,提高判断结果的准确度。
S206,获取所述第一目标数据的目标向量。
其中,所述目标向量中包括的三个分量的值分别为所述第一分量的值、所述第二分量的值和所述第三分量的值,所述目标向量用于计算所述目标对象的财务异常类型。
可见,本实施例中,电子设备首先获取目标对象在预设时段内的多个第一目标数据,然后针对所述每个第一目标数据执行以下操作:首先根据所述第一目标数据中包括的多个数据点的值获取第一分量的值,然后获取多个参考对象在目标时段内的多个第二目标数据,再然后根据所述多个第二目标数据和所述第一目标数据获取第二分量的值,再然后根据第一置信区间和所述第一目标数据获取第三分量的值,最后获取所述第一目标数据的目标向量。本方案实现了将财务相关数据转换为向量,并基于向量直接判断财务异常类型的功能,保证了对财务相关数据的分析的全面性,可以提高对财务异常类型的判断的效率和准确度。
与上述实施例一致的,请参阅图3,图3是本申请实施例提供的一种数据处理装置的功能单元组成框图。如图3所示,数据处理装置30包括:获取单元301,用于获取目标对象在预设时段内的多个第一目标数据,所述多个第一目标数据中每个第一目标数据中包括多个数据点,所述多个数据点用于综合计算得到所述第一目标数据,目标数据为反映所述目标对象的财务状况和经营活动的数据;执行单元302,用于针对所述每个第一目标数据执行以下操作:根据所述第一目标数据中包括的多个数据点的值获取第一分量的值,所述第一分量的值用于指示所述第一目标数据的公开充分程度;以及用于获取多个参考对象在目标时段内的多个第二目标数据,第二目标数据与所述第一目标数据对应的数据类型相同,所述目标时段为所述第一目标数据所属的时段,所述多个参考对象与所述目标对象对应的公司类型相同;以及用于根据所述多个第二目标数据和所述第一目标数据获取第二分量的值,所述第二分量的值用于指示所述第一目标数据的值相对于所述目标对象的合理程度;以及用于根据第一置信区间和所述第一目标数据获取第三分量的值,所述第一置信区间基于所述多个第一目标数据的中位数确定,所述第三分量的值用于指示所述第一目标数据的增长幅度的异常程度;以及用于获取所述第一目标数据的目标向量,所述目标向量中包括的三个分量的值分别为所述第一分量的值、所述第二分量的值和所述第三分量的值,所述目标向量用于计算所述目标对象的财务异常类型。
在一个可能的实施例中,在所述根据第一置信区间和所述第一目标数据获取第三分量的值之前,所述执行单元302还用于:获取所述多个参考第一目标数据的中位数,所述多个参考第一目标数据为所述多个第一目标数据中与所述第一目标数据所属的财务类型相同的数据;分别获取所述每个第一目标数据与所述参考第一目标数据的中位数的差值;根据所述多个第一目标数据的数量和所述差值获取标准值;根据所述标准值和预设指数获取第一置信区间。
在一个可能的实施例中,在所述根据第一置信区间和所述第一目标数据获取第三分量的值之前,所述执行单元302还用于:从所述第一目标数据包括的多个数据点中获取目标数据点,所述目标数据点为所述多个数据点中对应的值为非空值的数据点;确定所述目标数据点的数量是否小于第一预设值;若所述目标数据点的数量小于所述第一预设值,则确定所述第三分量的值为目标值,所述目标值用于指示所述第一目标数据的增长幅度为正常;若所述目标数据点的数量大于或等于所述第一预设值,则根据第一置信区间和所述第一目标数据获取第三分量的值。
在一个可能的实施例中,在在所述第三分量的值不为所述目标值时,所述执行单元302具体用于:在所述目标数据点的数量等于所述第一预设值时,根据所述目标时段从所述多个第一目标数据中获取第一历史数据和第二历史数据,所述第一历史数据所属的时段早于所述第二历史数据,所述第二历史数据所属的时段早于所述第一目标数据,所述第一历史数据和所述第二历史数据对应的财务类型与所述第一目标数据相同;根据所述第二历史数据和所述第一目标数据获取第一涨幅;根据所述第一历史数据和所述第二历史数据获取第二涨幅;在所述第一涨幅和所述第二涨幅的比值属于预设范围时,将所述第三分量的值修改为所述目标值。
在一个可能的实施例中,在在所述目标数据点的数量大于所述第一预设值时,所述执行单元302具体用于:根据所述多个参考第一目标数据获取所述每个参考第一目标数据对应的目标涨幅;根据所述每个参考第一目标数据对应的目标涨幅获取目标涨幅的中位数;根据所述每个参考第一目标数据对应的目标涨幅和所述目标涨幅的中位数获取第二置信区间;分别确定所述第一涨幅和所述第二涨幅的符号;在所述第一涨幅位于所述第二置信区间,且所述第一涨幅和所述第二涨幅的符合相同时,将所述第三分量的值修改为所述目标值。
在一个可能的实施例中,在所述根据所述多个第二目标数据和所述第一目标数据获取第二分量的值方面,所述执行单元302具体用于:分别获取多个第三目标数据,所述多个第三目标数据分别为所述多个参考对象在目标时段内的多个预设财务类型对应的数据;将所述多个第二目标数据作为因变量,依次对多个第三目标数据进行回归,得到回归模型;获取所述回归模型的回归残差;获取所述目标对象在所述目标时段内所述多个预设财务类型对应的多个第四目标数据;根据所述第四目标数据和所述回归模型获取预测数据;根据所述预测数据、所述第一目标数据和所述回归残差确定获取所述第二分量的值。
在一个可能的实施例中,在所述获取目标对象在预设时段内的多个第一目标数据之后,所述获取单元301还用于:分别确定所述每个第一目标数据对应的目标数据点的数量,所述目标数据点为所述多个数据点中对应的值为非空值的数据点;确定所述每个第一目标数据中所述目标数据点在所述多个数据点中的占比;将所述多个第一目标数据中,所述占比小于预设占比的第一目标数据删除。
可以理解的是,由于方法实施例与装置实施例为相同技术构思的不同呈现形式,因此,本申请中方法实施例部分的内容应同步适配于装置实施例部分,此处不再赘述。
在采用集成的单元的情况下,请参阅图4,图4是本申请实施例提供的另一种数据处理装置的功能单元组成框图。在图4中,数据处理装置30包括:处理模块312和通信模块311。处理模块312用于对数据处理装置30的动作进行控制管理,例如,执行获取单元301和执行单元302的步骤,和/或用于执行本文所描述的技术的其它过程。通信模块311用于数据处理装置30与其他设备之间的交互。如图4所示,数据处理装置30还可以包括存储模块313,存储模块313用于存储数据处理装置30的程序代码和数据。
其中,处理模块312可以是处理器或控制器,例如可以是中央处理器(CentralProcessing Unit,CPU),通用处理器,数字信号处理器(DigitalSignalProcessor,DSP),ASIC,FPGA或者其他可编程逻辑器件、晶体管逻辑器件、硬件部件或者其任意组合。其可以实现或执行结合本申请公开内容所描述的各种示例性的逻辑方框,模块和电路。所述处理器也可以是实现计算功能的组合,例如包含一个或多个微处理器组合,DSP和微处理器的组合等等。通信模块311可以是收发器、RF电路或通信接口等。存储模块313可以是存储器。
其中,上述方法实施例涉及的各场景的所有相关内容均可以援引到对应功能模块的功能描述,在此不再赘述。上述数据处理装置30可执行上述图2所示的数据处理方法。
上述实施例,可以全部或部分地通过软件、硬件、固件或其他任意组合来实现。当使用软件实现时,上述实施例可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令或计算机程序。在计算机上加载或执行所述计算机指令或计算机程序时,全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以为通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线或无线方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集合的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质。半导体介质可以是固态硬盘。
本申请实施例还提供一种计算机存储介质,其中,该计算机存储介质存储用于电子数据交换的计算机程序,该计算机程序使得计算机执行如上述方法实施例中记载的任一方法的部分或全部步骤,上述计算机包括电子设备。
本申请实施例还提供一种计算机程序产品,上述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,上述计算机程序可操作来使计算机执行如上述方法实施例中记载的任一方法的部分或全部步骤。该计算机程序产品可以为一个软件安装包,上述计算机包括电子设备。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本申请所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置,可通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如上述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性或其它的形式。
上述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
上述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储器中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储器中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例上述方法的全部或部分步骤。而前述的存储器包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储器中,存储器可以包括:闪存盘、只读存储器(英文:Read-Only Memory ,简称:ROM)、随机存取器(英文:Random Access Memory,简称:RAM)、磁盘或光盘等。
以上对本申请实施例进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

Claims (10)

1.一种数据处理方法,其特征在于,包括:
获取目标对象在预设时段内的多个第一目标数据,所述多个第一目标数据中每个第一目标数据中包括多个数据点,所述多个数据点用于综合计算得到所述第一目标数据,目标数据为反映所述目标对象的财务状况和经营活动的数据;
针对所述每个第一目标数据执行以下操作:
根据所述第一目标数据中包括的多个数据点的值获取第一分量的值,所述第一分量的值用于指示所述第一目标数据的公开充分程度;
获取多个参考对象在目标时段内的多个第二目标数据,第二目标数据与所述第一目标数据对应的数据类型相同,所述目标时段为所述第一目标数据所属的时段,所述多个参考对象与所述目标对象对应的公司类型相同;
根据所述多个第二目标数据和所述第一目标数据获取第二分量的值,所述第二分量的值用于指示所述第一目标数据的值相对于所述目标对象的合理程度;
根据第一置信区间和所述第一目标数据获取第三分量的值,所述第一置信区间基于所述多个第一目标数据的中位数确定,所述第三分量的值用于指示所述第一目标数据的增长幅度的异常程度;
获取所述第一目标数据的目标向量,所述目标向量中包括的三个分量的值分别为所述第一分量的值、所述第二分量的值和所述第三分量的值,所述目标向量用于计算所述目标对象的财务异常类型。
2.根据权利要求1所述的方法,其特征在于,所述根据第一置信区间和所述第一目标数据获取第三分量的值之前,所述方法还包括:
获取多个参考第一目标数据的中位数,所述多个参考第一目标数据为所述多个第一目标数据中与所述第一目标数据所属的财务类型相同的数据;
分别获取所述每个第一目标数据与所述参考第一目标数据的中位数的差值;
根据所述多个第一目标数据的数量和所述差值获取标准值;
根据所述标准值和预设指数获取第一置信区间。
3.根据权利要求2所述的方法,其特征在于,所述根据第一置信区间和所述第一目标数据获取第三分量的值之前,所述方法还包括:
从所述第一目标数据包括的多个数据点中获取目标数据点,所述目标数据点为所述多个数据点中对应的值为非空值的数据点;
确定所述目标数据点的数量是否小于第一预设值;
若所述目标数据点的数量小于所述第一预设值,则确定所述第三分量的值为目标值,所述目标值用于指示所述第一目标数据的增长幅度为正常;
若所述目标数据点的数量大于或等于所述第一预设值,则根据第一置信区间和所述第一目标数据获取第三分量的值。
4.根据权利要求3所述的方法,其特征在于,在所述第三分量的值不为所述目标值时,所述方法还包括:
在所述目标数据点的数量等于所述第一预设值时,根据所述目标时段从所述多个第一目标数据中获取第一历史数据和第二历史数据,所述第一历史数据所属的时段早于所述第二历史数据,所述第二历史数据所属的时段早于所述第一目标数据,所述第一历史数据和所述第二历史数据对应的财务类型与所述第一目标数据相同;
根据所述第二历史数据和所述第一目标数据获取第一涨幅;
根据所述第一历史数据和所述第二历史数据获取第二涨幅;
在所述第一涨幅和所述第二涨幅的比值属于预设范围时,将所述第三分量的值修改为所述目标值。
5.根据权利要求4所述的方法,其特征在于,在所述目标数据点的数量大于所述第一预设值时,所述方法还包括:
根据所述多个参考第一目标数据获取每个参考第一目标数据对应的目标涨幅;
根据所述每个参考第一目标数据对应的目标涨幅获取目标涨幅的中位数;
根据所述每个参考第一目标数据对应的目标涨幅和所述目标涨幅的中位数获取第二置信区间;
分别确定所述第一涨幅和所述第二涨幅的符号;
在所述第一涨幅位于所述第二置信区间,且所述第一涨幅和所述第二涨幅的符合相同时,将所述第三分量的值修改为所述目标值。
6.根据权利要求1所述的方法,其特征在于,所述根据所述多个第二目标数据和所述第一目标数据获取第二分量的值,包括:
分别获取多个第三目标数据,所述多个第三目标数据分别为所述多个参考对象在目标时段内的多个预设财务类型对应的数据;
将所述多个第二目标数据作为因变量,依次对多个第三目标数据进行回归,得到回归模型;
获取所述回归模型的回归残差;
获取所述目标对象在所述目标时段内所述多个预设财务类型对应的多个第四目标数据;
根据所述第四目标数据和所述回归模型获取预测数据;
根据所述预测数据、所述第一目标数据和所述回归残差确定获取所述第二分量的值。
7.根据权利要求1所述的方法,其特征在于,所述获取目标对象在预设时段内的多个第一目标数据之后,所述方法还包括:
分别确定所述每个第一目标数据对应的目标数据点的数量,所述目标数据点为所述多个数据点中对应的值为非空值的数据点;
确定所述每个第一目标数据中所述目标数据点在所述多个数据点中的占比;
将所述多个第一目标数据中,所述占比小于预设占比的第一目标数据删除。
8.一种数据处理装置,其特征在于,包括:
获取单元,用于获取目标对象在预设时段内的多个第一目标数据,所述多个第一目标数据中每个第一目标数据中包括多个数据点,所述多个数据点用于综合计算得到所述第一目标数据,目标数据为反映所述目标对象的财务状况和经营活动的数据;
执行单元,用于针对所述每个第一目标数据执行以下操作:根据所述第一目标数据中包括的多个数据点的值获取第一分量的值,所述第一分量的值用于指示所述第一目标数据的公开充分程度;以及用于获取多个参考对象在目标时段内的多个第二目标数据,第二目标数据与所述第一目标数据对应的数据类型相同,所述目标时段为所述第一目标数据所属的时段,所述多个参考对象与所述目标对象对应的公司类型相同;以及用于根据所述多个第二目标数据和所述第一目标数据获取第二分量的值,所述第二分量的值用于指示所述第一目标数据的值相对于所述目标对象的合理程度;以及用于根据第一置信区间和所述第一目标数据获取第三分量的值,所述第一置信区间基于所述多个第一目标数据的中位数确定,所述第三分量的值用于指示所述第一目标数据的增长幅度的异常程度;以及用于获取所述第一目标数据的目标向量,所述目标向量中包括的三个分量的值分别为所述第一分量的值、所述第二分量的值和所述第三分量的值,所述目标向量用于计算所述目标对象的财务异常类型。
9.一种电子设备,其特征在于,包括处理器、存储器,以及一个或多个程序,所述一个或多个程序被存储在所述存储器中,并且被配置由所述处理器执行,所述程序包括用于执行如权利要求1-7任一项所述的方法中的步骤的指令。
10.一种计算机可读存储介质,其上存储有计算机程序或指令,其特征在于,所述计算机程序或指令被处理器执行实现权利要求1-7任一项所述方法的步骤。
CN202410505810.6A 2024-04-25 2024-04-25 数据处理方法及相关装置 Pending CN118071528A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410505810.6A CN118071528A (zh) 2024-04-25 2024-04-25 数据处理方法及相关装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202410505810.6A CN118071528A (zh) 2024-04-25 2024-04-25 数据处理方法及相关装置

Publications (1)

Publication Number Publication Date
CN118071528A true CN118071528A (zh) 2024-05-24

Family

ID=91106217

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202410505810.6A Pending CN118071528A (zh) 2024-04-25 2024-04-25 数据处理方法及相关装置

Country Status (1)

Country Link
CN (1) CN118071528A (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060031150A1 (en) * 2004-08-06 2006-02-09 General Electric Company Methods and systems for anomaly detection in small datasets
US20090234899A1 (en) * 2008-03-11 2009-09-17 Paragon Science, Inc. Systems and Methods for Dynamic Anomaly Detection
CN112508709A (zh) * 2020-10-21 2021-03-16 杭州衡泰软件有限公司 一种基于网络结构的信用风险传染监控方法
CN115423594A (zh) * 2022-09-29 2022-12-02 东方星野数字科技(北京)有限公司 企业财务风险的评估方法、装置、设备及存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060031150A1 (en) * 2004-08-06 2006-02-09 General Electric Company Methods and systems for anomaly detection in small datasets
US20090234899A1 (en) * 2008-03-11 2009-09-17 Paragon Science, Inc. Systems and Methods for Dynamic Anomaly Detection
CN112508709A (zh) * 2020-10-21 2021-03-16 杭州衡泰软件有限公司 一种基于网络结构的信用风险传染监控方法
CN115423594A (zh) * 2022-09-29 2022-12-02 东方星野数字科技(北京)有限公司 企业财务风险的评估方法、装置、设备及存储介质

Similar Documents

Publication Publication Date Title
Patterson et al. Multivariate singular spectrum analysis for forecasting revisions to real-time data
KR20060061759A (ko) 트랜잭션 기반 성능 모델을 자동 검증 및 캘리브레이션하기위한 컴퓨터 구현 방법
US9779406B2 (en) User feature identification method and apparatus
CN111242793B (zh) 医保数据异常的检测方法和装置
CN110633194B (zh) 一种硬件资源在特定环境下的性能评估方法
CN107958297B (zh) 一种产品需求预测方法及产品需求预测装置
CN113837596B (zh) 一种故障确定方法、装置、电子设备及存储介质
Wawale et al. [Retracted] Minimizing the Error Gap in Smart Framing by Forecasting Production and Demand Using ARIMA Model
CN109978342A (zh) 电子装置、风险评估方法和计算机可读存储介质
CN118071528A (zh) 数据处理方法及相关装置
CN116128135A (zh) 数据处理方法及装置、电子设备和存储介质
CN115168509A (zh) 风控数据的处理方法及装置、存储介质、计算机设备
CN115564593A (zh) 一种针对农作物的融资预警方法、设备和存储介质
CN106156470B (zh) 一种时间序列异常检测标注方法及系统
JP5650290B1 (ja) オペレーショナルリスクの計量方法及び装置
CN113256407A (zh) 风险预测方法、装置、电子设备及存储介质
WO2020037922A1 (zh) 股指预测方法、装置及存储介质
Wang et al. A control chart based approach to monitoring supply network dynamics using Kalman filtering
Rojas Time dependence in joint replacement to multi-products grouped. The case of hospital food service
CN118037472B (zh) 财务数据处理方法及相关装置
CN111062816B (zh) 账户资产监管方法及装置
CN117172915A (zh) 择时方法、装置、计算机设备、存储介质和程序产品
CN117131965A (zh) 数据预测方法及装置、计算机存储介质、电子设备
CN117950968A (zh) 一种供应链自主可控度评估方法、装置、服务器及介质
CN114971695A (zh) 行业趋势预测方法、装置、设备、介质和程序产品

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination