CN112508308A - 一种数据处理方法、装置、设备及可读存储介质 - Google Patents

一种数据处理方法、装置、设备及可读存储介质 Download PDF

Info

Publication number
CN112508308A
CN112508308A CN202011598563.7A CN202011598563A CN112508308A CN 112508308 A CN112508308 A CN 112508308A CN 202011598563 A CN202011598563 A CN 202011598563A CN 112508308 A CN112508308 A CN 112508308A
Authority
CN
China
Prior art keywords
time point
target
index
index value
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011598563.7A
Other languages
English (en)
Inventor
唐永鹏
刘硕凌
唐方凯
李正非
张桐喆
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
E Fund Management Co ltd
Original Assignee
E Fund Management Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by E Fund Management Co ltd filed Critical E Fund Management Co ltd
Priority to CN202011598563.7A priority Critical patent/CN112508308A/zh
Publication of CN112508308A publication Critical patent/CN112508308A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/04Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Marketing (AREA)
  • Human Resources & Organizations (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Development Economics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Business, Economics & Management (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Medical Informatics (AREA)
  • Technology Law (AREA)
  • Evolutionary Biology (AREA)
  • Game Theory and Decision Science (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种数据处理方法、装置、设备及可读存储介质,该方法包括:当接收到针对目标指标的数据处理指令时,获取在初始时间点之前与所述目标指标关联的历史数据以及所述目标指标在所述初始时间点的初始指标值;根据所述历史数据,利用预设预测模型计算出所述目标指标在目标时间段内指标值的涨跌幅的均值和标准差;根据所述初始指标值、均值和标准差,利用预设期望算法计算出所述目标时间段内每个时间点的期望指标值;在当前时间点到达所述目标时间段内的目标时间点后,根据所述目标时间点的真实指标值和所述目标时间点的期望指标值,利用最优停止算法判断所述目标时间点的真实指标值是否为所述目标指标在未来时间段的估算极值。

Description

一种数据处理方法、装置、设备及可读存储介质
技术领域
本发明涉及数据处理技术领域,特别涉及一种数据处理方法、装置、设备及可读存储介质。
背景技术
时间序列是目标统计指标的指标值按其发生的时间先后顺序排序而成的数列;时间序列是经常被使用的研究对象,单个时间序列上的高低点信息具有重要含义,例如,河流水位的最高最低点、气温的最高最低点、商品价格的最高最低点等等;通常,在进行数据回溯时很容易判断出过去一段时间内的最高点和最低点,但是在实际的应用场景中,往往需要判断当前时间点的指标值是否为未来一段时间内的最高点或最低点;但是,由于未来信息具有不确定性,依靠现有技术,很难进行判断。
发明内容
本发明的目的在于提供一种数据处理方法、装置、设备及可读存储介质,提供了一种基于机器学习算法和动态最优停止算法的在时间序列上选择高低点的技术方案,能够判断当前时间点的指标值是否为目标指标在未来时间段的极值。
根据本发明的一个方面,提供了一种数据处理方法,所述方法包括:
当接收到针对目标指标的数据处理指令时,获取在初始时间点之前与所述目标指标关联的历史数据以及所述目标指标在所述初始时间点的初始指标值;
根据所述历史数据,利用预设预测模型计算出所述目标指标在目标时间段内指标值的涨跌幅的均值和标准差;其中,所述目标时间段是以所述初始时间点开始的时间段,且所述目标时间段被单位时间划分出多个时间点;
根据所述初始指标值、均值和标准差,利用预设期望算法计算出所述目标时间段内每个时间点的期望指标值;其中,一个时间点的期望指标值用于表征在所述时间点之后期望出现的所述目标指标的指标极值;
在当前时间点到达所述目标时间段内的目标时间点后,根据所述目标时间点的真实指标值和所述目标时间点的期望指标值,利用最优停止算法判断所述目标时间点的真实指标值是否为所述目标指标在未来时间段的估算极值;其中,所述未来时间段为所述目标时间段中位于所述目标时间点之后的时间范围。
可选的,所述根据所述历史数据,利用预设预测模型计算出所述目标指标在目标时间段内指标值的涨跌幅的均值和标准差,具体包括:
从所述历史数据中提取出预设特征参数,并将提取出的特征参数输入至预先训练好的用于执行回归任务的预测模型中,以得到所述目标指标在目标时间段内指标值的涨跌幅的均值和标准差。
可选的,在判断所述目标时间点的真实指标值是否为所述目标指标在未来时间段的估算极大值的场景中,所述根据所述初始指标值、均值和标准差,利用预设期望算法计算出所述目标时间段内每个时间点的期望指标值,具体包括:
设所述目标时间段被单位时间划分出M个时间点,且所述目标时间段是以第M个时间点结束的时间段;
计算第(M-1)个时间点的期望指标值V(M-1)=E(ln(PM))=E(ln(P0)+X1+X2+…+XM~N(ln(P0)+Mμ,Mσ2));其中,P0为所述初始指标值、μ为所述均值、σ2为所述标准差,Xt=ln(Pt)-ln(Pt-1)、且Xt服从正态分布Xt~N(μ,σ2)、t∈[1,M];
计算第(M-2)个时间点的期望指标值
Figure BDA0002870582700000021
Figure BDA0002870582700000022
计算第(M-3)个时间点的期望指标值
Figure BDA0002870582700000023
Figure BDA0002870582700000024
以此类推,直至计算出第1个时间点的期望指标值
Figure BDA0002870582700000031
Figure BDA0002870582700000032
其中,F()为服从正态分布的分布函数。
可选的,所述在当前时间点到达所述目标时间段内的目标时间点后,根据所述目标时间点的真实指标值和所述目标时间点的期望指标值,利用最优停止算法判断所述目标时间点的真实指标值是否为所述目标指标在未来时间段的估算极值,具体包括:
步骤A1:在当前时间点到达所述目标时间段内的目标时间点后,获取所述目标时间点的真实指标值;
步骤A2:判断所述目标时间点的真实指标值是否大于所述目标时间点的期望指标值,若是则将所述目标时间点的真实指标值作为所述目标指标在未来时间段的估算极大值,若否则执行步骤A3;
步骤A3:判断所述目标时间点是否为第(M-1)个时间点,若是则停止操作并将第M个时间点的真实指标值作为所述目标指标在所述目标时间段的估算极大值,若否则执行步骤A4;
步骤A4:以所述目标时间点的真实指标值作为初始指标值,根据所述均值和标准差,利用所述预设期望算法对所述目标时间点之后的所有时间点的期望指标值进行更新,并将所述目标时间点的下一时间点作为新的目标时间点,并返回步骤A1。
可选的,在判断所述目标时间点的真实指标值是否为所述目标指标在未来时间段的估算极小值的场景中,所述根据所述初始指标值、均值和标准差,利用预设期望算法计算出所述目标时间段内每个时间点的期望指标值,具体包括:
设所述目标时间段被单位时间划分出M个时间点,且所述目标时间段是以第M个时间点结束的时间段;
计算第(M-1)个时间点的期望指标值V(M-1)=E(ln(PM))=E(ln(P0)-X1-X2-…-XM~N(ln(P0)-Mμ,Mσ2));其中,P0为所述初始指标值、μ为所述均值、σ2为所述标准差,Xt=ln(Pt)-ln(Pt-1)、且Xt服从正态分布Xt~N(μ,σ2)、t∈[1,M];
计算第(M-2)个时间点的期望指标值
Figure BDA0002870582700000041
Figure BDA0002870582700000042
计算第(M-3)个时间点的期望指标值
Figure BDA0002870582700000043
Figure BDA0002870582700000044
以此类推,直至计算出第1个时间点的期望指标值
Figure BDA0002870582700000045
Figure BDA0002870582700000046
其中,F()为服从正态分布的分布函数。
可选的,所述在当前时间点到达所述目标时间段内的目标时间点后,根据所述目标时间点的真实指标值和所述目标时间点的期望指标值,利用最优停止算法判断所述目标时间点的真实指标值是否为所述目标指标在未来时间段的估算极值,具体包括:
步骤B1:在当前时间点到达所述目标时间段内的目标时间点后,获取所述目标时间点的真实指标值;
步骤B2:判断所述目标时间点的真实指标值是否小于所述目标时间点的期望指标值,若是则将所述目标时间点的真实指标值作为所述目标指标在未来时间段的估算极小值,若否则执行步骤B3;
步骤B3:判断所述目标时间点是否为第(M-1)个时间点,若是则停止操作并将第M个时间点的真实指标值作为所述目标指标在所述目标时间段的估算极小值,若否则执行步骤B4;
步骤B4:以所述目标时间点的真实指标值作为初始指标值,根据所述均值和标准差,利用所述预设期望算法对所述目标时间点之后的所有时间点的期望指标值进行更新,并将所述目标时间点的下一时间点作为新的目标时间点,并返回步骤B1。
为了实现上述目的,本发明还提供一种数据处理装置,所述装置具体包括以下组成部分:
获取模块,用于当接收到针对目标指标的数据处理指令时,获取在初始时间点之前与所述目标指标关联的历史数据以及所述目标指标在所述初始时间点的初始指标值;
预测模块,用于根据所述历史数据,利用预设预测模型计算出所述目标指标在目标时间段内指标值的涨跌幅的均值和标准差;其中,所述目标时间段是以所述初始时间点开始的时间段,且所述目标时间段被单位时间划分出多个时间点;
计算模块,用于根据所述初始指标值、均值和标准差,利用预设期望算法计算出所述目标时间段内每个时间点的期望指标值;其中,一个时间点的期望指标值用于表征在所述时间点之后期望出现的所述目标指标的指标极值;
确定模块,用于在当前时间点到达所述目标时间段内的目标时间点后,根据所述目标时间点的真实指标值和所述目标时间点的期望指标值,利用最优停止算法判断所述目标时间点的真实指标值是否为所述目标指标在未来时间段的估算极值;其中,所述未来时间段为所述目标时间段中位于所述目标时间点之后的时间范围。
可选的,所述预测模块,具体用于:
从所述历史数据中提取出预设特征参数,并将提取出的特征参数输入至预先训练好的用于执行回归任务的预测模型中,以得到所述目标指标在目标时间段内指标值的涨跌幅的均值和标准差。
为了实现上述目的,本发明还提供一种计算机设备,该计算机设备具体包括:存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述介绍的数据处理方法的步骤。
为了实现上述目的,本发明还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述介绍的数据处理方法的步骤。
本发明提供的数据处理方法、装置、设备及可读存储介质,可以利用目标指标已知的历史时间序列信息,准确、高效的判断出当前时间点的指标值是否为未来一段时间内的最大值或最小值。在本发明中,不会利用机器学习算法直接对目标指标在未来时间的指标值进行预测,而是利用机器学习算法预测出目标指标的指标值在未来的随机变量分布函数,且允许机器学习算法预测误差的存在;通过预测分布,结合期望最大化的最优停止算法,可以容忍由机器学习算法导致的预测误差,从而准确的判断出当前时间点的指标值是否为未来一段时间内的最大值或最小值。此外,在本发明中采用了动态的最优停止算法,会根据当前最新的指标值以更新目标指标在未来时间的分布,从而进一步提高数据处理的准确性。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1为实施例一提供的数据处理方法的一种可选的流程示意图;
图2为实施例二提供的数据处理装置的一种可选的组成结构示意图;
图3为实施例三提供的计算机设备的一种可选的硬件架构示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例一
本发明实施例提供了一种数据处理方法,如图1所示,该方法具体包括以下步骤:
步骤S101:当接收到针对目标指标的数据处理指令时,获取在初始时间点之前与所述目标指标关联的历史数据以及所述目标指标在所述初始时间点的初始指标值。
其中,所述目标指标为指标值可随时间变化的指标,例如:某只股票的股价、某个城市的气温、某条河流的水位等。
在实际应用中,当获取到与目标指标关联的历史数据时,可以进行适当的数据清洗工作,例如:对异常值进行缩尾处理、对缺失值进行填充处理;同时对不同类型的历史数据,还可以纳入额外的信息,例如:对于水位数据,可以使用季节和天气的数据进行补充、对于证券市场数据可以使用交易日的标识进行补充,这些补充数据的纳入可以较大的提升预设预测模型的预测性能。
步骤S102:根据所述历史数据,利用预设预测模型,计算出所述目标指标在目标时间段内指标值的涨跌幅的均值和标准差;其中,所述目标时间段是以所述初始时间点开始的时间段,且所述目标时间段被单位时间划分出多个时间点。
具体的,所述预设预测模型是利用现有的机器学习算法,基于已标注均值和标准差的样本数据训练得到的,且预设预测模型用于预测指标值在未来时间的涨跌幅均值和涨跌幅标准差,以体现指标值的未来分布情况。
进一步的,步骤S102,包括:
从所述历史数据中提取出预设特征参数,并将提取出的特征参数输入至预先训练好的用于执行回归任务的预测模型中,以得到所述目标指标在目标时间段内指标值的涨跌幅的均值和标准差。
优选的,预设特征参数至少包括以下之一:统计值、比值和滑窗值;其中,统计值包括:平均值、中位数、峰度、偏度、极差、标准差,比值包括:同比、环比、二阶导,滑窗值包括设定时间段内的具体指标值。
优选的,预设预测模型至少采用以下之一:神经网络、Xgboost、Lightgbm;若采用多个模型的方式,可以对不同模型的结果进行平均值融合。
步骤S103:根据所述初始指标值、均值和标准差,利用预设期望算法,计算出所述目标时间段内每个时间点的期望指标值;其中,一个时间点的期望指标值用于表征在所述时间点之后期望出现的所述目标指标的指标极值。
具体的,在判断所述目标时间点的真实指标值是否为所述目标指标在未来时间段的估算极大值的场景中,步骤S103,包括:
步骤C1:设所述目标时间段被单位时间划分出M个时间点,且所述目标时间段是以第M个时间点结束的时间段;
在本实施例中,目标时间段的起始时间点为初始时间点,即第0个时间点;目标时间段的结束时间点为第M个时间点;在所述目标时间段内包括第1个时间点至第(M-1)个时间点。
步骤C2:计算第(M-1)个时间点的期望指标值V(M-1)=E(ln(PM))=E(ln(P0)+X1+X2+…+XM~N(ln(P0)+Mμ,Mσ2));
其中,P0为所述初始指标值、μ为所述均值、σ2为所述标准差;Xt=ln(Pt)-ln(Pt-1),t∈[1,M]且Xt服从正态分布;基于均值μ和标注差σ2得到:Xt~N(μ,σ2);
在本实施例中,假设目标指标的每个时间点的指标值Pt服从对数正态分布,即其涨跌幅ln(Pt)-ln(Pt-1)服从正态分布。
在第0个时间点,已知目标指标的初始指标值P0,由于目标指标的指标值服从对数正态分布,所以可以得到每个时间点的指标值的分布如下:
ln(P1)=ln(P0)+X1~N(ln(P0)+μ,σ2);
ln(P2)=ln(P0)+X1+X2~N(ln(P0)+2μ,2σ2);
……
ln(PM)=ln(P0)+X1+X2+…+XM~N(ln(P0)+Mμ,Mσ2)。
此外,由于第M个时间点为所述目标时间段的最后一个时间点,根据最优停止算法可知,若在第M个时间点之前没有停止,那么第M个时间点必须停止,所以不需要计算第M个时间点的期望指标值。在本实施例中,第t个时间点的期望指标值用于表征若第t个时间点不停止则所述目标指标在未来能获得的最大收益。
步骤C3:计算第(M-2)个时间点的期望指标值V(M-2)
Figure BDA0002870582700000091
步骤C4:计算第(M-3)个时间点的期望指标值V(M-3)
Figure BDA0002870582700000092
步骤C5:以此类推,直至计算出第1个时间点的期望指标值V1
Figure BDA0002870582700000093
其中,F()为服从正态分布的分布函数。
进一步的,在判断所述目标时间点的真实指标值是否为所述目标指标在未来时间段的估算极小值的场景中,步骤S103,包括:
步骤D1:设所述目标时间段被单位时间划分出M个时间点,且所述目标时间段是以第M个时间点结束的时间段;
步骤D2:计算第(M-1)个时间点的期望指标值V(M-1)=E(ln(PM))=E(ln(P0)-X1-X2-…-XM~N(ln(P0)-Mμ,Mσ2));
其中,P0为所述初始指标值、μ为所述均值、σ2为所述标准差;Xt=ln(Pt)-ln(Pt-1),且Xt服从正态分布Xt~N(μ,σ2)、t∈[1,M];
步骤D3:计算第(M-2)个时间点的期望指标值
Figure BDA0002870582700000094
Figure BDA0002870582700000095
步骤D4:第(M-3)个时间点的期望指标值
Figure BDA0002870582700000096
Figure BDA0002870582700000097
步骤D5:以此类推,直至计算出第1个时间点的期望指标值
Figure BDA0002870582700000098
Figure BDA0002870582700000101
其中,F()为服从正态分布的分布函数。
步骤S104:在当前时间点到达所述目标时间段内的目标时间点后,根据所述目标时间点的真实指标值和所述目标时间点的期望指标值,利用最优停止算法判断所述目标时间点的真实指标值是否为所述目标指标在未来时间段的估算极值;其中,所述未来时间段为所述目标时间段中位于所述目标时间点之后的时间范围。
具体的,在判断所述目标时间点的真实指标值是否为所述目标指标在未来时间段的估算极大值的场景中,步骤S104,包括:
步骤A1:在当前时间点到达所述目标时间段内的目标时间点后,获取所述目标时间点的真实指标值;
优选的,先将所述目标时间段内的第1时间点设置为目标时间点,并在达到第1时间点时,获取目标指标在第1时间点的真实指标值。
步骤A2:判断所述目标时间点的真实指标值是否大于所述目标时间点的期望指标值,若是则将所述目标时间点的真实指标值作为所述目标指标在未来时间段的估算极大值,若否则执行步骤A3;
由于目标时间点的期望指标值是在未来期望的目标指标的极大值,若目标时间点的真实指标值大于未来期望的极大值,则可认为目标时间点的真实指标值为未来时间段的极大值。当目标时间点的真实指标值大于对应的期望指标值时,选择停止,否则继续观察下一时间点。
步骤A3:判断所述目标时间点是否为第(M-1)个时间点,若是则停止操作并将第M个时间点的真实指标值作为所述目标指标在所述目标时间段的估算极大值,若否则执行步骤A4;
在本实施例中,若第1个时间点至第(M-1)个时间点的真实指标值均小于对应的期望指标值,则认为在每个时间点均没有停止,此时需要将最后一个时间点,即第M个时间点的真实指标值作为目标时间段内的极大值。
步骤A4:以所述目标时间点的真实指标值作为初始指标值,根据所述均值和标准差,利用所述预设期望算法对所述目标时间点之后的所有时间点的期望指标值进行更新,并将所述目标时间点的下一时间点作为新的目标时间点,并返回步骤A1。
在本实施例中,随着时间的推移,会根据最新时间点的真实指标值更新之后时间点的期望指标值,实现了动态最优停止算法。
进一步的,在判断所述目标时间点的真实指标值是否为所述目标指标在未来时间段的估算极小值的场景中,步骤S104,包括:
步骤B1:在当前时间点到达所述目标时间段内的目标时间点后,获取所述目标时间点的真实指标值;
步骤B2:判断所述目标时间点的真实指标值是否小于所述目标时间点的期望指标值,若是则将所述目标时间点的真实指标值作为所述目标指标在未来时间段的估算极小值,若否则执行步骤B3;
步骤B3:判断所述目标时间点是否为第(M-1)个时间点,若是则停止操作并将第M个时间点的真实指标值作为所述目标指标在所述目标时间段的估算极小值,若否则执行步骤B4;
步骤B4:以所述目标时间点的真实指标值作为初始指标值,根据所述均值和标准差,利用所述预设期望算法对所述目标时间点之后的所有时间点的期望指标值进行更新,并将所述目标时间点的下一时间点作为新的目标时间点,并返回步骤B1。
本实施例中使用的最优停止算法纳入了可变算法起始点的思路,把更多的即使信息纳入到决策体系中。
由于机器学习算法在预测数据时存在一定的误差,若直接使用机器学习算法来预测出目标指标在目标时间段的极值,则会因为存在误差而导致预测结果不准确的问题;为了解决上述问题,在本实施例中先利用机器学习算法预测指标值在目标时间段的分布情况,再基于预测结果利用动态的最优停止算法以预测出目标指标在目标时间段的极值,通过使用最优停止算法可以容忍由机器学习算法带来的误差,使得最终的预测结果更加准确,通过使用最优停止算法以降低对机器学习算法的敏感度。
下面以证券交易为例,对本实施例的技术方案进行解释;不失一般性,本案例介绍在一个目标时间段上获得相对高的卖点价格;假设以下场景,用户持有某证券A,需要在当天进行TWAP交易卖出,交易频率为每30分钟交易一次,通过上述介绍的方法可以获得高的卖出价格,至少高于TWAP均价。
步骤E1:获取所述某证券A的历史数据,例如,历史成交价格、历史成交量等。
步骤E2:从所述历史数据中选取特征参数。
其中,特征参数至少包括:近5分钟涨跌幅、近1小时内5分钟频率的涨跌幅、近2小时内5分钟频率的涨跌幅、近1小时内5分钟频率的涨跌幅标准差、近2小时内5分钟频率的涨跌幅标准差、近1小时内的最高价/均价、仅1小时内的最低价/均价。
步骤E3:利用预设预测模型根据所述特征参数计算出所述证券A在5分钟频率上的涨跌幅均值和涨跌幅标准差。
例如,采用Lightgbm算法估计出证券A在目标时间段上的5分钟频率的涨跌幅的均值为0.00044,标准差为0.0091。
步骤E4:进入交易当天;假设已知初始时间点9:30的初始价格为7.38元,结合估计的均值和标准差,利用预设期望算法计算出接下来半小时内的各个时间点的期望指标值Vt序列,如表1所示:
表1
V<sub>t</sub> 7.51 7.46 7.46 7.44 7.40
时间点 9:35 9:40 9:45 9:50 9:55
由于若在9:55仍未成交,则必须在10:00成交,因此不需要计算出10:00的期望指标值。
步骤E5:判断是否成交;当时间到达9:35分是,假设证券A的真实价格为7.40元,小于期望价格7.51元,因此没有成交。此时需要基于9:35分的真实价格更新Vt序列值,新的Vt序列值如表2所示:
表2
V<sub>t</sub> 7.50 7.49 7.46 7.40
时间点 9:40 9:45 9:50 9:55
反复执行以上步骤,直至证券A在某个时间点的真实价格高于期望价格,实现成交,否则当时间到达10:00时,在10:00成交。
本实施例利用了机器学习预测准确度高于传统时间序列模型的优点,通过预测分布的方式,在一定程度上规避了机器学习预测误差带来的决策失误问题。利用随机分布的期望最大化的思想,给出了时间序列上的最优操作时间点。
实施例二
本发明实施例提供了一种数据处理装置,如图2所示,该装置具体包括以下组成部分:
获取模块201,用于当接收到针对目标指标的数据处理指令时,获取在初始时间点之前与所述目标指标关联的历史数据以及所述目标指标在所述初始时间点的初始指标值;
预测模块202,用于根据所述历史数据,利用预设预测模型计算出所述目标指标在目标时间段内指标值的涨跌幅的均值和标准差;其中,所述目标时间段是以所述初始时间点开始的时间段,且所述目标时间段被单位时间划分出多个时间点;
计算模块203,用于根据所述初始指标值、均值和标准差,利用预设期望算法计算出所述目标时间段内每个时间点的期望指标值;其中,一个时间点的期望指标值用于表征在所述时间点之后期望出现的所述目标指标的指标极值;
确定模块204,用于在当前时间点到达所述目标时间段内的目标时间点后,根据所述目标时间点的真实指标值和所述目标时间点的期望指标值,利用最优停止算法判断所述目标时间点的真实指标值是否为所述目标指标在未来时间段的估算极值;其中,所述未来时间段为所述目标时间段中位于所述目标时间点之后的时间范围。
具体的,预测模块202,用于:
从所述历史数据中提取出预设特征参数,并将提取出的特征参数输入至预先训练好的用于执行回归任务的预测模型中,以得到所述目标指标在目标时间段内指标值的涨跌幅的均值和标准差。
进一步的,在判断所述目标时间点的真实指标值是否为所述目标指标在未来时间段的估算极大值的场景中,计算模块203,具体用于:
设所述目标时间段被单位时间划分出M个时间点,且所述目标时间段是以第M个时间点结束的时间段;
计算第(M-1)个时间点的期望指标值V(M-1)=E(ln(PM))=E(ln(P0)+X1+X2+…+XM~N(ln(P0)+Mμ,Mσ2));其中,P0为所述初始指标值、μ为所述均值、σ2为所述标准差,Xt=ln(Pt)-ln(Pt-1)、且Xt服从正态分布Xt~N(μ,σ2)、t∈[1,M];
计算第(M-2)个时间点的期望指标值
Figure BDA0002870582700000141
Figure BDA0002870582700000142
计算第(M-3)个时间点的期望指标值
Figure BDA0002870582700000143
Figure BDA0002870582700000144
以此类推,直至计算出第1个时间点的期望指标值
Figure BDA0002870582700000145
Figure BDA0002870582700000146
其中,F()为服从正态分布的分布函数。
确定模块204,具体用于:
步骤A1:在当前时间点到达所述目标时间段内的目标时间点后,获取所述目标时间点的真实指标值;
步骤A2:判断所述目标时间点的真实指标值是否大于所述目标时间点的期望指标值,若是则将所述目标时间点的真实指标值作为所述目标指标在未来时间段的估算极大值,若否则执行步骤A3;
步骤A3:判断所述目标时间点是否为第(M-1)个时间点,若是则停止操作并将第M个时间点的真实指标值作为所述目标指标在所述目标时间段的估算极大值,若否则执行步骤A4;
步骤A4:以所述目标时间点的真实指标值作为初始指标值,根据所述均值和标准差,利用所述预设期望算法对所述目标时间点之后的所有时间点的期望指标值进行更新,并将所述目标时间点的下一时间点作为新的目标时间点,并返回步骤A1。
更进一步的,在判断所述目标时间点的真实指标值是否为所述目标指标在未来时间段的估算极小值的场景中,计算模块203,具体用于:
设所述目标时间段被单位时间划分出M个时间点,且所述目标时间段是以第M个时间点结束的时间段;
计算第(M-1)个时间点的期望指标值V(M-1)=E(ln(PM))=E(ln(P0)-X1-X2-…-XM~N(ln(P0)-Mμ,Mσ2));其中,P0为所述初始指标值、μ为所述均值、σ2为所述标准差,Xt=In(Pt)-ln(Pt-1)、且Xt服从正态分布Xt~N(μ,σ2)、t∈[1,M];
计算第(M-2)个时间点的期望指标值
Figure BDA0002870582700000151
Figure BDA0002870582700000152
计算第(M-3)个时间点的期望指标值
Figure BDA0002870582700000153
Figure BDA0002870582700000154
以此类推,直至计算出第1个时间点的期望指标值
Figure BDA0002870582700000155
Figure BDA0002870582700000156
其中,F()为服从正态分布的分布函数。
确定模块204,具体用于:
步骤B1:在当前时间点到达所述目标时间段内的目标时间点后,获取所述目标时间点的真实指标值;
步骤B2:判断所述目标时间点的真实指标值是否小于所述目标时间点的期望指标值,若是则将所述目标时间点的真实指标值作为所述目标指标在未来时间段的估算极小值,若否则执行步骤B3;
步骤B3:判断所述目标时间点是否为第(M-1)个时间点,若是则停止操作并将第M个时间点的真实指标值作为所述目标指标在所述目标时间段的估算极小值,若否则执行步骤B4;
步骤B4:以所述目标时间点的真实指标值作为初始指标值,根据所述均值和标准差,利用所述预设期望算法对所述目标时间点之后的所有时间点的期望指标值进行更新,并将所述目标时间点的下一时间点作为新的目标时间点,并返回步骤B1。
本实施例可以利用目标指标已知的历史时间序列信息,准确、高效的判断出当前时间点的指标值是否为未来一段时间内的最大值或最小值。在本实施例中,不会利用机器学习算法直接对目标指标在未来时间的指标值进行预测,而是利用机器学习算法预测出目标指标的指标值在未来的随机变量分布函数,且允许机器学习算法预测误差的存在;通过预测分布,结合期望最大化的最优停止算法,可以容忍由机器学习算法导致的预测误差,从而准确的判断出当前时间点的指标值是否为未来一段时间内的最大值或最小值。此外,在本实施例中采用了动态的最优停止算法,会根据当前最新的指标值以更新目标指标在未来时间的分布,从而进一步提高数据处理的准确性。
实施例三
本实施例还提供一种计算机设备,如可以执行程序的智能手机、平板电脑、笔记本电脑、台式计算机、机架式服务器、刀片式服务器、塔式服务器或机柜式服务器(包括独立的服务器,或者多个服务器所组成的服务器集群)等。如图3所示,本实施例的计算机设备30至少包括但不限于:可通过系统总线相互通信连接的存储器301、处理器302。需要指出的是,图3仅示出了具有组件301-302的计算机设备30,但是应理解的是,并不要求实施所有示出的组件,可以替代的实施更多或者更少的组件。
本实施例中,存储器301(即可读存储介质)包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中,存储器301可以是计算机设备30的内部存储单元,例如该计算机设备30的硬盘或内存。在另一些实施例中,存储器301也可以是计算机设备30的外部存储设备,例如该计算机设备30上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。当然,存储器301还可以既包括计算机设备30的内部存储单元也包括其外部存储设备。在本实施例中,存储器301通常用于存储安装于计算机设备30的操作系统和各类应用软件。此外,存储器301还可以用于暂时地存储已经输出或者将要输出的各类数据。
处理器302在一些实施例中可以是中央处理器(Central Processing Unit,CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器302通常用于控制计算机设备30的总体操作。
具体的,在本实施例中,处理器302用于执行存储器301中存储的数据处理方法的程序,所述数据处理方法的程序被执行时实现如下步骤:
当接收到针对目标指标的数据处理指令时,获取在初始时间点之前与所述目标指标关联的历史数据以及所述目标指标在所述初始时间点的初始指标值;
根据所述历史数据,利用预设预测模型计算出所述目标指标在目标时间段内指标值的涨跌幅的均值和标准差;其中,所述目标时间段是以所述初始时间点开始的时间段,且所述目标时间段被单位时间划分出多个时间点;
根据所述初始指标值、均值和标准差,利用预设期望算法计算出所述目标时间段内每个时间点的期望指标值;其中,一个时间点的期望指标值用于表征在所述时间点之后期望出现的所述目标指标的指标极值;
在当前时间点到达所述目标时间段内的目标时间点后,根据所述目标时间点的真实指标值和所述目标时间点的期望指标值,利用最优停止算法判断所述目标时间点的真实指标值是否为所述目标指标在未来时间段的估算极值;其中,所述未来时间段为所述目标时间段中位于所述目标时间点之后的时间范围。
上述方法步骤的具体实施例过程可参见第一实施例,本实施例在此不再重复赘述。
实施例四
本实施例还提供一种计算机可读存储介质,如闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘、服务器、App应用商城等等,其上存储有计算机程序,所述计算机程序被处理器执行时实现如下方法步骤:
当接收到针对目标指标的数据处理指令时,获取在初始时间点之前与所述目标指标关联的历史数据以及所述目标指标在所述初始时间点的初始指标值;
根据所述历史数据,利用预设预测模型计算出所述目标指标在目标时间段内指标值的涨跌幅的均值和标准差;其中,所述目标时间段是以所述初始时间点开始的时间段,且所述目标时间段被单位时间划分出多个时间点;
根据所述初始指标值、均值和标准差,利用预设期望算法计算出所述目标时间段内每个时间点的期望指标值;其中,一个时间点的期望指标值用于表征在所述时间点之后期望出现的所述目标指标的指标极值;
在当前时间点到达所述目标时间段内的目标时间点后,根据所述目标时间点的真实指标值和所述目标时间点的期望指标值,利用最优停止算法判断所述目标时间点的真实指标值是否为所述目标指标在未来时间段的估算极值;其中,所述未来时间段为所述目标时间段中位于所述目标时间点之后的时间范围。
上述方法步骤的具体实施例过程可参见第一实施例,本实施例在此不再重复赘述。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (10)

1.一种数据处理方法,其特征在于,所述方法包括:
当接收到针对目标指标的数据处理指令时,获取在初始时间点之前与所述目标指标关联的历史数据以及所述目标指标在所述初始时间点的初始指标值;
根据所述历史数据,利用预设预测模型计算出所述目标指标在目标时间段内指标值的涨跌幅的均值和标准差;其中,所述目标时间段是以所述初始时间点开始的时间段,且所述目标时间段被单位时间划分出多个时间点;
根据所述初始指标值、均值和标准差,利用预设期望算法计算出所述目标时间段内每个时间点的期望指标值;其中,一个时间点的期望指标值用于表征在所述时间点之后期望出现的所述目标指标的指标极值;
在当前时间点到达所述目标时间段内的目标时间点后,根据所述目标时间点的真实指标值和所述目标时间点的期望指标值,利用最优停止算法判断所述目标时间点的真实指标值是否为所述目标指标在未来时间段的估算极值;其中,所述未来时间段为所述目标时间段中位于所述目标时间点之后的时间范围。
2.根据权利要求1所述的数据处理方法,其特征在于,所述根据所述历史数据,利用预设预测模型计算出所述目标指标在目标时间段内指标值的涨跌幅的均值和标准差,具体包括:
从所述历史数据中提取出预设特征参数,并将提取出的特征参数输入至预先训练好的用于执行回归任务的预测模型中,以得到所述目标指标在目标时间段内指标值的涨跌幅的均值和标准差。
3.根据权利要求1所述的数据处理方法,其特征在于,在判断所述目标时间点的真实指标值是否为所述目标指标在未来时间段的估算极大值的场景中,所述根据所述初始指标值、均值和标准差,利用预设期望算法计算出所述目标时间段内每个时间点的期望指标值,具体包括:
设所述目标时间段被单位时间划分出M个时间点,且所述目标时间段是以第M个时间点结束的时间段;
计算第(M-1)个时间点的期望指标值V(M-1)=E(ln(PM))=E(ln(P0)+X1+X2+…+XM~N(ln(P0)+Mμ,Mσ2));其中,P0为所述初始指标值、μ为所述均值、σ2为所述标准差,Xt=ln(Pt)-ln(Pt-1)、且Xt服从正态分布Xt~N(μ,σ2)、t∈[1,M];
计算第(M-2)个时间点的期望指标值
Figure FDA0002870582690000021
Figure FDA0002870582690000022
计算第(M-3)个时间点的期望指标值
Figure FDA0002870582690000023
Figure FDA0002870582690000024
以此类推,直至计算出第1个时间点的期望指标值
Figure FDA0002870582690000025
Figure FDA0002870582690000026
其中,F()为服从正态分布的分布函数。
4.根据权利要求3所述的数据处理方法,其特征在于,所述在当前时间点到达所述目标时间段内的目标时间点后,根据所述目标时间点的真实指标值和所述目标时间点的期望指标值,利用最优停止算法判断所述目标时间点的真实指标值是否为所述目标指标在未来时间段的估算极值,具体包括:
步骤A1:在当前时间点到达所述目标时间段内的目标时间点后,获取所述目标时间点的真实指标值;
步骤A2:判断所述目标时间点的真实指标值是否大于所述目标时间点的期望指标值,若是则将所述目标时间点的真实指标值作为所述目标指标在未来时间段的估算极大值,若否则执行步骤A3;
步骤A3:判断所述目标时间点是否为第(M-1)个时间点,若是则停止操作并将第M个时间点的真实指标值作为所述目标指标在所述目标时间段的估算极大值,若否则执行步骤A4;
步骤A4:以所述目标时间点的真实指标值作为初始指标值,根据所述均值和标准差,利用所述预设期望算法对所述目标时间点之后的所有时间点的期望指标值进行更新,并将所述目标时间点的下一时间点作为新的目标时间点,并返回步骤A1。
5.根据权利要求1所述的数据处理方法,其特征在于,在判断所述目标时间点的真实指标值是否为所述目标指标在未来时间段的估算极小值的场景中,所述根据所述初始指标值、均值和标准差,利用预设期望算法计算出所述目标时间段内每个时间点的期望指标值,具体包括:
设所述目标时间段被单位时间划分出M个时间点,且所述目标时间段是以第M个时间点结束的时间段;
计算第(M-1)个时间点的期望指标值V(M-1)=E(ln(PM))=E(ln(P0)-X1-X2-…-XM~N(ln(P0)-Mμ,Mσ2));其中,P0为所述初始指标值、μ为所述均值、σ2为所述标准差,Xt=ln(Pt)-ln(Pt-1)、且Xt服从正态分布Xt~N(μ,σ2)、t∈[1,M];
计算第(M-2)个时间点的期望指标值
Figure FDA0002870582690000031
Figure FDA0002870582690000032
计算第(M-3)个时间点的期望指标值
Figure FDA0002870582690000033
Figure FDA0002870582690000034
以此类推,直至计算出第1个时间点的期望指标值
Figure FDA0002870582690000035
Figure FDA0002870582690000036
其中,F()为服从正态分布的分布函数。
6.根据权利要求5所述的数据处理方法,其特征在于,所述在当前时间点到达所述目标时间段内的目标时间点后,根据所述目标时间点的真实指标值和所述目标时间点的期望指标值,利用最优停止算法判断所述目标时间点的真实指标值是否为所述目标指标在未来时间段的估算极值,具体包括:
步骤B1:在当前时间点到达所述目标时间段内的目标时间点后,获取所述目标时间点的真实指标值;
步骤B2:判断所述目标时间点的真实指标值是否小于所述目标时间点的期望指标值,若是则将所述目标时间点的真实指标值作为所述目标指标在未来时间段的估算极小值,若否则执行步骤B3;
步骤B3:判断所述目标时间点是否为第(M-1)个时间点,若是则停止操作并将第M个时间点的真实指标值作为所述目标指标在所述目标时间段的估算极小值,若否则执行步骤B4;
步骤B4:以所述目标时间点的真实指标值作为初始指标值,根据所述均值和标准差,利用所述预设期望算法对所述目标时间点之后的所有时间点的期望指标值进行更新,并将所述目标时间点的下一时间点作为新的目标时间点,并返回步骤B1。
7.一种数据处理装置,其特征在于,所述装置包括:
获取模块,用于当接收到针对目标指标的数据处理指令时,获取在初始时间点之前与所述目标指标关联的历史数据以及所述目标指标在所述初始时间点的初始指标值;
预测模块,用于根据所述历史数据,利用预设预测模型计算出所述目标指标在目标时间段内指标值的涨跌幅的均值和标准差;其中,所述目标时间段是以所述初始时间点开始的时间段,且所述目标时间段被单位时间划分出多个时间点;
计算模块,用于根据所述初始指标值、均值和标准差,利用预设期望算法计算出所述目标时间段内每个时间点的期望指标值;其中,一个时间点的期望指标值用于表征在所述时间点之后期望出现的所述目标指标的指标极值;
确定模块,用于在当前时间点到达所述目标时间段内的目标时间点后,根据所述目标时间点的真实指标值和所述目标时间点的期望指标值,利用最优停止算法判断所述目标时间点的真实指标值是否为所述目标指标在未来时间段的估算极值;其中,所述未来时间段为所述目标时间段中位于所述目标时间点之后的时间范围。
8.根据权利要求7所述的数据处理装置,其特征在于,所述预测模块,具体用于:
从所述历史数据中提取出预设特征参数,并将提取出的特征参数输入至预先训练好的用于执行回归任务的预测模型中,以得到所述目标指标在目标时间段内指标值的涨跌幅的均值和标准差。
9.一种计算机设备,所述计算机设备包括:存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述方法的步骤。
CN202011598563.7A 2020-12-29 2020-12-29 一种数据处理方法、装置、设备及可读存储介质 Pending CN112508308A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011598563.7A CN112508308A (zh) 2020-12-29 2020-12-29 一种数据处理方法、装置、设备及可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011598563.7A CN112508308A (zh) 2020-12-29 2020-12-29 一种数据处理方法、装置、设备及可读存储介质

Publications (1)

Publication Number Publication Date
CN112508308A true CN112508308A (zh) 2021-03-16

Family

ID=74951871

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011598563.7A Pending CN112508308A (zh) 2020-12-29 2020-12-29 一种数据处理方法、装置、设备及可读存储介质

Country Status (1)

Country Link
CN (1) CN112508308A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113420876A (zh) * 2021-06-29 2021-09-21 平安科技(深圳)有限公司 基于无监督学习的实时运行数据处理方法、装置、设备
CN113537950A (zh) * 2021-08-20 2021-10-22 支付宝(杭州)信息技术有限公司 项目处理方法以及装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113420876A (zh) * 2021-06-29 2021-09-21 平安科技(深圳)有限公司 基于无监督学习的实时运行数据处理方法、装置、设备
CN113420876B (zh) * 2021-06-29 2023-10-27 平安科技(深圳)有限公司 基于无监督学习的实时运行数据处理方法、装置、设备
CN113537950A (zh) * 2021-08-20 2021-10-22 支付宝(杭州)信息技术有限公司 项目处理方法以及装置

Similar Documents

Publication Publication Date Title
CN111401609B (zh) 车流量时间序列的预测方法及预测装置
CN110084271B (zh) 一种图片类别的识别方法和装置
CN112232495B (zh) 预测模型的训练方法、装置、介质和计算设备
CN109740760B (zh) 文本质检自动化训练方法、电子装置及计算机设备
CN112508308A (zh) 一种数据处理方法、装置、设备及可读存储介质
JP2017142781A (ja) 確率的価格及び急変予測
CN110647913B (zh) 基于聚类算法的异常数据检测方法及装置
CN110764902A (zh) 基于ai的虚拟资源分配方法、装置、计算机设备及存储介质
CN108416619B (zh) 一种消费间隔时间预测方法、装置及可读存储介质
CN114187009A (zh) 交易风险预测模型的特征解释方法、装置、设备及介质
CN113129064A (zh) 汽车配件价格预测方法、系统、设备与可读存储介质
CN112308636B (zh) 一种基于市场需求变化的市场需求值的计算方法和装置
Ding et al. Dirichlet process mixture models with shrinkage prior
CN111783883A (zh) 一种异常数据的检测方法及装置
CN116452242A (zh) 一种基于拟合回归的游戏利润预测方法、装置及设备
CN114970985A (zh) 维修器材需求预测方法、装置及终端
CN111754103A (zh) 企业风险画像方法、装置、计算机设备和可读存储介质
CN117132177B (zh) 基于多重假设检验的径流预报模型构建和径流预报方法
CN117217822B (zh) 电力交易指数预测的方法、装置、终端设备及存储介质
CN113407411B (zh) 一种直播场景中线上数据的准确性监测装置及方法
CN116862561B (zh) 基于卷积神经网络的产品热度分析方法和系统
CN109409596B (zh) 预测风速的处理方法、装置、设备和计算机可读存储介质
CN116433093A (zh) 基于贝叶斯估计的非完全随机化可靠性试验因子识别方法
CN117332218A (zh) 台区末端电压预测方法及预测终端
CN116933078A (zh) 太阳辐照度区间预测方法、装置、计算机设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20210316

RJ01 Rejection of invention patent application after publication