CN115796365A - 一种基于可预测因子分解的金融时序预测方法及装置 - Google Patents

一种基于可预测因子分解的金融时序预测方法及装置 Download PDF

Info

Publication number
CN115796365A
CN115796365A CN202211530712.5A CN202211530712A CN115796365A CN 115796365 A CN115796365 A CN 115796365A CN 202211530712 A CN202211530712 A CN 202211530712A CN 115796365 A CN115796365 A CN 115796365A
Authority
CN
China
Prior art keywords
implicit
time sequence
factor
factors
financial
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211530712.5A
Other languages
English (en)
Inventor
侯静怡
刘志杰
贺威
夏光华
唐宇鑫
董震
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Science and Technology Beijing USTB
Yanan University
Original Assignee
University of Science and Technology Beijing USTB
Yanan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Science and Technology Beijing USTB, Yanan University filed Critical University of Science and Technology Beijing USTB
Priority to CN202211530712.5A priority Critical patent/CN115796365A/zh
Publication of CN115796365A publication Critical patent/CN115796365A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供了一种基于可预测因子分解的金融时序预测方法及装置,涉及软件技术领域。包括:根据可观测金融时序数据推断多个时刻的隐式因子,将多个隐式因子组合成多个相互独立的可预测时序分量,对时序分量中隐式因子之间的关系分别进行建模,获得多个可预测因子分解模型;对多个可预测因子分解模型进行优化学习,获得可辨识性、可预测性和充分性的优化结果,根据优化结果对构建的关系模型进行求解从而得到金融时序预测结果。该方法的提出缓解了以往方法由于缺乏高维可观测金融时序数据而难以进行可解释性建模分析的限制,通过对推断出的时序分量的预测,间接地实现对待预测值的计算。

Description

一种基于可预测因子分解的金融时序预测方法及装置
技术领域
本发明涉及软件技术领域,特别是指一种基于可预测因子分解的金融时序预测方法及装置。
背景技术
在金融数据中的变量由于受到多种已知、未知因素的影响,不确定性很高,往往难以预测。近年来,深度学习技术在视觉、语言等领域中所涉及的复杂序列建模任务上都表现出了强大预测能力。与这些研究领域的序列不同,金融时序既不包含充足的高维可观测数据信息,也很难获得足够的显式语义信息来指导数据分析,深度学习方法仍然面临着与其他任务不同的挑战。既然金融时间序列的规律性是内在的,不能直接观测到,分析并预测金融时序数据可以间接地从影响数据的各种因素出发,通过发现这些因素及因素之间的关系并对其进行建模,可以使金融时间序列预测方法具有良好的可解释性,从而提高方法的预测性能。已有一些金融数据预测方法显式地挖掘市场环境中可能对金融数据产生影响的因素,然而,有些影响因素是不可观测的,且因素之间的因果关系可能会冗余、或呈伪相关关系,难以有效建模。也有方法从历史观测数据中发掘隐式的因素,然而,大多数方法没有建模这些因素的时序变化特性,或者无法通过学习的方式自动发掘隐式的因素,因此无法充分利用可观测数据本身特性进行合理建模。
发明内容
针对现有技术中,大多数方法没有建模这些因素的时序变化特性,或者无法通过学习的方式自动发掘隐式的因素,因此无法充分利用可观测数据本身特性进行合理建模的问题,本发明提出了一种基于可预测因子分解的金融时序预测方法及装置。
为解决上述技术问题,本发明提供如下技术方案:
一方面,提供了一种基于可预测因子分解的金融时序预测方法,该方法应用于电子设备,包括以下步骤:
S1:根据可观测金融时序数据推断多个时刻的隐式因子,将多个隐式因子组合成多个相互独立的可预测时序分量,对时序分量中隐式因子之间的关系分别进行建模,获得多个可预测因子分解模型;
S2:对多个可预测因子分解模型进行优化学习,获得可辨识性、可预测性和充分性的优化结果,根据优化结果对构建的关系模型进行求解从而得到金融时序预测结果。
可选地,S1中,根据可观测金融时序数据推断多个时刻的隐式因子,将多个隐式因子组合成多个相互独立的可预测时序分量,对时序分量中隐式因子之间的关系分别进行建模,获得可预测因子分解模型,包括:
S11:采用多尺度卷积编码实现根据历史观测金融数据推断隐式因子分布,并将根据不同时间尺度计算出的隐式因子划分至对应的时序分量;
S12:根据推断出的隐式因子分布采样得到隐式因子,建模隐式因子之间的关系;
S13:设计解码器,构建隐式因子对观测数据的有向关系,建模隐式因子与观测数据的因果关系;
S14:利用序列模型构建隐式因子在时序分量中的时序关系,获得可预测因子分解模型。
可选地,S11中,采用多尺度卷积编码实现根据历史观测金融数据推断隐式因子分布,并将根据不同时间尺度计算出的隐式因子划分至对应的时序分量,包括:
Figure BDA0003975619290000021
为K个采样率的集合,采样的时间序列为
Figure BDA0003975619290000022
其中s(X,r)表示采样率为r的X上的采样操作;编码器分别学习每个时间尺度上的隐式因子,在解码过程中将这些隐式因子进行组合。
可选地,S13中,设计解码器,包括:
利用线性变换f(i)对每个时间尺度分别重构
Figure BDA0003975619290000023
Figure BDA0003975619290000024
根据下述公式(1)利用注意机制对不同时间尺度的重构信号进行组合:
Figure BDA0003975619290000031
其中,αi为注意力系数,||·||F为矩阵的Frobenious范数。
可选地,步骤S14中,利用序列模型构建隐式因子在时序分量中的时序关系,获得可预测因子分解模型,包括:
对于每个时序分量,引入一个GRU网络g(i)(i=1,2,…,K),其中GRU的输出为
Figure BDA0003975619290000032
为当前时刻对下一时刻的预测值。
可选地,步骤S2中,对多个可预测因子分解模型进行优化学习,获得可辨识性、可预测性和充分性的优化结果,根据优化结果对构建的关系模型进行求解从而得到金融时序预测结果,包括:
S21:基于变分自编码器VAE,引入一个额外的观测变量E,对可预测因子分解模型进行可辨识性建模,在训练过程中调整超参数,提高KL散度的权重,解耦隐式因子;
S22:基于隐式因子时序关系的GRU模型,将隐式因子直接输入至编码器,设置自回归损失使重构误差最小;
S23:通过最小化VAE目标函数中的重构项,对于所有时刻的隐式因子都使用解码器ψd重构X,利用解码器模型中的注意力权重系数αi加权相加,得到最终的预测结果。
可选地,步骤S22中,根据下述公式(2)设置自回归损失使重构误差最小,包括:
Figure BDA0003975619290000033
其中,X为已观测时序数据,E为额外观测变量;H为时序分量。
一方面,提供了一种基于可预测因子分解的金融时序预测装置,该装置应用于电子设备,该装置包括:
推断建模模块,用于根据可观测金融时序数据推断多个时刻的隐式因子,将多个隐式因子组合成多个相互独立的可预测时序分量,对时序分量中隐式因子之间的关系分别进行建模,获得多个可预测因子分解模型;
优化学习模块,用于对多个可预测因子分解模型进行优化学习,获得可辨识性、可预测性和充分性的优化结果,根据优化结果对构建的关系模型进行求解从而得到金融时序预测结果。
可选地,推断建模模块,进一步用于采用多尺度卷积编码实现根据历史观测金融数据推断隐式因子分布,并将根据不同时间尺度计算出的隐式因子划分至对应的时序分量;
根据推断出的隐式因子分布采样得到隐式因子,建模隐式因子之间的关系;
设计解码器,构建隐式因子对观测数据的有向关系,建模隐式因子与观测数据的因果关系;
利用序列模型构建隐式因子在时序分量中的时序关系,获得可预测因子分解模型。
可选地,推断建模模块,进一步用于设
Figure BDA0003975619290000041
为K个采样率的集合,采样的时间序列为
Figure BDA0003975619290000042
其中s(X,r)表示采样率为r的X上的采样操作;编码器分别学习每个时间尺度上的隐式因子,在解码过程中将这些隐式因子进行组合。
一方面,提供了一种电子设备,所述电子设备包括处理器和存储器,所述存储器中存储有至少一条指令,所述至少一条指令由所述处理器加载并执行以实现上述一种基于可预测因子分解的金融时序预测方法。
一方面,提供了一种计算机可读存储介质,所述存储介质中存储有至少一条指令,所述至少一条指令由处理器加载并执行以实现上述一种基于可预测因子分解的金融时序预测方法。
本发明实施例的上述技术方案至少具有如下有益效果:
上述方案中,创新地提出了一种发现时序数据中可预测隐式因子的金融时序预测方法。该方法通过对隐式因子的可辨识性、可预测性和充分性建模,学习由隐式因子组成的多个独立的、可预测的时序分量,实现长期高效的稀疏的隐式因子关系建模,从而使得模型更加轻松地对未来金融数据进行预测。该方法的提出缓解了以往方法由于缺乏高维可观测金融时序数据而难以进行可解释性建模分析的限制,通过对推断出的时序分量的预测,间接地实现对待预测值的计算。另外,本发明根据深度学习方法的特点,重新定义时序信号分解的性质,使得深度学习方法更有效地适用于金融时序预测任务。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的一种基于可预测因子分解的金融时序预测方法的流程图;
图2是本发明实施例提供的一种基于可预测因子分解的金融时序预测方法的流程图;
图3是本发明实施例提供的一种基于可预测因子分解的金融时序预测方法的隐式因子关系建模示例图;
图4是本发明实施例提供的一种基于可预测因子分解的金融时序预测方法的GRU模型每一时刻模块组成示意图;
图5是本发明实施例提供的一种基于可预测因子分解的金融时序预测装置框图;
图6是本发明实施例提供的一种电子设备的结构示意图。
具体实施方式
为使本发明要解决的技术问题、技术方案和优点更加清楚,下面将结合附图及具体实施例进行详细描述。
本发明实施例提供了一种基于可预测因子分解的金融时序预测方法,该方法可以由电子设备实现,该电子设备可以是终端或服务器。如图1所示的结合多尺度卷积与自注意力编码的基于可预测因子分解的金融时序预测方法流程图,该方法的处理流程可以包括如下的步骤:
S101:根据可观测金融时序数据推断多个时刻的隐式因子,将多个隐式因子组合成多个相互独立的可预测时序分量,对时序分量中隐式因子之间的关系分别进行建模,获得多个可预测因子分解模型;
S102:对多个可预测因子分解模型进行优化学习,获得可辨识性、可预测性和充分性的优化结果,根据优化结果对构建的关系模型进行求解从而得到金融时序预测结果。
可选地,S101中,根据可观测金融时序数据推断多个时刻的隐式因子,将多个隐式因子组合成多个相互独立的可预测时序分量,对时序分量中隐式因子之间的关系分别进行建模,获得可预测因子分解模型,包括:
S111:采用多尺度卷积编码实现根据历史观测金融数据推断隐式因子分布,并将根据不同时间尺度计算出的隐式因子划分至对应的时序分量;
S112:根据推断出的隐式因子分布采样得到隐式因子,建模隐式因子之间的关系;
S113:设计解码器,构建隐式因子对观测数据的有向关系,建模隐式因子与观测数据的因果关系;
S114:利用序列模型构建隐式因子在时序分量中的时序关系,获得可预测因子分解模型。
可选地,S111中,采用多尺度卷积编码实现根据历史观测金融数据推断隐式因子分布,并将根据不同时间尺度计算出的隐式因子划分至对应的时序分量,包括:
Figure BDA0003975619290000061
为K个采样率的集合,采样的时间序列为
Figure BDA0003975619290000062
其中s(X,r)表示采样率为r的X上的采样操作;编码器分别学习每个时间尺度上的隐式因子,在解码过程中将这些隐式因子进行组合。
可选地,S113中,设计解码器,包括:
利用线性变换f(i)对每个时间尺度分别重构
Figure BDA0003975619290000074
Figure BDA0003975619290000076
根据下述公式(1)利用注意机制对不同时间尺度的重构信号进行组合:
Figure BDA0003975619290000071
其中,αi为注意力系数,||·||F为矩阵的Frobenious范数。
可选地,步骤S114中,利用序列模型构建隐式因子在时序分量中的时序关系,获得可预测因子分解模型,包括:
对于每个时序分量,引入一个GRU网络g(i)(i=1,2,…,K),其中GRU的输出为
Figure BDA0003975619290000072
为当前时刻对下一时刻的预测值。
可选地,步骤S102中,对多个可预测因子分解模型进行优化学习,获得可辨识性、可预测性和充分性的优化结果,根据优化结果对构建的关系模型进行求解从而得到金融时序预测结果,包括:
S121:基于变分自编码器VAE,引入一个额外的观测变量E,对可预测因子分解模型进行可辨识性建模,在训练过程中调整超参数,提高KL散度的权重,解耦隐式因子;
S122:基于隐式因子时序关系的GRU模型,将隐式因子直接输入至编码器,设置自回归损失使重构误差最小;
S123:通过最小化VAE目标函数中的重构项,对于所有时刻的隐式因子都使用解码器ψd重构X,利用解码器模型中的注意力权重系数αi加权相加,得到最终的预测结果。
可选地,步骤S122中,根据下述公式(2)设置自回归损失使重构误差最小,包括:
Figure BDA0003975619290000073
其中,X为已观测时序数据,E为额外观测变量;H为时序分量。
本发明实施例中,创新地提出了一种发现时序数据中可预测隐式因子的金融时序预测方法。该方法通过对隐式因子的可辨识性、可预测性和充分性建模,学习由隐式因子组成的多个独立的、可预测的时序分量,实现长期高效的稀疏的隐式因子关系建模,从而使得模型更加轻松地对未来金融数据进行预测。该方法的提出缓解了以往方法由于缺乏高维可观测金融时序数据而难以进行可解释性建模分析的限制,通过对推断出的时序分量的预测,间接地实现对待预测值的计算。另外,本发明根据深度学习方法的特点,重新定义时序信号分解的性质,使得深度学习方法更有效地适用于金融时序预测任务。
本发明实施例提供了一种基于可预测因子分解的金融时序预测方法,该方法可以由电子设备实现,该电子设备可以是终端或服务器。如图2所示的结合多尺度卷积与自注意力编码的基于可预测因子分解的金融时序预测方法流程图,该方法的处理流程可以包括如下的步骤:
S201:采用多尺度卷积编码实现根据历史观测金融数据推断隐式因子分布,并将根据不同时间尺度计算出的隐式因子划分至对应的时序分量.
一种可行的实施方式中,本发明需要通过隐式因子(latent factor)推断与关系建模来构建可预测因子分解模型。首先构建隐式因子与可观测金融时序数据之间的关系,即根据可观测金融数据推断隐式因子,然后将隐式因子组合成多个相互独立的可预测时序分量,分别建模时序分量中隐式因子之间的关系从而预测后续时刻的隐式因子,最后通过隐式因子的简单组合得到待预测的金融数据。
其中,金融时序预测(financial time series forecasting)为根据观测到的历史时间序列数据预测未来金融数据的任务。隐式因子为能够影响可观测金融数据的因素,该类变量的具象含义无需人为定义。可预测因子分解为:将观测数据序列分解为多个隐式因子,并将隐式因子组成多个容易预测的时序数据,通过分别对这些序列的预测来推测待预测数据的值。
本发明实施例中,目标是发现金融时序数据中可预测的隐式因子,从而进行有效的预测。为此,首先对隐式因子和观测到的金融时序数据之间的关系建模,然后据此进行优化学习。将所有隐式因子划分为几个独立的时序分量,并假设每个分量中的因子是条件独立的,以提高计算效率。
图3所示为隐式因子推断与关系建模的示例(以2个时序分量为例)。令X=[x(1),...,x(T)]∈RD×T为过去的T个时间步长的已观测时序数据,D为每一时刻的特征维度,H=[h(1),...,h(T)]∈RL×K×T为分解后的K个时序分量,每个分量由L个隐式因子组成。观测到的金融时序数据X,例如股票的价格,通常是不可预测的非平稳时间序列,我们假设X依赖于隐式的可预测的H,通过根据X推断H来完成预测任务。如图2所示,未来时刻的观测值X(T+1)和预测值y(T+1)都可以通过隐式因子h(T+1)计算得到。
一种可行的实施方式中,首先进行多尺度卷积编码:为了挖掘对观测数据具有长期、短期依赖的隐式因子,本方法对观测时序数据进行多个尺度采样,并直接根据抽样尺度将隐式因子划分为不同的时序分量。设
Figure BDA00039756192900000910
为K个采样率的集合,采样的时间序列为
Figure BDA0003975619290000091
其中s(X,r)表示采样率为r的X上的采样操作;编码器分别学习每个时间尺度上的隐式因子,在解码过程中将这些隐式因子进行组合。
其中,特征编码器φ由K个子编码器组成,
Figure BDA0003975619290000092
这些子编码器用于以无监督的方式学习潜在因子的分布:
Figure BDA0003975619290000093
其中,其中
Figure BDA0003975619290000094
表示采样率为ri的输入时间序列学习到的第j个隐式因子,s(·,·)通过尺寸为2的膨胀卷积(dilated convolution)实现(即采样当前时刻与间隔为ri的前2个时刻数据),通过在时序数据开头处补0使X(i)和X之间保持相同大小。
Figure BDA0003975619290000095
Figure BDA0003975619290000096
分别表示μ(i)∈RL和σ(i)∈RL的第j个元素,因此上式中的
Figure BDA0003975619290000097
表示隐式因子的后验分布为一维高斯分布,均值和标准差分别为
Figure BDA0003975619290000098
Figure BDA0003975619290000099
S202:根据推断出的隐式因子分布采样得到隐式因子,建模隐式因子之间的关系。
一种可行的实施方式中,根据编码学得的高斯分布参数生成分布,从分布中采样推断出隐式因子H。
S203:设计解码器,构建隐式因子对观测数据的有向关系,建模隐式因子与观测数据的因果关系。
一种可行的实施方式中,在解码器部分,利用线性变换f(i)对每个时间尺度分别重构
Figure BDA0003975619290000101
Figure BDA0003975619290000102
根据下述公式(1)利用注意机制对不同时间尺度的重构信号进行组合:
Figure BDA0003975619290000103
其中,αi为注意力系数,||·||F为矩阵的Frobenious范数。由此,模型解码器可被描述为
Figure BDA0003975619290000104
进一步得到
Figure BDA0003975619290000105
S204:利用序列模型构建隐式因子在时序分量中的时序关系,获得可预测因子分解模型。
一种可行的实施方式中,对于每个时序分量,引入一个GRU(gatedrecurrentunit,门控循环单元)网络g(i)(i=1,2,…,K),其中GRU的输出为
Figure BDA0003975619290000106
为当前时刻对下一时刻的预测值。
本发明实施例中,通过深度学习技术推断金融数据随时间变化的隐式因子,形成有规律、可预测的多个条件独立的时序分量,相比于成因复杂的原始观测数据,这些时序分量由于相互独立、更有规律性而更容易预测。本方法首先间接地预测隐式因子,再根据预测得到的隐式因子计算最终的预测值。
S205:基于变分自编码器VAE,引入一个额外的观测变量E,对可预测因子分解模型进行可辨识性建模,在训练过程中调整超参数,提高KL散度的权重,解耦隐式因子。
本发明实施例中,基于VAE(variational autoencoder,变分自编码器)算法将编码为隐式因子的概率分布,预测未来时刻的隐式因子从而计算最终的预测值。本步骤对构建的可预测因子分解模型进行端到端优化学习,具体分为3个并行的子步骤,即通过建模隐式因子的可辨识性、可预测性和充分性来保证模型学习的可行性。
一种可行的实施方式中,进行可辨识性建模与证明:
在传统VAE的基础上,引入了一个额外的观测变量E,以保持整个模型的可辨识性,并解耦学习的潜在因素。我们定义E=[e1,…,eT]∈R(D+1)×T,用et描述时间指标t和在点对应的观测信号xt的联合表示。假定在E条件下,先验分布p(H|E)的各分量是条件独立的,即所有隐式因子hj相互独立。在上述步骤201-204描述的模型中,各尺度下的编码器
Figure BDA0003975619290000111
对后验分布qφ(H|X,E)进行联合建模,用它作为真实后验分布pψ(H|X,E)的变分近似。ψ表示解码器ψd和先验分布ψp的所有参数,因此联合分布描述为:
Figure BDA0003975619290000112
在条件独立的假设下,通过最大化对数似然优化模型参数
Figure BDA0003975619290000113
Figure BDA0003975619290000114
其中
Figure BDA00039756192900001110
为训练集。上式可以进一步分解为重构项和先验分布与后验分布之间的KL散度,并通过在模型训练过程中调整超参数,逐步提高KL散度的权重,以解耦隐式因子。
与VAE算法使用的标准正态分布先验不同,本发明采用高斯位置尺度族作为先验分布,其写作指数分布族的形式为
Figure BDA0003975619290000115
其中
Figure BDA0003975619290000116
是充分的统计量,对应的参数
Figure BDA0003975619290000117
和归一化常量
Figure BDA0003975619290000118
依赖于E。本方法模型中,λi是根据E独立随机抽样的,以实现前述的隐式因子相互条件独立,并且
Figure BDA0003975619290000119
对于不同的尺度是相同的。
利用[10]中的定理1证明步骤1中描述模型是~A可辨识的。其中~A定义如下:定义假定~表示的等价关系为
Figure BDA0003975619290000121
其中A是维度为LK×LK的矩阵,c表示向量。如果A是可逆的,则称该关系为~A
可以根据该定义证明步骤1描述的模型是~A可辨识的,因为满足以下条件:
a.用于重构x的各尺度的解码器f具有零测度误差。
b.f经过优化可近似单射。
c.
Figure BDA0003975619290000128
处处可微,且
Figure BDA0003975619290000122
Figure BDA0003975619290000123
是线性无关的。
d.通过根据E随机独立采样μ和σ,可得到LK+1个点的
Figure BDA0003975619290000124
令矩阵[λ(E2)-λ(E1),…,λ(ELK+1)-λ(ELK)]是可逆的。
通过证明可辨识性使得模型可以解耦隐式因子之间的复杂关系,从而将隐式因子之间的关系稀疏化,降低了模型的复杂性,提高了学习效率。
S206:基于隐式因子时序关系的GRU模型,将隐式因子直接输入至编码器,设置自回归损失使重构误差最小。
一种可行的实施方式中,为保证可预测性,对于建模了隐式因子时序关系的GRU模型,期望优化得到的网络使得
Figure BDA0003975619290000125
在一般的监督学习中,h(i)(t+1)被视为训练g(i)的真值,然而,本方法中的隐式因子h(i)(t+1)是由编码器φ(i)计算的,在端到端训练之前,编码器φ(i)也是不确定的,这可能会使g的优化失效。因此,直接将
Figure BDA0003975619290000126
输入解码器ψd重构X,设置自回归损失使重构误差最小:
Figure BDA0003975619290000127
S207:通过最小化VAE目标函数中的重构项,对于所有时刻的隐式因子都使用解码器ψd重构X,利用解码器模型中的注意力权重系数αi加权相加,得到最终的预测结果。
一种可行的实施方式中,为了保证学得的隐式因子包含足够的信息量,对于所有时刻的隐式因子都使用解码器ψd重构X,此处可直接通过最小化VAE目标函数中的重构项得到。除了包含足够的信息量重构观测信息,本方法还需要使得隐式因子包含足够计算未来预测值的信息。为此,可直接在学得隐式因子表示后接用于相应的任务模型,分别预测各时序分量的结果,再利用解码器模型中的注意力权重系数αi加权相加,得到最终的预测结果即可。拼接后的整体模型可以以端到端的方式进行优化。
一种可行的实施方式中,例如:金融长时序预测任务:该任务为自回归任务,根据历史观测数据,预测未来较长时间的观测数据。可利用时序自回归模型分别预测时序分量在未来时刻,然后将预测的时序分量以αi为系数直接加权相加得到最终的预测序列。
股票收益率预测:该任务的输入是股票价格相关信息,输出是未来一天的股票收益率。可利用循环神经网络等时序模型分别对时序分量进行编码,编码得到的特征以αi为系数直接加权相加,输入到一个非线性网络中得到最终的股票收益率预测值。
本发明实施例中,给出了实现可预测性隐式因子推断的三个性质定义,可辨识性、可预测性和充分性,通过对这三个性质的建模与学习才能保证本发明模型的可行性。
本发明实施例中,整个设计过程分为两大步骤。第一步实现隐式因子推断与关系建模来构建可预测因子分解模型;第二步根据定义和建模可辨识性、可预测性和充分性对构建的关系模型进行求解从而得到金融时序预测结果。模型(以2个时序分量为例)在每一时刻具体模块组成如图4所示。经过上述各步骤后,设计结束。
本发明实施例中,针对金融时序信息规律性弱、且缺乏高维可观测数据的问题,将观测数据映射到语义层级进行处理,重新定义金融时序信号分解,使得深度学习方法更有效地适用于金融时序预测任务。具体地,本发明方法通过根据历史信息推断影响金融时序数据的规律性强、可预测隐式因子,对这些因素进行稀疏关系建模,以实现长期有效且容易重构的预测。这种简单有效的深度学习模型可在金融时序预测领域(如股票收益率预测、金融长时预测任务)取得良好的应用,提高金融时序预测的可解释性,为基于语义层级的大规模金融时序分析提供了理论和应用基础,具有较大的经济效益。
图5是根据一示例性实施例示出的一种基于可预测因子分解的金融时序预测装置框图。参照图5,该装置300包括:
推断建模模块310,用于根据可观测金融时序数据推断多个时刻的隐式因子,将多个隐式因子组合成多个相互独立的可预测时序分量,对时序分量中隐式因子之间的关系分别进行建模,获得多个可预测因子分解模型;
优化学习模块320,用于对多个可预测因子分解模型进行优化学习,获得可辨识性、可预测性和充分性的优化结果,根据优化结果对构建的关系模型进行求解从而得到金融时序预测结果。
可选地,推断建模模块310,进一步用于采用多尺度卷积编码实现根据历史观测金融数据推断隐式因子分布,并将根据不同时间尺度计算出的隐式因子划分至对应的时序分量;
根据推断出的隐式因子分布采样得到隐式因子,建模隐式因子之间的关系;
设计解码器,构建隐式因子对观测数据的有向关系,建模隐式因子与观测数据的因果关系;
利用序列模型构建隐式因子在时序分量中的时序关系,获得可预测因子分解模型。
可选地,推断建模模块310,进一步用于设
Figure BDA0003975619290000141
为K个采样率的集合,采样的时间序列为
Figure BDA0003975619290000142
其中s(X,r)表示采样率为r的X上的采样操作;编码器分别学习每个时间尺度上的隐式因子,在解码过程中将这些隐式因子进行组合。
可选地,设计解码器,包括:
利用线性变换f(i)对每个时间尺度分别重构
Figure BDA0003975619290000143
Figure BDA0003975619290000144
根据下述公式(1)利用注意机制对不同时间尺度的重构信号进行组合:
Figure BDA0003975619290000151
其中,αi为注意力系数,||·||F为矩阵的Frobenious范数。
可选地,推断建模模块310,进一步用于对于每个时序分量,引入一个GRU网络g(i)(i=1,2,…,K),其中GRU的输出为
Figure BDA0003975619290000152
为当前时刻对下一时刻的预测值。
可选地,优化学习模块320,进一步用于基于变分自编码器VAE,引入一个额外的观测变量E,对可预测因子分解模型进行可辨识性建模,在训练过程中调整超参数,提高KL散度的权重,解耦隐式因子;
基于隐式因子时序关系的GRU模型,将隐式因子直接输入至编码器,设置自回归损失使重构误差最小;
通过最小化VAE目标函数中的重构项,对于所有时刻的隐式因子都使用解码器ψd重构X,利用解码器模型中的注意力权重系数αi加权相加,得到最终的预测结果。
可选地,优化学习模块320,进一步用于根据下述公式(2)设置自回归损失使重构误差最小,包括:
Figure BDA0003975619290000153
其中,X为已观测时序数据,E为额外观测变量;H为时序分量。
本发明实施例中,针对金融时序信息规律性弱、且缺乏高维可观测数据的问题,将观测数据映射到语义层级进行处理,重新定义金融时序信号分解,使得深度学习方法更有效地适用于金融时序预测任务。具体地,本发明方法通过根据历史信息推断影响金融时序数据的规律性强、可预测隐式因子,对这些因素进行稀疏关系建模,以实现长期有效且容易重构的预测。这种简单有效的深度学习模型可在金融时序预测领域(如股票收益率预测、金融长时预测任务)取得良好的应用,提高金融时序预测的可解释性,为基于语义层级的大规模金融时序分析提供了理论和应用基础,具有较大的经济效益。
图6是本发明实施例提供的一种电子设备400的结构示意图,该电子设备400可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器(centralprocessing units,CPU)401和一个或一个以上的存储器402,其中,所述存储器402中存储有至少一条指令,所述至少一条指令由所述处理器401加载并执行以实现下述基于可预测因子分解的金融时序预测方法的步骤:
S1:根据可观测金融时序数据推断多个时刻的隐式因子,将多个隐式因子组合成多个相互独立的可预测时序分量,对时序分量中隐式因子之间的关系分别进行建模,获得多个可预测因子分解模型;
S2:对多个可预测因子分解模型进行优化学习,获得可辨识性、可预测性和充分性的优化结果,根据优化结果对构建的关系模型进行求解从而得到金融时序预测结果。
在示例性实施例中,还提供了一种计算机可读存储介质,例如包括指令的存储器,上述指令可由终端中的处理器执行以完成上述基于可预测因子分解的金融时序预测方法。例如,所述计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种基于可预测因子分解的金融时序预测方法,其特征在于,包括以下步骤:
S1:根据可观测金融时序数据推断多个时刻的隐式因子,将多个所述隐式因子组合成多个相互独立的可预测时序分量,对时序分量中隐式因子之间的关系分别进行建模,获得多个可预测因子分解模型;
S2:对多个所述可预测因子分解模型进行优化学习,获得可辨识性、可预测性和充分性的优化结果,根据所述优化结果对构建的关系模型进行求解从而得到金融时序预测结果。
2.根据权利要求1所述的方法,其特征在于,所述S1中,根据可观测金融时序数据推断多个时刻的隐式因子,将多个所述隐式因子组合成多个相互独立的可预测时序分量,对时序分量中隐式因子之间的关系分别进行建模,获得可预测因子分解模型,包括:
S11:采用多尺度卷积编码实现根据历史观测金融数据推断隐式因子分布,并将根据不同时间尺度计算出的隐式因子划分至对应的时序分量;
S12:根据推断出的隐式因子分布采样得到隐式因子,建模隐式因子之间的关系;
S13:设计解码器,构建隐式因子对观测数据的有向关系,建模隐式因子与观测数据的因果关系;
S14:利用序列模型构建隐式因子在时序分量中的时序关系,获得可预测因子分解模型。
3.根据权利要求2所述的方法,其特征在于,所述S11中,采用多尺度卷积编码实现根据历史观测金融数据推断隐式因子分布,并将根据不同时间尺度计算出的隐式因子划分至对应的时序分量,包括:
Figure FDA0003975619280000011
为K个采样率的集合,采样的时间序列为
Figure FDA0003975619280000012
其中s(X,r)表示采样率为r的X上的采样操作;编码器分别学习每个时间尺度上的隐式因子,在解码过程中将这些隐式因子进行组合。
4.根据权利要求2所述的方法,其特征在于,所述S13中,设计解码器,包括:
利用线性变换f(i)对每个时间尺度分别重构
Figure FDA0003975619280000021
Figure FDA0003975619280000022
根据下述公式(1)利用注意机制对不同时间尺度的重构信号进行组合:
Figure FDA0003975619280000023
其中,αi为注意力系数,||·||F为矩阵的Frobenious范数。
5.根据权利要求2所述的方法,其特征在于,所述步骤S14中,利用序列模型构建隐式因子在时序分量中的时序关系,获得可预测因子分解模型,包括:
对于每个时序分量,引入一个GRU网络g(i)(i=1,2,…,K),其中GRU的输出为
Figure FDA0003975619280000024
为当前时刻对下一时刻的预测值。
6.根据权利要求2所述的方法,其特征在于,所述步骤S2中,对多个所述可预测因子分解模型进行优化学习,获得可辨识性、可预测性和充分性的优化结果,根据所述优化结果对构建的关系模型进行求解从而得到金融时序预测结果,包括:
S21:基于变分自编码器VAE,引入一个额外的观测变量E,对可预测因子分解模型进行可辨识性建模,在训练过程中调整超参数,提高KL散度的权重,解耦隐式因子;
S22:基于隐式因子时序关系的GRU模型,将隐式因子直接输入至编码器,设置自回归损失使重构误差最小;
S23:通过最小化VAE目标函数中的重构项,对于所有时刻的隐式因子都使用解码器ψd重构X,利用解码器模型中的注意力权重系数αi加权相加,得到最终的预测结果。
7.根据权利要求6所述的方法,其特征在于,所述步骤S22中,根据下述公式(2)设置自回归损失使重构误差最小,包括:
Figure FDA0003975619280000025
其中,X为已观测时序数据,E为额外观测变量;H为时序分量。
8.一种基于可预测因子分解的金融时序预测装置,其特征在于,所述装置适用于上述权利要求1-7中任意一项的方法,装置包括:
推断建模模块,用于根据可观测金融时序数据推断多个时刻的隐式因子,将多个所述隐式因子组合成多个相互独立的可预测时序分量,对时序分量中隐式因子之间的关系分别进行建模,获得多个可预测因子分解模型;
优化学习模块,用于对多个所述可预测因子分解模型进行优化学习,获得可辨识性、可预测性和充分性的优化结果,根据所述优化结果对构建的关系模型进行求解从而得到金融时序预测结果。
9.根据权利要求8所述的装置,其特征在于,所述推断建模模块,进一步用于采用多尺度卷积编码实现根据历史观测金融数据推断隐式因子分布,并将根据不同时间尺度计算出的隐式因子划分至对应的时序分量;
根据推断出的隐式因子分布采样得到隐式因子,建模隐式因子之间的关系;
设计解码器,构建隐式因子对观测数据的有向关系,建模隐式因子与观测数据的因果关系;
利用序列模型构建隐式因子在时序分量中的时序关系,获得可预测因子分解模型。
10.根据权利要求9所述的装置,其特征在于,所述推断建模模块,进一步用于设
Figure FDA0003975619280000031
为K个采样率的集合,采样的时间序列为
Figure FDA0003975619280000032
其中s(X,r)表示采样率为r的X上的采样操作;编码器分别学习每个时间尺度上的隐式因子,在解码过程中将这些隐式因子进行组合。
CN202211530712.5A 2022-12-01 2022-12-01 一种基于可预测因子分解的金融时序预测方法及装置 Pending CN115796365A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211530712.5A CN115796365A (zh) 2022-12-01 2022-12-01 一种基于可预测因子分解的金融时序预测方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211530712.5A CN115796365A (zh) 2022-12-01 2022-12-01 一种基于可预测因子分解的金融时序预测方法及装置

Publications (1)

Publication Number Publication Date
CN115796365A true CN115796365A (zh) 2023-03-14

Family

ID=85444573

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211530712.5A Pending CN115796365A (zh) 2022-12-01 2022-12-01 一种基于可预测因子分解的金融时序预测方法及装置

Country Status (1)

Country Link
CN (1) CN115796365A (zh)

Similar Documents

Publication Publication Date Title
Sangiorgio et al. Robustness of LSTM neural networks for multi-step forecasting of chaotic time series
Chattopadhyay et al. Data-driven predictions of a multiscale Lorenz 96 chaotic system using machine-learning methods: Reservoir computing, artificial neural network, and long short-term memory network
Tian Modes decomposition forecasting approach for ultra-short-term wind speed
CN112884056A (zh) 基于优化的lstm神经网络的污水水质预测方法
CN111242377B (zh) 一种集成深度学习和数据去噪的短期风速预测方法
Qin et al. Simulating and Predicting of Hydrological Time Series Based on TensorFlow Deep Learning.
Yu et al. Error correction method based on data transformational GM (1, 1) and application on tax forecasting
CN112766078B (zh) 基于emd-svr-mlr与注意力机制的gru-nn的电力负荷层次预测方法
CN116702831A (zh) 一种考虑数据大量丢失的混合短期风电功率预测方法
CN110956309A (zh) 基于crf和lstm的流程活动预测方法
CN112434891A (zh) 基于wcnn-alstm的太阳辐照度时间序列的预测方法
He et al. A cooperative ensemble method for multistep wind speed probabilistic forecasting
CN116596150A (zh) 基于多分支自注意力的Transformer霍克斯过程模型的事件预测方法
CN117094451B (zh) 一种耗电量的预测方法、装置及终端
Surakhi et al. On the ensemble of recurrent neural network for air pollution forecasting: Issues and challenges
Damaševičius et al. Decomposition aided attention-based recurrent neural networks for multistep ahead time-series forecasting of renewable power generation
CN114065996A (zh) 基于变分自编码学习的交通流预测方法
Rivero et al. Time series forecasting using recurrent neural networks modified by bayesian inference in the learning process
CN115796365A (zh) 一种基于可预测因子分解的金融时序预测方法及装置
CN111626472B (zh) 一种基于深度混合云模型的场景趋势判断指标计算系统及方法
CN114580250A (zh) 基于量子粒子群算法的gru网络的能耗预测方法、装置
CN114239934A (zh) 一种基于生成式对抗网络的电网负荷序列预测方法及系统
CN111402042A (zh) 一种用于股市大盘形态分析的数据分析与显示方法
CN117094431A (zh) 一种多尺度熵门控的DWTformer气象数据时序预测方法及设备
Li et al. Time series prediction based on decomposition and synthesis

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination