CN115689758A - 一种股票预测模型构建方法、系统及其应用 - Google Patents
一种股票预测模型构建方法、系统及其应用 Download PDFInfo
- Publication number
- CN115689758A CN115689758A CN202211450603.2A CN202211450603A CN115689758A CN 115689758 A CN115689758 A CN 115689758A CN 202211450603 A CN202211450603 A CN 202211450603A CN 115689758 A CN115689758 A CN 115689758A
- Authority
- CN
- China
- Prior art keywords
- stock
- price
- time
- stocks
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种股票预测模型构建方法、系统及其应用,包括:S1.采集单个交易日内股票的最高价、开盘价、最低价、收盘价和成交量以及公司每季度的财务指标数据,并构建股票特征;S2.构建动态异质图,动态图的点包括股票、上市公司、行业和地域类型,边包括股票之间的价格相关关系、股票与上市公司的从属关系、股票与行业的从属关系、上市公司与行业的从属关系以及上市公司与地域的从属关系;S3.设计股票时间序列编码器、上市公司编码器和行业及地域编码器并获取股票时间序列特征、上市公式特征、行业特征和地域特征;S4.构建动态异质图注意力网络模型并进行训练;本发明将股票间关系的多样性与动态性纳入股票关系建模,从而提升模型的预测性能。
Description
技术领域
本发明涉及金融数据挖掘技术领域,更具体的说是涉及一种股票预测模型构建方法、系统及其应用。
背景技术
目前,现有的股票预测模型主要包括三类方法:
金融时间序列建模,通过时间序列分析对股票的收益率或波动进行建模和预测,例如ARIMA模型、卡尔曼滤波和GRACH模型;
深度序列建模,深度序列模型能够捕捉序列中的非线性关系,通过端到端的训练自动提取特征;
图神经网络建模,将股票、公司之间的关系进行构图,从而进行将关系信息纳入图的建模。
但是,金融时间序列建模依赖于人对市场的观察与简单的假设,并不能反映实际的市场环境;深度序列建模遵循股票时间序列独立同分布的假设,然而实际金融市场并不满足这一假设,并且会丢失股票关系信息;然而目前图神经网络建模对股票间关系的挖掘和建模过于简单,未将多样和动态关系纳入考量。
因此,如何提供一种股票预测模型构建方法、系统及其应用是本领域技术人员亟需解决的问题。
发明内容
有鉴于此,本发明提供了一种股票预测模型构建方法、系统及其应用,在金融时间序列的基础上,构建股票关系的动态异质图,将股票间关系的多样性与动态性纳入股票关系建模,从而提升模型的预测性能。
为了实现上述目的,本发明采用如下技术方案:
一种股票预测模型构建方法,包括:
S1.采集原始数据,原始数据包括单个交易日内股票的最高价、开盘价、最低价、收盘价和成交量以及公司每季度公开的财务指标数据,并构建股票特征;
S2.构建动态异质图,动态图的节点包括股票、上市公司、行业和地域类型,还包括各节点特征和时间属性,动态图的边包括股票之间的价格相关关系、股票与上市公司的从属关系、股票与行业的从属关系、上市公司与行业的从属关系以及上市公司与地域的从属关系,还包括各边的时间属性;
S3.根据动态异质图设计股票时间序列编码器、上市公司编码器和行业及地域编码器并获取股票时间序列特征、上市公式特征、行业特征和地域特征;
S4.基于动态异质图和获取的股票时间序列特征、上市公式特征、行业特征和地域特征,引入注意力机制构建动态异质图注意力网络模型并进行模型训练。
优选的,S1中股票特征包括单个交易日内开盘价、最低价和最高价与收盘价的价格比率特征以及不同交易日的移动平均收益特征;
价格比率特征为:
μ∈{open,high,low}
其中,第j天的开盘价、收盘价、最高价和最低价分别为openj,closej,highj,lowj;
移动平均收益特征为:
φ∈{5,10,15,20,25,30}
其中,adjclose为调整后的收盘价。
优选的,S1还包括对股票的特征值进行z-score标准化处理,并对缺失值用0进行填充。
优选的,S2中股票之间的价格关系构建方式为:在每个交易日,对每只股票计算与其他所有股票在过去半年内股价间相关性,并从中挑出相关性最大的N只股票与其建边,计算相关性的方法为:
其中,Pi和Pj分别为股票i和股票j过去半年的股价。
优选的,S3的具体内容为:
(1)股票时间序列编码器:
对输入特征向量进行非线性映射,得到新的特征向量为:
基于深度序列模型中的双向LSTM模型对新的特征序列进行编码,得到每个时间步的股票Sq的隐藏层表征:
通过注意力机制求和:
其中,v,W2,b2是可学习的参数;
与LSTM的最终隐层表征拼接得到股票的时间序列表征:
(2)上市公司编码器:
通过双层MLP和残差连接的结构用于表征提取,得到上市公司Ci的表征为:
(3)行业及地域编码器:
对于行业以及地域类型的节点,分别设置可训练的embedding层,行业Ij和地域Ak的表征分别为:
优选的,S4中构建动态异质图注意力网络的具体内容包括:
(1)相对时序编码
对于给定的节点v,其对应的输入时间为t(v),经过时序编码后为:
(2)动态异质图注意力层
图神经网络的消息传递范式为:
其中Z1和Z2为归一化因子:
σ为非线性激活函数,定义引入关系时长敏感的注意力项:
其中,w(l)和b(l)为可学习的参数,w(l)>0,注意力项随时长增加单调递增,单个图注意力层采用个注意力头,则:
最后,添加残差链接,作为该层的最终输出:
其中,α和WA均为可学习的参数,α为更新比例,0<α<1;
其中,σ为sigmoid函数,将股票评分限制在[0,1]范围内,Wf和bf为可学习的参数。
优选的,模型训练的损失为:
优选的,模型的参数矩阵通过梯度下降方式进行更新,具体更新形式为:
一种股票预测系统,包括数据采集模块和股票预测模型;
数据采集模块,用于采集单个交易日内股票的最高价、开盘价、最低价、收盘价和成交量以及公司每季度公开的财务指标数据并输入股票预测模型;
股票预测模型,用于输出股票评分。
一种股票预测系统的应用,包括采集单个交易日内股票的最高价、开盘价、最低价、收盘价和成交量以及公司每季度公开的财务指标数据并输入股票预测模型,输出股票评分。
经由上述的技术方案可知,与现有技术相比,本发明公开提供了一种股票预测模型构建方法、系统及其应用,通过构建动态异质图的方式,刻画了股票间关系的多样性和动态性,并在动态异质图的基础上,引入了节点的相对时序编码和关于边建立时间长短的高斯先验的自注意力机制,设计了基于动态图神经网络的股票预测模型,相比于现有的方法,能够对股票间多样性和动态性的关系进行更精准的建模。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1附图为本发明提供的股票预测模型构建方法示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例公开了一种股票预测模型构建方法,包括:
S1.采集原始数据,原始数据包括单个交易日内股票的最高价、开盘价、最低价、收盘价和成交量以及公司每季度公开的财务指标数据,并构建股票特征;
S2.构建动态异质图,动态图的节点包括股票、上市公司、行业和地域类型,还包括各节点特征和时间属性,动态图的边包括股票之间的价格相关关系、股票与上市公司的从属关系、股票与行业的从属关系、上市公司与行业的从属关系以及上市公司与地域的从属关系,还包括各边的时间属性;
S3.根据动态异质图设计股票时间序列编码器、上市公司编码器和行业及地域编码器并获取股票时间序列特征、上市公式特征、行业特征和地域特征;
S4.基于动态异质图和获取的股票时间序列特征、上市公式特征、行业特征和地域特征,引入注意力机制构建动态异质图注意力网络模型并进行模型训练。
为了进一步实施上述技术方案,S1中股票特征包括单个交易日内开盘价、最低价和最高价与收盘价的价格比率特征以及不同交易日的移动平均收益特征;
价格比率特征为:
μ∈{open,high,low}
其中,第j天的开盘价、收盘价、最高价和最低价分别为openi,closej,highi,lowj;
移动平均收益特征为:
φ∈{5,10,15,20,25,30}
其中,adjclose为调整后的收盘价。
为了进一步实施上述技术方案,S1还包括对股票的特征值进行z-score标准化处理,并对缺失值用0进行填充。
在本实施例中,节点间关系具有多样性和动态性,多样性包括节点的多种关系,动态性体现在节点和边本身带有时间属性。
对于时间属性,在每个交易日,对股票节点,记录其上市时间;对上市公司,记录其建立时间;对行业节点,设定时间为数据集的起始时间;对地域节点,设定时间同样为数据集的起始时间;由于节点间关系的变化相对稀疏,发生变动的平均时间跨度较长,因此在描述边的变化时,会记录每条边上一次建立和消失的时间。
为了进一步实施上述技术方案,S2中股票之间的价格关系构建方式为:在每个交易日,对每只股票计算与其他所有股票在过去半年内股价间相关性,并从中挑出相关性最大的N只股票与其建边,计算相关性的方法为:
其中,Pi和Pj分别为股票i和股票j过去半年的股价。
在本实施例中,对于S2:
股价相关性:基于过去一段时间的股票价格的相关性,对于每只股票,计算与其它股票的价格相关系数,挑选出最大的N只股票进行连边;
股票与上市公司:对每只股票找到其对应的上市公司,二者间构成从属关系,为双向边;
股票与行业:对每只股票找到其所属的行业类型,构成从属关系,为双向边;
上市公司与行业:对每个上市公司找到其对应的经营行业,构成从属关系,为双向边;
上市公司与地域:对每个上市公司找到其注册地,构成从属关系,为双向边。
为了进一步实施上述技术方案,S3的具体内容为:
(1)股票时间序列编码器:
对输入特征向量进行非线性映射,得到新的特征向量为:
基于深度序列模型中的双向LSTM模型对新的特征序列进行编码,得到每个时间步的股票Sq的隐藏层表征:
通过注意力机制求和:
其中,v,W2,b2是可学习的参数;
与LSTM的最终隐层表征拼接得到股票的时间序列表征:
(2)上市公司编码器:
通过双层MLP和残差连接的结构用于表征提取,得到上市公司Ci的表征为:
(3)行业及地域编码器:
对于行业以及地域类型的节点,分别设置可训练的embedding层,行业Ij和地域Ak的表征分别为:
为了进一步实施上述技术方案,S4中构建动态异质图注意力网络的具体内容包括:
(1)相对时序编码
对于给定的节点v,其对应的输入时间为t(v),经过时序编码后为:
(2)动态异质图注意力层
图神经网络的消息传递范式为:
其中Z1和Z2为归一化因子:
σ为非线性激活函数,定义引入关系时长敏感的注意力项:
其中,w(l)和b(l)为可学习的参数,w(l)>0,注意力项随时长增加单调递增,单个图注意力层采用个注意力头,则:
最后,添加残差链接,作为该层的最终输出:
其中,α和WA均为可学习的参数,α为更新比例,0<α<1;
其中,σ为sigmoid函数,将股票评分限制在[0,1]范围内,Wf和bf为可学习的参数。
为了进一步实施上述技术方案,模型训练的损失为:
为了进一步实施上述技术方案,模型的参数矩阵通过梯度下降方式进行更新,具体更新形式为:
一种股票预测系统,包括数据采集模块和股票预测模型;
数据采集模块,用于采集单个交易日内股票的最高价、开盘价、最低价、收盘价和成交量以及公司每季度公开的财务指标数据并输入股票预测模型;
股票预测模型,用于输出股票评分。
一种股票预测系统的应用,包括采集单个交易日内股票的最高价、开盘价、最低价、收盘价和成交量以及公司每季度公开的财务指标数据并输入股票预测模型,输出股票评分。
在本实施例中,在沪深股票数据集上进行了股票收益预测实验,相比于基准模型,IC相对提升了6.4%,RankIC相对提升了5.6%。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
Claims (10)
1.一种股票预测模型构建方法,其特征在于,包括:
S1.采集原始数据,原始数据包括单个交易日内股票的最高价、开盘价、最低价、收盘价和成交量以及公司每季度公开的财务指标数据,并构建股票特征;
S2.构建动态异质图,动态图的节点包括股票、上市公司、行业和地域类型,还包括各节点特征和时间属性,动态图的边包括股票之间的价格相关关系、股票与上市公司的从属关系、股票与行业的从属关系、上市公司与行业的从属关系以及上市公司与地域的从属关系,还包括各边的时间属性;
S3.根据动态异质图设计股票时间序列编码器、上市公司编码器和行业及地域编码器并获取股票时间序列特征、上市公式特征、行业特征和地域特征;
S4.基于动态异质图和获取的股票时间序列特征、上市公式特征、行业特征和地域特征,引入注意力机制构建动态异质图注意力网络模型并进行模型训练。
3.根据权利要求1所述的一种股票预测模型构建方法,其特征在于,S1还包括对股票的特征值进行z-score标准化处理,并对缺失值用0进行填充。
5.根据权利要求1所述的一种股票预测模型构建方法,其特征在于,S3的具体内容为:
(1)股票时间序列编码器:
对输入特征向量进行非线性映射,得到新的特征向量为:
基于深度序列模型中的双向LSTM模型对新的特征序列进行编码,得到每个时间步的股票Sq的隐藏层表征:
通过注意力机制求和:
其中,v,W2,b2是可学习的参数;
与LSTM的最终隐层表征拼接得到股票的时间序列表征:
(2)上市公司编码器:
通过双层MLP和残差连接的结构用于表征提取,得到上市公司Ci的表征为:
(3)行业及地域编码器:
对于行业以及地域类型的节点,分别设置可训练的embedding层,行业Ij和地域Ak的表征分别为:
6.根据权利要求1所述的一种股票预测模型构建方法,其特征在于,S4中构建动态异质图注意力网络的具体内容包括:
(1)相对时序编码
对于给定的节点v,其对应的输入时间为t(v),经过时序编码后为:
(2)动态异质图注意力层
图神经网络的消息传递范式为:
其中Z1和Z2为归一化因子:
σ为非线性激活函数,定义引入关系时长敏感的注意力项:
其中,w(l)和b(l)为可学习的参数,w(l)>0,注意力项随时长增加单调递增,单个图注意力层采用个注意力头,则:
最后,添加残差链接,作为该层的最终输出:
其中,α和WA均为可学习的参数,α为更新比例,0<α<1;
其中,σ为sigmoid函数,将股票评分限制在[0,1]范围内,Wf和bf为可学习的参数。
9.一种股票预测系统,基于权利要求1-8任意一项所述的一种股票预测模型构建方法,其特征在于,包括数据采集模块和股票预测模型;
数据采集模块,用于采集单个交易日内股票的最高价、开盘价、最低价、收盘价和成交量以及公司每季度公开的财务指标数据并输入股票预测模型;
股票预测模型,用于输出股票评分。
10.一种股票预测系统的应用,基于权利要求9所述的一种股票预测系统,其特征在于,包括采集单个交易日内股票的最高价、开盘价、最低价、收盘价和成交量以及公司每季度公开的财务指标数据并输入股票预测模型,输出股票评分。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211450603.2A CN115689758A (zh) | 2022-11-18 | 2022-11-18 | 一种股票预测模型构建方法、系统及其应用 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211450603.2A CN115689758A (zh) | 2022-11-18 | 2022-11-18 | 一种股票预测模型构建方法、系统及其应用 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115689758A true CN115689758A (zh) | 2023-02-03 |
Family
ID=85054042
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211450603.2A Pending CN115689758A (zh) | 2022-11-18 | 2022-11-18 | 一种股票预测模型构建方法、系统及其应用 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115689758A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116188173A (zh) * | 2023-05-04 | 2023-05-30 | 北京澜舟科技有限公司 | 证券市场波动预警方法、系统以及存储介质 |
-
2022
- 2022-11-18 CN CN202211450603.2A patent/CN115689758A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116188173A (zh) * | 2023-05-04 | 2023-05-30 | 北京澜舟科技有限公司 | 证券市场波动预警方法、系统以及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Vajirakachorn et al. | Application of business intelligence in the tourism industry: A case study of a local food festival in Thailand | |
Ford et al. | Smart grid energy fraud detection using artificial neural networks | |
EP1504412B1 (en) | Processing mixed numeric and/or non-numeric data | |
Guan et al. | Analyzing massive data sets: an adaptive fuzzy neural approach for prediction, with a real estate illustration | |
El Morr et al. | Descriptive, predictive, and prescriptive analytics | |
CN105427138A (zh) | 基于神经网络模型的产品市场占有率分析方法及系统 | |
CN112819308B (zh) | 一种基于双向图卷积神经网络的头部企业识别方法 | |
Lee et al. | Decision field theory extensions for behavior modeling in dynamic environment using Bayesian belief network | |
Tsang et al. | Gaussian processes for daily demand prediction in tourism planning | |
Yang | Computational verb decision trees | |
Dat et al. | Hybrid online model based multi seasonal decompose for short-term electricity load forecasting using ARIMA and online RNN | |
Sandeep Kumar et al. | Location identification for real estate investment using data analytics | |
CN115013859B (zh) | 一种基于用户画像的供热二级网分户调控方法 | |
CN115689758A (zh) | 一种股票预测模型构建方法、系统及其应用 | |
CN113657990A (zh) | 一种蚁狮算法优化narx神经网络风险预测系统及方法 | |
CN114168819B (zh) | 一种基于图神经网络的岗位匹配方法及装置 | |
Hagenauer et al. | Contextual neural gas for spatial clustering and analysis | |
Lin et al. | Integrated business prestige and artificial intelligence for corporate decision making in dynamic environments | |
CN116703682B (zh) | 一种基于深度学习的政务数据平台 | |
Liu et al. | Multi-model coupling water demand prediction optimization method for megacities based on time series decomposition | |
Zhang | Remote sensing data processing of urban land using based on artificial neural network | |
Gorricha et al. | A framework for exploratory analysis of extreme weather events using geostatistical procedures and 3D self-organizing maps | |
Abdelaziz et al. | An Epsilon constraint method for selecting Indicators for use in Neural Networks for stock market forecasting | |
CN113849580A (zh) | 一种主体评级预测方法、装置、电子设备及存储介质 | |
Johnson et al. | GT-CHES: Graph transformation for classification in human evolutionary systems |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |