CN111860998A - 股票交易数据的预测方法、装置、电子设备及介质 - Google Patents
股票交易数据的预测方法、装置、电子设备及介质 Download PDFInfo
- Publication number
- CN111860998A CN111860998A CN202010692574.5A CN202010692574A CN111860998A CN 111860998 A CN111860998 A CN 111860998A CN 202010692574 A CN202010692574 A CN 202010692574A CN 111860998 A CN111860998 A CN 111860998A
- Authority
- CN
- China
- Prior art keywords
- data
- stock
- time
- network search
- stock transaction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 59
- 238000012549 training Methods 0.000 claims abstract description 15
- 230000011218 segmentation Effects 0.000 claims abstract description 13
- 238000007781 pre-processing Methods 0.000 claims abstract description 12
- 230000002776 aggregation Effects 0.000 claims abstract description 11
- 238000004220 aggregation Methods 0.000 claims abstract description 11
- 238000012545 processing Methods 0.000 claims description 33
- 238000004590 computer program Methods 0.000 claims description 9
- 230000006870 function Effects 0.000 claims description 9
- 238000010606 normalization Methods 0.000 claims description 6
- 238000006243 chemical reaction Methods 0.000 claims description 5
- 238000004140 cleaning Methods 0.000 claims description 4
- 238000011161 development Methods 0.000 claims description 4
- 230000018109 developmental process Effects 0.000 claims description 4
- 230000002441 reversible effect Effects 0.000 claims description 2
- 238000004364 calculation method Methods 0.000 description 7
- 230000008859 change Effects 0.000 description 6
- 238000003860 storage Methods 0.000 description 6
- 239000000126 substance Substances 0.000 description 6
- 230000000875 corresponding effect Effects 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 230000008901 benefit Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 239000011159 matrix material Substances 0.000 description 4
- 238000009826 distribution Methods 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000002596 correlated effect Effects 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 241000282414 Homo sapiens Species 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000000802 evaporation-induced self-assembly Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000000116 mitigating effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2462—Approximate or statistical queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2465—Query processing support for facilitating data mining operations in structured databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2477—Temporal data queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/04—Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Probability & Statistics with Applications (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- Fuzzy Systems (AREA)
- General Business, Economics & Management (AREA)
- Finance (AREA)
- Human Resources & Organizations (AREA)
- Accounting & Taxation (AREA)
- Marketing (AREA)
- Development Economics (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- Operations Research (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Technology Law (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请提供一种股票交易数据的预测方法及装置、一种电子设备以及一种计算机可读介质。方法包括:获取历史时间段内的网络搜索指数和股票交易数据;对数据进行预处理,得到预处理后的样本数据;通过设置滞后变量对预处理后的样本数据进行数据分段,再根据时间间隔将分段后的样本数据进行数据聚合得到多元时序数据,将多元时序数据转化为有监督数据;根据有监督数据,训练股票交易预测模型;将实时数据输入训练好的股票交易预测模型,得到实时预测的股票交易数据。通过统计历史股票交易数据和网络搜索指数在不同时间段内的因素,并设计融合这两种不同数据的时序模型,使得在预测短期内的股票交易数据比传统的方法更加精确。
Description
技术领域
本申请涉及计算机技术领域,具体涉及一种股票交易数据的预测方法及装置、一种电子设备以及一种计算机可读介质。
背景技术
股市是资本资源优化配置的一个重要场所,掌握其变化规律不仅是投资者梦寐以求的事,也对宏观国民经济的研究和管理有着重要的现实意义。由于影响股价的因素包括企业内部因素、经济因素、制度因素、人们的心理因素等等,各种因素的影响程度和方式各不相同,股价的准确预测难度很大。
利用历史数据预测股票市场的未来趋势是学术界和企业界的迫切需求。近年来,从一方面来说,电子交易系统的广泛应用使得股票市场的用户群体逐渐广泛,加剧了市场的壮大;从另一方面来说,人类自身对高收益的需求不断增加,使得选择更优的模型进行预测的需求愈加迫切,正确预测股票成交金额的不稳定趋势能够间接映射到股票价格,减少投资者的投资风险,有极高的应用价值。
影响股票成交金额不稳定波动的主要因素在于社会环境对目标企业的信任度,影响这种品牌信任度的因素有多方面,如社会制度、经济制度、国内外社会环境变化和企业自身发展等等。目前绝大多数的交易数据预测模型没有很好的考虑到如何准确的利用弱相关的社会因素的侧面量化数据进行辅助建模,缓解原始交易数据存在的随机扰动对交易数据预测模型拟合过程的直接影响。
发明内容
本申请的目的是提供一种股票交易数据的预测方法及装置、一种电子设备以及一种计算机可读介质。
本申请第一方面提供一种股票交易数据的预测方法,包括:
S1、获取历史时间段内的网络搜索指数和股票交易数据;所述网络搜索指数是指与股票交易相关的网络搜索数据;
S2、对所述网络搜索指数和股票交易数据进行预处理,得到预处理后的样本数据;
S3、通过设置滞后变量对所述预处理后的样本数据进行数据分段,再根据时间间隔将分段后的样本数据进行数据聚合得到多元时序数据,将所述多元时序数据转化为有监督数据;
S4、根据所述有监督数据,训练股票交易预测模型;
S5、将实时采集的网络搜索指数和股票交易数据输入训练好的所述股票交易预测模型,得到实时预测的股票交易数据。
本申请第二方面提供一种股票交易数据的预测装置,包括:
获取模块,用于获取一历史时间段内的网络搜索指数和股票交易数据;所述网络搜索指数是指与股票交易相关的网络搜索数据;
预处理模块,用于对所述网络搜索指数和股票交易数据进行预处理,得到预处理后的样本数据;
分段转化模块,用于通过设置滞后变量对所述预处理后的样本数据进行数据分段,再根据时间间隔将分段后的样本数据进行数据聚合得到多元时序数据,将所述多元时序数据转化为有监督数据;
模型训练模块,用于根据所述有监督数据,训练股票交易预测模型;
预测模块,用于将实时采集的网络搜索指数和股票交易数据输入训练好的所述股票交易预测模型,得到实时预测的股票交易数据。
本申请第三方面提供一种电子设备,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器运行所述计算机程序时执行以实现本申请第一方面所述的方法。
本申请第四方面提供一种计算机可读介质,其上存储有计算机可读指令,所述计算机可读指令可被处理器执行以实现本申请第一方面所述的方法。
相较于现有技术,本申请提供的股票交易数据的预测方法、装置、电子设备及介质,获取历史时间段内的网络搜索指数和股票交易数据;所述网络搜索指数是指与股票交易相关的网络搜索数据;对所述网络搜索指数和股票交易数据进行预处理,得到预处理后的样本数据;通过设置滞后变量对所述预处理后的样本数据进行数据分段,再根据时间间隔将分段后的样本数据进行数据聚合得到多元时序数据,将所述多元时序数据转化为有监督数据;根据所述有监督数据,训练股票交易预测模型;将实时采集的网络搜索指数和股票交易数据输入训练好的所述股票交易预测模型,得到实时预测的股票交易数据。由于是通过统计历史股票交易数据和网络搜索指数在不同时间段内的因素,并设计融合这两种不同数据的时序模型,训练预测模型生成股票交易数据的波动情况,在一定程度上缓解股票交易数据在各个时间间隔内的不确定性问题,从而提高预测的准确性。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本申请的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了本申请的一些实施方式所提供的一种股票交易数据的预测方法的流程图;
图2示出了本申请的一些实施方式所提供的一种具体的股票交易数据的预测方法的流程图;
图3示出了本申请的一些实施方式所提供的一种股票交易数据的预测装置的示意图;
图4示出了本申请的一些实施方式所提供的一种电子设备的示意图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施方式。虽然附图中显示了本公开的示例性实施方式,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施方式所限制。相反,提供这些实施方式是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
需要注意的是,除非另有说明,本申请使用的技术术语或者科学术语应当为本申请所属领域技术人员所理解的通常意义。
另外,术语“第一”和“第二”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。
目前绝大多数的股票交易预测模型没有很好的考虑到如何准确的利用弱相关的社会因素的侧面量化数据进行辅助建模,缓解原始交易数据序列存在的随机扰动对股票交易预测模型拟合过程的直接影响。搜索引擎作为互联网的重要入口,和生活密切相关,通过给定词汇的搜索指数可以为社会因素的侧面或截面描述提供依据。因此,存在融合网络搜索指数来提供更精准股票交易数据预测的可能。
因此,本申请实施例提供一种股票交易数据的预测方法及装置、一种电子设备以及计算机可读介质,下面结合附图进行说明。
请参考图1,其示出了本申请的一些实施方式所提供的一种股票交易数据的预测方法的流程图,如图所示,所述股票交易数据的预测方法,可以包括以下步骤:
步骤S101:获取历史时间段内的网络搜索指数和股票交易数据;所述网络搜索指数是指与股票交易相关的网络搜索数据;
步骤S102:对所述网络搜索指数和股票交易数据进行预处理,得到预处理后的样本数据;
步骤S103:通过设置滞后变量对所述预处理后的样本数据进行数据分段,再根据时间间隔将分段后的样本数据进行数据聚合得到多元时序数据,将所述多元时序数据转化为有监督数据;
步骤S104:根据所述有监督数据,训练股票交易预测模型;
步骤S105:将实时采集的网络搜索指数和股票交易数据输入训练好的所述股票交易预测模型,得到实时预测的股票交易数据。
具体的,步骤S101中,网络搜索指数可以是百度指数等,百度指数作为一款基于百度网民搜索行为的数据分析工具,一方面可以对关键词搜索趋势进行分析,另一方面可以深度挖掘舆情信息、市场需求、用户画像等多方面的数据特征。股票交易数据可以是股票交易金额等数据。
具体的,在历史时间段内,根据股票交易的时间区间统计各个地区、平台的网络搜索指数和股票交易数据,所述网络搜索指数和股票交易数据均统计为时序数据;所述地区包括全国及全国各省市级子区域,所述平台包括移动端、 PC端和汇总平台。搜索指数的查询例如全国地区、移动端平台“平安银行”关键词的搜索人数。设置时间间隔的个数为K个,则能够用[y1,y2,…,yK]表示收集到的股票交易数据时序数据,用[x1,x2,…,xK]表示收集到的网络搜索指数时序数据,其中任意xt={xt,1,xt,2,...,xt,i,...xt,n},其中xt,i表示t时刻网络搜索指数时序数据内的第i个搜索指数指标数据。时间间隔是能够依据实际情况调整的变量,其可设置为秒、天、周等具体时间区间。
针对股票交易数据和网络搜索指数数据进行初步数据清洗,过滤零值、去除无效的样本。对清洗后的数据进行归一化处理,将股票交易数据及各百度搜索指数因素数值压缩至确定的区间,得到归一化后的样本数据。
具体的,对收集到的原始数据进行数据清洗,检查所收集数据一致性,同时处理由于股票休市的无效记录。通过最值处理、数据均值化等基本数据处理操作完善归一化的输入向量。由于不同类型与不同时间段的数据值大小存在显著差异,因此本实施例对各个具体因素的序列数据进行Min-Max归一化处理。通过对原始数据进行线性变换,将样本数值量级归一化至[0,1]区间内,同时保持网络搜索指数与股票交易数据之间的相对数值大小差异。归一化的计算公式如下:
步骤S103中:
Ⅰ)为了从目标序列中挖掘中短期的时序模式,本实施例将归一化后的时间序列数据进行进一步的分段。为了确保网络搜索指数因素与股票交易数据因素在时间维度的关联性得以体现,本实施例设置滞后变量T为影响下个时间间隔的股票交易数据发展的回溯时间长度。该时序转化为有监督数据可表示为:
给定第i个搜索指数的时序数据[x1,i,x2,i,…,xK,i],设置滞后变量T为影响下个时间间隔的股票交易数据发展的回溯时间长度。该时序转化为有监督数据可表示为:
其中,i∈{1,…,n}。
Ⅱ)根据时间间隔将分段后的样本数据进行数据聚合,得到多元时序数据,
即得到时间聚合输入矩阵,表示为:
步骤S104中,根据上述有监督数据训练股票交易预测模型,请参考图2,其示出了本申请的一些实施方式所提供的一种具体的股票交易数据的预测方法的流程图:
Ⅰ)该股票交易预测模型包括:输入层、股票序列处理单元、搜索序列处理单元、合并层、全连接层和输出层;其中,输入层用于输入多元时序数据,包括过去K个时间间隔的股票交易数据和网络搜索指数时序数据,股票序列处理单元用于处理股票交易数据的时序数据,搜索序列处理单元用于处理网络搜索指数的时序数据,然后使用合并层和全连接层将股票序列处理单元和搜索序列处理单元输出的数据相互关联生成初始预测结果,输出层将初始预测结果反归一化生成最终输出的预测结果。
Ⅱ)股票序列处理单元的表示部件包括第一线程层,搜索序列处理单元的表示部件包括:softmax层和第二线程层。
股票成交金额序列处理单元表示部件主要在于线程层。线程层能够更好地通过少量样本拟合时间序列数据的短期趋势,因此在表示层部分通过线性层结构对输入序列进行参数训练,对输入序列进行线性变化,输出序列线性加权后的特征表示。其计算公式可以表示如下:
ey=wy[y1,y2,…,yT]+by,
Ⅲ)搜索序列处理单元表示部件包含:softmax层和线程层。从数据角度分析,网络搜索指数数据与股票交易数据的关联程度随时间动态变化,弱相关的特征因素对预测精度的提升价值不大,且弱相关的随机扰动会影响模型收敛和拟合效果。
因此,本实施例为了确保模型提取出所有搜索指数特征的潜在信息细节且尽可能降低外部序列扰动对目标序列的拟合风险,引入了softmax来降低弱相关数据对预测模型的影响,增强强相关数据特征对预测模型的贡献,进行搜索指数特征多元序列的初步线性变化,其计算公式可以被描述为:
p=softmax(e),
at=p*[x1;x2;…;xT]。
通过加权分布修正输入的网络搜索指数矩阵,可以更好地建立网络搜索指数与股票交易数据序列间的数据关联。线程层处softmax层输出的表示数据,并进一步线性变化,得出网络搜索指数的最终输出表示。利用线性加权是突出特殊周期事件、增强输入信息提取的一种重要手段。输入特征的线性加权计算公式可以表示如下:
eq=∑wq*at+bq,
Ⅳ)在合并层中两个处理单元(股票序列处理单元和搜索序列处理单元)的输出表示数据合并,最后部分通过一个全连接层将网络搜索指数数据和股票交易数据结合起来,从而使预测模型双端(两个处理单元)的输出表示相互关联,并将输出结果作为预测数据,计算公式可表示为:
针对生成的预测序列进行反归一化操作,其计算公式如下:
d=d′*(max(d)-min(d))+min(d),
反归一化公式在方法中被应用对预测模型产生的最终预测结果进行修正。
Ⅴ)设计的股票交易预测模,采用均方误差Mean squared error(MSE)作为预测模型的损失函数,即目标函数。通过迭代训练使得目标函数的损失达到最小,建立最优的预测模型。模型各层与层之间的激活函数使用线性整流函数 (ReLU)。
步骤S105中,融合网络搜索指数等外部数据与股票交易数据,进行数据的预处理,输入到股票交易预测模型,预测下一个时间间隔的股票交易数据的变化情况。其计算公式可以表示为
聚合网络搜索指数数据和股票交易数据的时序数据聚合并进行预处理,将预处理后的数据输入融合目标数据与外部数据的双端分隔处理的时序神经网络中,使得在预测短期内的股票交易数据比传统的方法更加精确。
如图2所示,最后将预测结果展示给股票相关人员。
上述股票交易数据的预测方法可用于客户端,本申请实施例中,所述客户端可以包括硬件,也可以包括软件。当客户端包括硬件时,其可以是具有显示屏并且支持信息交互的各种电子设备,例如,可以包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。当客户端包括软件时,可以安装在上述电子设备中,其可以实现成多个软件或软件模块,也可以实现成单个软件或软件模块。在此不做具体限定。
相较于现有技术,本发明提供的股票交易数据预测方法有以下优点:
1、缓解股票交易数据序列不确定性的问题
本方法通过引入和聚合数据相关或弱相关的网络搜索指数因素,并设计可以融合和利用两种异构数据的预测模型,通过分别对双端数据进行建模,侧面上引入了社会因素对原始序列的不稳定波动进行模态追踪,在一定程度上缓解股票交易数据在各个时间间隔内的不确定性问题,从而提高预测的准确性。
2、实时预测的可行性
本方法所用到的网络搜索指数和股票交易数据,均可实时获取。通过对外部数据与目标数据的独立建模可以分别挖掘两类数据的短期模态,再进行关联预测,能够更深入地提取两种数据的特征细节。利用历史数据训练股票交易预测模型,输入实时数据后,能够实时预测短期内股票交易数据的波动情况。
在上述的实施例中,提供了一种股票交易数据的预测方法,与之相对应的,本申请还提供一种股票交易数据的预测装置。本申请实施例提供的股票交易数据的预测装置可以实施上述股票交易数据的预测方法,该股票交易数据的预测装置可以通过软件、硬件或软硬结合的方式来实现。例如,该股票交易数据的预测装置可以包括集成的或分开的功能模块或单元来执行上述各方法中的对应步骤。请参考图3,其示出了本申请的一些实施方式所提供的一种股票交易数据的预测装置的示意图。由于装置实施例基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。下述描述的装置实施例仅仅是示意性的。
如图3所示,所述股票交易数据的预测装置10可以包括:
获取模块101,用于获取一历史时间段内的网络搜索指数和股票交易数据;所述网络搜索指数是指与股票交易相关的网络搜索数据;
预处理模块102,用于对所述网络搜索指数和股票交易数据进行预处理,得到预处理后的样本数据;
分段转化模块103,用于通过设置滞后变量对所述预处理后的样本数据进行数据分段,再根据时间间隔将分段后的样本数据进行数据聚合得到多元时序数据,将所述多元时序数据转化为有监督数据;
模型训练模块104,用于根据所述有监督数据,训练股票交易预测模型;
预测模块105,用于将实时采集的网络搜索指数和股票交易数据输入训练好的所述股票交易预测模型,得到实时预测的股票交易数据。
在本申请实施例的一些实施方式中,预处理模块102具体用于:对所述网络搜索指数和股票交易数据进行数据清洗,对清洗后的数据进行归一化处理,得到归一化后的样本数据。
本申请实施例提供的股票交易数据的预测装置10,与本申请前述实施例提供的股票交易数据的预测方法出于相同的发明构思,具有相同的有益效果。
本申请实施方式还提供一种与前述实施方式所提供的股票交易数据的预测方法对应的电子设备,所述电子设备可以是用于客户端的电子设备,例如手机、笔记本电脑、平板电脑、台式机电脑等,以执行上述股票交易数据的预测方法。
请参考图4,其示出了本申请的一些实施方式所提供的一种电子设备的示意图。如图4所示,所述电子设备20包括:处理器200,存储器201,总线 202和通信接口203,所述处理器200、通信接口203和存储器201通过总线 202连接;所述存储器201中存储有可在所述处理器200上运行的计算机程序,所述处理器200运行所述计算机程序时执行本申请前述任一实施方式所提供的股票交易数据的预测方法。
其中,存储器201可能包含高速随机存取存储器(RAM:RandomAccess Memory),也可能还包括非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。通过至少一个通信接口203(可以是有线或者无线)实现该系统网元与至少一个其他网元之间的通信连接,可以使用互联网、广域网、本地网、城域网等。
总线202可以是ISA总线、PCI总线或EISA总线等。所述总线可以分为地址总线、数据总线、控制总线等。其中,存储器201用于存储程序,所述处理器200在接收到执行指令后,执行所述程序,前述本申请实施例任一实施方式揭示的所述股票交易数据的预测方法可以应用于处理器200中,或者由处理器200实现。
处理器200可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器200中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器200可以是通用处理器,包括中央处理器 (Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称 NP)等;还可以是数字信号处理器(DSP)、专用集成电路(ASIC)、现成可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本申请实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器201,处理器200 读取存储器201中的信息,结合其硬件完成上述方法的步骤。
本申请实施例提供的电子设备与本申请实施例提供的股票交易数据的预测方法出于相同的发明构思,具有与其采用、运行或实现的方法相同的有益效果。
本申请实施方式还提供一种与前述实施方式所提供的股票交易数据的预测方法对应的计算机可读介质,其上存储有计算机程序(即程序产品),所述计算机程序在被处理器运行时,会执行前述任意实施方式所提供的股票交易数据的预测方法。
需要说明的是,所述计算机可读存储介质的例子还可以包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器 (DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他光学、磁性存储介质,在此不再一一赘述。
本申请的上述实施例提供的计算机可读存储介质与本申请实施例提供的股票交易数据的预测方法出于相同的发明构思,具有与其存储的应用程序所采用、运行或实现的方法相同的有益效果。
最后应说明的是:以上各实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述各实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的范围,其均应涵盖在本申请的权利要求和说明书的范围当中。
Claims (10)
1.一种股票交易数据的预测方法,其特征在于,包括:
S1、获取历史时间段内的网络搜索指数和股票交易数据;所述网络搜索指数是指与股票交易相关的网络搜索数据;
S2、对所述网络搜索指数和股票交易数据进行预处理,得到预处理后的样本数据;
S3、通过设置滞后变量对所述预处理后的样本数据进行数据分段,再根据时间间隔将分段后的样本数据进行数据聚合得到多元时序数据,将所述多元时序数据转化为有监督数据;
S4、根据所述有监督数据,训练股票交易预测模型;
S5、将实时采集的网络搜索指数和股票交易数据输入训练好的所述股票交易预测模型,得到实时预测的股票交易数据。
3.根据权利要求2所述的方法,其特征在于,所述步骤S2包括:
对所述网络搜索指数和股票交易数据进行数据清洗,对清洗后的数据进行归一化处理,得到归一化后的样本数据。
5.根据权利要求4所述的方法,其特征在于,所述股票交易预测模型包括:输入层、股票序列处理单元、搜索序列处理单元、合并层、全连接层和输出层;
其中,所述输入层用于输入所述多元时序数据,所述股票序列处理单元用于处理股票交易数据的时序数据,所述搜索序列处理单元用于处理网络搜索指数的时序数据,然后使用合并层和全连接层将所述股票序列处理单元和所述搜索序列处理单元输出的数据相互关联生成初始预测结果,输出层将初始预测结果反归一化生成最终输出的预测结果。
6.根据权利要求5所述的方法,其特征在于,所述股票序列处理单元的表示部件包括第一线程层,所述搜索序列处理单元的表示部件包括:softmax层和第二线程层。
7.根据权利要求5所述的方法,其特征在于,采用均方误差作为所述股票交易预测模型的损失函数。
8.一种股票交易数据的预测装置,其特征在于,包括:
获取模块,用于获取一历史时间段内的网络搜索指数和股票交易数据;所述网络搜索指数是指与股票交易相关的网络搜索数据;
预处理模块,用于对所述网络搜索指数和股票交易数据进行预处理,得到预处理后的样本数据;
分段转化模块,用于通过设置滞后变量对所述预处理后的样本数据进行数据分段,再根据时间间隔将分段后的样本数据进行数据聚合得到多元时序数据,将所述多元时序数据转化为有监督数据;
模型训练模块,用于根据所述有监督数据,训练股票交易预测模型;
预测模块,用于将实时采集的网络搜索指数和股票交易数据输入训练好的所述股票交易预测模型,得到实时预测的股票交易数据。
9.一种电子设备,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器运行所述计算机程序时执行以实现如权利要求1至7任一项所述的方法。
10.一种计算机可读介质,其特征在于,其上存储有计算机可读指令,所述计算机可读指令可被处理器执行以实现如权利要求1至7任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010692574.5A CN111860998A (zh) | 2020-07-17 | 2020-07-17 | 股票交易数据的预测方法、装置、电子设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010692574.5A CN111860998A (zh) | 2020-07-17 | 2020-07-17 | 股票交易数据的预测方法、装置、电子设备及介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111860998A true CN111860998A (zh) | 2020-10-30 |
Family
ID=73001181
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010692574.5A Pending CN111860998A (zh) | 2020-07-17 | 2020-07-17 | 股票交易数据的预测方法、装置、电子设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111860998A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113781224A (zh) * | 2021-09-13 | 2021-12-10 | 上海卡方信息科技有限公司 | 一种股票交易数据的预测方法及其系统 |
CN114565196A (zh) * | 2022-04-28 | 2022-05-31 | 北京零点远景网络科技有限公司 | 基于政务热线的多事件趋势预判方法、装置、设备及介质 |
-
2020
- 2020-07-17 CN CN202010692574.5A patent/CN111860998A/zh active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113781224A (zh) * | 2021-09-13 | 2021-12-10 | 上海卡方信息科技有限公司 | 一种股票交易数据的预测方法及其系统 |
CN114565196A (zh) * | 2022-04-28 | 2022-05-31 | 北京零点远景网络科技有限公司 | 基于政务热线的多事件趋势预判方法、装置、设备及介质 |
CN114565196B (zh) * | 2022-04-28 | 2022-07-29 | 北京零点远景网络科技有限公司 | 基于政务热线的多事件趋势预判方法、装置、设备及介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Wen et al. | Stock market trend prediction using high-order information of time series | |
CN109858740B (zh) | 企业风险的评估方法、装置、计算机设备及存储介质 | |
Zhang et al. | A novel Encoder-Decoder model based on read-first LSTM for air pollutant prediction | |
CN110400021B (zh) | 银行网点现金用量预测方法及装置 | |
Feng et al. | Toward scalable stochastic unit commitment. Part 1: load scenario generation | |
Popa et al. | Composite financial performance index prediction–a neural networks approach | |
CN111860998A (zh) | 股票交易数据的预测方法、装置、电子设备及介质 | |
CN112732786A (zh) | 金融数据处理方法、装置、设备及存储介质 | |
CN114201598B (zh) | 文本推荐方法及文本推荐装置 | |
Fu et al. | Forecasting stock index futures intraday returns: Functional time series model | |
Zhao et al. | Predicting oil prices: an analysis of oil price volatility cycle and financial markets | |
Liang et al. | Improving stock trend prediction through financial time series classification and temporal correlation analysis based on aligning change point | |
Xu et al. | A novel soft ensemble model for financial distress prediction with different sample sizes | |
Tang et al. | Forecasting annual foreign tourist arrivals to China by incorporating firefly algorithm into fractional non-homogenous discrete Grey model | |
Zhao et al. | A novel cryptocurrency price time series hybrid prediction model via machine learning with MATLAB/Simulink | |
Tekouabou et al. | AI-Based on Machine Learning Methods for Urban Real Estate Prediction: A Systematic Survey | |
CN113592196A (zh) | 一种流量数据预测系统、方法、计算机设备及介质 | |
CN113590962A (zh) | 一种流量数据预测系统、方法、计算机设备及介质 | |
Ahmed et al. | Enhancing stock portfolios for enterprise management and investment in energy industry | |
CN107766537A (zh) | 一种职位搜索排序方法及计算设备 | |
CN112686470A (zh) | 电网饱和负荷预测方法、装置及终端设备 | |
CN113095604B (zh) | 产品数据的融合方法、装置、设备及存储介质 | |
CN115908008A (zh) | 股票成交金额预测及模型训练方法、装置、设备及介质 | |
Hartanto et al. | Stock Price Time Series Data Forecasting Using the Light Gradient Boosting Machine (LightGBM) Model | |
CN113240192A (zh) | 模型训练及预测方法、装置、计算机设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20201030 |
|
RJ01 | Rejection of invention patent application after publication |