CN117252691A - 基于多端时序模型的时域自适应股价预测方法及装置 - Google Patents

基于多端时序模型的时域自适应股价预测方法及装置 Download PDF

Info

Publication number
CN117252691A
CN117252691A CN202310881833.2A CN202310881833A CN117252691A CN 117252691 A CN117252691 A CN 117252691A CN 202310881833 A CN202310881833 A CN 202310881833A CN 117252691 A CN117252691 A CN 117252691A
Authority
CN
China
Prior art keywords
model
time domain
adaptive
resampling
domain information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310881833.2A
Other languages
English (en)
Inventor
刘卢琛
黄进晟
夏炳煜
刘旭晖
张铭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Junming Technology Co ltd
Original Assignee
Beijing Junming Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Junming Technology Co ltd filed Critical Beijing Junming Technology Co ltd
Priority to CN202310881833.2A priority Critical patent/CN117252691A/zh
Publication of CN117252691A publication Critical patent/CN117252691A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/04Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/042Knowledge-based neural networks; Logical representations of neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • G06N3/0442Recurrent networks, e.g. Hopfield networks characterised by memory or gating, e.g. long short-term memory [LSTM] or gated recurrent units [GRU]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/0985Hyperparameter optimisation; Meta-learning; Learning-to-learn

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Development Economics (AREA)
  • Technology Law (AREA)
  • Strategic Management (AREA)
  • Marketing (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及人工智能领域,公开了一种基于多端时序模型的时域自适应股价预测方法及装置,用于对股票时域信息进行自适应噪声建模并提高股价预测的准确性。方法包括:通过固定初始化多端融合时序预测模型的第一模型参数并对初始化时域信息自适应重采样模型进行模型参数更新,得到目标时域信息自适应重采样模型;固定目标时域信息自适应重采样模型的第二模型参数并对初始化多端融合时序预测模型进行模型优化,得到目标多端融合时序预测模型;通过多轮双层迭代并进行模型验证,输出双层迭代优化的时域信息自适应模型;获取待处理的第二流式数据,并通过双层迭代优化的时域信息自适应模型对第二流式数据进行股价预测,得到目标股价预测结果。

Description

基于多端时序模型的时域自适应股价预测方法及装置
技术领域
本发明涉及人工智能领域,尤其涉及一种基于多端时序模型的时域自适应股价预测方法及装置。
背景技术
目前,股价预测方法是利用基于序列的深度模型,例如感知神经网络(MLP)、卷积神经网络(CNN)、递归神经网络(RNN)及其变体(LSTM)等来对股票时序数据进行序列性建模。针对股票时序数据中的非平稳性建模问题,大多数方法则采取传统的数学模型如GARCH,ARIMA等数学模型建模或者后期则使用基于深度学习的模块VAE来进行可学习的噪声性建模。
由于股票数据具有噪声强,平稳性差等特点。虽然人们已经使用了诸如特征工程,傅里叶变换等方法降低噪声,同时通过对数据差分等各种变换来提高平稳性。然而,在很多情况下,时间序列数据随时间变化其分布会发生明显变化,且通常这种变化并不是简单的线性。这时候简单的差分等操作并不能有效提高时间序列的平稳性,进而导致股价预测的准确率低。
发明内容
本发明提供了一种基于多端时序模型的时域自适应股价预测方法及装置,用于对股票时域信息进行自适应噪声建模并提高股价预测的准确性。
本发明第一方面提供了一种基于多端时序模型的时域自适应股价预测方法,所述基于多端时序模型的时域自适应股价预测方法包括:
对原始时域信息自适应重采样模型以及原始多端融合时序预测模型进行初始化,得到初始化时域信息自适应重采样模型以及初始化多端融合时序预测模型;
固定所述初始化多端融合时序预测模型的第一模型参数,并通过第一流式数据对所述初始化时域信息自适应重采样模型进行模型参数更新,得到目标时域信息自适应重采样模型;
通过所述目标时域信息自适应重采样模型对所述第一流式数据进行子任务划分和重采样,得到训练重采样数据集;
固定所述目标时域信息自适应重采样模型的第二模型参数,并通过所述训练重采样数据集和预置损失函数对所述初始化多端融合时序预测模型进行模型优化,得到目标多端融合时序预测模型;
对所述目标时域信息自适应重采样模型和所述目标多端融合时序预测模型进行多轮双层迭代以及模型验证,输出双层迭代优化的时域信息自适应模型;
获取待处理的第二流式数据,并通过所述双层迭代优化的时域信息自适应模型对所述第二流式数据进行股价预测,得到目标股价预测结果。
结合第一方面,在本发明第一方面的第一种实现方式中,所述对原始时域信息自适应重采样模型以及原始多端融合时序预测模型进行初始化,得到初始化时域信息自适应重采样模型以及初始化多端融合时序预测模型,包括:
构建原始时域信息自适应重采样模型,其中,所述原始时域信息自适应重采样模型包括:输入层、线性网络层以及优化层;
初始化所述原始时域信息自适应重采样模型的第一权重参数和第一偏置参数并设定所述原始时域信息自适应重采样模型的第一超参数,得到初始化时域信息自适应重采样模型;
构建原始多端融合时序预测模型,其中,所述原始多端融合时序预测模型包括:对应不同行业板块股票池的多个时序表征模块、基于关联信息的图神经网络建模层以及预测层;
对所述原始多端融合时序预测模型中的对应不同行业板块股票池的多个时序表征模块进行随机初始化,得到第二权重参数和第二偏置参数并设置每个时序模块的结构和第二超参数,得到初始化多端融合时序预测模型。
结合第一方面,在本发明第一方面的第二种实现方式中,所述固定所述初始化多端融合时序预测模型的第一模型参数,并通过第一流式数据对所述初始化时域信息自适应重采样模型进行模型参数更新,得到目标时域信息自适应重采样模型,包括:
获取股票特征数据X={x1,x2,...,xT}以及股票标签数据y={y1,y2,...,yT},其中,xi为m维的实值向量,表示股票对应的第i天的多维特征,y表示标签;
将所述股票特征数据和所述股票标签数据作为历史流式数据,并根据所述历史流式数据生成第一流式数据;
将所述第一流式数据输入所述初始化多端融合时序预测模型进行预测,得到第一预测结果,并根据所述第一预测结果计算对应的第一损失函数值;
根据所述第一损失函数值的梯度信息并通过梯度下降优化算法对所述初始化时域信息自适应重采样模型进行模型参数更新,同时,固定所述初始化多端融合时序预测模型的第一模型参数不变,只更新所述初始化时域信息自适应重采样模型的模型参数,其中,所述第一模型参数包括:第一权重参数、第一偏置参数以及第一超参数;
对所述初始化时域信息自适应重采样模型进行迭代训练,得到目标时域信息自适应重采样模型。
结合第一方面,在本发明第一方面的第三种实现方式中,所述通过所述目标时域信息自适应重采样模型对所述第一流式数据进行子任务划分和重采样,得到训练重采样数据集,包括:
通过所述目标时域信息自适应重采样模型对所述第一流式数据进行子任务划分,得到多个子任务;
对所述多个子任务进行重采样操作,生成每个子任务对应的重采样数据;
根据每个子任务对应的重采样数据生成训练重采样数据集。
结合第一方面,在本发明第一方面的第四种实现方式中,所述固定所述目标时域信息自适应重采样模型的第二模型参数,并通过所述训练重采样数据集和预置损失函数对所述初始化多端融合时序预测模型进行模型优化,得到目标多端融合时序预测模型,包括:
将所述训练重采样数据集输入所述初始化多端融合时序预测模型进行预测,得到第二预测结果;
通过预置的MSE损失函数对所述第二预测结果进行计算,得到第二损失函数值;
固定所述目标时域信息自适应重采样模型的第二模型参数,根据所述第二损失函数值对所述初始化多端融合时序预测模型进行模型优化,得到目标多端融合时序预测模型。
结合第一方面,在本发明第一方面的第五种实现方式中,所述对所述目标时域信息自适应重采样模型和所述目标多端融合时序预测模型进行多轮双层迭代以及模型验证,输出双层迭代优化的时域信息自适应模型,包括:
根据所述历史流式数据生成验证数据集;
通过所述目标时域信息自适应重采样模型对所述验证数据集进行子任务划分和重采样,得到验证重采样数据集;
通过所述目标多端融合时序预测模型对所述验证重采样数据集进行预测,得到第三预测结果;
根据所述第三预测结果生成模型性能评价指标,并根据所述模型性能评价指标输出双层迭代优化的时域信息自适应模型。
结合第一方面,在本发明第一方面的第六种实现方式中,所述获取待处理的第二流式数据,并通过所述双层迭代优化的时域信息自适应模型对所述第二流式数据进行股价预测,得到目标股价预测结果,包括:
获取待处理的第二流式数据;
将所述第二流式数据输入所述双层迭代优化的时域信息自适应模型进行子任务划分以及重采样,得到目标重采样数据集;
通过所述双层迭代优化的时域信息自适应模型对所述目标重采样数据集进行股价预测,得到目标股价预测结果。
本发明第二方面提供了一种基于多端时序模型的时域自适应股价预测装置,所述基于多端时序模型的时域自适应股价预测装置包括:
初始化模块,用于对原始时域信息自适应重采样模型以及原始多端融合时序预测模型进行初始化,得到初始化时域信息自适应重采样模型以及初始化多端融合时序预测模型;
更新模块,用于固定所述初始化多端融合时序预测模型的第一模型参数,并通过第一流式数据对所述初始化时域信息自适应重采样模型进行模型参数更新,得到目标时域信息自适应重采样模型;
重采样模块,用于通过所述目标时域信息自适应重采样模型对所述第一流式数据进行子任务划分和重采样,得到训练重采样数据集;
优化模块,用于固定所述目标时域信息自适应重采样模型的第二模型参数,并通过所述训练重采样数据集和预置损失函数对所述初始化多端融合时序预测模型进行模型优化,得到目标多端融合时序预测模型;
验证模块,用于对所述目标时域信息自适应重采样模型和所述目标多端融合时序预测模型进行多轮双层迭代以及模型验证,输出双层迭代优化的时域信息自适应模型;
预测模块,用于获取待处理的第二流式数据,并通过所述双层迭代优化的时域信息自适应模型对所述第二流式数据进行股价预测,得到目标股价预测结果。
本发明第三方面提供了一种基于多端时序模型的时域自适应股价预测设备,包括:存储器和至少一个处理器,所述存储器中存储有指令;所述至少一个处理器调用所述存储器中的所述指令,以使得所述基于多端时序模型的时域自适应股价预测设备执行上述的基于多端时序模型的时域自适应股价预测方法。
本发明的第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述的基于多端时序模型的时域自适应股价预测方法。
本发明提供的技术方案中,通过固定初始化多端融合时序预测模型的第一模型参数并对初始化时域信息自适应重采样模型进行模型参数更新,得到目标时域信息自适应重采样模型;固定目标时域信息自适应重采样模型的第二模型参数并对初始化多端融合时序预测模型进行模型优化,得到目标多端融合时序预测模型;进行多轮双层迭代以及模型验证,输出双层迭代优化的时域信息自适应模型;获取待处理的第二流式数据,并通过双层迭代优化的时域信息自适应模型对第二流式数据进行股价预测,得到目标股价预测结果,本发明基于双阶段迭代优化的时域信息自适应模型,提出了符合股票数据场景逻辑的时域信息自适应模型与数据重采样模型,能够有效针对股票数据中的非平稳数据进行建模,数据重采样模型是可学习的,这个可以保证模型在概念漂移的过程中保证参数有效性,提出了多端融合时序预测模型,能够针对不同行业板块,不同股票池进行数据建模,保证了模型在预测任务上的泛化性。
附图说明
图1为本发明实施例中基于多端时序模型的时域自适应股价预测方法的一个实施例示意图;
图2为本发明实施例中初始化的流程图;
图3为本发明实施例中模型优化的流程图;
图4为本发明实施例中模型验证的流程图;
图5为本发明实施例中基于多端时序模型的时域自适应股价预测装置的一个实施例示意图;
图6为本发明实施例中基于多端时序模型的时域自适应股价预测设备的一个实施例示意图。
具体实施方式
本发明实施例提供了一种基于多端时序模型的时域自适应股价预测方法及装置,用于对股票时域信息进行自适应噪声建模并提高股价预测的准确性。本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外,术语“包括”或“具有”及其任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
为便于理解,下面对本发明实施例的具体流程进行描述,请参阅图1,本发明实施例中基于多端时序模型的时域自适应股价预测方法的一个实施例包括:
S101、对原始时域信息自适应重采样模型以及原始多端融合时序预测模型进行初始化,得到初始化时域信息自适应重采样模型以及初始化多端融合时序预测模型;
可以理解的是,本发明的执行主体可以为基于多端时序模型的时域自适应股价预测装置,还可以是终端或者服务器,具体此处不做限定。本发明实施例以服务器为执行主体为例进行说明。
具体的,服务器构建原始时域信息自适应重采样模型:输入层:该层接收原始的时域数据作为输入。线性网络层:该层包含一些全连接层,可以通过权重参数和偏置参数进行线性变换。优化层:该层使用梯度下降等优化算法来更新模型参数,以逐步优化模型的性能。初始化原始时域信息自适应重采样模型:初始化第一权重参数和第一偏置参数:为模型的线性网络层中的权重和偏置参数赋予初始值,可以使用随机初始化的方法,如从高斯分布中采样得到初始值。设定第一超参数:根据具体问题的需求,设定相关的超参数,例如学习率、迭代次数等,用于控制模型的训练过程。构建原始多端融合时序预测模型:对应不同行业板块股票池的多个时序表征模块:针对不同行业板块或股票池,构建对应不同行业板块股票池的多个时序表征模块,例如采用LSTM模型,每个模块处理对应行业或股票的时序数据。基于关联信息的图神经网络建模层:该层用于学习股票之间的关联关系,可以通过构建图结构来表示不同股票之间的相似性或相关性,并利用图神经网络模型进行特征学习。预测层:根据时序模块和基于关联信息的图神经网络建模层的输出,设计预测层来生成股价预测结果。对原始多端融合时序预测模型中的对应不同行业板块股票池的多个时序表征模块进行随机初始化:对每个时序模块中的权重参数和偏置参数进行随机初始化,例如使用高斯分布随机采样的方法。设置每个时序模块的结构和第二超参数,包括隐藏状态的维度、激活函数的选择、优化算法的设定等。例如:假设服务器要预测科技板块的股价走势,服务器构建一个原始多端融合时序预测模型。其中,时序模块使用LSTM模型,基于关联信息的图神经网络建模层用于学习科技板块内不同股票的相关性。在初始化阶段,服务器随机初始化LSTM模型的权重参数和偏置参数,设定LSTM模型的隐藏状态维度为100,并选择ReLU作为激活函数。对于基于关联信息的图神经网络建模层,服务器构建一个图结构,其中节点表示科技板块内的不同股票,边表示股票之间的相关性。服务器随机初始化基于关联信息的图神经网络建模层的权重参数和偏置参数,并设置相关超参数,如学习率为0.001,迭代次数为100。
S102、固定初始化多端融合时序预测模型的第一模型参数,并通过第一流式数据对初始化时域信息自适应重采样模型进行模型参数更新,得到目标时域信息自适应重采样模型;
具体的,服务器获取股票特征数据X={x1,x2,...,xT}以及股票标签数据y={y1,y2,...,yT}:从数据源获取股票的多维特征数据,如开盘价、收盘价、成交量等。获取对应的标签数据,例如未来一天的收盘价或涨跌情况。将股票特征数据和股票标签数据作为历史流式数据,并生成第一流式数据:根据历史数据的时间顺序,将多维特征数据X和标签数据y组合成流式数据。可以设定一个滑动窗口,每次取固定长度的历史数据作为输入,移动窗口进行预测。给定X以及特定的标签序列y={y1,y2,...,yT},预测模型需要在历史数据(即训练数据Dt train={(xi,yi)}t i=1上进行训练和调整,并在未来对看不见的数据(测试数据Dt test={(xi,yi)}T i=t+1进行预测。所有的方法都基于一个基本的假设,即数据都来自相同的联合分布(xi,yi)~pt(x,y)。由于环境的非平稳性,联合分布pt不是静态的,而是随时间变化的,这个假设场景就是概念漂移。输入第一流式数据到初始化多端融合时序预测模型进行预测:使用初始化多端融合时序预测模型对第一流式数据进行处理和预测。模型可以包括对应不同行业板块股票池的多个时序表征模块和基于关联信息的图神经网络建模层,根据特征数据的时序性和股票之间的关联性进行预测。计算第一预测结果并计算对应的第一损失函数值:根据模型预测的结果和实际标签数据,计算预测结果与真实值之间的差距。可以选择适当的损失函数,如均方误差(MSE)或交叉熵损失等。利用梯度下降优化算法对初始化时域信息自适应重采样模型进行模型参数更新:根据第一损失函数值的梯度信息,通过梯度下降优化算法,对初始化时域信息自适应重采样模型的模型参数进行更新。可以使用反向传播算法计算梯度并更新参数,使得模型的预测结果逐步优化。固定初始化多端融合时序预测模型的第一模型参数:在模型参数更新过程中,保持初始化多端融合时序预测模型的第一模型参数不变,即固定第一模型参数的值。只更新初始化时域信息自适应重采样模型的模型参数,包括第一权重参数、第一偏置参数以及第一超参数。迭代训练初始化时域信息自适应重采样模型:重复对初始化时域信息自适应重采样模型进行迭代训练。每轮迭代中,根据新的第一流式数据和损失函数进行模型参数更新,逐步优化模型的性能。得到目标时域信息自适应重采样模型:在迭代训练完成后,得到目标时域信息自适应重采样模型。该模型经过多次迭代训练后,可以更好地适应股价预测任务的要求。
S103、通过目标时域信息自适应重采样模型对第一流式数据进行子任务划分和重采样,得到训练重采样数据集;
需要说明的是,通过目标时域信息自适应重采样模型对第一流式数据进行子任务划分:将第一流式数据输入目标时域信息自适应重采样模型进行处理。目标时域信息自适应重采样模型根据数据的特征和模式,将原始数据划分为多个子任务。子任务的划分可以基于时间窗口、特征相关性等标准进行。对多个子任务进行重采样操作,生成每个子任务对应的重采样数据:对每个子任务进行重采样操作,可以使用不同的采样方法和策略。重采样可以包括欠采样、过采样、随机采样等,根据具体需求选择合适的采样方法。重采样的目的是平衡样本类别分布、增加样本多样性或者减少样本量,以提升模型训练效果。根据每个子任务对应的重采样数据生成训练重采样数据集:将经过重采样的子任务数据集合并成训练重采样数据集。根据子任务之间的关联性和时序特征,将不同子任务的数据按照合适的方式组合。训练重采样数据集中的样本应包含输入数据和对应的标签,以供模型训练使用。
S104、固定目标时域信息自适应重采样模型的第二模型参数,并通过训练重采样数据集和预置损失函数对初始化多端融合时序预测模型进行模型优化,得到目标多端融合时序预测模型;
具体的,将训练重采样数据集输入初始化多端融合时序预测模型进行预测,得到第二预测结果:将训练重采样数据集作为输入提供给初始化多端融合时序预测模型。模型根据输入数据进行预测,得到对应的预测结果。第二预测结果可以是对股价未来走势的预测或其他相关的预测输出。通过预置的均方误差(MSE)损失函数对第二预测结果进行计算,得到第二损失函数值:将第二预测结果与训练重采样数据集中的真实标签进行比较。使用预置的MSE损失函数计算预测结果与真实标签之间的差异。第二损失函数值反映了模型预测的准确程度,值越小表示预测结果越接近真实标签。固定目标时域信息自适应重采样模型的第二模型参数,并根据第二损失函数值对初始化多端融合时序预测模型进行模型优化:在模型优化过程中,固定目标时域信息自适应重采样模型的第二模型参数,保持其不变。使用梯度下降等优化算法,根据第二损失函数值对初始化多端融合时序预测模型的其他模型参数进行调整和优化。通过迭代优化的过程,逐步更新模型参数,使得模型在训练重采样数据集上的性能逐渐提升。通过以上步骤,可以实现固定目标时域信息自适应重采样模型的第二模型参数,并通过训练重采样数据集和预置损失函数对初始化多端融合时序预测模型进行模型优化,最终得到目标多端融合时序预测模型。该模型能够更准确地预测股价走势或其他相关的预测结果。例如:假设服务器的目标是通过股票的历史数据来预测未来一周的股价走势。服务器使用多端融合时序预测模型,其中包括对应不同行业板块股票池的多个时序表征模块、基于关联信息的图神经网络建模层和预测层。服务器通过历史数据构建训练重采样数据集,包括股票的特征数据X和对应的标签数据y。例如,X可以表示每天的开盘价、收盘价、最高价、最低价等多维特征,而y可以表示第二天的涨跌情况(涨为1,跌为0)。将训练重采样数据集输入初始化的多端融合时序预测模型进行预测,得到第二预测结果。模型根据历史数据学习股价的模式和趋势,并预测未来一周的涨跌情况。通过预置的MSE损失函数计算第二预测结果与真实标签之间的差异,得到第二损失函数值。这个损失函数值可以衡量模型的预测准确度,越小表示预测结果与真实情况越接近。在模型优化过程中,服务器固定目标时域信息自适应重采样模型的第二模型参数,例如权重和偏置参数,不对其进行更新。利用梯度下降等优化算法,调整和优化初始化多端融合时序预测模型的其他模型参数,以最小化第二损失函数值。通过迭代优化的过程,服务器逐步改进模型的性能,使其能够更准确地预测股价走势。
S105、对目标时域信息自适应重采样模型和目标多端融合时序预测模型进行多轮双层迭代以及模型验证,输出双层迭代优化的时域信息自适应模型;
具体的,服务器根据历史流式数据生成验证数据集:从历史流式数据中选择一部分数据作为验证数据集,通常是最近的一段时间的数据。验证数据集用于评估模型的性能和泛化能力,因为它与训练数据集是独立的。通过目标时域信息自适应重采样模型对验证数据集进行子任务划分和重采样,得到验证重采样数据集:将验证数据集输入目标时域信息自适应重采样模型。目标模型对验证数据集进行子任务划分,将数据划分为多个子任务,每个子任务包含一部分数据。对每个子任务进行重采样操作,生成对应的重采样数据,这些数据将用于模型的验证和性能评估。通过目标多端融合时序预测模型对验证重采样数据集进行预测,得到第三预测结果:将验证重采样数据集输入目标多端融合时序预测模型。模型根据输入数据进行预测,得到对应的预测结果。第三预测结果可以是对股价未来走势的预测或其他相关的预测输出。根据第三预测结果生成模型性能评价指标,并根据模型性能评价指标输出双层迭代优化的时域信息自适应模型:使用预定义的评价指标,例如均方误差(MSE)、平均绝对误差(MAE)等,计算第三预测结果与验证数据集中的真实标签之间的差异。根据评价指标的值来评估模型在验证数据集上的性能表现。如果模型性能达到预期要求,即满足预先设定的性能指标,可以将目标时域信息自适应重采样模型作为输出。输出的时域信息自适应模型可以作为一个双层迭代优化的模型,其中第一层是目标时域信息自适应重采样模型,第二层是目标多端融合时序预测模型。例如:假设服务器使用基于多端时序模型的时域自适应股价预测方法来预测某股票的未来走势。服务器先从历史数据中获取一段时间的流式数据,其中包括股票的特征数据X和对应的标签数据y。服务器将历史流式数据中的一部分作为验证数据集。这些数据与训练数据集是独立的,用于评估模型的性能和泛化能力。通过目标时域信息自适应重采样模型对验证数据集进行子任务划分和重采样。模型将验证数据集划分为多个子任务,每个子任务包含一部分数据。针对每个子任务,服务器使用模型进行重采样操作,生成对应的重采样数据集。将验证重采样数据集输入目标多端融合时序预测模型进行预测。模型根据输入数据进行预测,得到对未来走势的预测结果。根据第三预测结果,服务器计算模型的性能评价指标,如均方误差(MSE)或平均绝对误差(MAE)。这些指标可以衡量模型的预测准确度和误差大小。
S106、获取待处理的第二流式数据,并通过双层迭代优化的时域信息自适应模型对第二流式数据进行股价预测,得到目标股价预测结果。
具体的,获取待处理的第二流式数据:第二流式数据是指新进入系统的实时或近期的股票特征数据,如当日的股票价格、交易量等。这些数据可以从股票交易所、金融数据提供商或其他相关数据源获取。将第二流式数据输入双层迭代优化的时域信息自适应模型进行子任务划分和重采样,得到目标重采样数据集:将第二流式数据输入目标时域信息自适应重采样模型。模型根据预先设定的规则将数据划分为多个子任务。对每个子任务进行重采样操作,生成相应的重采样数据集。重采样可以采用各种技术,如过采样、欠采样、分段采样等,以满足模型对数据的需求。通过双层迭代优化的时域信息自适应模型对目标重采样数据集进行股价预测,得到目标股价预测结果:将目标重采样数据集输入目标多端融合时序预测模型。模型根据输入数据进行股价预测,得到目标股价的预测结果。预测结果可以是对未来一段时间内股价走势的预测或其他相关的预测输出。例如:假设服务器使用基于多端时序模型的时域自适应股价预测方法来处理待处理的第二流式数据,服务器已经建立了双层迭代优化的时域信息自适应模型。假设服务器的目标是预测某支股票未来一周的价格走势。服务器从数据源获取待处理的第二流式数据,这些数据包括最新的股票特征信息,如当日的开盘价、收盘价、交易量等。将第二流式数据输入双层迭代优化的时域信息自适应模型。模型根据预先设定的规则将数据划分为多个子任务,并进行重采样操作生成目标重采样数据集。将目标重采样数据集输入目标多端融合时序预测模型。该模型会利用输入数据进行股价预测,得到对未来一周内股票价格走势的预测结果。服务器通过分析预测结果,判断股票价格的上涨、下跌或持平趋势,并据此做出相应的决策。
本发明实施例中,通过固定初始化多端融合时序预测模型的第一模型参数并对初始化时域信息自适应重采样模型进行模型参数更新,得到目标时域信息自适应重采样模型;固定目标时域信息自适应重采样模型的第二模型参数并对初始化多端融合时序预测模型进行模型优化,得到目标多端融合时序预测模型;进行多轮双层迭代以及模型验证,输出双层迭代优化的时域信息自适应模型;获取待处理的第二流式数据,并通过双层迭代优化的时域信息自适应模型对第二流式数据进行股价预测,得到目标股价预测结果,本发明基于双阶段迭代优化的时域信息自适应模型,提出了符合股票数据场景逻辑的时域信息自适应模型与数据重采样模型,能够有效针对股票数据中的非平稳数据进行建模,数据重采样模型是可学习的,这个可以保证模型在概念漂移的过程中保证参数有效性,提出了多端融合时序预测模型,能够针对不同行业板块,不同股票池进行数据建模,保证了模型在预测任务上的泛化性。
在一具体实施例中,如图2所示,执行步骤S101的过程可以具体包括如下步骤:
S201、构建原始时域信息自适应重采样模型,其中,原始时域信息自适应重采样模型包括:输入层、线性网络层以及优化层;
S202、初始化原始时域信息自适应重采样模型的第一权重参数和第一偏置参数并设定原始时域信息自适应重采样模型的第一超参数,得到初始化时域信息自适应重采样模型;
S203、构建原始多端融合时序预测模型,其中,原始多端融合时序预测模型包括:对应不同行业板块股票池的多个时序表征模块、基于关联信息的图神经网络建模层以及预测层;
S204、对原始多端融合时序预测模型中的对应不同行业板块股票池的多个时序表征模块进行随机初始化,得到第二权重参数和第二偏置参数并设置每个时序模块的结构和第二超参数,得到初始化多端融合时序预测模型。
具体的,服务器构建原始时域信息自适应重采样模型的输入层:输入层是模型的第一层,用于接收输入的时域信息。输入层的节点数应与输入数据的特征维度相匹配。构建原始时域信息自适应重采样模型的线性网络层:线性网络层是模型的中间层,用于对输入数据进行线性变换和特征提取。线性网络层由多个神经元组成,每个神经元与输入层的节点相连接。每个神经元包括权重和偏置,用于对输入数据进行线性组合。构建原始时域信息自适应重采样模型的优化层:优化层是模型的最后一层,用于对线性网络层的输出进行优化和调整。优化层可以使用不同的激活函数和优化算法,如ReLU激活函数和梯度下降法。初始化原始时域信息自适应重采样模型的第一权重参数和第一偏置参数:权重参数和偏置参数是模型的可学习参数,用于调整模型的输出。可以随机初始化权重参数和偏置参数,或者根据先验知识进行初始化。设定原始时域信息自适应重采样模型的第一超参数:超参数是模型的固定参数,用于控制模型的学习过程和性能。第一超参数可以包括学习率、正则化参数、迭代次数等。设定适当的超参数可以提高模型的性能和训练效果。例如:假设服务器构建一个原始时域信息自适应重采样模型来预测股票价格。模型的输入是股票的历史价格数据,包括开盘价、收盘价等特征。服务器使用一个线性网络层和一个优化层来构建模型。服务器构建输入层,其节点数与输入数据的特征维度相匹配。假设服务器选择使用开盘价和收盘价两个特征,那么输入层的节点数为2。服务器构建线性网络层,由多个神经元组成。每个神经元与输入层的节点相连接,每个连接都有一个权重参数和一个偏置参数。这些参数用于对输入数据进行线性组合和特征提取。服务器构建优化层,该层对线性网络层的输出进行优化和调整。可以使用激活函数如ReLU函数来引入非线性变换,并使用梯度下降法等优化算法进行参数更新。在模型构建完成后,服务器初始化模型的第一权重参数和第一偏置参数。这可以通过随机初始化或者根据先验知识进行初始化。服务器设定模型的第一超参数,如学习率、正则化参数等。这些超参数的设置对模型的训练效果和性能具有重要影响。
在一具体实施例中,执行步骤S102的过程可以具体包括如下步骤:
(1)获取股票特征数据X={x1,x2,...,xT}以及股票标签数据y={y1,y2,...,yT},其中,xi为m维的实值向量,表示股票对应的第i天的多维特征,y表示标签;
(2)将股票特征数据和股票标签数据作为历史流式数据,并根据历史流式数据生成第一流式数据;
(3)将第一流式数据输入初始化多端融合时序预测模型进行预测,得到第一预测结果,并根据第一预测结果计算对应的第一损失函数值;
(4)根据第一损失函数值的梯度信息并通过梯度下降优化算法对初始化时域信息自适应重采样模型进行模型参数更新,同时,固定初始化多端融合时序预测模型的第一模型参数不变,只更新初始化时域信息自适应重采样模型的模型参数,其中,第一模型参数包括:第一权重参数、第一偏置参数以及第一超参数;
(3)对初始化时域信息自适应重采样模型进行迭代训练,得到目标时域信息自适应重采样模型。
具体的,服务器获取股票特征数据X和股票标签数据y:从数据源中获取股票特征数据X和对应的股票标签数据y。特征数据X应为一个包含多个m维实值向量的序列,每个向量表示股票对应的第i天的多维特征。标签数据y表示股票对应的第i天的目标标签,可以是股价涨跌或其他相关指标。构建历史流式数据:将股票特征数据X和股票标签数据y按时间顺序组合成历史流式数据。可以使用滑动窗口或其他方法定义历史数据的时间窗口大小,例如取最近N天的数据作为历史数据。生成第一流式数据:根据历史流式数据,从中截取一段作为第一流式数据。第一流式数据的长度根据需要进行设置,通常包含一定数量的历史时间步长的数据。输入第一流式数据进行预测和损失计算:将第一流式数据输入初始化多端融合时序预测模型进行预测,得到第一预测结果。根据预测结果和对应的真实标签计算第一损失函数值,可以使用常见的损失函数如均方误差(MSE)。梯度下降更新初始化时域信息自适应重采样模型的参数:根据第一损失函数值的梯度信息,使用梯度下降算法更新初始化时域信息自适应重采样模型的参数。固定初始化多端融合时序预测模型的第一模型参数,只更新初始化时域信息自适应重采样模型的参数,包括第一权重参数、第一偏置参数以及第一超参数。迭代训练初始化时域信息自适应重采样模型:对初始化时域信息自适应重采样模型进行迭代训练,重复步骤,以逐渐优化模型的参数和性能。可以设置训练的迭代次数或使用其他停止准则来确定训练的终止条件。例如:假设服务器要利用股票特征数据和股票标签数据进行股价预测。股票特征数据X包含开盘价、收盘价、最高价等多个维度的数据,而股票标签数据y表示下一天的收盘价。服务器构建了一个多端融合时序预测模型和一个时域信息自适应重采样模型。从数据源中获取股票特征数据X和对应的股票标签数据y。例如,服务器获取了过去一年的股票特征数据和对应的收盘价作为标签数据。将股票特征数据X和股票标签数据y按时间顺序组合成历史流式数据。假设服务器设置时间窗口大小为20天,即每个时间步包含过去20天的数据。从历史流式数据中截取一段作为第一流式数据,例如最近的100个时间步作为第一流式数据。将第一流式数据输入初始化多端融合时序预测模型进行预测,得到第一预测结果。根据第一预测结果和对应的真实标签,计算第一损失函数值,如均方误差(MSE)。根据第一损失函数值的梯度信息,使用梯度下降算法对时域信息自适应重采样模型的参数进行更新。在更新参数时,固定多端融合时序预测模型的参数,只更新时域信息自适应重采样模型的参数。本实施例中,迭代训练时域信息自适应重采样模型,通过不断更新参数和计算损失函数,逐渐优化模型的性能。
在一具体实施例中,执行步骤S103的过程可以具体包括如下步骤:
(1)通过目标时域信息自适应重采样模型对第一流式数据进行子任务划分,得到多个子任务;
(2)对多个子任务进行重采样操作,生成每个子任务对应的重采样数据;
(3)根据每个子任务对应的重采样数据生成训练重采样数据集。
具体的,子任务划分:使用目标时域信息自适应重采样模型对第一流式数据进行子任务划分。子任务划分是将第一流式数据分割成多个较小的子任务,每个子任务包含一部分时间序列数据。子任务划分的方式根据具体的任务需求来确定,例如固定窗口划分、滑动窗口划分等。重采样操作:对每个子任务进行重采样操作,生成每个子任务对应的重采样数据。重采样操作是在每个子任务中对时间序列数据进行重新采样,可以改变采样频率、调整时间步长等。重采样操作的目的是根据具体需求对时间序列数据进行调整,使得数据更适合模型的训练。训练重采样数据集的生成:根据每个子任务对应的重采样数据,生成训练重采样数据集。将所有子任务的重采样数据合并成一个训练数据集,用于训练模型。训练数据集应包含特征数据和对应的标签数据,根据具体任务的需求来确定标签数据的生成方式。例如:假设服务器使用目标时域信息自适应重采样模型对股票数据进行预测,并将每天的股票数据作为第一流式数据。服务器将第一流式数据划分成大小为10天的子任务,并进行重采样操作,调整采样频率为每3天一次。以下是具体步骤:子任务划分:将第一流式数据按10天为一个子任务进行划分。例如,假设第一流式数据为100天的股票数据,那么可以划分成10个子任务,每个子任务包含连续的10天的数据。重采样操作:对每个子任务进行重采样操作,调整采样频率为每3天一次。例如,对于一个子任务,原始数据为连续的10天的股票数据,服务器将其重采样为每3天一条数据。训练重采样数据集的生成:将每个子任务的重采样数据合并成一个训练重采样数据集。训练重采样数据集应包含特征数据和对应的标签数据。例如,对于每个重采样后的数据点,可以使用过去7天的数据作为特征,用第8天的数据作为标签。
在一具体实施例中,如图3所示,执行步骤S104的过程可以具体包括如下步骤:
S301、将训练重采样数据集输入初始化多端融合时序预测模型进行预测,得到第二预测结果;
S302、通过预置的MSE损失函数对第二预测结果进行计算,得到第二损失函数值;
S303、固定目标时域信息自适应重采样模型的第二模型参数,根据第二损失函数值对初始化多端融合时序预测模型进行模型优化,得到目标多端融合时序预测模型。
具体的,服务器输入训练重采样数据集:将训练重采样数据集作为输入提供给初始化多端融合时序预测模型。训练重采样数据集应包含特征数据和对应的标签数据。预测第二结果:使用初始化多端融合时序预测模型对训练重采样数据集进行预测,得到第二预测结果。第二预测结果是模型对训练数据集中每个样本的预测输出。计算第二损失函数值:根据预置的损失函数(如MSE损失函数)以及第二预测结果和标签数据,计算第二损失函数值。损失函数用于衡量模型的预测结果与实际标签之间的差异。模型优化:固定目标时域信息自适应重采样模型的第二模型参数,即不对该模型参数进行更新。根据第二损失函数值使用优化算法(如梯度下降)对初始化多端融合时序预测模型的模型参数进行优化,以降低损失函数值。优化算法会根据损失函数的梯度信息对模型参数进行调整,以使模型更好地拟合训练数据。目标多端融合时序预测模型:经过多次迭代优化后,得到目标多端融合时序预测模型,其中模型参数已经通过训练数据集的优化得到。例如:假设服务器使用初始化多端融合时序预测模型对股票数据进行预测,并使用训练重采样数据集作为输入。其中,输入训练重采样数据集:假设训练重采样数据集包含100个样本,每个样本包含过去7天的股票特征数据和第8天的标签数据。预测第二结果:将训练重采样数据集输入初始化多端融合时序预测模型进行预测,得到100个样本对应的第二预测结果。计算第二损失函数值:使用预置的MSE损失函数,根据第二预测结果和对应的标签数据计算损失函数值。模型优化:固定目标时域信息自适应重采样模型的第二模型参数,不对该模型参数进行更新。使用梯度下降优化算法,根据第二损失函数值的梯度信息对初始化多端融合时序预测模型的模型参数进行优化。目标多端融合时序预测模型:经过多次迭代优化后,得到目标多端融合时序预测模型,其中模型参数已经通过训练重采样数据集的优化得到。
在一具体实施例中,如图4所示,执行步骤S105的过程可以具体包括如下步骤:
S401、根据历史流式数据生成验证数据集;
S402、通过目标时域信息自适应重采样模型对验证数据集进行子任务划分和重采样,得到验证重采样数据集;
S403、通过目标多端融合时序预测模型对验证重采样数据集进行预测,得到第三预测结果;
S404、根据第三预测结果生成模型性能评价指标,并根据模型性能评价指标输出双层迭代优化的时域信息自适应模型。
具体的,服务器历史流式数据生成验证数据集:从历史流式数据中选择一部分作为验证数据集。这些数据应该是与训练数据集独立且不重叠的样本,以评估模型在未见过的数据上的性能。验证数据集应包含特征数据和对应的标签数据。目标时域信息自适应重采样模型的子任务划分和重采样:使用目标时域信息自适应重采样模型对验证数据集进行子任务划分。将验证数据集中的样本划分为多个子任务,每个子任务包含一组相关的时间序列数据。子任务划分的方式根据具体问题进行设计,根据时间窗口、数据相关性等因素进行划分。子任务重采样:对每个子任务进行重采样操作。重采样可以包括对样本进行增加、删除、插值等操作,以改变子任务的数据分布或样本数量。目标多端融合时序预测模型的预测:将重采样后的验证数据集输入目标多端融合时序预测模型进行预测。模型会根据输入的时间序列数据预测未来的股票价格或其他目标值。第三预测结果和模型性能评价指标:根据目标多端融合时序预测模型的预测结果,得到第三预测结果。使用预定义的模型性能评价指标(如均方误差、准确率等)来评估模型在验证数据集上的性能。模型性能评价指标可以帮助判断模型的预测准确度和泛化能力。输出双层迭代优化的时域信息自适应模型:根据模型性能评价指标,可以进行模型选择、调参或进一步的模型优化。输出双层迭代优化的时域信息自适应模型,该模型经过多次迭代优化以在训练和验证数据上达到较好的性能。例如:假设服务器使用目标时域信息自适应重采样模型和目标多端融合时序预测模型进行股票预测。以下是具体步骤:历史流式数据生成验证数据集:从历史流式数据中选择最近一段时间的数据作为验证数据集,例如最近一个月的股票数据。目标时域信息自适应重采样模型的子任务划分和重采样:使用目标时域信息自适应重采样模型对验证数据集进行子任务划分,将验证数据集划分为多个子任务,每个子任务包含一组相关的时间序列数据。子任务重采样:对每个子任务进行重采样操作,例如通过增加或删除样本数据来改变子任务的数据分布或样本数量。目标多端融合时序预测模型的预测:将重采样后的验证数据集输入目标多端融合时序预测模型进行预测,得到预测结果。第三预测结果和模型性能评价指标:根据预测结果和真实标签数据计算模型性能评价指标,例如计算均方误差(MSE)来衡量模型的预测准确度。输出双层迭代优化的时域信息自适应模型:根据模型性能评价指标,进行模型选择、调参或进一步的模型优化。输出经过双层迭代优化的时域信息自适应模型,该模型已经在训练和验证数据上获得了较好的性能,可以用于进一步的股票预测任务。
在一具体实施例中,执行步骤S106的过程可以具体包括如下步骤:
(1)获取待处理的第二流式数据;
(2)将第二流式数据输入双层迭代优化的时域信息自适应模型进行子任务划分以及重采样,得到目标重采样数据集;
(3)通过双层迭代优化的时域信息自适应模型对目标重采样数据集进行股价预测,得到目标股价预测结果。
具体的,获取待处理的第二流式数据:第二流式数据是指即时或实时产生的股票数据,例如股票价格、交易量等信息。这些数据可以通过股票交易所的API、财经数据提供商或其他数据源获取。将第二流式数据输入双层迭代优化的时域信息自适应模型进行子任务划分和重采样:将获取的第二流式数据输入双层迭代优化的时域信息自适应模型中。使用时域信息自适应模型对第二流式数据进行子任务划分,将数据划分为多个子任务,每个子任务包含一组相关的时间序列数据。对每个子任务进行重采样操作,可以通过增加或删除样本数据来改变子任务的数据分布或样本数量。通过双层迭代优化的时域信息自适应模型对目标重采样数据集进行股价预测:将经过重采样的目标数据集输入双层迭代优化的时域信息自适应模型中。模型会根据输入的时间序列数据预测未来的股票价格或其他目标值。预测结果可以是单个时间点的预测值或一段时间内的序列预测值,取决于具体的模型设计和需求。得到目标股价预测结果:根据双层迭代优化的时域信息自适应模型的预测结果,得到目标股价预测结果。这些结果可以是对未来股价的预测值,可以用于制定投资策略、风险管理等决策。例如:假设服务器使用双层迭代优化的时域信息自适应模型进行股价预测。以下是具体步骤:获取待处理的第二流式数据:从股票交易所的API获取最新的股票价格和交易量等数据。将第二流式数据输入双层迭代优化的时域信息自适应模型进行子任务划分和重采样:将获取的第二流式数据输入时域信息自适应模型中。使用模型对数据进行子任务划分,例如按时间窗口划分数据。对每个子任务进行重采样操作,例如增加或删除样本数据。通过双层迭代优化的时域信息自适应模型对目标重采样数据集进行股价预测:将重采样后的目标数据集输入双层迭代优化的时域信息自适应模型中。模型会根据输入的时间序列数据预测未来的股票价格。得到目标股价预测结果:根据模型的预测结果,得到目标股价预测结果。例如,模型可以预测未来一周内的每天股票的收盘价。
上面对本发明实施例中基于多端时序模型的时域自适应股价预测方法进行了描述,下面对本发明实施例中基于多端时序模型的时域自适应股价预测装置进行描述,请参阅图5,本发明实施例中基于多端时序模型的时域自适应股价预测装置一个实施例包括:
初始化模块501,用于对原始时域信息自适应重采样模型以及原始多端融合时序预测模型进行初始化,得到初始化时域信息自适应重采样模型以及初始化多端融合时序预测模型;
更新模块502,用于固定所述初始化多端融合时序预测模型的第一模型参数,并通过第一流式数据对所述初始化时域信息自适应重采样模型进行模型参数更新,得到目标时域信息自适应重采样模型;
重采样模块503,用于通过所述目标时域信息自适应重采样模型对所述第一流式数据进行子任务划分和重采样,得到训练重采样数据集;
优化模块504,用于固定所述目标时域信息自适应重采样模型的第二模型参数,并通过所述训练重采样数据集和预置损失函数对所述初始化多端融合时序预测模型进行模型优化,得到目标多端融合时序预测模型;
验证模块505,用于对所述目标时域信息自适应重采样模型和所述目标多端融合时序预测模型进行多轮双层迭代以及模型验证,输出双层迭代优化的时域信息自适应模型;
预测模块506,用于获取待处理的第二流式数据,并通过所述双层迭代优化的时域信息自适应模型对所述第二流式数据进行股价预测,得到目标股价预测结果。
通过上述各个组成部分的协同合作,通过固定初始化多端融合时序预测模型的第一模型参数并对初始化时域信息自适应重采样模型进行模型参数更新,得到目标时域信息自适应重采样模型;固定目标时域信息自适应重采样模型的第二模型参数并对初始化多端融合时序预测模型进行模型优化,得到目标多端融合时序预测模型;进行多轮双层迭代以及模型验证,输出双层迭代优化的时域信息自适应模型;获取待处理的第二流式数据,并通过双层迭代优化的时域信息自适应模型对第二流式数据进行股价预测,得到目标股价预测结果,本发明基于双阶段迭代优化的时域信息自适应模型,提出了符合股票数据场景逻辑的时域信息自适应模型与数据重采样模型,能够有效针对股票数据中的非平稳数据进行建模,数据重采样模型是可学习的,这个可以保证模型在概念漂移的过程中保证参数有效性,提出了多端融合时序预测模型,能够针对不同行业板块,不同股票池进行数据建模,保证了模型在预测任务上的泛化性。
上面图5从模块化功能实体的角度对本发明实施例中的基于多端时序模型的时域自适应股价预测装置进行详细描述,下面从硬件处理的角度对本发明实施例中基于多端时序模型的时域自适应股价预测设备进行详细描述。
图6是本发明实施例提供的一种基于多端时序模型的时域自适应股价预测设备的结构示意图,该基于多端时序模型的时域自适应股价预测设备600可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器(central processing units,CPU)610(例如,一个或一个以上处理器)和存储器620,一个或一个以上存储应用程序633或数据632的存储介质630(例如一个或一个以上海量存储设备)。其中,存储器620和存储介质630可以是短暂存储或持久存储。存储在存储介质630的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对基于多端时序模型的时域自适应股价预测设备600中的一系列指令操作。更进一步地,处理器610可以设置为与存储介质630通信,在基于多端时序模型的时域自适应股价预测设备600上执行存储介质630中的一系列指令操作。
基于多端时序模型的时域自适应股价预测设备600还可以包括一个或一个以上电源640,一个或一个以上有线或无线网络接口650,一个或一个以上输入输出接口660,和/或,一个或一个以上操作系统631,例如Windows Serve,Mac OS X,Unix,Linux,FreeBSD等等。本领域技术人员可以理解,图6示出的基于多端时序模型的时域自适应股价预测设备结构并不构成对基于多端时序模型的时域自适应股价预测设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
本发明还提供一种基于多端时序模型的时域自适应股价预测设备,所述基于多端时序模型的时域自适应股价预测设备包括存储器和处理器,存储器中存储有计算机可读指令,计算机可读指令被处理器执行时,使得处理器执行上述各实施例中的所述基于多端时序模型的时域自适应股价预测方法的步骤。
本发明还提供一种计算机可读存储介质,该计算机可读存储介质可以为非易失性计算机可读存储介质,该计算机可读存储介质也可以为易失性计算机可读存储介质,所述计算机可读存储介质中存储有指令,当所述指令在计算机上运行时,使得计算机执行所述基于多端时序模型的时域自适应股价预测方法的步骤。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(read-only memory,ROM)、随机存取存储器(random acceS memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (10)

1.一种基于多端时序模型的时域自适应股价预测方法,其特征在于,所述基于多端时序模型的时域自适应股价预测方法包括:
对原始时域信息自适应重采样模型以及原始多端融合时序预测模型进行初始化,得到初始化时域信息自适应重采样模型以及初始化多端融合时序预测模型;
固定所述初始化多端融合时序预测模型的第一模型参数,并通过第一流式数据对所述初始化时域信息自适应重采样模型进行模型参数更新,得到目标时域信息自适应重采样模型;
通过所述目标时域信息自适应重采样模型对所述第一流式数据进行子任务划分和重采样,得到训练重采样数据集;
固定所述目标时域信息自适应重采样模型的第二模型参数,并通过所述训练重采样数据集和预置损失函数对所述初始化多端融合时序预测模型进行模型优化,得到目标多端融合时序预测模型;
对所述目标时域信息自适应重采样模型和所述目标多端融合时序预测模型进行多轮双层迭代以及模型验证,输出双层迭代优化的时域信息自适应模型;
获取待处理的第二流式数据,并通过所述双层迭代优化的时域信息自适应模型对所述第二流式数据进行股价预测,得到目标股价预测结果。
2.根据权利要求1所述的基于多端时序模型的时域自适应股价预测方法,其特征在于,所述对原始时域信息自适应重采样模型以及原始多端融合时序预测模型进行初始化,得到初始化时域信息自适应重采样模型以及初始化多端融合时序预测模型,包括:
构建原始时域信息自适应重采样模型,其中,所述原始时域信息自适应重采样模型包括:输入层、线性网络层以及优化层;
初始化所述原始时域信息自适应重采样模型的第一权重参数和第一偏置参数并设定所述原始时域信息自适应重采样模型的第一超参数,得到初始化时域信息自适应重采样模型;
构建原始多端融合时序预测模型,其中,所述原始多端融合时序预测模型包括:对应不同行业板块股票池的多个时序表征模块、基于关联信息的图神经网络建模层以及预测层;
对所述原始多端融合时序预测模型中的对应不同行业板块股票池的多个时序表征模块进行随机初始化,得到第二权重参数和第二偏置参数并设置每个时序模块的结构和第二超参数,得到初始化多端融合时序预测模型。
3.根据权利要求2所述的基于多端时序模型的时域自适应股价预测方法,其特征在于,所述固定所述初始化多端融合时序预测模型的第一模型参数,并通过第一流式数据对所述初始化时域信息自适应重采样模型进行模型参数更新,得到目标时域信息自适应重采样模型,包括:
获取股票特征数据X={x1,x2,...,xT}以及股票标签数据y={y1,y2,...,yT},其中,xi为m维的实值向量,表示股票对应的第i天的多维特征,y表示标签;
将所述股票特征数据和所述股票标签数据作为历史流式数据,并根据所述历史流式数据生成第一流式数据;
将所述第一流式数据输入所述初始化多端融合时序预测模型进行预测,得到第一预测结果,并根据所述第一预测结果计算对应的第一损失函数值;
根据所述第一损失函数值的梯度信息并通过梯度下降优化算法对所述初始化时域信息自适应重采样模型进行模型参数更新,同时,固定所述初始化多端融合时序预测模型的第一模型参数不变,只更新所述初始化时域信息自适应重采样模型的模型参数,其中,所述第一模型参数包括:第一权重参数、第一偏置参数以及第一超参数;
对所述初始化时域信息自适应重采样模型进行迭代训练,得到目标时域信息自适应重采样模型。
4.根据权利要求1所述的基于多端时序模型的时域自适应股价预测方法,其特征在于,所述通过所述目标时域信息自适应重采样模型对所述第一流式数据进行子任务划分和重采样,得到训练重采样数据集,包括:
通过所述目标时域信息自适应重采样模型对所述第一流式数据进行子任务划分,得到多个子任务;
对所述多个子任务进行重采样操作,生成每个子任务对应的重采样数据;
根据每个子任务对应的重采样数据生成训练重采样数据集。
5.根据权利要求1所述的基于多端时序模型的时域自适应股价预测方法,其特征在于,所述固定所述目标时域信息自适应重采样模型的第二模型参数,并通过所述训练重采样数据集和预置损失函数对所述初始化多端融合时序预测模型进行模型优化,得到目标多端融合时序预测模型,包括:
将所述训练重采样数据集输入所述初始化多端融合时序预测模型进行预测,得到第二预测结果;
通过预置的MSE损失函数对所述第二预测结果进行计算,得到第二损失函数值;
固定所述目标时域信息自适应重采样模型的第二模型参数,根据所述第二损失函数值对所述初始化多端融合时序预测模型进行模型优化,得到目标多端融合时序预测模型。
6.根据权利要求3所述的基于多端时序模型的时域自适应股价预测方法,其特征在于,所述对所述目标时域信息自适应重采样模型和所述目标多端融合时序预测模型进行多轮双层迭代以及模型验证,输出双层迭代优化的时域信息自适应模型,包括:
根据所述历史流式数据生成验证数据集;
通过所述目标时域信息自适应重采样模型对所述验证数据集进行子任务划分和重采样,得到验证重采样数据集;
通过所述目标多端融合时序预测模型对所述验证重采样数据集进行预测,得到第三预测结果;
根据所述第三预测结果生成模型性能评价指标,并根据所述模型性能评价指标输出双层迭代优化的时域信息自适应模型。
7.根据权利要求1所述的基于多端时序模型的时域自适应股价预测方法,其特征在于,所述获取待处理的第二流式数据,并通过所述双层迭代优化的时域信息自适应模型对所述第二流式数据进行股价预测,得到目标股价预测结果,包括:
获取待处理的第二流式数据;
将所述第二流式数据输入所述双层迭代优化的时域信息自适应模型进行子任务划分以及重采样,得到目标重采样数据集;
通过所述双层迭代优化的时域信息自适应模型对所述目标重采样数据集进行股价预测,得到目标股价预测结果。
8.一种基于多端时序模型的时域自适应股价预测装置,其特征在于,所述基于多端时序模型的时域自适应股价预测装置包括:
初始化模块,用于对原始时域信息自适应重采样模型以及原始多端融合时序预测模型进行初始化,得到初始化时域信息自适应重采样模型以及初始化多端融合时序预测模型;
更新模块,用于固定所述初始化多端融合时序预测模型的第一模型参数,并通过第一流式数据对所述初始化时域信息自适应重采样模型进行模型参数更新,得到目标时域信息自适应重采样模型;
重采样模块,用于通过所述目标时域信息自适应重采样模型对所述第一流式数据进行子任务划分和重采样,得到训练重采样数据集;
优化模块,用于固定所述目标时域信息自适应重采样模型的第二模型参数,并通过所述训练重采样数据集和预置损失函数对所述初始化多端融合时序预测模型进行模型优化,得到目标多端融合时序预测模型;
验证模块,用于对所述目标时域信息自适应重采样模型和所述目标多端融合时序预测模型进行多轮双层迭代以及模型验证,输出双层迭代优化的时域信息自适应模型;
预测模块,用于获取待处理的第二流式数据,并通过所述双层迭代优化的时域信息自适应模型对所述第二流式数据进行股价预测,得到目标股价预测结果。
9.一种基于多端时序模型的时域自适应股价预测设备,其特征在于,所述基于多端时序模型的时域自适应股价预测设备包括:存储器和至少一个处理器,所述存储器中存储有指令;
所述至少一个处理器调用所述存储器中的所述指令,以使得所述基于多端时序模型的时域自适应股价预测设备执行如权利要求1-7中任一项所述的基于多端时序模型的时域自适应股价预测方法。
10.一种计算机可读存储介质,所述计算机可读存储介质上存储有指令,其特征在于,所述指令被处理器执行时实现如权利要求1-7中任一项所述的基于多端时序模型的时域自适应股价预测方法。
CN202310881833.2A 2023-07-18 2023-07-18 基于多端时序模型的时域自适应股价预测方法及装置 Pending CN117252691A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310881833.2A CN117252691A (zh) 2023-07-18 2023-07-18 基于多端时序模型的时域自适应股价预测方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310881833.2A CN117252691A (zh) 2023-07-18 2023-07-18 基于多端时序模型的时域自适应股价预测方法及装置

Publications (1)

Publication Number Publication Date
CN117252691A true CN117252691A (zh) 2023-12-19

Family

ID=89130192

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310881833.2A Pending CN117252691A (zh) 2023-07-18 2023-07-18 基于多端时序模型的时域自适应股价预测方法及装置

Country Status (1)

Country Link
CN (1) CN117252691A (zh)

Similar Documents

Publication Publication Date Title
Psaros et al. Meta-learning PINN loss functions
EP3504666B1 (en) Asychronous training of machine learning model
US10755199B2 (en) Introspection network for training neural networks
US11593611B2 (en) Neural network cooperation
US20190138887A1 (en) Systems, methods, and media for gated recurrent neural networks with reduced parameter gating signals and/or memory-cell units
Letarte et al. Dichotomize and generalize: PAC-Bayesian binary activated deep neural networks
CN108170529A (zh) 一种基于长短期记忆网络的云数据中心负载预测方法
Chen et al. Variants of non-negative least-mean-square algorithm and convergence analysis
CN111950810A (zh) 一种基于自演化预训练的多变量时间序列预测方法和设备
CN113302605A (zh) 鲁棒且数据效率的黑盒优化
Janka et al. An SR1/BFGS SQP algorithm for nonconvex nonlinear programs with block-diagonal Hessian matrix
JP7267966B2 (ja) 情報処理装置及び情報処理方法
Zucchet et al. Beyond backpropagation: bilevel optimization through implicit differentiation and equilibrium propagation
JP2009110341A (ja) 時間情報を用いた予測装置、予測方法、予測プログラムおよびそのプログラムを記録した記録媒体
JP7497516B2 (ja) 等式制約を代数モデルに課すための射影方法
US20210103795A1 (en) Intelligent selection of time series models
EP4009239A1 (en) Method and apparatus with neural architecture search based on hardware performance
US20230059708A1 (en) Generation of Optimized Hyperparameter Values for Application to Machine Learning Tasks
WO2021181107A1 (en) Optimised approximation architectures and forecasting systems
Jadli et al. A Novel LSTM-GRU-Based Hybrid Approach for Electrical Products Demand Forecasting.
CN117252691A (zh) 基于多端时序模型的时域自适应股价预测方法及装置
Krityakierne et al. Global optimization with sparse and local Gaussian process models
Reiz et al. Neural nets with a newton conjugate gradient method on multiple GPUs
Kocijan et al. System identification with GP models
Nastac An adaptive retraining technique to predict the critical process variables

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination