CN106056244A - 一种股票价格优化预测方法 - Google Patents
一种股票价格优化预测方法 Download PDFInfo
- Publication number
- CN106056244A CN106056244A CN201610368834.7A CN201610368834A CN106056244A CN 106056244 A CN106056244 A CN 106056244A CN 201610368834 A CN201610368834 A CN 201610368834A CN 106056244 A CN106056244 A CN 106056244A
- Authority
- CN
- China
- Prior art keywords
- stock
- support vector
- vector regression
- parameter
- stock price
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/04—Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Theoretical Computer Science (AREA)
- Finance (AREA)
- Human Resources & Organizations (AREA)
- Accounting & Taxation (AREA)
- Marketing (AREA)
- Development Economics (AREA)
- General Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- Tourism & Hospitality (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Technology Law (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及一种股票价格优化预测方法。其特征在于,采用泛化能力较强,且不容易陷入局部最优和过拟合现象的支持向量回归机模型作为股票价格预测的核心部分,克服人工神经网络算法的缺点;引入流形学习中的线性局部切空间排列算法,将股票原始数据看作嵌入在高维欧式空间中的低维流形,提取股票数据中的非线性子流形结构,使得提取的特征更加具有区分度和代表性,并同时降低股票数据噪声;最后再利用遗传算法优化支持向量回归机的训练参数,解决了单一支持向量回归机模型参数选择困难的问题,最终提高股价的预测精度。
Description
技术领域
本发明属于金融数据分析处理领域,尤其涉及一种采用流形学习和支持向量回归机的股票价格优化预测方法。
背景技术
股票市场受到多方面因素的影响,导致股票价格变化多端,也正是因为这种变化,使得投资者能够通过买卖股票赚得差价收益。然而,若没有敏锐的市场直觉和丰富的金融知识是不能立足于股票交易市场并从中获利的。因此为了更加准确地识别股市动荡的规律,预测股价走势从而尽可能降低亏损的风险,前人总结了很多股票价格预测的经验和方法,大致可以分为三大类:人工经验预测法、时间序列预测法和机器学习预测法。
1)人工经验预测法
也称证券投资分析法,是一种依靠人力分析各种影响因素,从而对股票未来价格或趋势做出判断的方法。包括基本面分析和技术分析两个大的类型。基本面分析从影响股票价格的外部因素入手,如分析国家经济形势、金融政策的变化、上市公司的经营情况、内部稳定性等,通过分析这些外部影响因素,定性地判断未来股票价格的涨幅趋势或价格高低定位等,该方法一般为大型基金和机构所采用。技术分析则是利用各种图表、指标和分析工具来归纳分析市场的变化,依靠统计和归纳发现股价的波动规律,将发现的周期性规律用来指导股票交易的一种方法,也是广大股民最常用的一种方法。人工经验预测法主要依靠人力手工进行各种分析预测,在这个数据量暴增的时代,人工的方法显然耗时耗力,且人的情绪容易波动,从而直接影响到对趋势的判断造成亏损。
2)时间序列预测法
时间序列分析方法的应用对象包括所有随着时间推移变化的变量,其基本思想是依据时间序列变量与时间之间的相关性,利用统计模型对历史的时间序列对象建立数学模型,以此预测未来值。然而时间序列分析法虽然在对线性系统的处理上具有较好效果,但股票价格具有非线性的特征,不适合用时间序列分析法进行建模预测。
3)机器学习预测法
机器学习预测法是利用机器学习的算法对影响股票价格波动的各种因素和指标,与股票价格之间的非线性关系建模,将学习到的关键模式用于指导对未来股票价格的预测。机器学习预测法对人工操作的要求不高,只需要机器自动地进行学习即可预测,提高了效率且避免了人的情绪和失误所造成的损失。
发明内容
我们采用泛化能力较强,且不容易陷入局部最优和过拟合现象的支持向量回归机(SVR)模型作为股票价格预测的核心部分,克服人工神经网络算法的缺点;引入流形学习中的线性局部切空间排列算法(LLTSA),将股票原始数据看作嵌入在高维欧式空间中的低维流形,提取股票数据中的非线性子流形结构,使得提取的特征更加具有区分度和代表性,并同时降低股票数据噪声;最后再利用遗传算法(GA)优化SVR的训练参数,解决了单一SVR模型参数选择困难的问题,最终提高股价的预测精度。
选取基于结构风险最小化原则的支持向量回归机作为预测模型,具有很好的泛化能力且不容易陷入局部极小,并利用遗传算法对其核参数、惩罚因子和不敏感系数进行寻优操作,解决了人工查找参数困难的问题。将线性局部切空间排列算法与经过遗传算法优化的支持向量回归机模型组合,提出了一个新的股票价格优化预测模型,即LLTSA-GA-SVR模型。
附图说明
图1. LLTSA-GA-SVR模型预测流程
图2. LLTSA特征提取过程
具体实施方式
我们提出的LLTSA-GA-SVR模型如图1所示,预测股价的流程如下:
1)数据预处理
收集股票数据后,首先需对股票数据进行预处理,将其转换为适合模型处理的形式。比如根据模型的预测形式,将原始股票数据转化为数据样本集,并划分训练集和测试集;以及对股票数据进行归一化处理,消除量纲差异。
2)LLTSA特征提取
对原始股票数据进行预处理后,利用LLTSA算法提取数据样本集的特征,进行降维和降噪的操作,其处理过程如图2所示。LLTSA算法首先对输入的数据样本集进行PCA投影操作,即将原始数据样本集映射到PCA的主子空间,预先降低数据噪声和维度,使得后续的处理更加高效和方便。然后对样本集中所有的数据点求其邻域,通过线性逼近数据点及其邻域对应的切空间,将数据样本点投影到切空间上,得到局部坐标。通过将所有局部坐标进行全局排列,整合局部信息,构造全局排列矩阵。最后将目标函数转换为特征值的求解,求得能够将高维原始数据样本集映射到低维样本集的转换矩阵,根据该转换矩阵得到降维去噪后的低维特征集。
3)生成初始种群
本文选定二进制编码方案对三个参数进行编码,具体做法为将每个参数转化为20位二进制数然后再拼接起来,形成一个候选解。该候选解由三个参数的编码组合即60位二进制数组成。经过编码的个体称为一条染色体。
4)训练SVR评估个体适应度
将种群中的每个个体重新拆分为三个参数的二进制序列并分别转化为十进制数,则总共得到20组、和的值。将SVR模型的参数设为其中一组参数值,并对划分的训练样本集进行建模训练,得到预测值与真实值计算MSE,以此评估这组参数对应个体的适应度大小。对种群中20组参数候选值都进行同样的适应度评估,最后将个体按适应度大小排序。
5)选择、交叉和突变遗传形成新的种群
对上一步形成的种群按设定的选择概率、交叉概率和突变概率进行选择、交叉和突变三种遗传操作。进行选择操作时按一定的选择概率淘汰种群中不满足适应度要求的个体。进行交叉操作时根据一定的模式和概率对选中的个体进行其部分基因序列交换从而产生新的个体延续至下一代,两个被选择进行交叉遗传操作的个体C1和C2,C1的高位第12位开始的序列“111”与C2的低三位“000”发生交换,产生如图所示的下一代个体C1’和C2’。
进行突变操作时按突变概率选择种群中的个体改变其某个位置的基因符号,得到下一代的个体,其中个体C1的高位第12位的“1”发生变异,变为“0”,形成新的下一代个体C1’。
6)判断迭代条件
对新生成的种群用步骤4)判断其中包含个体的适应度大小,若有个体的适应度满足设定最优值或总体迭代次数达到上限,则停止迭代,适应度最优个体即为所求;若不满足以上两个条件,则转至步骤4)循环执行直到满足停止条件为止。当迭代停止后,就可以得到最优的个体,至此遗传算法对三个参数的优化完成。
7)组成最优SVR模型
将遗传算法处理得到的最优个体分解为三个参数对应的二进制序列再进行十进制转换,即可得到的最优的参数C、σ和ε的值,将SVR模型的参数设置为这三个最优值,即可得到经过遗传算法优化的SVR模型。
8)预测股票价格
将步骤2)得到的经过LLTSA算法提取特征之后的特征样本集输入到遗传算法优化的SVR模型中,利用其中训练集训练模型,再将训练好的模型在测试集上进行检验,得出股票收盘价的预测值。
Claims (1)
1.一种股票价格优化预测方法,其特征在于,包括以下关键步骤:
1)线性局部切空间排列算法特征提取
对原始股票数据进行预处理后,利用线性局部切空间排列提取数据样本集的特征,进行降维和降噪的操作;求得能够将高维原始数据样本集映射到低维样本集的转换矩阵,根据该转换矩阵得到降维去噪后的低维特征集;
2)支持向量回归机参数优化
具体又包括:
a.生成初始种群
将每个参数转化为20位二进制数然后再拼接起来,形成一个候选解;
b.训练支持向量回归机评估个体适应度
对划分的训练样本集进行建模训练,得到预测值与真实值计算MSE,以此评估这组参数对应个体的适应度大小。对种群中20组参数候选值都进行同样的适应度评估,最后将个体按适应度大小排序;
c.选择、交叉和突变遗传形成新的种群
按设定的选择概率、交叉概率和突变概率进行选择、交叉和突变三种遗传操作;
d.判断迭代条件
对新生成的种群判断其中包含个体的适应度大小,若有个体的适应度满足设定最优值或总体迭代次数达到上限,则停止迭代,适应度最优个体即为所求;若不满足以上两个条件,则循环执行直到满足停止条件为止;当迭代停止后,就可以得到最优的个体;
3)组成最优支持向量回归机模型
将遗传算法处理得到的最优个体分解为三个参数对应的二进制序列再进行十进制转换,即可得到的最优的参数C、σ和ε的值,将支持向量回归机的参数设置为这三个最优值,即可得到经过遗传算法优化的支持向量回归机模型;
4)预测股票价格
将前述步骤得到的经过线性局部切空间排列算法提取特征之后的特征样本集输入到遗传算法优化的支持向量回归机模型中,利用其中训练集训练模型,再将训练好的模型在测试集上进行检验,得出股票收盘价的预测值。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610368834.7A CN106056244A (zh) | 2016-05-30 | 2016-05-30 | 一种股票价格优化预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610368834.7A CN106056244A (zh) | 2016-05-30 | 2016-05-30 | 一种股票价格优化预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106056244A true CN106056244A (zh) | 2016-10-26 |
Family
ID=57171313
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610368834.7A Pending CN106056244A (zh) | 2016-05-30 | 2016-05-30 | 一种股票价格优化预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106056244A (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108399434A (zh) * | 2018-03-20 | 2018-08-14 | 东北大学 | 基于特征提取的高维时间序列数据的分析预测方法 |
CN108876627A (zh) * | 2018-06-12 | 2018-11-23 | 恒生电子股份有限公司 | 量化分析模型处理方法及系统、存储介质及电子终端 |
CN109543716A (zh) * | 2018-10-23 | 2019-03-29 | 华南理工大学 | 一种基于深度学习的k线形态图像识别方法 |
WO2019119478A1 (zh) * | 2017-12-20 | 2019-06-27 | 东莞理工学院 | 一种基于遗传算法的汇率分析方法 |
CN110558960A (zh) * | 2019-09-10 | 2019-12-13 | 重庆大学 | 一种基于ptt和miv-ga-svr的连续血压无创监测方法 |
CN116486969A (zh) * | 2023-06-25 | 2023-07-25 | 广东工业大学 | 基于遗传算法的材料最优相关性关系获取方法及应用 |
-
2016
- 2016-05-30 CN CN201610368834.7A patent/CN106056244A/zh active Pending
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019119478A1 (zh) * | 2017-12-20 | 2019-06-27 | 东莞理工学院 | 一种基于遗传算法的汇率分析方法 |
CN108399434A (zh) * | 2018-03-20 | 2018-08-14 | 东北大学 | 基于特征提取的高维时间序列数据的分析预测方法 |
CN108399434B (zh) * | 2018-03-20 | 2022-02-18 | 东北大学 | 基于特征提取的高维时间序列数据的分析预测方法 |
CN108876627A (zh) * | 2018-06-12 | 2018-11-23 | 恒生电子股份有限公司 | 量化分析模型处理方法及系统、存储介质及电子终端 |
CN109543716A (zh) * | 2018-10-23 | 2019-03-29 | 华南理工大学 | 一种基于深度学习的k线形态图像识别方法 |
CN109543716B (zh) * | 2018-10-23 | 2021-12-21 | 华南理工大学 | 一种基于深度学习的k线形态图像识别方法 |
CN110558960A (zh) * | 2019-09-10 | 2019-12-13 | 重庆大学 | 一种基于ptt和miv-ga-svr的连续血压无创监测方法 |
CN116486969A (zh) * | 2023-06-25 | 2023-07-25 | 广东工业大学 | 基于遗传算法的材料最优相关性关系获取方法及应用 |
CN116486969B (zh) * | 2023-06-25 | 2023-09-26 | 广东工业大学 | 基于遗传算法的材料最优相关性关系获取方法及应用 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106056244A (zh) | 一种股票价格优化预测方法 | |
CN108459955B (zh) | 基于深度自编码网络的软件缺陷预测方法 | |
Yan et al. | Unsupervised and semi‐supervised learning: The next frontier in machine learning for plant systems biology | |
CN105740984A (zh) | 一种基于性能预测的产品概念性能评价方法 | |
CN110956309A (zh) | 基于crf和lstm的流程活动预测方法 | |
Wu et al. | Optimized deep learning framework for water distribution data-driven modeling | |
Li et al. | Chart GCN: Learning chart information with a graph convolutional network for stock movement prediction | |
CN116187835A (zh) | 一种基于数据驱动的台区理论线损区间估算方法及系统 | |
CN113920379B (zh) | 一种基于知识辅助的零样本图像分类方法 | |
Peng et al. | Attention-based CNN–LSTM for high-frequency multiple cryptocurrency trend prediction | |
Zeng | Credit risk evaluation in enterprise financial management by using convolutional neural network under the construction of smart city | |
CN117093849A (zh) | 一种基于自动生成模型的数字矩阵特征分析方法 | |
CN116703607A (zh) | 一种基于扩散模型的金融时间序列预测方法与系统 | |
CN105678430A (zh) | 基于邻近项目Slope One算法的用户改进推荐方法 | |
Yao et al. | Six-factor asset pricing and portfolio investment via deep learning: Evidence from Chinese stock market | |
Bailey et al. | Stock portfolio design and backtest overfitting | |
Prime | Forecasting the changes in daily stock prices in Shanghai stock exchange using neural network and ordinary Least Squares regression | |
Wen | Application of Clustering Algorithm in Corporate Strategy and Risk | |
CN113656707A (zh) | 一种理财产品推荐方法、系统、存储介质及设备 | |
Zhou et al. | A shale gas production prediction model based on masked convolutional neural network | |
Grądzki et al. | Is attention all you need for intraday Forex trading? | |
CN114330485A (zh) | 基于pls-svm-ga算法的电网投资能力预测方法 | |
Ma et al. | Dynamic graph construction via motif detection for stock prediction | |
Xin | [Retracted] Application of Optimized Support Vector Machine Model in Tax Forecasting System | |
Huang et al. | An enhanced approach to optimizing the stock portfolio selection based on Modified Markowitz MV Method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20161026 |
|
WD01 | Invention patent application deemed withdrawn after publication |