CN109858938A - 基于随机森林预测期货价格趋势的方法 - Google Patents

基于随机森林预测期货价格趋势的方法 Download PDF

Info

Publication number
CN109858938A
CN109858938A CN201810465281.6A CN201810465281A CN109858938A CN 109858938 A CN109858938 A CN 109858938A CN 201810465281 A CN201810465281 A CN 201810465281A CN 109858938 A CN109858938 A CN 109858938A
Authority
CN
China
Prior art keywords
random forest
price trend
prediction
data
forward price
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810465281.6A
Other languages
English (en)
Inventor
杨炜祖
李从恺
顾军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Yuanlu Jiajia Information Technology Co Ltd
Original Assignee
Shanghai Yuanlu Jiajia Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Yuanlu Jiajia Information Technology Co Ltd filed Critical Shanghai Yuanlu Jiajia Information Technology Co Ltd
Priority to CN201810465281.6A priority Critical patent/CN109858938A/zh
Publication of CN109858938A publication Critical patent/CN109858938A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于随机森林预测期货价格趋势的方法,包括以下步骤:获取期货商品历史交易数据;对获取的历史交易数据进行技术指标计算并对这些指标进行特征处理以获得训练数据;构建用于预测的价格走势的随机森林,同时结合获得的训练数据生成随机森林模型;获取当前的数据并计算技术指标,转化为特征后输入给随机森林模型,得出预测的结果;运用了机器学习中的随机森林,来从这大量的历史交易数据中,发现这种潜在的规律,从而预测期货价格趋势。

Description

基于随机森林预测期货价格趋势的方法
技术领域
本发明涉及计算机应用技术领域,尤其涉及一种基于随机森林预测期货价格趋势的方法。
背景技术
随着国内金融业的改革和深入发展。尤其是像股票,期货这种蕴含潜力和经济利益的金融产品为越来越多的人所关注。期货市场作为现货市场的重要组成部分,对现货市场的价格具有指导和发现功能,对期货市场的价格进行预测,不仅能够通过套期保值的方式规避风险,还能利用对期货价格的预测,进行投机套利活动,获取经济收益。但是对于大宗商品期货价格的走势,单单靠人自己的观察和推断,很难在大量期货历史交易数据中的发现其内在的规律。而机器学习算法诞生于20世纪末,是一种全新的智能分析技术和方法,具有非常广阔的应用和发展前景。自诞生以来,机器学习算法就受到了理论界和实务界的广泛关注,它指的是通过机器学习技术从大量数据中提取出隐含在其中的规律,通过对一系列训练集中的样本数据进行分析,生成一定的规则,并将这规则进行推广运用于测试及过程中。
发明内容
鉴于目前存在的上述不足,本发明提供一种基于随机森林预测期货价格趋势的方法,能够从大量的历史交易数据中,发现潜在的规律,并进行价格趋势预测。
为达到上述目的,本发明的实施例采用如下技术方案:
一种基于随机森林预测期货价格趋势的方法,所述基于随机森林预测期货价格趋势的方法包括以下步骤:
获取期货商品历史交易数据;
对获取的历史交易数据进行技术指标计算并对这些指标进行特征处理以获得训练数据;
构建用于预测的价格走势的随机森林,同时结合获得的训练数据生成随机森林模型;
获取当前的数据并计算技术指标,转化为特征后输入给随机森林模型,得出预测的结果。
依照本发明的一个方面,所述对获取的历史交易数据进行技术指标计算并对这些指标进行特征处理以获得训练数据包括:对获取的历史交易数据进行技术指标计算,对这些指标进行离散化处理构建特征,搭建输入的数据特征格式,作为训练集。
依照本发明的一个方面,对获取到所有的特征按一定的规则进行离散化,以表征变化程度影响的不同。
依照本发明的一个方面,选择一定时间步长来构建样本特征。
依照本发明的一个方面,所述构建用于预测的价格走势的随机森林,同时结合获得的训练数据生成随机森林模型包括:随机森林由N(N为大于1的整数)棵决策树组成,每棵树都随机的从训练样本中随机抽取出数据进行训练,采用基尼纯度来选择合适的特征。
依照本发明的一个方面,采用含有N棵决策树的随机森林,使用基尼纯度来选择合适的属性节点,每棵树从训练集中随机抽取样本,且随机的抽取属性特征来生成各自的节点,直到每棵树把自己抽样出的样本分类完。
依照本发明的一个方面,所述N优选取值为10。
依照本发明的一个方面,所述基于随机森林预测期货价格趋势的方法包括:根据模型输出的预测结果给出相应的交易建议。
依照本发明的一个方面,所述根据模型输出的预测结果给出相应的交易建议包括:根据预测结果选择交易的方向,具体为做空或做多。
本发明实施的优点:本发明所述的基于随机森林预测期货价格趋势的方法,包括以下步骤:获取期货商品历史交易数据;对获取的历史交易数据进行技术指标计算并对这些指标进行特征处理以获得训练数据;构建用于预测的价格走势的随机森林,同时结合获得的训练数据生成随机森林模型;获取当前的数据并计算技术指标,转化为特征后输入给随机森林模型,得出预测的结果;运用了机器学习中的随机森林,来从这大量的历史交易数据中,发现这种潜在的规律,从而预测期货价格趋势。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明所述的基于随机森林预测期货价格趋势的方法示意图;
图2为本发明所述的随机森林结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例一
如图1和图2所示,一种基于随机森林预测期货价格趋势的方法,所述基于随机森林预测期货价格趋势的方法包括以下步骤:
步骤S1:获取期货商品历史交易数据;
在实际应用中,具体为:获取大宗商品期货历史的交易数据,开盘价,收盘价,最低价,最高价,成交量等。
步骤S2:对获取的历史交易数据进行技术指标计算并对这些指标进行特征处理以获得训练数据;
对步骤S1获取的大宗期货商品中ZN指数合约的历史交易数据:开盘价,收盘价,最高价,最低价,成交量。利用python中的talib包对获取的数据进行技术指标计算如SMA,WMA,MOM,MACD,RSI等11个技术指标。对获取到所有的特征按一定的规则进行离散化,表征变化程度影响的不同。最后按30天的时间步长来构建样本特征,其中这个样本特征对应的标签为第31天收盘价的较于前一天的涨跌。最后将获得到的数据集划分为训练集和测试集。
在实际应用中,所述对获取的历史交易数据进行技术指标计算并对这些指标进行特征处理以获得训练数据包括:对获取的历史交易数据进行技术指标计算,对这些指标进行离散化处理构建特征,搭建输入的数据特征格式,作为训练集。
在实际应用中,对获取到所有的特征按一定的规则进行离散化,以表征变化程度影响的不同。
在实际应用中,选择一定时间步长来构建样本特征。
步骤S3:构建用于预测的价格走势的随机森林,同时结合获得的训练数据生成随机森林模型;
所述构建用于预测的价格走势的随机森林,同时结合获得的训练数据生成随机森林模型包括:随机森林由N(N为大于1的整数)棵决策树组成,每棵树都随机的从训练样本中随机抽取出数据进行训练,采用基尼纯度来选择合适的特征,采用含有N棵决策树的随机森林,使用基尼纯度来选择合适的属性节点,每棵树从训练集中随机抽取样本,且随机的抽取属性特征来生成各自的节点,直到每棵树把自己抽样出的样本分类完。
在实际应用中,这里我们采用10棵树决策树来集合成一个随机森林。随机森林中每棵树都从训练集中又放回的抽取,且每次都随机选择一些特征来对这些抽出的样本数据进行划分。直到每棵树最终都把样本数据划分完。
步骤S4:获取当前的数据并计算技术指标,转化为特征后输入给随机森林模型,得出预测的结果。
获取当天的数据并计算技术指标,离散化后转化为特征输入给训练好的随机森林模型,得出预测的结果。
实施例二
如图1和图2所示,一种基于随机森林预测期货价格趋势的方法,所述基于随机森林预测期货价格趋势的方法包括以下步骤:
步骤S1:获取期货商品历史交易数据;
在实际应用中,具体为:获取大宗商品期货历史的交易数据,开盘价,收盘价,最低价,最高价,成交量等。
步骤S2:对获取的历史交易数据进行技术指标计算并对这些指标进行特征处理以获得训练数据;
对步骤S1获取的大宗期货商品中ZN指数合约的历史交易数据:开盘价,收盘价,最高价,最低价,成交量。利用python中的talib包对获取的数据进行技术指标计算如SMA,WMA,MOM,MACD,RSI等11个技术指标。对获取到所有的特征按一定的规则进行离散化,表征变化程度影响的不同。最后按30天的时间步长来构建样本特征,其中这个样本特征对应的标签为第31天收盘价的较于前一天的涨跌。最后将获得到的数据集划分为训练集和测试集。
在实际应用中,所述对获取的历史交易数据进行技术指标计算并对这些指标进行特征处理以获得训练数据包括:对获取的历史交易数据进行技术指标计算,对这些指标进行离散化处理构建特征,搭建输入的数据特征格式,作为训练集。
在实际应用中,对获取到所有的特征按一定的规则进行离散化,以表征变化程度影响的不同。
在实际应用中,选择一定时间步长来构建样本特征。
步骤S3:构建用于预测的价格走势的随机森林,同时结合获得的训练数据生成随机森林模型;
所述构建用于预测的价格走势的随机森林,同时结合获得的训练数据生成随机森林模型包括:随机森林由N(N为大于1的整数)棵决策树组成,每棵树都随机的从训练样本中随机抽取出数据进行训练,采用基尼纯度来选择合适的特征,采用含有N棵决策树的随机森林,使用基尼纯度来选择合适的属性节点,每棵树从训练集中随机抽取样本,且随机的抽取属性特征来生成各自的节点,直到每棵树把自己抽样出的样本分类完。
在实际应用中,这里我们采用10棵树决策树来集合成一个随机森林。随机森林中每棵树都从训练集中又放回的抽取,且每次都随机选择一些特征来对这些抽出的样本数据进行划分。直到每棵树最终都把样本数据划分完。
步骤S4:获取当前的数据并计算技术指标,转化为特征后输入给随机森林模型,得出预测的结果。
获取当天的数据并计算技术指标,离散化后转化为特征输入给训练好的随机森林模型,得出预测的结果。
步骤S5:根据模型输出的预测结果给出相应的交易建议。
所述根据模型输出的预测结果给出相应的交易建议包括:根据预测结果选择交易的方向,具体为做空或做多。
本发明实施的优点:本发明所述的基于随机森林预测期货价格趋势的方法,包括以下步骤:获取期货商品历史交易数据;对获取的历史交易数据进行技术指标计算并对这些指标进行特征处理以获得训练数据;构建用于预测的价格走势的随机森林,同时结合获得的训练数据生成随机森林模型;获取当前的数据并计算技术指标,转化为特征后输入给随机森林模型,得出预测的结果;运用了机器学习中的随机森林,来从这大量的历史交易数据中,发现这种潜在的规律,从而预测期货价格趋势。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本领域技术的技术人员在本发明公开的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。

Claims (9)

1.一种基于随机森林预测期货价格趋势的方法,其特征在于,所述基于随机森林预测期货价格趋势的方法包括以下步骤:
获取期货商品历史交易数据;
对获取的历史交易数据进行技术指标计算并对这些指标进行特征处理以获得训练数据;
构建用于预测的价格走势的随机森林,同时结合获得的训练数据生成随机森林模型;
获取当前的数据并计算技术指标,转化为特征后输入给随机森林模型,得出预测的结果。
2.根据权利要求1所述的基于随机森林预测期货价格趋势的方法,其特征在于,所述对获取的历史交易数据进行技术指标计算并对这些指标进行特征处理以获得训练数据包括:对获取的历史交易数据进行技术指标计算,对这些指标进行离散化处理构建特征,搭建输入的数据特征格式,作为训练集。
3.根据权利要求2所述的基于随机森林预测期货价格趋势的方法,其特征在于,对获取到所有的特征按一定的规则进行离散化,以表征变化程度影响的不同。
4.根据权利要求2所述的基于随机森林预测期货价格趋势的方法,其特征在于,选择一定时间步长来构建样本特征。
5.根据权利要求1所述的基于随机森林预测期货价格趋势的方法,其特征在于,所述构建用于预测的价格走势的随机森林,同时结合获得的训练数据生成随机森林模型包括:随机森林由N(N为大于1的整数)棵决策树组成,每棵树都随机的从训练样本中随机抽取出数据进行训练,采用基尼纯度来选择合适的特征。
6.根据权利要求5所述的基于随机森林预测期货价格趋势的方法,其特征在于,采用含有N棵决策树的随机森林,使用基尼纯度来选择合适的属性节点,每棵树从训练集中随机抽取样本,且随机的抽取属性特征来生成各自的节点,直到每棵树把自己抽样出的样本分类完。
7.根据权利要求6所述的基于随机森林预测期货价格趋势的方法,其特征在于,所述N取值为10。
8.根据权利要求1至7之一所述的基于随机森林预测期货价格趋势的方法,其特征在于,所述基于随机森林预测期货价格趋势的方法包括:根据模型输出的预测结果给出相应的交易建议。
9.根据权利要求8所述的基于随机森林预测期货价格趋势的方法,其特征在于,所述根据模型输出的预测结果给出相应的交易建议包括:根据预测结果选择交易的方向,具体为做空或做多。
CN201810465281.6A 2018-05-16 2018-05-16 基于随机森林预测期货价格趋势的方法 Pending CN109858938A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810465281.6A CN109858938A (zh) 2018-05-16 2018-05-16 基于随机森林预测期货价格趋势的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810465281.6A CN109858938A (zh) 2018-05-16 2018-05-16 基于随机森林预测期货价格趋势的方法

Publications (1)

Publication Number Publication Date
CN109858938A true CN109858938A (zh) 2019-06-07

Family

ID=66889658

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810465281.6A Pending CN109858938A (zh) 2018-05-16 2018-05-16 基于随机森林预测期货价格趋势的方法

Country Status (1)

Country Link
CN (1) CN109858938A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110288482A (zh) * 2019-07-02 2019-09-27 欧冶云商股份有限公司 钢厂期货交易方法及系统
CN110378532A (zh) * 2019-07-19 2019-10-25 中南大学 一种基于随机树的科研主题状态预测方法
CN113793086A (zh) * 2020-09-30 2021-12-14 北京沃东天骏信息技术有限公司 备货量确定方法及装置、计算机存储介质、电子设备
CN115450611A (zh) * 2022-09-16 2022-12-09 中国地质大学(北京) 一种基于随机森林的深层碳酸盐岩沉积微相分析方法

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110288482A (zh) * 2019-07-02 2019-09-27 欧冶云商股份有限公司 钢厂期货交易方法及系统
CN110288482B (zh) * 2019-07-02 2021-03-30 欧冶云商股份有限公司 钢厂期货交易方法及系统
CN110378532A (zh) * 2019-07-19 2019-10-25 中南大学 一种基于随机树的科研主题状态预测方法
CN110378532B (zh) * 2019-07-19 2021-12-14 中南大学 一种基于随机树的科研主题状态预测方法
CN113793086A (zh) * 2020-09-30 2021-12-14 北京沃东天骏信息技术有限公司 备货量确定方法及装置、计算机存储介质、电子设备
CN115450611A (zh) * 2022-09-16 2022-12-09 中国地质大学(北京) 一种基于随机森林的深层碳酸盐岩沉积微相分析方法

Similar Documents

Publication Publication Date Title
Hout et al. Intergenerational occupational mobility in Great Britain and the United States since 1850: comment
CN109858938A (zh) 基于随机森林预测期货价格趋势的方法
Peng Analysis of investor sentiment and stock market volatility trend based on big data strategy
Goumatianos et al. Stock selection system: building long/short portfolios using intraday patterns
Yang et al. The dynamic impacts of weather changes on vegetable price fluctuations in Shandong Province, China: an analysis based on VAR and TVP-VAR models
Deng et al. High-frequency direction forecasting of the futures market using a machine-learning-based method
CN103164631A (zh) 一种智能协同表达基因分析仪
Kostrzewski et al. The impact of forecasting jumps on forecasting electricity prices
Dutt et al. Novel mixed-encoding for forecasting patent grant duration
Stratigea et al. How to approach narratives in foresight studies: qualitative data analysis
Wang et al. MSGraph: Modeling multi-scale K-line sequences with graph attention network for profitable indices recommendation
Tonni et al. A machine learning based crop recommendation system and user-friendly android application for cultivation
Zhang et al. Multi-factor stock selection model based on kernel support vector machine
Xu et al. Evaluation and Determinants of the Digital Inclusive Financial Support Efficiency for Marine Carbon Sink Fisheries: Evidence from China
Tayal et al. AI Based Stock Market Prediction-Theoretical Perspective
Fang et al. Exploring Efficient Methods for Using Multiple Spectral Reflectance Indices to Establish a Prediction Model for Early Drought Stress Detection in Greenhouse Tomato
Alawad et al. Enhanced Graph Representation Convolution: Effective Inferring Gene Regulatory Network Using Graph Convolution Network with Self-Attention Graph Pooling Layer
Diday et al. The symbolic data analysis paradigm, discriminant discretization and financial application.
CN109934503A (zh) 一种互联网环境下的金融市场风险预警方法
Kammili A Study on Technical Analaysis of Indian FMCG Sector
Bendtsen Gated Bayesian networks
Chevallier et al. Understanding momentum in commodity markets
Christopher et al. Prediction of weather using high-performance gradient boosting
Ashouri et al. Emerging Trends Identification through Large Scale Data Analysis with Large Language Models
Saranya et al. Stock market prediction analysis using machine learning techniques

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20190607