CN116342286A - 一种基于arma-garch的金融交易预测模型 - Google Patents

一种基于arma-garch的金融交易预测模型 Download PDF

Info

Publication number
CN116342286A
CN116342286A CN202310380393.2A CN202310380393A CN116342286A CN 116342286 A CN116342286 A CN 116342286A CN 202310380393 A CN202310380393 A CN 202310380393A CN 116342286 A CN116342286 A CN 116342286A
Authority
CN
China
Prior art keywords
data
model
arma
garch
financial transaction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310380393.2A
Other languages
English (en)
Inventor
陈天健
黄江
何毅泉
林滋铠
梁启晨
黎耀煜
陈健浩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN202310380393.2A priority Critical patent/CN116342286A/zh
Publication of CN116342286A publication Critical patent/CN116342286A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/04Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/27Regression, e.g. linear or logistic regression
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/40Software arrangements specially adapted for pattern recognition, e.g. user interfaces or toolboxes therefor
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Mathematical Analysis (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Optimization (AREA)
  • Accounting & Taxation (AREA)
  • Computational Mathematics (AREA)
  • Finance (AREA)
  • Evolutionary Computation (AREA)
  • Probability & Statistics with Applications (AREA)
  • Human Computer Interaction (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Operations Research (AREA)
  • Development Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Algebra (AREA)
  • Technology Law (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于ARMA‑GARCH的金融交易预测模型,其构建步骤包括:数据获取,从数据集中通过滑动窗口及定期抽样的方式获取数据;数据预处理,将数据进行预处理,得到训练集与测试集;数据分析与模型构建,对训练集做基本统计分析并构建ARMA模型,进行ARCH效应检验,构建GARCH模型,将两者组合为ARMA‑GARCH模型;模型评估,利用评价指标评估模型;模型预测,基于给定交易数据,利用构建的模型,预测未来任一时间段或任一时刻的金融交易数据,采用可视化方式显示所预测的数据。通过构建基于ARMA‑GARCH建立的金融交易预测模型,分析不同时刻变量的相关关系,揭示其相关结构,并掌握规律将其延申到未来,能够提高模型预测精度,对未来交易数据做出更加精准的预测。

Description

一种基于ARMA-GARCH的金融交易预测模型
技术领域
本发明涉及技术预测领域,具体涉及一种基于ARMA-GARCH的金融交易预测模型。
背景技术
金融市场是国家经济生活的核心,寻找其中的变化规律,并进行有效合理的市场管理以及完善各种金融组织体系是各国政府及相关机构追求的主要目标。随着互联网行业及其附属产业的发展,信息技术逐渐占据主导地位,人们的投资意识开始转变,越来越多的投资者开始关注金融领域,如何对金融市场进行分析与预测,进而帮助投资者进行决策是当前的热点问题。在金融市场中,金融交易量是一项重要指标,一方面它能反映市场价格波动的过程,有利于发现价格形成的微观机制;另一方面,它也是交易系统策略开发、投资风险衡量与管理的重要依据,尤其是在高频交易的自动化交易系统中,风险失控带来的损失不可估量。因此,金融交易预测的研究具有极其重要的应用价值和理论意义。
金融交易数据是随时间而形成的一种随机变量,交易序列由这些交易数据构成。在一组交易序列中,每个的序列值都具有不同的特点,也具有不确定性,但序列值之间看似杂乱无章却有着一些不明显的内在联系,并且具有一定的变化规律可循,通过利用一些数学方法或是模型可刻画出数据之间的关系,并可以进一步掌握数据之间的规律以及特征。时间序列分析方法便是利用这种思路,通过对历史交易数据特征的分析与研究,揭示现象随时间变化的规律,并掌握规律将其延申到未来,从而对未来做出预测。
时间序列分析方法是通过分析不同时刻变量的相关关系,揭示其相关结构,是研究事物发展变化规律的一种量化分析方法。金融交易数据具有非线性、周期特性和不稳定性等特点,具有宏观效应,因此可以建立时间序列进行分析。早期的研究人员采用研究平稳序列的自回归移动平均模型(ARMA)进行拟合,效果并不好;而后自回归条件方差模型(ARCH)进入应用,其虽然能够较好地描述数据的波动过程,但其因参数量大在实际应用中存在诸多问题,无法较好地提供分析预测能力。随着广义自回归条件异方差模型(GARCH)的提出,其以灵活的滞后结构弥补ARCH的缺陷,具有很大优势,并广泛应用于金融领域。
发明内容
针对金融交易数据的复杂性和不确定性以及现有技术中的缺陷,本发明结合传统有效的时间序列分析方法中的自回归移动平均模型ARMA,与广义自回归异方差模型GARCH进行耦合,提出一种基于ARMA-GARCH的金融交易预测模型,其可以在特定的场景下构建金融交易预测模型,基于历史金融交易数据,更加准确地预测未来任一时间段或任意时刻的金融交易数据,提升用户体验。
本发明公开了一种基于ARMA-GARCH的金融交易预测模型,包含以下步骤:
步骤1:数据获取。从数据集中通过滑动窗口及定期抽样的方式获取样本数据。
步骤2:数据预处理。将步骤1获取的样本数据进行数据预处理,包括数据清洗、数据筛选、特征化、数据分类,得到训练样本集与测试样本集。
步骤3:数据分析与模型构建。基于步骤2得到的训练样本集,做基本统计分析并构建ARMA模型。在构建好的ARMA模型的基础上,进行ARCH效应检验,构建GARCH模型。将构建好的ARMA模型与GARCH模型组合为ARMA-GARCH模型。
步骤4:模型评估。通过相应评价指标评价模型的预测精度,检验所拟合模型的充分性。
步骤5:模型预测。基于给定的交易数据,利用所构建的金融交易预测模型,预测未来任一时间段或任一时刻的金融交易数据,同时采用可视化的方式显示所预测的金融交易数据。
进一步的,所述步骤1中,数据获取的具体方法包括:
步骤1.1、设置不同时间步长的滑动窗口。根据数据集的单位不同,可选取小时,天,周等时间单位进行时间步长的设置。
步骤1.2、利用步骤1.1所述的滑动窗口在给定数据集D上滑动获取多个窗口数据,通过窗口内定期抽样的方式获得对应时间步长的样本数据S。
进一步的,所述步骤2中,数据预处理的具体方法包括:
步骤2.1、将步骤1得到的样本数据S进行数据清洗,包括缺失值处理、异常值处理。具体来说,对于缺失值,视存在缺失值的数量大小,结合实际情况,采取聚类填充、热卡填充或直接删除的方法进行处理。对于异常值,视存在异常值的数量大小,结合实际情况,采取平均值修正或不处理的方法进行处理。最终得到处理后的样本数据Sp
步骤2.2、视样本数据大小,结合实际情况,将步骤2.1得到的样本数据Sp通过决策树或最优子集法进行数据筛选。具体来说,将样本数据Sp中的数据的参数通过决策树或最优子集法进行筛选,筛选出其中对交易成功贡献最大的n种目标参数,最终得到经筛选后的样本数据Se
步骤2.3、将步骤2.2得到的样本数据Se进行数据离散化处理,得到最终的样本集Sf,样本集包含n种目标参数对应的离散化后的特征。
步骤2.4、将最终的样本集Sf按比例划分为训练样本集St和测试样本集Sv。具体来说,采用比例8:2进行训练集与测试集的划分,即训练样本集占总样本集的80%,测试样本集占总样本集的20%。
进一步的,所述步骤3中,数据分析与模型构建的具体方法包括:
步骤3.1、基于步骤2得到的训练样本集St,通过Augmented Dickey Fuller(ADF)检验给定样本的时间序列是否平稳。若为非平稳的时间序列,则进行差分处理变成平稳的序列,再通过ADF进行平稳性检验。最终,得到平稳的时间序列训练样本集St
步骤3.2、基于步骤3.1得到的训练样本集St,进行基本统计分析。具体来说,进行自相关和偏自相关检验,绘制相应的偏自相关函数PACF图和自相关函数ACF图。
步骤3.3、基于步骤3.2的基本统计分析情况,构建ARMA模型,并对ARMA模型进行定阶。具体来说,结合步骤3.2中所分析的PACF与ACF的显著性以及模型的定阶准则赤池信息准则(AIC)、贝叶斯信息准则(BIC)确定ARMA模型中p和q的阶数。
ARMA模型的计算公式为:
Figure BDA0004171943330000041
其中,{εt}为白噪声序列,p和q均为非负整数。
赤池信息准则的计算公式:AIC=-2ln(L)+2k
贝叶斯信息准则的计算公式为:BIC=-2ln(L)+ln(n)*k
其中,L为该模型下的最大似然,n为数据数量,k为模型的变量个数。
步骤3.4、基于步骤3.3所构建的ARMA模型,进行ARCH效应检验,构建GARCH模型。具体来说,首先,基于步骤3.3所构建的ARMA模型对训练样本集St进行拟合后进行残差分析,对残差序列进行自相关和偏自相关性检验,判断在加入ARMA模型后其是否消除了自相关性。其次,对残差序列利用Ljung-Box统计量进行ARCH效应检验,判断其是否存在异方差性。
步骤3.5,基于步骤3.4中ARCH效应检验结果,构建GARCH模型,消除对应的ARCH效应。针对交易数据序列的特征,其一般不服从正态分布,因此选择学生t分布对GARCH模型进行设定。实际应用中GARCH模型阶数通常难以确定,可根据工程经验,选取低阶的GARCH(1,1)模型进行建模。
GARCH模型的计算公式为:
Figure BDA0004171943330000051
其中{εt}是均值为0,方差为1的独立同分布随机变量序列,α0>0,αi…0,βj…0。
步骤3.6、基于步骤3.3构建的ARMA模型以及步骤3.5构建的GARCH模型,组合成ARMA-GARCH模型。
进一步的,所述步骤4中,模型评估的具体方法包括:
步骤4.1、设定平均绝对误差(MAE)、平均相对误差(MAPE)、均方根误差(RMSE)、Theil不等系数U,四个评价指标。评价指标的具体数学公式如下:
平均绝对误差:
Figure BDA0004171943330000052
平均相对误差:
Figure BDA0004171943330000053
均方根误差RMSE:
Figure BDA0004171943330000054
Theil不等系数:
Figure BDA0004171943330000061
其中,n表示预测的期数,yt表示第t期的实际值,
Figure BDA0004171943330000062
表示第t期的预测值。
步骤4.2、基于步骤3构建的ARMA-GARCH模型,结合步骤2中得到的测试样本集Sv,通过步骤4.1所述的四个评价指标进行模型评估,检验所拟合模型的充分性。
进一步的,所述步骤5中,模型预测的具体方法包括:
步骤5.1、基于给定的交易数据,即训练样本数据St,利用所构建的ARMA-GARCH交易预测模型,预测未来任一时间段或任一时刻的金融交易数据。
步骤5.2、采用可视化的方法显示所预测未来任一时间段或任一时刻的金融交易数据。
本发明的有益效果为:
本发明提供的一种基于ARMA-GARCH的金融交易预测模型,通过将交易数据进行预处理后建立训练样本集和测试样本集;从训练样本集出发,根据其统计分析构建相应的ARMA模型进行数据拟合;针对其存在ARCH效应,构建GARCH模型以消除影响;最后通过构建ARMA-GARCH模型,分析不同时刻变量的相关关系,揭示其相关结构,并掌握规律将其延申到未来,提高模型的预测精度,从而对未来的交易数据做出更加精准的预测。
附图说明
图1是一种基于ARMA-GARCH的金融交易预测模型构建文字流程图;
图2是一种基于ARMA-GARCH的金融交易预测模型构建步骤示意图;
图3是一种基于ARMA-GARCH的金融交易预测模型构建详细流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1、图2和图3,本发明提供一种基于ARMA-GARCH的金融交易预测模型,模型的构建包含以下步骤:
步骤1:数据获取,从数据集D中通过滑动窗口及定期抽样的方式获取样本数据。
其中,数据集D指由多条历史金融交易数据组成的一组数据,具体来说,金融交易包括股票、汇率等,金融交易数据包括交易对象、交易内容、交易金额、交易时间等。滑动窗口指用左右指针来标记窗口的左右边界,左右指针滑动形成窗口的滑动,在本发明中,滑动窗口可理解为用于数据获取的一段给定长度的子序列。定期抽样指在间隔相同的时间段进行数据抽样,从而进行数据的获取,例如每2小时、每4小时进行数据抽样。
对数据进行获取时,包括以下步骤:
第一步,设置不同时间步长的滑动窗口。根据数据集D的时间单位、时间跨越长度不同,选择不同时间步长的滑动窗口。具体来说,时间步长可选取6个小时、12个小时、24个小时,2天、3天、5天、7天等时间长度。
第二步,利用第一步所设定时间步长的滑动窗口,在数据集D上按时间顺序进行滑动,获取多个窗口数据,通过对窗口内定期抽样的方式获得对应时间步长的样本数据S。具体来说,在设定定期抽样的时间为每4小时,时间步长为12小时的滑动窗口的前提下,其每次滑动对应的窗口数据为12小时的数据,通过每4小时定期抽样后得到的数据为第1小时、第5小时、第9小时的数据,即窗口数据中的第1、5、9位数据。
步骤2:数据预处理,将步骤1获取的样本数据进行数据预处理,包括数据清洗、数据筛选、特征化、数据分类,得到训练样本集与测试样本集。
对数据进行预处理时,包括以下步骤:
第一步,将步骤1得到的样本数据S进行数据清洗,包括缺失值处理、异常值处理。具体来说,对于缺失值,采取聚类填充、热卡填充或直接删除的方法进行处理。对于异常值,视存在异常值的数量大小,结合实际情况,采取平均值修正或不处理的方法进行处理。最终得到处理后的样本数据Sp。举例来说,对于缺失值,因金融交易数据具有的特殊性,为保证模型精度,若缺失值的占比大于30%,则通过直接删除该值的方法进行处理,若占比小于30%,采用聚类填充或热卡填充的方法进行处理;对于异常值,若其占比大于5%,则通过平均值修正的方法进行处理,反之不处理。通过数据清洗,可以尽可能地降低数据损失。提高数据质量,保证数据的正确性,提高模型预测的准确性。
第二步,视样本数据大小,结合实际情况,将第一步得到的样本数据Sp通过决策树或最优子集法进行数据筛选。具体来说,将样本数据Sp中的数据的参数通过决策树或最优子集法进行筛选,筛选出其中对交易成功贡献最大的n种目标参数,最终得到经筛选后的样本数据Se。举例来说,将样本数据Sp中的数据的参数输入决策树中或通过最优子集法进行计算,得到各个参数的贡献度排名,取其排名前80%的数据组成目标参数,构成样本数据Se,将剩余20%的数据进行舍弃。
第三步,将第二步得到的样本数据Se进行数据离散化处理,得到最终的样本集Sf,样本集包含n种目标参数对应的离散化后的特征。
第四步,将最终的样本集Sf按比例划分为训练样本集St和测试样本集Sv。具体来说,采用比例8:2进行训练集与测试集的划分,即训练样本集占总样本集的80%,测试样本集占总样本集的20%。
步骤3:数据分析与模型构建,对训练样本集做基本统计分析并构建ARMA模型,之后进行ARCH效应检验,构建GARCH模型,将ARMA模型与GARCH模型组合为ARMA-GARCH模型。
对数据进行分析与进行模型构建时,包括以下步骤:
第一步,基于步骤2得到的训练样本集St,通过Augmented Dickey Fuller(ADF)检验给定样本的时间序列是否平稳。若为非平稳的时间序列,则进行差分处理变成平稳的序列,再通过ADF进行平稳性检验。最终,得到平稳的时间序列训练样本集St。具体来说,ARMA模型的构建要求时间序列数据具有平稳性,若序列数据不平稳,应对数据进行处理,得到平稳的时间序列后再进行模型的构建;因此,基于步骤2得到的训练样本集St,通过AugmentedDickey Fuller(ADF)检验给定样本的时间序列是否平稳,考虑到金融交易数据可能出现不稳定的情况,可对序列进行差分处理,在通过ADF平稳性检验后,得到用于构建ARMA模型所需的平稳的时间序列训练样本集St
第二步,基于第一步所得到的平稳的时间序列训练样本集St,进行基本统计分析。具体来说,进行指数自相关和偏自相关检验,绘制相应的偏自相关函数(PACF)图和自相关函数(ACF)图,确定ARMA过程,为后续构建ARMA模型提供参考数据。
第三步,基于第二步的基本统计分析情况,构建ARMA模型,并对ARMA模型进行定阶。具体来说,结合第二步中所分析的PACF与ACF的显著性以及模型的定阶准则赤池信息准则(AIC)、贝叶斯信息准则(BIC)确定ARMA模型中p和q的阶数。
ARMA模型的计算公式为:
Figure BDA0004171943330000101
其中,{εt}为白噪声序列,p和q均为非负整数。
赤池信息准则的计算公式:AIC=-2ln(L)+2k
贝叶斯信息准则的计算公式为:BIC=-2ln(L)+ln(n)*k
其中,L为该模型下的最大似然,n为数据数量,k为模型的变量个数。
第四步,基于第三步所构建的ARMA模型,进行ARCH效应检验,构建GARCH模型。具体来说,首先,基于第三步所构建的ARMA模型对训练样本集St进行拟合后进行残差分析,对残差序列进行自相关和偏自相关性检验,判断在加入ARMA模型后其是否消除了自相关性。其次,对残差序列利用Ljung-Box统计量进行ARCH效应检验,判断其是否存在异方差性。
第五步,基于第四步中ARCH效应检验结果,构建GARCH模型,消除对应的ARCH效应。针对交易数据序列的特征,其一般不服从正态分布,因此选择学生t分布对GARCH模型进行设定。实际应用中GARCH模型阶数通常难以确定,故根据工程经验,选取低阶的GARCH(1,1)模型进行建模。具体来说,构建GARCH模型时,考虑常见的GARCH(0,1),GARCH(1,0),GARCH(1,1)等低阶GARCH模型进行建模,经多次实验后,对于金融交易数据,GARCH(1,1)模型较为合适,因此选择GARCH(1,1)模型进行建模。
GARCH模型的计算公式为:
Figure BDA0004171943330000102
其中{εt}是均值为0,方差为1的独立同分布随机变量序列,α0>0,αi…0,βj…0。
第六步,基于第三步构建的ARMA模型以及第五步构建的GARCH模型,组合成ARMA-GARCH模型。
步骤4:模型评估,通过相应评价指标评价模型的预测精度,检验所拟合模型的充分性。
对模型进行评估时,包括以下步骤:
第一步,设定平均绝对误差(MAE)、平均相对误差(MAPE)、均方根误差(RMSE)、Theil不等系数U,四个评价指标。评价指标的具体数学公式如下:
平均绝对误差:
Figure BDA0004171943330000111
平均相对误差:
Figure BDA0004171943330000112
均方根误差RMSE:
Figure BDA0004171943330000113
Theil不等系数:
Figure BDA0004171943330000114
其中,n表示预测的期数,yt表示第t期的实际值,
Figure BDA0004171943330000115
表示第t期的预测值。
第二步,基于步骤3构建的ARMA-GARCH模型,结合步骤2中得到的测试样本集Sv,通过第一步所述的四个评价指标进行模型评估,检验所拟合模型的充分性。
步骤5,模型预测,基于给定的交易数据,即训练样本数据St,利用步骤3所构建的金融交易预测模型,预测未来任一时间段或任一时刻的金融交易数据,同时采用可视化的方式显示所预测的金融交易数据。
对模型进行预测时,包括以下步骤:
第一步:基于给定的交易数据,即训练样本数据St,利用所构建的ARMA-GARCH交易预测模型,预测未来任一时间段或任一时刻的金融交易数据。
第二步:采用可视化的方法显示所预测未来任一时间段或任一时刻的金融交易数据。具体来说,通过例如柱状图、曲线图等形式,使用户更加方便、准确地获取预测结果,提升用户体验,帮助用户更好地做出相关决策。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

Claims (6)

1.一种基于ARMA-GARCH的金融交易预测模型,其特征在于包括以下步骤:
步骤1:数据获取;金融交易数据其数据量往往非常大,若数据全部用于模型的构建会不可避免地引入噪声,加大模型的构建难度,因此从数据集中通过滑动窗口及定期抽样的方式获取样本数据,缩小数据量级,更加高效地进行模型构建;
步骤2:数据预处理;将步骤1获取的样本数据进行数据预处理,包括数据清洗、数据筛选、特征化、数据分类,得到训练样本集与测试样本集;通过进行缺失值处理、异常值处理,引入决策树等算法进行数据筛选,进行数据特征化等方法,尽可能地降低数据损失,提高数据质量,保证数据的正确性与合理性,从而提高模型预测的准确性;
步骤3:数据分析与模型构建;针对金融交易数据的复杂性和不确定性以及现有技术中的缺陷,结合传统有效的时间序列分析方法中的自回归移动平均模型ARMA,与广义自回归异方差模型GARCH进行耦合;基于步骤2得到的训练样本集,做基本统计分析并构建ARMA模型;在构建好的ARMA模型的基础上,进行ARCH效应检验,构建GARCH模型;将构建好的ARMA模型与GARCH模型组合为ARMA-GARCH模型;其可以在特定的场景下构建金融交易预测模型,基于历史金融交易数据,更加准确地预测未来任一时间段或任意时刻的金融交易数据,提升用户体验;
步骤4:模型评估;通过相应评价指标评价模型的预测精度,检验所拟合模型的充分性;
步骤5:模型预测;基于给定的交易数据,利用所构建的金融交易预测模型,预测未来任一时间段或任一时刻的金融交易数据,同时采用可视化的方式显示所预测的金融交易数据。
2.根据权利要求1所述的一种基于ARMA-GARCH的金融交易预测模型,其特征在于步骤1中,所述数据获取具体步骤为:
从数据集中通过滑动窗口及定期抽样的方式获取样本数据;设置不同时间步长的滑动窗口;根据数据集的时间单位、时间跨越长度不同,选择不同时间步长的滑动窗口;利用所设定时间步长的滑动窗口,在数据集上按时间顺序进行滑动,获取多个窗口数据,通过对窗口内定期抽样的方式获得对应时间步长的样本数据。
3.根据权利要求1所述的一种基于ARMA-GARCH的金融交易预测模型,其特征在于步骤2中,所述数据预处理具体步骤为:
进行数据预处理,包括数据清洗、数据筛选、特征化、数据分类,得到训练样本集与测试样本集;对数据进行预处理时,包括缺失值处理、异常值处理;具体来说,对于缺失值,采取聚类填充、热卡填充或直接删除的方法进行处理;对于异常值,采取平均值修正或不处理的方法进行处理,得到处理后的样本数据;视样本数据大小,将样本数据通过决策树或最优子集法进行数据筛选,筛选出其中对交易成功贡献最大的n种目标参数,得到经筛选后的样本数据;将筛选后的样本数据进行数据离散化处理,得到最终的样本集;将最终的样本集按比例划分为训练样本集和测试样本集;通过数据清洗,可以尽可能地降低数据损失,提高数据质量,保证数据的正确性,提高模型预测的准确性。
4.根据权利要求1所述的一种基于ARMA-GARCH的金融交易预测模型,其特征在于步骤3中,所述数据分析与模型构建具体步骤为:
数据分析与模型构建,对训练样本集做基本统计分析并构建ARMA模型,之后进行ARCH效应检验,构建GARCH模型,将ARMA模型GARCH模型组合为ARMA-GARCH模型;对数据进行分析与进行模型构建时,包括以下步骤:基于步骤训练样本集,通过平稳性检验和处理得到平稳的时间序列训练样本集;基于平稳的时间序列训练样本集,进行基本统计分析,为构建ARMA模型提供参考数据并结合定阶准则构建ARMA模型;基于ARMA模型,进行ARCH效应检验,构建GARCH模型,并组合为ARMA-GARCH模型。
5.根据权利要求1所述的一种基于ARMA-GARCH的金融交易预测模型,其特征在于步骤4中,所述模型评估具体步骤为:
通过相应评价指标评价模型的预测精度,检验所拟合模型的充分性;具体来说,对模型进行评估时,设定平均绝对误差(MAE)、平均相对误差(MAPE)、均方根误差(RMSE)、Theil不等系数,四个评价指标;基于构建的ARMA-GARCH模型,结合测试样本集,通过所述的四个评价指标进行模型评估,检验所拟合模型的充分性。
6.根据权利要求1所述的一种基于ARMA-GARCH的金融交易预测模型,其特征在于步骤5中,所述模型预测具体步骤为:
对模型进行预测时,基于给定的交易数据,即训练样本数据,利用所构建的ARMA-GARCH交易预测模型,预测未来任一时间段或任一时刻的金融交易数据;采用可视化的方法显示所预测未来任一时间段或任一时刻的金融交易数据,通过例如柱状图、曲线图等形式,使用户更加方便、准确地获取预测结果,提升用户体验,帮助用户更好地做出相关决策。
CN202310380393.2A 2023-04-11 2023-04-11 一种基于arma-garch的金融交易预测模型 Pending CN116342286A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310380393.2A CN116342286A (zh) 2023-04-11 2023-04-11 一种基于arma-garch的金融交易预测模型

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310380393.2A CN116342286A (zh) 2023-04-11 2023-04-11 一种基于arma-garch的金融交易预测模型

Publications (1)

Publication Number Publication Date
CN116342286A true CN116342286A (zh) 2023-06-27

Family

ID=86878715

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310380393.2A Pending CN116342286A (zh) 2023-04-11 2023-04-11 一种基于arma-garch的金融交易预测模型

Country Status (1)

Country Link
CN (1) CN116342286A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117593101A (zh) * 2023-11-30 2024-02-23 北京聚汇融盛互联网科技有限公司 基于多维数据的金融风险数据处理分析方法及系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117593101A (zh) * 2023-11-30 2024-02-23 北京聚汇融盛互联网科技有限公司 基于多维数据的金融风险数据处理分析方法及系统
CN117593101B (zh) * 2023-11-30 2024-03-22 北京聚汇融盛互联网科技有限公司 基于多维数据的金融风险数据处理分析方法及系统

Similar Documents

Publication Publication Date Title
Methot Jr et al. Adjusting for bias due to variability of estimated recruitments in fishery assessment models
Wu et al. A prediction method using the grey model GMC (1, n) combined with the grey relational analysis: a case study on Internet access population forecast
Shepperd Software project economics: a roadmap
CN111243736B (zh) 一种生存风险评估方法及系统
Foucher et al. A flexible semi-Markov model for interval-censored data and goodness-of-fit testing
CN113837488B (zh) 能源消耗数据预测方法、系统、设备
CN116342286A (zh) 一种基于arma-garch的金融交易预测模型
CN113361690A (zh) 水质预测模型训练、水质预测方法、装置、设备及介质
CN111090833A (zh) 一种数据处理方法、系统及相关设备
Wibowo et al. The utilization of naive bayes and C. 45 in predicting the timeliness of students’ graduation
Shokhazamiy et al. Methods for complex retro-forecast analysis and complex forecasting of the accounting balance in terms of the interests of investors of insurance companies
CN112184415A (zh) 数据处理方法、装置、电子设备和存储介质
Williams et al. Putting variation into variance: modeling between-study heterogeneity in meta-analysis
Zhang et al. Multivariate discrete grey model base on dummy drivers
CN114048320B (zh) 一种基于课程学习的多标签国际疾病分类训练方法
CN113222255B (zh) 一种合同履约表现量化及短期违约预测的方法及装置
Holmes et al. Are UK labour markets polarising?
Sianturi et al. Implementation of The Moora Method in Determining Candidates for Village Head
CN113449018A (zh) 一种基于云平台的统计分析及可视化系统
Galvão et al. Measuring macro-financial conditions using a factor-augmented smooth-transition vector autoregression
Bornmann Which research institution performs better than average in a subject category or better than selected other institutions?
Basha et al. Implementation of Time-Series Analysis: Prediction of Stock Prices using Machine Learning and Deep learning models: A Hybrid Approach
Mendoza et al. Statistical analysis of species association indices
CN113159515B (zh) 一种建设市场主体最优信息透明度区间的确定方法
Manning et al. Volume and Direction of the Atlantic Slave Trade, 1650-1870: Estimates by Markov Chain Carlo Analysis

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination