CN111597229A - 一种基于高维点过程的金融时间序列的因果关系学习方法 - Google Patents
一种基于高维点过程的金融时间序列的因果关系学习方法 Download PDFInfo
- Publication number
- CN111597229A CN111597229A CN202010409718.1A CN202010409718A CN111597229A CN 111597229 A CN111597229 A CN 111597229A CN 202010409718 A CN202010409718 A CN 202010409718A CN 111597229 A CN111597229 A CN 111597229A
- Authority
- CN
- China
- Prior art keywords
- causal relationship
- financial
- namely
- data
- point process
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 58
- 230000001364 causal effect Effects 0.000 title claims abstract description 51
- 230000008569 process Effects 0.000 title claims abstract description 38
- 238000007476 Maximum Likelihood Methods 0.000 claims abstract description 13
- 239000011159 matrix material Substances 0.000 claims abstract description 11
- 230000009466 transformation Effects 0.000 claims abstract description 8
- 238000006243 chemical reaction Methods 0.000 claims description 3
- 230000006870 function Effects 0.000 claims description 3
- 238000005457 optimization Methods 0.000 claims description 3
- 238000007405 data analysis Methods 0.000 abstract description 3
- 238000004458 analytical method Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000000528 statistical test Methods 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2474—Sequence data queries, e.g. querying versioned data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/25—Integrating or interfacing systems involving database management systems
- G06F16/254—Extract, transform and load [ETL] procedures, e.g. ETL data flows in data warehouses
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/04—Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Databases & Information Systems (AREA)
- General Physics & Mathematics (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- General Business, Economics & Management (AREA)
- Technology Law (AREA)
- Strategic Management (AREA)
- Fuzzy Systems (AREA)
- Mathematical Physics (AREA)
- Probability & Statistics with Applications (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Marketing (AREA)
- Economics (AREA)
- Development Economics (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Abstract
本发明公开了金融数据分析领域的一种基于高维点过程的金融时间序列的因果关系学习方法,包括以下步骤:步骤1:事件序列提取,将金融时间序列数据事件化,使得时间序列可以用点过程模型进行建模与分析;步骤2:事件序列建模,对多维Hawkes过程进行修正,并使用该过程对步骤1中抽取得到的金融事件序列进行建模,估计转化矩阵;步骤3:参数估计,使用正则化的极大似然估计和EM算法估计模型参数;步骤4:因果关系网络构建,利用步骤3中得到的转化矩阵构建因果关系网络,提取多种金融数据间的因果关系。本发明能够有效地发掘金融数据中的因果关系,并能够更好地满足金融时间序列的因果关系学习的需求,能够有效地替代传统的因果关系学习方法。
Description
技术领域
本发明涉及金融数据分析领域,尤其涉及一种基于高维点过程的金融时间序列的因果关系学习方法。
背景技术
发现存在联系的因果关系是有向网络的一项有趣而又重要的任务,它在实际应用中扮演着越来越重要的角色,包括金融数据的预报、预测和数据分析。因果关系的概念最初由C.W.Granger提出,它主要用于时间序列数据,试图通过回归和统计检验来探究时间序列X在预测另一个Y时是否有意义,以此来构造X到Y之间的因果关系。例如,当美元指数变化时,它是否会导致石油价格的重大变化。如果是的话,人们可以认为美国农业部与油价有因果关系。如今,因果关系发现和学习在经济学、计算机和社会分析等领域有广泛的应用,包括政府支出和经济产出税、图像像素和标签、IPTV项目中的Granger因果关系等等,具有较为普遍的适用性。
针对目前因果关系学习的大多数方法都是基于自回归模型和相应的统计检验,但自回归模型难以应用于现实世界中,尤其是应用于金融数据中。自回归模型的适用范围毕竟窄,只能用于时间序列数据。通过基于对点过程的因果模型的改进,使其既适用于事件序列又适用于时间序列,并可以在大量数据发现可能存在的因果联系。
高维点过程已经取代了基于离散时滞变量的自回归模型,成为进行因果推理的新的重要工具。这些过程试图模拟不同维度或类型的影响,这通常用于评估因果关系。Hawkes过程是最常用的进行因果推理的点过程,它在实际数据中表现得非常好,通常用于低维和高维领域的因果推理。
然而,大多数基于高维Hawkes过程学习因果关系的现有工作都是为事件序列数据设计的,但对于时间序列(如在离散时间点上固定时间滞后下观测到的财务数据)是不可行的。这严重限制了点过程模型在因果分析领域的应用。
发明内容
本发明的目的在于针对现有因果关系方法的不足而提供一种基于高维点过程的金融时间序列的因果关系学习方法,该基于高维点过程的金融时间序列的因果关系学习方法能够有效地发掘金融数据中的因果关系,并能够更好地满足金融时间序列的因果关系学习的需求,本发明能够有效地替代传统的因果关系学习方法。
为达到上述目的,本发明通过以下技术方案来实现:一种基于高维点过程的金融时间序列的因果关系学习方法,包括以下步骤:
步骤1:事件序列提取,将金融时间序列数据事件化,使得金融时间序列可以用点过程模型进行建模与分析;
步骤2:事件序列建模,对多维Hawkes过程进行修正,并使用该过程对步骤1中抽取得到的金融事件序列进行建模,估计转化矩阵;
步骤3:参数估计,使用正则化的极大似然估计和EM算法估计模型参数;
步骤4:因果关系网络构建,利用步骤3中得到的转化矩阵构建因果关系网络,提取多种金融数据间的因果关系。
优选的,所述步骤1包括以下步骤:
步骤1-1:将时间序列数据规范化处理;
步骤1-2:抽取其中超过阈值的时间点组成事件数据。
优选的,所述步骤2中对多维Hawkes过程进行修正具体为在原Hawkes过程的基础上加入滞后项。
优选的,所述步骤3包括以下步骤:
步骤3-1:使用正则化的极大似然估计构建优化目标,对极大似然估计中的对数似然函数进行正则化处理,防止过拟合;
步骤3-2:EM算法估计模型参数,通过迭代计算E步和M步,基于EM的学习算法来求解正则化的极大似然估计问题。
优选的,所述步骤4具体为:基于步骤3中估计得到的转化矩阵,选择其中超过指定阈值的项,将此项对应的两种金融数据加入到因果关系网络中,并在因果关系网络中添加连接这两种金融数据的边。
与现有技术相比,本发明的有益效果为:
1、本发明避免了价格平稳时多余的冗余数据对模型造成的干扰;
2、本发明能够避免事件在同一天发生而产生的估计错误;
3、本发明可以处理高维数据的同时可以避免过拟合;
4、本发明能够在大量时间序列指标中成批发现因果联系;
5、本发明不需要大量的人工寻找与选择即可以构建因果关系的复杂网络;
6、本发明寻找到的因果关系有实际的物理意义,具有可解释性。
附图说明
图1为本发明的流程示意图。
具体实施方式
如图1所示,一种基于高维点过程的金融时间序列的因果关系学习方法,包括以下步骤:
步骤1:事件序列提取,将金融时间序列数据事件化,使得金融时间序列可以用点过程模型进行建模与分析;
步骤2:事件序列建模,对多维Hawkes过程进行修正,并使用该过程来对步骤1中抽取得到的金融事件序列进行建模,估计转化矩阵;
步骤3:参数估计,使用正则化的极大似然估计和EM算法估计模型参数;
步骤4:因果关系网络构建,利用步骤3中得到的转化矩阵构建因果关系网络,提取多种金融数据间的因果关系。
上述步骤1包括以下步骤:
步骤1-1:将金融时间序列数据规范化处理;
步骤1-2:抽取其中超过阈值的时间点组成事件数据。
上述步骤2中对多维Hawkes过程进行修正具体为在原Hawkes过程的基础上加入滞后项。
上述步骤3包括以下步骤:
步骤3-1:使用正则化的极大似然估计构建优化目标,对极大似然估计中的对数似然函数进行正则化处理,防止过拟合;
步骤3-2:EM算法估计模型参数,通过迭代计算E步和M步,基于EM的学习算法来求解正则化的极大似然估计问题。
上述步骤4具体为:基于步骤3中估计得到的转化矩阵,选择其中超过指定阈值的项,将此项对应的两种金融数据加入到因果关系网络中,并在因果关系网络中添加连接这两种金融数据的边。
本发明并不局限于上述实施例,在本发明公开的技术方案的基础上,本领域的技术人员根据所公开的技术内容,不需要创造性的劳动就可以对其中的一些技术特征作出一些替换和变形,这些替换和变形均在本发明的保护范围内。
Claims (5)
1.一种基于高维点过程的金融时间序列的因果关系学习方法,其特征在于,包括以下步骤:
步骤1:事件序列提取,将金融时间序列数据事件化,使得时间序列可以用点过程模型进行建模与分析;
步骤2:事件序列建模,对多维Hawkes过程进行修正,并使用该过程对步骤1中抽取得到的金融事件序列进行建模,估计转化矩阵;
步骤3:参数估计,使用正则化的极大似然估计和EM算法估计模型参数;
步骤4:因果关系网络构建,利用步骤3中得到的转化矩阵构建因果关系网络,提取多种金融数据间的因果关系。
2.根据权利要求1所述的一种基于高维点过程的金融时间序列的因果关系学习方法,其特征在于,所述步骤1包括以下步骤:
步骤1-1:将时间序列数据规范化处理;
步骤1-2:抽取其中超过阈值的时间点组成事件数据。
3.根据权利要求1所述的一种基于高维点过程的金融时间序列的因果关系学习方法,其特征在于,所述步骤2中对多维Hawkes过程进行修正具体为在原Hawkes过程的基础上加入滞后项。
4.根据权利要求1所述的一种基于高维点过程的金融时间序列的因果关系学习方法,其特征在于,所述步骤3包括以下步骤:
步骤3-1:使用正则化的极大似然估计构建优化目标,对极大似然估计中的对数似然函数进行正则化处理,防止过拟合;
步骤3-2:EM算法估计模型参数,通过迭代计算E步和M步, 基于EM的学习算法来求解正则化的极大似然估计问题。
5.根据权利要求1所述的一种基于高维点过程的金融时间序列的因果关系学习方法,其特征在于,所述步骤4具体为:基于步骤3中估计得到的转化矩阵,选择其中超过指定阈值的项,将此项对应的两种金融数据加入到因果关系网络中,并在因果关系网络中添加连接这两种金融数据的边。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010409718.1A CN111597229A (zh) | 2020-05-15 | 2020-05-15 | 一种基于高维点过程的金融时间序列的因果关系学习方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010409718.1A CN111597229A (zh) | 2020-05-15 | 2020-05-15 | 一种基于高维点过程的金融时间序列的因果关系学习方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111597229A true CN111597229A (zh) | 2020-08-28 |
Family
ID=72185489
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010409718.1A Pending CN111597229A (zh) | 2020-05-15 | 2020-05-15 | 一种基于高维点过程的金融时间序列的因果关系学习方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111597229A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112508709A (zh) * | 2020-10-21 | 2021-03-16 | 杭州衡泰软件有限公司 | 一种基于网络结构的信用风险传染监控方法 |
CN113779976A (zh) * | 2021-09-27 | 2021-12-10 | 成都数之联科技有限公司 | 裁判规则提取方法及系统及装置及介质 |
WO2022132592A1 (en) * | 2020-12-16 | 2022-06-23 | Jpmorgan Chase Bank, N.A. | System and method for ultra-high dimensional hawkes processes |
WO2024130569A1 (zh) * | 2022-12-21 | 2024-06-27 | 上海健康医学院 | 一种高维小样本时间序列的因果关系网络分析方法 |
-
2020
- 2020-05-15 CN CN202010409718.1A patent/CN111597229A/zh active Pending
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112508709A (zh) * | 2020-10-21 | 2021-03-16 | 杭州衡泰软件有限公司 | 一种基于网络结构的信用风险传染监控方法 |
WO2022132592A1 (en) * | 2020-12-16 | 2022-06-23 | Jpmorgan Chase Bank, N.A. | System and method for ultra-high dimensional hawkes processes |
CN113779976A (zh) * | 2021-09-27 | 2021-12-10 | 成都数之联科技有限公司 | 裁判规则提取方法及系统及装置及介质 |
CN113779976B (zh) * | 2021-09-27 | 2023-07-07 | 成都数之联科技股份有限公司 | 裁判规则提取方法及系统及装置及介质 |
WO2024130569A1 (zh) * | 2022-12-21 | 2024-06-27 | 上海健康医学院 | 一种高维小样本时间序列的因果关系网络分析方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111597229A (zh) | 一种基于高维点过程的金融时间序列的因果关系学习方法 | |
Mehtab et al. | A time series analysis-based stock price prediction using machine learning and deep learning models | |
Chen et al. | Measuring and relieving the over-smoothing problem for graph neural networks from the topological view | |
CN110377984B (zh) | 一种工业设备剩余有效寿命预测方法、系统及电子设备 | |
CN103782309A (zh) | 用于机器学习分类器的自动数据清除 | |
CN113051130B (zh) | 结合注意力机制的lstm网络的移动云负载预测方法及系统 | |
CN115145899B (zh) | 一种基于制造企业数据空间的时空数据异常检测方法 | |
CN113361559A (zh) | 基于深宽度联合神经网络的多模态数据知识信息提取方法 | |
WO2024012735A1 (en) | Training of a machine learning model for predictive maintenance tasks | |
CN117709446A (zh) | 基于规则引擎的动态金融信用风险模型的构建方法 | |
CN117974166B (zh) | 一种用电信息采集全链路异常监测及因果溯源方法及系统 | |
CN116340726A (zh) | 一种能源经济大数据清洗方法、系统、设备及存储介质 | |
Lei et al. | Comparison of multiple machine learning models based on enterprise revenue forecasting | |
Wang et al. | Monthly ship price forecasting based on multivariate variational mode decomposition | |
CN117236698A (zh) | 基于图神经网络的产业链风险评估模型、方法及介质 | |
CN116523540A (zh) | 基于自适应lgbm的超短期电价预测方法 | |
CN115809346A (zh) | 一种基于多视图语义增强的小样本知识图谱补全方法 | |
CN115376309A (zh) | 一种基于多视角时间矩阵分解的缺失交通数据修复方法 | |
CN114461619A (zh) | 能源互联网多源数据融合方法、装置、终端及存储介质 | |
Dragut | Stock data clustering and multiscale trend detection | |
Hong et al. | StackDA: a stacked dual attention neural network for multivariate time-series forecasting | |
CN112131569A (zh) | 一种基于图网络随机游走的风险用户预测方法 | |
Zhang et al. | Enterprise event risk detection based on supply chain contagion | |
Uilhoorn | Comparison of two non-convex mixed-integer nonlinear programming algorithms applied to autoregressive moving average model structure and parameter estimation | |
Mubarak et al. | GSTARIMA Model with Missing Value for Forecasting Gold Price |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20200828 |