CN111582945A - 一种基于复杂网络的金融市场预测方法 - Google Patents
一种基于复杂网络的金融市场预测方法 Download PDFInfo
- Publication number
- CN111582945A CN111582945A CN202010425189.4A CN202010425189A CN111582945A CN 111582945 A CN111582945 A CN 111582945A CN 202010425189 A CN202010425189 A CN 202010425189A CN 111582945 A CN111582945 A CN 111582945A
- Authority
- CN
- China
- Prior art keywords
- company
- listed
- companies
- complex network
- nodes
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
- G06Q30/0202—Market predictions or forecasting for commercial activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/04—Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/06—Asset management; Financial planning or analysis
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Entrepreneurship & Innovation (AREA)
- Economics (AREA)
- Marketing (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Game Theory and Decision Science (AREA)
- Technology Law (AREA)
- Data Mining & Analysis (AREA)
- Human Resources & Organizations (AREA)
- Operations Research (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于复杂网络的金融市场预测方法,涉及金融和计算机交叉研究技术领域,构建一个复杂网络来表示上市公司以及上市公司之间的跟随、背离、共现等联系,基于上市公司复杂网络,从中选取与一个上市公司关系最密切的多个公司的信息作为预测依据,并以它们的预测结果作为输出,构建基于深度学习的预测模型,该模型包括了经过编码器‑解码器结构和带注意力机制的卷积神经网络结构,以相关公司的嵌入和公司的历史表现数据为输入,以相关公司的金融指标走势为输出,本发明可以显著提升上市公司金融指标预测的准确性,从而可以更准确地判断上市公司未来在金融市场上的表现,也可以更好地做出投资和管理决策。
Description
技术领域
本发明涉及金融和计算机交叉研究技术领域,特别是涉及一种基于复杂网络的金融市场预测方法。
背景技术
股市等金融市场是经济的晴雨表,金融市场将如何波动、公司表现如何,是经济管理部门、金融机构、企业和投资者都十分关心的问题,如何对金融市场表现进行有效预测在商业界和学术界都受到了广泛的关注。
现有的分析预测手段对上市公司之间的关联考虑得不够,在预测一个公司的金融指标的时候,只是孤立地考虑待预测公司的信息,没有考虑公司之间的相互影响。
发明内容
本发明为了克服现有的分析预测手段对上市公司之间的关联考虑得不够,在预测一个公司的金融指标的时候,只是孤立地考虑待预测公司的信息,没有考虑公司之间的相互影响的缺点,本发明要解决的技术问题是提供一种基于复杂网络的金融市场预测方法,如何表示上市公司之间以及上市公司与版块、概念之间的关联,并利用这些信息来进行上市公司的金融指标预测。
为了解决上述技术问题,本发明提供了这样一种基于复杂网络的金融市场预测方法,该基于复杂网络的金融市场预测方法的具体步骤如下:
S1:构建上市公司复杂网络,所述上市公司复杂网络用于描述上市公司之间的关系;
S2:基于上市公司复杂网络进行分布式表示学习,得到节点的嵌入;
S3:构建深度学习模型,对上市公司的主要金融指标进行预测,其步骤如下:
1)、构建相关公司集合Rel(o);
2)、计算所述相关公司集合Rel(o)的嵌入,从上市公司复杂网络中提取 Rel(o)中的节点及其联系,得到一个子图GRel(o),以图中每个节点的嵌入作为输入,运行图卷积神经网络算法,得到整个子图的嵌入,即Rel(o)的嵌入;
3)、构建预测模型,所述模型的输入包括相关公司集合和相关公司的历史表现,采用LSTM模型来根据所述相关公司的历史表现生成向量表示,把该向量作为模型的具体输入。
优选地,所述步骤S1中,所述上市公司复杂网络的构建包括上市公司实体抽取和上市公司关系抽取,所述上市公司实体抽取为从互联网上抓取国内上市公司的股票代码和股票名称信息,所述上市公司关系抽取根据上市公司的股价分为三类上市公司关系,分别为追随关系、背离关系和共现关系。
优选地,所述步骤S2包括:
将一个所述上市公司复杂网络表示为:G=(Vs,Vt,Ess,Est),其中Vs是所有所述上市公司节点集合,Vt是所有所述主题节点集合,Ess是所述上市公司节点之间的边,Est是所述主题节点与所述上市公司节点之间的边,所述嵌入的学习采用深度学习方法,总的损失函数定义为:
其中p(u,v;θ)使用Logistic函数计算:
α用于控制结构损失和主题损失的比重。
优选地,步骤S3中步骤1)包括:
给定一个公司o和参数k,找出与公司o相关联的公司中关联度最强的k 个公司,作为o的相关公司集合Rel(o),以o为根,构造最小生成树,取该树靠近根部的k个节点构成Rel(o)。
有益效果
本发明为金融市场预测提供了新的思路,有助于更深刻地理解金融市场波动的机理,不仅可以推动金融市场预测的研究,也可以促进复杂网络和深度学习等技术的发展,同时也可以用于对上市公司或者金融市场进行监测和预警,对于经济管理部门、金融机构、企业和投资者有重要的参考价值,在经济和金融预测等领域有重要的应用价值,可以显著提升上市公司金融指标预测的准确性,从而可以更准确地判断上市公司未来在金融市场上的表现,也可以更好地做出投资和管理决策。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明中基于复杂网络的金融市场预测方法的研究思路流程示意图;
图2为本发明中基于复杂网络的金融市场预测方法的预测模型结构示意图。
具体实施方式
下面将结合附图和实施例对本发明作进一步的说明。
实施例1
一种基于复杂网络的金融市场预测方法,如图1-2所示,该基于复杂网络的金融市场预测方法的具体步骤如下:
S1:构建上市公司复杂网络,所述上市公司复杂网络用于描述上市公司之间的关系;
所述上市公司复杂网络CorpNet(Corporation Network)是一个图结构,所述上市公司复杂网络存在上市公司节点和主题节点,每个所述上市公司节点表示一个上市公司,对应一只股票,每个所述主题节点表示表示一个主题,所述一个主题可以表示一个板块、行业或者概念,如银行板块、5G等;
所述上市公司复杂网络存在两种类型的边,一种是上市公司节点之间的边,另一种是主题节点与所述上市公司节点之间的边,所述上市公司节点之间的边表示两个所述上市公司之间的关系,所述主题节点与所述上市公司节点之间的边表示一个上市公司属于或者具有一个主题;
所述上市公司复杂网络的构建包括上市公司实体抽取和上市公司关系抽取;
所述上市公司实体抽取为从互联网上抓取国内上市公司的股票代码和股票名称以及上市公司的其他信息,所述上市公司实体抽取需要在一个实际的文本中识别出一个上市公司实体的出现,所述上市公司实体的描述存在两类问题:
(1):实体描述与实体名称不相符,却指向该实体。如“上半年中行发放贷款有较大幅度增长”这里“中行”指的是上市公司“中国银行”;
(2)实体描述与实体名称匹配,但是并非指向该实体。例如“中国移动通信产业经历了飞跃式发展”这里虽然提到了“中国移动”,但并非指任何一个上市公司;
针对上述问题,解决方法如下:
首先,搜集语料信息,构建上市公司以及股票名称同义词、近义词库;
其次,基于大规模语料库学习上市公司及股票名称的词嵌入,称为实体嵌入,使得该嵌入中包含丰富的实体上下文信息;
最后,在一个具体的文档中,根据词法形式和同义词、近义词库找出疑似匹配的实体,然后将训练得到的实体嵌入与疑似实体的上下文词嵌入进行比较,如果相似性大于阈值,则认为文档所指为当前实体;
所述上市公司关系抽取根据上市公司的股价分为三类上市公司关系,分别为追随关系、背离关系和共现关系,所述背离关系是指一只股票的表现发生变动时,另一只股票经常随着该股票发生同方向变化,所述背离关系是指一只股票的表现发生变换时,另一只股票的表现经常发生逆向变化,所述共现关系是指两个股票经常在一个上下文中同时提到;
其中,所述追随关系反映了两个上市公司之间存在共生共荣关系,如处于一个供应链上;所述背离关系反映了两个上市公司之间的竞争关系;而所述共现关系的内涵有可能是追随关系,也有可能是背离关系,还可能是其他关系,因此我们要求两个公司之间的追随或者背离与共现关系不能同时出现,以免重复表达,进一步地,对三类关系进行识别:
共现关系的识别:共现关系的识别比较简单,基于上市公司实体识别结果,在一个单位的上下文中,如果两个股票实体同时出现,则它们之间存在共现关系;
追随和背离关系的识别:将一个股票的市场表现抽象为一个变动序列,其中每个元素从{Up,Down,Flat}中取值,分别表示上涨、下跌和平稳,其中平稳是指价格变动在一个预定义的范围内,给定两个股票序列,可以计算它们的相关性,如果高度正相关,则认为两个股票存在追随关系;如果高度负相关,则认为两个股票存在背离关系;为了减少计算量,拟采取“过滤—求精”框架,即先从每个序列抽取一些关键特征,根据这些特征将所有的序列分为若干个组,然后在组内进行比较。
S2:基于上市公司复杂网络进行分布式表示学习,得到节点的嵌入 (embedding);
上市公司网络中包含了大量信息,它们在学习和预测中有重要作用,为了有效地利用上市公司网络中的信息,需要将其向量化。本项目基于表示学习技术,学习上市公司网络的嵌入(embeddings),使得嵌入表示中尽可能反映上市公司之间的各种关系;
将一个所述上市公司复杂网络表示为:G=(Vs,Vt,Ess,Est),其中Vs是所有所述上市公司节点集合,Vt是所有所述主题节点集合,Ess是所述上市公司节点之间的边,Est是所述主题节点与所述上市公司节点之间的边,所述嵌入的学习采用深度学习方法,总的损失函数定义为:
其中p(u,v;θ)使用Logistic函数计算:
针对主题嵌入的产生,将每个主题节点用一个关键词集合表示,构造一个种子词集合,初始时包括主题词本身,然后考察一个主题下的每个节点的核心题材描述中的关键词,根据词嵌入找出与种子词相似的关键词,将这些关键词加入到种子词集合中,如此迭代,产生一个主题节点的关键词集合。然后产生一个主题的嵌入,考虑两种方式产生主题嵌入,一是用主题的关键词集合的词嵌入的平均作为主题的嵌入,二是利用LSTM模型,以关键词集合的词嵌入为输入,模型的输出为主题的嵌入,整个网络的结构部分的损失函数和主题相关部分的损失函数为:
总的损失函数是结构和主题损失函数的结合,其中,α可以控制结构损失和主题损失的比重,默认取0.5,即在嵌入中包含相同比重的结构信息和主题信息;
训练过程中考虑使用SGD、Adam等来优化。通过这种方式,不是分开来训练节点的结构嵌入和主题嵌入,而是联合训练,从而使得不同节点的嵌入有可比性,并预期可以取得更好的结果。
S3:构建深度学习模型,对上市公司的主要金融指标进行预测,其步骤如下:
1)、构建相关公司集合,由于一个公司的金融指标会受到其他公司的影响,因此在预测一个公司的金融指标的时候,首先找出对其影响最大的公司集合,给定一个公司o和参数k,找出与公司o相关联的公司中关联度最强的k 个公司,作为o的相关公司集合Rel(o),以o为根,构造最小生成树,取该树靠近根部的k个节点构成Rel(o);
2)、计算所述相关公司集合Rel(o)的嵌入,从上市公司复杂网络中提取 Rel(o)中的节点及其联系,得到一个子图GRel(o),以图中每个节点的嵌入作为输入,运行图卷积神经网络算法,得到整个子图的嵌入,即Rel(o)的嵌入;
3)、构建预测模型,所述模型的输入包括相关公司集合和相关公司的历史表现,所述相关公司的历史表现是指公司的股票、市值等金融指标的历史表现,取一个公司在某一时间段窗口内的金融指标作为该公司的历史表现,采用 LSTM模型来根据所述相关公司的历史表现生成一个向量表示,把该向量作为模型的具体输入,本方法不仅仅考虑待预测公司一个公司,而是考虑了与之关联最强的k个公司,将这k个公司的信息作为输入的一部分,因此,在预测的时候也以k个公司的预测结果作为模型的输出,也就是说,模型并不是预测一个公司的表现,而是一个集合的表现;
预测模型的总体结构如图2所示:模型的下半部分处理输入信息,将相关公司集合的嵌入和历史表现向量合并,然后通过一个自编码器产生一个融合了多方面信息的融合向量;模型的上半部分以该融合向量为输入,经过一个带注意力机制的多层卷积神经网络产生整个相关公司集合的预测结果,其中包括了待预测公司的预测结果。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
Claims (4)
1.一种基于复杂网络的金融市场预测方法,其特征在于,该基于复杂网络的金融市场预测方法的具体步骤如下:
S1:构建上市公司复杂网络,所述上市公司复杂网络用于描述上市公司之间的关系;
S2:基于上市公司复杂网络进行分布式表示学习,得到节点的嵌入;
S3:构建深度学习模型,对上市公司的主要金融指标进行预测,其步骤如下:
1)、构建相关公司集合Rel(o);
2)、计算所述相关公司集合Rel(o)的嵌入,从上市公司复杂网络中提取Rel(o)中的节点及其联系,得到一个子图GRel(o),以图中每个节点的嵌入作为输入,运行图卷积神经网络算法,得到整个子图的嵌入,即Rel(o)的嵌入;
3)、构建预测模型,所述模型的输入包括相关公司集合和相关公司的历史表现,采用LSTM模型来根据所述相关公司的历史表现生成向量表示,把该向量作为模型的具体输入。
2.如权利要求1所述的一种基于复杂网络的金融市场预测方法,其特征在于,所述步骤S1中,所述上市公司复杂网络的构建包括上市公司实体抽取和上市公司关系抽取,所述上市公司实体抽取为从互联网上抓取国内上市公司的股票代码和股票名称信息,所述上市公司关系抽取根据上市公司的股价分为三类上市公司关系,分别为追随关系、背离关系和共现关系。
3.如权利要求1所述的一种基于复杂网络的金融市场预测方法,其特征在于,所述步骤S2包括:
将一个所述上市公司复杂网络表示为:G=(Vs,Vt,Ess,Est),其中Vs是所有所述上市公司节点集合,Vt是所有所述主题节点集合,Ess是所述上市公司节点之间的边,Est是所述主题节点与所述上市公司节点之间的边,所述嵌入的学习采用深度学习方法,总的损失函数定义为:
其中p(u,v;θ)使用Logistic函数计算:
α用于控制结构损失和主题损失的比重。
4.如权利要求1所述的一种基于复杂网络的金融市场预测方法,其特征在于,步骤S3中步骤1)包括:
给定一个公司o和参数k,找出与公司o相关联的公司中关联度最强的k个公司,作为o的相关公司集合Rel(o),以o为根,构造最小生成树,取该树靠近根部的k个节点构成Rel(o)。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010425189.4A CN111582945A (zh) | 2020-05-19 | 2020-05-19 | 一种基于复杂网络的金融市场预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010425189.4A CN111582945A (zh) | 2020-05-19 | 2020-05-19 | 一种基于复杂网络的金融市场预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111582945A true CN111582945A (zh) | 2020-08-25 |
Family
ID=72117138
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010425189.4A Pending CN111582945A (zh) | 2020-05-19 | 2020-05-19 | 一种基于复杂网络的金融市场预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111582945A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112634057A (zh) * | 2020-12-18 | 2021-04-09 | 未鲲(上海)科技服务有限公司 | 基金相似度计算方法、平台、设备及可读存储介质 |
-
2020
- 2020-05-19 CN CN202010425189.4A patent/CN111582945A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112634057A (zh) * | 2020-12-18 | 2021-04-09 | 未鲲(上海)科技服务有限公司 | 基金相似度计算方法、平台、设备及可读存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2021147726A1 (zh) | 信息抽取方法、装置、电子设备及存储介质 | |
CN111428053B (zh) | 一种面向税务领域知识图谱的构建方法 | |
Swathi et al. | An optimal deep learning-based LSTM for stock price prediction using twitter sentiment analysis | |
Li et al. | Improve relation extraction with dual attention-guided graph convolutional networks | |
CN109947902B (zh) | 一种数据查询方法、装置和可读介质 | |
Lu et al. | Research on classification and similarity of patent citation based on deep learning | |
CN116383399A (zh) | 一种事件舆情风险预测方法及系统 | |
CN116245107B (zh) | 电力审计文本实体识别方法、装置、设备及存储介质 | |
Xu et al. | A scientific research topic trend prediction model based on multi‐LSTM and graph convolutional network | |
Shan et al. | Geographical address representation learning for address matching | |
Zhang et al. | A hybrid neural network approach for fine-grained emotion classification and computing | |
CN117667956A (zh) | 业务主体关系信息更新方法、装置、设备及存储介质 | |
CN117149974A (zh) | 一种子图检索优化的知识图谱问答方法 | |
Luan | Information extraction from scientific literature for method recommendation | |
CN112270189B (zh) | 一种提问式的分析节点生成方法、系统及存储介质 | |
CN114443842A (zh) | 战略性新兴产业分类方法及装置、存储介质和电子设备 | |
Liu et al. | Attention-based event relevance model for stock price movement prediction | |
CN111753151B (zh) | 一种基于互联网用户行为的服务推荐方法 | |
CN111582945A (zh) | 一种基于复杂网络的金融市场预测方法 | |
Li et al. | Automatic classification algorithm for multisearch data association rules in wireless networks | |
CN113051886B (zh) | 一种试题查重方法、装置、存储介质及设备 | |
Zhang et al. | Solving data-driven newsvendor problem with textual reviews through deep learning | |
CN113869058A (zh) | 基于lc-gcn方面级情感分析方法、系统、存储介质和电子设备 | |
Li et al. | Industry chain graph building based on text semantic association mining | |
Wang et al. | Methods for Acquiring and Incorporating Knowledge into Stock Price Prediction: A Survey |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |