CN114692944A - 一种基于多特征指标的股票趋势预测方法 - Google Patents

一种基于多特征指标的股票趋势预测方法 Download PDF

Info

Publication number
CN114692944A
CN114692944A CN202210134400.6A CN202210134400A CN114692944A CN 114692944 A CN114692944 A CN 114692944A CN 202210134400 A CN202210134400 A CN 202210134400A CN 114692944 A CN114692944 A CN 114692944A
Authority
CN
China
Prior art keywords
stock
index
data set
news
emotion
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210134400.6A
Other languages
English (en)
Inventor
邱月
陈炜
陈振松
宋哲玮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
CAPITAL UNIVERSITY OF ECONOMICS AND BUSINESS
Original Assignee
CAPITAL UNIVERSITY OF ECONOMICS AND BUSINESS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by CAPITAL UNIVERSITY OF ECONOMICS AND BUSINESS filed Critical CAPITAL UNIVERSITY OF ECONOMICS AND BUSINESS
Priority to CN202210134400.6A priority Critical patent/CN114692944A/zh
Publication of CN114692944A publication Critical patent/CN114692944A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/04Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Human Resources & Organizations (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Artificial Intelligence (AREA)
  • Development Economics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Finance (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Accounting & Taxation (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Operations Research (AREA)
  • Databases & Information Systems (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Technology Law (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

一种基于多特征指标的股票趋势预测方法,包括:获取股票历史数据与技术指标数据集、股吧评论数据集和新闻文本数据集;分别按不同预设规则对股票历史数据与技术指标数据集、股吧评论数据集和新闻文本数据集进行处理,分别得到处理后的股票历史数据与技术指标数据集、投资者情绪指数和新闻情绪数量指标指数;将处理后的股票历史数据与技术指标数据集、投资者情绪指数和新闻情绪数量指标指数作为输入,输入到AT‑LSTM模型,对股票趋势进行预测。本发明针对股票趋势预测难题,通过SKEP情感分析技术,提出了加权情绪指数的构建方法,并制定了新闻分类的准则,提升了现阶段股票趋势预测的准确率。

Description

一种基于多特征指标的股票趋势预测方法
技术领域
本发明涉及的是数据分析领域,特别涉及一种基于多特征指标的股票趋势预测方法。
背景技术
从行为金融学的角度,大量的研究已经证明了投资者情绪可以影响股票市场。Shiller等甚至发现了情绪影响投资者行为是导致1987年10月股市崩盘的主要原因。Chaffai等探讨了投资者情感和心理因素对突尼斯股市中影响。从投资收益的角度,有大量的研究证明投资者情绪指数可以用来预测股票的收益。Wurgal等研究发现,当初期情绪指标较低时,新股、小盘股、收益较低股、高波动性股票和困境股具有较高的后续收益,并提出了从投资角度预测股票收益率的12项措施。Statman等通过研究投资者情绪与股票市场收益之间的关系,发现投资者在市场预测和收益机会方面存在偏差。
情绪分析的来源可以是各种社交软件与网络平台,这些软件与平台鼓励用户传播与分享他们对金融证券产品和金融分析结果的情绪,这吸引了大量研究人员挖掘这些数据来预测股票趋势。例如,石善冲和朱颖楠通过对微信的文本挖掘来探究其与上证指数收盘价与成交量的相互关系。Kharde等分析twitter数据发现推文中的观点是高度结构化与异构性的,并将这些推文分为正面、负面或中性的。此外,一些学者在探究新闻与股吧评论对股价的影响,甚至尝试利用新闻与股吧评论等舆情信息分类后的结果来构建等权的情绪指数。例如,张琳和张军试图探究宏观经济信息发布对股票市场收益率及其波动的影响。杨娟通过文本处理的技术将互联网财经新闻分为兼并收购类、盈利能力类、再融资类新闻,进而探究其对股票市场的影响。Gillam等专注于用分类后的新闻的数量来量化包含在文本数据中的信息,研究发现量化后的情绪指数可以显著的提高收益。Nguyen等提出了一个新的特征,叫做“话题情绪指数”,来分析社交网络平台上的公众情绪,以提高股市的预测性能。Khan等利用社交媒体评论量和政治新闻文章预测股市走势。Ren等提出了一种新颖的投资者情绪特征——每日情绪指数,它是由当日投资者的正面评论和负面评论的数量构建的,以提高股票趋势预测的准确率。但是,现有的研究中对于不同文本之间的权重考虑仍然较少,以及对于网络新闻分类的准则也较为模糊。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的一种基于多特征指标的股票趋势预测方法。
为了解决上述技术问题,本申请实施例公开了如下技术方案:
一种基于多特征指标的股票趋势预测方法,包括:
S100.获取股票历史数据与技术指标数据集、股吧评论数据集和新闻文本数据集;
S200.分别按不同预设规则对股票历史数据与技术指标数据集、股吧评论数据集和新闻文本数据集进行处理,分别得到处理后的股票历史数据与技术指标数据集、投资者情绪指数和新闻情绪数量指标指数;
S300.将处理后的股票历史数据与技术指标数据集、投资者情绪指数和新闻情绪数量指标指数作为输入,输入到AT-LSTM模型,对股票趋势进行预测。
进一步地,S200中,对股票历史数据与技术指标数据集进行处理的预设规则为:对股票历史数据与技术指标数据集进行标准化和归一化处理后,得到处理后的股票历史数据与技术指标数据集。
进一步地,S200中,对股吧评论数据集进行处理的预设规则为:对股吧评论数据集进行预处理和情感表征,“非结构化数据”放入情感分析模型得到“结构化数据”,之后再将结构化数据放入“股票趋势预测模型”预测股票趋势。
进一步地,S200中,对新闻文本数据集进行处理的预设规则为:根据预设新闻的分类准则对新闻文本数据集进行判断,并根据判断结果对新闻文本数据集进行分析,得到各类新闻情绪数量指标。
进一步地,对股吧评论数据集进行预处理,具体包括:将股吧评论数据集中与股票无关的信息进行删除,包括URL、HTML、代码、注释、广告和其他标记,然后通过区分标点符号,将每篇评论分割成若干个句子,完成中文词语的分段,最后删除中文停用字。
进一步地,构建加权情绪指数的公式为:
Figure BDA0003503853970000031
其中,St为t日的加权情绪指数,n为t日的评论数量,Ai为第i条评论的阅读数量,
Figure BDA0003503853970000032
为每条评论的权重;ki的取值为-1、1与0分别表示该文本为消极、积极与中性;St的取值范围始终是在-1到1,其中0表示人们持中性态度,如果St大于0,则代表市场上的投资者多是持有积极的态度,否则投资者情绪持有消极的态度。
进一步地,改进后的情绪指数公式为:
Smodified-t=e-2St-2+e-1St-1+e-0St
Figure BDA0003503853970000033
其中,St是股票市场过去价格加权平均值,t是积分变量,随着时间的推移,St的权重指数进一步下降;参数β决定了过去价格对现在的影响,当参数β较高时,市场情绪由最近的价格变化决定;smodified表示每个星期一改进后的情绪指数,St-2代表着周六的加权情绪值,St-1代表着周日的加权情绪值。
进一步地,对新闻文本数据集进行处理,包括将新闻文本数据集进行分类,分为融资类新闻、财务类新闻和高管类新闻。
进一步地,AT-LSTM模型由LSTM层、Dropout层、自注意力层以及全连接层组成;输入T天的目标股票特征数据,先经过LSTM层顺序提取T天股票数据的时间序列特征,其中LSTM的层数N通过实验调参确定;每层后面加入Dropout层,通过随机删除一些神经元,防止模型过拟合;自注意力层进行序列间潜在关系的学习,通过对输入的滞后交易日数据之间的比较计算注意力分布概率,捕获数据之间的联系,突出输入中重要交易日特征数据的影响作用,自注意力机制可以进行并行运算,加快运算速度,最后添加全连接层输出预测值。
本发明实施例提供的上述技术方案的有益效果至少包括:
本发明公开的一种基于多特征指标的股票趋势预测方法,包括:获取股票历史数据与技术指标数据集、股吧评论数据集和新闻文本数据集;分别按不同预设规则对股票历史数据与技术指标数据集、股吧评论数据集和新闻文本数据集进行处理,分别得到处理后的股票历史数据与技术指标数据集、投资者情绪指数和新闻情绪数量指标指数;将处理后的股票历史数据与技术指标数据集、投资者情绪指数和新闻情绪数量指标指数作为输入,输入到AT-LSTM模型,对股票趋势进行预测。本发明针对股票趋势预测难题,通过SKEP情感分析技术,提出了加权情绪指数的构建方法,并制定了新闻分类的准则,提升了现阶段股票趋势预测的准确率。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
图1为本发明实施例1中,一种基于多特征指标的股票趋势预测方法的流程图;
图2为本发明实施例1中,一种基于多特征指标的股票趋势预测方法的详细流程框图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
为了解决现有技术中存在的问题,本发明实施例提供一种基于多特征指标的股票趋势预测方法。
实施例1
本实施例公开了一种基于多特征指标的股票趋势预测方法,如图1,包括:
S100.获取股票历史数据与技术指标数据集、股吧评论数据集和新闻文本数据集;具体的,如图2,本实施例是基于多特征体系进行股票趋势预测,可以将所有的特征分为金融市场与投资者情绪两个方面。根据特征的结构化程度,金融市场方面的数据作为结构化特征,具体包括股票价格数据与技术指标数据;投资者情绪作为非结构化特征,具体包括新闻文本数据与股吧文本数据。
S200.分别按不同预设规则对股票历史数据与技术指标数据集、股吧评论数据集和新闻文本数据集进行处理,分别得到处理后的股票历史数据与技术指标数据集、投资者情绪指数和新闻情绪数量指标指数;
具体的,对股票历史数据与技术指标数据集进行处理的预设规则为:对股票历史数据与技术指标数据集进行标准化和归一化处理后,得到处理后的股票历史数据与技术指标数据集。在金融市场方面,本专利使用的股票的历史数据包括:开盘价、收盘价、最高价、最低价、成交量、换手率、市盈率与市净率等,以及常用技术指标:KDJ、DMI、BIAS、BBI、WR等,其中的股票基本指标与技术指标数据来源于Wind金融数据库。
在本实施例中,对股吧评论数据集进行处理的预设规则为:对股吧评论数据集进行预处理和情感表征,将非结构化的文本信息转换为结构化的信息,将这些结构化的数据放入情感分析模型中,得到所需的情感数据集,构建加权情绪指数和改进的情绪指数,得到投资者情绪指数。具体的,对股吧评论数据集进行预处理,具体包括:将股吧评论数据集中与股票无关的信息进行删除,包括URL、HTML、代码、注释、广告和其他标记,然后通过区分标点符号,将每篇评论分割成若干个句子,完成中文词语的分段,最后删除中文停用字。例如,句子“我不满意这股票(I’m not satisfied with this stock)”可以被分割成五个词,包括:“我”,“不”,“满意”,“这”与“股票”。如果我们把这些词直接放入情感向量空间里。句子会被认为是乐观的,因为有"满意"这个褒义词。因此,我们应该把"不"和"满意"视为一个整体"不满意"。
在本实施例中,构建加权情绪指数的公式为:
Figure BDA0003503853970000061
其中,St为t日的加权情绪指数,n为t日的评论数量,Ai为第i条评论的阅读数量,
Figure BDA0003503853970000062
为每条评论的权重;ki的取值为-1、1与0分别表示该文本为消极、积极与中性;St的取值范围始终是在-1到1,其中0表示人们持中性态度,如果St大于0,则代表市场上的投资者多是持有积极的态度,否则投资者情绪持有消极的态度。
在本实施例中,改进后的情绪指数公式为:
Smodified-t=e-2St-2+e-1St-1+e-0St
Figure BDA0003503853970000063
其中,St是股票市场过去价格加权平均值,t是积分变量,随着时间的推移,St的权重指数进一步下降;参数β决定了过去价格对现在的影响,当参数β较高时,市场情绪由最近的价格变化决定;Smodified表示每个星期一改进后的情绪指数,St-2代表着周六的加权情绪值,St-1代表着周日的加权情绪值。
在本实施例中,对新闻文本数据集进行处理的预设规则为:根据预设新闻的分类准则对新闻文本数据集进行判断,并根据判断结果对新闻文本数据集进行分析,得到各类新闻情绪数量指标。对新闻文本数据集进行处理,包括将新闻文本数据集进行分类,分为融资类新闻、财务类新闻和高管类新闻。具体的新闻文本分类准则如表一所示。
表一
Figure BDA0003503853970000071
S300.将处理后的股票历史数据与技术指标数据集、投资者情绪指数和新闻情绪数量指标指数作为输入,输入到AT-LSTM模型,对股票趋势进行预测。
在本实施例中,AT-LSTM模型由LSTM层、Dropout层、自注意力层以及全连接层组成;输入T天的目标股票特征数据,先经过LSTM层顺序提取T天股票数据的时间序列特征,其中LSTM的层数N通过实验调参确定;每层后面加入Dropout层,通过随机删除一些神经元,防止模型过拟合;自注意力层进行序列间潜在关系的学习,通过对输入的滞后交易日数据之间的比较计算注意力分布概率,捕获数据之间的联系,突出输入中重要交易日特征数据的影响作用,自注意力机制可以进行并行运算,加快运算速度,最后添加全连接层输出预测值。
本实施例公开的一种基于多特征指标的股票趋势预测方法,包括:获取股票历史数据与技术指标数据集、股吧评论数据集和新闻文本数据集;分别按不同预设规则对股票历史数据与技术指标数据集、股吧评论数据集和新闻文本数据集进行处理,分别得到处理后的股票历史数据与技术指标数据集、投资者情绪指数和新闻情绪数量指标指数;将处理后的股票历史数据与技术指标数据集、投资者情绪指数和新闻情绪数量指标指数作为输入,输入到AT-LSTM模型,对股票趋势进行预测。本发明针对股票趋势预测难题,通过SKEP情感分析技术,提出了加权情绪指数的构建方法,并制定了新闻分类的准则,提升了现阶段股票趋势预测的准确率。
应该明白,公开的过程中的步骤的特定顺序或层次是示例性方法的实例。基于设计偏好,应该理解,过程中的步骤的特定顺序或层次可以在不脱离本公开的保护范围的情况下得到重新安排。所附的方法权利要求以示例性的顺序给出了各种步骤的要素,并且不是要限于所述的特定顺序或层次。
在上述的详细描述中,各种特征一起组合在单个的实施方案中,以简化本公开。不应该将这种公开方法解释为反映了这样的意图,即,所要求保护的主题的实施方案需要清楚地在每个权利要求中所陈述的特征更多的特征。相反,如所附的权利要求书所反映的那样,本发明处于比所公开的单个实施方案的全部特征少的状态。因此,所附的权利要求书特此清楚地被并入详细描述中,其中每项权利要求独自作为本发明单独的优选实施方案。
本领域技术人员还应当理解,结合本文的实施例描述的各种说明性的逻辑框、模块、电路和算法步骤均可以实现成电子硬件、计算机软件或其组合。为了清楚地说明硬件和软件之间的可交换性,上面对各种说明性的部件、框、模块、电路和步骤均围绕其功能进行了一般地描述。至于这种功能是实现成硬件还是实现成软件,取决于特定的应用和对整个系统所施加的设计约束条件。熟练的技术人员可以针对每个特定应用,以变通的方式实现所描述的功能,但是,这种实现决策不应解释为背离本公开的保护范围。
结合本文的实施例所描述的方法或者算法的步骤可直接体现为硬件、由处理器执行的软件模块或其组合。软件模块可以位于RAM存储器、闪存、ROM存储器、EPROM存储器、EEPROM存储器、寄存器、硬盘、移动磁盘、CD-ROM或者本领域熟知的任何其它形式的存储介质中。一种示例性的存储介质连接至处理器,从而使处理器能够从该存储介质读取信息,且可向该存储介质写入信息。当然,存储介质也可以是处理器的组成部分。处理器和存储介质可以位于ASIC中。该ASIC可以位于用户终端中。当然,处理器和存储介质也可以作为分立组件存在于用户终端中。
对于软件实现,本申请中描述的技术可用执行本申请所述功能的模块(例如,过程、函数等)来实现。这些软件代码可以存储在存储器单元并由处理器执行。存储器单元可以实现在处理器内,也可以实现在处理器外,在后一种情况下,它经由各种手段以通信方式耦合到处理器,这些都是本领域中所公知的。
上文的描述包括一个或多个实施例的举例。当然,为了描述上述实施例而描述部件或方法的所有可能的结合是不可能的,但是本领域普通技术人员应该认识到,各个实施例可以做进一步的组合和排列。因此,本文中描述的实施例旨在涵盖落入所附权利要求书的保护范围内的所有这样的改变、修改和变型。此外,就说明书或权利要求书中使用的术语“包含”,该词的涵盖方式类似于术语“包括”,就如同“包括,”在权利要求中用作衔接词所解释的那样。此外,使用在权利要求书的说明书中的任何一个术语“或者”是要表示“非排它性的或者”。

Claims (9)

1.一种基于多特征指标的股票趋势预测方法,其特征在于,包括:
S100.获取股票历史数据与技术指标数据集、股吧评论数据集和新闻文本数据集;
S200.分别按不同预设规则对股票历史数据与技术指标数据集、股吧评论数据集和新闻文本数据集进行处理,分别得到处理后的股票历史数据与技术指标数据集、投资者情绪指数和新闻情绪数量指标指数;
S300.将处理后的股票历史数据与技术指标数据集、投资者情绪指数和新闻情绪数量指标指数作为输入,输入到AT-LSTM模型,对股票趋势进行预测。
2.如权利要求1所述的一种基于多特征指标的股票趋势预测方法,其特征在于,S200中,对股票历史数据与技术指标数据集进行处理的预设规则为:对股票历史数据与技术指标数据集进行标准化和归一化处理后,得到处理后的股票历史数据与技术指标数据集。
3.如权利要求1所述的一种基于多特征指标的股票趋势预测方法,其特征在于,S200中,对股吧评论数据集进行处理的预设规则为:对股吧评论数据集进行预处理和情感表征,将非结构化的文本信息转换为结构化的信息,将这些结构化的数据放入情感分析模型中,得到所需的情感数据集,构建加权情绪指数和改进的情绪指数,得到投资者情绪指数。
4.如权利要求1所述的一种基于多特征指标的股票趋势预测方法,其特征在于,S200中,对新闻文本数据集进行处理的预设规则为:根据预设新闻的分类准则对新闻文本数据集进行判断,并根据判断结果对新闻文本数据集进行分析,得到各类新闻情绪数量指标。
5.如权利要求3所述的一种基于多特征指标的股票趋势预测方法,其特征在于,对股吧评论数据集进行预处理,具体包括:将股吧评论数据集中与股票无关的信息进行删除,包括URL、HTML、代码、注释、广告和其他标记,然后通过区分标点符号,将每篇评论分割成若干个句子,完成中文词语的分段,最后删除中文停用字。
6.如权利要求3所述的一种基于多特征指标的股票趋势预测方法,其特征在于,构建加权情绪指数的公式为:
Figure FDA0003503853960000021
其中,St为t日的加权情绪指数,n为t日的评论数量,Ai为第i条评论的阅读数量,
Figure FDA0003503853960000022
为每条评论的权重;ki的取值为-1、1与0分别表示该文本为消极、积极与中性;St的取值范围始终是在-1到1,其中0表示人们持中性态度,如果St大于0,则代表市场上的投资者多是持有积极的态度,否则投资者情绪持有消极的态度。
7.如权利要求3所述的一种基于多特征指标的股票趋势预测方法,其特征在于,改进后的情绪指数公式为:
Smodified-t=e-2St-2+e-1St-1+e-0Sf
Figure FDA0003503853960000023
其中,St是股票市场过去价格加权平均值,t是积分变量,随着时间的推移,St的权重指数进一步下降;参数β决定了过去价格对现在的影响,当参数β较高时,市场情绪由最近的价格变化决定;Smodified表示每个星期一改进后的情绪指数,St-2代表着周六的加权情绪值,St-1代表着周日的加权情绪值。
8.如权利要求1所述的一种基于多特征指标的股票趋势预测方法,其特征在于,对新闻文本数据集进行处理,包括将新闻文本数据集进行分类,分为融资类新闻、财务类新闻和高管类新闻。
9.如权利要求1所述的一种基于多特征指标的股票趋势预测方法,其特征在于,AT-LSTM模型由LSTM层、Dropout层、自注意力层以及全连接层组成;输入T天的目标股票特征数据,先经过LSTM层顺序提取T天股票数据的时间序列特征,其中LSTM的层数N通过实验调参确定;每层后面加入Dropout层,通过随机删除一些神经元,防止模型过拟合;自注意力层进行序列间潜在关系的学习,通过对输入的滞后交易日数据之间的比较计算注意力分布概率,捕获数据之间的联系,突出输入中重要交易日特征数据的影响作用,自注意力机制可以进行并行运算,加快运算速度,最后添加全连接层输出预测值。
CN202210134400.6A 2022-02-14 2022-02-14 一种基于多特征指标的股票趋势预测方法 Pending CN114692944A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210134400.6A CN114692944A (zh) 2022-02-14 2022-02-14 一种基于多特征指标的股票趋势预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210134400.6A CN114692944A (zh) 2022-02-14 2022-02-14 一种基于多特征指标的股票趋势预测方法

Publications (1)

Publication Number Publication Date
CN114692944A true CN114692944A (zh) 2022-07-01

Family

ID=82136828

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210134400.6A Pending CN114692944A (zh) 2022-02-14 2022-02-14 一种基于多特征指标的股票趋势预测方法

Country Status (1)

Country Link
CN (1) CN114692944A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117764458A (zh) * 2024-01-15 2024-03-26 广州宇中网络科技有限公司 业绩趋势分析方法、装置、设备及存储介质

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117764458A (zh) * 2024-01-15 2024-03-26 广州宇中网络科技有限公司 业绩趋势分析方法、装置、设备及存储介质

Similar Documents

Publication Publication Date Title
Chu et al. A global supply chain risk management framework: An application of text-mining to identify region-specific supply chain risks
Swathi et al. An optimal deep learning-based LSTM for stock price prediction using twitter sentiment analysis
Day et al. Deep learning for financial sentiment analysis on finance news providers
Ashtiani et al. News-based intelligent prediction of financial markets using text mining and machine learning: A systematic literature review
Kriebel et al. Credit default prediction from user-generated text in peer-to-peer lending using deep learning
Zhao et al. Deep Learning-based Integrated Framework for stock price movement prediction
Shi et al. Stock movement prediction with sentiment analysis based on deep learning networks
Lutz et al. Sentence-level sentiment analysis of financial news using distributed text representations and multi-instance learning
Gong et al. The role of textual analysis in oil futures price forecasting based on machine learning approach
Petropoulos et al. Employing google trends and deep learning in forecasting financial market turbulence
Kim et al. Stock price prediction through sentiment analysis of corporate disclosures using distributed representation
CN112419029A (zh) 类金融机构风险监控方法、风险模拟系统及存储介质
Ji et al. Exploring the impact of investor’s sentiment tendency in varying input window length for stock price prediction
CN114692944A (zh) 一种基于多特征指标的股票趋势预测方法
Wang et al. Learning to trade on sentiment
Huang et al. Using social network sentiment analysis and genetic algorithm to improve the stock prediction accuracy of the deep learning-based approach
Wang et al. A novel stock index direction prediction based on dual classifier coupling and investor sentiment analysis
Gu et al. Deep learning model with sentiment score and weekend effect in stock price prediction
Edman et al. Predicting Tesla Stock Return Using Twitter Data
Olawale et al. Predicting stock investments based on sentiment and historical price data
Zhang et al. Solving data-driven newsvendor problem with textual reviews through deep learning
Craja et al. Deep Learning application for fraud detection in financial statements
Evstigneeva et al. The impact of negative news on public perception of inflation
Koukaras et al. Stock Market Prediction Using Microblogging Sentiment Analysis and Machine Learning. Telecom 2022, 3, 358–378
Manzoor et al. Stock exchange prediction using financial news and sentiment analysis

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination