CN108876061A - 预测股票趋势的方法、装置、电子设备及存储介质 - Google Patents

预测股票趋势的方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN108876061A
CN108876061A CN201810865564.XA CN201810865564A CN108876061A CN 108876061 A CN108876061 A CN 108876061A CN 201810865564 A CN201810865564 A CN 201810865564A CN 108876061 A CN108876061 A CN 108876061A
Authority
CN
China
Prior art keywords
corpus
emotion
stock
enterprise
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810865564.XA
Other languages
English (en)
Inventor
罗旺
李俊杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen University
Original Assignee
Shenzhen University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen University filed Critical Shenzhen University
Priority to CN201810865564.XA priority Critical patent/CN108876061A/zh
Publication of CN108876061A publication Critical patent/CN108876061A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/04Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Marketing (AREA)
  • Development Economics (AREA)
  • Human Resources & Organizations (AREA)
  • General Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Tourism & Hospitality (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Technology Law (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种预测股票趋势的方法及装置,方法包括:采集指定企业在各个预设年份的年报数据与运营数据,并对采集到的年报数据进行预处理,得到各个年报数据对应的语料库;对各个语料库进行情感分析,确定各个语料库的情感语调值,以及利用预置的可读性检测算法检测各个语料库的可读性;根据指定企业在各个预设年份的股票价格变化趋势、运营数据以及语料库的情感语调值与可读性,对已建立的股票预测模型进行训练;采集待预测企业发布的最新年报数据与最新运营数据,并输入训练后的股票预测模型,得到待预测企业在未来预设时间段内的股票变化趋势。本发明可以使得股票预测结果更加准确,提高了股票预测的准确性。

Description

预测股票趋势的方法、装置、电子设备及存储介质
技术领域
本发明涉及数据分析技术领域,尤其涉及一种预测股票趋势的方法、装置、电子设备及存储介质。
背景技术
股票预测一直是一个热门的研究方向,现有的股票预测手段主要分为技术分析和基本分析两种:技术分析是仅从证券的市场行为来分析证券价格未来变化趋势的方法,其特点是通过对市场过去和现在的行为,应用数学和逻辑推理的方法,探索出一些典型的规律并据此预测证券市场的未来变化趋势;基本分析是指证券投资分析人员根据经济学、金融学、财务管理学及投资学的基本原理,对决定证券投资价值及价格的基本要素,如宏观经济指标、经济政策走势、行业发展状况、产品市场状况、公司销售和财务状况,来评估证券的投资价值,判断证券的合理价位,从而提出相应投资建议的一种分析方法。
其中,技术分析方式由于主要是依赖市场的历史数据来对未来股票价格走势进行预测,预测的准确性较低;而基本分析方式则需要预测人员具备较高的金融专业素养,且预测结果具有一定的主观性和片面性,因此,现有的股票预测方式的准确性仍旧有待提高。
发明内容
本发明的主要目的在于提供一种预测股票趋势的方法、装置、电子设备及存储介质,旨在解决现有技术中的股票预测方式准确性不高的技术问题。
为实现上述目的,本发明第一方面提供一种预测股票趋势的方法,该方法包括:
采集指定企业在各个预设年份的年报数据与运营数据,并对采集到的年报数据进行预处理,得到所述年报数据对应的语料库;
对所述语料库进行情感分析,确定所述语料库的情感语调值,以及利用预置的可读性检测算法检测所述语料库的可读性;
根据所述指定企业在所述各个预设年份的股票价格变化趋势、所述运营数据以及所述语料库的情感语调值与可读性,对已建立的股票预测模型进行训练;
采集待预测企业发布的最新年报数据与最新运营数据,并输入训练后的股票预测模型,得到所述待预测企业在未来预设时间段内的股票变化趋势。
此外,为实现上述目的,本发明第二方面提供一种预测股票趋势的装置,该装置包括:
采集模块,用于采集指定企业在各个预设年份的年报数据与运营数据,并对采集到的年报数据进行预处理,得到所述年报数据对应的语料库;
分析模块,用于对所述语料库进行情感分析,确定所述语料库的情感语调值,以及利用预置的可读性检测算法检测所述语料库的可读性;
训练模块,用于根据所述指定企业在所述各个预设年份的股票价格变化趋势、所述运营数据以及所述语料库的情感语调值与可读性,对已建立的股票预测模型进行训练;
预测模块,用于采集待预测企业发布的最新年报数据与最新运营数据,并输入训练后的股票预测模型,得到所述待预测企业在未来预设时间段内的股票变化趋势。
此外,为实现上述目的,本发明第三方面提供一种电子设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现本发明第一方面提供的预测股票趋势的方法中的各个步骤。
此外,为实现上述目的,本发明第四方面提供一种计算机可读存储介质,该计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现本发明第一方面提供的预测股票趋势的方法中的各个步骤。
本发明提供的一种预测股票趋势的方法,相较于现有技术而言,本发明通过采集上市企业以往的年报数据与运营数据,然后分析以往年报数据的情感变化以及年报数据的可读性,综合上市企业以往的股票价格变化趋势、运营数据,来对已建立的股票预测模型进行训练,然后将待预测企业发布的最新年报数据与最新运营数据输入训练后的股票预测模型,即可得到待预测企业在未来预设时间段内的股票变化趋势,即本发明在预测股票趋势时,不仅采用了上市企业最新发布的年报数据与运营数据,还采用了年报数据中的情感变化以及可读性,由于年报数据的情感变化可以反映出企业管理人员对企业运营状况是持有乐观心态还是悲观心态,以及通过年报数据的可读性可以反映出年报数据的公开透明度,可读性越差,年报数据存在刻意隐瞒事实或谎报数据的概率就越高,从而使得预测结果更加准确,提高了股票预测的准确性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例中预测股票趋势的方法的步骤流程示意图;
图2为本发明实施例中步骤102的细化步骤流程示意图;
图3为本发明实施例中预测股票趋势的方法的另一流程示意图;
图4为本发明实施例中预测股票趋势的装置的程序模块示意图;
图5为本发明实施例中分析模块402的细化程序模块示意图;
图6为本发明实施例中预测股票趋势的装置的另一程序模块示意图;
图7为本发明实施例中提供的电子设备的结构示意图。
具体实施方式
为使得本发明的发明目的、特征、优点能够更加的明显和易懂,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而非全部实施例。基于本发明中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1,图1为本发明实施例中预测股票趋势的方法的步骤流程示意图,在本发明实施例中,上述预测股票趋势的方法包括:
步骤101、采集指定企业在各个预设年份的年报数据与运营数据,并对采集到的年报数据进行预处理,得到所述年报数据对应的语料库。
首先,采集若干个指定的上市企业在预设时间段内(如2001年-至今)各个年份的年报数据与运营数据,建立年报数据库。其中,所采集的年报数据与运营数据都是企业最初发布的原版数据,且未经过人为篡改。其中,年报数据是上市企业每年必须提交股东的公司年度财务报表,报表包括描述公司经营状况,以及资产负债和收入情况;而运营数据可以包括上市企业的在股市中的一些关键性指标,例如规模(SIZE)、权益账面市值比(BM)、波动性(volatility)、换手率(Turnover)、杠杆比例、股利收益率、盈余价格比等。
其中,对采集到的年报数据进行预处理,包括摘取年报数据中的董事会报告(chairman’s statement)部分,并以.txt格式存储。另外,还可以包括删除摘取到的董事会报告部分中多余的空格、换行符,以及添加适当的标点、空格或换行符来整理文本格式,还原文本原有的句子和段落结构。
步骤102、对所述语料库进行情感分析,确定所述语料库的情感语调值,以及利用预置的可读性检测算法检测所述语料库的可读性。
具体的,在对语料库进行情感分析的之前,需要建立情感关键词词典,该情感关键词词典中包括积极情感关键词与消极情感关键词。
其中,情感关键词词典可以与Harvard和McDonald的情感词典相融合,包括有积极情感关键词,如“振奋人心”、“激动”等,以及包括消极情感关键词,如“遗憾”、“歉意”等。
本发明实施例中,可以根据预置的情感关键词在上述语料库中出现的次数、以及各个情感关键词自身所占有的比重,来确定上述语料库的情感语调值。例如,当积极情感关键词在上述语料库中出现的次数较多时,可以认为上述语料库的情感语调为积极;当消极情感关键词在上述语料库中出现的次数较少时,可以认为上述语料库的情感语调为消极。
同时,可以利用预置的可读性检测算法,如罗伯特·根宁公式或鲁道夫·弗莱施公式,来检测上述语料库的可读性。可以理解的是,董事会报告中主要是将报告期内已经发生或将要发生的重大事项予以及时说明,以帮助投资者更好的了解企业的财务状况、经营成果及现金流量,以便作出理性决策,经营业绩好的上市企业在公布的董事会报告时,由于信心、底气十足,公布的董事会报告往往会具有条例清楚、逻辑清晰、数据公开充分等特点,具有较高的可读性;而经营业绩差的上市企业在公布董事会报告时,由于缺乏底气与信心,为了维持股价,公布的董事会报告中往往会有所隐瞒、逻辑不够清晰、数据公开不充分甚至造假,从而可读性会较差。
步骤103、根据所述指定企业在所述各个预设年份的股票价格变化趋势、所述运营数据以及所述语料库的情感语调值与可读性,对已建立的股票预测模型进行训练。
本发明实施例中,先建立一个股票预测模型,然后利用指定企业在上述第一预设时间段内的股票价格变化趋势、运营数据以及上述语料库的情感语调值与可读性,对已建立的股票预测模型进行训练。
具体的,将指定企业在上述第一预设时间段内的运营数据以及上述语料库的情感语调值与可读性作为上述股票预测模型的输入自变量,将指定企业在第一预设时间段内的股票价格变化趋势作为因变量,对股票预测模型进行回归分析训练。
步骤104、采集待预测企业发布的最新年报数据与最新运营数据,并输入训练后的股票预测模型,得到所述待预测企业在未来预设时间段内的股票变化趋势。
本发明实施例中,在训练好股票预测模型之后,将待预测企业发布的最新年报数据与运营数据输入训练好的预测模型,即可输出上述待预测企业在未来预设时间段内(如未来一年内)的股票变化趋势。
本发明实施例所提供的预测股票趋势的方法,相较于现有技术而言,通过采集上市企业以往的年报数据与运营数据,然后分析以往年报数据的情感变化以及年报数据的可读性,综合上市企业以往的股票价格变化趋势、运营数据,来对已建立的股票预测模型进行训练,然后将待预测企业发布的最新年报数据与最新运营数据输入训练后的股票预测模型,即可得到待预测企业在未来预设时间段内的股票变化趋势,即本发明在预测股票趋势时,不仅采用了上市企业最新发布的年报数据与运营数据,还采用了年报数据中的情感变化以及可读性,由于年报数据的情感变化可以反映出企业管理人员对企业运营状况是持有乐观心态还是悲观心态,以及通过年报数据的可读性可以反映出年报数据的公开透明度,可读性越差,年报数据存在刻意隐瞒事实或谎报数据的概率就越高,从而使得预测结果更加准确,提高了股票预测的准确性。
进一步的,基于上述实施例,参照图2,图2为本发明实施例中步骤102的细化步骤流程示意图,本发明实施例中,上述步骤102包括:
步骤201、在所述语料库中查找预设的各个情感关键词,确定所述各个情感关键词在所述语料库中出现的次数。
具体的,根据各个情感关键词在语料库中出现的次数,生成各个情感关键词对应的情感词频向量,其中,各个情感关键词的顺序是固定的。
步骤202、基于所述各个情感关键词在所述语料库中出现的次数,以及所述指定企业在所述各个预设年份的股票价格变化趋势进行回归分析,确定所述各个情感关键词的权重。
具体的,可以采用以下方式确定各个情感关键词的权重:
输入:训练集TR,测试集TS,情感关键词词典DW,回归模型的类型f,训练的轮数N;
输出:情感关键词词典中各个情感关键词的权重;
初始化:领默认回归模型为一般回归模型;
for n=1、2、……、N
for r=1、2、……、R
将样本r处理成一个按照情感关键词词典DW顺序排序的词频向量,并将指定企业在第一预设时间段内的股票价格变化趋势输入回归模型中;
end for
使用梯度下降法求最优的回归模型;
end for
使用训练好的回归模型在测试集TS上测试性能,并返回模型中各个自变量的系数,对应各个情感关键词的权重。
步骤203、根据所述各个情感关键词在所述语料库中出现的次数,以及所述各个情感关键词的权重,确定所述语料库的情感语调值。
具体的,上述步骤203可以细化为以下步骤:
步骤一:遍历所述各个情感关键词,并计算遍历到的情感关键词在所述语料库中出现的次数与所述遍历到的情感关键词的权重的乘积。
步骤二:在遍历完所述各个情感关键词之后,将计算出的各个乘积的累加和与1的差值确定为所述语料库的情感值。
步骤三:计算所述各个预设年份内的相邻两个年份中,后一个年份对应的语料库的情感值与前一个年份对应的语料库的情感值的差值,并将计算出的差值作为后一个年份的情感语调值。
其中,将同一企业相邻年份的语料库的情感值之差,作为后一年份对应语料库的情感语调值。例如,某企业2015年与2016年的年报数据对应的预料库的情感值分别为a和b,则该企业2016年的年报数据对应的预料库的情感语调值为b-a。
具体的,可以采用以下方式确定语料库的情感语调值:
本发明实施例所提供的预测股票趋势的方法,可以根据各个情感关键词在语料库中出现的次数;以及指定企业在第一预设时间段内的股票价格变化趋势进行回归分析,确定出各个情感关键词的权重,进而根据各个情感关键词在语料库中出现的次数,以及各个情感关键词的权重,确定出语料库的情感语调值,利用该情感语调值与语料库的可读性,以及上市企业最新发布的年报数据与运营数据,来预测股票趋势,可以使得预测结果更加准确,有助于提高股票预测的准确性。
进一步地,基于上述实施例,本发明实施例中,上述步骤103之前还包括以下步骤:
步骤一、获取所述指定企业在所述各个预设年份的股票价格变化数据。
步骤二、利用所述指定企业在所述各个预设年份的股息数据,对所述股票价格变化数据进行修正。
步骤三、对修正后的股票价格变化数据进行回归训练,并将训练后的回归模型的斜率作为所述指定企业在所述各个预设年份的股票价格变化趋势。
其中,当回归模型的斜率为正数时,表示股票价格呈上涨趋势;当回归模型的斜率为负数时,表示股票价格呈下跌趋势。而斜率的绝对值大小则可以表示股价波动的幅度。
具体的,可以采用以下方式确定指定企业在各个预设年份的股票价格变化趋势:
输入:训练集TR,测试集TS,股息PS,股息调整日期,回归模型的类型f,训练的轮数N;
输出:股票价格变化趋势(回归模型的斜率);
初始化:领默认回归模型为一般回归模型;
for n=1、2、……、N
for r=1、2、……、R
使用股息数据修正样本r的股价数据,并将修正后的股价数据输入到回归模型中;
end for
使用梯度下降法来训练回归模型;
end for
使用训练好的回归模型在测试集TS上测试性能,并返回模型的斜率,对应股票价格变化趋势。
进一步的,为了更好的理解本发明实施例,参照图3,图3为本发明实施例中预测股票趋势的方法的另一流程示意图。
本发明实施例所提供的预测股票趋势的方法,通过获取指定企业在各个预设年份的股票价格变化数据,并对获取到的股票价格数据修正后进行回归训练,即可到的指定企业在各个预设年份的股票价格变化趋势,基于该股票价格变化趋势、指定企业在各个预设年份的运营数据、以及年报数据对应的语料库的情感语调值与可读性,即可对已建立的股票预测模型进行训练,得到股票训练模型。
进一步的,请参阅图4,图4为本发明实施例中预测股票趋势的装置的程序模块示意图,在本发明实施例中,上述预测股票趋势的装置包括:
采集模块401,用于采集指定企业在各个预设年份的年报数据与运营数据,并对采集到的年报数据进行预处理,得到所述年报数据对应的语料库;
分析模块402,用于对所述语料库进行情感分析,确定所述语料库的情感语调值,以及利用预置的可读性检测算法检测所述语料库的可读性;
具体的,上述装置还包括建立模块,用于建立情感关键词词典,所述情感关键词词典中包括积极情感关键词与消极情感关键词。
训练模块402,用于根据所述指定企业在所述各个预设年份的股票价格变化趋势、所述运营数据以及所述语料库的情感语调值与可读性,对已建立的股票预测模型进行训练;
预测模块403,用于采集待预测企业发布的最新年报数据与最新运营数据,并输入训练后的股票预测模型,得到所述待预测企业在未来预设时间段内的股票变化趋势。
本发明实施例所提供的预测股票趋势的装置,相较于现有技术而言,通过采集上市企业以往的年报数据与运营数据,然后分析以往年报数据的情感变化以及年报数据的可读性,综合上市企业以往的股票价格变化趋势、运营数据,来对已建立的股票预测模型进行训练,然后将待预测企业发布的最新年报数据与最新运营数据输入训练后的股票预测模型,即可得到待预测企业在未来预设时间段内的股票变化趋势,即本发明在预测股票趋势时,不仅采用了上市企业最新发布的年报数据与运营数据,还采用了年报数据中的情感变化以及可读性,由于年报数据的情感变化可以反映出企业管理人员对企业运营状况是持有乐观心态还是悲观心态,以及通过年报数据的可读性可以反映出年报数据的公开透明度,可读性越差,年报数据存在刻意隐瞒事实或谎报数据的概率就越高,从而使得预测结果更加准确,提高了股票预测的准确性。
进一步地,基于上述实施例,参照图5,图5为本发明实施例中分析模块402的细化程序模块示意图,本发明实施例中,上述分析模块402包括:
查找模块501,用于在所述语料库中查找预设的各个情感关键词,确定所述各个情感关键词在所述语料库中出现的次数;
第一确定模块502,用于基于所述各个情感关键词在所述语料库中出现的次数,以及所述指定企业在所述各个预设年份的股票价格变化趋势进行回归分析,确定所述各个情感关键词的权重;
第二确定模块503,用于根据所述各个情感关键词在所述语料库中出现的次数,以及所述各个情感关键词的权重,确定所述语料库的情感语调值。
具体的,第二确定模块503可以细化为:
第一计算模块,用于遍历所述各个情感关键词,并计算遍历到的情感关键词在所述语料库中出现的次数与所述遍历到的情感关键词的权重的乘积;
第二计算模块,用于在遍历完所述各个情感关键词之后,将计算出的各个乘积的累加和与1的差值确定为所述语料库的情感值;
语调确定模块,用于计算所述各个预设年份内的相邻两个年份中,后一个年份对应的语料库的情感值与前一个年份对应的语料库的情感值的差值,并将计算出的差值作为后一个年份的情感语调值。
本发明实施例所提供的预测股票趋势的装置,可以根据各个情感关键词在语料库中出现的次数;以及指定企业在第一预设时间段内的股票价格变化趋势进行回归分析,确定出各个情感关键词的权重,进而根据各个情感关键词在语料库中出现的次数,以及各个情感关键词的权重,确定出语料库的情感语调值,利用该情感语调值与语料库的可读性,以及上市企业最新发布的年报数据与运营数据,来预测股票趋势,可以使得预测结果更加准确,有助于提高股票预测的准确性。
进一步地,基于上述实施例,参照图6,图6为本发明实施例中预测股票趋势的装置的另一程序模块示意图,本发明实施例中,上述装置还包括:
获取模块601,用于获取所述指定企业在所述各个预设年份的股票价格变化数据;
修正模块602,用于利用所述指定企业在所述各个预设年份的股息数据,对所述股票价格变化数据进行修正;
变化趋势确定模块603,用于对修正后的股票价格变化数据进行回归训练,并将训练后的回归模型的斜率作为所述指定企业在所述各个预设年份的股票价格变化趋势。
本发明实施例所提供的预测股票趋势的装置,通过获取指定企业在各个预设年份的股票价格变化数据,并对获取到的股票价格数据修正后进行回归训练,即可到的指定企业在各个预设年份的股票价格变化趋势,基于该股票价格变化趋势、指定企业在各个预设年份的运营数据、以及年报数据对应的语料库的情感语调值与可读性,即可对已建立的股票预测模型进行训练,得到股票训练模型。
本发明实施例还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时,实现本发明预测股票趋势的方法对应各个实施例中的各个步骤。
本发明实施例还提供一种可读存储介质,该可读存储介质为计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时,实现本发明预测股票趋势的方法对应各个实施例中的各个步骤。
为了更好的理解本发明,参照图7,图7为本发明实施例中提供的电子设备的结构示意图。如图7所示,该实施例的电子设备07主要包括:处理器70、存储器71以及存储在存储器71中并可在处理器70上运行的计算机程序72,例如预测股票趋势的程序。处理器70执行计算机程序72时实现上述预测股票趋势的方法各实施例中的步骤,例如图1至附图3任一示例所示的步骤。或者,处理器70执行计算机程序72时实现上述各装置实施例中各模块/单元的功能,例如图4所示各模块的功能或者附图5至附图6任一示例的装置的功能。
示例性的,计算机程序72主要可以实现:采集指定企业在各个预设年份的年报数据与运营数据,并对采集到的年报数据进行预处理,得到所述年报数据对应的语料库;对所述语料库进行情感分析,确定所述语料库的情感语调值,以及利用预置的可读性检测算法检测所述语料库的可读性;根据所述指定企业在所述各个预设年份的股票价格变化趋势、所述运营数据以及所述语料库的情感语调值与可读性,对已建立的股票预测模型进行训练;采集待预测企业发布的最新年报数据与最新运营数据,并输入训练后的股票预测模型,得到所述待预测企业在未来预设时间段内的股票变化趋势。
计算机程序72可以被分割成一个或多个模块/单元,一个或者多个模块/单元被存储在存储器71中,并由处理器70执行,以完成本发明。一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述计算机程序72在计算设备07中的执行过程。例如,计算机程序72可以被分割成采集模块块401、分析模块402、训练模块403及预测模块404(虚拟装置中的模块)的功能。
计算设备07可包括但不仅限于处理器70、存储器71。本领域技术人员可以理解,图7仅仅是计算设备07的示例,并不构成对计算设备07的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如计算设备还可以包括输入输出设备、网络接入设备、总线等。
所称处理器70可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
存储器71可以是计算设备07的内部存储单元,例如计算设备07的硬盘或内存。存储器71也可以是计算设备07的外部存储设备,例如计算设备07上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,存储器71还可以既包括计算设备07的内部存储单元也包括外部存储设备。存储器71用于存储计算机程序以及计算设备所需的其他程序和数据。存储器71还可以用于暂时地存储已经输出或者将要输出的数据。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个模块或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或模块的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理模块,即可以位于一个地方,或者也可以分布到多个网络模块上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能模块可以集成在一个处理模块中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。
所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
需要说明的是,对于前述的各方法实施例,为了简便描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其它顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定都是本发明所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其它实施例的相关描述。
以上为对本发明所提供的一种预测股票趋势的方法及装置的描述,对于本领域的技术人员,依据本发明实施例的思想,在具体实施方式及应用范围上均会有改变之处,综上,本说明书内容不应理解为对本发明的限制。

Claims (10)

1.一种预测股票趋势的方法,其特征在于,所述方法包括:
采集指定企业在各个预设年份的年报数据与运营数据,并对采集到的年报数据进行预处理,得到所述年报数据对应的语料库;
对所述语料库进行情感分析,确定所述语料库的情感语调值,以及利用预置的可读性检测算法检测所述语料库的可读性;
根据所述指定企业在所述各个预设年份的股票价格变化趋势、所述运营数据以及所述语料库的情感语调值与可读性,对已建立的股票预测模型进行训练;
采集待预测企业发布的最新年报数据与最新运营数据,并输入训练后的股票预测模型,得到所述待预测企业在未来预设时间段内的股票变化趋势。
2.如权利要求1所述的方法,其特征在于,所述对所述语料库进行情感分析,确定所述语料库的情感语调值的步骤包括:
在所述语料库中查找预设的各个情感关键词,确定所述各个情感关键词在所述语料库中出现的次数;
基于所述各个情感关键词在所述语料库中出现的次数,以及所述指定企业在所述各个预设年份的股票价格变化趋势进行回归分析,确定所述各个情感关键词的权重;
根据所述各个情感关键词在所述语料库中出现的次数,以及所述各个情感关键词的权重,确定所述语料库的情感语调值。
3.如权利要求2所述的方法,其特征在于,所述根据所述各个情感关键词在所述语料库中出现的次数,以及所述各个情感关键词的权重,确定所述语料库的情感语调值的步骤包括:
遍历所述各个情感关键词,并计算遍历到的情感关键词在所述语料库中出现的次数与所述遍历到的情感关键词的权重的乘积;
在遍历完所述各个情感关键词之后,将计算出的各个乘积的累加和与1的差值确定为所述语料库的情感值;
计算所述各个预设年份内的相邻两个年份中,后一个年份对应的语料库的情感值与前一个年份对应的语料库的情感值的差值,并将计算出的差值作为后一个年份的情感语调值。
4.如权利要求1至3任意一项所述的方法,其特征在于,所述根据所述指定企业在所述各个预设年份的股票价格变化趋势、所述运营数据以及所述语料库的情感语调值与可读性,对已建立的股票预测模型进行训练的步骤之前还包括:
获取所述指定企业在所述各个预设年份的股票价格变化数据;
利用所述指定企业在所述各个预设年份的股息数据,对所述股票价格变化数据进行修正;
对修正后的股票价格变化数据进行回归训练,并将训练后的回归模型的斜率作为所述指定企业在所述各个预设年份的股票价格变化趋势。
5.一种预测股票趋势的装置,其特征在于,所述装置包括:
采集模块,用于采集指定企业在各个预设年份的年报数据与运营数据,并对采集到的年报数据进行预处理,得到所述年报数据对应的语料库;
分析模块,用于对所述语料库进行情感分析,确定所述语料库的情感语调值,以及利用预置的可读性检测算法检测所述语料库的可读性;
训练模块,用于根据所述指定企业在所述各个预设年份的股票价格变化趋势、所述运营数据以及所述语料库的情感语调值与可读性,对已建立的股票预测模型进行训练;
预测模块,用于采集待预测企业发布的最新年报数据与最新运营数据,并输入训练后的股票预测模型,得到所述待预测企业在未来预设时间段内的股票变化趋势。
6.如权利要求5所述的装置,其特征在于,所述分析模块包括:
查找模块,用于在所述语料库中查找预设的各个情感关键词,确定所述各个情感关键词在所述语料库中出现的次数;
第一确定模块,用于基于所述各个情感关键词在所述语料库中出现的次数,以及所述指定企业在所述各个预设年份的股票价格变化趋势进行回归分析,确定所述各个情感关键词的权重;
第二确定模块,用于根据所述各个情感关键词在所述语料库中出现的次数,以及所述各个情感关键词的权重,确定所述语料库的情感语调值。
7.如权利要求6所述的装置,其特征在于,所述第二确定模块包括:
第一计算模块,用于遍历所述各个情感关键词,并计算遍历到的情感关键词在所述语料库中出现的次数与所述遍历到的情感关键词的权重的乘积;
第二计算模块,用于在遍历完所述各个情感关键词之后,将计算出的各个乘积的累加和与1的差值确定为所述语料库的情感值;
语调确定模块,用于计算所述各个预设年份内的相邻两个年份中,后一个年份对应的语料库的情感值与前一个年份对应的语料库的情感值的差值,并将计算出的差值作为后一个年份的情感语调值。
8.如权利要求5至7任意一项所述的装置,其特征在于,所述装置还包括:
获取模块,用于获取所述指定企业在所述各个预设年份的股票价格变化数据;
修正模块,用于利用所述指定企业在所述各个预设年份的股息数据,对所述股票价格变化数据进行修正;
变化趋势确定模块,用于对修正后的股票价格变化数据进行回归训练,并将训练后的回归模型的斜率作为所述指定企业在所述各个预设年份的股票价格变化趋势。
9.一种电子设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至4任意一项所述的预测股票趋势的方法中的各个步骤。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至4任意一项所述的预测股票趋势的方法中的各个步骤。
CN201810865564.XA 2018-08-01 2018-08-01 预测股票趋势的方法、装置、电子设备及存储介质 Pending CN108876061A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810865564.XA CN108876061A (zh) 2018-08-01 2018-08-01 预测股票趋势的方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810865564.XA CN108876061A (zh) 2018-08-01 2018-08-01 预测股票趋势的方法、装置、电子设备及存储介质

Publications (1)

Publication Number Publication Date
CN108876061A true CN108876061A (zh) 2018-11-23

Family

ID=64306890

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810865564.XA Pending CN108876061A (zh) 2018-08-01 2018-08-01 预测股票趋势的方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN108876061A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111178498A (zh) * 2019-12-09 2020-05-19 北京邮电大学 一种股票波动预测方法及装置
CN111310709A (zh) * 2020-03-02 2020-06-19 邓谊 一种图文年报情感标定方法及系统
CN112036157A (zh) * 2020-08-04 2020-12-04 林树 一种基金经理语调文本分析方法及装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111178498A (zh) * 2019-12-09 2020-05-19 北京邮电大学 一种股票波动预测方法及装置
CN111178498B (zh) * 2019-12-09 2023-08-22 北京邮电大学 一种股票波动预测方法及装置
CN111310709A (zh) * 2020-03-02 2020-06-19 邓谊 一种图文年报情感标定方法及系统
CN112036157A (zh) * 2020-08-04 2020-12-04 林树 一种基金经理语调文本分析方法及装置

Similar Documents

Publication Publication Date Title
Wu et al. Forecasting the US oil markets based on social media information during the COVID-19 pandemic
US11526579B1 (en) System and methods for performing automatic data aggregation
Zhu et al. Modeling and forecasting expected shortfall with the generalized asymmetric Student-t and asymmetric exponential power distributions
Liu et al. Foreign exchange rates forecasting with convolutional neural network
Xiuguo et al. An analysis on financial statement fraud detection for Chinese listed companies using deep learning
Sun et al. A new multiscale decomposition ensemble approach for forecasting exchange rates
Li et al. Stock prediction via sentimental transfer learning
CN108876061A (zh) 预测股票趋势的方法、装置、电子设备及存储介质
Albora et al. Product Progression: a machine learning approach to forecasting industrial upgrading
Fallahgoul et al. Modelling tail risk with tempered stable distributions: an overview
Zhao R and data mining: Examples and case studies
CN109543945A (zh) 企业创新评估方法及终端设备
Hajek et al. Integrating sentiment analysis and topic detection in financial news for stock movement prediction
Nakajima Stochastic volatility model with regime-switching skewness in heavy-tailed errors for exchange rate returns
Jiang et al. Deep learning for predicting patent application outcome: The fusion of text and network embeddings
Prata et al. Lob-based deep learning models for stock price trend prediction: a benchmark study
Bagh et al. Effect of economic policy uncertainty on China’s stock price index: a comprehensive analysis using wavelet coherence approach
Wang et al. Stock volatility prediction using multi-kernel learning based extreme learning machine
Siahaan et al. Text Processing and Sentiment Analysis using Machine Learning and Deep Learning with Python GUI
Pranav et al. StockClue: Stock Prediction using Machine Learning
CN115048487A (zh) 基于人工智能的舆情分析方法、装置、计算机设备及介质
CN114139798A (zh) 企业风险预测方法、装置及电子设备
Pei [Retracted] Construction of a Legal System of Corporate Social Responsibility Based on Big Data Analysis Technology
Quan et al. Target based review classification for fine-grained sentiment analysis
Li et al. The effect of chairman’s statement tone changes in annual reports from Hong Kong

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20181123

RJ01 Rejection of invention patent application after publication