CN113793220A - 基于人工智能模型的股市投资决策方法及相关设备 - Google Patents

基于人工智能模型的股市投资决策方法及相关设备 Download PDF

Info

Publication number
CN113793220A
CN113793220A CN202111081161.4A CN202111081161A CN113793220A CN 113793220 A CN113793220 A CN 113793220A CN 202111081161 A CN202111081161 A CN 202111081161A CN 113793220 A CN113793220 A CN 113793220A
Authority
CN
China
Prior art keywords
price
lowest
target
data
sample feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN202111081161.4A
Other languages
English (en)
Inventor
谭泽宇
庞宇嘉
彭琛
汪伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN202111081161.4A priority Critical patent/CN113793220A/zh
Publication of CN113793220A publication Critical patent/CN113793220A/zh
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/06Asset management; Financial planning or analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • G06N7/01Probabilistic graphical models, e.g. probabilistic networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Business, Economics & Management (AREA)
  • General Engineering & Computer Science (AREA)
  • Finance (AREA)
  • Development Economics (AREA)
  • Artificial Intelligence (AREA)
  • Accounting & Taxation (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Pure & Applied Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Mathematical Optimization (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Mathematical Analysis (AREA)
  • Computational Mathematics (AREA)
  • Algebra (AREA)
  • Computing Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Game Theory and Decision Science (AREA)
  • Human Resources & Organizations (AREA)
  • Operations Research (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Technology Law (AREA)
  • General Business, Economics & Management (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请实施例提供了一种基于人工智能模型的股市投资决策方法及相关设备,所述方法包括:根据所述样本数据生成对应的样本特征向量,以获得多个样本特征集,其中,每个样本特征集分别对应一个历史交易日;将所述当前训练样本特征集中的样本特征向量作为输入,将所述未来最低成交价作为期望输出,对最低成交价预测模型进行训练,由此得到的目标最低成交价预测模型能够输出最低成交价的预测结果。由于本申请预测的并不是趋势,而是预测最低的下探价格,所以更适合应用于震荡股市行情中。基于本申请实施例的目标最低成交价预测模型的预测结果进行投资决策,将有助于获得更高的收益。

Description

基于人工智能模型的股市投资决策方法及相关设备
技术领域
本申请涉及人工智能领域,特别涉及一种基于人工智能模型的股市投资决策方法及相关设备。
背景技术
如今在金融投资中,人工智能在发挥着越来越重要的作用。各大券商、投行等金融机构已经越来越不满足于使用简单的规则以及量化来辅助交易员进行投资决策,而是把眼光投向了现今蓬勃发展的机器学习和深度学习领域。
传统的金融投资场景中,员工需要去翻阅大量的企业财报,政府的公告数据并同时关注市场对企业的舆论和态度,这种重复的机械的劳动不但需要消耗大量的人力物力,而且由于金融产品的多样性以及大量的人工产出比,对市场的评估很多时候难以做到客观和标准化。而这恰恰是人工智能的优势,替代繁琐的重复的劳动,标准化的提供实时的交易建议。
不过,在过往的应用场景下,股票市场中的人工智能模型主要聚焦于会有明显趋势的投资场景,但是在当今世界格局下,由于疫情和政治因素影响,震荡的股市市场(体现在股价在一个区间反复波动)会是主流,而传统的基于人工智能的预测模型则无法取得良好效果。
发明内容
本申请的旨在至少一定程度解决现有技术的问题,提供一种种基于人工智能模型的股市投资决策方法、装置、计算机设备和计算机可读存储介质,能够在震荡的股市环境下提供智能的投资决策,以提高投资收益率。
本申请实施例的技术方案如下:
第一方面,本申请提供了一种基于人工智能模型的股市投资决策方法,所述方法包括:
获取目标股票的样本数据,其中,所述样本数据至少包括股价数据,所述股价数据至少包括所述目标股票在每个历史交易日的最低单价;
依次将每个历史交易日作为第一起点日,当所述第一起点日的最低单价低于此后T个交易日的最低单价,将所述第一起点日的最低单价作为最低成交价,其中,T为大于1的整数;
根据所述样本数据生成对应的样本特征向量,以获得多个样本特征集,其中,每个样本特征集分别对应一个历史交易日;
从多个样本特征集中确定当前训练样本特征集,将所述当前训练样本特征集对应的历史交易日作为第二起点日,确定与所述第二起点日日期最接近的未来最低成交价;
将所述当前训练样本特征集中的样本特征向量作为输入,将所述未来最低成交价作为期望输出,对最低成交价预测模型进行训练,以得到目标最低成交价预测模型;
获取所述目标股票的目标数据,并根据所述目标数据生成对应的目标特征向量;
将所述目标特征向量输入到所述目标最低成交价预测模型,以使所述最低成交价预测模型输出目标最低成交价;
根据所述目标最低成交价进行投资决策。
根据本申请的一些实施例,在所述获得多个样本特征集之后,所述方法还包括:将所述多个样本特征集划分为训练集、验证集和测试集;
所述从多个样本特征集中确定当前训练样本特征集,包括:从所述训练集中确定当前训练样本特征集;
在所述将所述当前训练样本特征集中的特征向量作为输入,将所述未来最低成交价作为期望输出,对最低成交价预测模型进行训练之后,所述方法还包括:
利用所述验证集对所述最低成交价预测模型进行多轮迭代训练,以对所述最低成交价预测模型进行参数调优;
利用所述测试集对所述最低成交价预测模型进行评估,以得到目标最低成交价预测模型。
根据本申请的一些实施例,所述将所述多个样本特征集划分为训练集、验证集和测试集,包括:
按照日期顺序,对所述多个样本特征集进行排序;
按照预设的比例,依次从所述多个样本特征集划分训练集、验证集和测试集。
根据本申请的一些实施例,所述样本数据还包括企业数据,所述企业数据包括以下至少之一:企业领域、利润率历史数据、企业所在地区、年利润数据、大股东股份占比数据。
根据本申请的一些实施例,所述股价数据还包括以下至少之一:
每个历史交易日的最高单价;
每个历史交易日中以小时为单位的成交量比值数据序列;
每个历史交易日中以小时为单位的平均成交单价数据序列。
根据本申请的一些实施例,所述样本数据还包括舆情数据,所述舆情数据为使用自然语言处理NLP模型从与所述目标股票相关的舆论中提取;
所述根据所述样本数据生成对应的样本特征向量,包括:
通过预先训练的BERT模型对所述舆情数据进行拟合,以获得所述舆情数据对应的特征向量。
根据本申请的一些实施例,所述根据所述目标最低成交价进行投资决策,包括以下之一:
获取所述目标股票的当前的第一股价与所述目标最低成交价的第一差值,在所述第一差值与所述第一股价的比例小于第一预设阈值时,执行买入操作,并将所述第一股价作为买入价格;
获取所述目标股票的当前的第二股价与所述买入价格的第二差值,在所述第二差值与所述买入价格的比例小于第二预设阈值时,执行卖出操作。
第二方面,本申请提供了基于人工智能模型的股市投资决策装置,包括:
样本数据获取模块,用于获取目标股票的样本数据,其中,所述样本数据至少包括股价数据,所述股价数据至少包括所述目标股票在每个历史交易日的最低单价;
第一处理模块,用于依次将每个历史交易日作为第一起点日,当所述第一起点日的最低单价低于此后T个交易日的最低单价,将所述第一起点日的最低单价作为最低成交价,其中,T为大于1的整数;
样本特征提取模块,用于根据所述样本数据生成对应的样本特征向量,以获得多个样本特征集,其中,每个样本特征集分别对应一个历史交易日;
第二处理模块,用于从多个样本特征集中确定当前训练样本特征集,将所述当前训练样本特征集对应的历史交易日作为第二起点日,确定与所述第二起点日日期最接近的未来最低成交价;
训练模块,用于将所述当前训练样本特征集中的样本特征向量作为输入,将所述未来最低成交价作为期望输出,对最低成交价预测模型进行训练,以得到目标最低成交价预测模型;
目标数据获取模块,用于获取所述目标股票的目标数据;
目标特征提取模块,用于根据所述目标数据生成对应的目标特征向量;
预测模块,将所述目标特征向量输入到所述目标最低成交价预测模型,以使所述最低成交价预测模型输出目标最低成交价;
决策模块,用于根据所述目标最低成交价进行投资决策。
第三方面,本申请提供了一种计算机设备,所述计算机设备包括存储器和处理器,所述存储器中存储有计算机可读指令,所述计算机可读指令被一个或多个所述处理器执行时,使得一个或多个所述处理器执行如上第一方面描述的任一项所述方法的步骤。
第四方面,本申请还提供了一种计算机可读存储介质,所述存储介质可被处理器读写,所述存储介质存储有计算机指令,所述计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行如上第一方面描述的任一项所述方法的步骤。
本申请实施例所提供的技术方案具有如下的有益效果:
本申请实施例,通过依次将每个历史交易日作为第一起点日,当所述第一起点日的最低单价低于此后T个交易日的最低单价,将所述第一起点日的最低单价作为最低成交价;根据所述样本数据生成对应的样本特征向量,以获得多个样本特征集,其中,每个样本特征集分别对应一个历史交易日;从多个样本特征集中确定当前训练样本特征集,将所述当前训练样本特征集对应的历史交易日作为第二起点日,确定与所述第二起点日日期最接近的未来最低成交价;将所述当前训练样本特征集中的样本特征向量作为输入,将所述未来最低成交价作为期望输出,对最低成交价预测模型进行训练,由此得到的目标最低成交价预测模型能够输出最低成交价的预测结果。由于本申请预测的并不是趋势,而是预测最低的下探价格,所以更适合应用于股价在一个区间上下波动的震荡市场行情中。基于本申请实施例的目标最低成交价预测模型的预测结果进行投资决策,将有助于获得更高的收益。
附图说明
图1是本申请的一个实施例提供的基于人工智能模型的股市投资决策方法的流程示意图;
图2是本申请的另一个实施例提供的基于人工智能模型的股市投资决策方法的流程示意图;
图3是图2中步骤S131的子步骤流程示意图;
图4是本申请的另一个实施例提供的基于人工智能模型的股市投资决策方法的流程示意图;
图5是图1中步骤S180的子步骤流程示意图;
图6是本申请的一个实施例提供的基于人工智能模型的股市投资决策装置的结构示意图;
图7是本申请实施例提供的计算机设备的结构示意图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请实施例中,“至少一个”是指一个或者多个,“多个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示单独存在A、同时存在A和B、单独存在B的情况。其中A,B可以是单数或者复数。文本“/”一般表示前后关联对象是一种“或”的关系。“以下至少一项”及其类似表达,是指的这些项中的任意组合,包括单项或复数项的任意组合。例如,a,b和c中的至少一项可以表示:a,b,c,a和b,a和c,b和c或a和b和c,其中a,b,c可以是单个,也可以是多个。
应了解,本申请实施例可以基于人工智能技术对相关的数据进行获取和处理。其中,人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、机器人技术、生物识别技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
参见图1,图1示出了本申请实施例提供的一种基于人工智能模型的股市投资决策方法的流程示意图。可以理解的是,本申请实施例的方法可以应用于服务器,该方法也可以应用在终端中,还可以应用于包括终端和服务器的系统,并通过终端和服务器的交互实现。如图1所示,所述方法包括以下步骤:
S110,获取目标股票的样本数据,其中,所述样本数据至少包括股价数据,所述股价数据至少包括所述目标股票在每个历史交易日的最低单价。
可以理解的是,所述股价数据还可以包括每个历史交易日的最高单价、以小时为单位的成交量比值数据序列、以小时为单位的平均成交单价数据序列中的至少一项。
可以理解的是,上述股价数据可以通过预设的特征提取算法从目标股票的K线图中摘取。例如,可以以分钟为单位,从K线图中摘取成交价和成交量,基于该成交价和该成交量,对应生成以小时为单位的成交量比值、以小时为单位的平均成交单价。
以小时为单位的成交量比值的计算方法,可参见下面的公式:
Figure BDA0003264033910000041
以小时为单位的平均成交单价的计算方法,可参见下面的公式:
Figure BDA0003264033910000042
以上公式中,Price表示价格,Amount表示成交金额,h0表示初始时刻,h1表示结束时刻(与h0相隔一小时)。
通过计算各个小时成交量比值和平均成交单价,可得到以小时为单位的成交量比值数据序列、以小时为单位的平均成交单价数据序列。另外,每个交易日的最高单价和最低单价也可直接从K线图中摘取。
可以理解的是,成交量比值数据序列、平均成交单价数据序列可体现股价变化趋势,将成交量比值数据序列和平均成交单价数据序列之一,或者二者作为样本数据来进行模型训练,使得预测模型依据股价变化趋势输出预测结果,可提高模型预测的准确性。
在一些实施例中,所述样本数据还包括企业数据,以基于企业数据进行模型训练。具体地,所述企业数据可以包括以下至少之一:企业领域、利润率历史数据、企业所在地区、年利润数据、大股东股份占比数据。企业数据反映与目标股票相关的所属行业因素、经济因素、政治因素、地区因素等,将这些因素加入到样本数据中来进行模型训练,使得模型预测的结果更加可靠,准确率更加高。
具体实现中,本实施例描述的各种企业数据可以从各大商用数据库、企业网站或者政府网站中爬取。
可以理解的是,股票市场容易受各种政策、新闻、舆论的影响而产生剧烈波动。为获得更加准确的预测结果,本发明实施例的样本数据还可以包括舆情数据。舆情数据反映投资者对目标股票的情绪变化,投资者的情绪包括正向情绪和负向情绪,当投资者的情绪以正向情绪为主时,股票的价格一般呈向上趋势;当投资者的情绪以负向情绪为主时,股票的价格一般呈向下趋势。本实施例,在样本数据中加入了舆情数据,以基于舆论数据进行模型训练,进而获得准确的投资决策。
具体实现中,可利用自然语言处理NLP模型从与所述目标股票相关的舆论中提取出所述舆情数据。
S120,依次将每个历史交易日作为第一起点日,当所述第一起点日的最低单价低于此后T个交易日的最低单价,将所述第一起点日的最低单价作为最低成交价,其中,T为大于1的整数。
可以理解的是,本发明实施例提供的预测模型预测的是最低成交价,该最低成交价指某个交易日之后的T个交易日中的最低单价。在股市处于震荡环境(体现于股价在一个区间范围内上下震荡)时,股市的价格走势难以明朗,因此本发明实施例是对一个时间段(这里为T个交易日)内的最低成交价进行预测,并基于预测得到的最低成交价进行投资决策。
举例来说,假设将2021年7月1日作为第一起点日,假设T的取值为10,2021年7月1日之后的10个交易日中,第5个交易日的最低单价在这10个交易日的最低单价之中价格最低,故将第5个交易日的最低单价作为最低成交价。
S130,根据所述样本数据生成对应的样本特征向量,以获得多个样本特征集,其中,每个样本特征集分别对应一个历史交易日。
具体实现时,对于股价数据、企业数据,均可以根据预设的转化规则,将股价数据、企业数据所包含的各项数据转化为对应的特征向量,这部分属于本领域现有技术的内容,故不再赘述。
在样本数据包括舆情数据时,所述根据所述样本数据生成对应的样本特征向量,可以包括:通过预先训练的BERT模型对所述舆情数据进行拟合,以获得所述舆情数据对应的特征向量。
可以理解的是,在获得样本数据对应的样本特征向量后,按照交易日期,将得到样本特征向量划分为多个样本特征集,每个样本特征集分别对应一个历史交易日。
在一些实施例中,请参照图2,在步骤S130之后,还包括以下步骤:
S131,将所述多个样本特征集划分为训练集、验证集和测试集。这里,训练集用于对最低成交价预测模型进行训练,验证集用于对最低成交价预测模型的模型参数调优,测试集用于评估根据最低成交价预测模型的结果进行投资决策获得的收益。
具体实现时,请参照图3,步骤S131具体可以通过以下子步骤实现:
S1311,按照日期顺序,对所述多个样本特征集进行排序;
S1312,按照预设的比例,依次从所述多个样本特征集划分训练集、验证集和测试集。
示例性的,按照交易日的日期由远到近的顺序,对此前获得的多个样本特征集进行排序。然后按照预设的比例(例如6:2:2),依次从所述多个样本特征集划分出训练集、验证集和测试集,即60%的训练集,20%的验证集,20%的测试集。
S140,从多个样本特征集中确定当前训练样本特征集,将所述当前训练样本特征集对应的历史交易日作为第二起点日,确定与所述第二起点日日期最接近的未来最低成交价。
示例性的,所述从多个样本特征集中确定当前训练样本特征集,具体是从此前划分的训练集中确定当前训练样本特征集。
在确定当前训练样本特征集之后,确定当前训练样本特征集对应的交易日,将该交易日作为第二起点日;然后从此前获得的多个最低成交价中确定未来最低成交价。
应能理解,未来最低成交价对应的交易日期应在该第二起点日之后,且是在该第二起点日之后的最低成交价中与第二起点日日期最接近的。
S150,将所述当前训练样本特征集中的样本特征向量作为输入,将所述未来最低成交价作为期望输出,对最低成交价预测模型进行训练,以得到目标最低成交价预测模型。
作为示例,本发明实施例的最低成交价预测模型可以是XGBOOST模型。当前训练样本特征集包括股价数据的特征向量、企业数据的特征向量和舆情数据的特征向量,将这些特征向量作为用于训练的输入,将所述未来最低成交价作为期望输出,对最低成交价预测模型进行训练。
可以理解的是,参照图4,在步骤S150之后,本发明实施例还可以包括:
S151,利用所述验证集对所述最低成交价预测模型进行多轮迭代训练,以对所述最低成交价预测模型进行参数调优,以得到目标最低成交价预测模型。
具体实现时,可以基于预设的模型参数的范围,以模型在验证集上计算得到的均方根误差为评分标准,使用贝叶斯优化器进行参数调优。贝叶斯优化器可以通过有规律的搜索参数组合并计算模型得分,构建不同参数下模型得分的数值分布,在最少的迭代次数下找到最优的参数组合。
可以理解的是,参照图4,在得步骤S151之后,本发明实施例还可以包括:
S152,利用所述测试集评估基于所述所述目标最低成交价预测模型进行投资决策的收益,以获得最优的投资决策参数。
具体地,将测试集的特征向量输入至目标最低成交价预测模型中,得到模型输出的目标最低成交价的预测结果,基于该预测结果按预设的阈值参数来进行买入、卖出操作,以测试模型在金融市场上的实际表现,具体操作过程如下:
(1)获取所述目标股票的第一股价与所述目标最低成交价的第一差值,在所述第一差值与所述第一股价的比例小于第一预设阈值时,执行买入操作,并将所述第一股价作为买入价格;
(2)获取所述目标股票的第二股价(买入之后的交易日的股价)与所述买入价格的第二差值,在所述第二差值与所述买入价格的比例小于第二预设阈值时,执行卖出操作,并将所述第一股价作为卖出价格;
(3)根据买入价格和卖出价格确定最后的收益,根据最后的收益对第一预设阈值和第二预设阈值进行调整,还可以设置买入、卖出的频率,以获取最优的买入、卖出策略。
S160,获取所述目标股票的目标数据,并根据所述目标数据生成对应的目标特征向量。
示例性的,目标数据可以包括股价数据、企业数据和舆情数据中的一项或者多项。
股价数据可以包括以下至少一项数据:每个历史交易日的最高单价、最低单价、以小时为单位的成交量比值数据序列、以小时为单位的平均成交单价数据序列。
企业数据可以包括以下至少一项数据:企业领域、利润率历史数据、企业所在地区、年利润数据和大股东股份占比数据。
对于股价数据、企业数据,均可以根据预设的转化规则,将股价数据、企业数据所包含的各项数据转化为对应的特征向量,这部分属于本领域现有技术的内容,故不再赘述。
舆情数据为使用自然语言处理NLP模型从与所述目标股票相关的舆论中提取。通过预先训练的BERT模型对所述舆情数据进行拟合,可以获得所述舆情数据对应的特征向量。
S170,将所述目标特征向量输入到所述目标最低成交价预测模型,以使所述最低成交价预测模型输出目标最低成交价;
S180,根据所述目标最低成交价进行投资决策。
具体地,参照图5,步骤S180具体可通过以下子步骤实现:
S181,获取所述目标股票的当前的第一股价与所述目标最低成交价的第一差值,在所述第一差值与所述第一股价的比例小于第一预设阈值时,执行买入操作,并将所述第一股价作为买入价格;
S182,获取所述目标股票的当前的第二股价与所述买入价格的第二差值,在所述第二差值与所述买入价格的比例小于第二预设阈值时,执行卖出操作。
请参照图6,本申请实施例提供的一种基于人工智能模型的股市投资决策装置,包括:
样本数据获取模块,用于获取目标股票的样本数据,其中,所述样本数据至少包括股价数据,所述股价数据至少包括所述目标股票在每个历史交易日的最低单价;
第一处理模块,用于依次将每个历史交易日作为第一起点日,当所述第一起点日的最低单价低于此后T个交易日的最低单价,将所述第一起点日的最低单价作为最低成交价,其中,T为大于1的整数;
样本特征提取模块,用于根据所述样本数据生成对应的样本特征向量,以获得多个样本特征集,其中,每个样本特征集分别对应一个历史交易日;
第二处理模块,从多个样本特征集中确定当前训练样本特征集,将所述当前训练样本特征集对应的历史交易日作为第二起点日,确定与所述第二起点日日期最接近的未来最低成交价;
训练模块,将所述当前训练样本特征集中的样本特征向量作为输入,将所述未来最低成交价作为期望输出,对最低成交价预测模型进行训练,以得到目标最低成交价预测模型;
目标数据获取模块,获取所述目标股票的目标数据;
目标特征提取模块,根据所述目标数据生成对应的目标特征向量;
预测模块,将所述目标特征向量输入到所述目标最低成交价预测模型,以使所述最低成交价预测模型输出目标最低成交价;
决策模块,根据所述目标最低成交价进行投资决策。
在一些实施例中,所述第二处理模块具体包括:
划分单元,用于将所述多个样本特征集划分为训练集、验证集和测试集;
确定单元,用于从所述训练集中确定当前训练样本特征集,将所述当前训练样本特征集对应的历史交易日作为第二起点日,确定与所述第二起点日日期最接近的未来最低成交价。
在一些实施例中,所述划分单元具体用于:
按照日期顺序,对所述多个样本特征集进行排序;
按照预设的比例,依次从所述多个样本特征集划分训练集、验证集和测试集。
基于上述方案,所述训练模块还用于:
利用所述验证集对所述最低成交价预测模型进行多轮迭代训练,以对所述最低成交价预测模型进行参数调优,以得到目标最低成交价预测模型。
在一些实施例中,本发明实施例的装置还包括:
评估模块,用于利用所述测试集评估基于所述所述目标最低成交价预测模型进行投资决策的收益,以获得最优的投资决策参数。
在一些实施例中,所述决策模块具体包括:
买入单元,用于获取所述目标股票的当前的第一股价与所述目标最低成交价的第一差值,在所述第一差值与所述第一股价的比例小于第一预设阈值时,执行买入操作,并将所述第一股价作为买入价格。
在一些实施例中,所述决策模块还具体包括:
卖出单元,获取所述目标股票的当前的第二股价与所述买入价格的第二差值,在所述第二差值与所述买入价格的比例小于第二预设阈值时,执行卖出操作。
本申请实施例,通过依次将每个历史交易日作为第一起点日,当所述第一起点日的最低单价低于此后T个交易日的最低单价,将所述第一起点日的最低单价作为最低成交价;根据所述样本数据生成对应的样本特征向量,以获得多个样本特征集,其中,每个样本特征集分别对应一个历史交易日;从多个样本特征集中确定当前训练样本特征集,将所述当前训练样本特征集对应的历史交易日作为第二起点日,确定与所述第二起点日日期最接近的未来最低成交价;将所述当前训练样本特征集中的样本特征向量作为输入,将所述未来最低成交价作为期望输出,对最低成交价预测模型进行训练,由此得到的目标最低成交价预测模型能够输出最低成交价的预测结果。由于本申请预测的并不是趋势,而是预测最低的下探价格,所以更适合应用于在一个价位区间上下波动的震荡市场行情中。基于本申请实施例的目标最低成交价预测模型的预测结果进行投资决策,将有助于获得更高的收益。
图7示出了本申请实施例提供的计算机设备500。该计算机设备500可以是服务器或者终端,该计算机设备500的内部结构包括但不限于:
存储器510,用于存储程序;
处理器520,用于执行存储器510存储的程序,当处理器520执行存储器510存储的程序时,处理器520用于执行上述的基于人工智能模型的股市投资决策方法。
处理器520和存储器510可以通过总线或者其他方式连接。
存储器510作为一种非暂态计算机可读存储介质,可用于存储非暂态软件程序以及非暂态性计算机可执行程序,如本发明任意实施例描述的基于人工智能模型的股市投资决策方法。处理器520通过运行存储在存储器510中的非暂态软件程序以及指令,从而实现上述的基于人工智能模型的股市投资决策方法。
存储器510可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储执行上述的基于人工智能模型的股市投资决策方法。此外,存储器510可以包括高速随机存取存储器,还可以包括非暂态存储器,比如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在一些实施方式中,存储器510可选包括相对于处理器520远程设置的存储器,这些远程存储器可以通过网络连接至该处理器520。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
实现上述的基于人工智能模型的股市投资决策方法所需的非暂态软件程序以及指令存储在存储器510中,当被一个或者多个处理器520执行时,执行本发明任意实施例提供的基于人工智能模型的股市投资决策方法。
本申请实施例还提供了一种计算机可读存储介质,存储有计算机可执行指令,计算机可执行指令用于执行上述的基于人工智能模型的股市投资决策方法。
在一实施例中,该存储介质存储有计算机可执行指令,该计算机可执行指令被一个或多个控制处理器520执行,比如,被上述计算机设备500中的一个处理器520执行,可使得上述一个或多个处理器520执行本发明任意实施例提供的基于人工智能模型的股市投资决策方法。
以上所描述的实施例仅仅是示意性的,其中作为分离部件说明的单元可以是或者也可以不是物理上分开的,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
本领域普通技术人员可以理解,上文中所公开方法中的全部或某些步骤、系统可以被实施为软件、固件、硬件及其适当的组合。某些物理组件或所有物理组件可以被实施为由处理器,如中央处理器、数字信号处理器或微处理器执行的软件,或者被实施为硬件,或者被实施为集成电路,如专用集成电路。这样的软件可以分布在计算机可读介质上,计算机可读介质可以包括计算机存储介质(或非暂时性介质)和通信介质(或暂时性介质)。如本领域普通技术人员公知的,术语计算机存储介质包括在用于存储信息(诸如计算机可读指令、数据结构、程序模块或其他数据)的任何方法或技术中实施的易失性和非易失性、可移除和不可移除介质。计算机存储介质包括但不限于RAM、ROM、EEPROM、闪存或其他存储器技术、CD-ROM、数字多功能盘(DVD)或其他光盘存储、磁盒、磁带、磁盘存储或其他磁存储装置、或者可以用于存储期望的信息并且可以被计算机访问的任何其他的介质。此外,本领域普通技术人员公知的是,通信介质通常包括计算机可读指令、数据结构、程序模块或者诸如载波或其他传输机制之类的调制数据信号中的其他数据,并且可包括任何信息递送介质。
以上是对本发明的较佳实施进行了具体说明,但本发明并不局限于上述实施方式,熟悉本领域的技术人员在不违背本发明精神的。共享条件下还可作出种种等同的变形或替换,这些等同的变形或替换均包括在本发明权利要求所限定的范围内。

Claims (10)

1.一种基于人工智能模型的股市投资决策方法,其特征在于,所述方法包括:
获取目标股票的样本数据,其中,所述样本数据至少包括股价数据,所述股价数据至少包括所述目标股票在每个历史交易日的最低单价;
依次将每个历史交易日作为第一起点日,当所述第一起点日的最低单价低于此后T个交易日的最低单价,将所述第一起点日的最低单价作为最低成交价,其中,T为大于1的整数;
根据所述样本数据生成对应的样本特征向量,以获得多个样本特征集,其中,每个样本特征集分别对应一个历史交易日;
从多个样本特征集中确定当前训练样本特征集,将所述当前训练样本特征集对应的历史交易日作为第二起点日,确定与所述第二起点日的日期最接近的未来最低成交价;
将所述当前训练样本特征集中的样本特征向量作为输入,将所述未来最低成交价作为期望输出,对最低成交价预测模型进行训练,以得到目标最低成交价预测模型;
获取所述目标股票的目标数据,并根据所述目标数据生成对应的目标特征向量;
将所述目标特征向量输入到所述目标最低成交价预测模型,以使所述最低成交价预测模型输出目标最低成交价;
根据所述目标最低成交价进行投资决策。
2.根据权利要求1所述的方法,其特征在于,在所述获得多个样本特征集之后,所述方法还包括:将所述多个样本特征集划分为训练集、验证集和测试集;
所述从多个样本特征集中确定当前训练样本特征集,包括:从所述训练集中确定当前训练样本特征集;
在所述将所述当前训练样本特征集中的特征向量作为输入,将所述未来最低成交价作为期望输出,对最低成交价预测模型进行训练之后,所述方法还包括:
利用所述验证集对所述最低成交价预测模型进行多轮迭代训练,以对所述最低成交价预测模型进行参数调优,以得到目标最低成交价预测模型;
利用所述测试集评估基于所述所述目标最低成交价预测模型进行投资决策的收益,以获得最优的投资决策参数。
3.根据权利要求2所述的方法,其特征在于,所述将所述多个样本特征集划分为训练集、验证集和测试集,包括:
按照日期顺序,对所述多个样本特征集进行排序;
按照预设的比例,依次从所述多个样本特征集划分训练集、验证集和测试集。
4.根据权利要求1所述的方法,其特征在于,所述样本数据还包括企业数据;
所述企业数据包括以下至少之一:企业领域、利润率历史数据、企业所在地区、年利润数据、大股东股份占比数据。
5.根据权利要求1所述的方法,其特征在于,所述股价数据还包括以下至少之一:
每个历史交易日的最高单价;
每个历史交易日中以小时为单位的成交量比值数据序列;
每个历史交易日中以小时为单位的平均成交单价数据序列。
6.根据权利要求1所述的方法,其特征在于,所述样本数据还包括舆情数据,所述舆情数据为使用自然语言处理NLP模型从与所述目标股票相关的舆论中提取;
所述根据所述样本数据生成对应的样本特征向量,包括:
通过预先训练的BERT模型对所述舆情数据进行拟合,以获得所述舆情数据对应的特征向量。
7.根据权利要求1所述的方法,其特征在于,所述根据所述目标最低成交价进行投资决策,包括以下之一:
获取所述目标股票的当前的第一股价与所述目标最低成交价的第一差值,在所述第一差值与所述第一股价的比例小于第一预设阈值时,执行买入操作,并将所述第一股价作为买入价格;
获取所述目标股票的当前的第二股价与所述买入价格的第二差值,在所述第二差值与所述买入价格的比例小于第二预设阈值时,执行卖出操作。
8.一种基于人工智能模型的股市投资决策装置,其特征在于,包括:
样本数据获取模块,用于获取目标股票的样本数据,其中,所述样本数据至少包括股价数据,所述股价数据至少包括所述目标股票在每个历史交易日的最低单价;
第一处理模块,用于依次将每个历史交易日作为第一起点日,当所述第一起点日的最低单价低于此后T个交易日的最低单价,将所述第一起点日的最低单价作为最低成交价,其中,T为大于1的整数;
样本特征提取模块,用于根据所述样本数据生成对应的样本特征向量,以获得多个样本特征集,其中,每个样本特征集分别对应一个历史交易日;
第二处理模块,用于从多个样本特征集中确定当前训练样本特征集,将所述当前训练样本特征集对应的历史交易日作为第二起点日,确定与所述第二起点日日期最接近的未来最低成交价;
训练模块,用于将所述当前训练样本特征集中的样本特征向量作为输入,将所述未来最低成交价作为期望输出,对最低成交价预测模型进行训练,以得到目标最低成交价预测模型;
目标数据获取模块,用于获取所述目标股票的目标数据;
目标特征提取模块,用于根据所述目标数据生成对应的目标特征向量;
预测模块,用于将所述目标特征向量输入到所述目标最低成交价预测模型,以使所述最低成交价预测模型输出目标最低成交价;
决策模块,用于根据所述目标最低成交价进行投资决策。
9.一种计算机设备,其特征在于,所述计算机设备包括存储器和处理器,所述存储器中存储有计算机可读指令,所述计算机可读指令被一个或多个所述处理器执行时,使得一个或多个所述处理器执行如权利要求1至7中任一项所述方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述存储介质可被处理器读写,所述存储介质存储有计算机指令,所述计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行如权利要求1至7中任一项所述方法的步骤。
CN202111081161.4A 2021-09-15 2021-09-15 基于人工智能模型的股市投资决策方法及相关设备 Withdrawn CN113793220A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111081161.4A CN113793220A (zh) 2021-09-15 2021-09-15 基于人工智能模型的股市投资决策方法及相关设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111081161.4A CN113793220A (zh) 2021-09-15 2021-09-15 基于人工智能模型的股市投资决策方法及相关设备

Publications (1)

Publication Number Publication Date
CN113793220A true CN113793220A (zh) 2021-12-14

Family

ID=78878378

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111081161.4A Withdrawn CN113793220A (zh) 2021-09-15 2021-09-15 基于人工智能模型的股市投资决策方法及相关设备

Country Status (1)

Country Link
CN (1) CN113793220A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112600906A (zh) * 2020-12-09 2021-04-02 中国科学院深圳先进技术研究院 在线场景的资源分配方法、装置及电子设备

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112600906A (zh) * 2020-12-09 2021-04-02 中国科学院深圳先进技术研究院 在线场景的资源分配方法、装置及电子设备
CN112600906B (zh) * 2020-12-09 2022-04-26 中国科学院深圳先进技术研究院 在线场景的资源分配方法、装置及电子设备

Similar Documents

Publication Publication Date Title
Tsantekidis et al. Using deep learning to detect price change indications in financial markets
US20120173465A1 (en) Automatic Variable Creation For Adaptive Analytical Models
CN111967971B (zh) 银行客户数据处理方法及装置
US20190340516A1 (en) System and method for quantitatively analyzing an idea
US20190370716A1 (en) Intelligent diversification tool
CN113159355A (zh) 数据预测方法、装置、物流货量预测方法、介质、设备
Day et al. Artificial intelligence for ETF market prediction and portfolio optimization
US20210174449A1 (en) Systems and methods for automated trading
CN113793220A (zh) 基于人工智能模型的股市投资决策方法及相关设备
Elena Predicting the movement direction of omxs30 stock index using xgboost and sentiment analysis
CN112598526A (zh) 资产数据的处理方法及装置
US20210004716A1 (en) Real-time global ai platform
Zhukov et al. A stochastic dynamics model for shaping stock indexes using self-organization processes, memory and oscillations
CN117009621A (zh) 信息搜索方法、装置、电子设备、存储介质及程序产品
Păuna Data Mining Methods on Time Price Series for Algorithmic Trading Systems.
CN113407827A (zh) 基于用户价值分类的信息推荐方法、装置、设备及介质
CN112734086A (zh) 一种用于更新神经网络预测模型的方法和装置
CN113762415A (zh) 一种基于神经网络的汽车金融产品智能匹配方法和系统
Khanarsa et al. Self-identification deep learning ARIMA
CN109308565B (zh) 人群绩效等级识别方法、装置、存储介质及计算机设备
Janosek et al. Knowledge discovery in dynamic data using neural networks
CN111898708A (zh) 一种迁移学习方法和电子设备
Sood et al. Predictive Analytics for Real Estate During COVID-19 Pandemic
CN113570455A (zh) 股票推荐方法及装置、计算机设备、存储介质
CN112837151A (zh) 一种股票选股与交易策略的五因子评估及多策略组合优化方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication
WW01 Invention patent application withdrawn after publication

Application publication date: 20211214