CN116720965A - 一种量化投资方法、装置、电子设备及存储介质 - Google Patents
一种量化投资方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN116720965A CN116720965A CN202310718393.9A CN202310718393A CN116720965A CN 116720965 A CN116720965 A CN 116720965A CN 202310718393 A CN202310718393 A CN 202310718393A CN 116720965 A CN116720965 A CN 116720965A
- Authority
- CN
- China
- Prior art keywords
- investment
- quantized
- market
- data set
- project
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 88
- 238000012545 processing Methods 0.000 claims abstract description 50
- 238000004458 analytical method Methods 0.000 claims abstract description 30
- 230000006870 function Effects 0.000 claims description 100
- 241000283153 Cetacea Species 0.000 claims description 67
- 238000012549 training Methods 0.000 claims description 56
- 238000011156 evaluation Methods 0.000 claims description 46
- 238000004422 calculation algorithm Methods 0.000 claims description 28
- 230000008569 process Effects 0.000 claims description 26
- 238000005457 optimization Methods 0.000 claims description 25
- 238000004590 computer program Methods 0.000 claims description 13
- 230000008859 change Effects 0.000 claims description 11
- 238000012360 testing method Methods 0.000 claims description 9
- 238000012512 characterization method Methods 0.000 claims description 8
- 238000012216 screening Methods 0.000 claims description 6
- 238000004364 calculation method Methods 0.000 abstract description 13
- 238000005516 engineering process Methods 0.000 abstract description 12
- 230000007547 defect Effects 0.000 abstract description 5
- 238000007405 data analysis Methods 0.000 abstract description 2
- 238000010586 diagram Methods 0.000 description 16
- 239000013598 vector Substances 0.000 description 11
- 238000004891 communication Methods 0.000 description 10
- PCHPORCSPXIHLZ-UHFFFAOYSA-N diphenhydramine hydrochloride Chemical compound [Cl-].C=1C=CC=CC=1C(OCC[NH+](C)C)C1=CC=CC=C1 PCHPORCSPXIHLZ-UHFFFAOYSA-N 0.000 description 4
- 238000010606 normalization Methods 0.000 description 4
- 238000013461 design Methods 0.000 description 3
- 230000033001 locomotion Effects 0.000 description 3
- 238000010801 machine learning Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000013139 quantization Methods 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 230000003190 augmentative effect Effects 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 238000013100 final test Methods 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 238000010295 mobile communication Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- 230000004075 alteration Effects 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000012886 linear function Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 230000036962 time dependent Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/06—Asset management; Financial planning or analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/004—Artificial life, i.e. computing arrangements simulating life
- G06N3/006—Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
Abstract
本申请公开了一种量化投资方法、装置、电子设备及存储介质,涉及数据分析技术领域。在本申请中,获取目标投资项目在第一设定历史时间范围内的项目数据集,再采用目标量化投资模型对应的量化投资核函数,基于项目数据集包含的各个项目数据,获得目标投资项目在设定未来时间范围内的项目投资回报,从而基于项目投资回报归属的投资回报区间,确定目标投资项目对应的量化投资策略;这样,通过训练完成的目标量化投资模型及其对应的量化投资核函数,不仅可以对各个项目数据进行线性处理,还可以改善相关技术中,无法准确地预判市场在未来一段时间内的走势的技术弊端,故而,在对市场进行量化投资分析时,降低了计算复杂度以及提高了分析准确率。
Description
技术领域
本申请涉及数据分析技术领域,尤其涉及一种量化投资方法、装置、电子设备及存储介质。
背景技术
目前,投资者通常根据市场的基本面数据和基础技术数据,来预判市场在未来一段时间内的走势,从而采用相应的投资策略,但是,通常会受到历史投资经验的影响,往往很难获得较好的投资回报。
故而,为了获得较好的投资回报,可以使用量化投资的方式,即采用计算机技术,在大量数据计算的基础上,对市场走势进行预判,从而规避投资者根据历史投资经验进行投资带来的缺陷。
相关技术中,由于支持向量机(Support Vector Machine,SVM)具有很好的泛化能力,以及对于非线性和高维数据的支持能力,因此,被广泛运用于量化投资中,以实现对市场在未来一段时间内走势的判断。
然而,采用上述的量化投资方式,会因使用SVM进行量化投资,对市场走势判断时,需要进行大量的计算(即计算复杂度较高),从而导致对系统的性能要求较高;并且,由于SVM使用最大分类间隔的方式,无法准确地预判市场在未来一段时间内的走势。
可见,采用上述方式,在对市场进行量化投资分析时,计算复杂度较高以及分析准确率较低。
发明内容
本申请实施例提供了一种量化投资方法、装置、电子设备及存储介质,用以在对市场进行量化投资分析时,降低计算复杂度以及提高分析准确率。
第一方面,本申请实施例提供了一种量化投资方法,所述方法包括:
获取目标投资项目在第一设定历史时间范围内的项目数据集;其中,项目数据集表征:第一设定历史时间范围包含的各个历史时间周期内,目标投资项目的价值变化情况;
采用目标量化投资模型对应的量化投资核函数,基于项目数据集包含的各个项目数据,获得目标投资项目在设定未来时间范围内的项目投资回报;其中,量化投资核函数用于对各个项目数据进行线性处理;
基于项目投资回报归属的投资回报区间,以及预设的投资回报区间与量化投资策略之间的对应关系,确定目标投资项目对应的量化投资策略。
第二方面,本申请实施例还提供了一种量化投资装置,所述装置包括:
获取模块,用于获取目标投资项目在第一设定历史时间范围内的项目数据集;其中,项目数据集表征:第一设定历史时间范围包含的各个历史时间周期内,目标投资项目的价值变化情况;
处理模块,用于采用目标量化投资模型对应的量化投资核函数,基于项目数据集包含的各个项目数据,获得目标投资项目在设定未来时间范围内的项目投资回报;其中,量化投资核函数用于对各个项目数据进行线性处理;
确定模块,用于基于项目投资回报归属的投资回报区间,以及预设的投资回报区间与量化投资策略之间的对应关系,确定目标投资项目对应的量化投资策略。
在一种可选的实施例中,目标量化投资模型是采用如下方式训练获得的:
获取第二设定历史时间范围内的市场数据集;其中,每个市场数据表征:第二设定历史时间范围中,相应历史时间周期内市场指数的走势,市场指数表征:多个样本投资项目的市场价值总和;
基于市场数据集,对待训练的初始量化投资模型进行多轮迭代训练,获得符合预设量化投资要求的目标量化投资模型。
在一种可选的实施例中,在基于市场数据集,对待训练的初始量化投资模型进行多轮迭代训练时,所述处理模块具体用于:
获取市场数据集包含的各个市场数据,在各自对应的历史时间周期内的第一市场指数和第二市场指数;其中,第一市场指数大于第二市场指数;
基于获得的各第一市场指数和各第二市场指数,以及初始量化投资模型关联的超平面,构建初始量化投资模型的输入数据集和输出数据集;
基于输入数据集和输出数据集,对初始量化投资模型进行多轮迭代训练。
在一种可选的实施例中,在基于获得的各第一市场指数和各第二市场指数,以及初始量化投资模型关联的超平面,构建初始量化投资模型的输入数据集和输出数据集时,所述处理模块具体用于:
按照各个市场数据各自对应的历史时间周期,以及各第一市场指数和各第二市场指数,构建初始量化投资模型的输入数据集;
基于获得的输入数据集,以及超平面对应的界面约束条件,构建初始量化投资模型的输出数据集。
在一种可选的实施例中,在构建初始量化投资模型的输入数据集和输出数据集之后,所述处理模块还用于:
按照预设的数据标准化规则,分别对输入数据集包含的多个输入数据和输出数据集包含的多个输出数据进行数据标准化处理,获得数据标准化处理后的输入数据集和数据标准化处理后的输出数据集。
在一种可选的实施例中,在获取第二设定历史时间范围内的市场数据集之后,所述获取模块还用于:
基于预设的数据集划分规则,对市场数据集进行数据集划分,获得初始量化投资模型的训练样本集和测试样本集。
在一种可选的实施例中,在基于输入数据集和所述输出数据集,对初始量化投资模型进行多轮迭代训练时,所述处理模块具体用于:
在对初始量化投资模型进行一轮迭代训练的过程中,执行以下操作:
从输入数据集中,获取第三设定历史时间范围内的输入数据,并从输出数据集中,选取出与输入数据对应的输出数据;其中,第三设定历史时间范围归属于第二设定历史时间范围;
采用鲸鱼优化算法,基于输入数据和输出数据,对初始量化投资模型对应的量化投资核函数关联的各核函数参数进行调整;其中,各核函数参数用于衡量初始量化投资模型的量化投资分析准确度。
在一种可选的实施例中,若满足以下条件,则确定初始量化投资模型为符合预设量化投资要求的目标量化投资模型:
获取初始量化投资模型,在多轮迭代训练过程中,各自对应的输入数据均值、输出数据实际值和输出数据预测值;
基于获得的多组输入数据均值、输出数据实际值和输出数据预测值,分别确定在多轮迭代训练过程中,各核函数参数的参数评价值;其中,参数评价值表征:量化投资核函数的数据线性处理能力;
从各个参数评价值中,筛选出满足预设的参数评价值排序条件的目标评价值,并将目标评价值对应时刻的初始量化投资模型,作为符合预设量化投资要求的目标量化投资模型。
第三方面,本申请提供了一种电子设备,其包括处理器和存储器,其中,所述存储器存储有程序代码,当所述程序代码被所述处理器执行时,使得所述处理器执行上述第一方面所述的量化投资方法的步骤。
第四方面,本申请提供了一种计算机可读存储介质,其包括程序代码,当所述程序代码在电子设备上运行时,所述程序代码用于使所述电子设备执行上述第一方面所述的量化投资方法的步骤。
第五方面,本申请提供了一种计算机程序产品,所述计算机程序产品在被计算机调用时,使得所述计算机执行如第一方面所述的量化投资方法步骤。
本申请有益效果如下:
在本申请实施例所提供的量化投资方法中,获取目标投资项目在第一设定历史时间范围内的项目数据集,再采用目标量化投资模型对应的量化投资核函数,基于项目数据集包含的各个项目数据,获得目标投资项目在设定未来时间范围内的项目投资回报,从而基于项目投资回报归属的投资回报区间,以及预设的投资回报区间与量化投资策略之间的对应关系,确定目标投资项目对应的量化投资策略;采用这种方式,通过目标量化投资模型对应的量化投资核函数,可以对各个项目数据进行线性处理,避免了相关技术中,计算复杂度较高或对系统的性能要求较高的问题;并且,通过训练完成的目标量化投资模型,可以改善无法准确地预判市场在未来一段时间内的走势的技术弊端,从而在对市场进行量化投资分析时,提高了量化投资分析的准确率。
此外,本申请的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者,通过实施本申请而了解。本申请的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简要介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。在附图中:
图1为本申请实施例适用的一种可选的系统架构示意图;
图2为本申请实施例提供的一种量化投资方法的实施流程示意图;
图3为本申请实施例提供的一种获得目标量化投资模型的逻辑示意图;
图4为本申请实施例提供的一种对待训练的初始量化投资模型进行多轮迭代训练的方法实施流程示意图;
图5为本申请实施例提供的一种构建初始量化投资模型的输入数据集和输出数据集的逻辑示意图,
图6为本申请实施例提供的一种对初始量化投资模型进行迭代训练的逻辑示意图;
图7为本申请实施例提供的一种确定初始量化投资模型为符合预设量化投资要求的目标量化投资模型的方法实施流程示意图;
图8为本申请实施例提供的一种基于机器学习的高效量化投资的方法实施流程示意图;
图9为本申请实施例提供的一种鲸鱼优化算法的实施流程示意图;
图10为本申请实施例提供的一种基于图2的逻辑示意图;
图11为本申请实施例提供的一种量化投资装置的结构示意图;
图12为本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请技术方案的一部分实施例,而不是全部的实施例。基于本申请文件中记载的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请技术方案保护的范围。
需要说明的是,在本申请的描述中“多个”理解为“至少两个”。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。A与B连接,可以表示:A与B直接连接和A与B通过C连接这两种情况。另外,在本申请的描述中,“第一”、“第二”等词汇,仅用于区分描述的目的,而不能理解为指示或暗示相对重要性,也不能理解为指示或暗示顺序。
此外,本申请技术方案中,对数据的采集、传播、使用等,均符合国家相关法律法规要求。
以下对本申请实施例中的部分技术用语进行解释说明,以便于本领域技术人员理解。
(1)SVM:是一类按监督学习(Supervised Learning)方式对数据进行二元分类的广义线性分类器(Generalized Linear Classifier),其决策边界是对学习样本求解的最大边距超平面(Maximum-Margin Hyperplane),即使到超平面最近的样本点的“距离”最大。
(2)支持向量回归(Support Vector Regression,SVR):是SVM对回归问题的一种运用/分支,可以理解为在线性函数的两侧创造一个“间隔带”,而这个“间隔带”的间距为∈(这个值常是根据经验而给定的),对所有落入到间隔带内的样本不计算损失,也就是只有支持向量才会对其函数模型产生影响,最后,通过最小化总损失和最大化间隔来得出优化后的模型,对于非线性的模型,与SVM一样使用核函数映射到特征空间,然后再进行回归,并且,可使到超平面最远的样本点的“距离”最小。
(3)核函数(Kernel Function):是SVM中一种非线性函数,能够将原始空间中的向量作为输入向量,并返回特征空间(转换后的数据空间,可能是高维)中向量的点积函数,即可以将原始数据映射到一个高维空间中,使得非线性分布的数据也可以通过线性分类器进行分类,在SVM算法中,核函数是用于发现非线性特征的重要手段之一。
(4)径向基函数(Radial Basis Function Kernel,RBF):是一个取值仅仅依赖于离原点距离的实值函数,也就是Φ(x)=Φ(‖x‖),或者,还可以是到任意一点c的距离,c点称为中心点,也就是Φ(x,c)=Φ(‖x-c‖)。
需要说明的是,任意一个满足Φ(x)=Φ(‖x‖)特性的函数Φ都叫做径向基函数,标准的一般使用欧氏距离(也叫做欧式径向基函数),尽管其他距离函数也是可以的;并且,在神经网络结构中,可以作为全连接层和线性整流单元(Rectified Linear Unit,ReLu)层的主要函数。
(5)鲸鱼优化算法(Whale Optimization Algorithm,WOA):作为一种新型的群体智能优化算法,该算法可以模仿座头鲸的捕食行为,根据某种特性来指导其移动和寻优。
进一步的,基于上述名词及相关术语解释,下面对本申请实施例的设计思想进行简要介绍:
现今市场是一个十分庞杂的系统,各类因素会直接或间接地影响整个市场的情形,例如,各种突发事件都增加了市场的不确定性;并且,当今的投资者主要是从基本面数据和基础技术数据,来研究市场中各种投资项目的信息,但是总会存在一定的弊端,即投资者总会被历史经验主义所左右,最终造成亏损。
然而,基于计算机技术的量化投资,在大量数据计算的基础上,对市场走势进行预判,有效的解决了上述问题,即规避了投资者根据历史投资经验进行投资带来的缺陷,但如今大部分的量化投资技术和方案一味的追求收益率,进而导致了模型算法复杂高、资源浪费严重的问题。
示例性的,相关技术中,由于SVM具有很好的泛化能力,以及对于非线性和高维数据的支持能力,因此,被广泛运用于量化投资中,但是,因为使用SVM进行量化投资,对市场走势判断时,需要进行大量的计算(即计算复杂度较高),故而对系统的性能要求较高;并且,由于SVM使用最大分类间隔的方式,无法准确地预判市场在未来一段时间内的走势。
有鉴于此,为了在对市场进行量化投资分析时,降低计算复杂度以及提高分析准确率,在本申请实施例中,提出了一种量化投资方法,具体包括:获取目标投资项目在第一设定历史时间范围内的项目数据集;其中,项目数据集表征:第一设定历史时间范围包含的各个历史时间周期内,目标投资项目的价值变化情况;接着,采用目标量化投资模型对应的量化投资核函数,基于项目数据集包含的各个项目数据,获得目标投资项目在设定未来时间范围内的项目投资回报;其中,量化投资核函数用于对各个项目数据进行线性处理;最终,基于项目投资回报归属的投资回报区间,以及预设的投资回报区间与量化投资策略之间的对应关系,确定目标投资项目对应的量化投资策略。
特别地,以下结合说明书附图对本申请的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本申请,并不用于限定本申请,并且在不冲突的情况下,本申请实施例及实施例中的特征可以相互组合。
参阅图1所示,其为本申请实施例适用的一种系统架构示意图,该系统架构包括:目标终端101和服务器102。目标终端101和服务器102之间可通过通信网络进行信息交互,其中,通信网络采用的通信方式可包括:无线通信方式和有线通信方式。
示例性的,目标终端101可通过蜂窝移动通信技术接入网络,与服务器102进行通信,其中,所述蜂窝移动通信技术,比如,包括第五代移动通信(5th Generation MobileNetworks,5G)技术。
可选的,目标终端101可通过短距离无线通信方式接入网络,与服务器102进行通信,其中,所述短距离无线通信方式,比如,包括无线保真(Wireless Fidelity,Wi-Fi)技术。
本申请实施例对上述系统架构中涉及的通信设备的数量不做任何限制,例如,可以更多目标终端,或者没有目标终端,或者还包括其他网络设备,如图1所示,仅以目标终端101和服务器102为例进行描述,下面对上述各设备及其各自的功能进行简要介绍。
目标终端101,是一种可以向用户提供语音和/或数据连通性的设备,可以是支持有线和/或无线连接方式的设备。
示例性的,目标终端101包括但不限于:手机、平板电脑、笔记本电脑、掌上电脑、移动互联网设备(Mobile Internet Device,MID)、可穿戴设备,虚拟现实(Virtual Reality,VR)设备、增强现实(Augmented Reality,AR)设备、工业控制中的无线终端设备、无人驾驶中的无线终端设备、智能电网中的无线终端设备、运输安全中的无线终端设备、智慧城市中的无线终端设备,或智慧家庭中的无线终端设备等。
此外,目标终端101上可以安装有相关的客户端,该客户端可以是软件,例如,应用程序(Application,APP)、浏览器、短视频软件等,也可以是网页、小程序等;需要说明的是,在本申请实施例中,目标终端101可以使上述与量化投资相关的客户端,向服务器102发送目标投资项目在第一设定历史时间范围内的项目数据集,以及第二设定历史时间范围内的市场数据集等,以便进行后续的量化投资等方法步骤。
服务器102可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(Content Delivery Network,CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器;需要说明的是,在本申请实施例中,服务器102上部署有训练完成的目标量化投资模型,用于后续的量化投资操作;可选的,目标量化投资模型可以为基于SVR的量化投资分析模型。
值得提出的是,在本申请实施例中,服务器102用于获取目标投资项目在第一设定历史时间范围内的项目数据集;接着,采用目标量化投资模型对应的量化投资核函数,基于项目数据集包含的各个项目数据,获得目标投资项目在设定未来时间范围内的项目投资回报;最终,基于项目投资回报归属的投资回报区间,以及预设的投资回报区间与量化投资策略之间的对应关系,确定目标投资项目对应的量化投资策略。
下面结合上述的系统架构,以及参考附图来描述本申请示例性实施方式提供的量化投资方法,需要注意的是,上述系统架构仅是为了便于理解本申请的精神和原理而示出,本申请的实施方式在此方面不受任何限制。
参阅图2所示,其为本申请实施例提供的一种量化投资方法的实施流程示意图,执行主体以服务器为例,该方法的具体实施流程如下:
S201:获取目标投资项目在第一设定历史时间范围内的项目数据集。
其中,项目数据集表征:第一设定历史时间范围包含的各个历史时间周期内,目标投资项目的价值变化情况。
示例性的,上述的目标投资项目可以为XX股市或者XX证券或者XX理财平台等上,某一个可供广大投资者进行投资的投资项目(如,A股票、B证券或者C产品);并且,上述的第一设定历史时间范围可以为:近5个工作/交易日、近10个工作/交易日、近15个工作/交易日、近20个工作/交易日、近30个工作/交易日等;需要说明的是,在本申请实施例中,并不对上述第一设定历史时间范围进行具体限定。
故而,上述历史时间周期可以为每一个工作/交易日,或者,投资者在上述平台每个工作/交易日内,能够进行正常投资操作的时间段,因此,上述项目数据集包含的每个项目数据也可以表征:目标投资项目在相应工作/交易日内,或者,相应工作/交易日能够进行正常投资操作的时间段内,目标投资项目的价值变化情况;可选的,价值变化情况可以精确到秒级的价值变化。
S202:采用目标量化投资模型对应的量化投资核函数,基于项目数据集包含的各个项目数据,获得目标投资项目在设定未来时间范围内的项目投资回报。
其中,量化投资核函数用于对各个项目数据进行线性处理。
可选的,由于SVR作为SVM的一个分支,并且,相对于SVM而言可以进行定量预测;同时,SVM的计算量会更加小,更加符合对高效的要求;此外,SVR所涉及的最优超平面并不是SVM那样使两类或多类样本点分的间隔最大化(即最大分类间隔的方式),而是使所有的样本点(数据)离着超平面的总偏差最小;可见,采用SVR进行量化投资,不仅可以降低计算复杂度,还可以更加准确的实现对市场在未来一段时间内的走势的预判,故而,上述目标量化投资模型可以为基于SVR的量化投资分析模型。
需要说明的是,对于输入的样本数据集T={(x1,y1),(x2,y2),…,(xn,yn)},寻找各样本数据的内在关系可知,无论这些样本数据怎么变化,都可以将其归结为一个公式,其公式具体如下:
其ε表示其允许的失误范围,表示了超平面的上界,/>表示超平面的下界,C是一个常量,决定了相应损失函数的大小,‖w‖2表示了划分超平面距离,只有使划分超平面最小才能提高准确率。
并且,由于项目数据集包含的项目数据(即输入数据)都是非线性的,但是非线性问题不好求解,所以需要进行非线性变换,转变后的数据可以采用求解线性问题的方法来求解原来的非线性问题;因此,需要用到核函数,而高斯径向基函数对于未知的数据类型具有很好的适用性,所以可以采用高斯径向基函数可以作为量化投资核函数对输入数据进行非线性求解。
在一种可选的实现方式中,目标量化投资模型可以是采用如下方式训练获得的,参阅图3所示,服务器获取第二设定历史时间范围内的市场数据集,再基于市场数据集,对待训练的初始量化投资模型进行多轮迭代训练,获得符合预设量化投资要求的目标量化投资模型;其中,每个市场数据表征:第二设定历史时间范围中,相应历史时间周期内市场指数的走势,市场指数表征:多个样本投资项目的市场价值总和。
需要说明的是,在本申请实施例中,上述第二设定历史时间周期范围与第一设定历史时间范围间并没有明确的大小关系,只是为了便于描述而进行的区分,即上述第二设定历史时间范围可以与第一设定历史时间周期范围相同,也可以与第一设定时间周期范围不同,可以大于第一设定历史时间周期范围,也可以不大于第一设定历史时间周期范围。
在一种可选的实现方式中,服务器在获取到第二设定历史时间范围内的市场数据集之后,还可以基于预设的数据集划分规则,对市场数据集进行数据集划分,获得初始量化投资模型的训练样本集和测试样本集;这样,将训练样本集作为训练过程用的样本数据,以及将测试样本集作为初始量化投资模型训练完成后的最终测试样本数据,从而确保将初始量化投资模型进行多次迭代训练后,已获得符合预设量化投资要求的目标量化投资模型。
示例性的,上述预设的数据集划分规则可以为预设的数据划分比例,即将市场数据集中占有一定数据比例的多个市场数据作为样本数据集,将市场数据集中其余剩下的各个市场数据作为测试数据集,例如,假定上述预设的数据划分比例为2/3,则服务器可将市场数据集中2/3的市场数据作为样本数据集,以及将剩下的1/3市场数据作为测试数据集。
在一种可选的实现方式中,参阅图4所示,服务器在基于市场数据集,对待训练的初始量化投资模型进行多轮迭代训练时,具体实施流程如下:
S401:获取市场数据集包含的各个市场数据,在各自对应的历史时间周期内的第一市场指数和第二市场指数。
其中,第一市场指数大于第二市场指数。
示例性的,假定上述第二设定历史时间范围为最近的5个工作/交易日,则可知市场数据集包含5个市场数据,由于每个市场数据详细记录了相应工作/交易日(即历史时间周期)内市场指数的走势,故而,通过对市场数据集包含的5个市场数据解析,便可知道5个工作/交易日各自对应的第一市场指数和第二市场指数;可选的,第一市场指数可以为市场指数在相应工作/交易日的最大/高值,第二市场指数可以为市场指数在相应工作/交易日的最小/低值。
S402:基于获得的各第一市场指数和各第二市场指数,以及初始量化投资模型关联的超平面,构建初始量化投资模型的输入数据集和输出数据集。
在一种可选的实现方式中,参阅图5所示,在执行步骤S402时,服务器在获得各个市场数据,在各自对应的历史时间周期内的第一市场指数和第二市场指数之后,便可按照各个市场数据各自对应的历史时间周期,以及各第一市场指数和各第二市场指数,构建初始量化投资模型的输入数据集。
示例性的,假定在每个历史时间周期内,第一市场指数(即市场指数的最大值)记作第二市场指数(即市场指数的最小值)记作/>其中,i表示为时间节点顺序,则构建初始量化投资模型的输入数据集可以记作:/>其中,/>即每个历史时间周期内,第一市场指数(市场指数的最大值)始终大于第二市场指数(市场指数的最小值)。
进一步地,服务器完成对输入数据集的构建之后,便可基于获得的的输入数据集,以及超平面对应的界面约束条件,构建初始量化投资模型的输出数据集,从而确保能够对初始量化投资模型进行多次迭代训练;其中,界面约束条件为(划分)超平面的上界和下界。
示例性的,输出数据集可表示为:其中,/>表示为对应的预测的第i+1历史时间周期内的第二市场指数(市场指数的最小值),/>表示为对应的预测的第i+1历史时间周期的第一市场指数(市场指数的最大值);需要说明的是,第二市场指数(市场指数的最小值)和第一市场指数(市场指数的最大值),分别对应了SVR相关超平面的上界和下界。此外,由于市场指数具有时间性的特点,故而,初始量化投资模型输出数据集的时间序列始终在输入数据集的时间序列之后。
在一种可选的实现方式中,服务器在构建初始量化投资模型的输入数据集和输出数据集之后,还可以按照预设的数据标准化规则,分别对输入数据集包含的多个输入数据和输出数据集包含的多个输出数据进行数据标准化处理,获得数据标准化处理后的输入数据集和数据标准化处理后的输出数据集,以便后续对初始量化投资模型对应的量化投资核函数关联的各核函数参数进行调整。
示例性的,假定某一输入数据集为:X={x1,x2,...,xn},服务器可以根据上述预设的数据标准化规则,实现对其如下的数据标准化操作:首先,计算得到其均值标准差/>进一步地,计算标准化后的各个输入数据为此时,输入数据集包含的所有输入数据都聚集在0附近,且方差为1,贴近高斯分布。
S403:基于输入数据集和输出数据集,对初始量化投资模型进行多轮迭代训练。
在一种可选的实现方式中,参阅图6所示,在执行步骤S403时,服务器在对初始量化投资模型进行一轮迭代训练的过程中,执行以下操作:从输入数据集中,获取第三设定历史时间范围内的输入数据,并从输出数据集中,选取出与所述输入数据对应的输出数据,再采用鲸鱼优化算法,基于输入数据和输出数据,对初始量化投资模型对应的量化投资核函数关联的各核函数参数进行调整;其中,各核函数参数用于衡量初始量化投资模型的量化投资分析准确度。
其中,第三设定历史时间范围归属于第二设定历史时间范围,即第三设定历史时间范围为第二设定历史时间范围对应时间序列的一个子集;并且,由此可知,第三设定历史时间范围内的输入数据和输出数据,分别为对应输入数据集和输出数据集的一个子集;需要说明的是,上述输入数据或输出数据均可包括:一个或者多个第一市场数据及其对应第二市场指数。
示例性的,假定第二设定历史时间范围为:2022年5月11日-2022年2月25日,则第三设定历史时间范围可以为:2022年5月13日-2022年2月20日,即第三设定历史时间范围归属于第二设定历史时间范围。
需要说明的是,鲸鱼优化算法是近来的一种新型的群体智能优化算法,简练易于实现,且对目标函数条件要求宽松,参数控制较少等优点而被广泛开发应用,由于鲸鱼优化算法模仿座头鲸的捕猎流程,故而,通过对最优目标的搜索、包围和捕获三个动作,便可以达到优化搜索的目的,即实现对量化投资核函数关联的各核函数参数(即初始量化投资模型的各个网络模型参数)的调整,从而使得获得的目标量化投资模型具有较高的量化投资分析能力。
具体的,上述鲸鱼优化算法的计算过程具体如下:
首先是鲸鱼包围猎物(即围捕猎物或Encircling prey),在鲸鱼包围猎物的时候,可以通过以下公式,来更新鲸鱼自身的位置:
X(t+1)=X*(t)-AD
D=|CX*(t)-X(t)|
其中,t表示迭代次数,X*(t)表示目前的目前最优解决方案,即目前得到的最佳解的位置向量,如果存在更好的解决方案,那么应该在每次迭代中更新X*(t),X(t)表示当前迭代鲸鱼的位置,即是位置向量,||是绝对值,A和C是系数向量,可以由以下公式得到。
C=2r2
A=2ar1-a
其中,r1和r2是随机变量,可为是[0,1]中的随机向量,a是会随着迭代次数t的增加而逐渐减小的一个常数,例如,在整个迭代过程中,a由2线性降低到0,A的值域范围为[-1,1],其具体取值和a息息相关。
其次,鲸鱼还可以采取狩猎(气泡网捕食)的方法,并且,在鲸鱼狩猎的时候,会采用螺旋的方法靠近猎物,数学表达如下:
X(t+1)=X*(t)+Dpebl cos(2πl)
其中,Dpebl=|X*(t)-X(t)|表示当前鲸鱼(搜索个体)和目前最优解决方案的距离,b是一个常量,决定了螺旋的大小,即螺旋形状参数,l是一个值域为[-1,1]均匀分布的随机数。
特别地,鲸鱼可以选择狩猎还是围捕,本申请实施例中,可以理解为围捕或者狩猎发生的情况是均等的,并且,可以通过生成随机数的方式,来控制是狩猎还是围捕。
除外,鲸鱼还可以搜索新的猎物,搜索猎物即是为了得到全局最优,允许某只鲸鱼可以脱离鲸鱼群,去搜索其他更好的猎物,从而保证所有鲸鱼在解空间(即超平面)中充分搜索,根据鲸鱼彼此之间的距离来更新位置,达到随机搜索的目的,示例性的,数学表达式如下:
X(t+1)=Xrand(t)-AD
D=|CXrand(t)-X(t)|
其中,t仍表示迭代次数,Xrand(t)表示当前随机个体(即脱离鲸鱼群的鲸鱼)的位置,A和C仍是系数向量,D表示当前搜索个体(即当前迭代鲸鱼)的位置,与当前随机个体位置之间的距离。
值得注意的是,包围和捕获都是靠近目前最优解的过程,但是搜寻反其道而行之,主要目的是寻找目前最优解之外的更优解,可以通过改变A的值来远离目前最优方案来达到搜寻的目的。
因此,服务器通过采用鲸鱼优化算法的三个过程,可以实现对量化投资核函数关联的各核函数参数进行控制和优化,从而寻找到最优的量化投资分析模型(即目标量化投资模型);示例性的,在本申请实施例中,由于选择高斯径向基函数作为量化投资核函数,故而,量化投资核函数关联的各核函数参数可以为(F,C,σ),其中,F为量化投资核函数的常量系数(即权重系数),C为错误项的惩罚因子,原则上C可以根据需要选择所有大于0的数,C越大表示优化过程中,对于总误差的关注程度越高,对于最小误差的要求越高,甚至不惜使间隔减小,σ为量化投资核函数的带宽参数,是指量化投资核函数中用于控制其平滑度和泛化能力的一个重要参数。
在一种可选的实现方式中,参阅图7所示,若满足以下条件,则确定初始量化投资模型为符合预设量化投资要求的目标量化投资模型:
S701:获取初始量化投资模型,在多轮迭代训练过程中,各自对应的输入数据均值、输出数据实际值和输出数据预测值。
示例性的,在多轮迭代训练的每一轮迭代训练过程中,输入数据均值可表示为即市场指数在单个历史时间周期内的平均值,输出数据实际值可表示为Xt+1,即市场指数在t+1的实际值,输出数据预测值可表示为/>即市场指数在t的预测值;其中,由于第一市场指数和第二市场指数的存在,故而,输入数据均值/>至少包括:第一市场指数对应的输入数据均值/>和第二市场指数对应的输入数据均值/>输出数据实际值Xt+1至少包括:第一市场指数对应的输出数据实际值/>和第二市场指数对应的输出数据实际值/>输出数据预测值/>至少包括:第一市场指数对应的输出数据预测值/>和第二市场指数对应的输出数据预测值/>
S702:基于获得的多组输入数据均值、输出数据实际值和输出数据预测值,分别确定在多轮迭代训练过程中,各核函数参数的参数评价值。
其中,参数评价值表征:量化投资核函数的数据线性处理能力。
示例性的,上述参数评价值也可称之为鲸鱼的适应度,其中,参数评价值可具体表示为:
f(x)=resmax*resmin
其中,resmax和resmin是由输入数据均值、输出数据实际值和输出数据预测值确定的,分别表示最大残差和最小残差,可选的,resmax和resmin的计算公式可具体表示如下:
其中,resmax为最大残差,为第一市场指数在j+1的输出数据实际值,/>为第一市场指数在j的输出数据预测值,/>为第一市场指数在j+1的输入数据均值,n为输入数据的数量。
其中,resmin为最大残差,为第二市场指数在j+1的输出数据实际值,/>为第二市场指数在j的输出数据预测值,/>为第二市场指数在j+1的输入数据均值,n为输入数据的数量。
需要说明的是,参数评价值f(x)越小,则表明鲸鱼优化算法中,该位置的鲸鱼越接近猎物,越接近最佳候选解决方案。
S703:从各个参数评价值中,筛选出满足预设的参数评价值排序条件的目标评价值,并将目标评价值对应时刻的初始量化投资模型,作为符合预设量化投资要求的目标量化投资模型。
其中,上述满足预设的参数评价值排序条件的目标评价值可以为参数评价值的大小排序中,排序最小(即参数评价值最小)的参数评价值。
故而,在执行步骤S703时,服务器从各个参数评价值中,筛选出参数评价值的大小排序中,排序最小(即参数评价值最小)的参数评价值(即目标评价值)之后,便可确定初始量化投资模型在该参数评价值对应的各核函数参数下,达到很好的量化投资分析准确度,以及,在极大程度上降低了计算的复杂度,因此,也可将目标评价值对应时刻的初始量化投资模型,作为符合预设量化投资要求的目标量化投资模型。
S203:基于项目投资回报归属的投资回报区间,以及预设的投资回报区间与量化投资策略之间的对应关系,确定目标投资项目对应的量化投资策略。
示例性的,在执行步骤S203时,上述投资回报区间可以分为:第一投资回报收益区间和第二投资回报收益区间,其中,第一投资回报收益区间表示在未来一段时间内可以收益,第二投资回报收益区间表示在未来一段时间内会出现亏损,故而,上述量化投资策略也可以分为:第一量化投资策略和第二量化投资策略,其中,第一量化投资策略表示对目标投资项目进行投资,或者,持有已对目标投资项目进行的投资,第二量化投资策略表示停止对目标投资项目进行投资,或者,撤回已对目标投资项目进行的投资。
在一种可选的实现方式中,参阅图8所示,基于上述的量化投资方法,可以实现基于机器学习的高效量化投资:
S801:收集市场数据集。
示例性的,上述市场数据集可以为XX股市或者XX证券或者XX理财平台上的市场数据;需要说明的是,在本申请实施例中,可以针对每个市场(样本)数据按照不同的时间跨度进行样本分类,还可以找到历史时间周期内,市场指数的最高值和最低值,得到当前市场指数的走势。
可选的,服务器可以将市场数据集中,样本数据的三分之二作为观测用的测试样本,其余的用于模型的最终测试。
S802:构造模型的输入数据集和输出数据集。
示例性的,在执行步骤S802时,服务器在历史时间周期内,市场指数的最高值(即第一市场指数)记作最低值(即第二市场指数)记作/>其中,最高值和最低值的选取,可参考市场指数的K线图,i表示时间节点顺序。
故而,基于SVR的量化投资分析模型(即初始量化投资模型)的输入数据集可表示为:其中,/>当天的最低值始终低于最高值的;以及,基于SVR的量化投资分析模型的输出数据集可表示为:/>其中,/>表示为对应的预测的第i+1周期的最低值,/>表示为对应的预测的第i+1周期的最高值。
需要说明的是,最低值和最高值对应了基于SVR的量化投资分析模型关联的超平面的上界和下界;并且,由于市场指数具有时间性的特点,输出数据集的时间序列始终在输入数据集的时间序列之后。
可选的,在执行步骤S802时,服务器可以对输入数据集/输出数据集进行标准化操作,示例性的,若某一数据为X={x1,x2,...,xn},计算得到其均值标准差计算标准化后的数据为/>此时,所有数据都聚集在0附近,且方差为1,贴近高斯分布。
S803:基于获得的输入数据集和输出数据集,结合鲸鱼优化算法,对模型参数进行全局寻优,得到最优的训练模型。
其中,上述模型参数为量化投资核函数关联的核函数参数,示例性的,核函数参数可以为:F,C,σ。
由于F,C,σ表现为一个三维数据,故而,对于鲸鱼优化算法而言,将对这个三维的数据值进行寻优,参阅图9所示,具体方法步骤如下:
S901:初始化鲸鱼种群和训练数据集。
具体的,在执行步骤S901时,服务器可以初始化鲸鱼算法参数,示例性的,假定鲸鱼种群规模为SN=20,最大迭代次数为Tmax=50,变量的上下界(即超平面的约束条件)分别为10和-10。
此外,还可以初始化鲸鱼种群位置,根据量化投资核函数关联的核函数参数可以得到一个三维空间的鲸鱼的位置(F,C,σ)∈R3;并且,初始化鲸鱼种群xi(i=1,2,…,N),其中,i对应市场数据集中市场数据的时间。
还需要说明的是,需要检查鲸鱼的位置是否超出了搜索的上下界,如果超过了就做出相应修改。
S902:计算鲸鱼种群中全部鲸鱼的适应度值。
其中,鲸鱼的适应度的计算公式即为参数评价值的计算公式,示例性的,鲸鱼种群中的每一头鲸鱼的适应度值可表示为f(xi)。
S903:根据鲸鱼的适应度值更新目前最优解决方案,并更新鲸鱼的位置。
示例性的,在执行步骤S903时,服务器对鲸鱼种群中,各个鲸鱼的适应度值进行排序,并找到其中适应度值最小的鲸鱼的位置(即预设的参数评价值排序条件)作为当前最佳候选位置;并且,将适应度值f(xi)最小的个体作为目前最优解决方案进行替换,同时更新其他鲸鱼个体的位置。
S904:捕食概率p≤0.5,若是,则转入S905,若否,则转入S906。
具体的,在执行步骤S904时,服务器根据随机生成的捕食概率p,来选择鲸鱼的捕食方式;需要说明的是,捕食概率p可以是随机生成的,也可以是人为设定的,在本申请实施例中,并不对其获得方式进行任何具体限定。
S905:围捕猎物。
需要说明的是,围捕猎物也即采用包围法,缩小最优解可能存在的范围,其中,包围方式参考上述鲸鱼优化算法的包围公式。
S906:系数向量|A|<1,若是,则转入S907,若否,则转入S908。
S907:捕获猎物。
需要说明的是,捕获猎物也即狩猎,也可称之为捕获法;并且,在执行步骤S907时,将采用螺旋运动的方式向最优目标靠近,即捕获法获得最优解决方案,其中,捕获方式可以参考上述鲸鱼优化算法的捕获公式。
S908:搜寻猎物。
需要说明的是,搜寻猎物也即搜索新的猎物,也可称之为搜索猎物。
显然,如果仅采用围捕和捕获方式来对猎物进行捕食,很容易产生局部最优解,所以可从鲸鱼种群中,随机选择一个位置个体,去寻找最优解决范围外的机会,即在围捕(包围)和捕获之外,还会选取一只鲸鱼进行搜索猎物,搜寻远离目前最优解的可能性的解。
S909:达到预期的迭代次数和预期目标,若是,则转入S910,若否,则转入S910:更新迭代次数和更新相关参数后,再转入S901。
示例性的,在本申请实施例中,上述相关参数可以为A,a,l,C,p。
S911:对结果进行排序,输出最优解。
具体的,在执行步骤S911时,输出最优的鲸鱼的位置,即使得误差最小的(F,C,σ)的值。
故而,基于上述S901~S911记载的鲸鱼优化算法的方法步骤,服务器可通过鲸鱼优化算法,找到了最优的核函数参数(即量化投资核函数关联的各核函数参数),并可以得到最优的量化投资分析模型(即目标量化投资模型)。
S804:采用最优模型对目标投资项目进行涨跌预测。
S805:根据涨跌预测结果,生成量化投资策略。
示例性的,对于预测结果如果/>则表示在i+1的时间内指数将上涨,即作为一个买入或者继续持仓的信号,则生成第一量化投资策略),如果/>则表示在i+1的时间内指数将下降,即作为一个卖出或者清仓的信号,则生成第二量化投资策略。
显然,基于上述S801~S805的方法步骤,选取了市场数据集作为基于SVR的量化投资分析模型的训练数据集,并在此之上,针对市场数据的时间性的特点,创新性的构建了基于SVR的量化投资分析模型的输入数据集和输出数据集;接着,还对市场数据进行了一系列标准化处理,消除了市场数据的量纲影响;进一步地,利用鲸鱼优化算法对核函数参数进行优化,筛选出了最优的模型参数;此外,还针对本模型定义了鲸鱼的适应度公式,指导鲸鱼的移动,即通过将机器学习与鲸鱼优化算法相结合,得到了具有实用性高、计算复杂度较低的量化投资分析模型,作为符合预设量化投资要求的目标量化投资模型。
在一种可选的实现方式中,基于上述S201~S203的量化投资方法步骤,参阅图10所示,其为本申请实施例提供的一种量化投资的逻辑示意图,服务器获取目标投资项目在第一设定历史时间范围内的项目数据集之后,便可采用目标量化投资模型对应的量化投资核函数,基于项目数据集包含的各个项目数据,获得目标投资项目在设定未来时间范围内的项目投资回报,从而基于项目投资回报归属的投资回报区间,以及预设的投资回报区间与量化投资策略之间的对应关系,确定目标投资项目对应的量化投资策略;这样,在目标量化投资模型的训练过程中,结合了鲸鱼优化算法的特点,对基于SVR的初始量化投资模型(对应的量化投资核函数关联)的核函数参数进行了寻优,从而相较于SVM具有更低的计算复杂度以及更优的结果呈现,即更高的分析准确率。
综上所述,在本申请实施例所提供的量化投资方法中,获取目标投资项目在第一设定历史时间范围内的项目数据集,再采用目标量化投资模型对应的量化投资核函数,基于项目数据集包含的各个项目数据,获得目标投资项目在设定未来时间范围内的项目投资回报,从而基于项目投资回报归属的投资回报区间,以及预设的投资回报区间与量化投资策略之间的对应关系,确定目标投资项目对应的量化投资策略;采用这种方式,通过目标量化投资模型对应的量化投资核函数,可以对各个项目数据进行线性处理,避免了相关技术中,计算复杂度较高或对系统的性能要求较高的问题;并且,通过训练完成的目标量化投资模型,可以改善无法准确地预判市场在未来一段时间内的走势的技术弊端,从而在对市场进行量化投资分析时,提高了量化投资分析的准确率。
进一步地,基于相同的技术构思,本申请实施例提供了一种量化投资装置,该量化投资装置用以实现本申请实施例的上述方法流程。参阅图11所示,该量化投资装置包括:获取模块1101、处理模块1102以及确定模块1103,其中:
获取模块1101,用于获取目标投资项目在第一设定历史时间范围内的项目数据集;其中,项目数据集表征:第一设定历史时间范围包含的各个历史时间周期内,目标投资项目的价值变化情况;
处理模块1102,用于采用目标量化投资模型对应的量化投资核函数,基于项目数据集包含的各个项目数据,获得目标投资项目在设定未来时间范围内的项目投资回报;其中,量化投资核函数用于对各个项目数据进行线性处理;
确定模块1103,用于基于项目投资回报归属的投资回报区间,以及预设的投资回报区间与量化投资策略之间的对应关系,确定目标投资项目对应的量化投资策略。
在一种可选的实施例中,目标量化投资模型是采用如下方式训练获得的:
获取第二设定历史时间范围内的市场数据集;其中,每个市场数据表征:第二设定历史时间范围中,相应历史时间周期内市场指数的走势,市场指数表征:多个样本投资项目的市场价值总和;
基于市场数据集,对待训练的初始量化投资模型进行多轮迭代训练,获得符合预设量化投资要求的目标量化投资模型。
在一种可选的实施例中,在基于市场数据集,对待训练的初始量化投资模型进行多轮迭代训练时,所述处理模块1102具体用于:
获取市场数据集包含的各个市场数据,在各自对应的历史时间周期内的第一市场指数和第二市场指数;其中,第一市场指数大于第二市场指数;
基于获得的各第一市场指数和各第二市场指数,以及初始量化投资模型关联的超平面,构建初始量化投资模型的输入数据集和输出数据集;
基于输入数据集和输出数据集,对初始量化投资模型进行多轮迭代训练。
在一种可选的实施例中,在基于获得的各第一市场指数和各第二市场指数,以及初始量化投资模型关联的超平面,构建初始量化投资模型的输入数据集和输出数据集时,所述处理模块1102具体用于:
按照各个市场数据各自对应的历史时间周期,以及各第一市场指数和各第二市场指数,构建初始量化投资模型的输入数据集;
基于获得的输入数据集,以及超平面对应的界面约束条件,构建初始量化投资模型的输出数据集。
在一种可选的实施例中,在构建初始量化投资模型的输入数据集和输出数据集之后,所述处理模块1102还用于:
按照预设的数据标准化规则,分别对输入数据集包含的多个输入数据和输出数据集包含的多个输出数据进行数据标准化处理,获得数据标准化处理后的输入数据集和数据标准化处理后的输出数据集。
在一种可选的实施例中,在获取第二设定历史时间范围内的市场数据集之后,所述获取模块1101还用于:
基于预设的数据集划分规则,对市场数据集进行数据集划分,获得初始量化投资模型的训练样本集和测试样本集。
在一种可选的实施例中,在基于输入数据集和所述输出数据集,对初始量化投资模型进行多轮迭代训练时,所述处理模块1102具体用于:
在对初始量化投资模型进行一轮迭代训练的过程中,执行以下操作:
从输入数据集中,获取第三设定历史时间范围内的输入数据,并从输出数据集中,选取出与输入数据对应的输出数据;其中,第三设定历史时间范围归属于第二设定历史时间范围;
采用鲸鱼优化算法,基于输入数据和输出数据,对初始量化投资模型对应的量化投资核函数关联的各核函数参数进行调整;其中,各核函数参数用于衡量初始量化投资模型的量化投资分析准确度。
在一种可选的实施例中,若满足以下条件,则确定初始量化投资模型为符合预设量化投资要求的目标量化投资模型:
获取初始量化投资模型,在多轮迭代训练过程中,各自对应的输入数据均值、输出数据实际值和输出数据预测值;
基于获得的多组输入数据均值、输出数据实际值和输出数据预测值,分别确定在多轮迭代训练过程中,各核函数参数的参数评价值;其中,参数评价值表征:量化投资核函数的数据线性处理能力;
从各个参数评价值中,筛选出满足预设的参数评价值排序条件的目标评价值,并将目标评价值对应时刻的初始量化投资模型,作为符合预设量化投资要求的目标量化投资模型。
基于相同的技术构思,本申请实施例还提供了一种电子设备,该电子设备可实现本申请上述实施例提供的量化投资方法流程。在一种实施例中,该电子设备可以是服务器,也可以是终端设备或其他电子设备。参图12所示,该电子设备可包括:
至少一个处理器1201,以及与至少一个处理器1201连接的存储器1202,本申请实施例中不限定处理器1201与存储器1202之间的具体连接介质,图12中是以处理器1201和存储器1202之间通过总线1200连接为例。总线1200在图12中以粗线表示,其它部件之间的连接方式,仅是进行示意性说明,并不引以为限。总线1200可以分为地址总线、数据总线、控制总线等,为便于表示,图12中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。或者,处理器1201也可以称为控制器,对于名称不做限制。
在本申请实施例中,存储器1202存储有可被至少一个处理器1201执行的指令,至少一个处理器1201通过执行存储器1202存储的指令,可以执行前文论述的一种量化投资方法。处理器1201可以实现图11所示的装置中各个模块的功能。
其中,处理器1201是该装置的控制中心,可以利用各种接口和线路连接整个该控制设备的各个部分,通过运行或执行存储在存储器1202内的指令以及调用存储在存储器1202内的数据,该装置的各种功能和处理数据,从而对该装置进行整体监控。
在一种可能的设计中,处理器1201可包括一个或多个处理单元,处理器1201可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器1201中。在一些实施例中,处理器1201和存储器1202可以在同一芯片上实现,在一些实施例中,它们也可以在独立的芯片上分别实现。
处理器1201可以是通用处理器,例如CPU、数字信号处理器、专用集成电路、现场可编程门阵列或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件,可以实现或者执行本申请实施例中公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者任何常规的处理器等。结合本申请实施例所公开的一种量化投资方法的步骤可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。
存储器1202作为一种非易失性计算机可读存储介质,可用于存储非易失性软件程序、非易失性计算机可执行程序以及模块。存储器1202可以包括至少一种类型的存储介质,例如可以包括闪存、硬盘、多媒体卡、卡型存储器、随机访问存储器(Random AccessMemory,RAM)、静态随机访问存储器(Static Random Access Memory,SRAM)、可编程只读存储器(Programmable Read Only Memory,PROM)、只读存储器(Read Only Memory,ROM)、带电可擦除可编程只读存储器(Electrically Erasable Programmable Read-Only Memory,EEPROM)、磁性存储器、磁盘、光盘等等。存储器1202是能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。本申请实施例中的存储器1202还可以是电路或者其它任意能够实现存储功能的装置,用于存储程序指令和/或数据。
通过对处理器1201进行设计编程,可以将前述实施例中介绍的一种量化投资方法所对应的代码固化到芯片内,从而使芯片在运行时能够执行图1所示的实施例的一种量化投资方法的步骤。如何对处理器1201进行设计编程为本领域技术人员所公知的技术,这里不再赘述。
基于同一发明构思,本申请实施例还提供一种存储介质,该存储介质存储有计算机指令,当该计算机指令在计算机上运行时,使得计算机执行前文论述的一种量化投资方法。
在一些可能的实施方式中,本申请还提供了一种量化投资方法的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当程序产品在装置上运行时,程序代码用于使该控制设备执行本说明书上述描述的根据本申请各种示例性实施方式的一种量化投资方法中的步骤。
应当注意,尽管在上文详细描述中提及了装置的若干单元或子单元,但是这种划分仅仅是示例性的并非强制性的。实际上,根据本申请的实施方式,上文描述的两个或更多单元的特征和功能可以在一个单元中具体化。反之,上文描述的一个单元的特征和功能可以进一步划分为由多个单元来具体化。
此外,尽管在附图中以特定顺序描述了本申请方法的操作,但是,这并非要求或者暗示必须按照该特定顺序来执行这些操作,或是必须执行全部所示的操作才能实现期望的结果。附加地或备选地,可以省略某些步骤,将多个步骤合并为一个步骤执行,和/或将一个步骤分解为多个步骤执行。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个服务器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
可使用一种或多种程序设计语言的任意组合来编写用于执行本申请操作的程序代码,程序设计语言包括面向对象的程序设计语言,诸如Java、C++等,还包括常规的过程式程序设计语言,诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算装置上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算装置上部分在远程计算装置上执行、或者完全在远程计算装置或服务器上执行。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。
Claims (19)
1.一种量化投资方法,其特征在于,包括:
获取目标投资项目在第一设定历史时间范围内的项目数据集;其中,所述项目数据集表征:所述第一设定历史时间范围包含的各个历史时间周期内,所述目标投资项目的价值变化情况;
采用目标量化投资模型对应的量化投资核函数,基于所述项目数据集包含的各个项目数据,获得所述目标投资项目在设定未来时间范围内的项目投资回报;其中,所述量化投资核函数用于对所述各个项目数据进行线性处理;
基于所述项目投资回报归属的投资回报区间,以及预设的投资回报区间与量化投资策略之间的对应关系,确定所述目标投资项目对应的量化投资策略。
2.如权利要求1所述的方法,其特征在于,所述目标量化投资模型是采用如下方式训练获得的:
获取第二设定历史时间范围内的市场数据集;其中,每个市场数据表征:所述第二设定历史时间范围中,相应历史时间周期内市场指数的走势,所述市场指数表征:多个样本投资项目的市场价值总和;
基于所述市场数据集,对待训练的初始量化投资模型进行多轮迭代训练,获得符合预设量化投资要求的目标量化投资模型。
3.如权利要求2所述的方法,其特征在于,所述基于所述市场数据集,对待训练的初始量化投资模型进行多轮迭代训练,包括:
获取所述市场数据集包含的各个市场数据,在各自对应的历史时间周期内的第一市场指数和第二市场指数;其中,所述第一市场指数大于所述第二市场指数;
基于获得的各第一市场指数和各第二市场指数,以及所述初始量化投资模型关联的超平面,构建所述初始量化投资模型的输入数据集和输出数据集;
基于所述输入数据集和所述输出数据集,对所述初始量化投资模型进行多轮迭代训练。
4.如权利要求3所述的方法,其特征在于,所述基于获得的各第一市场指数和各第二市场指数,以及所述初始量化投资模型关联的超平面,构建所述初始量化投资模型的输入数据集和输出数据集,包括:
按照所述各个市场数据各自对应的历史时间周期,以及所述各第一市场指数和所述各第二市场指数,构建所述初始量化投资模型的输入数据集;
基于获得的输入数据集,以及所述超平面对应的界面约束条件,构建所述初始量化投资模型的输出数据集。
5.如权利要求3所述的方法,其特征在于,所述构建所述初始量化投资模型的输入数据集和输出数据集之后,还包括:
按照预设的数据标准化规则,分别对所述输入数据集包含的多个输入数据和所述输出数据集包含的多个输出数据进行数据标准化处理,获得数据标准化处理后的输入数据集和数据标准化处理后的输出数据集。
6.如权利要求2所述的方法,其特征在于,所述获取第二设定历史时间范围内的市场数据集之后,还包括:
基于预设的数据集划分规则,对所述市场数据集进行数据集划分,获得所述初始量化投资模型的训练样本集和测试样本集。
7.如权利要求3-6中任一项所述的方法,其特征在于,所述基于所述输入数据集和所述输出数据集,对所述初始量化投资模型进行多轮迭代训练,包括:
在对所述初始量化投资模型进行一轮迭代训练的过程中,执行以下操作:
从所述输入数据集中,获取第三设定历史时间范围内的输入数据,并从所述输出数据集中,选取出与所述输入数据对应的输出数据;其中,所述第三设定历史时间范围归属于所述第二设定历史时间范围;
采用鲸鱼优化算法,基于所述输入数据和所述输出数据,对所述初始量化投资模型对应的量化投资核函数关联的各核函数参数进行调整;其中,所述各核函数参数用于衡量所述初始量化投资模型的量化投资分析准确度。
8.如权利要求7所述的方法,其特征在于,若满足以下条件,则确定所述初始量化投资模型为符合所述预设量化投资要求的目标量化投资模型:
获取所述初始量化投资模型,在所述多轮迭代训练过程中,各自对应的输入数据均值、输出数据实际值和输出数据预测值;
基于获得的多组输入数据均值、输出数据实际值和输出数据预测值,分别确定在所述多轮迭代训练过程中,所述各核函数参数的参数评价值;其中,所述参数评价值表征:所述量化投资核函数的数据线性处理能力;
从各个参数评价值中,筛选出满足预设的参数评价值排序条件的目标评价值,并将所述目标评价值对应时刻的初始量化投资模型,作为符合所述预设量化投资要求的目标量化投资模型。
9.一种量化投资装置,其特征在于,包括:
获取模块,用于获取目标投资项目在第一设定历史时间范围内的项目数据集;其中,所述项目数据集表征:所述第一设定历史时间范围包含的各个历史时间周期内,所述目标投资项目的价值变化情况;
处理模块,用于采用目标量化投资模型对应的量化投资核函数,基于所述项目数据集包含的各个项目数据,获得所述目标投资项目在设定未来时间范围内的项目投资回报;其中,所述量化投资核函数用于对所述各个项目数据进行线性处理;
确定模块,用于基于所述项目投资回报归属的投资回报区间,以及预设的投资回报区间与量化投资策略之间的对应关系,确定所述目标投资项目对应的量化投资策略。
10.如权利要求9所述的装置,其特征在于,所述目标量化投资模型是采用如下方式训练获得的:
获取第二设定历史时间范围内的市场数据集;其中,每个市场数据表征:所述第二设定历史时间范围中,相应历史时间周期内市场指数的走势,所述市场指数表征:多个样本投资项目的市场价值总和;
基于所述市场数据集,对待训练的初始量化投资模型进行多轮迭代训练,获得符合预设量化投资要求的目标量化投资模型。
11.如权利要求10所述的装置,其特征在于,在所述基于所述市场数据集,对待训练的初始量化投资模型进行多轮迭代训练时,所述处理模块具体用于:
获取所述市场数据集包含的各个市场数据,在各自对应的历史时间周期内的第一市场指数和第二市场指数;其中,所述第一市场指数大于所述第二市场指数;
基于获得的各第一市场指数和各第二市场指数,以及所述初始量化投资模型关联的超平面,构建所述初始量化投资模型的输入数据集和输出数据集;
基于所述输入数据集和所述输出数据集,对所述初始量化投资模型进行多轮迭代训练。
12.如权利要求11所述的装置,其特征在于,在所述基于获得的各第一市场指数和各第二市场指数,以及所述初始量化投资模型关联的超平面,构建所述初始量化投资模型的输入数据集和输出数据集时,所述处理模块具体用于:
按照所述各个市场数据各自对应的历史时间周期,以及所述各第一市场指数和所述各第二市场指数,构建所述初始量化投资模型的输入数据集;
基于获得的输入数据集,以及所述超平面对应的界面约束条件,构建所述初始量化投资模型的输出数据集。
13.如权利要求11所述的装置,其特征在于,在所述构建所述初始量化投资模型的输入数据集和输出数据集之后,所述处理模块还用于:
按照预设的数据标准化规则,分别对所述输入数据集包含的多个输入数据和所述输出数据集包含的多个输出数据进行数据标准化处理,获得数据标准化处理后的输入数据集和数据标准化处理后的输出数据集。
14.如权利要求9所述的装置,其特征在于,在所述获取第二设定历史时间范围内的市场数据集之后,所述获取模块还用于:
基于预设的数据集划分规则,对所述市场数据集进行数据集划分,获得所述初始量化投资模型的训练样本集和测试样本集。
15.如权利要求11-14中任一项所述的装置,其特征在于,在所述基于所述输入数据集和所述输出数据集,对所述初始量化投资模型进行多轮迭代训练时,所述处理模块具体用于:
在对所述初始量化投资模型进行一轮迭代训练的过程中,执行以下操作:
从所述输入数据集中,获取第三设定历史时间范围内的输入数据,并从所述输出数据集中,选取出与所述输入数据对应的输出数据;其中,所述第三设定历史时间范围归属于所述第二设定历史时间范围;
采用鲸鱼优化算法,基于所述输入数据和所述输出数据,对所述初始量化投资模型对应的量化投资核函数关联的各核函数参数进行调整;其中,所述各核函数参数用于衡量所述初始量化投资模型的量化投资分析准确度。
16.如权利要求15所述的装置,其特征在于,若满足以下条件,则确定所述初始量化投资模型为符合所述预设量化投资要求的目标量化投资模型:
获取所述初始量化投资模型,在所述多轮迭代训练过程中,各自对应的输入数据均值、输出数据实际值和输出数据预测值;
基于获得的多组输入数据均值、输出数据实际值和输出数据预测值,分别确定在所述多轮迭代训练过程中,所述各核函数参数的参数评价值;其中,所述参数评价值表征:所述量化投资核函数的数据线性处理能力;
从各个参数评价值中,筛选出满足预设的参数评价值排序条件的目标评价值,并将所述目标评价值对应时刻的初始量化投资模型,作为符合所述预设量化投资要求的目标量化投资模型。
17.一种电子设备,包括存储器,处理器及存储在存储器上并可在处理器运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1-8中任一项所述的方法。
18.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-8中任一所述方法的步骤。
19.一种计算机程序产品,其特征在于,所述计算机程序产品在被计算机调用时,使得所述计算机执行如权利要求1-8中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310718393.9A CN116720965A (zh) | 2023-06-16 | 2023-06-16 | 一种量化投资方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310718393.9A CN116720965A (zh) | 2023-06-16 | 2023-06-16 | 一种量化投资方法、装置、电子设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116720965A true CN116720965A (zh) | 2023-09-08 |
Family
ID=87874871
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310718393.9A Pending CN116720965A (zh) | 2023-06-16 | 2023-06-16 | 一种量化投资方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116720965A (zh) |
-
2023
- 2023-06-16 CN CN202310718393.9A patent/CN116720965A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20230325724A1 (en) | Updating attribute data structures to indicate trends in attribute data provided to automated modelling systems | |
CN111352965B (zh) | 序列挖掘模型的训练方法、序列数据的处理方法及设备 | |
US20210303970A1 (en) | Processing data using multiple neural networks | |
US11360927B1 (en) | Architecture for predicting network access probability of data files accessible over a computer network | |
KR20200039852A (ko) | 기업 경영 현황 분석 예측 모델링을 위한 기계학습 알고리즘 제공 방법 | |
CN111210347A (zh) | 交易风险预警方法、装置、设备及存储介质 | |
EP1107157A2 (en) | System and method for performing predictive analysis | |
CN111582341B (zh) | 用户异常操作预测方法及装置 | |
CN113159213A (zh) | 一种业务分配方法、装置及设备 | |
CN116720965A (zh) | 一种量化投资方法、装置、电子设备及存储介质 | |
CN115600818A (zh) | 多维评分方法、装置、电子设备和存储介质 | |
KR102284440B1 (ko) | 딥러닝 모델 거래중개서버에 의해서 수행되는 딥러닝 모델 거래를 중개하는 방법 | |
CN113506175A (zh) | 中小企业风险预警模型优化方法、装置、设备和存储介质 | |
CN112231299A (zh) | 一种特征库动态调整的方法和装置 | |
CN111091198A (zh) | 一种数据处理方法及装置 | |
CN117058498B (zh) | 分割图评估模型的训练方法、分割图的评估方法及装置 | |
KR102311108B1 (ko) | 딥러닝 모델 거래중개서버에 의해서 수행되는 딥러닝 모델 거래를 중개하는 방법 | |
CN116306985A (zh) | 预测模型训练方法、装置、计算机设备和存储介质 | |
CN114238763A (zh) | 基于金融app的信息推送方法、装置和计算机设备 | |
CN117113131A (zh) | 分类模型的确定方法、装置、计算机设备和存储介质 | |
CN114971866A (zh) | 基于人工智能的授信额度管控方法、装置、设备及介质 | |
CN116911295A (zh) | 一种基于交叉去偏超参数优化的文本分类方法及系统 | |
CN117893309A (zh) | 用户等级的确定方法、装置、存储介质以及电子设备 | |
Babu et al. | Resource-Based Prediction in Cloud Computing Using LSTM with Autoencoders | |
CN116485537A (zh) | 金融产品的选择方法、装置、处理器以及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |