CN113781232A - 一种基于遗传算法的智能多因子投资方法 - Google Patents

一种基于遗传算法的智能多因子投资方法 Download PDF

Info

Publication number
CN113781232A
CN113781232A CN202110784843.5A CN202110784843A CN113781232A CN 113781232 A CN113781232 A CN 113781232A CN 202110784843 A CN202110784843 A CN 202110784843A CN 113781232 A CN113781232 A CN 113781232A
Authority
CN
China
Prior art keywords
factor
rating
weight
stock
chromosome
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110784843.5A
Other languages
English (en)
Inventor
张伟
朱汉卿
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Dianzi University
Original Assignee
Hangzhou Dianzi University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Dianzi University filed Critical Hangzhou Dianzi University
Priority to CN202110784843.5A priority Critical patent/CN113781232A/zh
Publication of CN113781232A publication Critical patent/CN113781232A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/06Asset management; Financial planning or analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/242Dictionaries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/12Computing arrangements based on biological models using genetic models
    • G06N3/126Evolutionary algorithms, e.g. genetic algorithms or genetic programming

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • Business, Economics & Management (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Finance (AREA)
  • Evolutionary Biology (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Data Mining & Analysis (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Operations Research (AREA)
  • Databases & Information Systems (AREA)
  • Technology Law (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Game Theory and Decision Science (AREA)
  • Physiology (AREA)
  • Genetics & Genomics (AREA)
  • Biomedical Technology (AREA)
  • Evolutionary Computation (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

本发明公开了一种基于遗传算法的智能多因子投资方法,其包括以下步骤:1)从券商报告中获取评级一致性因子和评级波动性因子;2)计算评级一致性因子和评级波动性因子的权重累加和作为染色基因,使用遗传算法求解当前市场环境下的最优因子权重;3)根据步骤2)得到的最优因子权重,对股票池中的各只股票进行打分,从而确定最优标的,根据确定的最优标的调仓仓位。本发明通过评级一致性因子和评级波动性因子这两个维度入手,对个股进行了更加全面精准的价格预测,同时定期调整因子权重的做法也保证了策略能随市场环境的变化而动态调整,提高了策略的自适应性。

Description

一种基于遗传算法的智能多因子投资方法
技术领域
本发明涉及一种基于遗传算法的智能多因子投资方法,尤其是一种基于遗传 算法的智能多因子投资方法。
背景技术
量化投资是指结合现代统计学和数学的方法,利用计算机技术,通过建模分 析、参数优化等手段,并从历史金融数据中提取影响投资的指标,并使用该程序 进行自动交易以获得“超额”收益的投资方法。在国外,从传统的基于统计学的研 究方法,到近年来的结合神经网络的数据挖掘方法,各个不同方面的量化投资方 法都在市场上有较丰富的落地经验和成熟的应用体系。
量化投资的理论基础是市场的非有效性或者弱有效性。当所有能够对投资市 场产生影响的信息都可以及时准确地通过价格曲线反映出来并且投资者可以根 据曲线的变化做出理性的应对的时候,投资市场可以认为是有效的市场。在有效 投资市场中,除非存在市场操控,否则投资者不可能通过分析历史价格数据并制 定投资方法获得高于市场平均水平的超额收益。反之,当股票市场尚未达到弱有 效性时,投资者可以通过选择合适的投资标的与投资方法来获得超额收益。
与成熟的国外市场相比,中国A股市场的发展时间较短、市场上仍然存在 许多估值洼地、投资者的非理性投资行为普遍存在。许多研宄表明中国股票市场 仍然是无效的或者未达到弱有效。建立合理的量化投资方法的难点如下:
1)有效新因子的提取
影响市场的因素是复杂多样的,从股票基本面数据、宏观金融指标到公司财 务报表,历史新闻文本,都在各类量化投资方法中有所应用。由于候选因子过多, 有效因子的提取的甄别和提取一直是建立量化投资方法工作量最大的一部分。除 此以外,因子本身的盈利可能性是基于因子的非有效性,即:一个因子越被广泛 地应用到投资方法中,它对于市场的直接作用效果越弱,这使得仅仅依靠历史价 格,宏观指标等传统的结构化的数据特征往往会落后于市场,不能完整表现出对 市场内部的预测能力,而寻求新的,具有解释力的因子(即Alpha因子)成为 量化投资的关键和难点。
2)因子权重调整
投资者很早就意识到,单一维度的数据建模方式无法模拟金融市场中复杂的 关联性特征。相反,构建能够敏锐洞察市场趋势与股价波动的多因子特征,可以 进一步提升模型预测的准确性及鲁棒性。但是多因子间的相关性和不同因子对股 票影响程度的差异,为因子的有效组合增添了难度。
发明内容
本发明提供了基于遗传算法的智能多因子投资方法,以解决为量化投资方法 寻找新的、具有市场解释力的因子的难度大,以及因子权重调整不合理的问题。
本发明解决上述技术问题所采用的技术方案为:
本发明涉及一种基于遗传算法的智能多因子投资方法,其包括以下步骤:
1)从券商报告中获取评级一致性因子和评级波动性因子;
2)计算评级一致性因子和评级波动性因子的权重累加和作为染色基因,使 用遗传算法求解当前市场环境下的最优因子权重;
3)根据步骤2)得到的最优因子权重,对股票池中的各只股票进行打分, 从而确定最优标的,根据确定的最优标的调仓仓位。
优选地,所述的步骤1)中的评级一致性因子以及评级波动性因子的获取步 骤包括:
1.1)构建金融情感词典:选择若干初始情感词典,以上市公司招股说明书 和财务年报作为基础语料,进行金融领域专业词语过滤,在初始情感词典中加入 具有针对性的金融领域专业名词以及术语,形成金融情感词典;
1.2)构建标题语料库和投资评级语料库:汇总标题语句文本,形成语句集 合,对每个句子分词后,查询金融情感词典,将每个积极情感词典赋予权重+1, 每个消极情感词典赋予权重-1;通过句子总权值的正负来判断相应的标题语句文 本的情感倾向,并对标题语句文本进行分类;
1.3)计算标题因子与评级因子:对于一份新的券商报告文本,提取新文本 的标题以及与评级相关的语句,将得到的语句与投资评级语料库的语句集合进行 相似度匹配,根据相似度分布情况,确定新文本标题或评级的所属类别,并对新 文本标题或评级进行归一化处理,得到新文本对应的标题因子和评级因子;
1.4)基于评级因子计算评级一致性因子:计算各家券商机构在时间[t-n,t] 内对个股的评级平均值,并根据评级平均值计算个股在[t-n,t]内的一致评级值;
1.5)基于标题因子计算评级波动性因子:计算时间段[t-n,t]内,同一家证 券机构对于个股在标题级别上的波动,将不同证券机构的波动结果进行结合,得 到这段时间内,市场内部的针对该股的推荐等级调整变化情况。
优选地,所述的步骤1.4)中,券商机构brokeri在时间段[t-n,t]内对个股的 评级平均值的计算公式为:
Figure BDA0003158835780000031
个股在[t-n,t]内的一致评级值的计算公式为:
Figure BDA0003158835780000032
公式中,Rate_brokeri表示时间[t-n,t]内,券商机构brokeri对个股的评级 平均值,ratek表示个股在时刻k的评级值,report_brokeri表示时间[t-n,t]内券 商机构brokeri发布的券商报告集合,Ratet表示一致评级值,wi表示券商机构 brokeri对应的机构权重,m表示时间[t-n,t]内针对个股,有发布券商报告的券 商机构总数。
优选地,所述的步骤1.5)中,计算时间段[t-n,t]内同一家证券机构对于个 股在标题级别上的波动的计算公式为:
Figure BDA0003158835780000033
将不同证券机构的波动结果进行结合的公式为:
Figure BDA0003158835780000034
公式中,Rate_broker_changei表示个股在标题级别上的波动,Rate_changet表示该个股在不同证券机构的波动的结合,wi表示券商机构brokeri对应的权重。
优选地,所述的步骤2)中的最优因子权重求解步骤如下:
2.1)计算评级一致性因子和评级波动性因子权重,计算权重累加和作为待 选股票的分数,以该分数作为待优化的m组染色基因,随机初始化一个染色体 个数为n的种群P0,种群中每个染色体携带有m组染色体基因,设置最大迭代次 数;
2.2)计算种群中每条染色体Xi的适应度值,当适应度值为非负值时,将该 适应度值作为相应染色体Xi的适应度值;当适应度为负值时,将相应染色体Xi的 适应度值设置为0,以保证个体对应累计概率为0,不会被选中;
2.3)计算种群中个体Xi对应累计概率qxi
2.4)进行赌轮选择,其过程为每次随机生成r∈[0,1],若qxi>r,则选择个 体Xi;重复该操作
Figure BDA0003158835780000043
次,得到数量为
Figure BDA0003158835780000044
的父代染色体,对父代染色体进 行交叉操作,得到子代染色体,合并父代染色体和子代染色体得到下一代种群P1
2.5)重复以上步骤,直到某代种群Pk满足终止条件,输出Pk中染色体基因 对应权重值,即为所求回测周期Ttest内,各因子最优权重值组合。
优选地,所述的步骤2.1)中设置的最大迭代次数为: generation_max=100000;
所述的步骤2.5)中终止条件为:超过设置的最大迭代次数或者某代种群个 体适应度值方差达到收敛条件,收敛条件std_limition=2000。
优选地,所述的步骤2.1)中计算权重累加和的计算公式为:
stockScorei=wconsistent*consistentRatei+wvolatile*volatileRatei (5)
公式中,stockScorei表示某个待选股票的分数,即权重的累加和,wconsistent表示分配给评级一致性因子的权重,wvolatile表示分配给评级波动性因子的权重,consistentRatei表示股票stocki在时间段t内的评级一致性因子值, volatileRatei表示股票stocki在时间段t内的评级波动性因子值;
所述的步骤2.2)中,对权重累加和进行二进制基因译码后再进行适应度值 的计算,适应度值的计算公式为:
fitnessi=historyTest(weighti,Ttest) (6)
公式中,weighti为染色体xi二进制基因译码后得到的因子权重,Ttest为回 测周期,其范围为当前时间的前三周,historyTest表示因子权重配比weighti在 Ttest范围内展开回测的函数,用于返回最终回测收益率。
优选地,所述的步骤2.3)计算种群中个体Xi对应累计概率qxi的计算方法为:
Figure BDA0003158835780000041
Figure BDA0003158835780000042
公式中,p(xi)表示个体Xi对应的适应度值在种群所有个体中的占比,
Figure BDA0003158835780000053
表 示累计概率,f(xi)表示个体Xi对应的适应度值,n表示种群的个体总数,j表示 累加过程中遍历到的染色体下标,xi和xj表示染色体。
优选地,所述的步骤2.4)中父代染色体进行交叉操作的具体步骤为:
2.4.1)随机确定
Figure BDA0003158835780000051
个交叉点,其中c为给定交叉率;
2.4.2)交换交叉点前后染色体片段;
2.4.3)对交叉后的代染色体进行变异操作,即随机确定
Figure BDA0003158835780000052
个发 生变异的基因个数,其中m为给定变异率,len为单个染色体基因长度,反转基 因位的数值得到子代染色体;
2.4.4)合并父代染色体和子代染色体得到下一代种群P1
优选地,其还包括:
4)每隔三周重复步骤1)~3),调整因子权重,以适应市场环境的变化。
本发明与现有技术相比,存在以下有益效果:
本发明以券商报告为数据源,提取出具有市场解释力的评级一致性因子和评 级波动性因子,并通过遗传算法动态地调整因子权重,从而适应变化的市场环境。 相比于目前常见的投资方法,在累计收益率、最大回撤、夏普比率等指标上有明 显提升。
附图说明
附图1是本发明的总体实现框图。
附图2是使用遗传算法求解最优因子权重的流程图。
具体实施方式
为进一步了解本发明的内容,结合实施例对本发明作详细描述,以下实施例 用于说明本发明,但不用来限制本发明的范围。
结合附图1所示,本发明提供一种基于遗传算法的智能多因子投资方法包括 以下步骤:
1)从券商报告中获取评级一致性因子和评级波动性因子,具体为:
1.1)构建金融情感词典:以HOWNET作为初始情感词典,以2011年到2016 年间的上市公司招股说明书和财务年报作为基础语料,使用《证券投资大辞典》 进行金融领域专业词语过滤,以达到在情感词典中加入具有针对性的金融领域专 业名词以及术语,增强情感词典完备性的目的;随机播撒感知节点到监测区域, 放置汇聚节点在检测区域边缘位置,进而在初始情感词典中加入具有针对性的金 融领域专业名词以及术语,形成金融情感词典;
1.2)构建标题语料库和投资评级语料库:以构建标题语料库为例,汇总标 题语句文本,形成语句集合,对每个句子分词后,查询金融情感词典,将每个积 极情感词典赋予权重+1,每个消极情感词典赋予权重-1;通过句子总权值的正负 来判断文本的情感倾向,从而对标题语句文本进行分类;本实施例将标题评级按 情感极性和强度分为4个层次,将投资评级分为5个层次;
1.3)计算标题因子与评级因子:对于一份新的券商报告文本,首先提取新 文本的标题和评级相关语句,将得到的语句与语料库的语句集合进行相似度匹配, 根据相似度分布情况,确定新文本标题或评级的所属层级;由于标题和评级的量 纲不同,需要对新文本标题或评级进行归一化处理,得到新文本对应标题因子和 评级因子;
1.4)基于推荐评级因子计算评级一致性因子:计算各家券商机构在时间[t-n, t]内对个股的评级平均值,计算公式为:
Figure BDA0003158835780000061
再计算个股在[t-n,t]内的一致评级值,计算公式为:
Figure BDA0003158835780000062
公式中,Rate_brokeri表示时间[t-n,t]内,券商机构brokeri对个股的评级 平均值,ratek表示个股在时刻k的评级值,report_brokeri表示时间[t-n,t]内券 商机构brokeri发布的券商报告集合,Ratet表示一致评级值,wi表示券商机构 brokeri对应的机构权重,m表示时间[t-n,t]内针对个股,有发布券商报告的券 商机构总数;
1.5)基于标题因子计算评级波动性因子:即先求时间段[t-n,t]内同一家证 券机构对于个股在标题级别上的波动,计算公式为
Figure BDA0003158835780000063
将不同证券机构的波动结果进行结合,即可得到这段时间内,市场内部的针 对该股的推荐等级调整变化情况,计算公式为:
Figure BDA0003158835780000071
公式中,Rate_broker_changei表示个股在标题级别上的波动,Rate_changet表示该个股在不同证券机构的波动的结合,wi表示券商机构brokeri对应的权重。
2)计算评级一致性因子和评级波动性因子的权重累加和作为染色基因,使 用遗传算法求解当前市场环境下的最优因子权重,具体步骤如附图2所示;
2.1)计算评级一致性因子和评级波动性因子权重,计算权重累加和作为待 选股票的分数,以该分数作为待优化的m组染色基因,计算公式为:
stockScorei=wconsistent*consistentRatei+wvolatile*volatileRatei (5)
公式中,stockScorei表示某个待选股票的分数,即权重的累加和,wconsistent表示分配给评级一致性因子的权重,wvolatile表示分配给评级波动性因子的权重,consistentRatei表示股票stocki在时间段t内的评级一致性因子值, volatileRatei表示股票stocki在时间段t内的评级波动性因子值;
随机初始化一个染色体个数为n的种群P0,种群中每个染色体携带有m组 基因,设置终止条件为超过最大迭代次数generation_max=100000;
2.2)计算种群中每条染色体Xi的股票总收益作为适应度值,具体是先对权 重累加和进行二进制基因译码,再进行适应度值的计算,计算公式为:
fitnessi=historyTest(weighti,Ttest) (6)
公式中,公式中,weighti为染色体xi二进制基因译码后得到的因子权重, Ttest为回测周期,其范围为当前时间的前三周,historyTest表示因子权重配比 weighti在Ttest范围内展开回测的函数,返回最终回测收益率;适应度值为非负 值时,即回测结果在映射为非负值后,作为染色体适应度值参与接下来的处理; 适应度值为负值时,将相应染色体Xi的适应度值设置为0,以保证个体对应累计 概率为0,不会被选中。
2.3)计算种群中个体xi对应累计概率qxi,计算公式为
Figure BDA0003158835780000081
Figure BDA0003158835780000082
公式中,p(xi)表示个体Xi对应的适应度值在种群所有个体中的占比,qxi表 示累计概率,f(xi)表示个体Xi对应的适应度值,n表示种群的个体总数,j表示 累加过程中遍历到的染色体下标,xi和xj表示染色体,即xi表示染色体xi,xj表 示染色体xj
2.4)进行赌轮选择,赌轮选择过程为每次随机生成r∈[0,1],若qxi>r,则 选择个体Xi,重复该操作
Figure BDA0003158835780000083
次,得到数量为
Figure BDA0003158835780000084
的父代染色体,再对父代 染色体进行交叉操作,得到子代染色体合并父代染色体和子代染色体得到下一代 种群P1;具体过程是:
2.4.1)随机确定
Figure BDA0003158835780000085
个交叉点,其中c为给定交叉率;
2.4.2)交换交叉点前后染色体片段;
2.4.3)对交叉后的代染色体进行变异操作,即随机确定
Figure BDA0003158835780000086
个发 生变异的基因个数,其中m为给定变异率,len为单个染色体基因长度,反转基 因位的数值得到子代染色体;
2.4.4)合并父代染色体和子代染色体得到下一代种群P1
2.5)重复以上步骤,直到某代种群Pk满足终止条件,中终止条件为:超过 设置的最大迭代次数或者某代种群个体适应度值方差达到收敛条件,收敛条件 std_limition=2000,输出Pk中染色体基因对应权重值,即为所求回测周期T内, 各因子最优权重值组合。
3)根据步骤2)得到的最优因子权重,对股票池中的各只股票进行打分, 从而确定最优标的,根据确定的最优标的调仓仓位;
4)每三周重复步骤1)~3),调整因子权重,以适应市场环境的变化。
以上结合实施例对本发明进行了详细说明,但所述内容仅为本发明的较佳实 施例,不能被认为用于限定本发明的实施范围。凡依本发明申请范围所作的均等 变化与改进等,均应仍属于本发明的专利涵盖范围之内。

Claims (10)

1.一种基于遗传算法的智能多因子投资方法,其特征在于:其包括以下步骤:
1)从券商报告中获取评级一致性因子和评级波动性因子;
2)计算评级一致性因子和评级波动性因子的权重累加和作为染色基因,使用遗传算法求解当前市场环境下的最优因子权重;
3)根据步骤2)得到的最优因子权重,对股票池中的各只股票进行打分,从而确定最优标的,根据确定的最优标的调仓仓位。
2.根据权利要求1所述的基于遗传算法的智能多因子投资方法,其特征在于:所述的步骤1)中的评级一致性因子以及评级波动性因子的获取步骤包括:
1.1)构建金融情感词典:选择若干初始情感词典,以上市公司招股说明书和财务年报作为基础语料,进行金融领域专业词语过滤,在初始情感词典中加入具有针对性的金融领域专业名词以及术语,形成金融情感词典;
1.2)构建标题语料库和投资评级语料库:汇总标题语句文本,形成语句集合,对每个句子分词后,查询金融情感词典,将每个积极情感词典赋予权重+1,每个消极情感词典赋予权重-1;通过句子总权值的正负来判断相应的标题语句文本的情感倾向,并对标题语句文本进行分类;
1.3)计算标题因子与评级因子:对于一份新的券商报告文本,提取新文本的标题以及与评级相关的语句,将得到的语句与投资评级语料库的语句集合进行相似度匹配,根据相似度分布情况,确定新文本标题或评级的所属类别,并对新文本标题或评级进行归一化处理,得到新文本对应的标题因子和评级因子;
1.4)基于评级因子计算评级一致性因子:计算各家券商机构在时间[t-n,t]内对个股的评级平均值,并根据评级平均值计算个股在[t-n,t]内的一致评级值;
1.5)基于标题因子计算评级波动性因子:计算时间段[t-n,t]内,同一家证券机构对于个股在标题级别上的波动,将不同证券机构的波动结果进行结合,得到这段时间内,市场内部的针对该股的推荐等级调整变化情况。
3.根据权利要求2所述的基于遗传算法的智能多因子投资方法,其特征在于:所述的步骤1.4)中,券商机构brokeri在时间段[t-n,t]内对个股的评级平均值的计算公式为:
Figure FDA0003158835770000011
个股在[t-n,t]内的一致评级值的计算公式为:
Figure FDA0003158835770000021
公式中,Rate_brokeri表示时间[t-n,t]内,券商机构brokeri对个股的评级平均值,ratek表示个股在时刻k的评级值,report_brokeri表示时间[t-n,t]内券商机构brokeri发布的券商报告集合,Ratet表示一致评级值,wi表示券商机构brokeri对应的机构权重,m表示时间[t-n,t]内针对个股,有发布券商报告的券商机构总数。
4.根据权利要求2所述的基于遗传算法的智能多因子投资方法,其特征在于:所述的步骤1.5)中,计算时间段[t-n,t]内同一家证券机构对于个股在标题级别上的波动的计算公式为:
Figure FDA0003158835770000022
将不同证券机构的波动结果进行结合的公式为:
Figure FDA0003158835770000023
公式中,Rate_broker_changei表示个股在标题级别上的波动,Rate_changet表示该个股在不同证券机构的波动的结合,wi表示券商机构brokeri对应的权重。
5.根据权利要求1所述的基于遗传算法的智能多因子投资方法,其特征在于:所述的步骤2)中的最优因子权重求解步骤如下:
2.1)计算评级一致性因子和评级波动性因子权重,计算权重累加和作为待选股票的分数,以该分数作为待优化的m组染色基因,随机初始化一个染色体个数为n的种群P0,种群中每个染色体携带有m组染色体基因,设置最大迭代次数;
2.2)计算种群中每条染色体Xi的股票总收益作为适应度值,当适应度值为非负值时,将该适应度值作为相应染色体Xi的适应度值;当适应度为负值时,将相应染色体Xi的适应度值设置为0,以保证个体对应累计概率为0,不会被选中;
2.3)计算种群中个体Xi对应累计概率qxi
2.4)进行赌轮选择,其过程为每次随机生成r∈[0,1],若
Figure FDA0003158835770000024
则选择个体Xi;重复该操作
Figure FDA0003158835770000025
次,得到数量为
Figure FDA0003158835770000026
的父代染色体,对父代染色体进行交叉操作,得到子代染色体,合并父代染色体和子代染色体得到下一代种群P1
2.5)重复以上步骤,直到某代种群Pk满足终止条件,输出Pk中染色体基因对应权重值,即为所求回测周期Ttest内,各因子最优权重值组合。
6.根据权利要求5所述的基于遗传算法的智能多因子投资方法,其特征在于:所述的步骤2.1)中设置的最大迭代次数为:generation_max=100000;
所述的步骤2.5)中终止条件为:超过设置的最大迭代次数或者某代种群个体适应度值方差达到收敛条件,收敛条件std_limition=2000。
7.根据权利要求5所述的基于遗传算法的智能多因子投资方法,其特征在于:所述的步骤2.1)中计算权重累加和的计算公式为:
stockScorei=wconsistent*consistentRatei+wvolatile*volatileRatei (5)
公式中,stockScorei表示某个待选股票的分数,即权重的累加和,wconsistent表示分配给评级一致性因子的权重,wvolatile表示分配给评级波动性因子的权重,consistentRatei表示股票stocki在时间段t内的评级一致性因子值,volatileRatei表示股票stocki在时间段t内的评级波动性因子值;
所述的步骤2.2)中,对权重累加和进行二进制基因译码后再进行适应度值的计算,适应度值的计算公式为:
fitnessi=historyTest(weighti,Ttest) (6)
公式中,weighti为染色体xi二进制基因译码后得到的因子权重,Ttest为回测周期,其范围为当前时间的前三周,historyTest表示因子权重配比weighti在Ttest范围内展开回测的函数,用于返回最终回测收益率。
8.根据权利要求5所述的基于遗传算法的智能多因子投资方法,其特征在于:所述的步骤2.3)计算种群中个体Xi对应累计概率qxi的计算方法为:
Figure FDA0003158835770000031
Figure FDA0003158835770000032
公式中,p(xi)表示个体Xi对应的适应度值在种群所有个体中的占比,qxi表示累计概率,f(xi)表示个体Xi对应的适应度值,n表示种群的个体总数,j表示累加过程中遍历到的染色体下标,xi和xj表示染色体。
9.根据权利要求5所述的基于遗传算法的智能多因子投资方法,其特征在于:所述的步骤2.4)中父代染色体进行交叉操作的具体步骤为:
2.4.1)随机确定
Figure FDA0003158835770000041
个交叉点,其中c为给定交叉率;
2.4.2)交换交叉点前后染色体片段;
2.4.3)对交叉后的代染色体进行变异操作,即随机确定
Figure FDA0003158835770000042
个发生变异的基因个数,其中m为给定变异率,len为单个染色体基因长度,反转基因位的数值得到子代染色体;
2.4.4)合并父代染色体和子代染色体得到下一代种群P1
10.根据权利要求1所述的基于遗传算法的智能多因子投资方法,其特征在于:其还包括:
4)每隔三周重复步骤1)~3),调整因子权重,以适应市场环境的变化。
CN202110784843.5A 2021-07-12 2021-07-12 一种基于遗传算法的智能多因子投资方法 Pending CN113781232A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110784843.5A CN113781232A (zh) 2021-07-12 2021-07-12 一种基于遗传算法的智能多因子投资方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110784843.5A CN113781232A (zh) 2021-07-12 2021-07-12 一种基于遗传算法的智能多因子投资方法

Publications (1)

Publication Number Publication Date
CN113781232A true CN113781232A (zh) 2021-12-10

Family

ID=78835869

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110784843.5A Pending CN113781232A (zh) 2021-07-12 2021-07-12 一种基于遗传算法的智能多因子投资方法

Country Status (1)

Country Link
CN (1) CN113781232A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116522932A (zh) * 2023-06-26 2023-08-01 云目未来科技(湖南)有限公司 一种文本分析方法及系统
CN116739789A (zh) * 2023-08-16 2023-09-12 中信证券股份有限公司 虚拟物品回测信息发送方法、装置、电子设备和介质

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116522932A (zh) * 2023-06-26 2023-08-01 云目未来科技(湖南)有限公司 一种文本分析方法及系统
CN116522932B (zh) * 2023-06-26 2023-09-19 云目未来科技(湖南)有限公司 一种文本分析方法及系统
CN116739789A (zh) * 2023-08-16 2023-09-12 中信证券股份有限公司 虚拟物品回测信息发送方法、装置、电子设备和介质
CN116739789B (zh) * 2023-08-16 2023-12-19 中信证券股份有限公司 虚拟物品回测信息发送方法、装置、电子设备和介质

Similar Documents

Publication Publication Date Title
CN113781232A (zh) 一种基于遗传算法的智能多因子投资方法
CN112419029B (zh) 类金融机构风险监控方法、风险模拟系统及存储介质
CN112001788A (zh) 一种基于rf-dbscan算法的信用卡违约欺诈识别方法
CN110210973A (zh) 基于随机森林与朴素贝叶斯模型的内幕交易识别方法
CN107481135A (zh) 一种基于bp神经网络的个人信用评价方法及系统
CN111738856A (zh) 一种股票舆情投资决策分析方法及装置
García García et al. What is the cost of maximizing ESG performance in the portfolio selection strategy? The case of The Dow Jones Index average stocks
Parracho et al. Trading with optimized uptrend and downtrend pattern templates using a genetic algorithm kernel
Troise et al. Equity and reward crowdfunding: a multiple signal analysis
US8463678B2 (en) Generating method for transaction models with indicators for option
Haryono et al. Aspect-based sentiment analysis of financial headlines and microblogs using semantic similarity and bidirectional long short-term memory
CN113344692B (zh) 多信息源融合的网络借贷信用风险评估模型的建立方法
Miciuła The concept of FTS analysis in forecasting trends of exchange rate changes
CN112434862B (zh) 上市企业财务困境预测方法及装置
Yu et al. Loan Approval Prediction Improved by XGBoost Model Based on Four-Vector Optimization Algorithm
Gurung et al. uNRAVELING BEHAVIORAL BIASES IN DECISION MAKING: A STuDY OF NEPALESE INVESTORS
Taguchi et al. Constructing equity investment strategies using analyst reports and regime switching models
Jan et al. Detection of fraudulent financial statements using decision tree and artificial neural network
CN113706258A (zh) 基于组合模型的产品推荐方法、装置、设备及存储介质
Lin et al. Genetic algorithms for robust optimization in financial applications
KR102130104B1 (ko) 유전자 알고리즘을 이용한 부동산 경매에서의 낙찰가 예측 시스템 및 방법
CN111191688A (zh) 一种用户分期期数管理方法、装置和电子设备
Nur Comparing the Accuracy of Multiple Discriminant Analyisis, Logistic Regression, and Neural Network to estimate pay and not to pay Dividend
Barlam et al. Evaluating stock performance using technical analysis: A case study of TCS Ltd.
Denanti et al. The Correlation of Headline News Sentiment and Stock Return During Dividend Period

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination