CN114549213A - 一种基金产品的分析管理方法、装置及系统 - Google Patents
一种基金产品的分析管理方法、装置及系统 Download PDFInfo
- Publication number
- CN114549213A CN114549213A CN202210108056.3A CN202210108056A CN114549213A CN 114549213 A CN114549213 A CN 114549213A CN 202210108056 A CN202210108056 A CN 202210108056A CN 114549213 A CN114549213 A CN 114549213A
- Authority
- CN
- China
- Prior art keywords
- fund
- product
- analysis
- data
- fund product
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 39
- 238000004458 analytical method Methods 0.000 claims abstract description 169
- 238000007726 management method Methods 0.000 claims abstract description 95
- 238000005065 mining Methods 0.000 claims abstract description 32
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 19
- 238000010801 machine learning Methods 0.000 claims abstract description 16
- 238000013500 data storage Methods 0.000 claims abstract description 10
- 230000008859 change Effects 0.000 claims description 64
- 238000007621 cluster analysis Methods 0.000 claims description 11
- 238000004140 cleaning Methods 0.000 claims description 8
- 238000012545 processing Methods 0.000 claims description 5
- 230000002159 abnormal effect Effects 0.000 claims description 4
- 230000005540 biological transmission Effects 0.000 claims description 2
- 230000008569 process Effects 0.000 description 11
- 238000010586 diagram Methods 0.000 description 8
- 230000000694 effects Effects 0.000 description 7
- 238000004364 calculation method Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- 238000009826 distribution Methods 0.000 description 4
- 238000012795 verification Methods 0.000 description 4
- 230000001932 seasonal effect Effects 0.000 description 3
- 238000013473 artificial intelligence Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000007418 data mining Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000000491 multivariate analysis Methods 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 238000013139 quantization Methods 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000004141 dimensional analysis Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 238000012417 linear regression Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/06—Asset management; Financial planning or analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/26—Visual data mining; Browsing structured data
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Finance (AREA)
- Databases & Information Systems (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Operations Research (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- Technology Law (AREA)
- Economics (AREA)
- General Business, Economics & Management (AREA)
- Entrepreneurship & Innovation (AREA)
- Human Resources & Organizations (AREA)
- Game Theory and Decision Science (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种基金产品的分析管理方法、装置及系统。该分析管理装置包括数据获取单元、挖掘分析单元以及结果发送单元。该分析管理系统包括分析管理模块以及数据存储模块。通过根据所述背景数据组以及预设的预警阈值,从基金产品本身的持仓情况以及基金经理的管理偏好两个角度出发,对所述基金产品进行多维特征挖掘分析,从而提升对基金产品分析的准确性;进一步地,本发明提供的一种基金产品的分析管理方法、装置及系统还通过采用聚类分析和机器学习算法对多个基金产品进行分析,从而进一步提升对基金产品分析的准确性。
Description
技术领域
本发明涉及基金产品的分析管理领域,涉及一种基金的分析管理方法、装置及系统。
背景技术
随着金融资本市场的不断成熟发展,国内居民财富不断积累,投资者对收益稳定、风险可控的基金产品需求也越来越大。如何分析和监控基金产品的风险,成为了投资者在投资交易过程中的难题。一般地,投资者会通过分析基金产品历史的净值波动情况或分析基金产品的底层持仓风险情况,进一步评估基金产品的风险,从而对持仓基金进行变动管理。然而,公募基金只会通过季度报表进行持仓信息的披露,其中第一、三季度报表会在季度结束后一个月内完成,而且只需要披露前十大重仓股,半年报、年报会分别在季度结束后两个月、四个月内披露持仓详细情况。由于基金的季度报表存在滞后性和数据的稀疏性的情况对研究有着极大的限制性,我们需要结合市场信息对基金持仓资产进行实时的预测。
在现有技术中,计算基金产品历史净值的波动率,或者其他风险量化指标,对这些量化指标进行监控,若波动率较高,则说明基金产品可能存在较大风险,给予风险预警;分析基金产品的最新披露的持仓情况,若持仓中含有高风险资产或高风险行业,则说明基金产品可能存在较大风险,给予风险预警。
但是,现有技术仍存在如下缺陷:首先,目前部分公司对基金持仓的判断方法是基于非量化的手段,通过一定的人力调研,获取基金底层持仓资产的情况,但是这类方法具有很大的局限性,不易推广;其次,通过线性回归的算法对大盘行业指数净值以及基金走势净值进行一个拟合,推测基金对各行业的持仓比例,无视了行业指数存在着共线性的问题,缺乏对于基金经理、基金公司、大盘行情等多维度的分析,导致最终拟合的效果并不好。
因此,当前需要一种基金产品的分析管理方法、装置及系统,从而克服现有技术中存在的上述缺陷。
发明内容
针对现存的上述技术问题,本发明的目的在于提供一种基金产品的分析管理方法、装置及系统,从而提升对基金产品分析的准确性。
本发明提供了一种基金产品的分析管理方法,所述分析管理方法包括:获取待分析管理的基金产品以及所述基金产品对应的背景数据组;根据所述背景数据组以及预设的预警阈值,对所述基金产品进行多维特征挖掘分析,从而获取所述基金产品的分析结果;将所述分析结果发送给用户。
在一个实施例中,所述分析管理方法还包括:在接收到所述用户根据所述分析结果发送的管理指令后,对所述基金产品进行相应管理。
在一个实施例中,当仅存在一个待分析管理的基金产品时,所述根据所述背景数据组以及预设的预警阈值,对所述基金产品进行多维特征挖掘分析,从而获取所述基金产品的分析结果,具体包括:获取所述背景数据组中的持仓产品数据以及持仓风格数据;根据所述持仓产品数据以及所述持仓风格数据,计算所述基金产品的持仓变化率,并判断所述持仓变化率是否超过预设的预警阈值;若超过,则所述基金产品的分析结果为有异动风险。
在一个实施例中,当存在多个待分析管理的基金产品时,所述根据所述背景数据组以及预设的预警阈值,对所述基金产品进行多维特征挖掘分析,从而获取所述基金产品的分析结果,具体包括:获取各个基金产品的背景数据组中的持仓产品数据以及持仓风格数据;根据各个基金产品的所述持仓产品数据,提取对应的基金产品的产品持仓特征,并根据各个基金产品的所述持仓风格数据,提取对应的基金产品的管理偏好特征;根据产品持仓特征以及管理偏好特征,对多个基金产品进行聚类分析以获得聚类分析结果,并根据聚类类别、对应的基金产品以及预设的机器学习算法,预测各个基金产品的持仓情况;所述聚类分析结果包括聚类类别以及对应的基金产品;将各个基金产品的持仓情况作为对应基金产品的分析结果。
在一个实施例中,在获取所述背景数据组中的持仓产品数据以及持仓风格数据之后,所述分析管理方法还包括:对所述持仓产品数据以及所述持仓风格数据进行数据清洗处理。
本发明还提供了一种基金产品的分析管理装置,所述分析管理装置包括数据获取单元、挖掘分析单元以及结果发送单元,其中,所述数据获取单元用于获取待分析管理的基金产品以及所述基金产品对应的背景数据组;所述挖掘分析单元用于根据所述背景数据组以及预设的预警阈值,对所述基金产品进行多维特征挖掘分析,从而获取所述基金产品的分析结果;所述结果发送单元用于将所述分析结果发送给用户。
在一个实施例中,所述分析管理装置还包括产品管理单元,所述产品管理单元用于在接收到所述用户根据所述分析结果发送的管理指令后,对所述基金产品进行相应管理。
在一个实施例中,所述分析管理装置还包括数据清洗单元,所述数据清洗单元用于对所述持仓产品数据以及所述持仓风格数据进行数据清洗处理。
本发明还提供了一种基金产品的分析管理系统,所述分析管理系统包括分析管理模块以及数据存储模块,所述分析管理模块与所述数据存储模块通信连接,所述分析管理模块用于执行如前所述的基金产品的分析管理方法,所述数据存储模块用于存储所有数据。
相比于现有技术,本发明实施例具有如下有益效果:
本发明提供了一种基金产品的分析管理方法、装置及系统,通过根据所述背景数据组以及预设的预警阈值,从基金产品本身的持仓情况以及基金经理的管理偏好两个角度出发,对所述基金产品进行多维特征挖掘分析,从而提升对基金产品分析的准确性。
进一步地,本发明提供的一种基金产品的分析管理方法、装置及系统还通过采用聚类分析和机器学习算法对多个基金产品进行分析,从而进一步提升对基金产品分析的准确性。
附图说明
下文将结合说明书附图对本发明进行进一步的描述说明,其中:
图1示出了根据本发明的一种基金产品的分析管理方法的一个实施例的流程图;
图2示出了根据本发明的一种基金产品的分析管理方法的另一实施例的流程图;
图3示出了根据本发明的一种基金产品的分析管理装置的一个实施例的结构图;
图4示出了根据本发明的一种基金产品的分析管理系统的一个实施例的结构图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
具体实施例一
本发明实施例首先描述了一种基金产品的分析管理方法。图1示出了根据本发明的一种基金产品的分析管理方法的一个实施例的流程图。
如图1所示,该分析管理方法包括如下步骤:
S1:获取待分析管理的基金产品以及所述基金产品对应的背景数据组。
为了实现基金产品的分析,首先需要获取待分析管理的基金产品的各项数据,即本文中所述的背景数据组。
在现有技术中,由于考虑的因素维度较低,通常使用的量化技术往往无法实现准确的拟合效果,对此,本发明实施例对基金产品背后,包括但不限于基金经理、基金公司、大盘行情等方面进行多维度的特征挖掘和分析,辅助后续通过市场行情数据与基金表现拟合,形成持仓预测,从而进行分析。
S2:根据所述背景数据组以及预设的预警阈值,对所述基金产品进行多维特征挖掘分析,从而获取所述基金产品的分析结果。
在一个实施例中,当仅存在一个待分析管理的基金产品时,所述根据所述背景数据组以及预设的预警阈值,对所述基金产品进行多维特征挖掘分析,从而获取所述基金产品的分析结果,具体包括:获取所述背景数据组中的持仓产品数据以及持仓风格数据;根据所述持仓产品数据以及所述持仓风格数据,计算所述基金产品的持仓变化率,并判断所述持仓变化率是否超过预设的预警阈值;若超过,则所述基金产品的分析结果为有异动风险。
在一个实施例中,持仓产品数据包括行业季度持仓率、日持仓变化率以及整体持仓变化率。
其中,持仓变化率的计算公式如下:
CRf,id,dt=|Wf,id,dr-Wf,id,dr-1|;
CRf,dt=∑CRf,id,dr;
CRid,dt=∑CRid,dt;
其中CRf,id,dt表示基金f在交易日dt对行业id的持仓变化率,Wf,id,dt表示基金f在季度t对行业id的持仓比例,CRf,dt表示基金f在交易日dt时的持仓变化率,CRid,dt表示公募基金在交易日dt时对行业id的整体持仓变化率。当系统检测到基金持仓变化率CRf,dt大于设定阈值σf的时候,或者行业持仓变化率CRid,dt大于设定阈值σid,系统产生异动预警信号并发送给用户,提供一定的交易建议。其中,该预设的预警阈值可以是开发者针对基金特性设定的固定阈值,也可以是利用概率模型根据基金历史数据动态调整的阈值。
在一个实施例中,当存在多个待分析管理的基金产品时,所述根据所述背景数据组以及预设的预警阈值,对所述基金产品进行多维特征挖掘分析,从而获取所述基金产品的分析结果,具体包括:获取各个基金产品的背景数据组中的持仓产品数据以及持仓风格数据;根据各个基金产品的所述持仓产品数据,提取对应的基金产品的产品持仓特征,并根据各个基金产品的所述持仓风格数据,提取对应的基金产品的管理偏好特征;根据产品持仓特征以及管理偏好特征,对多个基金产品进行聚类分析以获得聚类分析结果,并根据聚类类别、对应的基金产品以及预设的机器学习算法,预测各个基金产品的持仓情况;所述聚类分析结果包括聚类类别以及对应的基金产品;将各个基金产品的持仓情况作为对应基金产品的分析结果。
在一个实施例中,持仓产品数据还包括大类资产投资率,持仓风格数据还包括基金产品对应的基金经理的第一行业季度持仓率。
通过对基金产品多个维度的特征信息预处理,能够有效帮助后续从更深层次的角度去分析产品,提高后续基金持仓预测的准确率。本发明实施例中,主要是从基金产品、基金经理两个维度出发,以量化的方式处理出基金的特征,从而能结合业务逻辑从这些维度分析整个产品。
具体的,从基金产品维度出发,主要考虑基金的持仓风格特征。首先通过基金对大类资产的持仓比例,区分基金属于偏股型、混合型、偏债型、偏货币型还是QDII、ETF等,从而获得对应的基金产品的产品持仓特征。更进一步地,着重对于偏股型基金分析投资风格,通过自底向上的思路,从基金的持仓股票风格,包括成长、估值、价值等多个角度衡量判断,再结合持仓比例形成基金的持股风格。
从基金经理维度出发,关注的维度包括但不限于其整体持仓变化率、行业持仓变化率、倾向配置行业等特征信息。具体的,通过度量过去多年中,利用公募基金的报表信息,通过下述公式分别提取基金经理整体的持仓变化率以及在各个行业维度的持仓变化率,衡量基金经理的投资风格,从而获得对应的基金产品的管理偏好特征。
其中,具体的公式如下:
Change_ratef,id,t=|Pf,id,t-Pf,id,t-1|;
Change_ratef,t=∑Change_ratef,id,t;
其中Change_ratef,id,t表示基金f在季度t对行业id的持仓变化率,Pf,id,t表示基金f在季度t对行业id的持仓比例。整体的持仓变化率通过对各行业的持仓变化率来刻画,该特征主要是用来衡量基金经理的投资规律,以及持仓指标对于后续分析预测的作用效果。
在计算获得产品持仓特征以及管理偏好特征之后,即可对多个基金产品进行聚类分析以获得聚类分析结果。通过多元统计等方法,结合上述量化特征对基金进行分类,分析每个分类中基金产品的持仓的共通之处,以此改进我们后续的预测效果。在一个实施例中,聚类算法包括但不限于K-means、Dbscan等。
聚类的作用是为了分析在不同特征维度下,相近的基金产品在持仓变化上的规律性,结合机器学习算法预测特征的变化方向,辅助后续的基金持仓预测模块。具体的,依据基金产品的定性分类,结合基金走势等信息生成基金的特征向量,根据特征向量对基金进行聚类分析。对于每个聚类类别,利用人工智能算法进行数据挖掘,从而计算同类基金整体换仓率、行业换仓率等特征受到表征大盘行情的各类因子变化的影响,预测出在复杂的行情下各类基金的换手率的分布概率情况,从而进一步获得预测的各个基金的持仓情况。
在前述步骤中,要计算持仓变化率,首先要对该基金产品的持仓情况进行预测,具体地,通过分析基金走势与行业走势来分析基金持仓的变化,但是,如果直接采用大盘的行业指数来进行求解,会出现噪音过大、行业共线性较强等问题。针对这一问题,本发明实施例从基金公司维度出发,关注公司整体的基金持仓股票,分析基金公司的投资方向,以基金公司为单位构造行业指数。从而一方面能够更加贴近公司的投资分析体系,使得生成的指数能够更接近单目标基金分析时的分析的行业指数;另一方面,能够剔除掉大量冗余股票,降低了行业指数的相关性,提高后续最优化过程的精度。
具体的,对于同一基金公司下的所有产品,首先得到过去数年内持仓明细,剔除掉持仓比例过低的个股数据。然后从远到近依次对股票的持仓比重给予递增的权重,使得模型能够更关注近期的持仓信息。最后,利用基金公司持股的市值数据,经过Softmax函数处理后,与股票的涨跌幅曲线加权求和,得到该公司各个行业指数的涨跌幅变化曲线。
其中,所述的Softmax函数如下公式所示,ws,t表示股票s在时间t时的权值,vs,t表示单基金公司在时间t对股票i的持仓市值。
cid,t=∑s′∈idws′,t×cs′,t;
行业指数生成公式如下,cid,t表示行业id在时间t的涨跌幅,cs′,t表示股票s′在时间t的涨跌幅。实际计算过程就是以股票所属行业进行划分,以基金对股票持仓市值为权重,生成行业指数涨跌幅。
随后,通过分析目标基金涨跌幅的变化曲线,以及行业指数生成模块得到的指数涨跌幅变化曲线,预测基金底层持仓资产。具体操作分为以下两个步骤:
第一步为行业预筛选,为了尽量避免行业共线性产生的干扰,该模块分析目标基金过去一段时间的持仓偏好,预筛选掉持仓比例过低的行业信息,降低干扰,具体的,通过聚类分析模块中对持仓偏好特征的预测,剔除掉持仓偏好最低级的行业,以此提高后续预测精度;第二部是持仓预测,利用多元非线性优化器,对过去一段时间行业指数涨跌幅曲线和目标基金涨跌幅曲线进行回归拟合,预测目标基金对各个行业的持仓情况。同时,结合聚类分析模块得到的期望行业配置权重ewf,id,t作为每个行业的初始化权重,使模型能够利用先验分析的结果优化搜索起点。其中,限制行业权重的搜索空间为[ewf,id,t-σ,ewf,id,t+σ],其中的σ通过目标基金的持仓变化率决定,变化率越高,σ就越大,表示行业的权重越不稳定,反之变化率越低σ取值越小。最后将预测的基金底层持仓分布存储在数据库中,提供查询服务。
在一个实施例中,为了避免市场行情巨变、特征因子失效等情况,从而使得前述机器学习过程中产生的模型预测精度偏差较大的情况产生,该分析管理方法还包括:以预设的跟踪时间间隔,获取该基金产品的实时背景数据组,并根据该实时背景数据组,对所述机器学习算法进行准确性验证,并在验证不通过时,对应进行修正。
S3:将所述分析结果发送给用户。
在获得分析结果后,需要将分析结果发送给用户,从而使得用户根据该分析结果决定下一步操作。
本发明实施例描述了一种基金产品的分析管理方法,通过根据所述背景数据组以及预设的预警阈值,从基金产品本身的持仓情况以及基金经理的管理偏好两个角度出发,对所述基金产品进行多维特征挖掘分析,从而提升对基金产品分析的准确性;进一步地,本发明实施例描述的一种基金产品的分析管理方法还通过采用聚类分析和机器学习算法对多个基金产品进行分析,从而进一步提升对基金产品分析的准确性。
具体实施例二
更进一步地,本发明实施例还描述了一种基金产品的分析管理方法。图2示出了根据本发明的一种基金产品的分析管理方法的另一实施例的流程图。
如图2所示,该分析管理方法包括如下步骤:
A1:获取待分析管理的基金产品以及所述基金产品对应的背景数据组。
为了实现基金产品的分析,首先需要获取待分析管理的基金产品的各项数据,即本文中所述的背景数据组。
在现有技术中,由于考虑的因素维度较低,通常使用的量化技术往往无法实现准确的拟合效果,对此,本发明实施例对基金产品背后,包括但不限于基金经理、基金公司、大盘行情等方面进行多维度的特征挖掘和分析,辅助后续通过市场行情数据与基金表现拟合,形成持仓预测,从而进行分析。
A2:根据所述背景数据组以及预设的预警阈值,对所述基金产品进行多维特征挖掘分析,从而获取所述基金产品的分析结果。
在一个实施例中,当仅存在一个待分析管理的基金产品时,所述根据所述背景数据组以及预设的预警阈值,对所述基金产品进行多维特征挖掘分析,从而获取所述基金产品的分析结果,具体包括:获取所述背景数据组中的持仓产品数据以及持仓风格数据;根据所述持仓产品数据以及所述持仓风格数据,计算所述基金产品的持仓变化率,并判断所述持仓变化率是否超过预设的预警阈值;若超过,则所述基金产品的分析结果为有异动风险。
在一个实施例中,持仓产品数据包括行业季度持仓率、日持仓变化率以及整体持仓变化率。
其中,持仓变化率的计算公式如下:
CRf,id,dt=|Wf,id,dt-Wf,id,dt-1|;
CRf,dt=∑CRf,id,dt;
CRid,dt=∑CRid,dt;
其中CRf,id,dt表示基金f在交易日dt对行业id的持仓变化率,Wf,id,dt表示基金f在季度t对行业id的持仓比例,CRf,dt表示基金f在交易日dt时的持仓变化率,CRid,dt表示公募基金在交易日dt时对行业id的整体持仓变化率。当系统检测到基金持仓变化率CRf,dt大于设定阈值σf的时候,或者行业持仓变化率CRid,dt大于设定阈值σid,系统产生异动预警信号并发送给用户,提供一定的交易建议。其中,该预设的预警阈值可以是开发者针对基金特性设定的固定阈值,也可以是利用概率模型根据基金历史数据动态调整的阈值。
在一个实施例中,当存在多个待分析管理的基金产品时,所述根据所述背景数据组以及预设的预警阈值,对所述基金产品进行多维特征挖掘分析,从而获取所述基金产品的分析结果,具体包括:获取各个基金产品的背景数据组中的持仓产品数据以及持仓风格数据;根据各个基金产品的所述持仓产品数据,提取对应的基金产品的产品持仓特征,并根据各个基金产品的所述持仓风格数据,提取对应的基金产品的管理偏好特征;根据产品持仓特征以及管理偏好特征,对多个基金产品进行聚类分析以获得聚类分析结果,并根据聚类类别、对应的基金产品以及预设的机器学习算法,预测各个基金产品的持仓情况;所述聚类分析结果包括聚类类别以及对应的基金产品;将各个基金产品的持仓情况作为对应基金产品的分析结果。
在一个实施例中,持仓产品数据还包括大类资产投资率,持仓风格数据还包括基金产品对应的基金经理的第一行业季度持仓率。
通过对基金产品多个维度的特征信息预处理,能够有效帮助后续从更深层次的角度去分析产品,提高后续基金持仓预测的准确率。本发明实施例中,主要是从基金产品、基金经理两个维度出发,以量化的方式处理出基金的特征,从而能结合业务逻辑从这些维度分析整个产品。
具体的,从基金产品维度出发,主要考虑基金的持仓风格特征。首先通过基金对大类资产的持仓比例,区分基金属于偏股型、混合型、偏债型、偏货币型还是QDII、ETF等,从而获得对应的基金产品的产品持仓特征。更进一步地,着重对于偏股型基金分析投资风格,通过自底向上的思路,从基金的持仓股票风格,包括成长、估值、价值等多个角度衡量判断,再结合持仓比例形成基金的持股风格。
从基金经理维度出发,关注的维度包括但不限于其整体持仓变化率、行业持仓变化率、倾向配置行业等特征信息。具体的,通过度量过去多年中,利用公募基金的报表信息,通过下述公式分别提取基金经理整体的持仓变化率以及在各个行业维度的持仓变化率,衡量基金经理的投资风格,从而获得对应的基金产品的管理偏好特征。
其中,具体的公式如下:
Change_ratef,id,t=|Pf,id,t-Pf,id,t-1|;
Change_ratef,t=∑Change_ratef,id,t;
其中Change_ratef,id,t表示基金f在季度t对行业id的持仓变化率,Pf,id,t表示基金f在季度t对行业id的持仓比例。整体的持仓变化率通过对各行业的持仓变化率来刻画,该特征主要是用来衡量基金经理的投资规律,以及持仓指标对于后续分析预测的作用效果。
在计算获得产品持仓特征以及管理偏好特征之后,即可对多个基金产品进行聚类分析以获得聚类分析结果。通过多元统计等方法,结合上述量化特征对基金进行分类,分析每个分类中基金产品的持仓的共通之处,以此改进我们后续的预测效果。在一个实施例中,聚类算法包括但不限于K-means、Dbscan等。
聚类的作用是为了分析在不同特征维度下,相近的基金产品在持仓变化上的规律性,结合机器学习算法预测特征的变化方向,辅助后续的基金持仓预测模块。具体的,依据基金产品的定性分类,结合基金走势等信息生成基金的特征向量,根据特征向量对基金进行聚类分析。对于每个聚类类别,利用人工智能算法进行数据挖掘,从而计算同类基金整体换仓率、行业换仓率等特征受到表征大盘行情的各类因子变化的影响,预测出在复杂的行情下各类基金的换手率的分布概率情况,从而进一步获得预测的各个基金的持仓情况。
在前述步骤中,要计算持仓变化率,首先要对该基金产品的持仓情况进行预测,具体地,通过分析基金走势与行业走势来分析基金持仓的变化,但是,如果直接采用大盘的行业指数来进行求解,会出现噪音过大、行业共线性较强等问题。针对这一问题,本发明实施例从基金公司维度出发,关注公司整体的基金持仓股票,分析基金公司的投资方向,以基金公司为单位构造行业指数。从而一方面能够更加贴近公司的投资分析体系,使得生成的指数能够更接近单目标基金分析时的分析的行业指数;另一方面,能够剔除掉大量冗余股票,降低了行业指数的相关性,提高后续最优化过程的精度。
具体的,对于同一基金公司下的所有产品,首先得到过去数年内持仓明细,剔除掉持仓比例过低的个股数据。然后从远到近依次对股票的持仓比重给予递增的权重,使得模型能够更关注近期的持仓信息。最后,利用基金公司持股的市值数据,经过Softmax函数处理后,与股票的涨跌幅曲线加权求和,得到该公司各个行业指数的涨跌幅变化曲线。
其中,所述的Softmax函数如下公式所示,ws,t表示股票s在时间t时的权值,vs,t表示单基金公司在时间t对股票i的持仓市值。
cid,t=∑s′∈idws′,t×cs′,t;
行业指数生成公式如下,cid,t表示行业id在时间t的涨跌幅,cs′,t表示股票s′在时间t的涨跌幅。实际计算过程就是以股票所属行业进行划分,以基金对股票持仓市值为权重,生成行业指数涨跌幅。
随后,通过分析目标基金涨跌幅的变化曲线,以及行业指数生成模块得到的指数涨跌幅变化曲线,预测基金底层持仓资产。具体操作分为以下两个步骤:
第一步为行业预筛选,为了尽量避免行业共线性产生的干扰,该模块分析目标基金过去一段时间的持仓偏好,预筛选掉持仓比例过低的行业信息,降低干扰,具体的,通过聚类分析模块中对持仓偏好特征的预测,剔除掉持仓偏好最低级的行业,以此提高后续预测精度;第二部是持仓预测,利用多元非线性优化器,对过去一段时间行业指数涨跌幅曲线和目标基金涨跌幅曲线进行回归拟合,预测目标基金对各个行业的持仓情况。同时,结合聚类分析模块得到的期望行业配置权重ewf,id,t作为每个行业的初始化权重,使模型能够利用先验分析的结果优化搜索起点。其中,限制行业权重的搜索空间为[ewf,id,t-σ,ewf,id,t+σ],其中的σ通过目标基金的持仓变化率决定,变化率越高,σ就越大,表示行业的权重越不稳定,反之变化率越低σ取值越小。最后将预测的基金底层持仓分布存储在数据库中,提供查询服务。
在一个实施例中,为了避免市场行情巨变、特征因子失效等情况,从而使得前述机器学习过程中产生的模型预测精度偏差较大的情况产生,该分析管理方法还包括:以预设的跟踪时间间隔,获取该基金产品的实时背景数据组,并根据该实时背景数据组,对所述机器学习算法进行准确性验证,并在验证不通过时,对应进行修正。
A3:将所述分析结果发送给用户。
在获得分析结果后,需要将分析结果发送给用户,从而使得用户根据该分析结果决定下一步操作。
A4:在接收到所述用户根据所述分析结果发送的管理指令后,对所述基金产品进行相应管理。
本发明实施例描述了一种基金产品的分析管理方法,通过根据所述背景数据组以及预设的预警阈值,从基金产品本身的持仓情况以及基金经理的管理偏好两个角度出发,对所述基金产品进行多维特征挖掘分析,从而提升对基金产品分析的准确性;进一步地,本发明实施例描述的一种基金产品的分析管理方法还通过采用聚类分析和机器学习算法对多个基金产品进行分析,从而进一步提升对基金产品分析的准确性。
具体实施例三
除上述方法外,本发明实施例还描述了一种基金产品的分析管理装置。图3示出了根据本发明的一种基金产品的分析管理装置的一个实施例的结构图。
如图所示,该装置包括分析管理装置包括数据获取单元11、挖掘分析单元12以及结果发送单元13。
数据获取单元11用于获取待分析管理的基金产品以及所述基金产品对应的背景数据组。
挖掘分析单元12用于根据所述背景数据组以及预设的预警阈值,对所述基金产品进行多维特征挖掘分析,从而获取所述基金产品的分析结果。
结果发送单元13用于将所述分析结果发送给用户。
当需要对基金产品进行分析管理时,首先,通过数据获取单元11获取待分析管理的基金产品以及所述基金产品对应的背景数据组;随后,根据所述背景数据组以及预设的预警阈值,通过挖掘分析单元12对所述基金产品进行多维特征挖掘分析,从而获取所述基金产品的分析结果;最后,通过结果发送单元13将所述分析结果发送给用户。
在一个实施例中,所述分析管理装置还包括产品管理单元,所述产品管理单元用于在接收到所述用户根据所述分析结果发送的管理指令后,对所述基金产品进行相应管理。
在一个实施例中,所述分析管理装置还包括数据清洗单元,所述数据清洗单元用于对所述持仓产品数据以及所述持仓风格数据进行数据清洗处理。
本发明实施例描述了一种基金产品的分析管理装置,通过根据所述背景数据组以及预设的预警阈值,从基金产品本身的持仓情况以及基金经理的管理偏好两个角度出发,对所述基金产品进行多维特征挖掘分析,从而提升对基金产品分析的准确性;进一步地,本发明实施例描述的一种基金产品的分析管理装置还通过采用聚类分析和机器学习算法对多个基金产品进行分析,从而进一步提升对基金产品分析的准确性。
具体实施例四
除上述方法和装置外,本发明还描述了一种基金产品的分析管理系统。图4示出了根据本发明的一种基金产品的分析管理系统的一个实施例的结构图。
如图所示,该分析管理系统包括分析管理模块1以及数据存储模块2,所述分析管理模块1与所述数据存储模块2通信连接,所述分析管理模块1用于执行如前所述的基金产品的分析管理方法,所述数据存储模块2用于存储所有数据。
在一个实施例中,该分析管理系统包括用户交互模块,该用户交互模块包括触摸/不可触摸显示屏、输入键盘、虚拟键盘、指示灯、麦克风、扬声器以及前述一种或多种的组合。
本发明实施例描述了一种基金产品的分析管理系统,通过根据所述背景数据组以及预设的预警阈值,从基金产品本身的持仓情况以及基金经理的管理偏好两个角度出发,对所述基金产品进行多维特征挖掘分析,从而提升对基金产品分析的准确性;进一步地,本发明实施例描述的一种基金产品的分析管理系统还通过采用聚类分析和机器学习算法对多个基金产品进行分析,从而进一步提升对基金产品分析的准确性。
以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步的详细说明,应当理解,以上所述仅为本发明的具体实施例而已,并不用于限定本发明的保护范围。特别指出,对于本领域技术人员来说,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (9)
1.一种基金产品的分析管理方法,其特征在于,所述分析管理方法包括:
获取待分析管理的基金产品以及所述基金产品对应的背景数据组;
根据所述背景数据组以及预设的预警阈值,对所述基金产品进行多维特征挖掘分析,从而获取所述基金产品的分析结果;
将所述分析结果发送给用户。
2.根据权利要求1所述的基金产品的分析管理方法,其特征在于,所述分析管理方法还包括:
在接收到所述用户根据所述分析结果发送的管理指令后,对所述基金产品进行相应管理。
3.根据权利要求2所述的基金产品的分析管理方法,其特征在于,当仅存在一个待分析管理的基金产品时,所述根据所述背景数据组以及预设的预警阈值,对所述基金产品进行多维特征挖掘分析,从而获取所述基金产品的分析结果,具体包括:
获取所述背景数据组中的持仓产品数据以及持仓风格数据;
根据所述持仓产品数据以及所述持仓风格数据,计算所述基金产品的持仓变化率,并判断所述持仓变化率是否超过预设的预警阈值;
若超过,则所述基金产品的分析结果为有异动风险。
4.根据权利要求3所述的基金产品的分析管理方法,其特征在于,当存在多个待分析管理的基金产品时,所述根据所述背景数据组以及预设的预警阈值,对所述基金产品进行多维特征挖掘分析,从而获取所述基金产品的分析结果,具体包括:
获取各个基金产品的背景数据组中的持仓产品数据以及持仓风格数据;
根据各个基金产品的所述持仓产品数据,提取对应的基金产品的产品持仓特征,并根据各个基金产品的所述持仓风格数据,提取对应的基金产品的管理偏好特征;
根据产品持仓特征以及管理偏好特征,对多个基金产品进行聚类分析以获得聚类分析结果,并根据聚类类别、对应的基金产品以及预设的机器学习算法,预测各个基金产品的持仓情况;所述聚类分析结果包括聚类类别以及对应的基金产品;
将各个基金产品的持仓情况作为对应基金产品的分析结果。
5.根据权利要求4所述的基金产品的分析管理方法,其特征在于,在获取所述背景数据组中的持仓产品数据以及持仓风格数据之后,所述分析管理方法还包括:
对所述持仓产品数据以及所述持仓风格数据进行数据清洗处理。
6.一种基金产品的分析管理装置,其特征在于,所述分析管理装置包括数据获取单元、挖掘分析单元以及结果发送单元,其中,
所述数据获取单元用于获取待分析管理的基金产品以及所述基金产品对应的背景数据组;
所述挖掘分析单元用于根据所述背景数据组以及预设的预警阈值,对所述基金产品进行多维特征挖掘分析,从而获取所述基金产品的分析结果;
所述结果发送单元用于将所述分析结果发送给用户。
7.根据权利要求6所述的基金产品的分析管理装置,其特征在于,所述分析管理装置还包括产品管理单元,所述产品管理单元用于在接收到所述用户根据所述分析结果发送的管理指令后,对所述基金产品进行相应管理。
8.根据权利要求7所述的基金产品的分析管理装置,其特征在于,所述分析管理装置还包括数据清洗单元,所述数据清洗单元用于对所述持仓产品数据以及所述持仓风格数据进行数据清洗处理。
9.一种基金产品的分析管理系统,其特征在于,所述分析管理系统包括分析管理模块以及数据存储模块,所述分析管理模块与所述数据存储模块通信连接,所述分析管理模块用于执行如权利要求1-5任一项所述的基金产品的分析管理方法,所述数据存储模块用于存储所有数据。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210108056.3A CN114549213B (zh) | 2022-01-28 | 2022-01-28 | 一种基金产品的分析管理方法、装置及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210108056.3A CN114549213B (zh) | 2022-01-28 | 2022-01-28 | 一种基金产品的分析管理方法、装置及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114549213A true CN114549213A (zh) | 2022-05-27 |
CN114549213B CN114549213B (zh) | 2024-09-20 |
Family
ID=81673021
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210108056.3A Active CN114549213B (zh) | 2022-01-28 | 2022-01-28 | 一种基金产品的分析管理方法、装置及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114549213B (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108805718A (zh) * | 2018-05-24 | 2018-11-13 | 广州实盈网络科技有限公司 | 一种业绩归因分析及fof\mom资产配置系统 |
CN109344174A (zh) * | 2018-09-13 | 2019-02-15 | 深圳易投云智能科技有限公司 | 金融分析方法和系统 |
CN109360105A (zh) * | 2018-09-18 | 2019-02-19 | 平安科技(深圳)有限公司 | 产品风险预警方法、装置、计算机设备和存储介质 |
CN110335057A (zh) * | 2019-04-30 | 2019-10-15 | 广发证券股份有限公司 | 一种机器学习与人工规则融合的基金精准营销方法 |
-
2022
- 2022-01-28 CN CN202210108056.3A patent/CN114549213B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108805718A (zh) * | 2018-05-24 | 2018-11-13 | 广州实盈网络科技有限公司 | 一种业绩归因分析及fof\mom资产配置系统 |
CN109344174A (zh) * | 2018-09-13 | 2019-02-15 | 深圳易投云智能科技有限公司 | 金融分析方法和系统 |
CN109360105A (zh) * | 2018-09-18 | 2019-02-19 | 平安科技(深圳)有限公司 | 产品风险预警方法、装置、计算机设备和存储介质 |
CN110335057A (zh) * | 2019-04-30 | 2019-10-15 | 广发证券股份有限公司 | 一种机器学习与人工规则融合的基金精准营销方法 |
Also Published As
Publication number | Publication date |
---|---|
CN114549213B (zh) | 2024-09-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Wang et al. | Enhancing intraday stock price manipulation detection by leveraging recurrent neural networks with ensemble learning | |
Tsai et al. | Combining multiple feature selection methods for stock prediction: Union, intersection, and multi-intersection approaches | |
Chen et al. | Financial distress prediction in China | |
CN111783829A (zh) | 一种基于多标签学习的财务异常检测方法及装置 | |
Emir et al. | A stock selection model based on fundamental and technical analysis variables by using artificial neural networks and support vector machines | |
Ruyu et al. | A comparison of credit rating classification models based on spark-evidence from lending-club | |
CN110689437A (zh) | 一种基于随机森林的通信施工项目财务风险预测方法 | |
Deng et al. | An intelligent system for insider trading identification in Chinese security market | |
Li | Design a management information system for financial risk control | |
CN114037536A (zh) | 股票智能投资系统 | |
CN116503174A (zh) | 一种基于大数据的金融数据预测系统 | |
Arora et al. | Predicting distress: A post insolvency and bankruptcy code 2016 analysis | |
Polamuri et al. | Prediction of stock price growth for novel greedy heuristic optimized multi-instances quantitative (NGHOMQ) | |
Velykoivanenko et al. | Application of Clustering in the Dimensionality Reduction Algorithms for Separation of Financial Status of Commercial Banks in Ukraine | |
CN112329862A (zh) | 基于决策树的反洗钱方法及系统 | |
Doğan et al. | A comparative study of corporate credit ratings prediction with machine learning | |
Ndayisenga | Bank loan approval prediction using machine learning techniques | |
CN116385151A (zh) | 基于大数据进行风险评级预测的方法及计算设备 | |
Najadat et al. | Performance evaluation of industrial firms using DEA and DECORATE ensemble method. | |
CN114549213A (zh) | 一种基金产品的分析管理方法、装置及系统 | |
Yang et al. | An evidential reasoning rule-based ensemble learning approach for evaluating credit risks with customer heterogeneity | |
Li et al. | Research on listed companies’ credit ratings, considering classification performance and interpretability | |
Ha et al. | Financial distress forecasting with a machine learning approach | |
Hsu et al. | Classification methods of credit rating-A comparative analysis on SVM, MDA and RST | |
Cheng et al. | An attribute selection based classifier to predict financial distress |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |