CN109658253A - 一种基于行业指数回归的基金仓位估算算法 - Google Patents
一种基于行业指数回归的基金仓位估算算法 Download PDFInfo
- Publication number
- CN109658253A CN109658253A CN201910031177.0A CN201910031177A CN109658253A CN 109658253 A CN109658253 A CN 109658253A CN 201910031177 A CN201910031177 A CN 201910031177A CN 109658253 A CN109658253 A CN 109658253A
- Authority
- CN
- China
- Prior art keywords
- fund
- regression
- bin
- storehouse
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 claims abstract description 15
- 230000001419 dependent effect Effects 0.000 claims abstract description 11
- 238000009499 grossing Methods 0.000 claims description 13
- 238000011480 coordinate descent method Methods 0.000 claims description 8
- 230000008901 benefit Effects 0.000 claims description 3
- 230000008569 process Effects 0.000 claims description 2
- 230000002354 daily effect Effects 0.000 description 27
- 230000008859 change Effects 0.000 description 7
- 230000000875 corresponding effect Effects 0.000 description 2
- 230000003203 everyday effect Effects 0.000 description 2
- 230000007115 recruitment Effects 0.000 description 2
- 241000287196 Asthenes Species 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000012417 linear regression Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000013488 ordinary least square regression Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/06—Asset management; Financial planning or analysis
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Operations Research (AREA)
- Game Theory and Decision Science (AREA)
- Human Resources & Organizations (AREA)
- Entrepreneurship & Innovation (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- Technology Law (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Abstract
基金仓位是基金投入股市的资金占基金所能运用的资产的比例,是市场信息的一个反应。目前国内基金的仓位信息是按照证监会以季度为单位进行披露的,无法及时反应市场的风向。本发明方法主要用于基金仓位的每天估算。方法首先依据申万一级行业分类,将股票分为28类,获取这28个行业指数日收益率及待估算的基金的日收益率;然后将行业指数日收益率作为自变量、基金的日收益率作为因变量建立回归方程;随后基于lasso回归模型,通过坐标下降法及最小化回归损失函数解出回归系数,回归系数的和就是基金持有的股票资产占基金资产的比例,即基金仓位;最后用每季度的公布的实际仓位和预测仓位比较,计算其除去最大、最小误差后的平均误差,进行模型修匀,提升模型的准确度。根据基金仓位预测模型的结果,可以为投资者提供一定的投资参考价值。
Description
技术领域
本发明涉及基金数据挖掘技术领域,尤其是涉及一种基于行业指数回归的基金仓位估算算法。
背景技术
证券投资基金是通过发售基金的方式集中投资者的资金,基金托管人托管,基金管理人管理,以投资组合的方法进行证券投资的一种利益共享,风险共担的集合投资方式。作为A股重要的机构投资者之一,公募基金尤其是主动管理型股票基金的持仓动向一直为市场所关注。
基金仓位是基金投入股市的资金占基金所能运用的资产的比例,是市场信息的一个反应,其变化代表着作为市场中重要的机构投资者对未来市场的看法,可以作为其他投资者判断后市场走向的重要指标。但基金仓位通常处于较为频繁的变动之中,因而预测每一天的仓位变化有着重要意义。
目前国内基金的仓位信息是按照证监会以季度为单位进行披露的,无法及时反应市场风向,不能作为一个连续的市场预期指标,因此可以通过建立基金仓位估算模型来预测。
传统的基金仓位估算方法通过使用基金的净值变化和基金的平均收益变化建立简单的回归模型,误差较大。而基金仓位与基金持股股价的加权平均是正相关的,且存在线性关系,可以考虑采用线性回归的方法对仓位进行估算。
考虑到市场上股票数太多,根据行业习惯和市场认可度,可以依据申万一级行业分类,选择具有代表的一级行业指数的日收益率作为回归自变量。基于自变量组存在明显的多重共线性,若直接采用普通最小二乘回归进行求解,则各行业变量前面的拟合系数会互相干扰,出现不合理的回归结果,并且共线性严重时回归方程无法通过数值方法求解,因此模型选择lasso回归。
发明内容
本发明方法主要用于基金仓位的每天估算。方法首先依据申万一级行业分类,将股票分为28类,获取这28个行业指数日收益率及待估算的基金的日收益率;然后将行业指数日收益率作为自变量、基金的日收益率作为因变量建立回归方程;随后基于lasso回归模型,通过坐标下降法及最小化回归损失函数解出回归系数,回归系数的和就是基金持有的股票资产占基金资产的比例,即基金仓位;最后用历史每季度的公布的实际仓位和预测仓位比较,计算其除去最大、最小误差后的平均误差,进行模型修匀,提升模型的准确度。根据基金仓位预测模型的结果,可以为投资者提供一定的投资参考价值。
具体步骤如下:
(1)获取股票的28个一级行业指数日收益率及基金的日收益率;
(2)以28个一级行业指数日收益率作为自变量、基金的日收益率作为因变量建立回归方程;
(3)基于lasso回归模型,通过坐标下降法,最小化回归损失函数解出回归系数;
(4)根据基金的历史实际仓位,进行模型修匀。
其中,步骤(1)的获取股票的28个一级行业指数日收益率及基金的日收益率,是指依据申万一级行业分类(N=28),将股票分为28类,获取N个行业指数日收益率及基金的日收益率,分别记为和记,即一级行业指数i在t日的收益率和基金j在t日的收益率。
其中,步骤(2)中以28个一级行业指数日收益率作为自变量、基金的日收益率作为因变量建立回归方程,是指用和记建立回归方程:
,
其中,是截距项,为待拟合的回归系数,则回归系数的和是基金持有的股票资产占基金资产的比例,即基金仓位;只要求出回归系数,就能获得相应的基金仓位。考虑到28个自变量间的共线性问题,对模型加罚项,采用lasso回归,通过构造一个惩罚函数得到一个较为精炼的模型。假设预测基金交易日T收盘时的持仓权重,取交易日T-K~T的数据进行回归,记回归方程为:
,
其中为自变量,为因变量。
其中,步骤(3)中的基于lasso回归模型,通过坐标下降法,最小化回归损失函数解出回归系数,是指通过上述的回归方程,建立lasso回归的损失函数:
,
其中,为超参数,是惩罚项。为求解出,使用坐标下降法,每次求解其中一个维度使得损失函数最小,固定其他维度,通过不断迭代得到最优回归系数。求得的某个维度的偏导数为:
,
为符号简洁,令:,
令有:
,
通过第j基金招募合同中规定的仓位上下限对预测基金进行约束,当对于该基金的预测仓位低于时调整为,高于时调整为。
其中,步骤(4)中的根据基金的历史实际仓位,进行模型修匀,是指用历史每季度的公布的实际仓位和预测仓位比较,计算其除去最大、最小误差后的平均误差;对于第n天的预测仓位,选取第n天的前K个季度平均误差做预测修匀,修匀后的预测仓位为:
,
其中是修匀后的预测仓位,是第n天的预测仓位,是前K个季度平均误差。
附图说明
图1是本发明基于行业指数回归的基金仓位估算算法的流程步骤图。
图2是使用本发明模型对某基金的预测情况。图中为某基金的实际仓位与模型预测仓位结果的对比。
具体实施方式
下面结合附图和实例,对本发明方法进行描述。
本发明方法通过以28个一级行业指数日收益率作为自变量、基金的日收益率作为因变量建立回归方程,通过最小化lasso回归损失函数,求解出回归系数,得到的系数之和为基金仓位,从而预测每一天的基金仓位变化。同时通过历史每季度公布的实际仓位进行模型修匀提升模型的准确度,其步骤如图1所示。通过模型预测每天的基金仓位,可以为投资者提供一定的参考和研究价值。
本发明方法的具体步骤描述如下。
一、获取股票的28个一级行业指数日收益率及基金的日收益率。
依据申万一级行业分类(N=28),将股票分为28类,获取N个行业指数日收益率及基金的日收益率,分别记为和记,即一级行业指数i在t日的收益率和基金j在t日的收益率。
二、以28个一级行业指数日收益率作为自变量、基金的日收益率作为因变量建立回归方程,
,
其中,为截距项,𝛽𝑖为待拟合的回归系数,则回归系数的和是基金持有的股票资产占基金资产的比例,即基金仓位。这时只要求出回归系数,就能获得相应的基金仓位。
三、基于lasso回归模型,通过坐标下降法,最小化回归损失函数解出回归系数。
考虑到28个自变量间的共线性问题,对模型加罚项,采用lasso回归,通过构造一个惩罚函数得到一个较为精炼的模型,使得它压缩一些系数,同时设定一些系数为零。这种方法保留了子集收缩的优点,是一种处理具有复共线性数据的有偏估计。
假设预测基金交易日T收盘时的持仓权重,取交易日T-K~T的数据进行回归,记回归方程中因变量:,
自变量:,
其中: ,
待拟合系数:,
则lasso回归的损失函数为:,
其中,为超参数,是惩罚项。
将RSS写为算术形式:
,
为求解出,使用坐标下降法,每次求解其中一个维度使得损失函数最小,固定其他维度,通过不断迭代得到最优回归系数:
。
为符号简洁,令:,
令有:
,
通过第j基金招募合同中规定的仓位上下限对预测基金进行约束,当对于该基金的预测仓位低于时调整为,高于时调整为。
四、根据基金的历史实际仓位,进行模型修匀。
为提升模型准确度,通过每季度公布的实际仓位进行模型修匀。记第t季度的公布的实际仓位为,模型预测仓位为,则第t季度仓位预测误差为:
。
对于同一只基金,已知实际仓位的前K个季度,其预测误差分别为,计算其除去最大、最小误差后的平均误差为:
,
其中,、分别为K个季度中的最大、最小误差。
对于第n天的预测仓位,选取第n天的前K个季度平均误差做预测修匀,修匀后的预测仓位为:
,
其中是修匀后的预测仓位,是前K个季度平均误差。
使用本模型对某基金的仓位进行预测,其结果如图2所示。可见模型预测值与实际仓位值比较接近,趋势相同,平均误差在10%以内。
综上所述,本发明公开了一种基于行业指数回归的基金仓位估算算法。方法以28个一级行业指数日收益率作为自变量、基金的日收益率作为因变量建立回归方程,通过最小化lasso回归损失函数,求解出回归系数,得到的系数之和为基金仓位,预测每一天的仓位变化。同时通过历史每季度公布的实际仓位进行模型修匀提升模型的准确度。预测的基金仓位可以为投资者提供一定的参考和研究价值。
本发明方法同样可应用于证券类具有相似操作本体的数据,如私募基金、期货、或者股票等证券的管理人评分。因此,尽管为说明目的公开了本发明的具体实施例和附图,其目的在于帮助理解本发明的内容并据以实施,但是本领域的技术人员可以理解:在不脱离本发明及所附的权利要求的精神和范围内,各种替换、变化和修改都是不可能的。因此,本发明不应局限于最佳实施例和附图所公开的内容。当前公开的实施例在所有方面应被理解为说明性的而非对其请求保护的范围的限制。
Claims (4)
1.一种基于行业指数回归的基金仓位估算算法,其特征在于所述方法包括如下步骤:
(1)获取股票的28个一级行业指数日收益率及基金的日收益率;
(2)以28个一级行业指数日收益率作为自变量、基金的日收益率作为因变量建立回归方程;
(3)基于lasso回归模型,通过坐标下降法,最小化回归损失函数解出回归系数;
(4)根据基金的历史实际仓位,进行模型修匀。
2.根据权利要求1所述的一种基于行业指数回归的基金仓位估算算法,其特征在于,以28个一级行业指数日收益率作为自变量、基金的日收益率作为因变量建立回归方程:
,
其中,为截距项,𝛽𝑖为待拟合的回归系数,则回归系数的和是基金持有的股票资产占基金资产的比例,即基金仓位,这时只要求出回归系数,就能获得相应的基金仓位。
3.根据权利要求1所述的一种基于行业指数回归的基金仓位估算算法,其特征在于,考虑到28个自变量间的共线性问题,对模型加罚项,采用lasso回归,通过构造一个惩罚函数得到一个较为精炼的模型,使得它压缩一些系数,同时设定一些系数为零;lasso回归的损失函数为:
,
其中为超参数,是惩罚项;使用坐标下降法,每次求解其中一个维度使得损失函数最小,固定其他维度,通过不断迭代得到最优回归系数,求得的某个维度的偏导数为:
,
这样保留了子集收缩的优点,是一种处理具有复共线性数据的有偏估计。
4.根据权利要求1所述的一种基于行业指数回归的基金仓位估算算法,其特征在于,根据基金的历史实际仓位,进行模型修匀;用每季度的公布的实际仓位和预测仓位比较,计算其除去最大、最小误差后的平均误差,对于第n天的预测仓位,选取第n天的前K个季度平均误差做预测修匀,修匀后的预测仓位为:
中是修匀后的预测仓位,是第n天的预测仓位,是前K个季度平均误差。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910031177.0A CN109658253A (zh) | 2019-01-14 | 2019-01-14 | 一种基于行业指数回归的基金仓位估算算法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910031177.0A CN109658253A (zh) | 2019-01-14 | 2019-01-14 | 一种基于行业指数回归的基金仓位估算算法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109658253A true CN109658253A (zh) | 2019-04-19 |
Family
ID=66119463
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910031177.0A Pending CN109658253A (zh) | 2019-01-14 | 2019-01-14 | 一种基于行业指数回归的基金仓位估算算法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109658253A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112541829A (zh) * | 2020-12-18 | 2021-03-23 | 未鲲(上海)科技服务有限公司 | 数据处理方法、装置、设备及可读存储介质 |
CN114092241A (zh) * | 2021-10-29 | 2022-02-25 | 杭州衡泰技术股份有限公司 | 一种资产组合实时波动率绘制方法、装置及存储介质 |
-
2019
- 2019-01-14 CN CN201910031177.0A patent/CN109658253A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112541829A (zh) * | 2020-12-18 | 2021-03-23 | 未鲲(上海)科技服务有限公司 | 数据处理方法、装置、设备及可读存储介质 |
CN114092241A (zh) * | 2021-10-29 | 2022-02-25 | 杭州衡泰技术股份有限公司 | 一种资产组合实时波动率绘制方法、装置及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Chen et al. | A hybrid approach for portfolio selection with higher-order moments: Empirical evidence from Shanghai Stock Exchange | |
Nguyen et al. | Stock investment of agriculture companies in the Vietnam stock exchange market: An AHP integrated with GRA-TOPSIS-MOORA approaches | |
Zhao | Futures price prediction of agricultural products based on machine learning | |
US7734526B2 (en) | Investment classification and tracking system | |
Nikolic et al. | The application of brute force logistic regression to corporate credit scoring models: Evidence from Serbian financial statements | |
Maher et al. | Predicting bond ratings using neural networks: a comparison with logistic regression | |
US20130024395A1 (en) | System and method for constructing outperforming portfolios relative to target benchmarks | |
US20090198633A1 (en) | Investment classification and tracking system using diamond ratings | |
Jiang et al. | Influencing factors for predicting financial performance based on genetic algorithms | |
Boguslauskas et al. | The selection of financial ratios as independent variables for credit risk assessment | |
Raffinot et al. | Investing through economic cycles with ensemble machine learning algorithms | |
CN109658253A (zh) | 一种基于行业指数回归的基金仓位估算算法 | |
KR101004375B1 (ko) | Psr 분석을 이용한 펀드 관리 방법 및 시스템 | |
Maknickienė et al. | Comparison of forex market forecasting tools based on Evolino ensemble and technical analysis indicators | |
Hargreaves et al. | Stock portfolio selection using data mining approach | |
Zhang et al. | Predicting the returns of the US real estate investment trust market: evidence from the group method of data handling neural network | |
Nunes et al. | Artificial neural networks in fixed income markets for yield curve forecasting | |
AlـGounmeein et al. | Modelling and forecasting monthly Brent crude oil prices: a long memory and volatility approach | |
Kochliaridis et al. | UNSURE-A machine learning approach to cryptocurrency trading | |
CN106485363A (zh) | 一种股票日内价格趋势的量化及预测方法 | |
Lin et al. | Soft computing algorithms in price of Taiwan real estates | |
Pandey et al. | Fuzzy based investment portfolio management | |
Pai et al. | Neural Network Model for Efficient portfolio Management and Time Series Forecasting | |
Hargreaves | An automated stock investment system using machine learning techniques: an application in Australia | |
Mahdi et al. | BANKRUPTCY PREDICTION BY USING SUPPORT VECTOR MACHINES AND GENETIC ALGORITHMS. |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20190419 |