CN109034542A - 投资组合生成方法、装置及计算机可读存储介质 - Google Patents
投资组合生成方法、装置及计算机可读存储介质 Download PDFInfo
- Publication number
- CN109034542A CN109034542A CN201810697668.4A CN201810697668A CN109034542A CN 109034542 A CN109034542 A CN 109034542A CN 201810697668 A CN201810697668 A CN 201810697668A CN 109034542 A CN109034542 A CN 109034542A
- Authority
- CN
- China
- Prior art keywords
- characteristic value
- matrix
- sample
- sample covariance
- covariance matrix
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 38
- 239000011159 matrix material Substances 0.000 claims abstract description 299
- 230000001174 ascending effect Effects 0.000 claims description 8
- 238000010586 diagram Methods 0.000 description 5
- 230000009286 beneficial effect Effects 0.000 description 4
- 230000008859 change Effects 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 239000004615 ingredient Substances 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 2
- 239000002131 composite material Substances 0.000 description 2
- 238000000354 decomposition reaction Methods 0.000 description 2
- 239000003337 fertilizer Substances 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 238000011946 reduction process Methods 0.000 description 2
- 230000010365 information processing Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0635—Risk analysis of enterprise or organisation activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/16—Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/04—Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Human Resources & Organizations (AREA)
- Theoretical Computer Science (AREA)
- Mathematical Physics (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Computational Mathematics (AREA)
- Marketing (AREA)
- Development Economics (AREA)
- Finance (AREA)
- Data Mining & Analysis (AREA)
- Entrepreneurship & Innovation (AREA)
- Pure & Applied Mathematics (AREA)
- Accounting & Taxation (AREA)
- Mathematical Optimization (AREA)
- Mathematical Analysis (AREA)
- Technology Law (AREA)
- Computing Systems (AREA)
- Tourism & Hospitality (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- Game Theory and Decision Science (AREA)
- Algebra (AREA)
- Educational Administration (AREA)
- Databases & Information Systems (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Abstract
本发明公开了一种投资组合生成方法,该方法包括:根据目标市场指数的成分股在连续多个历史交易日中的交易数据生成样本矩阵;根据样本矩阵计算第一样本协方差矩阵;计算第一样本协方差矩阵的特征值和与特征值对应的特征向量;基于M‑P定律计算第一样本协方差矩阵的理论最大特征值,根据理论最大特征值对第一样本协方差矩阵的特征值对角阵进行去噪处理;根据去噪后的特征值对角阵和由特征向量构成的矩阵计算第二样本协方差矩阵;根据第二样本协方差矩阵计算各成分股的投资比例,生成投资组合。本发明还提出一种投资组合生成装置以及一种计算机可读存储介质。本发明实现了对样本协方差矩阵进行去噪处理,降低了投资组合的风险。
Description
技术领域
本发明涉及信息处理技术领域,尤其涉及一种投资组合生成方法、装置及计算机可读存储介质。
背景技术
马科维茨的投资组合边界理论开创了现代数理金融学的领域,第一次把数学工具引入到金融分析中,使得投资理论有了比较可靠的数学分析基础。在实务中,投资者对资产间的相关性的描述,使用的是经验协方差矩阵代替理论上的协方差矩阵,也就是使用历史数据计算资产间的协方差,用样本协方差代替总体协方差。但是由于中国股市的弱有效性,导致获取到的收益数据中存在大量的白噪音数据,白噪音的存在使得样本协方差矩阵是理论协方差矩阵的有偏估计,而股票之间的样本协方差矩阵是资产配置最优组合的计算中的一个重要参数,高维数据的白噪音会严重的扭曲样本协方差矩阵,使得最优投资组合的计算失真,进而导致创建的资产组合的投资风险较高。
发明内容
本发明提供一种投资组合生成方法、装置及计算机可读存储介质,其主要目的在于实现对样本协方差矩阵进行去噪处理,降低投资组合的风险。
为实现上述目的,本发明还提供一种投资组合生成方法,该方法包括:
确定目标市场指数,并根据所述目标市场指数的成分股在连续多个历史交易日中的交易数据生成样本矩阵;
根据所述样本矩阵计算所述目标市场指数的成分股的第一样本协方差矩阵;
计算所述第一样本协方差矩阵的特征值和与特征值对应的特征向量;
基于M-P定律计算所述第一样本协方差矩阵的理论最大特征值,根据所述理论最大特征值对所述第一样本协方差矩阵的特征值对角阵进行去噪处理;
根据去噪处理后的特征值对角阵和由所述特征向量构成的矩阵,计算第二样本协方差矩阵;
根据所述第二样本协方差矩阵和马科维茨均值方差模型中计算各成分股的投资比例,并根据所述投资比例生成投资组合。
可选地,所述基于M-P定律计算所述第一样本协方差矩阵的理论最大特征值,根据所述理论最大特征值对所述第一样本协方差矩阵的特征值对角阵进行去噪处理的步骤包括:
基于M-P定律计算所述第一样本协方差矩阵的理论最大特征值;
将所述特征值按照由小到大的顺序排列,生成特征值对角阵;
从所述特征值中查找到大于所述理论最大特征值、且其前一个特征值小于所述理论最大特征值的特征值,作为截点特征值;
删除所述特征值对角阵中小于所述截点特征值的特征值,以对所述特征值对角阵进行去噪处理。
可选地,所述根据去噪处理后的特征值对角阵和由所述特征向量构成的矩阵,计算第二样本协方差矩阵的步骤包括:
根据如下公式计算第二样本协方差矩阵∑filtered:
∑filtered=UΛfilteredU-1
其中,U为由所述特征向量构成的矩阵,U-1为由所述特征向量构成的矩阵的逆矩阵,Λfiltered为经过去噪处理后的特征值对角阵。
可选地,所述确定目标市场指数,并根据所述目标市场指数的成分股在连续多个历史交易日中的交易数据生成样本矩阵的步骤包括:
确定目标市场指数,获取所述目标市场指数的成分股在连续多个历史交易日内的交易数据;
对获取的交易数据进行标准化处理;
根据标准化处理后的交易数据构建所述样本矩阵。
可选地,所述交易数据为收盘价数据,在所述对获取的交易数据进行标准化处理的步骤之前,该方法还包括步骤:
将所述收盘价数据转换为对数收益率数据;
所述根据标准化处理后的交易数据构建所述样本矩阵的步骤包括:
根据标准化处理后的对数收益率数据构建所述样本矩阵。
此外,为实现上述目的,本发明还提供一种投资组合生成装置,该装置包括存储器和处理器,所述存储器中存储有可在所述处理器上运行的投资组合生成程序,所述投资组合生成程序被所述处理器执行时实现如下步骤:
确定目标市场指数,并根据所述目标市场指数的成分股在连续多个历史交易日中的交易数据生成样本矩阵;
根据所述样本矩阵计算所述目标市场指数的成分股的第一样本协方差矩阵;
计算所述第一样本协方差矩阵的特征值和与特征值对应的特征向量;
基于M-P定律计算所述第一样本协方差矩阵的理论最大特征值,根据所述理论最大特征值对所述第一样本协方差矩阵的特征值对角阵进行去噪处理;
根据去噪处理后的特征值对角阵和由所述特征向量构成的矩阵,计算第二样本协方差矩阵;
根据所述第二样本协方差矩阵和马科维茨均值方差模型中计算各成分股的投资比例,并根据所述投资比例生成投资组合。
可选地,所述基于M-P定律计算所述第一样本协方差矩阵的理论最大特征值,根据所述理论最大特征值对所述第一样本协方差矩阵的特征值对角阵进行去噪处理的步骤包括:
基于M-P定律计算所述第一样本协方差矩阵的理论最大特征值;
将所述特征值按照由小到大的顺序排列,生成特征值对角阵;
从所述特征值中查找到大于所述理论最大特征值、且其前一个特征值小于所述理论最大特征值的特征值,作为截点特征值;
删除所述特征值对角阵中小于所述截点特征值的特征值,以对所述特征值对角阵进行去噪处理。
可选地,所述根据去噪处理后的特征值对角阵和由所述特征向量构成的矩阵,计算第二样本协方差矩阵的步骤包括:
根据如下公式计算第二样本协方差矩阵∑filtered:
∑filtered=UΛfilteredU-1
其中,U为由所述特征向量构成的矩阵,U-1为由所述特征向量构成的矩阵的逆矩阵,Λfiltered为经过去噪处理后的特征值对角阵。
可选地,所述确定目标市场指数,并根据所述目标市场指数的成分股在连续多个历史交易日中的交易数据生成样本矩阵的步骤包括:
确定目标市场指数,获取所述目标市场指数的成分股在连续多个历史交易日内的交易数据;
对获取的交易数据进行标准化处理;
根据标准化处理后的交易数据构建所述样本矩阵。
此外,为实现上述目的,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有投资组合生成程序,所述投资组合生成程序可被一个或者多个处理器执行,以实现如上所述的投资组合生成方法的步骤。
本发明提出的投资组合生成方法、装置及计算机可读存储介质,确定目标市场指数,并根据目标市场指数的成分股在连续多个历史交易日中的交易数据生成样本矩阵;根据样本矩阵计算目标市场指数的成分股的第一样本协方差矩阵;计算第一样本协方差矩阵的特征值和与特征值对应的特征向量;基于M-P定律计算第一样本协方差矩阵的理论最大特征值,根据特征值和理论最大特征值对第一样本协方差矩阵的特征值对角阵进行去噪处理;根据去噪处理后的特征值对角阵和由特征向量构成的矩阵,计算第二样本协方差矩阵;根据第二样本协方差矩阵和马科维茨均值方差模型中计算各成分股的投资比例,并根据投资比例生成投资组合。该方案基于M-P定律对市场指数的样本协方差矩阵进行去噪处理,过滤掉其中的随机性数据,使得重新计算得到的第二样本协方差矩阵中的数据是比较可靠的相关系数,进而使得投资组合得到优化,降低投资风险。
附图说明
图1为本发明一实施例提供的投资组合生成方法的流程示意图;
图2为本发明一实施例提供的投资组合生成装置的内部结构示意图;
图3为本发明一实施例提供的投资组合生成装置中投资组合生成程序的模块示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明提供一种投资组合生成方法。参照图1所示,为本发明一实施例提供的投资组合生成方法的流程示意图。该方法可以由一个装置执行,该装置可以由软件和/或硬件实现。
在本实施例中,投资组合生成方法包括:
步骤S10,确定目标市场指数,并根据所述目标市场指数的成分股在连续多个历史交易日中的交易数据生成样本矩阵。
步骤S20,根据所述样本矩阵计算所述目标市场指数的成分股的第一样本协方差矩阵。
本发明中的目标市场指数可以是上证综指、沪深300等市场指数,以下实施例中,以沪深300为例对本发明方法进行说明。从数据库中获取沪深300 中的300只成分股在过去十年内每一个交易日的收盘价数据。其中,步骤S10 具体地包括如下细化步骤:
确定目标市场指数,获取所述目标市场指数的成分股在连续多个历史交易日内的交易数据;对获取的交易数据进行标准化处理;根据标准化处理后的交易数据构建所述样本矩阵。
此外,由于收盘价数据作为金融时序数据,具备尖峰肥尾的特征,为了消除这种特征,先对股票收盘价数据进行对数化处理:
其中,是股票i在第t期末的对数收益率,是股票i在第t期末的收盘价。假设过去十年内共有T个交易日的收盘价数据,则第t期末的对数收益率为连续T个交易日中的第t个交易日的收盘价数据。
此外,为了消除量纲的影响,对对数收益率进行标准化处理,对成分股i 来说,其标准化处理方式如下:
其中,T为交易日的总数量,δi为股票i的对数收益率的标准差。
目标市场指数中成分券的数量为N,对于沪深300来说,N=300,交易日的数量为T,则经过标准化处理后的全部对数收益率数据构成一个N×T的矩阵,每一个成分股的对数收益率可以视为一个随机变量,T个交易日的全部成分股的对数收益率构成一个样本对数收益率矩阵。所有成分股经过标准化处理后的对数收益率序列矩阵如下所示:
根据如下公式,得到第一样本协方差矩阵:由于计算的是随机变量之间的协方差,因此得到的第一样本协方差矩阵为N×N的矩阵。
步骤S30,计算所述第一样本协方差矩阵的特征值和与特征值对应的特征向量。
步骤S40,基于M-P定律计算所述第一样本协方差矩阵的理论最大特征值,根据所述理论最大特征值对所述第一样本协方差矩阵的特征值对角阵进行去噪处理。
步骤S50,根据去噪处理后的特征值对角阵和由所述特征向量构成的矩阵,计算第二样本协方差矩阵。
步骤S60,根据所述第二样本协方差矩阵和马科维茨均值方差模型中计算各成分股的投资比例,并根据所述投资比例生成投资组合。
步骤S40可以包括如下细化步骤:基于M-P定律计算所述第一样本协方差矩阵的理论最大特征值;将所述特征值按照由小到大的顺序排列,生成特征值对角阵;从第一样本协方差矩阵的特征值中查找到大于所述理论最大特征值、且其前一个特征值小于所述理论最大特征值的特征值,作为截点特征值;删除所述特征值对角阵中小于所述截点特征值的特征值,以对所述特征值对角阵进行去噪处理。
具体地,求解第一样本协方差矩阵的特征值λ(i),并按照特征值从小到大的顺序对特征值排序λ(1)<λ(2)<…λ(N),这些特征值形成特征值对角阵Λ:
计算特征值对应的特征向量。
u(i)为λ(i)对应的特征向量,特征向量为列向量,全部的特征向量构成矩阵U=(u(1),u(2),…,u(N))。
记则根据M-P定律(Marchenko-Pastur LAW,马尔琴科-帕斯图尔定律,简称M-P定律),如果矩阵中的元素是独立同分布的,则该矩阵的理论最大特征值可以根据Q计算得到,具体计算公式如下:
根据M-P定律计算出第一样本协方差矩阵的理论最大特征值后,找到截点特征值,具体地,从按照从小到大的顺序排列的特征值λ(1)、λ(2)、...λ(N)中,查找到排序为第k大的特征值λ(k),使其满足如下条件:
λ(k)>λmax≥λ(k-1)
λ(k-1)为排在λ(k)的前面一个的特征值。将λ(k)作为截点特征值,将特征值对角阵中特征值小于该截点特征值的特征值均替换为0。
由于M-P定律的前提假设是矩阵中的元素是独立同分布的,即假设第一样本协方差矩阵中的元素是独立同分布的情况下,其理论最大特征值符合若根据实际数据计算得到特征值大于上述理论最大特征值,则说明矩阵中的一些元素并非是独立同分布的,而是具有一定的相关性。删除掉那些符合M-P定律的特征值,根据新的特征值对角阵重新计算得到的第二协方差矩阵排除掉了随机性数据,剩下的的数据就是比较可靠的相关数据。
此处需要说明的是,根据M-P定律也能够计算出第一样本协方差矩阵的理论最小特征值,而对于小于理论特征最小值的特征值来说,其绝对值一般接近于0,可以忽略不计,并且特征值越小,说明其重要程度越低,可以忽略不计,因此,本实施例的方案中将小于理论最大特征值的特征值从特征值对角阵中全部删除掉,被删除的特征值中也包含了那些不符合M-P定律的、小于理论最小特征值的特征值。
或者,在其他实施例中,步骤S40可以包括如下细化步骤:基于M-P定律计算所述第一样本协方差矩阵的理论最大特征值;将所述特征值按照由小到大的顺序排列,生成特征值对角阵;删除所述特征值对角阵中小于所述理论最大特征值的特征值,以对所述特征值对角阵进行去噪处理。
经过去噪处理后的特征值对角阵如下:
根据经过降噪处理后的特征值对角阵Λfiltered,按照特征值分解公式重新计算协方差矩阵,得到第二样本协方差矩阵,该协方差矩阵已经消除了白噪音数据的影响:
∑filtered=UΛfilteredU-1
其中,U为由所述特征向量构成的矩阵,U-1为由所述特征向量构成的矩阵的逆矩阵,Λfiltered为经过去噪处理后的特征值对角阵。
将去噪后的样本协方差矩阵代入到马科维茨均值方差模型中,求解各个成分股的投资比例,根据计算得到的投资比例组合所述成分股,生成投资组合。使用经过去噪处理后的样本协方差矩阵代入到马科维茨均值方差模型中计算,使得计算得到的投资组合得到优化,降低投资组合的风险。
本实施例提出的投资组合生成方法,确定目标市场指数,并根据目标市场指数的成分股在连续多个历史交易日中的交易数据生成样本矩阵;根据样本矩阵计算目标市场指数的成分股的第一样本协方差矩阵;计算第一样本协方差矩阵的特征值和与特征值对应的特征向量;基于M-P定律计算第一样本协方差矩阵的理论最大特征值,根据特征值和理论最大特征值对第一样本协方差矩阵的特征值对角阵进行去噪处理;根据去噪处理后的特征值对角阵和由特征向量构成的矩阵,计算第二样本协方差矩阵;根据第二样本协方差矩阵和马科维茨均值方差模型中计算各成分股的投资比例,并根据投资比例生成投资组合。该方案基于M-P定律对市场指数的样本协方差矩阵进行去噪处理,过滤掉其中的随机性数据,使得重新计算得到的第二样本协方差矩阵中的数据是比较可靠的相关系数,进而使得投资组合得到优化,降低投资风险。
本发明还提供一种投资组合生成装置。参照图2所示,为本发明一实施例提供的投资组合生成装置的内部结构示意图。
在本实施例中,投资组合生成装置1可以是PC(Personal Computer,个人电脑),也可以是智能手机、平板电脑、便携计算机等终端设备。该投资组合生成装置1至少包括存储器11、处理器12,网络接口13以及通信总线。
其中,存储器11至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、磁性存储器、磁盘、光盘等。存储器11在一些实施例中可以是投资组合生成装置1的内部存储单元,例如该投资组合生成装置1的硬盘。存储器11在另一些实施例中也可以是投资组合生成装置1的外部存储设备,例如投资组合生成装置1上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,存储器 11还可以既包括投资组合生成装置1的内部存储单元也包括外部存储设备。存储器11不仅可以用于存储安装于投资组合生成装置1的应用软件及各类数据,例如投资组合生成程序01的代码等,还可以用于暂时地存储已经输出或者将要输出的数据。
处理器12在一些实施例中可以是一中央处理器(Central Processing Unit,CPU)、控制器、微控制器、微处理器或其他数据处理芯片,用于运行存储器 11中存储的程序代码或处理数据,例如执行投资组合生成程序01等。
网络接口13可选的可以包括标准的有线接口、无线接口(如WI-FI接口),通常用于在该装置1与其他电子设备之间建立通信连接。
通信总线用于实现这些组件之间的连接通信。
可选地,该装置1还可以包括用户接口,用户接口可以包括显示器 (Display)、输入单元比如键盘(Keyboard),可选的用户接口还可以包括标准的有线接口、无线接口。可选地,在一些实施例中,显示器可以是LED显示器、液晶显示器、触控式液晶显示器以及OLED(Organic Light-Emitting Diode,有机发光二极管)触摸器等。其中,显示器也可以适当的称为显示屏或显示单元,用于显示在投资组合生成装置1中处理的信息以及用于显示可视化的用户界面。
图2仅示出了具有组件11-13以及投资组合生成程序01的投资组合生成装置1,本领域技术人员可以理解的是,图1示出的结构并不构成对投资组合生成装置1的限定,可以包括比图示更少或者更多的部件,或者组合某些部件,或者不同的部件布置。
在图2所示的装置1实施例中,存储器11中存储有投资组合生成程序01;处理器12执行存储器11中存储的投资组合生成程序01时实现如下步骤:
确定目标市场指数,并根据所述目标市场指数的成分股在连续多个历史交易日中的交易数据生成样本矩阵。
根据所述样本矩阵计算所述目标市场指数的成分股的第一样本协方差矩阵。
计算所述第一样本协方差矩阵的特征值和与特征值对应的特征向量。
基于M-P定律计算所述第一样本协方差矩阵的理论最大特征值,根据所述理论最大特征值对所述第一样本协方差矩阵的特征值对角阵进行去噪处理。
根据去噪处理后的特征值对角阵和由所述特征向量构成的矩阵,计算第二样本协方差矩阵。
根据所述第二样本协方差矩阵和马科维茨均值方差模型中计算各成分股的投资比例,并根据所述投资比例生成投资组合。
本发明中的目标市场指数可以是上证综指、沪深300等市场指数,以下实施例中,以沪深300为例对本发明方法进行说明。从数据库中获取沪深300 中的300只成分股在过去十年内每一个交易日的收盘价数据。其中,确定目标市场指数,并根据所述目标市场指数的成分股在连续多个历史交易日中的交易数据生成样本矩阵的步骤具体地包括如下细化步骤:确定目标市场指数,获取所述目标市场指数的成分股在连续多个历史交易日内的交易数据;对获取的交易数据进行标准化处理;根据标准化处理后的交易数据构建所述样本矩阵。
此外,由于收盘价数据作为金融时序数据,具备尖峰肥尾的特征,为了消除这种特征,先对股票收盘价数据进行对数化处理:
其中,是股票i在第t期末的对数收益率,是股票i在第t期末的收盘价。假设过去十年内共有T个交易日的收盘价数据,则第t期末的对数收益率为连续T个交易日中的第t个交易日的收盘价数据。
此外,为了消除量纲的影响,对对数收益率进行标准化处理,对成分股i 来说,其标准化处理方式如下:
其中,T为交易日的总数量,δi为股票i的对数收益率的标准差。
目标市场指数中成分券的数量为N,对于沪深300来说,N=300,交易日的数量为T,则经过标准化处理后的全部对数收益率数据构成一个N×T的矩阵,每一个成分股的对数收益率可以视为一个随机变量,T个交易日的全部成分股的对数收益率构成一个样本对数收益率矩阵。所有成分股经过标准化处理后的对数收益率序列矩阵如下所示:
根据如下公式,得到第一样本协方差矩阵:由于计算的是随机变量之间的协方差,因此得到的第一样本协方差矩阵为N×N的矩阵。
基于M-P定律计算所述第一样本协方差矩阵的理论最大特征值,根据所述理论最大特征值对所述第一样本协方差矩阵的特征值对角阵进行去噪处理的步骤可以包括如下细化步骤:基于M-P定律计算所述第一样本协方差矩阵的理论最大特征值;将所述特征值按照由小到大的顺序排列,生成特征值对角阵;从第一样本协方差矩阵的特征值中查找到大于所述理论最大特征值、且其前一个特征值小于所述理论最大特征值的特征值,作为截点特征值;删除所述特征值对角阵中小于所述截点特征值的特征值,以对所述特征值对角阵进行去噪处理。
具体地,求解第一样本协方差矩阵的特征值λ(i),并按照特征值从小到大的顺序对特征值排序λ(1)<λ(2)<…λ(N),这些特征值形成特征值对角阵Λ:
计算特征值对应的特征向量。
u(i)为λ(i)对应的特征向量,特征向量为列向量,全部的特征向量构成矩阵U=(u(1),u(2),…,u(N))。
记则根据M-P定律(Marchenko-Pastur,马尔琴科-帕斯图尔定律),如果矩阵中的元素是独立同分布的,则该矩阵的理论最大特征值可以根据Q 计算得到,具体计算公式如下:
根据M-P定律计算出第一样本协方差矩阵的理论最大特征值后,找到截点特征值,具体地,从按照从小到大的顺序排列的特征值λ(1)、λ(2)、...λ(N)中,查找到排序为第k大的特征值λ(k),使其满足如下条件:
λ(k)>λmax≥λ(k-1)
λ(k-1)为排在λ(k)的前面一个的特征值。将λ(k)作为截点特征值,将特征值对角阵中特征值小于该截点特征值的特征值均替换为0。
由于M-P定律的前提假设是矩阵中的元素是独立同分布的,即假设第一样本协方差矩阵中的元素是独立同分布的情况下,其理论最大特征值符合若根据实际数据计算得到特征值大于上述理论最大特征值,则说明矩阵中的一些元素并非是独立同分布的,而是具有一定的相关性。删除掉那些符合M-P定律的特征值,根据新的特征值对角阵重新计算得到的第二协方差矩阵排除掉了随机性数据,剩下的的数据就是比较可靠的相关数据。
此处需要说明的是,根据M-P定律也能够计算出第一样本协方差矩阵的理论最小特征值,而对于小于理论特征最小值的特征值来说,其绝对值一般接近于0,可以忽略不计,并且特征值越小,说明其重要程度越低,可以忽略不计,因此,本实施例的方案中将小于理论最大特征值的特征值从特征值对角阵中全部删除掉,被删除的特征值中也包含了那些不符合M-P定律的、小于理论最小特征值的特征值。
或者,在其他实施例中,基于M-P定律计算所述第一样本协方差矩阵的理论最大特征值,根据所述理论最大特征值对所述第一样本协方差矩阵的特征值对角阵进行去噪处理的步骤可以包括如下细化步骤:基于M-P定律计算所述第一样本协方差矩阵的理论最大特征值;将所述特征值按照由小到大的顺序排列,生成特征值对角阵;删除所述特征值对角阵中小于所述理论最大特征值的特征值,以对所述特征值对角阵进行去噪处理。
经过去噪处理后的特征值对角阵如下:
根据经过降噪处理后的特征值对角阵Λfiltered,按照特征值分解公式重新计算协方差矩阵,得到第二样本协方差矩阵,该协方差矩阵已经消除了白噪音数据的影响:
∑filtered=UΛfilteredU-1
其中,U为由所述特征向量构成的矩阵,U-1为由所述特征向量构成的矩阵的逆矩阵,Λfiltered为经过去噪处理后的特征值对角阵。
将去噪后的样本协方差矩阵代入到马科维茨均值方差模型中,求解各个成分股的投资比例,根据计算得到的投资比例组合所述成分股,生成投资组合。使用经过去噪处理后的样本协方差矩阵代入到马科维茨均值方差模型中计算,使得计算得到的投资组合得到优化,降低投资组合的风险。
本实施例提出的投资组合生成装置,确定目标市场指数,并根据目标市场指数的成分股在连续多个历史交易日中的交易数据生成样本矩阵;根据样本矩阵计算目标市场指数的成分股的第一样本协方差矩阵;计算第一样本协方差矩阵的特征值和与特征值对应的特征向量;基于M-P定律计算第一样本协方差矩阵的理论最大特征值,根据特征值和理论最大特征值对第一样本协方差矩阵的特征值对角阵进行去噪处理;根据去噪处理后的特征值对角阵和由特征向量构成的矩阵,计算第二样本协方差矩阵;根据第二样本协方差矩阵和马科维茨均值方差模型中计算各成分股的投资比例,并根据投资比例生成投资组合。该方案基于M-P定律对市场指数的样本协方差矩阵进行去噪处理,过滤掉其中的随机性数据,使得重新计算得到的第二样本协方差矩阵中的数据是比较可靠的相关系数,进而使得投资组合得到优化,降低投资风险。
可选地,在其他的实施例中,投资组合生成程序还可以被分割为一个或者多个模块,一个或者多个模块被存储于存储器11中,并由一个或多个处理器(本实施例为处理器12)所执行以完成本发明,本发明所称的模块是指能够完成特定功能的一系列计算机程序指令段,用于描述投资组合生成程序在投资组合生成装置中的执行过程。
例如,参照图3所示,为本发明投资组合生成装置一实施例中的投资组合生成程序的程序模块示意图,该实施例中,投资组合生成程序可以被分割为样本生成模块10、协方差计算模块20、特征计算模块30、矩阵去噪模块 40和组合生成模块50,示例性地:
样本生成模块10用于:确定目标市场指数,并根据所述目标市场指数的成分股在连续多个历史交易日中的交易数据生成样本矩阵;
协方差计算模块20用于:根据所述样本矩阵计算所述目标市场指数的成分股的第一样本协方差矩阵;
特征计算模块30用于:计算所述第一样本协方差矩阵的特征值和与特征值对应的特征向量;
矩阵去噪模块40用于:基于M-P定律计算所述第一样本协方差矩阵的理论最大特征值,根据所述理论最大特征值对所述第一样本协方差矩阵的特征值对角阵进行去噪处理;
协方差计算模块20还用于:根据去噪处理后的特征值对角阵和由所述特征向量构成的矩阵,计算第二样本协方差矩阵;
组合生成模块50用于:根据所述第二样本协方差矩阵和马科维茨均值方差模型中计算各成分股的投资比例,并根据所述投资比例生成投资组合。
上述样本生成模块10、协方差计算模块20、特征计算模块30、矩阵去噪模块40和组合生成模块50等程序模块被执行时所实现的功能或操作步骤与上述实施例大体相同,在此不再赘述。
此外,本发明实施例还提出一种计算机可读存储介质,所述计算机可读存储介质上存储有投资组合生成程序,所述投资组合生成程序可被一个或多个处理器执行,以实现如下操作:
确定目标市场指数,并根据所述目标市场指数的成分股在连续多个历史交易日中的交易数据生成样本矩阵;
根据所述样本矩阵计算所述目标市场指数的成分股的第一样本协方差矩阵;
计算所述第一样本协方差矩阵的特征值和与特征值对应的特征向量;
基于M-P定律计算所述第一样本协方差矩阵的理论最大特征值,根据所述理论最大特征值对所述第一样本协方差矩阵的特征值对角阵进行去噪处理;
根据去噪处理后的特征值对角阵和由所述特征向量构成的矩阵,计算第二样本协方差矩阵;
根据所述第二样本协方差矩阵和马科维茨均值方差模型中计算各成分股的投资比例,并根据所述投资比例生成投资组合。本发明计算机可读存储介质具体实施方式与上述投资组合生成装置和方法各实施例基本相同,在此不作累述。
需要说明的是,上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。并且本文中的术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (10)
1.一种投资组合生成方法,其特征在于,所述方法包括:
确定目标市场指数,并根据所述目标市场指数的成分股在连续多个历史交易日中的交易数据生成样本矩阵;
根据所述样本矩阵计算所述目标市场指数的成分股的第一样本协方差矩阵;
计算所述第一样本协方差矩阵的特征值和与特征值对应的特征向量;
基于M-P定律计算所述第一样本协方差矩阵的理论最大特征值,根据所述理论最大特征值对所述第一样本协方差矩阵的特征值对角阵进行去噪处理;
根据去噪处理后的特征值对角阵和由所述特征向量构成的矩阵,计算第二样本协方差矩阵;
根据所述第二样本协方差矩阵和马科维茨均值方差模型中计算各成分股的投资比例,并根据所述投资比例生成投资组合。
2.如权利要求1所述的投资组合生成方法,其特征在于,所述基于M-P定律计算所述第一样本协方差矩阵的理论最大特征值,根据所述理论最大特征值对所述第一样本协方差矩阵的特征值对角阵进行去噪处理的步骤包括:
基于M-P定律计算所述第一样本协方差矩阵的理论最大特征值;
将所述特征值按照由小到大的顺序排列,生成特征值对角阵;
从所述特征值中查找到大于所述理论最大特征值、且其前一个特征值小于所述理论最大特征值的特征值,作为截点特征值;
删除所述特征值对角阵中小于所述截点特征值的特征值,以对所述特征值对角阵进行去噪处理。
3.如权利要求1所述的投资组合生成方法,其特征在于,所述根据去噪处理后的特征值对角阵和由所述特征向量构成的矩阵,计算第二样本协方差矩阵的步骤包括:
根据如下公式计算第二样本协方差矩阵Σfiltered:
Σfiltered=UΛfilteredU-1
其中,U为由所述特征向量构成的矩阵,U-1为由所述特征向量构成的矩阵的逆矩阵,Λfiltered为经过去噪处理后的特征值对角阵。
4.如权利要求1至3中任一项所述的投资组合生成方法,其特征在于,所述确定目标市场指数,并根据所述目标市场指数的成分股在连续多个历史交易日中的交易数据生成样本矩阵的步骤包括:
确定目标市场指数,获取所述目标市场指数的成分股在连续多个历史交易日内的交易数据;
对获取的交易数据进行标准化处理;
根据标准化处理后的交易数据构建所述样本矩阵。
5.如权利要求4所述的投资组合生成方法,其特征在于,所述交易数据为收盘价数据,在所述对获取的交易数据进行标准化处理的步骤之前,该方法还包括步骤:
将所述收盘价数据转换为对数收益率数据;
所述根据标准化处理后的交易数据构建所述样本矩阵的步骤包括:
根据标准化处理后的对数收益率数据构建所述样本矩阵。
6.一种投资组合生成装置,其特征在于,所述装置包括存储器和处理器,所述存储器上存储有可在所述处理器上运行的投资组合生成程序,所述投资组合生成程序被所述处理器执行时实现如下步骤:
确定目标市场指数,并根据所述目标市场指数的成分股在连续多个历史交易日中的交易数据生成样本矩阵;
根据所述样本矩阵计算所述目标市场指数的成分股的第一样本协方差矩阵;
计算所述第一样本协方差矩阵的特征值和与特征值对应的特征向量;
基于M-P定律计算所述第一样本协方差矩阵的理论最大特征值,根据所述理论最大特征值对所述第一样本协方差矩阵的特征值对角阵进行去噪处理;
根据去噪处理后的特征值对角阵和由所述特征向量构成的矩阵,计算第二样本协方差矩阵;
根据所述第二样本协方差矩阵和马科维茨均值方差模型中计算各成分股的投资比例,并根据所述投资比例生成投资组合。
7.如权利要求6所述的投资组合生成装置,其特征在于,所述基于M-P定律计算所述第一样本协方差矩阵的理论最大特征值,根据所述理论最大特征值对所述第一样本协方差矩阵的特征值对角阵进行去噪处理的步骤包括:
基于M-P定律计算所述第一样本协方差矩阵的理论最大特征值;
将所述特征值按照由小到大的顺序排列,生成特征值对角阵;
从所述特征值中查找到大于所述理论最大特征值、且其前一个特征值小于所述理论最大特征值的特征值,作为截点特征值;
删除所述特征值对角阵中小于所述截点特征值的特征值,以对所述特征值对角阵进行去噪处理。
8.如权利要求6所述的投资组合生成装置,其特征在于,所述根据去噪处理后的特征值对角阵和由所述特征向量构成的矩阵,计算第二样本协方差矩阵的步骤包括:
根据如下公式计算第二样本协方差矩阵Σfiltered:
Σfiltered=UΛfilteredU-1
其中,U为由所述特征向量构成的矩阵,U-1为由所述特征向量构成的矩阵的逆矩阵,Λfiltered为经过去噪处理后的特征值对角阵。
9.如权利要求6至8中任一项所述的投资组合生成装置,其特征在于,所述确定目标市场指数,并根据所述目标市场指数的成分股在连续多个历史交易日中的交易数据生成样本矩阵的步骤包括:
确定目标市场指数,获取所述目标市场指数的成分股在连续多个历史交易日内的交易数据;
对获取的交易数据进行标准化处理;
根据标准化处理后的交易数据构建所述样本矩阵。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有投资组合生成程序,所述投资组合生成程序可被一个或者多个处理器执行,以实现如权利要求1至5中任一项所述的投资组合生成方法的步骤。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810697668.4A CN109034542A (zh) | 2018-06-29 | 2018-06-29 | 投资组合生成方法、装置及计算机可读存储介质 |
PCT/CN2018/107502 WO2020000718A1 (zh) | 2018-06-29 | 2018-09-26 | 投资组合生成方法、装置及计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810697668.4A CN109034542A (zh) | 2018-06-29 | 2018-06-29 | 投资组合生成方法、装置及计算机可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109034542A true CN109034542A (zh) | 2018-12-18 |
Family
ID=65521864
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810697668.4A Pending CN109034542A (zh) | 2018-06-29 | 2018-06-29 | 投资组合生成方法、装置及计算机可读存储介质 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN109034542A (zh) |
WO (1) | WO2020000718A1 (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111861711A (zh) * | 2020-07-22 | 2020-10-30 | 未鲲(上海)科技服务有限公司 | 资源分配方法及相关产品 |
CN111898970A (zh) * | 2020-06-30 | 2020-11-06 | 深圳前海微众银行股份有限公司 | 一种产品申请资格的认证方法及装置 |
CN111861711B (zh) * | 2020-07-22 | 2024-06-07 | 重庆百盐投资(集团)有限公司 | 资源分配方法及相关产品 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103455943B (zh) * | 2013-09-02 | 2017-02-01 | 深圳国泰安教育技术股份有限公司 | 一种股票或股票投资组合波动率的预测方法、装置 |
CN105321113A (zh) * | 2014-08-04 | 2016-02-10 | 同济大学 | 一种基于宏观因子的压力测试客户端 |
US20170316507A1 (en) * | 2016-04-27 | 2017-11-02 | Anish R. Shah | Uncertain utility to improve portfolio selection |
CN108090837A (zh) * | 2018-02-08 | 2018-05-29 | 上海译会信息科技有限公司 | 一种多种金融产品组合投资策略风险评估方法 |
-
2018
- 2018-06-29 CN CN201810697668.4A patent/CN109034542A/zh active Pending
- 2018-09-26 WO PCT/CN2018/107502 patent/WO2020000718A1/zh active Application Filing
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111898970A (zh) * | 2020-06-30 | 2020-11-06 | 深圳前海微众银行股份有限公司 | 一种产品申请资格的认证方法及装置 |
CN111861711A (zh) * | 2020-07-22 | 2020-10-30 | 未鲲(上海)科技服务有限公司 | 资源分配方法及相关产品 |
CN111861711B (zh) * | 2020-07-22 | 2024-06-07 | 重庆百盐投资(集团)有限公司 | 资源分配方法及相关产品 |
Also Published As
Publication number | Publication date |
---|---|
WO2020000718A1 (zh) | 2020-01-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108763277B (zh) | 一种数据分析方法、计算机可读存储介质及终端设备 | |
CN110163476A (zh) | 项目智能推荐方法、电子装置及存储介质 | |
CN107679995B (zh) | 电子装置、保险案件理赔审核方法及计算机可读存储介质 | |
CN112148987B (zh) | 基于目标对象活跃度的消息推送方法及相关设备 | |
CN109285082A (zh) | 保险产品推荐方法、装置及计算机可读存储介质 | |
CN107818491A (zh) | 电子装置、基于用户上网数据的产品推荐方法及存储介质 | |
CN109903152A (zh) | 违约损失分析方法、装置及计算机可读存储介质 | |
CN110458644A (zh) | 一种信息处理方法及相关设备 | |
CN109255715A (zh) | 电子装置、产品推荐方法和计算机可读存储介质 | |
WO2019192132A1 (zh) | 股票走势预测装置、方法及可读存储介质 | |
CN113129150A (zh) | 交易数据的处理方法、装置、终端设备及可读存储介质 | |
Gong et al. | Risk-aversion and the short-run supply of timber | |
CN110232150A (zh) | 一种用户数据分析方法、装置、可读存储介质及终端设备 | |
Deng et al. | Sequential importance sampling and resampling for dynamic portfolio credit risk | |
CN109034542A (zh) | 投资组合生成方法、装置及计算机可读存储介质 | |
CN108846687A (zh) | 客户分类方法、装置及存储介质 | |
CN112184305A (zh) | 一种企业估值方法、装置、电子设备及可读存储介质 | |
CN111985578A (zh) | 多源数据融合方法、装置、计算机设备及存储介质 | |
Valdez et al. | Optimal portfolio in a regime-switching model | |
CN116860805A (zh) | 数据处理方法、装置、计算机设备及存储介质 | |
CN109544348B (zh) | 资产证券筛选方法、设备及计算机可读存储介质 | |
WO2019242143A1 (zh) | 股票卖出预警方法、装置及计算机可读存储介质 | |
CN110009397A (zh) | 一种精准营销的方法及装置 | |
CN107798249B (zh) | 行为模式数据的发布方法及终端设备 | |
CN108428174A (zh) | 交易资金预警方法、服务器及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20181218 |
|
RJ01 | Rejection of invention patent application after publication |