CN109119166A

CN109119166A - 一种基于矩阵传递熵的时间序列因果性分析方法及其计算机装置

Info

Publication number: CN109119166A
Application number: CN201810608100.0A
Authority: CN
Inventors: 黄缨婷; 赵功博; 陈霸东; 马荣金; 肖建锋; 秦伟
Original assignee: Shaanxi Zhi Lian Brain Control Technology Co Ltd
Current assignee: Shaanxi Zhi Lian Brain Control Technology Co Ltd
Priority date: 2018-06-13
Filing date: 2018-06-13
Publication date: 2019-01-01

Abstract

本发明公开了一种基于矩阵传递熵的时间序列因果性分析方法及其计算机装置和应用，通过Parzen窗变量的概率密度估计方法直接计算二阶Renyi熵，并将其推广到变量X的α阶Renyi熵，结合Gram矩阵定义矩阵传递熵，然后在传统的基于传递熵的因果性分析方法的基础上，通过矩阵传递熵计算因果性分析指标，最后按照因果性判断标准分析两个时间序列的因果性。与格兰杰因果性分析方法相比，该方法克服了“回归模型”的缺陷，能够用于具有非线性因果关系的时间序列中，与传统的基于传递熵的因果性分析方法相比，该方法鲁棒性好，易于计算而且计算复杂度低，适用于计算复杂度低的场合；将该分析方法应用于临床应用中用于探索患有呼吸暂停综合症病人的呼吸和心跳之间的因果性，具有良好的应用效果。

Description

一种基于矩阵传递熵的时间序列因果性分析方法及其计算机装置

技术领域

本发明属于时间序列分析领域；涉及一种基于矩阵传递熵的时间序列因果性分析方法；本发明还涉及能够实施上述分析方法的计算机装置。

背景技术

相关性分析描述两个变量之间的相互影响程度。而因果性分析揭示一个变量是如何对另一个变量进行作用的，即阐述变量之间的信息传递，具有方向性，在探索变量之间的关系、机器学习的特征提取和大脑效应网络的构建等领域中具有重要的应用价值。

目前，研究者们常采用格兰杰因果性分析方法探索变量之间的因果性。格兰杰因果性分析方法为2003年诺贝尔经济学奖得主Clive W.J.Granger所开创，用于分析经济变量之间的格兰杰因果关系。该方法基于线性回归模型，使用过去一些时刻点上所有信息的最佳最小二乘预测的方差来分析变量之间的因果性，易于理解并且计算复杂度低，能准确地分析具有线性因果关系且夹杂高斯噪声的时间序列之间的因果性。然而在实际应用中采集到的信号往往混有大量的非高斯噪声，而且变量之间的影响往往是非线性的，例如功能性核磁共振信号(fMRI)、脑电(EMG)和肌电(EEG)等信号。这使得格兰杰因果性分析方法的性能急剧下降。

2000年，Thomas Schreiber基于信息论中香农熵提出了新方法——传递熵用于分析两个时间序列之间的因果性，并应用于临床应用中探索患有呼吸暂停综合症病人的呼吸和心跳之间的因果性。变量Y到X的传递熵反映了Y的信息的加入对X的不确定性大小的改变，即Y传递给X信息量的大小，因此传递熵可以作为衡量因果性的指标。传递熵易于理解，仅考虑变量间的信息量传递，而不需要假定变量间具有特定形式的关系，并对非高斯噪声不敏感，因此具有比格兰杰因果性更好的适用性，尤其是对于夹杂非高斯噪声的非线性变量。然而在计算熵时，需要通过有限的数据估计变量的概率密度函数。通常变量的概率密度函数的估计是近似的，尤其是变量的联合概率密度函数和条件概率密度函数；同时概率密度函数的估计也存在计算复杂度高的问题。

发明内容

本发明提供了一种基于矩阵传递熵的时间序列因果性分析方法及其计算机装置；与格兰杰因果性分析方法相比，该方法克服了“回归模型”的缺陷，能够用于具有非线性因果关系的时间序列中，与传统的基于传递熵的因果性分析方法相比，该方法鲁棒性好，易于计算而且计算复杂度低，适用于计算复杂度低的场合。

本发明的技术方案是：一种基于矩阵传递熵的时间序列因果性分析方法，包括步骤S1，确定两个时间序列X和Y，并且生成关于X的向量自回归模型，并且采用贝叶斯信息准则确定X的嵌入维度；步骤S2，结合步骤S1中X的嵌入维度基于Silverman准则确定高斯核宽度；步骤S3，基于矩阵传递熵计算因果性分析指标，计算Y到X的因果性；其具体过程是：基于Parzen窗变量的概率密度估计方法计算变量X的二阶Renyi熵，并将其推广到变量X的α阶Renyi熵，结合Gram矩阵定义X的矩阵传递熵，得到Y到X的矩阵传递熵为：其中k为嵌入维度；计算时取α＝2；步骤S4，重复步骤S1-S3，计算得到X到Y的矩阵传递熵MTE_X→Y；步骤S5，按照因果性判断标准分析并得到两个时间序列的因果性。

更进一步的，本发明的特点还在于：

其中步骤S3中X的二阶Renyi熵为：其中N为时间序列长度，G_σ(·)为高斯核函数，σ为高斯核宽度。

其中步骤S3中X的矩阵熵为S_α(X)＝-log[tr(A^α)]，其中A为变量X的Gram矩阵；X和Y的联合矩阵熵为其中B为Y的Gram矩阵，且变量X和Y的条件矩阵熵为S_α(X|Y)＝S_α(X，Y)-S_α(Y)；计算时取α＝2。

其中步骤S1中贝叶斯信息准则为：其中r为自回归模型误差向量，N为时间序列长度；所述嵌入维度k通过贝叶斯信息准则确定，其中P为预设的最大的嵌入维度。

其中步骤S2中的Silverman准则为：其中d为时间序列的个数，s₁ ²为第一个时间序列的方差，s₂ ²为第二个时间序列的方差。

其中步骤S5中因果性判断标准为：若MTE_Y→X＞＞0且MTE_Y→X/MTE_X→Y＞1，则Y是X的因；若MTE_X→Y＞＞0且MTE_Y→X/MTE_X→Y＜1，则X是Y的因；若MTE_Y→X＞＞0，MTE_X→Y＞＞0且MTE_Y→X/MTE_X→Y≈1，则认为X和Y互为因果。

本发明还提供了一种计算机装置，该计算机装置能够实施上述的基于矩阵传递熵的时间序列因果性分析方法。

与现有技术相比，本发明的有益效果是：由于格兰杰因果性分析方法不能有效地分析夹杂着非高斯噪声且具有非线性关系的两个时间序列之间的因果性，而传递熵方法的计算复杂度高。本发明提出了基于矩阵传递熵的因果性分析方法，该方法具有良好的普适性，适合应用于非高斯噪声系统的因果性分析场合，能解决格兰杰因果性分析方法对叠加非高斯噪声且具有非线性因果关系的两个时间序列分析不准确和传递熵的计算复杂度高的问题，具有重要的研究意义和广泛的应用价值。

更进一步的，该方法通过Parzen窗变量的概率密度估计方法直接计算二阶Renyi熵，并将其推广到变量X的α阶Renyi熵，结合Gram矩阵定义矩阵传递熵，然后在传统的基于传递熵的因果性分析方法的基础上，通过矩阵传递熵计算因果性分析指标，最后按照因果性判断标准分析两个时间序列的因果性。与格兰杰因果性分析方法相比，该方法克服了“回归模型”的缺陷，可用于具有非线性因果关系的时间序列中；与传统的基于传递熵的因果性分析方法相比，该方法鲁棒性好，易于计算而且计算复杂度低，适用于要求方法的计算复杂度低的场合

附图说明

图1为本发明的流程示意图；

图2为本发明矩阵传递熵和现有传递熵的计算复杂度对比图；

图3为采用本发明矩阵传递熵在不同高斯核宽度下计算具有因果关系的时间序列的因果性分析指标图；

图4为采用现有传递熵在不同高斯核宽度下计算具有因果关系的时间序列的因果性分析指标图；

图5为采用本发明矩阵传递熵在不同高斯核宽度下计算具有非线性因果关系的时间序列的因果性分析指标图；

图6为采用现有递熵在不同高斯核宽度下计算具有非线性因果关系的时间序列的因果性分析指标图。

具体实施方式

下面结合附图和具体实施例对本发明的技术方案进一步说明。

本发明提供了一种基于矩阵传递熵的时间序列因果性分析方法，通过Parzen窗变量的概率密度估计方法直接计算二阶Renyi熵，并将其推广到变量X的α阶Renyi熵，结合Gram矩阵定义矩阵传递熵，然后在传统的基于传递熵的因果性分析方法的基础上，通过矩阵传递熵计算因果性分析指标，最后按照因果性判断标准分析两个时间序列的因果性。

如图1所示，该分析方法的具体过程包括以下步骤：

步骤S1，确定两个时间序列X和Y，并且生成关于X的向量自回归模型，同时采用贝叶斯信息准则确定X的嵌入维度；其中贝叶斯信息准则公式为：其中r为自回归模型误差向量；X的嵌入维度表示为：其中P为预设的最大的嵌入维度。

步骤S2，结合步骤S1中X的嵌入维度k，并且基于Silverman准则确定X的高斯核宽度；具体的，Silverman准则公式为：其中d为时间序列的个数，s₁ ²为第一个时间序列的方差，s₂ ²为第二个时间序列的方差，σ为核宽度。

步骤S3，基于矩阵传递熵计算因果性分析指标，计算Y到X的因果性；具体过程是，首先采用二阶Renyi熵计算变量X的熵，得到其中α＞0，α≠1，一般取α＝2；其中p(x)为概率密度函数；同时，Parzen窗变量的概率密度估计方法为其中G_σ(·)为高斯函数，σ为核宽度，N为样本量；从而得到基于Parzen窗变量的概率密度估计方法和二阶Renyi熵的X熵的计算公式为其中N为时间序列的长度。

然后结合Gram矩阵定义X的矩阵传递熵，设定Gram矩阵为A，其中从而得到X的二阶矩阵熵S₂(X)＝-log[tr(A²)]，其中tr(·)为矩阵的迹函数；一般地，X的矩阵熵S_α(X)＝-log[tr(A^α)]；同理得到X和Y的联合矩阵熵为得到X和Y的条件矩阵熵为S_α(X|Y)＝S_α(X，Y)-S_α(Y)，其中B为变量Y的Gram矩阵。

基于传递熵的计算方法，得到Y到X的矩阵传递熵为计算时取α＝2。

步骤S4，重复上述步骤S1-S3，计算得到X到Y的矩阵传递熵MTE_X→Y。

步骤S5，按照因果性判断标准分析并得到两个时间序列的因果性；具体的因果性判断标准为：若MTE_Y→X＞＞0且MTE_Y→X/MTE_X→Y＞1，则Y是X的因；若MTE_X→Y＞＞0且MTE_Y→X/MTE_X→Y＜1，则X是Y的因；若MTE_Y→X＞＞0，MTE_X→Y＞＞0且MTE_Y→X/MTE_X→Y≈1，则认为X和Y互为因果。

如图2所示，在仿真实验下矩阵传递熵和传递熵计算复杂度的对比，该仿真实验中采用线性因果模型：其中N₁服从均值为0方差为1的高斯分布，N₂服从参数为[1.6，0，0.001，0]的Levy alpha-stable分布；从图2中可以看出矩阵传递熵的计算复杂度远远低于传递熵，因此将本发明的方法将矩阵传递熵引入到因果性分析领域。

考虑具有因果关系的两个时间序列和X是Y的因，其由上述线性因果模型生成，分别采用矩阵传递熵和传递熵计算时间序列的因果性分析指标分别如图3和图4所示，为在不同高斯核宽度下计算具有因果关系的时间序列的因果性分析指标图，其中图3和图4中的竖线是基于Silverman准则确定的高斯和宽度。从图3和图4中能够看出，基于矩阵传递熵和传递熵均能分析出时间序列的因果性，X是因，Y是果。但是矩阵传递熵的计算结果更平滑，传递熵存在抖动，说明传递熵相对于矩阵传递熵的不稳定性。

考虑具有非线性因果关系的两个时间序列和X是Y的因，其由模型生成，其中服从均值为0方差为1的高斯分布，服从参数为[1.6，0，0.001，0]的Levy alpha-stable分布，N＝1000为时间序列的长度，分别采用矩阵传递熵和传递熵计算时间序列的因果性分析指标，分别得到如图5和图6所示。

图5和图6分别采用矩阵传递熵和传递熵在不同高斯核宽度下计算具有非线性因果关系的时间序列的因果性分析指标图，竖线是基于Silverman准则确定的高斯核宽度。从图5和图6中能够看出，基于矩阵传递熵和传递熵均能分析出具有非线性因果关系的时间序列的因果性，X是因，Y是果。同样的，矩阵传递熵的计算结果更平滑，而传递熵存在抖动，说明了传递熵的不稳定性。

然而使用格兰杰因果性分析方法不能检测出具有非线性因果关系的时间序列。因此本发明基于矩阵传递熵的因果性分析方法的计算复杂度低且鲁棒性高，可用于具有非线性因果关系的时间序列分析中，具有极高的应用价值。

Claims

1.一种基于矩阵传递熵的时间序列因果性分析方法，其特征在于，包括以下步骤：

步骤S1，确定两个时间序列X和Y，并且生成关于X的向量自回归模型，并且采用贝叶斯信息准则确定X的嵌入维度；

步骤S2，结合步骤S1中X的嵌入维度基于Silverman准则确定高斯核宽度；

步骤S3，基于矩阵传递熵计算因果性分析指标，计算Y到X的因果性；其具体过程是：基于Parzen窗变量的概率密度估计方法计算变量X的二阶Renyi熵，并将其推广到变量X的α阶Renyi熵，结合Gram矩阵定义X的矩阵传递熵，得到Y到X的矩阵传递熵为：

其中k为嵌入维度；计算时取α＝2；

步骤S4，重复步骤S1-S3，计算得到X到Y的矩阵传递熵MTE_X→Y；

步骤S5，按照因果性判断标准分析并得到两个时间序列的因果性。

2.根据权利要求1所述的基于矩阵传递熵的时间序列因果性分析方法，其特征在于，所述步骤S3中X的二阶Renyi熵为：其中N为时间序列长度，G_σ(·)为高斯核函数，σ为高斯核宽度。

3.根据权利要求1和2任意一项所述的基于矩阵传递熵的时间序列因果性分析方法，其特征在于，所述步骤S3中X的矩阵熵为S_α(X)＝-log[tr(A^α)]，其中A为变量X的Gram矩阵；X和Y的联合矩阵熵为其中B为Y的Gram矩阵，且变量X和Y的条件矩阵熵为S_α(X|Y)＝S_α(X,Y)-S_α(Y)；计算时取α＝2。

4.根据权利要求2所述的基于矩阵传递熵的时间序列因果性分析方法，其特征在于，所述步骤S1中贝叶斯信息准则为：其中r为自回归模型误差向量，N为时间序列长度；所述嵌入维度k通过贝叶斯信息准则确定，其中P为预设的最大的嵌入维度。

5.根据权利要求2所述的基于矩阵传递熵的时间序列因果性分析方法，其特征在于，所述步骤S2中的Silverman准则为：其中d为时间序列的个数，s₁ ²为第一个时间序列的方差，s₂ ²为第二个时间序列的方差。

6.根据权利要求1所述的基于矩阵传递熵的时间序列因果性分析方法，其特征在于，所述步骤S5中因果性判断标准为：若MTE_Y→X＞＞0且MTE_Y→X/MTE_X→Y＞1，则Y是X的因；若MTE_X→Y＞＞0且MTE_Y→X/MTE_X→Y＜1，则X是Y的因；若MTE_Y→X＞＞0，MTE_X→Y＞＞0且MTE_Y→X/MTE_X→Y≈1，则认为X和Y互为因果。

7.一种计算机装置，其特征在于，该计算机装置能够实施权利要求1所述的基于矩阵传递熵的时间序列因果性分析方法。