CN115269679A

CN115269679A - 一种多维时间序列整体复杂度评估方法

Info

Publication number: CN115269679A
Application number: CN202210824702.6A
Authority: CN
Inventors: 崔兴然; 高之琳; 孙慧敏; 顾忠泽
Original assignee: Southeast University
Current assignee: Southeast University
Priority date: 2022-07-14
Filing date: 2022-07-14
Publication date: 2022-11-01

Abstract

本发明公开了一种多维时间序列整体复杂度评估方法，首先，粗粒化处理多维原始时间序列；其次，采用序列法和符号法状态化压缩粗粒化多维时间序列以获取一维全局状态化序列；然后，采用维数复杂度、熵复杂度和符号复杂度计算一维全局状态化序列的多变量复杂度；最后，计算所有时间尺度的多变量复杂度以获取多变量多尺度复杂度。本发明可在任意变量数的多维序列上运行；不受多维序列顺序的影响，仅测量多维时间序列自身所具备的复杂度；计算量小，更适用于多变量数、高采样率的多维时间序列。

Description

一种多维时间序列整体复杂度评估方法

技术领域

本发明涉及多尺度分析方法、系统整体复杂度评估、多维数据处理技术领域，具体涉及一种多维时间序列整体复杂度评估方法。

背景技术

大多数情况下，人们仅能通过测量到的系统宏观输出的时间序列信号来认识了解系统内部运行机制。现实中大多数复杂系统及其输出的时间序列信号均表现出非线性、非平稳、复杂混沌且高度随机的特征。常规线性分析方法往往会忽略上述时间序列自身所具备的非线性相关特征。而非线性动力学分析方法可有效提取出时间序列中有价值的信息，并且为帮助人类理解复杂系统及其输出信号提供新的技术手段。复杂度是广泛用于表征时间序列复杂程度的非线性参数，系统输出时间序列的复杂度指标往往可以反映系统内部运行机制。目前常用复杂度分析算法通常从维数复杂度、不规则性和不可预测性等角度进行复杂度的测量。

复杂系统在不同尺度上都具有复杂结构，即分形特性，可通过小尺度结构的研究，测量复杂系统结构的自相似性。非线性时间序列在不同时间尺度上具有不同的不规则性，传统复杂度分析所获得的复杂度指标，仅代表某一时间尺度上时间序列的无序性，而无序性的测量结果与复杂度理论假设相矛盾。因此，传统基于单一尺度分析的复杂度分析方法往往会忽略系统所具备的多尺度复杂度特性，无法准确描述复杂系统的真实复杂度。对于系统复杂度的评估表征需要多尺度的综合分析方法，以量化时间序列在不同时间尺度上的复杂度，更直观详细地描述系统的动态变化。

随着传感器技术的不断发展，复杂系统的多变量监测是必然趋势。基于一维时间序列的复杂度评估方法，仅测量系统局部复杂度，无法评估系统的整体复杂度。目前，大多基于多维时间序列的复杂度评估方法，通常基于多元嵌入理论进行空间重构，准确的空间重构高度依赖多变量时间序列的空间位置信息，计算复杂，不适用于维数较高的多变量时间序列。因此，需要一种可综合评估同一系统所输出的多变量时间序列的时间及空间动态复杂度的多变量多尺度复杂度算法，此外，要求该算法可面向不同类别的复杂系统，例如模拟、生理、气象以及地质系统等，并且适用于多通道数与高采样率的多维时间序列。其中，生理系统是一种受到广泛关注的复杂系统，其可以同时输出多维时间序列。传统多尺度熵及其改进算法往往无法全面评估上述多维时间序列的整体复杂度，所得结果往往会因为引入人为干扰而与真实结果存在一定差异。忽略多变量的顺序影响，充分利用生理系统输出的多维时间序列的结构性信息已成为多维信号处理分析领域一个重要的关注点。

综上，研究一种多维时间序列整体复杂度评估方法具有十分重要的现实价值。

发明内容

发明目的：针对上述现有多尺度复杂度分析算法的不足，本发明提供一种多维时间序列整体复杂度评估方法，克服了目前多元多尺度复杂度分析算法无法综合评估时间及空间动态复杂度的缺点，实现面向多类别复杂系统所输出的多维时间序列的整体复杂度评估。

技术方案：本发明提供一种多维时间序列整体复杂度评估方法，具体包括以下步骤：

(1)粗粒化处理多维原始时间序列；

(2)采用序列法和符号法状态化压缩粗粒化多维时间序列以获取一维全局状态化序列，包括全局状态化时间序列

和全局状态化符号序列

(3)采用维数复杂度、熵复杂度和符号复杂度计算一维全局状态化序列的多变量复杂度；

(4)计算所有时间尺度的多变量复杂度以获取多变量多尺度复杂度。

进一步地，所述步骤(1)实现过程如下：

多维原始时间序列X表示为：

其中，M代表多维时间序列的变量数量，N代表多维时间序列的数据长度，x_k,u代表多维原始时间序列的第k维第u个数据点；

对每一维数据进行粗粒化处理，时间尺度s的多维粗粒化时间序列的第k维第v个数据点

由以下公式计算得到：

多维粗粒化时间序列Y^s表示为：

进一步地，所述步骤(2)实现过程如下：

去除各变量的数值偏移，得到第k维的一维去偏移时间序列

以及多维去偏移时间序列B^s：

其中，

为第k维粗粒化时间序列的均值,

为第k维粗粒化时间序列的标准差；

序列法的具体计算方法如下：

计算第j时刻下，系统内部所有变量两两之间的距离D^s,j，用于表示当前系统的混乱程度：

其中，

代表第j时刻下，k1与k2两个维度之间的距离；

将距离矩阵中两两变量的距离，划分为L个区间，第j时刻下第i个区间的概率为

第j时刻下的状态化程度

由以下公式得到：

计算所有时刻的状态化程度

得到全局状态化时间序列

符号法的具体计算方法如下：

每一个时刻的状态定义为该时刻的系统微状态；将所有时刻的系统拓扑结构提取，并且输入到无监督聚类算法中，并且设定目标类别个数，然后通过聚类算法，将其降至目标类个数T；获得任意第j个时刻下的系统类别

此时全局状态化符号序列

为T进制符号化序列。

进一步地，步骤(3)所述维数复杂度的具体计算方法如下：

基于步骤(2)获取的全局状态化时间序列

延迟重构新矩阵

其中，t代表分形尺度；

计算

的曲线长度L_w(t)：

计算不同t值的总曲线长度L(t)，并对L(t)取对数，得到多变量维数复杂度

其中，β代表幂律指数，C代表常数。

进一步地，步骤(3)所述熵复杂度的具体计算方法包括近似熵、样本熵和模糊熵；

所述近似熵复杂度的具体计算方法如下：

基于全局状态化时间序列

区间长度为m，得到重构后的序列

计算第b个子区间

和所有子区间

之间的距离

统计距离小于等于阈值r的数量，根据以下公式得到相似序列比例

对整个全局状态化序列

所有子区间统计相似序列比例后，得到平均相似率

改变区间长度为m+1，得到

多变量熵复杂度

为：

所述样本熵复杂度的具体计算方法如下：

基于全局状态化时间序列

区间长度为m，得到重构后的序列

计算第b个子区间

和其他子区间

之间的距离

对整个全局状态化序列

所有子区间统计相似序列比例后，得到平均相似率

改变区间长度为m+1，得到

多变量熵复杂度

为：

所述模糊熵复杂度的具体计算方法如下：

基于全局状态化时间序列

区间长度为m，得到重构后的序列

其中，

为

的均值；

计算第b个子区间

和其他子区间

之间的距离

通过模糊函数

定义两子区间的相似度

其中n为模糊幂；对整个状态化序列

所有子区间统计概率

改变区间长度为m+1，得到

多变量熵复杂度

为：

进一步地，步骤(3)所述符号复杂度包括置换熵复杂度和符号熵复杂度；

所述置换熵复杂度的具体计算方法如下：

基于全局状态化符号序列

区间长度为m，得到重构后的序列

对每一个子区间

内的数进行递增排序，得到排列模式序列

共有E种不同的排列模式，第e种排列模式的概率为P_e，多变量符号复杂度

为：

所述符号熵复杂度的具体计算方法如下：

基于全局状态化符号序列

区间长度为m，得到重构后的序列

这个m元序列共有K种可能；

统计重构序列

中第f种m元序列的概率P_f，多变量符号复杂度

为：

有益效果：与现有技术相比，本发明的有益效果为：1、本发明克服多元多尺度复杂度分析算法无法综合评估时间及空间动态复杂度的缺点，实现针对复杂系统所输出的多维时间序列的整体复杂度评估；2、本发明不受多维时间序列顺序影响，有效衡量多维时间序列自身所具备的复杂度，适用于任意变量数的多变量时间序列；3、本发明可适用于多变量数及高采样率的多维时间序列，计算量小；4、本发明相较于传统多尺度复杂度分析算法可适用于较短时间序列；5、本发明具备较高的稳健性与鲁棒性，用于多变量输出时间序列分析时，所得结果个体差异性较小。

附图说明

图1为本发明的流程图；

图2为健康年轻人与健康老年人12导联心电的多变量多尺度复杂度分析结果图。

具体实施方式

下面结合附图对本发明作进一步详细描述：

本发明提出一种多维时间序列整体复杂度评估方法，如图1所示，具体包括以下步骤：

步骤1：粗粒化处理多维原始时间序列。

多维原始时间序列X表示为：

其中M代表多维时间序列的变量数量，N代表多维时间序列的数据长度，x_k,u代表多维原始时间序列的第k维第u个数据点。

由以下公式计算得到：

多维粗粒化时间序列Y^s表示为：

步骤2：采用序列法和符号法状态化压缩粗粒化多维时间序列以获取一维全局状态化序列GS^s，包括全局状态化时间序列

和全局状态化符号序列

去除各变量的数值偏移，得到第k维的一维去偏移时间序列

以及多维去偏移时间序列B^s：

其中，

为第k维粗粒化时间序列的均值,

为第k维粗粒化时间序列的标准差。

后续可分别通过序列法和符号法，将去除偏移后的多维粗粒化时间序列压缩为一维全局状态化时间序列和全局状态化符号序列。

(1)序列法：

其中，

代表第j时刻下，k1与k2两个维度之间的距离。

第j时刻下的状态化程度

由以下公式得到：

计算所有时刻的状态化程度

得到全局状态化时间序列

(2)符号法：

此时全局状态化符号序列

为T进制符号化序列。

步骤3：采用维数复杂度、熵复杂度和符号复杂度等多类计算方法计算一维全局状态化序列的多变量复杂度C^s。

(1)维数复杂度：

基于全局状态化时间序列

延迟重构新矩阵

其中，t代表分形尺度。

计算

的曲线长度L₁(t):

其中，β代表幂律指数，C代表常数。

(2)熵复杂度：

基于步骤2所述序列法提取的一维全局状态化时间序列，量化一维全局状态化序列的多变量复杂度步骤中所述熵复杂度的具体计算方法包括近似熵、样本熵和模糊熵等。

(a)近似熵复杂度：

基于全局状态化时间序列

区间长度为m，得到重构后的序列

计算第b个子区间

和所有子区间

之间的距离

对整个全局状态化序列

所有子区间统计相似序列比例后，得到平均相似率

改变区间长度为m+1，得到

多变量熵复杂度

为：

(b)样本熵复杂度：

基于全局状态化时间序列

区间长度为m，得到重构后的序列

计算第b个子区间

和其他子区间

之间的距离

对整个全局状态化序列

所有子区间统计相似序列比例后，得到平均相似率

改变区间长度为m+1，得到

多变量熵复杂度

为：

(c)模糊熵复杂度：

基于全局状态化时间序列

区间长度为m，得到重构后的序列

其中，

为

的均值；计算第b个子区间

和其他子区间

之间的距离

通过模糊函数

定义两子区间的相似度

其中，n为模糊幂；对整个状态化序列

所有子区间统计概率

改变区间长度为m+1，得到

多变量熵复杂度

为：

(3)符号复杂度：

基于步骤2提取的一维全局状态化符号序列，量化一维全局状态化符号序列的多变量复杂度步骤中所述符号复杂度的具体计算方法包括置换熵和符号熵复杂度等。

(a)置换熵复杂度：

基于全局状态化符号序列

区间长度为m，得到重构后的序列

对每一个子区间

内的数进行递增排序，得到排列模式序列

为：

(b)符号熵复杂度。

基于全局状态化符号序列

区间长度为m，得到重构后的序列

这个m元序列共有K种可能。

统计重构序列

中第f种m元序列的概率P_f，多变量符号复杂度

为：

步骤4：计算所有时间尺度的多变量复杂度以获取多变量多尺度复杂度，即修改粗粒化过程的时间尺度参数，重复上述步骤，获取对应于不同时间尺度的多变量复杂度，以得到多变量多尺度复杂度。

下面将结合健康年轻人与健康老年人12导联心电时间序列分析的具体实施方案，对本发明的技术方案做进一步说明。本发明实施例的具体内容如下：

本实施例所采用的多变量12导联心电时间序列的维度为12，即有12个变量，采样率为500Hz，每段心电时间序列长度约为15秒左右，即每段时间序列点数约为7500。首先，该实施例利用常规心电时间序列预处理方法对两组心电时间序列完成了预处理，包括剔除坏导，陷波去除工频干扰、带通滤波器去除基线漂移与高频噪声、剔除坏段以及剔除异常值等。后续，利用上述步骤一中的粗粒化处理多维原始时间序列的具体实施步骤获得粗粒化多维时间序列，利用上述步骤二中的序列法具体实施步骤状态化压缩粗粒化多维时间序列以获取一维全局状态化序列，利用上述步骤三中的样本熵具体计算方法计算一维全局状态化序列的多变量复杂度。最后，完成上述步骤四中计算所有时间尺度的多变量复杂度以获取多变量多尺度复杂度，即改变时间尺度因子重复上述过程。健康年轻人与健康老年人12导联心电的多变量多尺度复杂度分析结果如图2所示，该结果描述了衰老状态相对于正常状态下的心脏整体复杂度变化情况，在图中全部时间尺度上，健康年轻人组的复杂度均高于健康老年人的复杂度，这表明健康年轻人组的心脏相较于健康老年人的心脏具有更高的整体复杂度。并且，两组之间的复杂度差异随着时间尺度的增加而增加至趋于稳定，且两者在小时间尺度上差异性较小，这表明多尺度相关分析方法可从多尺度角度全面真实地表征不同生理状态下的复杂度差距。此外，上述多变量多尺度复杂度分析结果验证了衰老状态降低系统复杂度的结论，这表明该整体复杂度评估方法可综合考虑多变量信号所包含的信息，实现真实可靠的整体复杂度评估。

上述结果表明，多变量多尺度熵分析方法可真实可靠分析生理系统所输出的多维时间序列(大于3维)，实现其整体复杂度有效评估的目的。

以上所述仅展示了本发明算法的部分优选实施方案，应当指出，在不脱离本发明技术原理的前提下，还可以做出若干算法改进，这些算法改进也应视为本发明的保护范围。