CN115269679A - 一种多维时间序列整体复杂度评估方法 - Google Patents

一种多维时间序列整体复杂度评估方法 Download PDF

Info

Publication number
CN115269679A
CN115269679A CN202210824702.6A CN202210824702A CN115269679A CN 115269679 A CN115269679 A CN 115269679A CN 202210824702 A CN202210824702 A CN 202210824702A CN 115269679 A CN115269679 A CN 115269679A
Authority
CN
China
Prior art keywords
sequence
complexity
time series
dimensional
time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210824702.6A
Other languages
English (en)
Inventor
崔兴然
高之琳
孙慧敏
顾忠泽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Southeast University
Original Assignee
Southeast University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Southeast University filed Critical Southeast University
Priority to CN202210824702.6A priority Critical patent/CN115269679A/zh
Publication of CN115269679A publication Critical patent/CN115269679A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2474Sequence data queries, e.g. querying versioned data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/16Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Mathematical Optimization (AREA)
  • Computational Mathematics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Software Systems (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Probability & Statistics with Applications (AREA)
  • Algebra (AREA)
  • Computational Linguistics (AREA)
  • Computing Systems (AREA)
  • Fuzzy Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Operations Research (AREA)
  • Complex Calculations (AREA)

Abstract

本发明公开了一种多维时间序列整体复杂度评估方法,首先,粗粒化处理多维原始时间序列;其次,采用序列法和符号法状态化压缩粗粒化多维时间序列以获取一维全局状态化序列;然后,采用维数复杂度、熵复杂度和符号复杂度计算一维全局状态化序列的多变量复杂度;最后,计算所有时间尺度的多变量复杂度以获取多变量多尺度复杂度。本发明可在任意变量数的多维序列上运行;不受多维序列顺序的影响,仅测量多维时间序列自身所具备的复杂度;计算量小,更适用于多变量数、高采样率的多维时间序列。

Description

一种多维时间序列整体复杂度评估方法
技术领域
本发明涉及多尺度分析方法、系统整体复杂度评估、多维数据处理技术领域,具体涉及一种多维时间序列整体复杂度评估方法。
背景技术
大多数情况下,人们仅能通过测量到的系统宏观输出的时间序列信号来认识了解系统内部运行机制。现实中大多数复杂系统及其输出的时间序列信号均表现出非线性、非平稳、复杂混沌且高度随机的特征。常规线性分析方法往往会忽略上述时间序列自身所具备的非线性相关特征。而非线性动力学分析方法可有效提取出时间序列中有价值的信息,并且为帮助人类理解复杂系统及其输出信号提供新的技术手段。复杂度是广泛用于表征时间序列复杂程度的非线性参数,系统输出时间序列的复杂度指标往往可以反映系统内部运行机制。目前常用复杂度分析算法通常从维数复杂度、不规则性和不可预测性等角度进行复杂度的测量。
复杂系统在不同尺度上都具有复杂结构,即分形特性,可通过小尺度结构的研究,测量复杂系统结构的自相似性。非线性时间序列在不同时间尺度上具有不同的不规则性,传统复杂度分析所获得的复杂度指标,仅代表某一时间尺度上时间序列的无序性,而无序性的测量结果与复杂度理论假设相矛盾。因此,传统基于单一尺度分析的复杂度分析方法往往会忽略系统所具备的多尺度复杂度特性,无法准确描述复杂系统的真实复杂度。对于系统复杂度的评估表征需要多尺度的综合分析方法,以量化时间序列在不同时间尺度上的复杂度,更直观详细地描述系统的动态变化。
随着传感器技术的不断发展,复杂系统的多变量监测是必然趋势。基于一维时间序列的复杂度评估方法,仅测量系统局部复杂度,无法评估系统的整体复杂度。目前,大多基于多维时间序列的复杂度评估方法,通常基于多元嵌入理论进行空间重构,准确的空间重构高度依赖多变量时间序列的空间位置信息,计算复杂,不适用于维数较高的多变量时间序列。因此,需要一种可综合评估同一系统所输出的多变量时间序列的时间及空间动态复杂度的多变量多尺度复杂度算法,此外,要求该算法可面向不同类别的复杂系统,例如模拟、生理、气象以及地质系统等,并且适用于多通道数与高采样率的多维时间序列。其中,生理系统是一种受到广泛关注的复杂系统,其可以同时输出多维时间序列。传统多尺度熵及其改进算法往往无法全面评估上述多维时间序列的整体复杂度,所得结果往往会因为引入人为干扰而与真实结果存在一定差异。忽略多变量的顺序影响,充分利用生理系统输出的多维时间序列的结构性信息已成为多维信号处理分析领域一个重要的关注点。
综上,研究一种多维时间序列整体复杂度评估方法具有十分重要的现实价值。
发明内容
发明目的:针对上述现有多尺度复杂度分析算法的不足,本发明提供一种多维时间序列整体复杂度评估方法,克服了目前多元多尺度复杂度分析算法无法综合评估时间及空间动态复杂度的缺点,实现面向多类别复杂系统所输出的多维时间序列的整体复杂度评估。
技术方案:本发明提供一种多维时间序列整体复杂度评估方法,具体包括以下步骤:
(1)粗粒化处理多维原始时间序列;
(2)采用序列法和符号法状态化压缩粗粒化多维时间序列以获取一维全局状态化序列,包括全局状态化时间序列
Figure BDA0003745987980000021
和全局状态化符号序列
Figure BDA0003745987980000022
(3)采用维数复杂度、熵复杂度和符号复杂度计算一维全局状态化序列的多变量复杂度;
(4)计算所有时间尺度的多变量复杂度以获取多变量多尺度复杂度。
进一步地,所述步骤(1)实现过程如下:
多维原始时间序列X表示为:
Figure BDA0003745987980000023
其中,M代表多维时间序列的变量数量,N代表多维时间序列的数据长度,xk,u代表多维原始时间序列的第k维第u个数据点;
对每一维数据进行粗粒化处理,时间尺度s的多维粗粒化时间序列的第k维第v个数据点
Figure BDA0003745987980000024
由以下公式计算得到:
Figure BDA0003745987980000031
多维粗粒化时间序列Ys表示为:
Figure BDA0003745987980000032
进一步地,所述步骤(2)实现过程如下:
去除各变量的数值偏移,得到第k维的一维去偏移时间序列
Figure BDA0003745987980000033
以及多维去偏移时间序列Bs
Figure BDA0003745987980000034
其中,
Figure BDA0003745987980000035
为第k维粗粒化时间序列的均值,
Figure BDA0003745987980000036
为第k维粗粒化时间序列的标准差;
序列法的具体计算方法如下:
计算第j时刻下,系统内部所有变量两两之间的距离Ds,j,用于表示当前系统的混乱程度:
Figure BDA0003745987980000037
其中,
Figure BDA0003745987980000038
代表第j时刻下,k1与k2两个维度之间的距离;
将距离矩阵中两两变量的距离,划分为L个区间,第j时刻下第i个区间的概率为
Figure BDA0003745987980000039
第j时刻下的状态化程度
Figure BDA00037459879800000310
由以下公式得到:
Figure BDA00037459879800000311
计算所有时刻的状态化程度
Figure BDA00037459879800000312
得到全局状态化时间序列
Figure BDA00037459879800000313
Figure BDA0003745987980000041
符号法的具体计算方法如下:
每一个时刻的状态定义为该时刻的系统微状态;将所有时刻的系统拓扑结构提取,并且输入到无监督聚类算法中,并且设定目标类别个数,然后通过聚类算法,将其降至目标类个数T;获得任意第j个时刻下的系统类别
Figure BDA0003745987980000042
此时全局状态化符号序列
Figure BDA0003745987980000043
为T进制符号化序列。
进一步地,步骤(3)所述维数复杂度的具体计算方法如下:
基于步骤(2)获取的全局状态化时间序列
Figure BDA0003745987980000044
延迟重构新矩阵
Figure BDA0003745987980000045
Figure BDA0003745987980000046
其中,t代表分形尺度;
计算
Figure BDA0003745987980000047
的曲线长度Lw(t):
Figure BDA0003745987980000048
计算不同t值的总曲线长度L(t),并对L(t)取对数,得到多变量维数复杂度
Figure BDA0003745987980000049
Figure BDA00037459879800000410
其中,β代表幂律指数,C代表常数。
进一步地,步骤(3)所述熵复杂度的具体计算方法包括近似熵、样本熵和模糊熵;
所述近似熵复杂度的具体计算方法如下:
基于全局状态化时间序列
Figure BDA00037459879800000411
区间长度为m,得到重构后的序列
Figure BDA00037459879800000412
Figure BDA00037459879800000413
计算第b个子区间
Figure BDA00037459879800000414
和所有子区间
Figure BDA00037459879800000415
之间的距离
Figure BDA00037459879800000416
Figure BDA00037459879800000417
统计距离小于等于阈值r的数量,根据以下公式得到相似序列比例
Figure BDA00037459879800000418
Figure BDA0003745987980000051
对整个全局状态化序列
Figure BDA0003745987980000052
所有子区间统计相似序列比例后,得到平均相似率
Figure BDA0003745987980000053
Figure BDA0003745987980000054
改变区间长度为m+1,得到
Figure BDA0003745987980000055
多变量熵复杂度
Figure BDA0003745987980000056
为:
Figure BDA0003745987980000057
所述样本熵复杂度的具体计算方法如下:
基于全局状态化时间序列
Figure BDA0003745987980000058
区间长度为m,得到重构后的序列
Figure BDA0003745987980000059
计算第b个子区间
Figure BDA00037459879800000510
和其他子区间
Figure BDA00037459879800000511
之间的距离
Figure BDA00037459879800000512
统计距离小于等于阈值r的数量,根据以下公式得到相似序列比例
Figure BDA00037459879800000513
Figure BDA00037459879800000514
对整个全局状态化序列
Figure BDA00037459879800000515
所有子区间统计相似序列比例后,得到平均相似率
Figure BDA00037459879800000516
Figure BDA00037459879800000517
改变区间长度为m+1,得到
Figure BDA00037459879800000518
多变量熵复杂度
Figure BDA00037459879800000519
为:
Figure BDA00037459879800000520
所述模糊熵复杂度的具体计算方法如下:
基于全局状态化时间序列
Figure BDA00037459879800000521
区间长度为m,得到重构后的序列
Figure BDA00037459879800000522
Figure BDA00037459879800000523
其中,
Figure BDA00037459879800000524
Figure BDA00037459879800000525
的均值;
计算第b个子区间
Figure BDA00037459879800000526
和其他子区间
Figure BDA00037459879800000527
之间的距离
Figure BDA00037459879800000528
通过模糊函数
Figure BDA00037459879800000529
定义两子区间的相似度
Figure BDA00037459879800000530
Figure BDA00037459879800000531
其中n为模糊幂;对整个状态化序列
Figure BDA00037459879800000532
所有子区间统计概率
Figure BDA00037459879800000533
Figure BDA0003745987980000061
改变区间长度为m+1,得到
Figure BDA0003745987980000062
多变量熵复杂度
Figure BDA0003745987980000063
为:
Figure BDA0003745987980000064
进一步地,步骤(3)所述符号复杂度包括置换熵复杂度和符号熵复杂度;
所述置换熵复杂度的具体计算方法如下:
基于全局状态化符号序列
Figure BDA0003745987980000065
区间长度为m,得到重构后的序列
Figure BDA0003745987980000066
Figure BDA0003745987980000067
对每一个子区间
Figure BDA0003745987980000068
内的数进行递增排序,得到排列模式序列
Figure BDA0003745987980000069
共有E种不同的排列模式,第e种排列模式的概率为Pe,多变量符号复杂度
Figure BDA00037459879800000610
为:
Figure BDA00037459879800000611
所述符号熵复杂度的具体计算方法如下:
基于全局状态化符号序列
Figure BDA00037459879800000612
区间长度为m,得到重构后的序列
Figure BDA00037459879800000613
这个m元序列共有K种可能;
统计重构序列
Figure BDA00037459879800000614
中第f种m元序列的概率Pf,多变量符号复杂度
Figure BDA00037459879800000615
为:
Figure BDA00037459879800000616
有益效果:与现有技术相比,本发明的有益效果为:1、本发明克服多元多尺度复杂度分析算法无法综合评估时间及空间动态复杂度的缺点,实现针对复杂系统所输出的多维时间序列的整体复杂度评估;2、本发明不受多维时间序列顺序影响,有效衡量多维时间序列自身所具备的复杂度,适用于任意变量数的多变量时间序列;3、本发明可适用于多变量数及高采样率的多维时间序列,计算量小;4、本发明相较于传统多尺度复杂度分析算法可适用于较短时间序列;5、本发明具备较高的稳健性与鲁棒性,用于多变量输出时间序列分析时,所得结果个体差异性较小。
附图说明
图1为本发明的流程图;
图2为健康年轻人与健康老年人12导联心电的多变量多尺度复杂度分析结果图。
具体实施方式
下面结合附图对本发明作进一步详细描述:
本发明提出一种多维时间序列整体复杂度评估方法,如图1所示,具体包括以下步骤:
步骤1:粗粒化处理多维原始时间序列。
多维原始时间序列X表示为:
Figure BDA00037459879800000710
其中M代表多维时间序列的变量数量,N代表多维时间序列的数据长度,xk,u代表多维原始时间序列的第k维第u个数据点。
对每一维数据进行粗粒化处理,时间尺度s的多维粗粒化时间序列的第k维第v个数据点
Figure BDA0003745987980000071
由以下公式计算得到:
Figure BDA0003745987980000072
多维粗粒化时间序列Ys表示为:
Figure BDA0003745987980000073
步骤2:采用序列法和符号法状态化压缩粗粒化多维时间序列以获取一维全局状态化序列GSs,包括全局状态化时间序列
Figure BDA0003745987980000074
和全局状态化符号序列
Figure BDA0003745987980000075
去除各变量的数值偏移,得到第k维的一维去偏移时间序列
Figure BDA0003745987980000076
以及多维去偏移时间序列Bs
Figure BDA0003745987980000077
其中,
Figure BDA0003745987980000078
为第k维粗粒化时间序列的均值,
Figure BDA0003745987980000079
为第k维粗粒化时间序列的标准差。
后续可分别通过序列法和符号法,将去除偏移后的多维粗粒化时间序列压缩为一维全局状态化时间序列和全局状态化符号序列。
(1)序列法:
计算第j时刻下,系统内部所有变量两两之间的距离Ds,j,用于表示当前系统的混乱程度:
Figure BDA0003745987980000081
其中,
Figure BDA0003745987980000082
代表第j时刻下,k1与k2两个维度之间的距离。
将距离矩阵中两两变量的距离,划分为L个区间,第j时刻下第i个区间的概率为
Figure BDA0003745987980000083
第j时刻下的状态化程度
Figure BDA0003745987980000084
由以下公式得到:
Figure BDA0003745987980000085
计算所有时刻的状态化程度
Figure BDA0003745987980000086
得到全局状态化时间序列
Figure BDA0003745987980000087
Figure BDA0003745987980000088
(2)符号法:
每一个时刻的状态定义为该时刻的系统微状态;将所有时刻的系统拓扑结构提取,并且输入到无监督聚类算法中,并且设定目标类别个数,然后通过聚类算法,将其降至目标类个数T;获得任意第j个时刻下的系统类别
Figure BDA0003745987980000089
此时全局状态化符号序列
Figure BDA00037459879800000810
为T进制符号化序列。
步骤3:采用维数复杂度、熵复杂度和符号复杂度等多类计算方法计算一维全局状态化序列的多变量复杂度Cs
(1)维数复杂度:
基于全局状态化时间序列
Figure BDA00037459879800000811
延迟重构新矩阵
Figure BDA00037459879800000812
Figure BDA00037459879800000813
其中,t代表分形尺度。
计算
Figure BDA0003745987980000091
的曲线长度L1(t):
Figure BDA0003745987980000092
计算不同t值的总曲线长度L(t),并对L(t)取对数,得到多变量维数复杂度
Figure BDA0003745987980000093
Figure BDA0003745987980000094
其中,β代表幂律指数,C代表常数。
(2)熵复杂度:
基于步骤2所述序列法提取的一维全局状态化时间序列,量化一维全局状态化序列的多变量复杂度步骤中所述熵复杂度的具体计算方法包括近似熵、样本熵和模糊熵等。
(a)近似熵复杂度:
基于全局状态化时间序列
Figure BDA0003745987980000095
区间长度为m,得到重构后的序列
Figure BDA0003745987980000096
Figure BDA0003745987980000097
计算第b个子区间
Figure BDA0003745987980000098
和所有子区间
Figure BDA0003745987980000099
之间的距离
Figure BDA00037459879800000910
Figure BDA00037459879800000911
统计距离小于等于阈值r的数量,根据以下公式得到相似序列比例
Figure BDA00037459879800000912
Figure BDA00037459879800000913
对整个全局状态化序列
Figure BDA00037459879800000914
所有子区间统计相似序列比例后,得到平均相似率
Figure BDA00037459879800000915
Figure BDA00037459879800000916
改变区间长度为m+1,得到
Figure BDA00037459879800000917
多变量熵复杂度
Figure BDA00037459879800000918
为:
Figure BDA00037459879800000919
(b)样本熵复杂度:
基于全局状态化时间序列
Figure BDA00037459879800000920
区间长度为m,得到重构后的序列
Figure BDA00037459879800000921
计算第b个子区间
Figure BDA0003745987980000101
和其他子区间
Figure BDA0003745987980000102
之间的距离
Figure BDA0003745987980000103
统计距离小于等于阈值r的数量,根据以下公式得到相似序列比例
Figure BDA0003745987980000104
Figure BDA0003745987980000105
对整个全局状态化序列
Figure BDA0003745987980000106
所有子区间统计相似序列比例后,得到平均相似率
Figure BDA0003745987980000107
Figure BDA0003745987980000108
改变区间长度为m+1,得到
Figure BDA0003745987980000109
多变量熵复杂度
Figure BDA00037459879800001010
为:
Figure BDA00037459879800001011
(c)模糊熵复杂度:
基于全局状态化时间序列
Figure BDA00037459879800001012
区间长度为m,得到重构后的序列
Figure BDA00037459879800001013
Figure BDA00037459879800001014
其中,
Figure BDA00037459879800001015
Figure BDA00037459879800001016
的均值;计算第b个子区间
Figure BDA00037459879800001017
和其他子区间
Figure BDA00037459879800001018
之间的距离
Figure BDA00037459879800001019
通过模糊函数
Figure BDA00037459879800001020
定义两子区间的相似度
Figure BDA00037459879800001021
Figure BDA00037459879800001022
其中,n为模糊幂;对整个状态化序列
Figure BDA00037459879800001023
所有子区间统计概率
Figure BDA00037459879800001024
Figure BDA00037459879800001025
改变区间长度为m+1,得到
Figure BDA00037459879800001026
多变量熵复杂度
Figure BDA00037459879800001027
为:
Figure BDA00037459879800001028
(3)符号复杂度:
基于步骤2提取的一维全局状态化符号序列,量化一维全局状态化符号序列的多变量复杂度步骤中所述符号复杂度的具体计算方法包括置换熵和符号熵复杂度等。
(a)置换熵复杂度:
基于全局状态化符号序列
Figure BDA00037459879800001029
区间长度为m,得到重构后的序列
Figure BDA00037459879800001030
Figure BDA0003745987980000111
对每一个子区间
Figure BDA0003745987980000112
内的数进行递增排序,得到排列模式序列
Figure BDA0003745987980000113
共有E种不同的排列模式,第e种排列模式的概率为Pe,多变量符号复杂度
Figure BDA0003745987980000114
为:
Figure BDA0003745987980000115
(b)符号熵复杂度。
基于全局状态化符号序列
Figure BDA0003745987980000116
区间长度为m,得到重构后的序列
Figure BDA0003745987980000117
这个m元序列共有K种可能。
统计重构序列
Figure BDA0003745987980000118
中第f种m元序列的概率Pf,多变量符号复杂度
Figure BDA0003745987980000119
为:
Figure BDA00037459879800001110
步骤4:计算所有时间尺度的多变量复杂度以获取多变量多尺度复杂度,即修改粗粒化过程的时间尺度参数,重复上述步骤,获取对应于不同时间尺度的多变量复杂度,以得到多变量多尺度复杂度。
下面将结合健康年轻人与健康老年人12导联心电时间序列分析的具体实施方案,对本发明的技术方案做进一步说明。本发明实施例的具体内容如下:
本实施例所采用的多变量12导联心电时间序列的维度为12,即有12个变量,采样率为500Hz,每段心电时间序列长度约为15秒左右,即每段时间序列点数约为7500。首先,该实施例利用常规心电时间序列预处理方法对两组心电时间序列完成了预处理,包括剔除坏导,陷波去除工频干扰、带通滤波器去除基线漂移与高频噪声、剔除坏段以及剔除异常值等。后续,利用上述步骤一中的粗粒化处理多维原始时间序列的具体实施步骤获得粗粒化多维时间序列,利用上述步骤二中的序列法具体实施步骤状态化压缩粗粒化多维时间序列以获取一维全局状态化序列,利用上述步骤三中的样本熵具体计算方法计算一维全局状态化序列的多变量复杂度。最后,完成上述步骤四中计算所有时间尺度的多变量复杂度以获取多变量多尺度复杂度,即改变时间尺度因子重复上述过程。健康年轻人与健康老年人12导联心电的多变量多尺度复杂度分析结果如图2所示,该结果描述了衰老状态相对于正常状态下的心脏整体复杂度变化情况,在图中全部时间尺度上,健康年轻人组的复杂度均高于健康老年人的复杂度,这表明健康年轻人组的心脏相较于健康老年人的心脏具有更高的整体复杂度。并且,两组之间的复杂度差异随着时间尺度的增加而增加至趋于稳定,且两者在小时间尺度上差异性较小,这表明多尺度相关分析方法可从多尺度角度全面真实地表征不同生理状态下的复杂度差距。此外,上述多变量多尺度复杂度分析结果验证了衰老状态降低系统复杂度的结论,这表明该整体复杂度评估方法可综合考虑多变量信号所包含的信息,实现真实可靠的整体复杂度评估。
上述结果表明,多变量多尺度熵分析方法可真实可靠分析生理系统所输出的多维时间序列(大于3维),实现其整体复杂度有效评估的目的。
以上所述仅展示了本发明算法的部分优选实施方案,应当指出,在不脱离本发明技术原理的前提下,还可以做出若干算法改进,这些算法改进也应视为本发明的保护范围。

Claims (6)

1.一种多维时间序列整体复杂度评估方法,其特征在于,包括以下步骤:
(1)粗粒化处理多维原始时间序列;
(2)采用序列法和符号法状态化压缩粗粒化多维时间序列以获取一维全局状态化序列,包括全局状态化时间序列
Figure FDA0003745987970000011
和全局状态化符号序列
Figure FDA0003745987970000012
(3)采用维数复杂度、熵复杂度和符号复杂度计算一维全局状态化序列的多变量复杂度;
(4)计算所有时间尺度的多变量复杂度以获取多变量多尺度复杂度。
2.根据权利要求1所述的一种多维时间序列整体复杂度评估方法,其特征在于,所述步骤(1)实现过程如下:
多维原始时间序列X表示为:
Figure FDA0003745987970000013
其中M代表多维时间序列的变量数量,N代表多维时间序列的数据长度,xk,u代表多维原始时间序列的第k维第u个数据点;
对每一维数据进行粗粒化处理,时间尺度s的多维粗粒化时间序列的第k维第v个数据点
Figure FDA0003745987970000014
由以下公式计算得到:
Figure FDA0003745987970000015
多维粗粒化时间序列Ys表示为:
Figure FDA0003745987970000016
3.根据权利要求1所述的一种多维时间序列整体复杂度评估方法,其特征在于,所述步骤(2)实现过程如下:
去除各变量的数值偏移,得到第k维的一维去偏移时间序列
Figure FDA0003745987970000017
以及多维去偏移时间序列Bs
Figure FDA0003745987970000021
其中,
Figure FDA0003745987970000022
为第k维粗粒化时间序列的均值,
Figure FDA0003745987970000023
为第k维粗粒化时间序列的标准差;
序列法的具体计算方法如下:
计算第j时刻下,系统内部所有变量两两之间的距离Ds,j,用于表示当前系统的混乱程度:
Figure FDA0003745987970000024
其中,
Figure FDA0003745987970000025
代表第j时刻下,k1与k2两个维度之间的距离;
将距离矩阵中两两变量的距离,划分为L个区间,第j时刻下第i个区间的概率为
Figure FDA0003745987970000026
第j时刻下的状态化程度
Figure FDA0003745987970000027
由以下公式得到:
Figure FDA0003745987970000028
计算所有时刻的状态化程度
Figure FDA0003745987970000029
得到全局状态化时间序列
Figure FDA00037459879700000210
Figure FDA00037459879700000211
符号法的具体计算方法如下:
每一个时刻的状态定义为该时刻的系统微状态;将所有时刻的系统拓扑结构提取,并且输入到无监督聚类算法中,并且设定目标类别个数,然后通过聚类算法,将其降至目标类个数T;获得任意第j个时刻下的系统类别
Figure FDA00037459879700000212
此时全局状态化符号序列
Figure FDA00037459879700000213
为T进制符号化序列。
4.根据权利要求1所述的一种多维时间序列整体复杂度评估方法,其特征在于,步骤(3)所述维数复杂度的具体计算方法如下:
基于步骤(2)获取的全局状态化时间序列
Figure FDA0003745987970000031
延迟重构新矩阵
Figure FDA0003745987970000032
Figure FDA0003745987970000033
其中,t代表分形尺度;
计算
Figure FDA0003745987970000034
的曲线长度Lw(t):
Figure FDA0003745987970000035
计算不同t值的总曲线长度L(t),并对L(t)取对数,得到多变量维数复杂度
Figure FDA0003745987970000036
Figure FDA0003745987970000037
其中,β代表幂律指数,C代表常数。
5.根据权利要求1所述的一种多维时间序列整体复杂度评估方法,其特征在于,步骤(3)所述熵复杂度的具体计算方法包括近似熵、样本熵和模糊熵;
所述近似熵复杂度的具体计算方法如下:
基于全局状态化时间序列
Figure FDA0003745987970000038
区间长度为m,得到重构后的序列
Figure FDA0003745987970000039
Figure FDA00037459879700000310
计算第b个子区间
Figure FDA00037459879700000311
和所有子区间
Figure FDA00037459879700000312
之间的距离
Figure FDA00037459879700000313
Figure FDA00037459879700000314
统计距离小于等于阈值r的数量,根据以下公式得到相似序列比例
Figure FDA00037459879700000315
Figure FDA00037459879700000316
对整个全局状态化序列
Figure FDA00037459879700000317
所有子区间统计相似序列比例后,得到平均相似率
Figure FDA00037459879700000318
Figure FDA00037459879700000319
改变区间长度为m+1,得到
Figure FDA00037459879700000320
多变量熵复杂度
Figure FDA00037459879700000321
为:
Figure FDA00037459879700000322
所述样本熵复杂度的具体计算方法如下:
基于全局状态化时间序列
Figure FDA0003745987970000041
区间长度为m,得到重构后的序列
Figure FDA0003745987970000042
计算第b个子区间
Figure FDA0003745987970000043
和其他子区间
Figure FDA0003745987970000044
之间的距离
Figure FDA0003745987970000045
统计距离小于等于阈值r的数量,根据以下公式得到相似序列比例
Figure FDA0003745987970000046
Figure FDA0003745987970000047
对整个全局状态化序列
Figure FDA0003745987970000048
所有子区间统计相似序列比例后,得到平均相似率
Figure FDA0003745987970000049
Figure FDA00037459879700000410
改变区间长度为m+1,得到
Figure FDA00037459879700000411
多变量熵复杂度
Figure FDA00037459879700000412
为:
Figure FDA00037459879700000413
所述模糊熵复杂度的具体计算方法如下:
基于全局状态化时间序列
Figure FDA00037459879700000414
区间长度为m,得到重构后的序列
Figure FDA00037459879700000415
Figure FDA00037459879700000416
其中,
Figure FDA00037459879700000417
Figure FDA00037459879700000418
的均值;
计算第b个子区间
Figure FDA00037459879700000419
和其他子区间
Figure FDA00037459879700000420
之间的距离
Figure FDA00037459879700000421
通过模糊函数
Figure FDA00037459879700000422
定义两子区间的相似度
Figure FDA00037459879700000423
Figure FDA00037459879700000424
其中n为模糊幂;对整个状态化序列
Figure FDA00037459879700000425
所有子区间统计概率
Figure FDA00037459879700000426
Figure FDA00037459879700000427
改变区间长度为m+1,得到
Figure FDA00037459879700000428
多变量熵复杂度
Figure FDA00037459879700000429
为:
Figure FDA00037459879700000430
6.根据权利要求1所述的一种多维时间序列整体复杂度评估方法,其特征在于,步骤(3)所述符号复杂度包括置换熵复杂度和符号熵复杂度;
所述置换熵复杂度的具体计算方法如下:
基于全局状态化符号序列
Figure FDA00037459879700000431
区间长度为m,得到重构后的序列
Figure FDA00037459879700000432
Figure FDA0003745987970000051
对每一个子区间
Figure FDA0003745987970000052
内的数进行递增排序,得到排列模式序列
Figure FDA0003745987970000053
共有E种不同的排列模式,第e种排列模式的概率为Pe,多变量符号复杂度
Figure FDA0003745987970000054
为:
Figure FDA0003745987970000055
所述符号熵复杂度的具体计算方法如下:
基于全局状态化符号序列
Figure FDA0003745987970000056
区间长度为m,得到重构后的序列
Figure FDA0003745987970000057
这个m元序列共有F种可能;
统计重构序列
Figure FDA0003745987970000058
中第f种m元序列的概率Pf,多变量符号复杂度
Figure FDA0003745987970000059
为:
Figure FDA00037459879700000510
CN202210824702.6A 2022-07-14 2022-07-14 一种多维时间序列整体复杂度评估方法 Pending CN115269679A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210824702.6A CN115269679A (zh) 2022-07-14 2022-07-14 一种多维时间序列整体复杂度评估方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210824702.6A CN115269679A (zh) 2022-07-14 2022-07-14 一种多维时间序列整体复杂度评估方法

Publications (1)

Publication Number Publication Date
CN115269679A true CN115269679A (zh) 2022-11-01

Family

ID=83765715

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210824702.6A Pending CN115269679A (zh) 2022-07-14 2022-07-14 一种多维时间序列整体复杂度评估方法

Country Status (1)

Country Link
CN (1) CN115269679A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115982611A (zh) * 2023-03-14 2023-04-18 北京易能中网技术有限公司 基于聚类算法的电力用户用能特点分析方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115982611A (zh) * 2023-03-14 2023-04-18 北京易能中网技术有限公司 基于聚类算法的电力用户用能特点分析方法

Similar Documents

Publication Publication Date Title
CN114564991B (zh) 基于Transformer引导卷积神经网络的脑电信号分类方法
CN111307438B (zh) 一种基于信息熵的旋转机械振动故障诊断方法及其系统
CN108009122B (zh) 一种改进的hht方法
CN108549078B (zh) 一种雷达脉冲信号跨信道合并及检测方法
CN113673346A (zh) 一种基于多尺度SE-Resnet的电机振动数据处理与状态识别方法
CN115269679A (zh) 一种多维时间序列整体复杂度评估方法
CN110192864B (zh) 一种跨域心电图生物特征身份识别方法
CN114397569A (zh) 基于vmd参数优化、样本熵的断路器故障电弧检测方法
CN112836393B (zh) 一种基于多尺度熵分析储层非均质性的方法
CN116738221B (zh) 一种带压管道气体分析方法及系统
CN116818574A (zh) 基于太赫兹谱特征参数表征的材料力学性能测定方法
CN112686182A (zh) 局部放电模式识别方法及终端设备
Carvalho et al. Extended-alphabet finite-context models
CN112561161A (zh) 一种基于压缩感知的时间序列趋势提取和预测方法
CN108055042A (zh) 基于斜率分布的离散波形数据压缩方法
CN114492146B (zh) 基于迁移学习的螺栓群松动定位和定量分析方法及系统
CN116312860A (zh) 基于监督迁移学习的农产品可溶性固形物预测方法
CN111025100A (zh) 变压器特高频局部放电信号模式识别方法与装置
CN115565004A (zh) 一种基于二维拉曼图结合深度学习的拉曼光谱分析方法
CN113598784B (zh) 心律失常检测方法及系统
CN113219333B (zh) 一种电机故障诊断时的频谱参数处理方法
CN111010193B (zh) 基于压电导纳的数据压缩重构及结构损伤识别方法、设备
CN108984997B (zh) 一种基于熵值的离心泵故障诊断方法
CN110705373B (zh) 一种基于小波包分析和残差网络的槽电压信号分类方法
CN114371501A (zh) 海量地震源数据seg d分段分类混合压缩方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination