CN115269679A - 一种多维时间序列整体复杂度评估方法 - Google Patents
一种多维时间序列整体复杂度评估方法 Download PDFInfo
- Publication number
- CN115269679A CN115269679A CN202210824702.6A CN202210824702A CN115269679A CN 115269679 A CN115269679 A CN 115269679A CN 202210824702 A CN202210824702 A CN 202210824702A CN 115269679 A CN115269679 A CN 115269679A
- Authority
- CN
- China
- Prior art keywords
- sequence
- complexity
- time series
- dimensional
- time
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2474—Sequence data queries, e.g. querying versioned data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/16—Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/18—Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Mathematical Optimization (AREA)
- Computational Mathematics (AREA)
- Pure & Applied Mathematics (AREA)
- Mathematical Analysis (AREA)
- Software Systems (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Probability & Statistics with Applications (AREA)
- Algebra (AREA)
- Computational Linguistics (AREA)
- Computing Systems (AREA)
- Fuzzy Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Operations Research (AREA)
- Complex Calculations (AREA)
Abstract
本发明公开了一种多维时间序列整体复杂度评估方法,首先,粗粒化处理多维原始时间序列;其次,采用序列法和符号法状态化压缩粗粒化多维时间序列以获取一维全局状态化序列;然后,采用维数复杂度、熵复杂度和符号复杂度计算一维全局状态化序列的多变量复杂度;最后,计算所有时间尺度的多变量复杂度以获取多变量多尺度复杂度。本发明可在任意变量数的多维序列上运行;不受多维序列顺序的影响,仅测量多维时间序列自身所具备的复杂度;计算量小,更适用于多变量数、高采样率的多维时间序列。
Description
技术领域
本发明涉及多尺度分析方法、系统整体复杂度评估、多维数据处理技术领域,具体涉及一种多维时间序列整体复杂度评估方法。
背景技术
大多数情况下,人们仅能通过测量到的系统宏观输出的时间序列信号来认识了解系统内部运行机制。现实中大多数复杂系统及其输出的时间序列信号均表现出非线性、非平稳、复杂混沌且高度随机的特征。常规线性分析方法往往会忽略上述时间序列自身所具备的非线性相关特征。而非线性动力学分析方法可有效提取出时间序列中有价值的信息,并且为帮助人类理解复杂系统及其输出信号提供新的技术手段。复杂度是广泛用于表征时间序列复杂程度的非线性参数,系统输出时间序列的复杂度指标往往可以反映系统内部运行机制。目前常用复杂度分析算法通常从维数复杂度、不规则性和不可预测性等角度进行复杂度的测量。
复杂系统在不同尺度上都具有复杂结构,即分形特性,可通过小尺度结构的研究,测量复杂系统结构的自相似性。非线性时间序列在不同时间尺度上具有不同的不规则性,传统复杂度分析所获得的复杂度指标,仅代表某一时间尺度上时间序列的无序性,而无序性的测量结果与复杂度理论假设相矛盾。因此,传统基于单一尺度分析的复杂度分析方法往往会忽略系统所具备的多尺度复杂度特性,无法准确描述复杂系统的真实复杂度。对于系统复杂度的评估表征需要多尺度的综合分析方法,以量化时间序列在不同时间尺度上的复杂度,更直观详细地描述系统的动态变化。
随着传感器技术的不断发展,复杂系统的多变量监测是必然趋势。基于一维时间序列的复杂度评估方法,仅测量系统局部复杂度,无法评估系统的整体复杂度。目前,大多基于多维时间序列的复杂度评估方法,通常基于多元嵌入理论进行空间重构,准确的空间重构高度依赖多变量时间序列的空间位置信息,计算复杂,不适用于维数较高的多变量时间序列。因此,需要一种可综合评估同一系统所输出的多变量时间序列的时间及空间动态复杂度的多变量多尺度复杂度算法,此外,要求该算法可面向不同类别的复杂系统,例如模拟、生理、气象以及地质系统等,并且适用于多通道数与高采样率的多维时间序列。其中,生理系统是一种受到广泛关注的复杂系统,其可以同时输出多维时间序列。传统多尺度熵及其改进算法往往无法全面评估上述多维时间序列的整体复杂度,所得结果往往会因为引入人为干扰而与真实结果存在一定差异。忽略多变量的顺序影响,充分利用生理系统输出的多维时间序列的结构性信息已成为多维信号处理分析领域一个重要的关注点。
综上,研究一种多维时间序列整体复杂度评估方法具有十分重要的现实价值。
发明内容
发明目的:针对上述现有多尺度复杂度分析算法的不足,本发明提供一种多维时间序列整体复杂度评估方法,克服了目前多元多尺度复杂度分析算法无法综合评估时间及空间动态复杂度的缺点,实现面向多类别复杂系统所输出的多维时间序列的整体复杂度评估。
技术方案:本发明提供一种多维时间序列整体复杂度评估方法,具体包括以下步骤:
(1)粗粒化处理多维原始时间序列;
(3)采用维数复杂度、熵复杂度和符号复杂度计算一维全局状态化序列的多变量复杂度;
(4)计算所有时间尺度的多变量复杂度以获取多变量多尺度复杂度。
进一步地,所述步骤(1)实现过程如下:
多维原始时间序列X表示为:
其中,M代表多维时间序列的变量数量,N代表多维时间序列的数据长度,xk,u代表多维原始时间序列的第k维第u个数据点;
多维粗粒化时间序列Ys表示为:
进一步地,所述步骤(2)实现过程如下:
序列法的具体计算方法如下:
计算第j时刻下,系统内部所有变量两两之间的距离Ds,j,用于表示当前系统的混乱程度:
符号法的具体计算方法如下:
每一个时刻的状态定义为该时刻的系统微状态;将所有时刻的系统拓扑结构提取,并且输入到无监督聚类算法中,并且设定目标类别个数,然后通过聚类算法,将其降至目标类个数T;获得任意第j个时刻下的系统类别此时全局状态化符号序列为T进制符号化序列。
进一步地,步骤(3)所述维数复杂度的具体计算方法如下:
其中,t代表分形尺度;
其中,β代表幂律指数,C代表常数。
进一步地,步骤(3)所述熵复杂度的具体计算方法包括近似熵、样本熵和模糊熵;
所述近似熵复杂度的具体计算方法如下:
所述样本熵复杂度的具体计算方法如下:
所述模糊熵复杂度的具体计算方法如下:
进一步地,步骤(3)所述符号复杂度包括置换熵复杂度和符号熵复杂度;
所述置换熵复杂度的具体计算方法如下:
所述符号熵复杂度的具体计算方法如下:
有益效果:与现有技术相比,本发明的有益效果为:1、本发明克服多元多尺度复杂度分析算法无法综合评估时间及空间动态复杂度的缺点,实现针对复杂系统所输出的多维时间序列的整体复杂度评估;2、本发明不受多维时间序列顺序影响,有效衡量多维时间序列自身所具备的复杂度,适用于任意变量数的多变量时间序列;3、本发明可适用于多变量数及高采样率的多维时间序列,计算量小;4、本发明相较于传统多尺度复杂度分析算法可适用于较短时间序列;5、本发明具备较高的稳健性与鲁棒性,用于多变量输出时间序列分析时,所得结果个体差异性较小。
附图说明
图1为本发明的流程图;
图2为健康年轻人与健康老年人12导联心电的多变量多尺度复杂度分析结果图。
具体实施方式
下面结合附图对本发明作进一步详细描述:
本发明提出一种多维时间序列整体复杂度评估方法,如图1所示,具体包括以下步骤:
步骤1:粗粒化处理多维原始时间序列。
多维原始时间序列X表示为:
其中M代表多维时间序列的变量数量,N代表多维时间序列的数据长度,xk,u代表多维原始时间序列的第k维第u个数据点。
多维粗粒化时间序列Ys表示为:
后续可分别通过序列法和符号法,将去除偏移后的多维粗粒化时间序列压缩为一维全局状态化时间序列和全局状态化符号序列。
(1)序列法:
计算第j时刻下,系统内部所有变量两两之间的距离Ds,j,用于表示当前系统的混乱程度:
(2)符号法:
每一个时刻的状态定义为该时刻的系统微状态;将所有时刻的系统拓扑结构提取,并且输入到无监督聚类算法中,并且设定目标类别个数,然后通过聚类算法,将其降至目标类个数T;获得任意第j个时刻下的系统类别此时全局状态化符号序列为T进制符号化序列。
步骤3:采用维数复杂度、熵复杂度和符号复杂度等多类计算方法计算一维全局状态化序列的多变量复杂度Cs。
(1)维数复杂度:
其中,t代表分形尺度。
其中,β代表幂律指数,C代表常数。
(2)熵复杂度:
基于步骤2所述序列法提取的一维全局状态化时间序列,量化一维全局状态化序列的多变量复杂度步骤中所述熵复杂度的具体计算方法包括近似熵、样本熵和模糊熵等。
(a)近似熵复杂度:
(b)样本熵复杂度:
(c)模糊熵复杂度:
(3)符号复杂度:
基于步骤2提取的一维全局状态化符号序列,量化一维全局状态化符号序列的多变量复杂度步骤中所述符号复杂度的具体计算方法包括置换熵和符号熵复杂度等。
(a)置换熵复杂度:
(b)符号熵复杂度。
步骤4:计算所有时间尺度的多变量复杂度以获取多变量多尺度复杂度,即修改粗粒化过程的时间尺度参数,重复上述步骤,获取对应于不同时间尺度的多变量复杂度,以得到多变量多尺度复杂度。
下面将结合健康年轻人与健康老年人12导联心电时间序列分析的具体实施方案,对本发明的技术方案做进一步说明。本发明实施例的具体内容如下:
本实施例所采用的多变量12导联心电时间序列的维度为12,即有12个变量,采样率为500Hz,每段心电时间序列长度约为15秒左右,即每段时间序列点数约为7500。首先,该实施例利用常规心电时间序列预处理方法对两组心电时间序列完成了预处理,包括剔除坏导,陷波去除工频干扰、带通滤波器去除基线漂移与高频噪声、剔除坏段以及剔除异常值等。后续,利用上述步骤一中的粗粒化处理多维原始时间序列的具体实施步骤获得粗粒化多维时间序列,利用上述步骤二中的序列法具体实施步骤状态化压缩粗粒化多维时间序列以获取一维全局状态化序列,利用上述步骤三中的样本熵具体计算方法计算一维全局状态化序列的多变量复杂度。最后,完成上述步骤四中计算所有时间尺度的多变量复杂度以获取多变量多尺度复杂度,即改变时间尺度因子重复上述过程。健康年轻人与健康老年人12导联心电的多变量多尺度复杂度分析结果如图2所示,该结果描述了衰老状态相对于正常状态下的心脏整体复杂度变化情况,在图中全部时间尺度上,健康年轻人组的复杂度均高于健康老年人的复杂度,这表明健康年轻人组的心脏相较于健康老年人的心脏具有更高的整体复杂度。并且,两组之间的复杂度差异随着时间尺度的增加而增加至趋于稳定,且两者在小时间尺度上差异性较小,这表明多尺度相关分析方法可从多尺度角度全面真实地表征不同生理状态下的复杂度差距。此外,上述多变量多尺度复杂度分析结果验证了衰老状态降低系统复杂度的结论,这表明该整体复杂度评估方法可综合考虑多变量信号所包含的信息,实现真实可靠的整体复杂度评估。
上述结果表明,多变量多尺度熵分析方法可真实可靠分析生理系统所输出的多维时间序列(大于3维),实现其整体复杂度有效评估的目的。
以上所述仅展示了本发明算法的部分优选实施方案,应当指出,在不脱离本发明技术原理的前提下,还可以做出若干算法改进,这些算法改进也应视为本发明的保护范围。
Claims (6)
3.根据权利要求1所述的一种多维时间序列整体复杂度评估方法,其特征在于,所述步骤(2)实现过程如下:
序列法的具体计算方法如下:
计算第j时刻下,系统内部所有变量两两之间的距离Ds,j,用于表示当前系统的混乱程度:
符号法的具体计算方法如下:
5.根据权利要求1所述的一种多维时间序列整体复杂度评估方法,其特征在于,步骤(3)所述熵复杂度的具体计算方法包括近似熵、样本熵和模糊熵;
所述近似熵复杂度的具体计算方法如下:
所述样本熵复杂度的具体计算方法如下:
所述模糊熵复杂度的具体计算方法如下:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210824702.6A CN115269679A (zh) | 2022-07-14 | 2022-07-14 | 一种多维时间序列整体复杂度评估方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210824702.6A CN115269679A (zh) | 2022-07-14 | 2022-07-14 | 一种多维时间序列整体复杂度评估方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115269679A true CN115269679A (zh) | 2022-11-01 |
Family
ID=83765715
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210824702.6A Pending CN115269679A (zh) | 2022-07-14 | 2022-07-14 | 一种多维时间序列整体复杂度评估方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115269679A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115982611A (zh) * | 2023-03-14 | 2023-04-18 | 北京易能中网技术有限公司 | 基于聚类算法的电力用户用能特点分析方法 |
-
2022
- 2022-07-14 CN CN202210824702.6A patent/CN115269679A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115982611A (zh) * | 2023-03-14 | 2023-04-18 | 北京易能中网技术有限公司 | 基于聚类算法的电力用户用能特点分析方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114564991B (zh) | 基于Transformer引导卷积神经网络的脑电信号分类方法 | |
CN111307438B (zh) | 一种基于信息熵的旋转机械振动故障诊断方法及其系统 | |
CN108009122B (zh) | 一种改进的hht方法 | |
CN108549078B (zh) | 一种雷达脉冲信号跨信道合并及检测方法 | |
CN113673346A (zh) | 一种基于多尺度SE-Resnet的电机振动数据处理与状态识别方法 | |
CN115269679A (zh) | 一种多维时间序列整体复杂度评估方法 | |
CN110192864B (zh) | 一种跨域心电图生物特征身份识别方法 | |
CN114397569A (zh) | 基于vmd参数优化、样本熵的断路器故障电弧检测方法 | |
CN112836393B (zh) | 一种基于多尺度熵分析储层非均质性的方法 | |
CN116738221B (zh) | 一种带压管道气体分析方法及系统 | |
CN116818574A (zh) | 基于太赫兹谱特征参数表征的材料力学性能测定方法 | |
CN112686182A (zh) | 局部放电模式识别方法及终端设备 | |
Carvalho et al. | Extended-alphabet finite-context models | |
CN112561161A (zh) | 一种基于压缩感知的时间序列趋势提取和预测方法 | |
CN108055042A (zh) | 基于斜率分布的离散波形数据压缩方法 | |
CN114492146B (zh) | 基于迁移学习的螺栓群松动定位和定量分析方法及系统 | |
CN116312860A (zh) | 基于监督迁移学习的农产品可溶性固形物预测方法 | |
CN111025100A (zh) | 变压器特高频局部放电信号模式识别方法与装置 | |
CN115565004A (zh) | 一种基于二维拉曼图结合深度学习的拉曼光谱分析方法 | |
CN113598784B (zh) | 心律失常检测方法及系统 | |
CN113219333B (zh) | 一种电机故障诊断时的频谱参数处理方法 | |
CN111010193B (zh) | 基于压电导纳的数据压缩重构及结构损伤识别方法、设备 | |
CN108984997B (zh) | 一种基于熵值的离心泵故障诊断方法 | |
CN110705373B (zh) | 一种基于小波包分析和残差网络的槽电压信号分类方法 | |
CN114371501A (zh) | 海量地震源数据seg d分段分类混合压缩方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |