CN107665276A - 基于符号化模态及转换频次的时间序列复杂性测算方法 - Google Patents
基于符号化模态及转换频次的时间序列复杂性测算方法 Download PDFInfo
- Publication number
- CN107665276A CN107665276A CN201710837853.4A CN201710837853A CN107665276A CN 107665276 A CN107665276 A CN 107665276A CN 201710837853 A CN201710837853 A CN 201710837853A CN 107665276 A CN107665276 A CN 107665276A
- Authority
- CN
- China
- Prior art keywords
- symbolism
- time series
- mode
- mrow
- probability
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computer Hardware Design (AREA)
- Evolutionary Computation (AREA)
- Geometry (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Complex Calculations (AREA)
Abstract
一种基于符号化模态及转换频次的时间序列复杂性测算方法:给定采样时间间隔相同的一维原始时间序列,处理成标准时间序列;对标准时间序列进行多区域分段划分处理,得到N个等概率区间,用相同的符号表示同一个区间的序列值,得到标准时间序列的符号化序列;设置一个固定长度滑窗,从符号化序列的第一个符号开始,自左向右逐步滑动,得到一系列滑窗长度的符号化子片段,实现对原始时间序列的符号化模态表征;通过符号化模态之间的转换关系确定模式对,一个模式对为一个事件,统计符号化模态之间的转换频次,计算符号化模态之间的转换概率;根据转换概率绘制出符号化模态之间转换频次示意图,并定义原始时间序列的熵值。本发明普适性更强且测算准确度更高。
Description
技术领域
本发明涉及一种时间序列复杂性测算方法。特别是涉及一种基于符号化模态及转换频次的时间序列复杂性测算方法。
背景技术
时间序列是自然界中复杂系统的外在表现形式,具有多相特征,通常呈现出非线性、非平稳特性。时间序列的复杂性测算为进一步揭示复杂系统的动态演化规律提供非常有价值的线索,因此吸引了众多学者致力于该问题的研究,并提出了多种复杂性测算方法,其中经典方法有Lempel-Ziv测度、排列熵、近似熵和样本熵等。Lempel-Ziv测度主要反映时间序列中的子序列随时间序列长度增加的速率;排列熵方法是基于相空间重构原理,通过统计时间序列中各种排列模式出现的相对频率测算时间序列的复杂性;近似熵测算结果反映时间序列在不同维数条件下,新模式产生的概率;样本熵测算方法是对近似熵方法的一种改进,与近似熵不同的是,其计算的是概率和的对数,没有自身匹配的过程。目前,样本熵方法在时间序列复杂性分析应用中被广泛采用且测算结果较为可靠。
随着时间序列复杂性测算应用的不断拓展,现有算法的一些不足也逐渐凸显,大量测试结果表明,现有方法在复杂性测算的准确度和普适性方面均存在一定的问题,有些方法用于某些特定类型信号的效果较好,但当用于其它类型信号的时候偏差较大。另外,时间序列通常在一定范围内跳变且跳变数值非常多,使得从时间序列的原始数值中很难发现蕴含其中的本征模态,因此对时间序列进行恰当的符号化处理,将有助于挖掘其中的固有模态,同时大大简化了分析的复杂度。
发明内容
本发明所要解决的技术问题是,提供一种普适性更强且测算准确度更高的基于符号化模态及转换频次的时间序列复杂性测算方法。
本发明所采用的技术方案是:一种基于符号化模态及转换频次的时间序列复杂性测算方法,包括如下步骤:
1)首先给定采样时间间隔相同的一维原始时间序列{xi,i=1,…,n},并标准化处理成平均值为0,标准差为1的标准时间序列;
2)依据跳变数据的等概率分布对标准时间序列进行多区域分段划分处理,得到N个等概率区间,并用相同的符号表示处于同一个区间的序列值,从而得到标准时间序列的符号化序列:
S={s1s2s3…sk…sN},sk∈{a,b,c,d,…}
其中,S表示标准时间序列的符号化序列;sk表示第k个元素的符号;
3)设置一个固定长度为l的滑窗,从符号化序列S的第一个符号开始,自左向右逐步滑动,得到一系列长度为l的符号化子片段,实现对原始时间序列的符号化模态表征;
4)通过符号化模态之间的转换关系确定模式对,其中,一个模式对为一个事件,统计符号化模态之间的转换频次以计算符号化模态之间的转换概率;
5)根据事件发生的概率,绘制出符号化模态之间转换频次示意图,并定义原始时间序列的熵值E为:
式中,P(j)表示事件j发生的概率;Num为事件总数量;
所述的熵值E即为原始时间序列复杂性测算结果。
步骤4)中所述的计算符号化模态之间的转换概率如下:
假设事件总数量为Num,事件j发生的次数为mj,则事件j发生的概率为:
式中,P(j)表示事件j发生的概率;
如果当前符号化模态到下一时刻的符号化模态发生了变化,那么两个符号化模态之间转化为一个事件且权重加1;如果当前符号化模态与下一时刻符号化模态相同,不发生变化。
本发明的基于符号化模态及转换频次的时间序列复杂性测算方法,普适性更强且测算准确度更高。本发明主要优点及特色体现在如下几个方面:
1、本发明方法对复杂变化的时间序列进行恰当的符号化处理,并结合滑窗技术确定符号化模态,这一方面更有利于挖掘原始序列中的本征模态,另一方面可在保障分析精度的同时大大简化信号分析的复杂度。
2、本发明方法将符号化模态之间的方向性和转换频次定义事件出现的概率,能更准确地反映复杂系统内在的关联性及方向性差异,因此信号的复杂性测算结果也更为精准。
3、本发明提出的基于符号化模态及转换频次分析的时间序列复杂性测算方法具有很强的普适性,未来将在众多领域(如气象、交通、金融等)有广阔的应用前景。
附图说明
图1是本发明基于符号化模态及转换频次的时间序列复杂性测算方法的流程图;
图2a是本发明实施例符号化示例标准化时间序列;
图2b是本发明实施例符号化示例处理后的符号化序列;
图3a是本发明实施例正弦信号时间序列;
图3b是本发明实施实例噪声强度为0.1的混合时间序列;
图3c是本发明实施实例噪声强度为0.2的混合时间序列;
图3d是本发明实施实例噪声强度为0.3的混合时间序列;
图3e是本发明实施实例噪声强度为0.4的混合时间序列;
图3f是本发明实施实例噪声强度为0.5的混合时间序列;
图3g是本发明实施实例噪声强度为0.6的混合时间序列;
图3h是本发明实施实例噪声强度为0.7的混合时间序列;
图3i是本发明实施实例噪声强度为0.8的混合时间序列;
图3j是本发明实施实例噪声强度为0.9的混合时间序列;
图3k是本发明实施实例高斯白噪声时间序列;
图4a是本发明实施实例正弦信号时间序列的模态对转换频次示意图;
图4b是本发明实施实例噪声强度为0.5的混合时间序列的模态对转换频次示意图;
图5是本发明实施实例典型及加噪时间序列的样本熵对比测算结果;
图6是本发明实施实例典型及加噪时间序列的复杂性测算结果。
具体实施方式
下面结合实施例和附图对本发明的基于符号化模态及转换频次的时间序列复杂性测算方法做出详细说明。
本发明的基于符号化模态及转换频次的时间序列复杂性测算方法,首先是依据跳变数据的等概率分布对复杂变化的时间序列进行恰当的符号化处理,从而保障对原始信号精度损失较小的前提下大大简化分析信号的难度;然后利用滑窗技术获得有限个数的不同符号化模态,然后计算符号化模态对之间的转换频次。最后,综合符号化模态对数量和模态对之间的转换频次以计算符号化模态之间的转换概率,从而测算出时间序列的复杂度。本发明的方法相比现有传统方法,普适性更强且测算准确度更高。
如图1所示,本发明的基于符号化模态及转换频次的时间序列复杂性测算方法,包括如下步骤:
1)首先给定采样时间间隔相同的一维原始时间序列{xi,i=1,…,n},并标准化处理成平均值为0,标准差为1的标准时间序列;
2)依据跳变数据的等概率分布对标准时间序列进行多区域分段划分处理,得到N个等概率区间,并用相同的符号表示处于同一个区间的序列值,从而得到标准时间序列的符号化序列:
S={s1s2s3…sk…sN},sk∈{a,b,c,d,…} (1)
其中,S表示标准时间序列的符号化序列;sk表示第k个元素的符号;
从图2a和图2b可以看出,符号化序列较好地保留了原始序列的跳变状态。这保障对原始信号精度损失较小的前提下大大简化分析信号的难度。
3)设置一个固定长度为l的滑窗,从符号化序列S的第一个符号开始,自左向右逐步滑动,得到一系列长度为l的符号化子片段,实现对原始时间序列的符号化模态表征;
4)通过符号化模态之间的转换关系确定模式对,其中,一个模式对为一个事件,统计符号化模态之间的转换频次以计算符号化模态之间的转换概率;所述的计算符号化模态之间的转换概率如下:
假设事件总数量为Num,事件j发生的次数为mj,则事件j发生的概率为:
式中,P(j)表示事件j发生的概率;如果当前符号化模态到下一时刻的符号化模态发生了变化,那么两个符号化模态之间转化为一个事件且权重加1;如果当前符号化模态与下一时刻符号化模态相同,不发生变化。
5)根据事件发生的概率,绘制出符号化模态之间转换频次示意图,并定义原始时间序列的熵值E为:
式中,P(j)表示事件j发生的概率;Num为事件总数量;
所述的熵值E即为原始时间序列复杂性测算结果。
下面以典型信号加噪为实例,详细的说明本发明的基于符号化模态及转换频次的时间序列复杂性测算方法如下:
首先,
选取长度为1000点的序列进行验证。
●正弦信号y1=sin(x),采样间隔为π/32。
●正弦信号与高斯白噪声信号的混合序列,y=y1+py2,其中y1为正弦信号,y2为高斯白噪声时间序列,p为信号中混合的高斯白噪声的强度,分别取0.1~0.9,步长为0.1。
●由MATLAB产生的实高斯白噪声序列。
典型信号及其加噪时间序列如图3a~图3k所示。
然后进行如下的过程:
1)将每一个一维时间序列{xi,i=1,…,1000}标准化成平均值为0,标准差为1的标准序列。
2)依据跳变数据的等概率分布对时间序列进行多区域分段划分处理(区域设定为4),得到4个等概率区间,并用相同的符号表示处于同一个区间的序列值,从而得到其符号化表示:
S={s1s2s3…sk…s1000},sk∈{a,b,c,d,…} (4)
3)设置一个固定长度l为4的滑窗,从符号化序列S的第一个符号开始,自左向右逐步滑动,这样就得到一系列长度为4的符号化子片段,实现对原始时间序列的符号化模态表征。
4)通过符号化模态之间的转换关系确定模式对,其中,一个模式对为一个事件,统计符号化模态之间的转换频次以计算符号化模态之间的转换概率。假设事件总数量为Num,事件j发生的次数为mj,则事件j发生的概率为:
如果当前符号化模态到下一时刻的符号化模态发了变化,那么这两个符号化模态之间转化为一个事件且权重加1。如果当前符号化模态与下一时刻符号化模态相同,不发生变化。
5)根据事件发生的概率,绘制出符号化模态之间转换频次示意图,如图4a、图4b所示,定义时间序列的熵值E为:
所述的熵值E即为原始时间序列复杂性测算结果,最终实现对复杂信号进行复杂性测算。
图5为典型信号的样本熵测算对比结果,整体呈现上升趋势,在周期信号及其噪声强度较低时,样本熵可以很好地度量出信号之间的复杂性测度差异性,然而对于噪声强度在0.5~0.8之间的混合信号,它们的样本熵近似相等,无法体现出混合信号的噪声强度和复杂性,并且在噪声强度为0.9时,其样本熵高于白噪声信号的样本熵,发生了误判。总之,对于复杂性较大的信号存在波动性而不是整体呈现线性关系,难以准确描述信号的噪声强度和复杂性测度。图6为本发明提出的基于符号化模态及转换频次分析的时间序列复杂性测算方法的分析结果。熵值随着复杂性增大而增大,具有较好的线性趋势。周期性的正弦信号的复杂性测度参数——熵值最小,高斯白噪声的熵值最大。对于混合信号,它的复杂度介于周期信号和白噪声信号之间,随着噪声强度的增加,其熵值同样地呈递增趋势。上述分析表明,本文提出的新方法能精细、准确地反映分析信号复杂性差异。
Claims (2)
1.一种基于符号化模态及转换频次的时间序列复杂性测算方法,其特征在于,包括如下步骤:
1)首先给定采样时间间隔相同的一维原始时间序列{xi,i=1,…,n},并标准化处理成平均值为0,标准差为1的标准时间序列;
2)依据跳变数据的等概率分布对标准时间序列进行多区域分段划分处理,得到N个等概率区间,并用相同的符号表示处于同一个区间的序列值,从而得到标准时间序列的符号化序列:
S={s1 s2 s3 … sk … sN},sk∈{a,b,c,d,…}
其中,S表示标准时间序列的符号化序列;sk表示第k个元素的符号;
3)设置一个固定长度为l的滑窗,从符号化序列S的第一个符号开始,自左向右逐步滑动,得到一系列长度为l的符号化子片段,实现对原始时间序列的符号化模态表征;
4)通过符号化模态之间的转换关系确定模式对,其中,一个模式对为一个事件,统计符号化模态之间的转换频次以计算符号化模态之间的转换概率;
5)根据事件发生的概率,绘制出符号化模态之间转换频次示意图,并定义原始时间序列的熵值E为:
<mrow>
<mi>E</mi>
<mo>=</mo>
<mo>-</mo>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>j</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mrow>
<mi>N</mi>
<mi>u</mi>
<mi>m</mi>
</mrow>
</munderover>
<mi>P</mi>
<mrow>
<mo>(</mo>
<mi>j</mi>
<mo>)</mo>
</mrow>
<mi>ln</mi>
<mi> </mi>
<mi>P</mi>
<mrow>
<mo>(</mo>
<mi>j</mi>
<mo>)</mo>
</mrow>
</mrow>
式中,P(j)表示事件j发生的概率;Num为事件总数量;
所述的熵值E即为原始时间序列复杂性测算结果。
2.根据权利要求1所述的基于符号化模态及转换频次的时间序列复杂性测算方法,其特征在于,步骤4)中所述的计算符号化模态之间的转换概率如下:
假设事件总数量为Num,事件j发生的次数为mj,则事件j发生的概率为:
<mrow>
<mi>P</mi>
<mrow>
<mo>(</mo>
<mi>j</mi>
<mo>)</mo>
</mrow>
<mo>=</mo>
<msub>
<mi>m</mi>
<mi>j</mi>
</msub>
<mo>/</mo>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>j</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mrow>
<mi>N</mi>
<mi>u</mi>
<mi>m</mi>
</mrow>
</munderover>
<msub>
<mi>m</mi>
<mi>j</mi>
</msub>
</mrow>
式中,P(j)表示事件j发生的概率;
如果当前符号化模态到下一时刻的符号化模态发生了变化,那么两个符号化模态之间转化为一个事件且权重加1;如果当前符号化模态与下一时刻符号化模态相同,不发生变化。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710837853.4A CN107665276A (zh) | 2017-09-18 | 2017-09-18 | 基于符号化模态及转换频次的时间序列复杂性测算方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710837853.4A CN107665276A (zh) | 2017-09-18 | 2017-09-18 | 基于符号化模态及转换频次的时间序列复杂性测算方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN107665276A true CN107665276A (zh) | 2018-02-06 |
Family
ID=61098396
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710837853.4A Pending CN107665276A (zh) | 2017-09-18 | 2017-09-18 | 基于符号化模态及转换频次的时间序列复杂性测算方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107665276A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111241150A (zh) * | 2019-12-18 | 2020-06-05 | 重庆大学 | 用于监测数据处理的多元时间序列符号化映射方法 |
CN116155426A (zh) * | 2023-04-19 | 2023-05-23 | 恩平市奥新电子科技有限公司 | 基于历史数据的调音台运行异常监测方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103942425A (zh) * | 2014-04-14 | 2014-07-23 | 中国人民解放军国防科学技术大学 | 一种数据处理方法和装置 |
US20160042101A1 (en) * | 2013-03-14 | 2016-02-11 | Nec Corporation | Data prediction apparatus |
US20160171514A1 (en) * | 2014-08-21 | 2016-06-16 | Affectomatics Ltd. | Crowd-based scores for food from measurements of affective response |
CN106095787A (zh) * | 2016-05-30 | 2016-11-09 | 重庆大学 | 时间序列数据的一种符号化表示方法 |
CN106533742A (zh) * | 2016-10-31 | 2017-03-22 | 天津大学 | 基于时间序列模式表征的加权有向复杂网络建网方法 |
-
2017
- 2017-09-18 CN CN201710837853.4A patent/CN107665276A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160042101A1 (en) * | 2013-03-14 | 2016-02-11 | Nec Corporation | Data prediction apparatus |
CN103942425A (zh) * | 2014-04-14 | 2014-07-23 | 中国人民解放军国防科学技术大学 | 一种数据处理方法和装置 |
US20160171514A1 (en) * | 2014-08-21 | 2016-06-16 | Affectomatics Ltd. | Crowd-based scores for food from measurements of affective response |
CN106095787A (zh) * | 2016-05-30 | 2016-11-09 | 重庆大学 | 时间序列数据的一种符号化表示方法 |
CN106533742A (zh) * | 2016-10-31 | 2017-03-22 | 天津大学 | 基于时间序列模式表征的加权有向复杂网络建网方法 |
Non-Patent Citations (2)
Title |
---|
JESSICA LIN 等: "A Symbolic Representation of Time Series, with Implications for Streaming Algorithms", 《PROCEEDINGS OF THE 8TH ACM SIGMOD WORKSHOP ON RESEARCH ISSUES IN DATA MINING AND KNOWLEDGE DISCOVERY》 * |
李吉功 等: "时变流场环境中机器人跟踪气味烟羽方法", 《自动化学报》 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111241150A (zh) * | 2019-12-18 | 2020-06-05 | 重庆大学 | 用于监测数据处理的多元时间序列符号化映射方法 |
CN116155426A (zh) * | 2023-04-19 | 2023-05-23 | 恩平市奥新电子科技有限公司 | 基于历史数据的调音台运行异常监测方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Qiang et al. | Information fractal dimension of mass function | |
CN105163326B (zh) | 一种基于无线网络话务特征的小区聚类方法和系统 | |
CN103473786B (zh) | 基于多目标模糊聚类的灰度图像分割方法 | |
CN105512206A (zh) | 一种基于聚类的离群点检测方法 | |
CN109949176A (zh) | 一种基于图嵌入的社交网络中异常用户检测方法 | |
CN102542288A (zh) | 一种高光谱数据多特征空间构建与融合分类方法 | |
CN106533742A (zh) | 基于时间序列模式表征的加权有向复杂网络建网方法 | |
CN107665276A (zh) | 基于符号化模态及转换频次的时间序列复杂性测算方法 | |
CN110348488A (zh) | 一种基于局部密度峰值聚类的模态辨识方法 | |
CN109271427A (zh) | 一种基于近邻密度和流形距离的聚类方法 | |
CN103955580B (zh) | 基于信度规则库推理的集成电路参数成品率估计方法 | |
CN110135642A (zh) | 一种基于dtw距离的交通流量序列相似性度量方法 | |
CN108241925A (zh) | 一种基于离群点检测的离散制造机械产品质量溯源方法 | |
CN103942325A (zh) | 一种融合气候分区思想的海陆气候事件关联规则挖掘方法 | |
CN107977730A (zh) | 一种多传感器数据融合技术的风速测量方法 | |
Yang et al. | An over sampling method of unbalanced data based on ant colony clustering | |
CN107552657A (zh) | 一种热冲压模具的冷却系统 | |
CN108280561A (zh) | 一种基于信息熵和加权距离的离散制造机械产品质量溯源方法 | |
Lei et al. | A panel data approach to the income convergence among Mainland China, Hong Kong and Macao | |
CN107562778A (zh) | 一种基于偏离特征的离群点挖掘方法 | |
Hua-Yan et al. | Accelerating EM missing data filling algorithm based on the k-means | |
CN109447833A (zh) | 一种大规模微博用户兴趣群体发现方法 | |
CN110188967A (zh) | 基于混沌人群算法和贝叶斯网络的电力负荷概率性预测方法 | |
CN117407744B (zh) | 基于数字孪生的多源数据融合方法 | |
CN110020409A (zh) | 基于自适应核密度估计算法的地面气温观测资料分析方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20180206 |