CN109768890B - 基于stl分解法的符号化有向加权复杂网络建网方法 - Google Patents

基于stl分解法的符号化有向加权复杂网络建网方法 Download PDF

Info

Publication number
CN109768890B
CN109768890B CN201910042399.2A CN201910042399A CN109768890B CN 109768890 B CN109768890 B CN 109768890B CN 201910042399 A CN201910042399 A CN 201910042399A CN 109768890 B CN109768890 B CN 109768890B
Authority
CN
China
Prior art keywords
node
network
nodes
time
mode
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910042399.2A
Other languages
English (en)
Other versions
CN109768890A (zh
Inventor
汪丽娜
成媛媛
臧臣瑞
申江龙
谭桂敏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inner Mongolia University of Technology
Original Assignee
Inner Mongolia University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inner Mongolia University of Technology filed Critical Inner Mongolia University of Technology
Priority to CN201910042399.2A priority Critical patent/CN109768890B/zh
Publication of CN109768890A publication Critical patent/CN109768890A/zh
Application granted granted Critical
Publication of CN109768890B publication Critical patent/CN109768890B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

本发明公开了一种基于STL分解法的符号化有向加权复杂网络建网方法,采用STL分解法将原始时间序列分解为季节项、趋势项和随机项;采用粗粒化过程对三个分解项分别做层次划分和符号模式转化,将每个时间序列数据用符号向量表示;将互不相同的时刻符号向量定义为复杂网络的节点,不同符号向量之间的转换方向和转换频次分别定义为连边的方向和权重,从而将时间序列映射为以符号向量为基元的有向加权网络。本发明从时间序列的生成过程和长期趋势建立复杂网络,可以区分平稳时间序列和非平稳时间序列。

Description

基于STL分解法的符号化有向加权复杂网络建网方法
技术领域
本发明涉及一种复杂网络建网方法。特别是涉及一种基于STL分解法的符号化有向加权复杂网络建网方法。
背景技术
复杂网络分析法是将复杂系统的基本基元抽象为节点,基元之间相互作用的关系抽象为连边的方法。自从复杂网络的小世界特性和无标度特性被揭示以来,复杂网络分析方法被普遍应用到了各类复杂系统的研究当中。将复杂系统抽象为由点和连边组成的网络,通过分析该网络的拓扑特征挖掘系统的信息。
近年来,运用复杂网络建模方法挖掘时间序列的内部信息越来越多地受到各领域研究者的关注。目前,经典的时间序列建网方法有:相空间重构法和可视图算法。相空间重构法是通过嵌入维数和推迟时间将一维时间序列划分为一组特定长度的多维向量,以向量为节点,向量之间的相关关系为连边,将原始时间序列映射为一个无权无向的复杂网络。可视图算法是将时间序列的每个时刻数据抽象为节点,柱状图展示的数据频率之间的可视关系抽象为连边的一种建网方法。这两种建网方法忽略了时间的不可逆性和节点之间不同的关联性强度,在精准刻画系统特性方面表现较弱。
随着电子技术、计算机技术的高速发展,大数据时代已经来临。经济、交通、通讯、教育等各个领域记录和存储了海量具有时空特征的数据。经典时间序列建网方法的计算复杂度较高,面对大数据时,其分析能力较差,时间序列符号化建网方法应运而生。主要的时间序列符号化建网方法有:基于Pearson相关性的符号化建网方法,基于伏动模式的符号化建网方法和符号模式表征的建网方法。基于Pearson相关性的符号化建网方法可以分析具有相关性的多维时间序列。基于伏动模式的符号化建网方法根据时间序列的变化率建网,更多地应用于金融领域的时间序列数据。符号模式表征的建网方法针对具有跳跃性特征的时间序列数据。
发明内容
本发明所要解决的技术问题是,对于具有周期性特征的时间序列,提供一种能够精准刻画时间序列数据点之间关联的基于STL分解法的符号化有向加权复杂网络建网方法。
本发明所采用的技术方案是:基于STL分解法的符号化有向加权复杂网络建网方法,包括如下步骤:
1)依据时间序列加法模型Yn=Sn+Tn+Rn,采用STL分解法将周期性时间序列分解为季节项,趋势项和随机项,其中,Sn表示季节项,Tn表示趋势项,Rn表示随机项,n表示时间序列的长度,即:原时间序列Yn={yi,i=1,2,…,n}通过STL分解法分解为Sn={si,i=1,2,…,n},Tn={ti,i=1,2,…,n},Rn={ri,i=1,2,…,n};
2)将每个分解项看做一个变量,每个时间序列数据值表示为三个分解变量组成的数据向量;
3)用粗粒化过程将一组点转化为符号模式,粗粒化过程:选用符号化阶数m对时间序列{xi,i=1,2,…,n}进行层次划分和符号模式转化,令:
Figure BDA0001948011100000021
Figure BDA0001948011100000022
其中,A,B,…,M表示m阶符号;
4)根据步骤3),对原始时间序列的三个分解项分别做层次划分和符号模式转化,然后将每个时间序列数据用符号向量表示;
5)将互不相同的时刻符号模式作为复杂网络的节点,不同模式之间的转换关系作为节点之间的连边,转换频次和转换的方向作为复杂网络连边的权重和连边的方向,如此,将时间序列映射为以符号模式为基元的有向加权复杂网络;
6)借助Gephi软件实现有向加权复杂网络的可视化;
7)计算有向加权复杂网络的网络拓扑特性,包括度分布p(k)、节点强度gi、加权聚类系数C和加权有向平均路径长度WDPL,
Figure BDA0001948011100000023
上式中,N表示网络的节点总数,Nk表示网络中度为k的节点的数量,
Figure BDA0001948011100000024
上式中,wij是从节点i到节点j的边的权重,Neighbori表示由节点i指出的所有邻居节点构成的集合,
Figure BDA0001948011100000025
上式中,N表示网络的节点总数,ci是节点i的聚类系数,gi如式(4),ki是节点i的度,wij是从节点i到节点j的边的权重,类似地,wik是从节点i到节点k的边的权重,aij是邻接矩阵中的元素,表示节点i和j的连接关系,类似地,ajk和aik是邻接矩阵中的元素,
Figure BDA0001948011100000026
L(i,j)=minwij (6)
上式中,N表示网络的节点总数,L(i,j)表示由节点i到节点j的最小加权有向路径长度,wij是由节点i指向节点j的边的权重。
步骤2)是由于每个时间数据值包含的信息量有周期态,趋势态和随机态,同时这些信息量可以有效地表示该时刻的数据,记
yi=(si,ti,ri) (7)
步骤4)中,根据三个分解变量对原时间序列的影响程度选用不同权重的符号化阶数,令m1为季节项的符号化阶数,m2为趋势项的符号化阶数,m3为随机项的符号化阶数,根据步骤3),得到三组符号序列
Figure BDA0001948011100000031
其中,p(si),p(ti),p(ri)∈{A,B,…},根据公式(7),每个时间序列数据值表示为如下符号化模式
modei={p(si),p(ti),p(ri)} (9)
对每个时刻的数据都以同样的方式进行符号化处理,最终达到对原始时间序列数据的符号化模式转化。
步骤5)中,确定节点之间的连边以及连边的权重和方向的具体方法为:对于相邻两个时刻的符号化模式modei和modei+1,如果modei=modei+1,则网络状态保持不变,如果modei≠modei+1,i时刻的符号模式与i+1时刻的符号模式之间存在连边;连边的方向从i时刻的符号模式指向i+1时刻的符号模式,并且连边的权重加1。
本发明的基于STL分解法的符号化有向加权复杂网络建网方法,采用STL分解法和粗粒化过程,对原始时间序列做加法模型分解、层次划分和符号模式转化,所建立的网络的拓扑结构可以精准地体现时间序列时间数据状态间的关系。本发明的优点特色体现在以下几个方面:
1、本发明提出的有向加权复杂网络可以很准确地反映时间序列数据状态之间的关联,网络拓扑特性可以区分平稳时间序列和非平稳时间序列。
2、本发明提出的有向加权复杂网络中的节点是由该节点所对应的时间序列数据的状态符号化向量表示的。因此,网络不仅可以体现时间序列数据状态的变化而且能够反映时间序列的长期趋势性。符号化过程使得网络规模受时间序列长度的影响较小,适用于具有周期性的大数据时间序列分析。
3、本发明提出的有向加权复杂网络针对周期性时间序列,并且软件编程易于实现、算法效率高。因此,可以广泛应用于具有周期性的时间序列,如:气象数据、通信数据、互联网吞吐时序数据,交通领域旅客吞吐时序数据等。
附图说明
图1是本发明基于STL分解法的符号化有向加权复杂网络建网方法的流程图;
图2是本发明基于STL分解法的符号化有向加权复杂网络建网方法的原理图;
图3是航空旅客吞吐量时间序列STL分解图;
图4是对应于图3的有向加权复杂网络图;
图5是网络话务量时间序列STL分解图;
图6是对应于图5的有向加权复杂网络图。
具体实施方式
下面结合实例和附图对本发明的基于STL分解法的符号化有向加权复杂网络建网方法做出详细说明。
本发明的基于STL分解法的符号化有向加权复杂网络建网方法,如图1所示,包括如下步骤:
步骤1:依据时间序列加法模型Yn=Sn+Tn+Rn,采用STL分解法将周期性时间序列分解为季节项,趋势项和随机项。其中,Sn表示季节项,Tn表示趋势项,Rn表示随机项,n表示时间序列的长度。即,原时间序列Yn={yi,i=1,2,…,n}通过STL分解法分解为Sn={si,i=1,2,…,n},Tn={ti,i=1,2,…,n},Rn={ri,i=1,2,…,n}。
步骤2:将每个分解项看做一个变量,每个时间序列数据值表示为三个分解变量组成的数据向量。由于每个时间数据值包含的信息量有周期态,趋势态和随机态,同时这些信息量可以有效地表示该时刻的数据,记
yi=(si,ti,ri)(1)
步骤3:用粗粒化过程将一组点转化为符号模式,粗粒化过程:选用符号化阶数m对时间序列{xi,i=1,2,…,n}进行层次划分和符号模式转化,令:
Figure BDA0001948011100000041
Figure BDA0001948011100000042
其中,A,B,…,M表示m阶符号。
步骤4:根据步骤3,对原始时间序列的三个分解项分别做层次划分和符号模式转化,然后将每个时间序列数据用符号向量表示。具体依据如下方法进行:
首先,根据三个分解变量对原时间序列的影响程度选用不同权重的符号化阶数,令m1为季节项的符号化阶数,m2为趋势项的符号化阶数,m3为随机项的符号化阶数,根据步骤3,得到三组符号序列
Figure BDA0001948011100000043
其中,p(si),p(ti),p(ri)∈{A,B,…}。其次,根据公式(1),每个时间序列数据值表示为如下符号化模式
modei={p(si),p(ti),p(ri)} (5)
最后,对每个时刻的数据都以同样的方式进行符号化处理,最终达到对原始时间序列数据的符号化模式转化。
依据这种方法,原始时间序列可以表示成由一系列符号化模式组成的序列,如图2所示为本发明基于STL分解法的符号化有向加权复杂网络建网方法的原理图。
步骤5:将互不相同的时刻符号模式作为复杂网络的节点,不同模式之间的转换关系作为节点之间的连边,转换频次和转换的方向作为复杂网络连边的权重和连边的方向,如此,将时间序列映射为以符号模式为基元的有向加权复杂网络。确定复杂网络节点之间的连边以及连边的权重和方向的具体方法为:对于相邻两个时刻的符号化模式modei和modei+1,如果modei=modei+1,则网络状态保持不变,如果modei≠modei+1,i时刻的符号模式与i+1时刻的符号模式之间存在连边;连边的方向从i时刻的符号模式指向i+1时刻的符号模式,并且连边的权重加1。
步骤6:借助Gephi软件实现有向加权复杂网络的可视化。
步骤7:计算有向加权复杂网络的网络拓扑特性,包括度分布p(k)、节点强度gi、加权聚类系数C和加权有向平均路径长度WDPL,
Figure BDA0001948011100000051
上式中,N表示网络的节点总数,Nk表示网络中度为k的节点的数量;
Figure BDA0001948011100000052
上式中,wij是从节点i到节点j的边的权重,Neighbori表示由节点i指出的所有邻居节点构成的集合;
Figure BDA0001948011100000053
上式中,N表示网络的节点总数,ci是节点i的聚类系数,gi如式(7),ki是节点i的度,wij是从节点i到节点j的边的权重,类似地,wik是从节点i到节点k的边的权重,aij是邻接矩阵中的元素,表示节点i和j的连接关系,类似地,ajk和aik是邻接矩阵中的元素;
Figure BDA0001948011100000054
L(i,j)=minwij (9)
上式中,N表示网络的节点总数,L(i,j)表示由节点i到节点j的最小加权有向路径长度,wij是由节点i指向节点j的边的权重。
实施例1
本案例使用的初始数据为航空旅客月吞吐量时间序列数据,时间跨度从1996年1月到2017年12月。图3所示是航空旅客吞吐量时间序列数据的STL分解结果,其中季节项为周期是12的时间序列,趋势项呈现近似上升趋势。经过ADF检测可知该时间序列满足周期性和非平稳性。分别选取季节项的符号化阶数为6,趋势项的符号化阶数为10,随机项的符号化阶数为4,将原时间序列进行符号化转化。以不同的符号化模式为节点,相邻时间序列数据的符号模式之间的转换关系为连边,并且连边的方向从前一时刻指向后一时刻,模式的转换频次为连边的权重,得到有向加权复杂网络。如图4所示为图3的时间序列所对应的有向加权复杂网络图。由非平稳周期时间序列映射得到的复杂网络的拓扑特征为:网络的聚类系数较小,网络中节点的强度较小。
实施例2
本案例使用的初始数据为网络话务量时间序列数据,时间跨度从2005年1月20日00时到2005年1月26日23时,每五分钟记录一次话务量数据。图5所示为网络话务量时间序列数据的STL分解结果,其中季节项为周期是24的时间序列,趋势项呈现近似上升趋势,ADF检测结果显示该时间序列满足周期性和平稳性。分别选取季节项的符号化阶数为6,趋势项的符号化阶数为10,随机项的符号化阶数为4,将原时间序列进行符号化转化和构建有向加权复杂网络。如图6所示是图5的时间序列所对应的有向加权复杂网络图。由平稳周期时间序列映射得到的复杂网络的拓扑特征为:网络的聚类系数较大,网络中节点的强度较大。

Claims (1)

1.一种基于STL分解法的符号化有向加权复杂网络建网方法,其特征在于,包括如下步骤:
1)依据时间序列加法模型Yn=Sn+Tn+Rn,采用STL分解法将周期性时间序列分解为季节项,趋势项和随机项,其中,Sn表示季节项,Tn表示趋势项,Rn表示随机项,n表示时间序列的长度,即:原始时间序列Yn={yi,i=1,2,…,n}通过STL分解法分解为Sn={si,i=1,2,…,n},Tn={ti,i=1,2,…,n},Rn={ri,i=1,2,…,n};
2)将每个分解项看做一个变量,每个时间序列数据值表示为三个分解项组成的数据向量;
3)用粗粒化过程将一组点转化为符号模式,粗粒化过程:选用符号化阶数m对时间序列{xi,i=1,2,…,n}进行层次划分和符号化处理,令:
Figure FDA0003335154140000011
Figure FDA0003335154140000012
其中,A,B,…,M表示m阶符号模式;
4)根据步骤3),对原始时间序列的三个分解项分别做层次划分和符号化处理,然后将每个时间序列数据值用符号模式表示;
5)将互不相同的时刻符号模式作为复杂网络的节点,不同模式之间的转换关系作为节点之间的连边,转换频次和转换的方向作为复杂网络连边的权重和连边的方向,如此,将时间序列映射为以符号模式为基元的有向加权复杂网络;
6)借助Gephi软件实现有向加权复杂网络的可视化;
7)计算有向加权复杂网络的网络拓扑特性,包括度分布p(k)、节点强度gi、加权聚类系数C和加权有向平均路径长度WDPL;
Figure FDA0003335154140000013
上式中,N表示网络的节点总数,Nk表示网络中度为k的节点的数量,
Figure FDA0003335154140000014
上式中,wij是从节点i到节点j的边的权重,Neighbori表示由节点i指出的所有邻居节点构成的集合,
Figure FDA0003335154140000015
上式中,N表示网络的节点总数,ci是节点i的聚类系数,gi如式(4),ki是节点i的度,wij是从节点i到节点j的边的权重,类似地,wik是从节点i到节点k的边的权重,aij是邻接矩阵中的元素,表示节点i和j的连接关系,类似地,ajk和aik是邻接矩阵中的元素,
Figure FDA0003335154140000021
上式中,N表示网络的节点总数,L(i,j)表示由节点i到节点j的最小加权有向路径长度,wij是由节点i指向节点j的边的权重;
步骤2)是由于每个时间序列数据值包含的信息量有周期态,趋势态和随机态,同时这些信息量可以有效地表示该时刻的数据,记
yi=(si,ti,ri) (7);
步骤4)中,根据三个分解项对原始时间序列的影响程度选用不同权重的符号化阶数,令m1为季节项的符号化阶数,m2为趋势项的符号化阶数,m3为随机项的符号化阶数,根据步骤3),得到三组符号模式序列:
Figure FDA0003335154140000022
其中,p(si),p(ti),p(ri)∈{A,B,…},根据公式(8),每个时间序列数据值表示为如下符号模式
modei={p(si),p(ti),p(ri)} (9);
对每个时间序列数据值都以同样的方式符号化处理,最终达到对原始时间序列的符号化处理;
步骤5)中,确定节点之间的连边以及连边的权重和方向的具体方法为:对于相邻两个时刻的符号模式modei和modei+1,如果modei=modei+1,则网络状态保持不变,如果modei≠modei+1,i时刻的符号模式与i+1时刻的符号模式之间存在连边;连边的方向从i时刻的符号模式指向i+1时刻的符号模式,并且连边的权重加1。
CN201910042399.2A 2019-01-17 2019-01-17 基于stl分解法的符号化有向加权复杂网络建网方法 Active CN109768890B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910042399.2A CN109768890B (zh) 2019-01-17 2019-01-17 基于stl分解法的符号化有向加权复杂网络建网方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910042399.2A CN109768890B (zh) 2019-01-17 2019-01-17 基于stl分解法的符号化有向加权复杂网络建网方法

Publications (2)

Publication Number Publication Date
CN109768890A CN109768890A (zh) 2019-05-17
CN109768890B true CN109768890B (zh) 2021-12-17

Family

ID=66454081

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910042399.2A Active CN109768890B (zh) 2019-01-17 2019-01-17 基于stl分解法的符号化有向加权复杂网络建网方法

Country Status (1)

Country Link
CN (1) CN109768890B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114114001B (zh) * 2021-11-24 2023-10-31 国网安徽省电力有限公司电力科学研究院 一种gis设备隔离开关机械状态监测方法及系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103996077A (zh) * 2014-05-22 2014-08-20 中国南方电网有限责任公司电网技术研究中心 一种基于多维时间序列的电气设备故障预测方法
CN105678047A (zh) * 2015-11-25 2016-06-15 天津大学 融合经验模态分解降噪和复杂网络分析的风场表征方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7831538B2 (en) * 2007-05-23 2010-11-09 Nec Laboratories America, Inc. Evolutionary spectral clustering by incorporating temporal smoothness
CN106506485A (zh) * 2016-10-26 2017-03-15 中国电子产品可靠性与环境试验研究所 网络空间安全态势感知分析方法和系统

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103996077A (zh) * 2014-05-22 2014-08-20 中国南方电网有限责任公司电网技术研究中心 一种基于多维时间序列的电气设备故障预测方法
CN105678047A (zh) * 2015-11-25 2016-06-15 天津大学 融合经验模态分解降噪和复杂网络分析的风场表征方法

Also Published As

Publication number Publication date
CN109768890A (zh) 2019-05-17

Similar Documents

Publication Publication Date Title
Son et al. Some novel hybrid forecast methods based on picture fuzzy clustering for weather nowcasting from satellite image sequences
Gonzalez-Vidal et al. A methodology for energy multivariate time series forecasting in smart buildings based on feature selection
CN109271975B (zh) 一种基于大数据多特征提取协同分类的电能质量扰动识别方法
Campolongo et al. The use of graph theory in the sensitivity analysis of the model output: a second order screening method
Godsill On the relationship between Markov chain Monte Carlo methods for model uncertainty
Nason et al. Wavelet packet transfer function modelling of nonstationary time series
Yang et al. Hybrid prediction method for wind speed combining ensemble empirical mode decomposition and Bayesian ridge regression
Crawford et al. Developing climate model ensembles: A comparative case study
Steinhaeuser et al. Complex Networks in Climate Science: Progress, Opportunities and Challenges.
JPWO2018012487A1 (ja) 予測装置、パラメータ集合生産方法及びプログラム
CN113420421B (zh) 移动边缘计算中基于时序正则化张量分解的QoS预测方法
WO2023103130A1 (zh) 一种基于量子游走的时间序列多尺度分析方法
CN114169645A (zh) 一种智能电网短期负荷预测方法
CN109768890B (zh) 基于stl分解法的符号化有向加权复杂网络建网方法
CN111598313A (zh) 一种风功率预测方法
Wang et al. Modeling higher-order interactions in complex networks by edge product of graphs
CN117113054A (zh) 一种基于图神经网络和Transformer的多元时间序列预测方法
Toms et al. Testing the reliability of interpretable neural networks in geoscience using the madden-julian oscillation
CN110572789A (zh) 基于Hankel变换的无线传感网高维数据补全方法
CN115409541A (zh) 基于数据血缘的卷烟品牌数据处理方法
CN113419278A (zh) 一种基于状态空间模型与支持向量回归的井震联合多目标同时反演方法
Ramgraber et al. Ensemble transport smoothing--Part 1: unified framework
Li et al. Spatial–Temporal Traffic Modeling With a Fusion Graph Reconstructed by Tensor Decomposition
CN113298131A (zh) 一种基于注意力机制的时序数据缺失值插补方法
Zhang et al. A novel hybrid forecasting system based on data augmentation and deep learning neural network for short-term wind speed forecasting

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant