CN103942300A - 一种中心时间序列的动态求解方法 - Google Patents
一种中心时间序列的动态求解方法 Download PDFInfo
- Publication number
- CN103942300A CN103942300A CN201410151135.8A CN201410151135A CN103942300A CN 103942300 A CN103942300 A CN 103942300A CN 201410151135 A CN201410151135 A CN 201410151135A CN 103942300 A CN103942300 A CN 103942300A
- Authority
- CN
- China
- Prior art keywords
- time
- time series
- sequence
- dynamic
- distance
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/90335—Query processing
- G06F16/90348—Query processing by searching ordered data, e.g. alpha-numerically ordered data
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种中心时间序列的动态求解方法,包括以下步骤:标注时间序列;计算动态匹配;输出中心时间序列。本发明给出了一种新的中心时间序列动态匹配距离,保持了动态形状特征的相似性,比欧几里德平均距离法求中心时间序列的方法更好地呈现形态特征。本发明所确定的一种新的中心时间序列动态匹配累计方式,保证了中心时间序列到相关的时间序列动态匹配距离最小,而且时间复杂度为O(n(p+q)/2)3),比动态时间弯曲距离法求解中心时间序列的方法的时间复杂度好两个数量级。本发明给出的所有预设中点中获取最小误差的方法,对于时间序列聚类而言,使时间序列聚类更准确。
Description
技术领域
本发明涉及一种数据处理技术,特别是一种中心时间序列的动态求解方法。
背景技术
时间序列是指按时间顺序排列的一组数据,是一类重要的复杂数据对象。它广泛存在于各种不同领域中,如股票价格、各种汇率、销售数量、产品的生产能力、天气数据、网购行为和观点评述等。大量时间序列数据真实地记录了各个时刻的所有重要信息,依时间呈现动态性,若能得到有效地分析,发现其中各时间序列之间的相互关系,必将大大提高人们的认识和理解,进而有效地预测和控制,在大数据时代显得尤为重要。人们发现这些时间序列的中心时间序列直接反映了它们的通用模式,有效把握和分析时间序列,至关重要的就是要有效地求解这些中心时间序列,但不幸的是,在人们致力于研发时间序列分析和挖掘系统工具中,中心时间序列求解作为其核心程序,一直是个瓶颈。
观察时间序列数据,可以看作是具有一定动态特性的系统的外在表现形式,这种动态特性主要表现在于它因时间变化而形成的全局形态特征和局部形态特征,其中全局形态特征描述了时间序列的起伏变化等,局部形态特征则表现为时间序列局部时间点上的异常观测值,如不连续点、极值点、突变点和转折点等。在求解两个时间序列的中心时间序列过程中,中心时间序列必须具有与参考时间序列相似的动态特性,保持相似性。然而,由于需要保持其特定的形状特征,使得目前常用的一些相似性度量和聚类方法失去了原有的优越性。
求解中心时间序列,当前主要采用欧几里德距离法和动态时间弯曲距离法。欧几里德平均距离法求中心时间序列,是直接通过时间序列间对应的两个节点求欧几里德距离上的平均中值,计算复杂度为O(n),但这种欧几里德二值平均会直接抵消原时间序列在时间弯曲上的形态特征,导致所求的中心时间序列不支持原时间序列依形态特征。动态时间弯曲距离法求解中心时间序列的方法中,先通过随机产生初始中心时间序列,然后通过迭代产生由每个单独的时间序列和暂时的中心时间序列之间的动态时间弯曲距离,逐步精炼,并生产新的临时中心时间序列,直到迭代到临时中心时间序列是稳定的,与欧几里德平均距离法求到的中心时间序列相比,在时间弯曲上的表现较好,但计算复杂度为O(n3),而且因为不是通过最小匹配而是通过迭代逼近法求中心时间序列,所以不易保持误差最小化。
发明内容
为解决现有技术存在的上述问题,本发明要提出一种既要在时间弯曲上的表现较好、又要降低时间复杂度的中心时间序列的动态求解方法。
为了实现上述目的,本发明的技术方案如下:一种中心时间序列的动态求解方法,包括以下步骤:
A、标注时间序列:对于多个时间序列,先完成每两个时间序列之间的求解,最终求出多个时间序列的中心时间序列。不失一般性,假定现有两个时间序列x[1:m]=(x1,x2,…,xm)(m>1),y[1:n]=(y1,y2,…,yn)(n>1),需要求出它们的中心时间序列c[1:t]=(c1,c2,…,cq)(q>1)。
B、计算动态匹配:时间序列x与c之间存在动态时间匹配关系W=[[w1,1,w1,2]T,[w2,1,w2,2]T,…,[wk,1,wk,2]T,…,[wL,1,wL,2]],k∈{1,2,…,L},wk,1∈{1,2,…,m},wk,2∈{1,2,…,q}。动态匹配距离为:
因为时间序列间存在形状变化特征,动态时间匹配关系并不是唯一的,而是存在动态时间匹配簇(H>1),其中,最小动态匹配距离为:
在路径上的中心时间序列候选集t中,最小动态时间匹配上的中心时间序列为:
C、输出中心时间序列c有以下7个子步骤:
C1、输入时间序列x,y,读出x序列的长度赋给m,读出y的长度赋给n。
C2、初始化伴随矩阵M[(m+1)*(n+1)],是所有行的值为0,而误差error值设为无穷大。
C3、读取x序列,检索伴随矩阵M,依公式(2)计算规整映射路径到x序列。
C4、读取y序列,检索伴随矩阵M,规整映射路径到y序列。
C5、从节点i到1倒序累计预设中心点到x序列的距离和,以及从节点j到1倒序累计预设中心点到y序列的距离和,依公式(4)计算预设第k个中心点距离Disti,j,k(x,y):
Disti,j,k(x,y)=DT(c[1:k],x[1:i])+DT(c[1:k],y[1:j]) (4)
这里c=Centi,j,k(x,y);Centi,j,k[k]=avg(x[p:i],y[q:j]);
C6、依公式(5)更新伴随矩阵值mvalue:
mvalue=Distp,q,k-1+err(x[p:i],y[q:j]) (5)
这里err(x,y)依公式(6)在所有预设中点坐标λ中获取最小误差:
C7、依最小误差输出中心时间序列c。
与现有技术相比,本发明具有以下有益效果:
1、本发明在公式(4)中给出了一种新的中心时间序列动态匹配距离,保持了动态形状特征的相似性,比欧几里德平均距离法求中心时间序列的方法更好地呈现形态特征。
2、本发明采用了如公式(5)所确定的一种新的中心时间序列动态匹配累计方式,保证了中心时间序列到相关的时间序列动态匹配距离最小,而且时间复杂度为O(n((p+q)/2)3),比动态时间弯曲距离法求解中心时间序列的方法的时间复杂度好两个数量级。
3、本发明采用了公式(6)给出的所有预设中点中获取最小误差的方法,对于时间序列聚类而言,使时间序列聚类更准确。
附图说明
本发明共有附图5张,其中:
图1是中心时间序列动态匹配示例图。
图2是匹配距离与误差构成图。
图3实例数据图。
图4实例结果图。
图5是本发明的流程图。
具体实施方式
下面结合附图对本发明进行进一步地描述。
图1是本发明中心时间序列动态匹配示意图,已知两个时间序列x,y,匹配中心时间序列为c。
图2是本发明是匹配距离与误差构成示意图,两个时间序列x,y,对于求解匹配中心时间序列c的ck-1时间节点时,最小距离为累计误差为err(x[i:i],y[j:j])。
图3是实例数据图,图中有50条150单位时长的时间序列,其中每一条都是根据枪手射击视频中每帧焦点取样获取、根据视频播放的时间顺序形成的时间序列。图4是10次在50条源时间序列中以不同时间序列对作为初始时间序列求解中心时间序列的结果。为了定量评价我们的结果,我们求出10次中每次所求的中心时间序列与各个源时间序列间的距离和,然后把10次距离和累加在一起,除10,求出平均值,这个平均值仅为105.97单位距离。
Claims (1)
1.一种中心时间序列的动态求解方法,其特征在于:包括以下步骤:
A、标注时间序列:对于多个时间序列,先完成每两个时间序列之间的求解,最终求出多个时间序列的中心时间序列;不失一般性,假定现有两个时间序列x[1:m]=(x1,x2,…,xm)(m>1),y[1:n]=(y1,y2,…,yn)(n>1),需要求出它们的中心时间序列c[1:t]=(c1,c2,…,cq)(q>1);
B、计算动态匹配:时间序列x与c之间存在动态时间匹配关系W=[[w1,1,w1,2]T,[w2,1,w2,2]T,…,[wk,1,wk,2]T,…,[wL,1,wL,2]],k∈{1,2,…,L},wk,1∈{1,2,…,m},wk,2∈{1,2,…,q};动态匹配距离为:
因为时间序列间存在形状变化特征,动态时间匹配关系并不是唯一的,而是存在动态时间匹配簇(H>1),其中,最小动态匹配距离为:
在路径上的中心时间序列候选集t中,最小动态时间匹配上的中心时间序列为:
C、输出中心时间序列c有以下7个子步骤:
C1、输入时间序列x,y,读出x序列的长度赋给m,读出y的长度赋给n;
C2、初始化伴随矩阵M[(m+1)*(n+1)],是所有行的值为0,而误差error值设为无穷大;
C3、读取x序列,检索伴随矩阵M,依公式(2)计算规整映射路径到x序列;
C4、读取y序列,检索伴随矩阵M,规整映射路径到y序列;
C5、从节点i到1倒序累计预设中心点到x序列的距离和,以及从节点j到1倒序累计预设中心点到y序列的距离和,依公式(4)计算预设第k个中心点距离Disti,j,k(x,y):
Disti,j,k(x,y)=DT(c[1:k],x[1:i])+DT(c[1:k],y[1:j]) (4)
这里c=Centi,j,k(x,y);Centi,j,k[k]=avg(x[p:i],y[q:j]);
C6、依公式(5)更新伴随矩阵值mvalue:
mvalue=Distp,q,k-1+err(x[p:i],y[q:j]) (5)
这里err(x,y)依公式(6)在所有预设中点坐标λ中获取最小误差:
C7、依最小误差输出中心时间序列c。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410151135.8A CN103942300A (zh) | 2014-04-15 | 2014-04-15 | 一种中心时间序列的动态求解方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410151135.8A CN103942300A (zh) | 2014-04-15 | 2014-04-15 | 一种中心时间序列的动态求解方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN103942300A true CN103942300A (zh) | 2014-07-23 |
Family
ID=51189968
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410151135.8A Pending CN103942300A (zh) | 2014-04-15 | 2014-04-15 | 一种中心时间序列的动态求解方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103942300A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104572888A (zh) * | 2014-12-23 | 2015-04-29 | 浙江大学 | 一种时间序列关联的信息检索方法 |
CN105183836A (zh) * | 2015-09-01 | 2015-12-23 | 南京工程学院 | 一种基于符号特征获取事件大数据信息的算法 |
-
2014
- 2014-04-15 CN CN201410151135.8A patent/CN103942300A/zh active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104572888A (zh) * | 2014-12-23 | 2015-04-29 | 浙江大学 | 一种时间序列关联的信息检索方法 |
CN105183836A (zh) * | 2015-09-01 | 2015-12-23 | 南京工程学院 | 一种基于符号特征获取事件大数据信息的算法 |
CN105183836B (zh) * | 2015-09-01 | 2018-06-15 | 江苏润邦智能车库股份有限公司 | 一种基于符号特征获取事件大数据信息的算法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11586880B2 (en) | System and method for multi-horizon time series forecasting with dynamic temporal context learning | |
Chang et al. | A memory-network based solution for multivariate time-series forecasting | |
Teichgraeber et al. | Extreme events in time series aggregation: A case study for optimal residential energy supply systems | |
Anselin et al. | Interpolation of air quality measures in hedonic house price models: spatial aspects | |
US20230086226A1 (en) | Systems and methods for features engineering | |
GB2590161A (en) | Systems and methods for dynamic demand sensing | |
CN105225149A (zh) | 一种征信评分确定方法及装置 | |
JP7217074B2 (ja) | 電力需給管理システム、電力需給管理方法、および電力需給管理装置 | |
US20200257729A1 (en) | Predicting locations based on transaction records | |
Ma et al. | A novel prediction based portfolio optimization model using deep learning | |
CN103942300A (zh) | 一种中心时间序列的动态求解方法 | |
Wynn et al. | Valuing genetically modified traits in canola using real options | |
Riley | Can mutual fund stars still pick stocks?: A replication and extension of Kosowski, Timmermann, Wermers, and White (2006) | |
CN116579120A (zh) | 一种基于综合法的日风电出力序列场景生成方法 | |
Kumar et al. | A deep clustering framework for load pattern segmentation | |
Boccanfuso et al. | Parametric and nonparametric income distribution estimators in CGE micro-simulation modeling | |
Shu et al. | Multistep short‐term wind speed prediction with rank pooling and fast Fourier transformation | |
Mulewa et al. | A novel Bagged-CNN architecture for short-term wind power forecasting | |
Ohlenburg et al. | Fewer Questions, More Answers: Truncated Early Stopping for Proxy Means Testing | |
Pumjaroen et al. | How to obtain a better result of updating the IO table from the MTT method | |
Horvathova et al. | Overview of business bankruptcy models | |
Mokrišová et al. | Domain Knowledge Features versus LASSO Features in Predicting Risk of Corporate Bankruptcy—DEA Approach | |
CN117829882B (zh) | 一种数据要素评价系统 | |
Lakshmi et al. | An Enhanced Regression Technique for House Price Prediction | |
ALAIMO DI LORO et al. | Hidden Markov Model estimation via Particle Gibbs |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20140723 |