CN102360384A - 基于多时序因子和序列因子支配的多时间序列查询方法 - Google Patents

基于多时序因子和序列因子支配的多时间序列查询方法 Download PDF

Info

Publication number
CN102360384A
CN102360384A CN2011103124036A CN201110312403A CN102360384A CN 102360384 A CN102360384 A CN 102360384A CN 2011103124036 A CN2011103124036 A CN 2011103124036A CN 201110312403 A CN201110312403 A CN 201110312403A CN 102360384 A CN102360384 A CN 102360384A
Authority
CN
China
Prior art keywords
sequence
time
mts
many
factor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2011103124036A
Other languages
English (en)
Other versions
CN102360384B (zh
Inventor
王朝坤
潘鹏
徐亚军
施炜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tsinghua University
Original Assignee
Tsinghua University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tsinghua University filed Critical Tsinghua University
Priority to CN 201110312403 priority Critical patent/CN102360384B/zh
Publication of CN102360384A publication Critical patent/CN102360384A/zh
Application granted granted Critical
Publication of CN102360384B publication Critical patent/CN102360384B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Data Exchanges In Wide-Area Networks (AREA)
  • Separation Of Gases By Adsorption (AREA)

Abstract

本发明涉及一种基于多时序因子和序列因子支配的多时间序列查询方法,属于计算机数据处理技术领域。首先定义两个单时间序列之间的序列因子支配关系和两个多时间序列之间的多时序因子和序列因子的支配关系:然后计算多时间序列的数值和组成多时间序列的每个单时间序列的数值,最后根据各多时间序列的输出值和支配关系,输出查询结果。本发明方法可以在多时间序列上进行查询,而不必使用由多时间序列提取得到的特征值。所以直接对多时间序列进行查询的效果要好于对特征值查询。本方法直接使用原始数据,避免了提取特征值等过程带来的额外代价,并通过限制时间窗口、计算各多时间序列的最大、最小输出值来提高查询效率,大大加快了查询的速度。

Description

基于多时序因子和序列因子支配的多时间序列查询方法
技术领域
本发明涉及一种基于多时序因子和序列因子支配的多时间序列查询方法,属于计算机数据处理技术领域。
背景技术
时间序列是现实生活中大量使用的一类数据,在自然界和人类社会中都有着极广泛的应用,如地震波采样等。时间序列可分为多时间序列和单时间序列。单时间序列仅仅从一个角度描述对象,而多时间序列则从多个角度描述对象本身,其数据信息会比单时间序列丰富得多。
在有些领域中,虽然目前并没有使用基于多时序因子和序列因子支配的多时间序列查询方法,但是它们也适用这种方法,而且效果会更好。以土木业的地震最不利选波为例,目前的做法是对地震波的特征值进行Top-k查询,或直接人工观察选波。人工观察选波依赖于人的主观认识和选波经验,且仅适合于在少量地震波上选波;Top-k查询是在地震波特征值上进行查询,但特征值会受经验和模型所限制,因此查询结果会出现不少的误解和漏解。地震波谱(多时间序列)就没有这样的约束限制,所以对地震波谱进行查询,其查询效果(减少漏解、误解等)会好得多。因此最不利选波更适合使用基于多时序因子和序列因子支配的多时间序列查询方法。
发明内容
本发明的目的是提出一种基于多时序因子和序列因子支配的多时间序列查询方法,通过对多时间序列进行多时序因子和序列因子支配的比较,从而得到查询的结果。
本发明提出的基于多时序因子和序列因子支配的多时间序列查询方法,包括以下步骤:
(1)定义两个单时间序列之间的序列因子支配关系:
设一个单时间序列中的每个值对应一个时戳,一个单时间序列TS为一个按时戳顺序排列的序列,即一个单时间序列TS=[v1,v2,...,vn],一个单时间序列中共有|TS|=n个时戳,并且t1<t2<...<tn,用TS[t]表示TS在时戳t时的数值,设定一个序列因子k,0<k≤1,对于两个单时间序列TS和TS’,若
Figure BDA0000098725600000011
|T|≥k|w|,且满足条件(1)TS[t]≥TS’[t]和(2)
Figure BDA0000098725600000013
TS[t]>TS’[t],则单时间序列TS在w上为序列因子支配单时间序列TS’,记作
Figure BDA0000098725600000014
其中w为时间窗口,
Figure BDA0000098725600000015
(2)定义两个多时间序列之间的多时序因子和序列因子的支配关系:
设多时间序列MTS由m个单时间序列组成:MTS={TS1,TS2,...,TSm},其中m≥1,对于两个多时间序列MTS和MTS’,设定序列因子k和多时序因子k’,0<k,k’≤1,以及时间窗口w,若满足条件
Figure BDA0000098725600000021
或MTS[i].w=MTS’[i].w}|≥k’m,和(2)
Figure BDA0000098725600000022
使得
Figure BDA0000098725600000023
则多时间序列MTS在时间窗口w上为多时序因子和序列因子支配多时间序列MTS’,记作
Figure BDA0000098725600000024
其中|MTS|=|MTS’|=m,MTS[i].w和MTS’[i].w分别为多时间序列MTS和多时间序列MTS’中第i个单时间序列在时间窗口w中的子序列,当MTS[i].w和MTS’[i].w的每个互相对应时戳的值相等时,MTS[i].w和MTS’[i].w相等;
(3)计算多时间序列的数值和组成多时间序列的每个单时间序列的数值:
(3-1)从组成多时间序列的各单时间序列中分别提取多个最大的时戳数值,将多个最大时戳数值作为单调递增函数的输入,得到一个第一输出值,建立各单时间序列与该第一输出值之间的对应关系,一个第一输出值对应一个单时间序列,一个多时间序列同时对应多个第一输出值;将该多个第一输出值作为上述单调递增函数的输入,得到一个最大输出值,该最大输出值与该多时间序列相对应;
(3-2)从组成多时间序列的各单时间序列中分别提取多个最小的时戳数值,将多个最小时戳数值作为单调递增函数的输入,得到一个第二输出值,建立各单时间序列与该第二输出值之间的对应关系,一个第二输出值对应一个单时间序列,一个多时间序列同时对应多个第二输出值;将该多个第二输出值作为上述单调递增函数的输入,得到一个最小输出值,该最小输出值与该多时间序列相对应;
(3-3)重复步骤(3-1)和步骤(3-2),得到多个多时间序列中每个多时间序列的最大输出值和最小输出值;
(4)根据多时间序列的输出值,对每任意两个多时间序列的多时序因子和序列因子支配关系进行判断,若多时间序列MTS的最小输出值大于或等于多时间序列MTS’的最大输出值,则多时间序列MTS不被其他多时间序列MTS’所支配,并输出该多时间序列MTS;若多时间序列MTS的最小输出值小于多时间序列MTS’的最大输出值,则根据两个多时间序列之间的多时序因子和序列因子的支配关系作进一步判断,若多时间序列MTS不被其他多时间序列MTS’所支配,则输出该多时间序列MTS,若多时间序列MTS被其他多时间序列MTS’所支配,则不输出多时间序列MTS。
本发明提出的基于多时序因子和序列因子支配的多时间序列处理方法,其优点是:
1、本发明方法可以在多时间序列上进行查询,而不必使用由多时间序列提取得到的特征值。因为经过采样得到的原始数据往往是以多时间序列的形式存储。原始数据含有较全面的数据信息,而经过提取得到的特征值,往往会损失一些数据信息。例如在地震波中,由于人们现在还无法完全认识地震波,因此提取得到的特征值并不能完全地反映原始的地震波,即在特征提取过程中损失了部分数据信息。所以直接对多时间序列进行查询的效果要好于对特征值查询。
2、本发明方法由于直接使用原始数据(多时间序列的形式),避免了提取特征值等过程带来的额外代价,并通过限制时间窗口、计算各多时间序列的最大、最小输出值来提高查询效率,大大加快了查询的速度。
具体实施方式
本发明方法假定数值之间的比较,以取较大者为优。
本发明提出的基于多时序因子和序列因子支配的多时间序列处理方法,包括以下步骤:
(1)定义两个单时间序列之间的序列因子支配关系:
设一个单时间序列中的每个值对应一个时戳,一个单时间序列TS为一个按时戳顺序排列的序列,即一个单时间序列TS=[v1,v2,...,vn],一个单时间序列中共有|TS|=n个时戳,并且t1<t2<...<tn,用TS[t]表示TS在时戳t时的数值,设定一个序列因子k,0<k≤1,对于两个单时间序列TS和TS’,若
Figure BDA0000098725600000031
|T|≥k|w|,且满足条件(1)
Figure BDA0000098725600000032
TS[t]≥TS’[t]和(2)
Figure BDA0000098725600000033
TS[t]>TS’[t],则单时间序列TS在w上为序列因子支配单时间序列TS’,记作其中w为单时间序列时间窗口,
Figure BDA0000098725600000035
(2)定义两个多时间序列之间的多时序因子和序列因子的支配关系:
设多时间序列MTS由m个单时间序列组成:MTS={TS1,TS2,...,TSm},其中m≥1,对于两个多时间序列MTS和MTS’,设定序列因子k和多时序因子k’,0<k,k’≤1,以及每个单时间序列的时间窗口w,若满足条件
Figure BDA0000098725600000036
或MTS[i].w=MTS’[i].w}|≥k’m,和(2)使得
Figure BDA0000098725600000038
则多时间序列MTS在单时间序列的时间窗口w上为多时序因子和序列因子支配多时间序列MTS’,记作
Figure BDA0000098725600000039
Figure BDA00000987256000000310
其中|MTS|=|MTS’|=m,MTS[i].w和MTS’[i].w分别为多时间序列MTS和多时间序列MTS’中第i个单时间序列在时间窗口w中的子序列,当MTS[i].w和MTS’[i].w的每个互相对应时戳的值相等时,MTS[i].w和MTS’[i].w相等;
(3)计算多时间序列的数值和组成多时间序列的每个单时间序列的数值:
(3-1)从组成多时间序列的各单时间序列中分别提取多个最大的时戳数值,将多个最大时戳数值作为单调递增函数的输入,得到一个第一输出值,建立各单时间序列与该第一输出值之间的对应关系,一个第一输出值对应一个单时间序列,一个多时间序列同时对应多个第一输出值;将该多个第一输出值作为上述单调递增函数的输入,得到一个最大输出值,该最大输出值与该多时间序列相对应;
(3-2)从组成多时间序列的各单时间序列中分别提取多个最小的时戳数值,将多个最小时戳数值作为单调递增函数的输入,得到一个第二输出值,建立各单时间序列与该第二输出值之间的对应关系,一个第二输出值对应一个单时间序列,一个多时间序列同时对应多个第二输出值;将该多个第二输出值作为上述单调递增函数的输入,得到一个最小输出值,该最小输出值与该多时间序列相对应;
(3-3)重复步骤(3-1)和步骤(3-2),得到多个多时间序列中每个多时间序列的最大输出值和最小输出值;
(4)根据多时间序列的输出值,对每任意两个多时间序列的多时序因子和序列因子支配关系进行判断,若多时间序列MTS的最小输出值大于或等于多时间序列MTS’的最大输出值,则多时间序列MTS不被其他多时间序列MTS’所支配,并输出该多时间序列MTS;若多时间序列MTS的最小输出值小于多时间序列MTS’的最大输出值,则根据两个多时间序列之间的多时序因子和序列因子的支配关系作进一步判断,若多时间序列MTS不被其他多时间序列MTS’所支配,则输出该多时间序列MTS,若多时间序列MTS被其他多时间序列MTS’所支配,则不输出多时间序列MTS。
本发明方法中,首先定义多时间序列之间的多时序因子和序列因子支配关系。建立与多时间序列相对应的数值索引。
给定了多时间序列数据集dataSet,序列因子k,多时序因子k’和时间窗口w,为每一个多时间序列MTS∈dataSet计算其对应的数值索引,包括:
对于MTS的每个单时间序列TS,计算第一输出值B(k|w|,TS)和第二输出值W(k|w|,TS)。其中,W(k|w|,TS)=∑x∈Worst(kw,TS)F(x),B(k|w|,TS)=∑x∈Best(kw,TS)F(x),|w|表示时间窗口w中包含的时戳数,Worst(k|w|,TS)表示单时间序列TS在w中的子序列中最小的k|w|个时戳数值,Best(k|w|,TS)表示单时间序列TS在w中的子序列中最大的k|w|个时戳数值,F(x)为某个单调递增函数,如F(x)=sgn(x)ln(|x|+1),sgn(x)为符号函数,定义为:
sgn ( x ) = | x | / x , x ≠ 0 ; 0 , x = 0 . .
对于多时间序列MTS,包含了m个单时间序列,因此多时间序列MTS包含m个第一输出值B(k|w|,TS)和m个第二输出值W(k|w|,TS),计算最小输出值W(k’m,MTS)和最大输出值B(k’m,MTS)。其中,W(k’m,MTS)=∑x∈Worst(k’m,MTS)F(x),B(k’m,MTS)=∑x∈Best(k’m, MTS)F(x),Worst(k’m,MTS)表示多时间序列MTS中最小的k’m个第二输出值W(k|w|,TS),Best(k’m,MTS)表示多时间序列MTS中最大的k’m个第一输出值B(k|w|,TS),F(x)为单调递增函数。

Claims (1)

1.一种基于多时序因子和序列因子支配的多时间序列处理方法,其特征在于该方法包括以下步骤:
(1)定义两个单时间序列之间的序列因子支配关系:
设一个单时间序列中的每个值对应一个时戳,一个单时间序列TS为一个按时戳顺序排列的序列,即一个单时间序列TS=[v1,v2,...,vn],一个单时间序列中共有|TS|=n个时戳,并且t1<t2<...<tn,用TS[t]表示TS在时戳t时的数值,设定一个序列因子k,0<k≤1,对于两个单时间序列TS和TS’,若
Figure FDA0000098725590000011
|T|≥k|w|,且满足条件(1)
Figure FDA0000098725590000012
TS[t]≥TS’[t]和(2)TS[t]>TS’[t],则单时间序列TS在w上为序列因子支配单时间序列TS’,记作
Figure FDA0000098725590000014
其中w为时间窗口,
Figure FDA0000098725590000015
(2)定义两个多时间序列之间的多时序因子和序列因子的支配关系:
设多时间序列MTS由m个单时间序列组成:MTS={TS1,TS2,...,TSm},其中m≥1,对于两个多时间序列MTS和MTS’,设定序列因子k和多时序因子k’,0<k,k’≤1,以及每个单时间序列的时间窗口w,若满足条件或MTS[i].w=MTS’[i].w}|≥k’m,和(2)
Figure FDA0000098725590000017
使得则多时间序列MTS在时间窗口w上为多时序因子和序列因子支配多时间序列MTS’,记作其中|MTS|=|MTS’|=m,MTS[i].w和MTS’[i].w分别为多时间序列MTS和多时间序列MTS’中第i个单时间序列在时间窗口w中的子序列,当MTS[i].w和MTS’[i].w的每个互相对应时戳的值相等时,MTS[i].w和MTS’[i].w相等;
(3)计算多时间序列的数值和组成多时间序列的每个单时间序列的数值:
(3-1)从组成多时间序列的各单时间序列中分别提取多个最大的时戳数值,将多个最大时戳数值作为单调递增函数的输入,得到一个第一输出值,建立各单时间序列与该第一输出值之间的对应关系,一个第一输出值对应一个单时间序列,一个多时间序列同时对应多个第一输出值;将该多个第一输出值作为上述单调递增函数的输入,得到一个最大输出值,该最大输出值与该多时间序列相对应;
(3-2)从组成多时间序列的各单时间序列中分别提取多个最小的时戳数值,将多个最小时戳数值作为单调递增函数的输入,得到一个第二输出值,建立各单时间序列与该第二输出值之间的对应关系,一个第二输出值对应一个单时间序列,一个多时间序列同时对应多个第二输出值;将该多个第二输出值作为上述单调递增函数的输入,得到一个最小输出值,该最小输出值与该多时间序列相对应;
(3-3)重复步骤(3-1)和步骤(3-2),得到多个多时间序列中每个多时间序列的最大输出值和最小输出值;
(4)根据多时间序列的输出值,对每任意两个多时间序列的多时序因子和序列因子支配关系进行判断,若多时间序列MTS的最小输出值大于或等于多时间序列MTS’的最大输出值,则多时间序列MTS不被其他多时间序列MTS’所支配,并输出该多时间序列MTS;若多时间序列MTS的最小输出值小于多时间序列MTS’的最大输出值,则根据两个多时间序列之间的多时序因子和序列因子的支配关系作进一步判断,若多时间序列MTS不被其他多时间序列MTS’所支配,则输出该多时间序列MTS,若多时间序列MTS被其他多时间序列MTS’所支配,则不输出多时间序列MTS。
CN 201110312403 2011-10-14 2011-10-14 基于多时序因子和序列因子支配的多时间序列查询方法 Active CN102360384B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 201110312403 CN102360384B (zh) 2011-10-14 2011-10-14 基于多时序因子和序列因子支配的多时间序列查询方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 201110312403 CN102360384B (zh) 2011-10-14 2011-10-14 基于多时序因子和序列因子支配的多时间序列查询方法

Publications (2)

Publication Number Publication Date
CN102360384A true CN102360384A (zh) 2012-02-22
CN102360384B CN102360384B (zh) 2013-05-01

Family

ID=45585713

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 201110312403 Active CN102360384B (zh) 2011-10-14 2011-10-14 基于多时序因子和序列因子支配的多时间序列查询方法

Country Status (1)

Country Link
CN (1) CN102360384B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106503827A (zh) * 2016-09-21 2017-03-15 国网河北省电力公司 一种多时序混合整数规划问题的处理方法及装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101482944A (zh) * 2000-11-09 2009-07-15 Spss公司 构建时间序列模型的系统与方法
CN101551465A (zh) * 2008-04-03 2009-10-07 中国石油天然气集团公司 一种自适应识别和消除地震勘探单频干扰的方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101482944A (zh) * 2000-11-09 2009-07-15 Spss公司 构建时间序列模型的系统与方法
CN101551465A (zh) * 2008-04-03 2009-10-07 中国石油天然气集团公司 一种自适应识别和消除地震勘探单频干扰的方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
《计算机研究与发展》 20111031 徐亚军等 多时间序列k'?k-支配Skyline查询处理 1860-1870 1 第48卷, 第10期 *
徐亚军等: "多时间序列k′?k-支配Skyline查询处理", 《计算机研究与发展》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106503827A (zh) * 2016-09-21 2017-03-15 国网河北省电力公司 一种多时序混合整数规划问题的处理方法及装置

Also Published As

Publication number Publication date
CN102360384B (zh) 2013-05-01

Similar Documents

Publication Publication Date Title
CN101561813B (zh) 一种Web环境下的字符串相似度的分析方法
WO2006076312A3 (en) Method for improved image segmentation
CN109065046A (zh) 语音唤醒的方法、装置、电子设备及计算机可读存储介质
CN102521617A (zh) 一种利用稀疏基的协同显著性检测方法
CN113590818B (zh) 一种基于cnn与gru及knn融合的政务文本数据分类方法
CN104484432A (zh) 基于四元数指数矩的彩色图像检索方法
CN105912739A (zh) 一种相似图片检索系统及其方法
CN106971377A (zh) 一种基于稀疏与低秩矩阵分解的单幅图像去雨方法
CN102360384B (zh) 基于多时序因子和序列因子支配的多时间序列查询方法
CN105389778A (zh) 一种基于字典匹配的图像超分辨率重建方法及装置
CN111340645A (zh) 一种针对电力负荷的改进关联分析方法
CN105448290A (zh) 一种变帧率的音频特征提取方法
CN104573081A (zh) 一种基于sns的个人社会关系数据挖掘方法
CN105677850A (zh) 一种基于神经网络模型的上下文感知音乐推荐方法
CN105469601A (zh) 一种基于lzw编码的道路交通空间数据压缩方法
CN103744885A (zh) 一种基于子块的融合颜色和方向特征的图像检索方法
CN107071181A (zh) 一种自动匹配通讯联系人的方法
CN104657619A (zh) 一种评价风速周期性的方法及系统
CN112685468B (zh) 生态系统属性组分组成结构长期演变图形表达方法
CN110083864A (zh) 一种基于经验模态分解的短期风速预测方法
CN109344405A (zh) 一种基于tf-idf思想及神经网络的相似性处理方法
Seo et al. Multifractal intensity in dynamical behaviors of multifractals
CN117134777B (zh) 一种定位数据的智能压缩方法
Das Frequency Estimation of Extreme Hydrological Events by a Subsampling Procedure Integrated with Regional Concept
CN103853911A (zh) 一种基于vikor的区间数多指标决策方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant