CN112506933B - 高速率多通道时间序列数据存储方法 - Google Patents

高速率多通道时间序列数据存储方法 Download PDF

Info

Publication number
CN112506933B
CN112506933B CN202011499196.5A CN202011499196A CN112506933B CN 112506933 B CN112506933 B CN 112506933B CN 202011499196 A CN202011499196 A CN 202011499196A CN 112506933 B CN112506933 B CN 112506933B
Authority
CN
China
Prior art keywords
data
time segment
segment length
time
data acquisition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011499196.5A
Other languages
English (en)
Other versions
CN112506933A (zh
Inventor
周振威
何世烈
黄云
刘俊斌
时林林
孟苓辉
俞鹏飞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Electronic Product Reliability and Environmental Testing Research Institute
Original Assignee
China Electronic Product Reliability and Environmental Testing Research Institute
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Electronic Product Reliability and Environmental Testing Research Institute filed Critical China Electronic Product Reliability and Environmental Testing Research Institute
Priority to CN202011499196.5A priority Critical patent/CN112506933B/zh
Publication of CN112506933A publication Critical patent/CN112506933A/zh
Application granted granted Critical
Publication of CN112506933B publication Critical patent/CN112506933B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2291User-Defined Types; Storage management thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2474Sequence data queries, e.g. querying versioned data

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Fuzzy Systems (AREA)
  • Debugging And Monitoring (AREA)
  • Recording Measured Values (AREA)

Abstract

本发明公开了一种高速率多通道时间序列数据存储方法,包括:当数据采集达到第三时间片段长度时,对数据进行暂时存储;判断数据采集是否达到设定的数据采集总时长或数据总存储量;如果为是,则停止数据采集;如果为否,则每间隔第四时间片段长度进行异常检测;如果结果为正常,则将暂时存储的数据更新为最近的第三时间片段长度的数据,继续进行数据采集并重复是否停止数据采集的判断和异常检测,并且每当采集的数据量达到第一时间片段长度时,存储第二时间片段长度的数据,并计算数据的指标特征并存储;如果结果为异常,则继续采集和存储第五时间片段长度的数据,进行告警提示并停止数据采集。本发明能够有效减少数据存储空间,提高数据采集质量。

Description

高速率多通道时间序列数据存储方法
技术领域
本发明涉及数据存储方法,尤其涉及一种高速率多通道时间序列数据存储方法。
背景技术
在航空、航天、船舶、轨道交通、电力等领域中,长时间高速率多通道时间序列特征数据十分普遍。这些工业设备系统正常运行或试验过程中,产生海量实时状态监测数据,数据采样通道数量高达几十个甚至上百个,为了捕捉信号特征经常需要匹配更高的采样率,例如1M或更高的采样频率,因此长时间连续数据采集会带来诸多问题。例如,存储空间不够用,几百GB甚至TB级别的硬盘很快就写满了,不得不人工介入,停止采集待更换上新的存储介质才能继续,不但浪费人力,且破环数据采集的连续性。例如,长时间连续数据采集则产生了海量的时间序列数据,后续的数据分析需要遍历整个数据库才能从中提取数据并建立数据变化趋势,耗费大量时间,增加了数据分析难度。举一个典型例子,纹波作为DC-DC电源性能退化的关键特征指标之一,通常需要1M以上采用频率才能较为准确捕捉该特征,同时该特征是一个缓慢变化量,工业领域工程师较为关注的是纹波的长时间退化过程及其故障发生时间,因此既需要短时高速率采样同时又不必对每个变化不显著的数据片段进行全部保存。因此,如何开展高速率多通道时间序列数据的特征提取和存储等工作是一项重要工作。
现有技术之一是多源时间序列数据压缩存储方法,包含以下步骤:对各部署对象分组;将各部署对象组划分内部组;在内存中为每个内部组分配一个用于缓存的内存文件;在收到某量测点的时间序列数据时,进行第一级有损压缩,并根据该量测点所属的部署对象组和内部组,找到其对应的内存文件,将压缩后的数据缓存到内存文件中;在内存文件写满或达到预设的时间限制时,将内存文件映射到硬盘,进行第二级无损压缩,将压缩后的数据块存储到关系型数据库中。
该多源时间序列数据采用压缩存储方法受制于压缩比率和压缩速率,以及关系型数据库的实时性、访问查询效率限制。在数据采样通道数量非常多(100个以上)且采样率较高(1M以上),该方法难以满足长时间高速率多通道时间序列数据的快速压缩和存储需求。
现有技术之二是一种基于分布式列存储的时间序列数据存储方法,使时间序列数据能够适应分布式列存储的存储方式。该方法使用由行键和列组成的系数表存储测点记录数据,行键包含了尽可能多的检索信息,每一行记录把某个时间段的分散采集的数据合在一起,同时设置了名称映射表存储名称信息。
该基于分布式列存储的时间序列数据存储方法受制于存储速度和检索查询效率等限制,难以满足长时间高速率多通道时间序列数据的快速压缩和存储需求。同时,一般而言,复杂工业设备系统长时间处于正常运行状态或者试验运行状态,相近时刻的数据变化较小,对所有监测的时间序列数据进行存储,对设备异常检测和长时间退化趋势建模作用不显著。当前压缩存储通常只考虑最大值、最小值和均值等特征指标存储,以便于检索查询,难以满足工业设备多源信号的多特征提取需要。
发明内容
本发明针对现有技术中存在的问题,提供一种高速率多通道时间序列数据存储方法,能够有效减少数据存储空间,提高数据采集质量,为后续故障复现和分析提供便利。
为了实现上述目的,本发明提供了一种高速率多通道时间序列数据存储方法,包括:步骤S1:设定参数并开始数据采集,所述参数包括数据采集总时长、数据总存储量、第一时间片段长度T1、第二时间片段长度T2、第三时间片段长度T3、第四时间片段长度T4、第五时间片段长度T5;步骤S2:当数据采集达到第三时间片段长度T3时,对该第三时间片段长度T3的数据进行暂时存储;步骤S3:判断数据采集是否达到设定的数据采集总时长或数据总存储量;如果步骤S3中判断为是,则执行步骤S8:停止数据采集;如果判断为否,则执行步骤S4:每间隔第四时间片段长度T4,进行异常检测;如果步骤S4中的异常检测结果为正常,则执行步骤S5:将暂时存储的数据更新为最近的第三时间片段长度T3的数据,继续进行数据采集并重复执行步骤S3和S4,并且每当采集的数据量达到第一时间片段长度T1时,执行步骤S6:存储第二时间片段长度T2的数据,并计算第二时间片段长度T2数据的指标特征并存储;如果步骤S4中的异常检测结果为异常,则执行步骤S7:继续采集和存储第五时间片段长度T5的数据,进行告警提示并执行步骤S8:停止数据采集。
优选地,所述特征指标包括均值、最大值、最小值、方差、标准差、峰峰值、均方根、峰值因子、峭度、偏斜度、频率、幅值中的任意一个或多个。
优选地,通过对所述数据采集总时长进行等间隔划分得到第一时间片段长度T1。
优选地,所述第二时间片段长度T2位于所述第一时间片段长度T1的最末端。
优选地,因此所述第一时间片段长度T1、第二时间片段长度T2、第三时间片段长度T3、第五时间片段长度T5满足如下关系式:
其中,T表示数据采集总时长,C表示存储数据的硬盘容量大小,k表示数据总存储量占硬盘容量的比例,k为取值在0至1之间的数值,N表示数据通道数目,S表示采样频率,R表示采集数据的变化速率,M表示特征指标的个数,C0表示特征指标占用的存储量。
优选地,所述第一时间片段长度T1为30分钟,所述第二时间片段长度T2为1秒钟。
优选地,所述第三时间片段长度T3为45分钟,所述第四时间片段长度为1分钟。
优选地,所述第五时间片段长度T5为2.5小时。
本发明实施方式还提供一种计算机程序产品,其被设置用于执行上述任一项所述的方法。
本发明实施方式还提供一种计算机可读存储介质,具有上述的计算机程序产品。
本发明的高速率多通道时间序列数据存储方法能够有效减少数据存储空间,提高数据采集质量,为后续故障复现和分析提供便利。
附图说明
下面,将结合附图对本发明的优选实施方式进行进一步详细的说明,其中:
图1为本发明一种实施方式的高速率多通道时间序列数据存储方法的流程图;
图2为本发明一种实施方式的第一~第四时间片段长度T1-T4的设定示例图。
具体实施方式
为了使本领域的技术人员更好地理解本发明的技术方案,下面将结合附图对本发明作进一步的详细介绍。
本发明的高速率多通道时间序列数据存储方法的基本思路为,在数据检测结果为正常时,删除较大时间片段的数据,只保存较小时间片段数据,并对较小时间片段数据进行特征提取,可实现长时间高速率多通道时间序列数据的删减,以一定的原貌保存数据并进行多个特征提取,减少数据存储空间,提高数据采集质量,为长时间数据变化趋势建模及故障预测提供良好数据条件。在数据检测结果为异常时,则对故障前后一段时间内的数据进行保存,可为后续故障复现和分析提供便利。以下对本发明一种实施方式的高速率多通道时间序列数据存储方法进行详细说明。
图1为本发明一种实施方式的高速率多通道时间序列数据存储方法的流程图。如图1所示,本发明一种实施方式的高速率多通道时间序列数据存储方法包括步骤S1-S8。
在步骤S1中,设定参数并开始数据采集,所述参数包括数据采集总时长、数据总存储量、第一时间片段长度T1、第二时间片段长度T2、第三时间片段长度T3、第四时间片段长度T4、第五时间片段长度T5。
在本实施方式中,步骤S1中设定的数据采集总时长和数据总存储量可根据实际需要来设定。第一时间片段长度T1、第二时间片段长度T2、第三时间片段长度T3、第四时间片段长度T4、第五时间片段长度T5可如下设定。
(1)第一时间片段长度T1
图2为本发明一种实施方式的第一~第四时间片段长度T1-T4的设定示例图。图2中的30分钟是第一时间片段长度T1的示例,一般地,可以通过对数据采集总时长进行等间隔划分得到第一时间片段长度T1,例如图2中的30分钟,也就是将每30分钟划分为第一时间片段长度T1,作为一个较大的时间片段。
(2)第二时间片段长度T2
在每个较大的时间片段中采集和存储一个较小的时间片段数据,可以针对每一个较大时间片段,即第一时间片段长度T1的最末端数据,作为用于数据采集和存储的较小时间片段,即第一时间片段长度T2,例如图2中的1秒钟,也就是将较大时间片段T1中的最后1秒钟数据进行全部采集和存储。
(3)第三时间片段长度T3
暂时保存最近一段时间的数据,该一段时间为第三时间片段长度T3,例如图2中的45分钟,也就是将最近的45分钟数据进行暂时存储。随着数据采集工作不断进行,“最新”的暂存数据不断覆盖“最早”的暂存数据,以保持暂存的数据量维持在一个固定水平。第三时间片段长度T3可能大于、等于或小于第一时间片段长度T1,需要结合硬盘存储容量、采样速率、通道数量等因素进行确定。
(4)第四时间片段长度T4
对暂存的“最新”的数据进行一次异常检测,以识别采集的数据是否处于异常状态,进行异常检测的时间段为第四时间片段长度T4,例如图2中的1分钟。第四时间片段长度T4可以处于紧接第三时间片段长度T3之后,也即首次异常检测的时间发生在数据采集时间大于第三时间片段长度T3之后。
(5)第五时间片段长度T5
第五时间片段长度T5用于对发生异常前后的数据进行存储,可根据实际需要进行设定,例如可以设定为2.5小时。
另外,上述时间片段长度T1、T2、T3、T4和T5的取值大小还需要考虑以下多个方面的因素:第一,存储数据的硬盘容量大小C。通常情况下,数据总存储量不超过硬盘容量的一定比例k,其中k为取值在0至1之间的数值,例如90%。第二,采集数据总时长T。第三,数据通道数目N和采样频率S。第四,采集数据的变化速率R。第五,较小时间片段数据(第二时间片段长度T2)的特征指标个数M及其占用的存储量C0。考虑到在每一个较大时间片段(第一时间片段长度T1)内采集的较小时间片段T2的数据不断累积,以及为异常数据预留存储空间,因此T1、T2、T3、T4、T5满足如下关系式:
上述表达式中,表示/>上整数,/>表示对第二时间片段长度T2的存储量,/>表示对第二时间片段长度T2的特征指标的存储量,(T3+T5)×S×N表示异常状态数据的存储量。
在步骤S1中完成参数设定并开始数据采集后,在步骤S2中,当数据采集达到第三时间片段长度T3时,对该第三时间片段长度T3的数据进行暂时存储,然后进入步骤S3。在步骤S3中,判断数据采集是否达到设定的数据采集总时长或数据总存储量,通过该判断决定终止采集和存储。
即,如果步骤S3中判断为是,则执行步骤S8:停止数据采集;如果判断为否,则执行步骤S4:每间隔第四时间片段长度T4,进行异常检测。异常检测可以通过计算故障检测指标来进行。
如果步骤S4中的异常检测结果为正常,即,检测指标正常,则执行步骤S5:将暂时存储的数据更新为最近的第三时间片段长度T3的数据,继续进行数据采集并重复执行步骤S3和S4,与此同时,每当采集的数据量达到第一时间片段长度T1时,执行步骤S6:存储第二时间片段长度T2的数据,并计算第二时间片段长度T2数据的指标特征并存储。
其中,第二时间片段长度T2数据的特征指标包括均值、最大值、最小值、方差、标准差、峰峰值、均方根、峰值因子、峭度、偏斜度、频率、幅值中的任意一个或多个。
如果步骤S4中的异常检测结果为异常,则执行步骤S7:继续采集和存储第五时间片段长度T5的数据,进行告警提示并执行步骤S8:停止数据采集。
即,当异常检测结果为异常时,共计存储异常发生前的第三时间片段长度T3的数据以及异常发生后的第五时间片段长度T5的数据,能够为后续故障复现和分析提供便利。
综上所述,本发明实施方式的高速率多通道时间序列数据存储方法可对缓慢变化的高速率多通道时间序列进行删减,以一定的原貌得以保存并进行多种特征指标提取,减少数据存储空间,提高数据采集质量,为长时间数据变化趋势建模及故障预测提供良好数据条件。同时,该方法还可对设备发生故障前后一段时间内的数据进行保存,可为后续故障复现和分析提供便利。
此外,本发明实施方式还提供一种计算机程序产品,其被设置用于执行本发明实施方式的道岔系统健康评估方法。另外,本发明实施方式还提供一种具有该计算机程序产品的计算机可读存储介质。
以上只通过说明的方式描述了本发明的某些示范性实施例,毋庸置疑,对于本领域的普通技术人员,在不偏离本发明的精神和范围的情况下,可以用各种不同的方式对所描述的实施例进行修正。因此,上述附图和描述在本质上是说明性的,不应理解为对本发明权利要求保护范围的限制。

Claims (9)

1.一种高速率多通道时间序列数据存储方法,其特征在于,包括:
步骤S1:设定参数并开始数据采集,所述参数包括数据采集总时长、数据总存储量、第一时间片段长度T1、第二时间片段长度T2、第三时间片段长度T3、第四时间片段长度T4、第五时间片段长度T5;
步骤S2:当数据采集达到第三时间片段长度T3时,对该第三时间片段长度T3的数据进行暂时存储;
步骤S3:判断数据采集是否达到设定的数据采集总时长或数据总存储量;
如果步骤S3中判断为是,则执行步骤S8:停止数据采集;如果判断为否,则执行步骤S4:每间隔第四时间片段长度T4,进行异常检测;
如果步骤S4中的异常检测结果为正常,则执行步骤S5:将暂时存储的数据更新为最近的第三时间片段长度T3的数据,继续进行数据采集并重复执行步骤S3和S4,并且每当采集的数据量达到第一时间片段长度T1时,执行步骤S6:存储第二时间片段长度T2的数据,并计算第二时间片段长度T2数据的特征指标并存储;
如果步骤S4中的异常检测结果为异常,则执行步骤S7:继续采集和存储第五时间片段长度T5的数据,进行告警提示并执行步骤S8:停止数据采集,
所述第一时间片段长度T1、第二时间片段长度T2、第三时间片段长度T3、第五时间片段长度T5满足如下关系式:
其中,T表示数据采集总时长,C表示存储数据的硬盘容量大小,k表示数据总存储量占硬盘容量的比例,k为取值在0至1之间的数值,N表示数据通道数目,S表示采样频率,R表示采集数据的变化速率,M表示特征指标的个数,C0表示特征指标占用的存储量。
2.根据权利要求1所述的方法,其特征在于,所述特征指标包括均值、最大值、最小值、方差、标准差、峰峰值、均方根、峰值因子、峭度、偏斜度、频率、幅值中的任意一个或多个。
3.根据权利要求1或2所述的方法,其特征在于,通过对所述数据采集总时长进行等间隔划分得到第一时间片段长度T1。
4.根据权利要求1或2所述的方法,其特征在于,所述第二时间片段长度T2位于所述第一时间片段长度T1的最末端。
5.根据权利要求1或2所述的方法,其特征在于,所述第一时间片段长度T1为30分钟,所述第二时间片段长度T2为1秒钟。
6.根据权利要求1或2所述的方法,其特征在于,所述第三时间片段长度T3为45分钟,所述第四时间片段长度T4为1分钟。
7.根据权利要求1或2所述的方法,其特征在于,所述第五时间片段长度T5为2.5小时。
8.一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1-7中任一项所述的方法的步骤。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1-7中任一项所述的方法的步骤。
CN202011499196.5A 2020-12-17 2020-12-17 高速率多通道时间序列数据存储方法 Active CN112506933B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011499196.5A CN112506933B (zh) 2020-12-17 2020-12-17 高速率多通道时间序列数据存储方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011499196.5A CN112506933B (zh) 2020-12-17 2020-12-17 高速率多通道时间序列数据存储方法

Publications (2)

Publication Number Publication Date
CN112506933A CN112506933A (zh) 2021-03-16
CN112506933B true CN112506933B (zh) 2024-04-12

Family

ID=74922462

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011499196.5A Active CN112506933B (zh) 2020-12-17 2020-12-17 高速率多通道时间序列数据存储方法

Country Status (1)

Country Link
CN (1) CN112506933B (zh)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103914449A (zh) * 2012-12-29 2014-07-09 上海可鲁系统软件有限公司 一种多源时间序列数据压缩存储方法
CN111694879A (zh) * 2020-05-22 2020-09-22 北京科技大学 一种多元时间序列异常模式预测方法及数据采集监控装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105260404B (zh) * 2015-09-22 2019-03-26 北京百度网讯科技有限公司 存储时间序列数据的方法和装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103914449A (zh) * 2012-12-29 2014-07-09 上海可鲁系统软件有限公司 一种多源时间序列数据压缩存储方法
CN111694879A (zh) * 2020-05-22 2020-09-22 北京科技大学 一种多元时间序列异常模式预测方法及数据采集监控装置

Also Published As

Publication number Publication date
CN112506933A (zh) 2021-03-16

Similar Documents

Publication Publication Date Title
CN110647093B (zh) 一种基于大数据分析的电力系统智能监控系统及监控方法
CN110580492A (zh) 一种基于小幅波动检测的轨道电路故障前兆发现方法
CN115757363B (zh) 一种三维地籍数据库的多层级管理方法及系统
CN116914917A (zh) 一种基于大数据的配电柜运行状态监测管理系统
CN109299201B (zh) 基于两阶段聚类的电厂生产子系统异常监测方法及装置
CN112506933B (zh) 高速率多通道时间序列数据存储方法
JP4834580B2 (ja) プラント状態指標管理装置とその実現用コンピュータプログラム
CN117150418B (zh) 基于状态特征故障树的变压器运检周期制定方法和系统
CN107342880A (zh) 异常信息采集方法及系统
CN117277566A (zh) 基于大数据的电网数据分析电力调度系统及方法
CN111460027A (zh) 一种适用于能源互联网的智能动态监测方法及系统
CN110562296A (zh) 一种基于lkj列控运行文件数据连续波动异常识别方法
CN106650154B (zh) 一种基于热力性能指标的核电常规岛设备可靠性监测方法
CN112526558B (zh) 一种局部数据缺失条件下的系统运行工况识别与切割方法
CN112685473B (zh) 一种基于时序分析技术的网络异常流量检测方法及其系统
CN114283503A (zh) 应用于卷烟设备的台时能耗报警控制方法
CN114510517A (zh) 一种面向大型旋转机组健康管理的数据处理方法及系统
CN108228738B (zh) 监测系统实时数据压缩存储方法
CN110726866A (zh) 一种高电压等级的电压合格率监测方法及装置
CN117335571B (zh) 一种配电网智能化故障预警管理系统及方法
CN117172139B (zh) 通信用铜包铝合金电缆的性能测试方法及系统
CN113721207B (zh) 一种基于大数据的雷达时寿件更换的预警方法和系统
CN113626540B (zh) 超短波无线电信号监测数据分析系统
KR101170329B1 (ko) 산업플랜트 설비의 정상 운전값 범위를 취득하는 방법 및 그 장치 및 그 방법을 수행하기 위한 프로그램이 저장된 컴퓨터 판독 가능한 저장매체
CN117056134B (zh) 一种快速备份能耗监测系统中数据库数据的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant