CN105574074A - 一种基于智能电网wams的时序大数据存储方法 - Google Patents

一种基于智能电网wams的时序大数据存储方法 Download PDF

Info

Publication number
CN105574074A
CN105574074A CN201510819767.1A CN201510819767A CN105574074A CN 105574074 A CN105574074 A CN 105574074A CN 201510819767 A CN201510819767 A CN 201510819767A CN 105574074 A CN105574074 A CN 105574074A
Authority
CN
China
Prior art keywords
data
value
wams
key
timestamp
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510819767.1A
Other languages
English (en)
Inventor
王远
蒋英明
郑晓露
周淳
粟勇
史英杰
袁军
吴鹏
陈亮
陈立宇
朱月梅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
CHINA REALTIME DATABASE Co Ltd
Original Assignee
CHINA REALTIME DATABASE Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by CHINA REALTIME DATABASE Co Ltd filed Critical CHINA REALTIME DATABASE Co Ltd
Priority to CN201510819767.1A priority Critical patent/CN105574074A/zh
Publication of CN105574074A publication Critical patent/CN105574074A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2219Large Object storage; Management thereof

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于智能电网WAMS的时序大数据存储方法,属于实时数据库技术领域。本发明根据WAMS场景建立相应的键-值存储模型作为数据模型,以每秒钟每一个测点创建一个存储单元,存储单元的长度根据WAMS数据的采样频率设置,在数据加载过程中采用预写日志技术,对数据中值进行压缩,而键保持不变,根据加载数据的规模、加载频率,对数据进行分库。本发明能够满足于智能电网WAMS场景的时序大数据快速加载、查询,具有很强的高可靠性。

Description

一种基于智能电网WAMS的时序大数据存储方法
技术领域
本发明属于实时数据库技术领域,主要涉及智能电网WAMS的时序大数据存储方法。
背景技术
随着智能电网技术的不断发展,作为智能电网重要支撑的“广域监测系统(WideAreaMeasurementSystem,WAMS)”成为当前研究的热点。电网广域监测系统是通过布局在全网关键节点的同步相量测量单元(PhasorMeasurementUnit,PMU),实现全网的动态监测与控制。
当前,智能电网WAMS主要有以下特点:(1)布局在全网的监测节点数量越来越多;(2)监测节点数据的实时性要求较高,数据产生周期为几十毫秒级;(3)对于系统的稳定性要求较高;(4)历史时序数据量规模越来越大,应用的丰富性和互动性不断增强,对历史数据的访问需求越来越高。而常规的数据存储方法并不能良好地适用于智能电网WAMS之中。因此,有必要针对智能电网WAMS,设计一种与其特点相适应的数据存储方法。
发明内容
本发明目的是:针对智能电网WAMS时序数据的特征,提供一种能够满足于智能电网WAMS场景的时序大数据快速加载查询且具有高可靠的存储方法,解决智能电网WAMS量测节点规模大、数据产生频率高的时序数据的高速加载问题,为实现以时间维度(多个量测节点,在一个时刻上的数据集合)断面数据的快速查询提供基础。
具体地说,本发明是采用以下技术方案实现的,包括以下步骤:
1)根据WAMS场景建立相应的键-值存储模型作为数据模型;
2)以每秒钟每一个测点创建一个存储单元,存储单元的长度根据WAMS数据的采样频率设置;
3)在数据加载过程中采用预写日志技术,首先将数据以日志形式顺序写入磁盘,然后再将数据加载至内存进行存储操作;
4)对数据中值进行压缩,而键保持不变;
5)根据加载数据的规模、加载频率,对数据进行分库。
上述技术方案的进一步特征在于,所述键-值存储模型,其键的结构为<时间戳,测点id>,值的结构为<质量码数组,数据值数组>,表示如下:
Key=<timestamp,id>
Value=<status[UnitLength],valueItem[UnitLength]>
其中,Key代表键,timestamp,代表时间戳,Value代表值,UnitLength代表存储单元的长度,status[UnitLength]为质量码数组,valueItem[UnitLength]为数据值数组;
Key的排序方式为:以时间戳优先排序,其次按测点id排序,时间戳与测点id均采用增序排序;
Value的质量码数组与数据值数组采用一一对应关系,且质量码数据与数据值数组的数据元素按照时间顺序存储。
本发明的有益效果如下:本发明采用键-值存储模型,符合聚簇思想,每个测点每一秒钟建立一个存储单元,从而减少冗余数据的存储;同时采用数据压缩,减少磁盘I/O,进而提升数据加载性能。根据数据测点规模、数据产生频率,建立灵活数据库分库机制,提升数据查询效率。采用预写日志技术,当系统异常崩溃时,可通过日志文件快速恢复数据,提升系统的可靠性。
附图说明
图1是键-值存储模型示意图。
具体实施方式
下面结合实施例并参照附图对本发明作进一步详细描述。
本发明的步骤如下:
1)根据WAMS场景建立相应的键-值(K-V,Key-Value)存储模型作为数据模型。图1给出了K-V存储模型示意。其中的符号含义为:timestamp,存储单元的时间戳,精度到秒级;id,测点id(量测量的惟一标识);status,存储单元的数据质量码数组;valueItem,存储单元的数据值数组;unitLength,存储单元长度。由该图可知,K-V存储模型中key的结构为<时间戳,测点id>,value的结构为<质量码数组,数据值数组>。
其中,模型Key的排序方式:1)时间戳优先排序,其次为测点id;2)时间戳与测点id均采用增序排序。而模型Value的质量码数组与数据值数组采用一一对应关系(即:valueItem[1]、status[1]表示同一条记录的数值与数值的质量码),且质量码数据与数据值数组的数据元素按照时间顺序存储。
2)以每秒钟每一个测点创建一个存储单元,存储单元的长度(UnitLength)根据WAMS数据的采样频率设置。由于WAMS场景的数据产生周期为毫秒级,因此,1≤UnitLength≤1000。
3)在数据加载过程中采用预写日志技术(Write-AheadLogging,WAL),首先将数据以日志形式顺序写入磁盘,然后再将数据加载至内存进行存储操作。当系统崩溃,重新扫描日志文件即可恢复在内存中,未成功写入至数据库数据文件中的那部分数据。由于记录写入日志文件是按照顺序方式写入,因此,在保证系统可靠性的同时也有较高数据加载效率。
4)对数据中值进行压缩,而键保持不变;
5)根据加载数据的规模、加载频率,对数据进行分库。由于任何类型数据库或多或少都存在数据堆积效应,如:关系型数据表的“记录”增加、时序数据库测点时标数据增加均会导致数据查询效率降低,故有必要进行数据分开。按本发明的分库策略,可以灵活的实现数据库分库。例如,某WAMS系统的测点数量为50000、数据采样频率为50Hz。若以一小时分一个库的机制,则每一个数据库的时标数据为90亿条。
以下将根据某区域电网WAMS系统的应用实例来描述本方法的具体实施方式,即:测点规模为50000测点、数据采样频率为50Hz。本方法采用rocksDB键值数据库实现了上述模型。所采用的服务器配置如下:
rocksDB参数配置:
配置项 文件重整方式 线程数
kCompactionStyleLevel IncreaseParallelism(16线程)
K-V存储模型数据类型设置:
字段 timestamp id status[i] valueItem[i]
类型 unsigned int(4Byte) unsigned int(4Byte) char(1Byte) float(4Byte)
根据以上参数的配置,某电网区域的WAMS测点规模:5万个测点、数据产生周期为20毫秒;数据库分库为:每一小时WASM时序数据建立一个rocksDB数据库。同时,根据本方法K-V存储模型设置,时序数据顺序加载与查询的效率如下:
操作类型 加载 查询
效率(万/秒) 2065 16286
如上表,本方法数据加载与查询效率分别为:2065万/秒、16286万/秒。其中,单位“万/秒”表示:每一秒钟加载/查询多少万条数据值。在该实例的场景下,数据加载的需求大于250万/秒(50000测点乘以每秒产生50条数值),因此,本方法高效的满足了WAMS场景时序数据应用需求。
虽然本发明已以较佳实施例公开如上,但实施例并不是用来限定本发明的。在不脱离本发明之精神和范围内,所做的任何等效变化或润饰,同样属于本发明之保护范围。因此本发明的保护范围应当以本申请的权利要求所界定的内容为标准。

Claims (2)

1.一种基于智能电网WAMS的时序大数据存储方法,其特征在于,包括以下步骤:
1)根据WAMS场景建立相应的键-值存储模型作为数据模型;
2)以每秒钟每一个测点创建一个存储单元,存储单元的长度根据WAMS数据的采样频率设置;
3)在数据加载过程中采用预写日志技术,首先将数据以日志形式顺序写入磁盘,然后再将数据加载至内存进行存储操作;
4)对数据中值进行压缩,而键保持不变;
5)根据加载数据的规模、加载频率,对数据进行分库。
2.根据权利要求1所述的基于智能电网WAMS的时序大数据存储方法,其特征在于,所述键-值存储模型,其键的结构为<时间戳,测点id>,值的结构为<质量码数组,数据值数组>,表示如下:
Key=<timestamp,id>
Value=<status[UnitLength],valueItem[UnitLength]>
其中,Key代表键,timestamp,代表时间戳,Value代表值,UnitLength代表存储单元的长度,status[UnitLength]为质量码数组,valueItem[UnitLength]为数据值数组;
Key的排序方式为:以时间戳优先排序,其次按测点id排序,时间戳与测点id均采用增序排序;
Value的质量码数组与数据值数组采用一一对应关系,且质量码数据与数据值数组的数据元素按照时间顺序存储。
CN201510819767.1A 2015-11-23 2015-11-23 一种基于智能电网wams的时序大数据存储方法 Pending CN105574074A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510819767.1A CN105574074A (zh) 2015-11-23 2015-11-23 一种基于智能电网wams的时序大数据存储方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510819767.1A CN105574074A (zh) 2015-11-23 2015-11-23 一种基于智能电网wams的时序大数据存储方法

Publications (1)

Publication Number Publication Date
CN105574074A true CN105574074A (zh) 2016-05-11

Family

ID=55884205

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510819767.1A Pending CN105574074A (zh) 2015-11-23 2015-11-23 一种基于智能电网wams的时序大数据存储方法

Country Status (1)

Country Link
CN (1) CN105574074A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106570193A (zh) * 2016-11-17 2017-04-19 深圳市康拓普信息技术有限公司 一种时序大数据的加载方法
CN106844555A (zh) * 2016-12-30 2017-06-13 江苏瑞中数据股份有限公司 一种用于电网wams系统的时序数据存储方法
CN106844483A (zh) * 2016-12-23 2017-06-13 航天星图科技(北京)有限公司 一种日志数据流处理方法
CN108153483A (zh) * 2016-12-06 2018-06-12 南京南瑞继保电气有限公司 一种基于属性分组的时序数据压缩方法
CN110609813A (zh) * 2019-08-14 2019-12-24 北京华电天仁电力控制技术有限公司 一种数据存储系统及方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102281330A (zh) * 2011-08-03 2011-12-14 深圳市科迪特信息技术有限公司 用于saas平台的数据存储、通讯访问及控制的方法
CN102999526A (zh) * 2011-09-16 2013-03-27 阿里巴巴集团控股有限公司 一种数据库关系表的拆分、查询方法及系统
CN104133867A (zh) * 2014-07-18 2014-11-05 中国科学院计算技术研究所 分布式顺序表片内二级索引方法及系统
US20140330767A1 (en) * 2011-09-19 2014-11-06 Cloudtran, Inc Scalable distributed transaction processing system
CN104866577A (zh) * 2015-05-26 2015-08-26 深圳市六度人和科技有限公司 一种基于嵌入式数据库的数据处理方法及装置
CN104991741A (zh) * 2015-06-24 2015-10-21 江苏瑞中数据股份有限公司 一种基于键值模型的情境适配电网大数据存储方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102281330A (zh) * 2011-08-03 2011-12-14 深圳市科迪特信息技术有限公司 用于saas平台的数据存储、通讯访问及控制的方法
CN102999526A (zh) * 2011-09-16 2013-03-27 阿里巴巴集团控股有限公司 一种数据库关系表的拆分、查询方法及系统
US20140330767A1 (en) * 2011-09-19 2014-11-06 Cloudtran, Inc Scalable distributed transaction processing system
CN104133867A (zh) * 2014-07-18 2014-11-05 中国科学院计算技术研究所 分布式顺序表片内二级索引方法及系统
CN104866577A (zh) * 2015-05-26 2015-08-26 深圳市六度人和科技有限公司 一种基于嵌入式数据库的数据处理方法及装置
CN104991741A (zh) * 2015-06-24 2015-10-21 江苏瑞中数据股份有限公司 一种基于键值模型的情境适配电网大数据存储方法

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106570193A (zh) * 2016-11-17 2017-04-19 深圳市康拓普信息技术有限公司 一种时序大数据的加载方法
CN106570193B (zh) * 2016-11-17 2020-07-07 深圳市康拓普信息技术有限公司 一种时序大数据的加载方法
CN108153483A (zh) * 2016-12-06 2018-06-12 南京南瑞继保电气有限公司 一种基于属性分组的时序数据压缩方法
CN108153483B (zh) * 2016-12-06 2021-04-20 南京南瑞继保电气有限公司 一种基于属性分组的时序数据压缩方法
CN106844483A (zh) * 2016-12-23 2017-06-13 航天星图科技(北京)有限公司 一种日志数据流处理方法
CN106844555A (zh) * 2016-12-30 2017-06-13 江苏瑞中数据股份有限公司 一种用于电网wams系统的时序数据存储方法
CN110609813A (zh) * 2019-08-14 2019-12-24 北京华电天仁电力控制技术有限公司 一种数据存储系统及方法
CN110609813B (zh) * 2019-08-14 2023-01-31 北京华电天仁电力控制技术有限公司 一种数据存储系统及方法

Similar Documents

Publication Publication Date Title
CN105574074A (zh) 一种基于智能电网wams的时序大数据存储方法
EP2263180B1 (en) Indexing large-scale gps tracks
CN104317800A (zh) 一种海量智能用电数据混合存储系统及方法
CN108108517A (zh) 一种基于大数据的电网规划智能辅助分析方法
CN107807961B (zh) 一种基于Spark计算引擎的配电网大数据分区处理方法
CN109669975B (zh) 一种工业大数据处理系统及方法
CN103198157B (zh) 一种大地电场数据的压缩存储处理方法
Ceci et al. Big data techniques for supporting accurate predictions of energy production from renewable sources
Hongxun et al. Data quality assessment for on-line monitoring and measuring system of power quality based on big data and data provenance theory
CN112783901A (zh) 一种基于物联网中间件的物联网时序大数据处理方法
CN104991741A (zh) 一种基于键值模型的情境适配电网大数据存储方法
CN104268709A (zh) 一种采用分布式lsm树的rfid系统设计方法
CN106844556A (zh) 一种基于HBase的智能电网时标量测数据存储方法
CN103246695A (zh) 海迅实时数据库与ies600p系统的集成方法
CN104299065A (zh) 一种调度自动化主备系统间模型正确性校验的方法
CN111078731A (zh) 基于Hbase的电网运行数据协同查询方法、设备及存储介质
CN112540987A (zh) 一种基于数据集市的配用电大数据管理系统
CN112434010A (zh) 一种用电信息采集系统主站数据库的交互方法
CN103955492A (zh) 一种电力系统中数据存储的方法
CN103473330A (zh) 采用二维表的电力系统能量管理系统历史数据存储方法
Zhou et al. Research on improving intelligent inspection efficiency of substation based on big data analysis
CN104657426A (zh) 一种基于统一视图的行列混合数据存储模型的建立方法
Liu et al. A research on unified storage management and access technology applied in power network dispatch and control big data
CN108959581A (zh) 一种面向时空融合分析的电力设备状态数据处理方法
CN110928855A (zh) 一种建立电网量测数据库的方法及其系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20160511

RJ01 Rejection of invention patent application after publication