CN116910126B - 一种海量日清电量数据便捷存储分类查询系统及方法 - Google Patents

一种海量日清电量数据便捷存储分类查询系统及方法 Download PDF

Info

Publication number
CN116910126B
CN116910126B CN202311183904.8A CN202311183904A CN116910126B CN 116910126 B CN116910126 B CN 116910126B CN 202311183904 A CN202311183904 A CN 202311183904A CN 116910126 B CN116910126 B CN 116910126B
Authority
CN
China
Prior art keywords
data
electric quantity
quantity data
storage
hash value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202311183904.8A
Other languages
English (en)
Other versions
CN116910126A (zh
Inventor
梁波
王鑫
鞠文杰
王旭东
解磊
张海静
杨洋
杨琳琳
张慧
王莲君
冯延坤
陈冠廷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Marketing Service Center of State Grid Shandong Electric Power Co Ltd
Original Assignee
Marketing Service Center of State Grid Shandong Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Marketing Service Center of State Grid Shandong Electric Power Co Ltd filed Critical Marketing Service Center of State Grid Shandong Electric Power Co Ltd
Priority to CN202311183904.8A priority Critical patent/CN116910126B/zh
Publication of CN116910126A publication Critical patent/CN116910126A/zh
Application granted granted Critical
Publication of CN116910126B publication Critical patent/CN116910126B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2471Distributed queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2228Indexing structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2228Indexing structures
    • G06F16/2255Hash tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/27Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • G06F16/9024Graphs; Linked lists
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/64Protecting data integrity, e.g. using checksums, certificates or signatures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Business, Economics & Management (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Computer Security & Cryptography (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Public Health (AREA)
  • Water Supply & Treatment (AREA)
  • Mathematical Physics (AREA)
  • Human Resources & Organizations (AREA)
  • Computational Linguistics (AREA)
  • Fuzzy Systems (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Computing Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Bioethics (AREA)
  • Computer Hardware Design (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提出了一种海量日清电量数据便捷存储分类查询系统及方法,涉及数据处理方法领域,包括数据处理模块,被配置为:对采集的日清电量数据进行处理,包括缺失数据的拟合,得到多个类型不同时间戳的电量数据;数据存储模块,被配置为:利用分布式数据库HBase,采取链式储存方式,对电量数据进行存储;数据查询模块,被配置为:对已存储的电量数据进行多维度查询;本发明以HBase技术为基础,通过链式存储,构建分布式数据存储和查询系统,实现日清电量数据的快速存储、查询,助力电力公司员工快速查询日清电量数据,进而实现日清电量和月结电量数据的跟踪和预测分析。

Description

一种海量日清电量数据便捷存储分类查询系统及方法
技术领域
本发明属于数据处理方法领域,尤其涉及一种海量日清电量数据便捷存储分类查询系统及方法。
背景技术
本部分的陈述仅仅是提供了与本发明相关的背景技术信息,不必然构成在先技术。
电力大数据时代已然来临,电力业务数据从总量和种类上都已具有一定规模,对于计量、计算、分析的要求越来越高,面对海量的数据,如何找到一种便捷存储分类查询方法,高效地建立大数据平台将现有的数据有效地利用起来,就成为了难题。
随着电网数据、软件容量的快速增长,传统数据处理技术已经不能满足智能电网电力大数据的业务处理需求;目前电力公司数据管理系统的数据平台大多采用关系型数据库(如Oracle)构建,但是关系型数据库的横向扩展能力较差,面对电力行业数据量快速增长和数据类型不断扩展的趋势,这类数据库难以提供有效支持;传统的数据存储架构面对海量数据的存储和扩展需求,存在支持数据类型单一、扩展性差、数据处理效率低下等问题,无法满足全类型数据高速增长的存储要求,也难以满足未来海量数据的弹性扩展需求。
发明内容
为克服上述现有技术的不足,本发明提供了一种海量日清电量数据便捷存储分类查询系统及方法,以HBase技术为基础,通过链式存储,构建分布式数据存储和查询系统,实现日清电量数据的快速存储、查询,助力电力公司员工快速查询日清电量数据,进而实现日清电量和月结电量数据的跟踪和预测分析。
为实现上述目的,本发明的一个或多个实施例提供了如下技术方案:
本发明第一方面提供了一种海量日清电量数据便捷存储分类查询系统。
一种海量日清电量数据便捷存储分类查询系统,包括数据处理模块、数据存储模块和数据查询模块:
数据处理模块,被配置为:对采集的日清电量数据进行处理,包括缺失数据的拟合,得到多个类型不同时间戳的电量数据;
数据存储模块,被配置为:利用分布式数据库HBase,采取链式储存方式,对电量数据进行存储;
数据查询模块,被配置为:对已存储的电量数据进行多维度查询;
其中,每个类型的电量数据采用分布式数据库HBase的列式存储,在列式存储中,同一类型不同时间戳的电量数据采取链式储存,所述链式储存由不同时间戳的信息区块组成,信息区块储存上一信息区块的Hash值和本信息区块的Hash值,所述本信息区块的Hash值,基于上一信息区块的Hash值和当前时间戳的电量数据计算得到。
进一步的,还包括用户管理模块,被配置为:进行用户信息的管理、用户权限的管理、系统权限的控制。
进一步的,所述采集的日清电量数据,是通过用户档案采集的原始数据。
进一步的,所述电量数据的类型包括:
采集的原始数据;
根据时段表码的差值计算的每日每个时点的电量;
根据当月和次月的1日表码差值计算的月结电量。
进一步的,所述分布式数据库HBase,采用列存储不同类型的数据,同一类型的数据按操作时间戳来区分版本。
进一步的,所述链式储存方式,任意一个信息区块的数据改变使其后所有信息区块的Hash值发生更改,只需应用Hash值对最近一个信息区块进行校验,确定分布式数据是否发生篡改。
进一步的,所述多维度查询,包括按日查询、按日按时段查询、按月查询、按月按时段查询。
本发明第二方面提供了一种海量日清电量数据便捷存储分类查询方法。
一种海量日清电量数据便捷存储分类查询方法,包括:
对采集的日清电量数据进行处理,包括缺失数据的拟合,得到多个类型不同时间戳的电量数据;
利用分布式数据库HBase,采取链式储存方式,对电量数据进行存储;
对已存储的电量数据进行多维度查询;
其中,每个类型的电量数据采用分布式数据库HBase的列式存储,在列式存储中,同一类型不同时间戳的电量数据采取链式储存,所述链式储存由不同时间戳的信息区块组成,信息区块储存上一信息区块的Hash值和本信息区块的Hash值,所述本信息区块的Hash值,基于上一信息区块的Hash值和当前时间戳的电量数据计算得到。
本发明第三方面提供了计算机可读存储介质,其上存储有程序,该程序被处理器执行时实现如本发明第二方面所述的一种海量日清电量数据便捷存储分类查询方法中的步骤。
本发明第四方面提供了电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的程序,所述处理器执行所述程序时实现如本发明第二方面所述的一种海量日清电量数据便捷存储分类查询方法中的步骤。
以上一个或多个技术方案存在以下有益效果:
本发明针对电力公司日清电量数据,基于HBase和链式存储,构建分布式日清电量数据存储查询系统,帮助电力公司实现日清电量和月结电量数据的分布式存储和快速查询,对于面对日益激增的数据资源的电力公司意义重大:
(1)助力电力公司员工实现对日清电量的实时监控与追踪
本发明构建的分布式数据存储和查询系统可以帮助电力公司实现日清电量和月结电量数据的快速查询,进而可以实时掌握用户的用电情况,进行电量跟踪和预测分析,避免因为系统延迟造成用户信息掌握不精确等情况。
(2)帮助电力公司员工快速实现缺失数据的拟合与分析
分布式数据存储和查询系统具有较低延迟,可以快速查询缺失数据,进而帮助电力公司员工快速发现缺失数据,并进行拟合,保持日清电量数据的完整性和高质量。
(3)采取链式储存模式实现数据可追溯、防篡改和避免校验工作量无限膨胀
储存结构由包含不同时间戳的信息区块组成,在一个信息区块中,不但储存了上一区块的Hash值,并囊括上一区块的Hash值计算得到了本区块的Hash值数据。在这样的链式结构下,任意一块区块的数据改变都会使其后所有区块的Hash值发生更改,这样只需应用Hash值对最近一个数据区块进行校验,即可保证分布式数据未发生篡改,且校验工作量并未因分布式数据量增大而发生改变,这为分布式数据库可追溯、防止篡改和避免校验工作量无限膨胀等性能要求提供了很好的储存方案。
本发明附加方面的优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
构成本发明的一部分的说明书附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。
图1为第一个实施例日清电量数据存储和查询系统架构图。
图2为第一个实施例功能模块图。
图3为第一个实施例数据链式储存结构图。
具体实施方式
应该指出,以下详细说明都是例示性的,旨在对本申请提供进一步的说明。除非另有指明,本发明使用的所有技术和科学术语具有与本申请所属技术领域的普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本申请的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
随着电网数据、软件容量的快速增长,电网数据正呈现几何级增长。传统的数据库维护成本越来越高,因此传统的数据存储和查询技术越来越不能满足海量日清电量数据的存储和查询需求。
数据存储层作为大数据平台的核心层级,目的是有效管理全量数据,实现统一存储、高效访问;分布式大数据存储技术所具备的数据管理、弹性扩展、存储优化能力,为实现数据的高效存取提供了有力的支撑。
因此,针对海量数据的高效存储分类查询需求,需要充分考虑采用分布式文件存储系统、分布式数据库等技术,同时建立系统平台,结合电量数据存储场景,实现数据的弹性存储,以应对海量数据的增量存储查询需求。
实施例一
在一个或多个实施方式中,公开了一种海量日清电量数据便捷存储分类查询系统,包括数据处理模块、数据存储模块和数据查询模块:
数据处理模块,被配置为:对采集的日清电量数据进行处理,包括缺失数据的拟合,得到多个类型不同时间戳的电量数据;
数据存储模块,被配置为:利用分布式数据库HBase,采取链式储存方式,对电量数据进行存储;
数据查询模块,被配置为:对已存储的电量数据进行多维度查询;
其中,每个类型的电量数据采用分布式数据库HBase的列式存储,在列式存储中,同一类型不同时间戳的电量数据采取链式储存,所述链式储存由不同时间戳的信息区块组成,信息区块储存上一信息区块的Hash值和本信息区块的Hash值,所述本信息区块的Hash值,基于上一信息区块的Hash值和当前时间戳的电量数据计算得到。
下面对本实施例一种海量日清电量数据便捷存储分类查询系统的实现过程进行详细说明。
针对现阶段电网日清电量数据存储和查询出现的问题,本实施例设计了一种海量日清电量数据便捷存储分类查询系统,主要内容包括总体架构设计和系统功能模块设计,系统总体架构设计将从系统设计架构的角度来分析系统在整体上的构架,系统功能模块设计具体包括系统的用户管理模块、数据处理模块、数据存储模块、数据查询模块。
系统总体架构设计
日清电量数据存储和查询系统主要为国网公司员工提供日清电量的处理、存储和查询服务,具体为:将采集的日电量数据进行处理,然后进行分布式存储,之后在应用层可进行日电量的查询,以方便电力公司员工掌握电力用户电量的变化趋势,进行电量跟踪和预测分析。
日清电量数据存储和查询系统的架构图如图1所示,整体框架主要分为四层:
在用户访问层,电力公司员工用户可以登陆系统,维护自己的基本信息、查询日清电量、拟合缺失电量数据等。
在应用接口层,提供需要开发的接口,主要的接口包括用户管理、数据处理、数据存储、数据查询;用户管理接口可以功能主要包括用户身份验证、用户名和密码验证、用户权限管理。
在基础管理层,利用HBase自身的结构特点,由master节点负责管理元数据信息,通过分布式的协调服务实现负载均衡,当出现Region分裂迁移合并时,负责找到新的Region,开启分布式锁将数据信息写入到新的Region中,同时将元数据信息返回给客户端进行读写,当有节点出现宕机时,能够找到可用节点进行恢复,Hbase自带的memstore缓存功能可以利用局部性空间原理将数据加入缓存,下次访问时能够节省大量时间。
存储层由分布式文件系统HDFS构成,是数据存储的最底层,由多个服务器构成,提供物理存储服务,利用其高容错性提供稳定可靠的服务,当出现节点宕机时,可以利用分布式协调服务迅速关闭该节点提供的服务,配合主节点找到可用节点,并将该节点数据写入到新的节点;在HDFS数据备份设置检查点,当出现数据损坏时通过检查点可以得到损坏情况信息,从而进行数据恢复,HDFS备份节点在物理位置部署时一般分布在同一个机架、同一个机房和不同机房中,这样做的好处就是当一处节点出现宕机或者机房断电等情况时,可以迅速利用其它处的节点来提供服务,保证整个系统的高可用性;在数据储存方式上,采用链式储存,并应用Hash加密算法进行区块头数码计算。
系统功能模块设计
本实施例的日清电量系统主要有用户管理功能、数据处理功能、数据存储功能、数据查询功能,如图2所示,电力公司员工登陆系统后,首先可以进行数据的处理,对缺失的日清电量进行拟合,拟合之后可以将拟合数据入库存储,最后可以进行数据的查询,在数据查询模块可以选择按市场主体或按售电公司进行查询,均支持按日查询、按时段查询、按月查询等多个维度;系统的各个模块彼此之间互不影响,可以单独进行相应的操作。
(1)用户管理模块
电力公司系统管理人员拥有用户管理(增删改查)、用户权限管理(增删改查)、日清电量查看等权限,通过权限对电量跟踪和预测分析进行控制。
(2)数据处理模块
主要包括三个方面的功能:
第一,时点电量的测算,营销侧的日清电量通过用户档案采集原始数据,根据其中记录的相邻时段表码的差值计算出每日每个时点的电量。
第二,采集数据缺失的情况下数据的拟合。如果日清电量的采集数据缺失,需要进行数据拟合,具体的拟合规则可以查看《山东省电力现货市场交易规则(试行)》,详细拟合规则见其中的《市场用户电量数据合办法》和《发电侧电量数据拟合办法》。
第三,月结电量的测算,根据当月和次月的1日表码差值计算月结电量。
(3)数据存储模块
系统在运行过程中主要存储三类数据:第一类是通过用户档案采集出的原始数据;第二类是计算和拟合出的每日每个时点的电量数据;第三类是测算得到的月结电量数据。
数据存储模块使用HBase数据库进行存储,HBase属于列式存储的数据库,其数据库的数据是以键值对的形式存在的。
Hbase是根据列族来存储数据的,列族下面可以有非常多的列。列式存储的最大好处就是,其数据在表中是按照某列存储的,这样在查询只需要少数几个字段时,能大大减少读取的数据量。HBase采用Key-Value形式的列存储表结构,表一般由rowkey、Time Stamp、Column Family组成,数据存储在表中,每条数据写入时,如果不指定时间戳,系统会自动为其加上该字段,其值为写入 HBase 的时间,每操作一次就会产生一个版本。
cell是由{rowkey, Column Family, Time Stamp} 唯一确定的单元,每个Cell的多个版本的数据按时间倒序存储,其中,rowkey是HBase的key-value存储中的key,存储到HBase的数据都是按照rowkey字典升序进行排序,rowkey采用自增序列生成,并且HBase中检索数据,是根据rowkey主键进行检索;Column Family是列族,下面包括三列,分别存储上述三类电量数据。
另外,每条行数据由rowkey唯一标识,具有不同的时间戳,不同的行数据采取链式储存模式,如图3所示,链式储存的储存结构由多个信息区块首尾相接组成,为每条行数据构建一个信息区块,每个区块的Hash值是由时间戳、Merkle根、上一区块Hash值和随机数通过加密计算得到。
这里的Merkle根是从输入数据(数据1、数据2…)开始进行hash,hash的结果作为树的叶子节点,然后相邻两个节点值两两配对作为输入再hash散列得到上层节点,如此一直往上,直到得到父节点的hash值;在本实施例中,输入的数据为同一类不同时间戳的电量数据。
由于在一个信息区块中,不但储存了上一区块的Hash值,也通过加密计算得到了本区块的Hash值数据,故称该储存方式为链式储存,信息区块的排列顺序按照区块产生的时间顺序排列。
在这样的链式结构下,任意一块区块的数据改变都会使其后所有区块的Hash值发生更改,这样只需应用Hash值对最近一个数据区块进行校验,即可保证分布式数据未发生篡改,且校验工作量并未因分布式数据量增大而发生改变;这为分布式数据库可追溯、防止篡改和避免校验工作量无限膨胀等性能要求提供了很好的储存方案。
(4)数据查询模块
数据查询模块主要面向电力公司员工,即通过权限控制用户的使用,电力公司员工可以在系统的查询界面查询到用户的日清电量情况,根据日清电量的情况可以进行电量跟踪和预测分析;查询功能界面可进行多个维度的查询;主要包括按市场主体或按售电公司进行查询,均支持按日查询、按日按时段查询、按月查询、按月按时段查询等多个维度。供电公司员工进行使用,对日度和月度电量进行查询和分析。
实施例二
在一个或多个实施例中,公开了一种海量日清电量数据便捷存储分类查询方法,包括:
对采集的日清电量数据进行处理,包括缺失数据的拟合,得到多个类型不同时间戳的电量数据;
利用分布式数据库HBase,采取链式储存方式,对电量数据进行存储;
对已存储的电量数据进行多维度查询;
其中,每个类型的电量数据采用分布式数据库HBase的列式存储,在列式存储中,同一类型不同时间戳的电量数据采取链式储存,所述链式储存由不同时间戳的信息区块组成,信息区块储存上一信息区块的Hash值和本信息区块的Hash值,所述本信息区块的Hash值,基于上一信息区块的Hash值和当前时间戳的电量数据计算得到。
实施例三
本实施例的目的是提供计算机可读存储介质。
计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本公开实施例二所述的一种海量日清电量数据便捷存储分类查询方法中的步骤。
实施例四
本实施例的目的是提供电子设备。
电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的程序,所述处理器执行所述程序时实现如本公开实施例二所述的一种海量日清电量数据便捷存储分类查询方法中的步骤。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种海量日清电量数据便捷存储分类查询系统,其特征在于,包括数据处理模块、数据存储模块和数据查询模块:
数据处理模块,被配置为:对采集的日清电量数据进行处理,包括缺失数据的拟合,得到多个类型不同时间戳的电量数据;
数据存储模块,被配置为:利用分布式数据库HBase,采取链式储存方式,对电量数据进行存储;
数据查询模块,被配置为:对已存储的电量数据进行多维度查询;
其中,每个类型的电量数据采用分布式数据库HBase的列式存储,在列式存储中,同一类型不同时间戳的电量数据采取链式储存,所述链式储存由不同时间戳的信息区块组成,信息区块储存上一信息区块的Hash值和本信息区块的Hash值,所述本信息区块的Hash值,基于上一信息区块的Hash值和当前时间戳的电量数据计算得到。
2.如权利要求1所述的一种海量日清电量数据便捷存储分类查询系统,其特征在于,还包括用户管理模块,被配置为:进行用户信息的管理、用户权限的管理、系统权限的控制。
3.如权利要求1所述的一种海量日清电量数据便捷存储分类查询系统,其特征在于,所述采集的日清电量数据,是通过用户档案采集的原始数据。
4.如权利要求1所述的一种海量日清电量数据便捷存储分类查询系统,其特征在于,所述电量数据的类型包括:
采集的原始数据;
根据时段表码的差值计算的每日每个时点的电量;
根据当月和次月的1日表码差值计算的月结电量。
5.如权利要求1所述的一种海量日清电量数据便捷存储分类查询系统,其特征在于,所述分布式数据库HBase,采用列存储不同类型的数据,同一类型的数据按操作时间戳来区分版本。
6.如权利要求1所述的一种海量日清电量数据便捷存储分类查询系统,其特征在于,所述链式储存方式,任意一个信息区块的数据改变使其后所有信息区块的Hash值发生更改,只需应用Hash值对最近一个信息区块进行校验,确定分布式数据是否发生篡改。
7.如权利要求1所述的一种海量日清电量数据便捷存储分类查询系统,其特征在于,所述多维度查询,包括按日查询、按日按时段查询、按月查询、按月按时段查询。
8.一种海量日清电量数据便捷存储分类查询方法,其特征在于,包括:
对采集的日清电量数据进行处理,包括缺失数据的拟合,得到多个类型不同时间戳的电量数据;
利用分布式数据库HBase,采取链式储存方式,对电量数据进行存储;
对已存储的电量数据进行多维度查询;
其中,每个类型的电量数据采用分布式数据库HBase的列式存储,在列式存储中,同一类型不同时间戳的电量数据采取链式储存,所述链式储存由不同时间戳的信息区块组成,信息区块储存上一信息区块的Hash值和本信息区块的Hash值,所述本信息区块的Hash值,基于上一信息区块的Hash值和当前时间戳的电量数据计算得到。
9.一种电子设备,其特征是,包括:
存储器,用于非暂时性存储计算机可读指令;以及
处理器,用于运行所述计算机可读指令,
其中,所述计算机可读指令被所述处理器运行时,执行上述权利要求8所述的方法。
10.一种存储介质,其特征是,非暂时性地存储计算机可读指令,其中,当所述非暂时性计算机可读指令由计算机执行时,执行权利要求8所述方法的指令。
CN202311183904.8A 2023-09-14 2023-09-14 一种海量日清电量数据便捷存储分类查询系统及方法 Active CN116910126B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311183904.8A CN116910126B (zh) 2023-09-14 2023-09-14 一种海量日清电量数据便捷存储分类查询系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311183904.8A CN116910126B (zh) 2023-09-14 2023-09-14 一种海量日清电量数据便捷存储分类查询系统及方法

Publications (2)

Publication Number Publication Date
CN116910126A CN116910126A (zh) 2023-10-20
CN116910126B true CN116910126B (zh) 2023-11-24

Family

ID=88355131

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311183904.8A Active CN116910126B (zh) 2023-09-14 2023-09-14 一种海量日清电量数据便捷存储分类查询系统及方法

Country Status (1)

Country Link
CN (1) CN116910126B (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106651633A (zh) * 2016-10-09 2017-05-10 国网浙江省电力公司信息通信分公司 一种基于大数据技术的用电信息采集系统及其采集方法
CN109669943A (zh) * 2018-11-30 2019-04-23 深圳灵图慧视科技有限公司 数据存储方法、数据查询方法及装置
CN113468551A (zh) * 2021-05-31 2021-10-01 南京邮电大学 一种基于联盟区块链的家用智能电表数据存储系统及方法
CN114079660A (zh) * 2021-09-28 2022-02-22 中诚区块链研究院(南京)有限公司 一种高性能分布式存储区块数据、时间戳、跨链通信与数据协同方法
CN114661832A (zh) * 2022-03-22 2022-06-24 辽宁大学 一种基于数据质量的多模态异构数据存储方法及系统
CN115860759A (zh) * 2022-11-29 2023-03-28 山东华丰数字科技有限公司 一种基于区块链的农产品可信溯源系统及方法
CN116683452A (zh) * 2023-08-03 2023-09-01 国网山东省电力公司营销服务中心(计量中心) 一种日清缺失电量的修复方法及系统

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10108637B2 (en) * 2016-03-08 2018-10-23 International Business Machines Corporation Spatial-temporal storage system, method, and recording medium
CN111880746A (zh) * 2017-05-25 2020-11-03 创新先进技术有限公司 一种向区块链系统中写入业务数据的方法和装置
US10102691B1 (en) * 2018-04-20 2018-10-16 Smartdrive Systems, Inc. Systems and methods for using on-board resources of individual vehicles in a fleet of vehicles as a distributed data center

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106651633A (zh) * 2016-10-09 2017-05-10 国网浙江省电力公司信息通信分公司 一种基于大数据技术的用电信息采集系统及其采集方法
CN109669943A (zh) * 2018-11-30 2019-04-23 深圳灵图慧视科技有限公司 数据存储方法、数据查询方法及装置
CN113468551A (zh) * 2021-05-31 2021-10-01 南京邮电大学 一种基于联盟区块链的家用智能电表数据存储系统及方法
CN114079660A (zh) * 2021-09-28 2022-02-22 中诚区块链研究院(南京)有限公司 一种高性能分布式存储区块数据、时间戳、跨链通信与数据协同方法
CN114661832A (zh) * 2022-03-22 2022-06-24 辽宁大学 一种基于数据质量的多模态异构数据存储方法及系统
CN115860759A (zh) * 2022-11-29 2023-03-28 山东华丰数字科技有限公司 一种基于区块链的农产品可信溯源系统及方法
CN116683452A (zh) * 2023-08-03 2023-09-01 国网山东省电力公司营销服务中心(计量中心) 一种日清缺失电量的修复方法及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
智能变电站海量在线监测数据处理方法;王德文;肖磊;肖凯;;电力自动化设备(08);全文 *

Also Published As

Publication number Publication date
CN116910126A (zh) 2023-10-20

Similar Documents

Publication Publication Date Title
CN104881424B (zh) 一种基于正则表达式的电力大数据采集、存储及分析方法
CN104820670B (zh) 一种电力信息大数据的采集和存储方法
CN113010506B (zh) 一种多源异构水环境大数据管理系统
CN104317800A (zh) 一种海量智能用电数据混合存储系统及方法
CN112347071B (zh) 一种配电网云平台数据融合方法及配电网云平台
CN110503570A (zh) 一种异常用电数据检测方法、系统、设备、存储介质
Prasad et al. Smart meter data analytics using OpenTSDB and Hadoop
CN105357311A (zh) 一种云计算技术的二次设备大数据存储与处理方法
CN102722584B (zh) 数据存储系统及方法
CN114328688A (zh) 一种针对电力能源大数据的管控平台
Ceci et al. Big data techniques for supporting accurate predictions of energy production from renewable sources
Gibadullin et al. Service-oriented distributed energy data management using big data technologies
CN109446230A (zh) 一种光伏发电影响因素的大数据分析系统及方法
CN107330017A (zh) 一种基于主题实例的电力海量数据存储和查询统计分析方法及其系统
Murugesan et al. Audit log management in MongoDB
Wu et al. An Auxiliary Decision‐Making System for Electric Power Intelligent Customer Service Based on Hadoop
CN118069712A (zh) 数据生命周期管理方法、装置、电子设备及存储介质
Chen et al. An optimized distributed OLAP system for big data
CN116910126B (zh) 一种海量日清电量数据便捷存储分类查询系统及方法
Zhao et al. Hadoop-based power grid data quality verification and monitoring method
Dong et al. Research on Architecture of Power Big Data High-Speed Storage System for Energy Interconnection
CN112540987A (zh) 一种基于数据集市的配用电大数据管理系统
CN103544196A (zh) BigBase高通量大数据在线分析软硬件一体机
Lenard et al. An Approach for Efficient Processing of Machine Operational Data
Behan et al. Comparative analysis of RDBMS and NoSQL databases

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant