CN105574643A - 一种电网实时数据中心与大数据平台融合方法 - Google Patents

一种电网实时数据中心与大数据平台融合方法 Download PDF

Info

Publication number
CN105574643A
CN105574643A CN201510818743.4A CN201510818743A CN105574643A CN 105574643 A CN105574643 A CN 105574643A CN 201510818743 A CN201510818743 A CN 201510818743A CN 105574643 A CN105574643 A CN 105574643A
Authority
CN
China
Prior art keywords
data
real
time data
layer
center
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510818743.4A
Other languages
English (en)
Inventor
李贤慧
季胜鹏
李京波
徐朋
吴佳
苏丹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
CHINA REALTIME DATABASE Co Ltd
Original Assignee
CHINA REALTIME DATABASE Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by CHINA REALTIME DATABASE Co Ltd filed Critical CHINA REALTIME DATABASE Co Ltd
Priority to CN201510818743.4A priority Critical patent/CN105574643A/zh
Publication of CN105574643A publication Critical patent/CN105574643A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种电网实时数据中心与大数据平台融合方法,建立电网实时数据中心与大数据平台融合整体架构:数据采集层、存储层、网关层、数据处理层、应用层,本发明实现了实时数据中心与大数据平台的有效融合,可利用实时数据中心和大数据平台的功能和技术相辅相成,优势互补,提升历史/准实时数据存储、处理加工效率的同时,保证了原有实时数据中心业务应用的连续性。

Description

一种电网实时数据中心与大数据平台融合方法
技术领域
本发明涉及电网信息化领域,特别是涉及一种电网实时数据中心与大数据平台融合方法。
背景技术
十二五期间,电网企业(如国家电网公司和南方电网公司)建成了实时数据中心,实现了对电力生产运行过程中各业务应用生成的历史/准实时数据的按需存储、整合、共享交换和计算加工,接入了用电信息采集、SCADA、电能量、输变电在线监测等业务系统历史/准实时数据,支撑了大量业务应用的历史/准实时数据访问服务。
随着大数据技术的发展,历史/准实时数据结合大数据相关的技术将发挥更大的价值,通过在实时数据中心引入大数据平台,可以优化数据整合、数据存储、数据计算、数据分析、数据服务能力,支撑业务应用建设。但是,大数据平台的引入,并非直接替代实时数据中心承担历史/准实时数据的存储、整合、分析和计算,大数据平台和实时数据中心在处理历史/准实时数据上是相辅相成的。实时数据中心与大数据平台的有机融合,将使历史/准实时数据发挥更大作用。具体表现在:
(1)时序数据使用模式根深蒂固,现有业务应用已基于此模式实现应用集成及应用开发,融合需考虑使用模式及业务应用的连续性。通过测点访问时序数据的模式在行业内有标准的CIS、OPC等标准,在电网企业层面也发布了UAPI访问规范,基于测点的数据访问已成为时序数据写入和访问的标准模式。同时现有实时数据中心已经支撑电网企业统推应用和部分省(市)公司自建应用的应用集成和数据访问,如果调整时序数据使用模式,势必导致大量统推和自建应用需改造,影响业务应用的连续性。
(2)大数据平台对于分钟级以下时序数据处理能力有限,而实时数据中心底层实时数据库专门为时序数据量身订做,可存储处理毫秒级甚至微秒级时序数据。现有统一车辆数据、供电电压数据等采集频率均达到秒级,随着精益化生产管理需求,越来越多的生产运营实时数据要求精度更高,频度更大,仅通过大数据平台难于处理高频海量时序数据存储、处理和分析需求。
(3)保护投资,充分利旧。根据电网企业十二五规划要求,实时数据中心是四大数据中心之一,重点存储历史/准实时数据。十二五期间,通过实时数据中心的建设,充分验证了其作为历史/准实时数据存储处理的可行性。大数据平台在行业外应用效果明显,但是在电网时序数据存储处理上国内外并无先例,其可行性有待进一步验证研究。同时通过实时数据中心和大数据平台融合的尝试,保护投资的同时也充分利旧。
综上,实时数据中心与大数据平台融合时宜作为大数据平台的一部分存在,通过大数据平台优秀的数据挖掘分析计算组件,支撑实时数据中心深化应用;通过实时数据中心时序数据快速存储处理特性,存储智能电网生产运行时序数据。两者相辅相成、相得益彰。
发明内容
针对现有技术中存在的问题,本发明提供了一种实现基于数据库网关的实时数据中心与大数据平台融合,实现大数据平台支撑时序数据的存储应用,保证原有时序业务应用的使用连续性的电网实时数据中心与大数据平台融合方法。
本发明的目的通过以下技术方案实现。
一种电网实时数据中心与大数据平台融合方法,建立电网实时数据中心与大数据平台融合整体架构:数据采集层、存储层、网关层、数据处理层、应用层,所述的数据采集层基于大数据领域通用的组件Kafka实现,所述的数据采集层用于电网业务中各类时序数据采集和缓存,并传递至存储层;所述的存储层是实时数据中心的核心,采用基于实时数据库和关系数据库双引擎的存储方式,所述的实时数据库存储电网生产运行过程中各业务系统产生的时间序列量测数据,所述的关系数据库存储支撑实时数据中心正常运行的关系型数据;所述的网关层基于JDBC接口和FDW技术实现实时数据中心与Spark大数据技术的融合;所述的数据处理层利用Spark内存计算框架和Storm流式计算框架实现海量数据的历史分析和实时分析,并对外提供统一的数据访问接口;所述的应用层用于实现数据挖掘、数据可视化,与现有基于实时数据中心的各类业务应用共同支撑智能电网稳定运行。
通过实时数据中心内部实时数据库的中间件实时数据库网关实现从SQL到实时数据中心数据访问的回调及JDBC技术,从而实现实时数据中心与大数据平台的融合。
所述的实时数据库网关中实现了SQL到实时数据中心UAPI接口调用的映射,在Spark层执行相应的SQL时,对应执行实时数据中心的UAPI回调,从而实现时序数据的访问。
相比于现有技术,本发明的优点在于:实现了实时数据中心与大数据平台的有效融合,可利用实时数据中心和大数据平台的功能和技术相辅相成,优势互补,提升历史/准实时数据存储、处理加工效率的同时,保证了原有实时数据中心业务应用的连续性。
附图说明
图1是实时数据中心与大数据平台融合总体架构图。
图2是实时数据中心与大数据平台融合原理示意图。
图3是实时数据库网关原理示意图。
图4是基于实时数据中心与大数据平台融合的业务流程示意图。
具体实施方式
下面结合说明书附图和具体的实施例,对本发明作详细描述。
图1为实时数据中心与大数据平台融合总体架构图。实时数据中心与大数据平台融合主要通过图中网关层实时数据库网关实现。整体架构可分五层:数据采集层、存储层、网关层、数据处理层、应用层。其中,数据采集层充分考虑电网时序数据业务特点基于大数据领域通用的组件Kafka实现,主要用于电网业务中各类时序数据采集和缓存,并传递至存储层;存储层是实时数据中心的核心,采用基于实时数据库和关系数据库双引擎的存储方式,实时数据库存储电网生产运行过程中各业务系统产生的时间序列量测数据,关系数据库存储支撑实时数据中心正常运行的关系型数据,完全满足并适用于电网各类业务应用中量测对象及量测值(时序数据)的存储;网关层基于JDBC接口和FDW技术实现实时数据中心与Spark大数据技术的有机融合,不仅能够满足电网企业现有时序数据访问的规范要求,而且能够提供以SQL接口的形式直接访问实时数据中心中的时序数据。数据处理层,利用Spark内存计算框架和Storm流式计算框架实现海量数据的历史分析和实时分析,并对外提供统一的数据访问接口;应用层主要实现数据挖掘、数据可视化等具体应用,与现有基于实时数据中心的各类业务应用共同支撑智能电网的安全、高效、稳定运行。
通过实时数据中心内部实时数据库的中间件——实时数据库网关实现从SQL到实时数据中心数据访问的回调及JDBC技术,从而实现实时数据中心与大数据平台的有机融合。通过实时数据中心与大数据平台的融合,一方面完全符合电网企业现有时序数据访问规范技术要求,保持电网企业现有业务应用的连续性,以确保电网企业现有业务系统的稳定、可靠性、高效运行;另一方面实现分布式、高可用、可扩展、高效率的大数据业务,优化了现有海量数据业务,实现大数据技术的充分应用。
图2为实时数据中心与大数据平台Spark融合的原理图。实时数据库网关中实现了SQL到实时数据中心UAPI接口调用的映射,在Spark层执行相应的SQL时,可以对应执行实时数据中心的UAPI回调,从而实现时序数据的访问。实时数据库网关能够以基于JDBC的DataLink接口与大数据组件Spark有效融合,一方面Spark能够直接以SQL或Javaapi接口的形式直接对数据库网关进行访问,另一方面借助瑞中数据研发的DataLink支撑实时数据中心与大数据平台有效融合后面向广域、多源异构数据源为主题的相关电网业务中的存储分析需求。此外,实时数据中心与大数据平台经过上述方式融合后,通过Spark能够实现并满足实时数据中心中的数据与Hadoop系统及其组件中数据的联动需求,实现实时数据中心与大数据平台真正意义上的融合;在实时数据库网关内部,根据实时数据库的特点,借鉴FDW技术,通过瑞中数据RTDB_FDW中间件技术,有效支持实时数据库网关与实时数据中心的内置型的无缝集成。实时数据库网关实现原理如图3所示。上层应用提交SQL实时数据库网关,实时数据库网关通过对SQL的解析、查询优化,最终调用实时数据库的访问API实现数据的交互。
为保证业务应用对海量时序数据访问的高效性,实时数据库网关作为实现实时数据中心与大数据平台融合的关键部分,其在设计研发中考虑以下特性:
(1)基于内存的进程间实时通信技术;
(2)SQL词法解析及预编译技术;
(3)数据库网关仅管理实时数据中心中时序数据的元数据,避免了大量时序数据在任务执行过程中的迁移;
(4)实时数据库网关提供的JDBC接口技术与spark大数据平台的有机融合,利用spark大数据平台自身的延迟执行、任务调度机制、作业划分机制等,能够优化作业的执行效率,提升了海量(平台)为电网业务应用提供高效时序数据访问的效率,同时发挥了spark大数据平台和实时数据中心的优势。
基于RTDB_FDW技术构建的实时数据库网关与实时数据中心之间的无缝集成,使得实时数据中心能够透明、稳定、高效地为电网业务应用提供时序数据服务,同时高效地支持与大数据平台及其相关组件的有效融合、数据联动。
实时数据中心与大数据平台融合后数据访问流程如图4,其流程如下:
业务应用根据应用需求以SQL或及Java接口形式发送请求到大数据平台Spark。
Spark对业务应用的任务请求进行解析、任务调度及任务执行优化。
Spark大数据平台通过实时数据库网关提供的JDBC接口实现连接、注册到实时数据库网关并将相关任务请求发送到实时数据库网关。
实时数据库网关将借助于RTDB_FDW技术将实时数据中心中时序数据的元数据映射到数据库网关内,通过UAPI回调实现数据的访问。同时将数据访问结果返回给数据库网关。然后,业务应用可以以符合时序数据的使用模式要求的方式完成对时序数据访问及基于Spark的电网大数据分析业务。

Claims (3)

1.一种电网实时数据中心与大数据平台融合方法,其特征在于建立电网实时数据中心与大数据平台融合整体架构:数据采集层、存储层、网关层、数据处理层、应用层,所述的数据采集层基于大数据领域通用的组件Kafka实现,所述的数据采集层用于电网业务中各类时序数据采集和缓存,并传递至存储层;所述的存储层是实时数据中心的核心,采用基于实时数据库和关系数据库双引擎的存储方式,所述的实时数据库存储电网生产运行过程中各业务系统产生的时间序列量测数据,所述的关系数据库存储支撑实时数据中心正常运行的关系型数据;所述的网关层基于JDBC接口和FDW技术实现实时数据中心与Spark大数据技术的融合;所述的数据处理层利用Spark内存计算框架和Storm流式计算框架实现海量数据的历史分析和实时分析,并对外提供统一的数据访问接口;所述的应用层用于实现数据挖掘、数据可视化,与现有基于实时数据中心的各类业务应用共同支撑智能电网稳定运行。
2.根据权利要求1所述的一种电网实时数据中心与大数据平台融合方法,其特征在于通过实时数据中心内部实时数据库的中间件实时数据库网关实现从SQL到实时数据中心数据访问的回调及JDBC技术,从而实现实时数据中心与大数据平台的融合。
3.根据权利要求2所述的一种电网实时数据中心与大数据平台融合方法,其特征在于所述的实时数据库网关中实现了SQL到实时数据中心UAPI接口调用的映射,在Spark层执行相应的SQL时,对应执行实时数据中心的UAPI回调,从而实现时序数据的访问。
CN201510818743.4A 2015-11-23 2015-11-23 一种电网实时数据中心与大数据平台融合方法 Pending CN105574643A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510818743.4A CN105574643A (zh) 2015-11-23 2015-11-23 一种电网实时数据中心与大数据平台融合方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510818743.4A CN105574643A (zh) 2015-11-23 2015-11-23 一种电网实时数据中心与大数据平台融合方法

Publications (1)

Publication Number Publication Date
CN105574643A true CN105574643A (zh) 2016-05-11

Family

ID=55884747

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510818743.4A Pending CN105574643A (zh) 2015-11-23 2015-11-23 一种电网实时数据中心与大数据平台融合方法

Country Status (1)

Country Link
CN (1) CN105574643A (zh)

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106326331A (zh) * 2016-06-29 2017-01-11 河南许继仪表有限公司 一种基于云计算的智能用电数据服务系统
CN106502772A (zh) * 2016-10-09 2017-03-15 国网浙江省电力公司信息通信分公司 基于分布式离线技术的电量数据批量高速处理方法及系统
CN106528847A (zh) * 2016-11-24 2017-03-22 北京集奥聚合科技有限公司 一种海量数据的多维度处理方法及系统
CN106777278A (zh) * 2016-12-29 2017-05-31 海尔优家智能科技(北京)有限公司 一种基于Spark的数据处理方法及装置
CN106777141A (zh) * 2016-12-19 2017-05-31 国网山东省电力公司电力科学研究院 一种融合多源异构电网数据的获取和分布式存储方法
CN107545007A (zh) * 2016-06-26 2018-01-05 国网天津市电力公司 电力大数据快速检索引擎
CN107612984A (zh) * 2017-09-04 2018-01-19 北京天平检验行有限公司 一种基于互联网的大数据平台
CN107609085A (zh) * 2017-09-07 2018-01-19 国网辽宁省电力有限公司 一种基于大数据技术的智能电网量测数据处理方法及系统
CN108108517A (zh) * 2017-11-23 2018-06-01 江苏瑞中数据股份有限公司 一种基于大数据的电网规划智能辅助分析方法
CN108710705A (zh) * 2018-05-28 2018-10-26 贵州中科恒运软件科技有限公司 一种关于政务数据融合分析的方法
CN108985531A (zh) * 2017-06-01 2018-12-11 中国科学院深圳先进技术研究院 一种多模异构电力大数据融合分析管理系统及方法
CN109672668A (zh) * 2018-12-03 2019-04-23 积成电子股份有限公司 一种gda接口与opc ua服务的映射方法
CN110298764A (zh) * 2019-05-15 2019-10-01 广西电网有限责任公司南宁供电局 一种保供电可视化系统和方法
CN110362572A (zh) * 2019-06-25 2019-10-22 浙江邦盛科技有限公司 一种基于列式存储的时序数据库系统
CN110515967A (zh) * 2019-08-30 2019-11-29 北京东软望海科技有限公司 基于spark计算框架的数据分析方法及电子设备
CN111077870A (zh) * 2020-01-06 2020-04-28 浙江中烟工业有限责任公司 一种基于流计算的opc数据实时采集监控智能系统及方法
CN111194008A (zh) * 2018-10-29 2020-05-22 深圳市优必选科技有限公司 车辆轨迹实时监测方法及终端设备

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104102702A (zh) * 2014-07-07 2014-10-15 浪潮(北京)电子信息产业有限公司 一种实现软硬件结合的面向应用的大数据系统及方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104102702A (zh) * 2014-07-07 2014-10-15 浪潮(北京)电子信息产业有限公司 一种实现软硬件结合的面向应用的大数据系统及方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
朱朝阳等: "电力大数据平台研究与设计", 《电力信息与通信技术》 *

Cited By (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107545007A (zh) * 2016-06-26 2018-01-05 国网天津市电力公司 电力大数据快速检索引擎
CN106326331A (zh) * 2016-06-29 2017-01-11 河南许继仪表有限公司 一种基于云计算的智能用电数据服务系统
CN106502772A (zh) * 2016-10-09 2017-03-15 国网浙江省电力公司信息通信分公司 基于分布式离线技术的电量数据批量高速处理方法及系统
CN106528847A (zh) * 2016-11-24 2017-03-22 北京集奥聚合科技有限公司 一种海量数据的多维度处理方法及系统
CN106777141A (zh) * 2016-12-19 2017-05-31 国网山东省电力公司电力科学研究院 一种融合多源异构电网数据的获取和分布式存储方法
CN106777141B (zh) * 2016-12-19 2019-07-12 国网山东省电力公司电力科学研究院 一种融合多源异构电网数据的获取和分布式存储方法
CN106777278A (zh) * 2016-12-29 2017-05-31 海尔优家智能科技(北京)有限公司 一种基于Spark的数据处理方法及装置
CN108985531A (zh) * 2017-06-01 2018-12-11 中国科学院深圳先进技术研究院 一种多模异构电力大数据融合分析管理系统及方法
CN107612984A (zh) * 2017-09-04 2018-01-19 北京天平检验行有限公司 一种基于互联网的大数据平台
CN107612984B (zh) * 2017-09-04 2020-11-10 北京天平检验行有限公司 一种基于互联网的大数据平台
CN107609085A (zh) * 2017-09-07 2018-01-19 国网辽宁省电力有限公司 一种基于大数据技术的智能电网量测数据处理方法及系统
CN108108517A (zh) * 2017-11-23 2018-06-01 江苏瑞中数据股份有限公司 一种基于大数据的电网规划智能辅助分析方法
CN108710705A (zh) * 2018-05-28 2018-10-26 贵州中科恒运软件科技有限公司 一种关于政务数据融合分析的方法
CN111194008A (zh) * 2018-10-29 2020-05-22 深圳市优必选科技有限公司 车辆轨迹实时监测方法及终端设备
CN109672668A (zh) * 2018-12-03 2019-04-23 积成电子股份有限公司 一种gda接口与opc ua服务的映射方法
CN109672668B (zh) * 2018-12-03 2021-04-09 积成电子股份有限公司 一种gda接口与opc ua服务的映射方法
CN110298764A (zh) * 2019-05-15 2019-10-01 广西电网有限责任公司南宁供电局 一种保供电可视化系统和方法
CN110362572A (zh) * 2019-06-25 2019-10-22 浙江邦盛科技有限公司 一种基于列式存储的时序数据库系统
CN110362572B (zh) * 2019-06-25 2022-07-01 浙江邦盛科技股份有限公司 一种基于列式存储的时序数据库系统
CN110515967A (zh) * 2019-08-30 2019-11-29 北京东软望海科技有限公司 基于spark计算框架的数据分析方法及电子设备
CN111077870A (zh) * 2020-01-06 2020-04-28 浙江中烟工业有限责任公司 一种基于流计算的opc数据实时采集监控智能系统及方法

Similar Documents

Publication Publication Date Title
CN105574643A (zh) 一种电网实时数据中心与大数据平台融合方法
CN110022226B (zh) 一种基于面向对象的数据采集系统及采集方法
CN106326331A (zh) 一种基于云计算的智能用电数据服务系统
CN102663117B (zh) 面向数据库与Hadoop混合平台的OLAP查询处理方法
CN109492040A (zh) 一种适用于数据中心海量短报文数据处理的系统
CN108052634B (zh) 一种电网生产控制大区与资产管理大区多信息系统的集成方法
CN105631764A (zh) 面向智慧城市的智能电网大数据应用系统
CN110047014A (zh) 一种基于负荷曲线和历史电量的用户电量数据修复方法
CN103700041A (zh) 基于云计算的智能电网负荷预测管理平台
CN107341205A (zh) 一种基于大数据平台的智能配用电系统
CN105405070A (zh) 一种分布式内存电网系统构建方法
CN110308966B (zh) 一种基于容器技术的静态安全分析方法
CN105447611A (zh) 基于gis平台支持的oms设备异动管控信息系统
CN106055590A (zh) 基于大数据及图数据库的电力网络数据处理方法和系统
CN103729742B (zh) 一种基于soa架构和模型驱动架构的数据资源管理系统
CN107766451A (zh) 一种面向电力大数据的跨数据库关联检索方法
CN114281790B (zh) 一种多类型负荷资源聚合商接入系统及方法
CN108446145A (zh) 一种分布式文件自动加载mpp数据库方法
CN109816336A (zh) 基于全生命周期的信息管理系统
CN103729455B (zh) 一种基于主副本存储模式的主数据存储方法
CN109542828A (zh) 一种电力大数据实验平台
CN101867185A (zh) 电力系统的pi测点自动维护系统及其维护方法
CN111291048A (zh) 一种数据处理系统
CN112434010A (zh) 一种用电信息采集系统主站数据库的交互方法
CN204425403U (zh) 一种配电自动化架构

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20160511