CN105117171A - 一种能源scada海量数据分布式处理系统及其方法 - Google Patents

一种能源scada海量数据分布式处理系统及其方法 Download PDF

Info

Publication number
CN105117171A
CN105117171A CN201510541792.8A CN201510541792A CN105117171A CN 105117171 A CN105117171 A CN 105117171A CN 201510541792 A CN201510541792 A CN 201510541792A CN 105117171 A CN105117171 A CN 105117171A
Authority
CN
China
Prior art keywords
data
management server
file
node
scada
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510541792.8A
Other languages
English (en)
Other versions
CN105117171B (zh
Inventor
白忠贺
金舒
戴宏斌
董胜刚
张迎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NANJING GUODIAN NANZI MEIZHUO CONTROL SYSTEM CO Ltd
Original Assignee
NANJING GUODIAN NANZI MEIZHUO CONTROL SYSTEM CO Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NANJING GUODIAN NANZI MEIZHUO CONTROL SYSTEM CO Ltd filed Critical NANJING GUODIAN NANZI MEIZHUO CONTROL SYSTEM CO Ltd
Priority to CN201510541792.8A priority Critical patent/CN105117171B/zh
Publication of CN105117171A publication Critical patent/CN105117171A/zh
Application granted granted Critical
Publication of CN105117171B publication Critical patent/CN105117171B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种能源SCADA海量数据分布式处理系统及其方法,包括依次相连的客户端、实时通信节点、管理服务器和分布式数据服务器,实时通信节点包括实时库和配置库,管理服务器包括主管理服务器和备管理服务器,分布式数据服务器包括多个主存储节点和多个备存储节点。其将海量历史数据的存储文件的路径、时间等属性信息和数据本身分开存储,文件的属性信息存储在管理服务器上,数据信息存储在数据服务器节点上,并将数据分片以二进制文件形式存储在多个不同的服务器上,由于数据信息存储在多个服务器上,它们会并行对外传输数据,数据服务器的数量越多时,访问的效率越高,解决了当前SCADA海量历史信息的存储和访问问题。

Description

一种能源SCADA海量数据分布式处理系统及其方法
技术领域
本发明涉及技术领域,尤其涉及一种能源SCADA海量数据分布式处理系统及其方法。
背景技术
随着互联网的飞速发展,能源自动化领域也受到+互联网和互联网+的影响,应用需求涉及面越来越广,需要实时采集的信息量越来越大,海量的历史数据给网络、信息处理和存储系统造成了极大的负担,而且面对用户随机提出的查询需求,对关系数据库预先建索引就失去了价值,从海量信息中遍历查询某个字段的效率较低。
SCADA系统是一类功能强大的计算机远程控制与数据采集系统,它综合利用了计算机技术、控制技术、通信与网络技术,完成了对测控点分散的各种过程或设备的实时数据采集,本地或远程的自动控制,以及生产过程的全面实时监控,并为安全生产、调度、管理、优化和故障诊断提供必要和完整的数据及技术手段。能源SCADA系统中设备种类多、信息量大、采集点多,同时由于各种应用的实际需要,通常需要把采集的数据保留一段很长的时间,用于查询、分析和统计。另外,数据的实时性要求高,对数据点就要保持较高的采样频率,采样频率一般包括秒级和分钟级。这样,数据会呈现爆发式的增长,如果不能对采集的数据信息进行及时的处理,就会产生数据丢失的问题。
面对数据量的迅速增长,通常有两种解决方案,一种是使用更好的硬件,另一种就是分布式处理,将数据分散处理。但是硬件通常是有物理极限的,达到极限以后,处理能力就不能再增加了,而后者只需要普通的服务器,成本很低,而且理论上可以无限扩展。
现有技术中,对大量数据的采集、处理和存储采用的方法是:
1)前置服务器采集电力数据,并将数据组装成报文,以消息的形式发放到总线上;各服务器读取各自订阅的消息报文,解析得到的数据放入实时库;实时库的数据不断被刷新;
2)数据以不同的采样频率刷入开源实时库,根据频率不同,对应开源分布式数据库中的表结构不同;
3)同一地区的数据放在相邻行,数据按照键值对形式存储。
其技术缺点是使用传统关系数据库集中存储,系统复杂,在无索引的情况下,随机大数据量访问效率低,并且可扩展性差。另外,通过应用程序对数据的处理和分析受限,灵活性差。
发明内容
有鉴于现有技术的上述缺陷,本发明所要解决的技术问题是提供一种能源SCADA海量数据的分布式处理系统及其方法,其将海量历史数据的存储文件的路径、时间等属性信息和数据本身分开存储,文件的属性信息存储在管理服务器上,数据信息存储在数据服务器节点上,并将数据分片以二进制文件形式存储在多个不同的服务器上,以便于海量信息的存储,文件属性信息的作用相当于编程语言里的指针,指向数据本身。当访问历史数据时,首先访问控制服务器,然后快速定位到目标主机,并从指定的文件中读取信息。由于数据信息存储在多个服务器上,它们会并行对外传输数据,数据服务器的数量越多时,访问的效率越高,解决了当前SCADA海量历史信息的存储和访问问题。
为实现上述目的,本发明提供了一种能源SCADA海量数据分布式处理系统,其特征在于:包括客户端、实时通信节点、管理服务器和分布式数据服务器,所述客户端通过互联网与实时通信节点相连接,所述实时通信节点与管理服务器连接,所述管理服务器通过以太网与分布式数据服务器相连接;所述实时通信节点包括实时库和配置库,所述管理服务器包括主管理服务器和备管理服务器,所述分布式数据服务器包括多个主存储节点和多个备存储节点。
一种能源SCADA海量数据分布式处理方法,其特征在于,包括以下步骤:
S1、客户端首先通过配置工具配置所有的IO点及属性信息,将配置信息存储到配置库中,配置数据是通过关系数据库来管理,并生成xml文件,即配置文件;
S2、实时库产生的数据包括模拟量、数字量、字符和报警信息,模拟量暂时存储到本地的缓存中,数字量是在发生变化时主动发动给管理服务器,报警信息是在发生报警时主动发送给管理服务器;
S3、管理服务器中启动了三个线程去采集或接收实时库中产生的数据信息,这三个线程分别是analog线程、digital线程和alarm线程,analog线程按照配置的频率去实时库中采集模拟量数据,digital线程和alarm时刻监听着各自的端口,如果监听到消息则立即接收;
S4、管理服务器将接收到的数据先进行报文解析,根据配置文件进行过滤,丢弃配置文件中不需要保存的IO点,对需要保存的IO点进行检查,若非本月首次存储,则存储到本月其他数据已分配的主机中,否则,按照一定的分配策略重新分配到不同的分布式数据服务器的各个存储节点中,将存储文件的路径和时间信息存放在管理服务器中;
S5、每一个存储服务器都会在管理服务器中进行注册,注册完成后,管理服务器中会生成主机名到IP的映射表,一个主机名映射两个IP,分别是主存储节点和备存储节点的IP,主存储节点的IP会被优先访问;当主存储节点出现故障时,管理服务器检测到后会将备存储节点的IP置为优先级最高,同时,备存储节点立即替代故障的节点工作;其中,任一组存储节点包括n个存储服务器,分别存储一部分历史数据;
S6、当有IO点数据需要存储时,管理服务器就会根据已注册的所有主机名来分配数据,并根据路由表将要存储的数据路由到目的主机,这些工作由RRM进程(RegisterandRouterManager,注册和路由管理)来完成;
S7、数据被传输到分布式数据服务器后,先暂时存储在内存中,然后每隔一段时间把内存中的数据转移到硬盘中,在硬盘中以二进制文件的形式进行存储,存储路径是固定的,存储路径采用“tagName/attribute/具体的月份”三层文件夹的格式,如果某个文件夹不存在,就新建一个对应名字的文件夹。
进一步地,所述步骤S6中RRM进程的执行过程为:客户端不需要知道要访问的数据存放的位置,只需将请求提交给RRM进程,RRM进程知道目标数据在哪个主机,然后将请求转发给目标服务进程,目标服务进程读取数据后直接传输给客户端进程。
进一步地,所述步骤S4的分配策略为:分配策略采用一致性哈希方法和固定分配相结合的方式,同一个月的数据被固定分配到同一个存储节点上;当月份发生改变时,再采用一致性哈希方法计算出要被分配的下一个节点编号;当需要查询某个点的某一段时间的数据时,根据月份直接定位到数据所在的存储节点。
进一步地,所述采用的一致性哈希方法过程如下:
1)使用哈希函数H(m)=mMODn,其中n=232;其哈希值空间为0-(232-1),每个空间可以看做一个桶,将编号为0-(232-1)的桶头尾相连,形成一个虚拟环;
2)把月份m通过步骤1)中使用的哈希函数计算出对应的key值,然后散列到虚拟环上;
3)把存储节点的主机名作为输入值通过同步骤1)一样的哈希函数也映射到虚拟环中,然后以顺时针的方向计算,将所有月份m存储到离自己最近的机器中。
进一步地,所述步骤S7中数据文件存储在月份文件夹下,二进制文件以一天来分割进行存储,即不同一天的数据存储在不同的二进制文件中;如果是模拟量,则二进制文件以具体的日期和采样频率的组合来命名,采样频率可以在配置库中进行配置;如果是数字量,二进制文件以具体的日期命名,二进制文件中每一条都要存储具体时间,而数据信息只用存储第一条数据,以后只用存储相对于第一条数据的偏移量;如果是字符,则二进制文件以具体的日期命名,而且全部存储;当超过设置的最大值时,自动删除存储时间最早的文件。
进一步地,所述步骤S5中对某个IO点的某一段时间的数据进行访问时,客户端会将查询请求先提交给管理服务器,管理服务器进行报文解析,根据存储时的哈希算法计算出目标主机,然后根据路由表把查询信息路由到目标主机。
进一步地,所述查询信息路由到目标主机分三种情况:
1)如果查询的是同一天的数据,则查询进程会先在目的主机中的内存中查找,当内存中没有请求的数据时,再到硬盘中的tagName(点名)和月份文件夹下找到对应的二进制文件,然后根据具体的时间计算出偏移量,定位到文件中的某一行或者某几行,然后读取;
2)如果查询的是同月份的不同N天的数据,则开启N个线程分别读取,具体方法同步骤1);
3)如果查询的是不同月份的数据,则分别到对应的主机中的二进制文件中读取数据,具体方法同步骤1)。
本发明的有益效果是:
1)数据以天为单位进行存储,且同一个月的数据存储在同一个主机中,数据分散和集中存储相结合,灵活性好,便于访问和管理;
2)数据文件的属性信息在管理服务器中,数据文件本身在数据服务器中,控制信息和数据信息分开存储,耦合程度低,可扩展性强;
3)数据以二进制文件形式存储,读写效率高,而且节约存储空间,一定程度上实现了无损数据压缩;
4)可以借助应用程度对二进制文件进行复杂的数据分析,操作速度快且不易出错;
5)当数据量很大时,数据分片存储在不同的主机上,能够快速定位到数据的位置,同时从多个主机上读取信息,再进行整合,提高了访问效率;
6)管理服务器和数据服务器均采用热备份,当主服务器出现故障时,备服务器立即替代其工作,不会产生数据的丢失。
以下将结合附图对本发明的构思、具体结构及产生的技术效果作进一步说明,以充分地了解本发明的目的、特征和效果。
附图说明
图1是本发明的分布式存储体系结构结构示意图;
图2是本发明的数据过滤存储流程图;
图3是本发明的消息路由流程图;
图4是本发明的数据查询流程图。
具体实施方式
如图1所示,一种能源SCADA海量数据分布式处理系统,其特征在于:包括客户端1、实时通信节点2、管理服务器3和分布式数据服务器4,所述客户端1通过互联网与实时通信节点2相连接,所述实时通信节点2与管理服务器3连接,所述管理服务器3通过以太网与分布式数据服务器4相连接;所述实时通信节点2包括实时库21和配置库22,所述管理服务器3包括主管理服务器31和备管理服务器32,所述分布式数据服务器4包括多个主存储节点41和多个备存储节点42。
图1所示为整个分布式体系结构,客户端1首先通过配置工具配置所有的IO点及属性信息,将配置信息存储到配置库22中,配置数据是通过关系数据库来管理,并生成xml文件,即配置文件。实时库21产生的数据包括模拟量、数字量、字符和报警信息。模拟量会存储会暂时到本地的缓存中,数字量是在发生变化时主动发动给管理服务器,报警信息是在发生报警时主动发送给管理服务器。
管理服务器3中启动了三个线程去采集或接收实时库中产生的数据信息,这三个线程分别是analog线程、digital线程和alarm线程,analog线程按照配置的频率去实时库中采集模拟量数据,digital线程和alarm时刻监听着各自的端口,如果监听到消息则立即接收。
如图2所示,管理服务器3将接收到的数据先进行报文解析,根据配置文件进行过滤,丢弃配置文件中不需要保存的IO点,对需要保存的IO点进行检查,若非本月首次存储,则存储到本月其他数据已分配的主机中,否则,按照一定的分配策略重新分配到不同的分布式存储服务器节点中。将存储文件的路径和时间信息存放在管理服务器中。
管理服务器3包括一个主管理服务器31和一个备管理服务器32,主管理服务器31的信息有变化时,就会同步到备管理服务器32中。当主管理服务器31宕机后,备管理服务器32自动启动。
分布式数据服务器4是由两组服务器组成,一组主存储节点41,另一组为备存储节点42,正常情况下是主存储节点41在工作,它们会把各自的心跳信息发给管理服务器3和被服务节点;主存储节点41将接收到最新数据时,同时会发送给备存储节点42一份,主备服务节点存储着同样的两份数据,一起到容灾的作用。
每一个存储服务器都会在管理服务器3中进行注册,注册完成后,管理服务器3中会生成主机名到IP的映射表,一个主机名映射两个IP,分别是主存储节点41和备存储节点42的IP,主存储节点41的IP会被优先访问。当主存储节点41出现故障时,管理服务器3检测到后会将备存储节点42的IP置为优先级最高,同时,备存储节点42立即替代故障的节点工作。其中,任一组存储节点包括n个存储服务器,分别存储一部分历史数据。
当有IO点数据需要存储时,管理服务器就会根据已注册的所有主机名来分配数据,并根据路由表将要存储的数据路由到目的主机。这些工作由RRM(RegisterandRouterManager,注册和路由管理)进程来完成。这是一个应用程序,负责数据服务器节点的注册和路由管理工作,当有新增加的数据服务器时,会通过RRM在管理服务器中进行注册登记。客户端进程不需要知道其要访问的数据的存储位置,只需将请求交给RRM,RRM再将请求传输给合适的主机,主机将请求结果直接送给客户端。如图3所示,客户端不需要知道要访问的数据存放的位置,只需将请求提交给RRM进程,RRM进程知道目标数据在哪个主机,然后将请求转发给目标服务进程,目标服务进程读取数据后直接传输给客户端进程。
分配策略采用一致性哈希方法和固定分配相结合的方式,同一个月的数据被固定分配到同一个存储节点上,当月份发生改变时,再采用一致性哈希方法计算出要被分配的下一个节点编号。当需要查询某个点的某一段时间的数据时,根据月份直接定位到数据所在的存储节点。采用的一致性哈希方法过程如下:
1)使用哈希函数H(m)=mMODn,其中n=232;其哈希值空间为0~(232-1),每个空间可以看做一个桶,将编号为0~(232-1)的桶头尾相连,形成一个虚拟环;
2)把月份m通过1)中使用的哈希函数计算出对应的key值,然后散列到虚拟环上;
3)把存储节点的主机名作为输入值通过同1)一样的哈希函数也映射到虚拟环中,然后以顺时针的方向计算,将所有月份m存储到离自己最近的机器中。
一致性哈希方法有较好的容错性和可扩展性,当有存储节点增加时,一致性哈希方法使数据的迁移达到了最小,减小了服务器的压力,避免了普通哈希方法造成大量数据存储原始位置失效的问题。
数据被传输到节点服务器后,先暂时存储在内存中,然后每隔一段时间把内存中的数据转移到硬盘中。在硬盘中以二进制文件的形式进行存储,存储路径是固定的,存储路径采用“tagName/attribute/具体的月份”三层文件夹的格式,如果某个文件夹不存在,就新建一个对应名字的文件夹。数据文件存储在月份文件夹下,二进制文件以一天来分割进行存储,即不同一天的数据存储在不同的二进制文件中,比较方便管理。如果是模拟量,则二进制文件以具体的日期和采样频率的组合来命名,采样频率可以在配置库中进行配置,这样可以根据需要针对不同的IO点采用不同的采样频率,使得采样更加灵活。在二进制文件中只需要存储第一条数据的具体时间,以后的数据根据采样频率就可以计算出来,这样就可以节省存储空间。如果是数字量,由于数字量是被动接收数据的,接收数据的时间是不确定的,则二进制文件以具体的日期命名,二进制文件中每一条都要存储具体时间,而数据信息只用存储第一条数据,以后只用存储相对于第一条数据的偏移量,这样也可以节省存储空间。如果是字符,则二进制文件以具体的日期命名,而且全部存储。由于存储空间是有限的,当超过设置的最大值时,自动删除存储时间最早的文件。
由于要存储的IO数据有固定的格式,而且也没有复杂的数据关系管理,因此这里选择用二进制文件存储,二进制文件具有如下优点:
1)读写效率高;
2)以二进制的形式存储数据,比文本文件以ASCII码的形式存储数据在一定程度了节约了存储空间;
3)文本文件在写字符的时候,会把所有的“\n”转换成“\r\n”,读字符的时候会把“\r\n”转换成“\n”,而二进制文件不存在这些隐式转换;
以上主要是针对windows而言,linux中所有的文件都是二进制形式的,因此二进制文件跨平台性能更好。
如图4示,对某个IO点的某一段时间的数据进行访问时,客户端会将查询请求先提交给管理服务器,管理服务器进行报文解析,根据存储时的哈希算法计算出目标主机,然后根据路由表把查询信息路由到目标主机,根据查询的时间,可以分为三种情况:
1)如果查询的是同一天的数据,则查询进程会先在目的主机中的内存中查找,当内存中没有请求的数据时,再到硬盘中的tagName(点名)和月份文件夹下找到对应的二进制文件,然后根据具体的时间计算出偏移量,定位到文件中的某一行或者某几行,然后读取;
2)如果查询的是同月份的不同N天的数据,则开启N个线程分别读取,具体方法同1);
3)如果查询的是不同月份的数据,则分别到对应的主机中的二进制文件中读取数据,具体方法同1)。
这样,当读取一个月的数据时,数据量还不是很大,磁盘IO不会成为瓶颈;当查询半年以上甚至一年的数据时,可以从多个主机中同时并行读取数据,再进行合并,有效地避免了数据集中存储在一个主机中的磁盘IO问题,大大提高了查询效率。
以上详细描述了本发明的较佳具体实施例。应当理解,本领域的普通技术人员无需创造性劳动就可以根据本发明的构思做出诸多修改和变化。因此,凡本技术领域中技术人员依本发明的构思在现有技术的基础上通过逻辑分析、推理或者有限的实验可以得到的技术方案,皆应在由权利要求书所确定的保护范围内。

Claims (8)

1.一种能源SCADA海量数据分布式处理系统,其特征在于:包括客户端(1)、实时通信节点(2)、管理服务器(3)和分布式数据服务器(4),所述客户端(1)通过互联网与实时通信节点(2)相连接,所述实时通信节点(2)与管理服务器(3)连接,所述管理服务器(3)通过以太网与分布式数据服务器(4)相连接;所述实时通信节点(2)包括实时库(21)和配置库(22),所述管理服务器(3)包括主管理服务器(31)和备管理服务器(32),所述分布式数据服务器(4)包括多个主存储节点(41)和多个备存储节点(42)。
2.如权利要求1所述的一种能源SCADA海量数据分布式处理方法,其特征在于,包括以下步骤:
S1、客户端(1)首先通过配置工具配置所有的IO点及属性信息,将配置信息存储到配置库(22)中,配置数据是通过关系数据库来管理,并生成xml文件,即配置文件;
S2、实时库(21)产生的数据包括模拟量、数字量、字符和报警信息,模拟量暂时存储到本地的缓存中,数字量是在发生变化时主动发动给管理服务器(3),报警信息是在发生报警时主动发送给管理服务器(3);
S3、管理服务器(3)中启动了三个线程去采集或接收实时库中产生的数据信息,这三个线程分别是analog线程、digital线程和alarm线程,analog线程按照配置的频率去实时库(21)中采集模拟量数据,digital线程和alarm时刻监听着各自的端口,如果监听到消息则立即接收;
S4、管理服务器(3)将接收到的数据先进行报文解析,根据配置文件进行过滤,丢弃配置文件中不需要保存的IO点,对需要保存的IO点进行检查,若非本月首次存储,则存储到本月其他数据已分配的主机中,否则,按照一定的分配策略重新分配到不同的分布式数据服务器(4)的各个存储节点中,将存储文件的路径和时间信息存放在管理服务器(3)中;
S5、每一个存储服务器都会在管理服务器中(3)进行注册,注册完成后,管理服务器(3)中会生成主机名到IP的映射表,一个主机名映射两个IP,分别是主存储节点(41)和备存储节点(42)的IP,主存储节点(41)的IP会被优先访问;当主存储节点(41)出现故障时,管理服务器(3)检测到后会将备存储节点(42)的IP置为优先级最高,同时,备存储节点(42)立即替代故障的节点工作;其中,任一组存储节点包括n个存储服务器,分别存储一部分历史数据;
S6、当有IO点数据需要存储时,管理服务器(3)就会根据已注册的所有主机名来分配数据,并根据路由表将要存储的数据路由到目的主机,这些工作由RRM进程(RegisterandRouterManager,注册和路由管理)来完成;
S7、数据被传输到分布式数据服务器(4)后,先暂时存储在内存中,然后每隔一段时间把内存中的数据转移到硬盘中,在硬盘中以二进制文件的形式进行存储,存储路径是固定的,存储路径采用“tagName/attribute/具体的月份”三层文件夹的格式,如果某个文件夹不存在,就新建一个对应名字的文件夹。
3.如权利要求2所述的一种能源SCADA海量数据分布式处理系统及其方法,其特征在于,所述步骤S6中RRM进程的执行过程为:客户端(1)不需要知道要访问的数据存放的位置,只需将请求提交给RRM进程,RRM进程知道目标数据在哪个主机,然后将请求转发给目标服务进程,目标服务进程读取数据后直接传输给客户端进程。
4.如权利要求2所述的一种能源SCADA海量数据分布式处理系统及其方法,其特征在于,所述步骤S4的分配策略为:分配策略采用一致性哈希方法和固定分配相结合的方式,同一个月的数据被固定分配到同一个存储节点上;当月份发生改变时,再采用一致性哈希方法计算出要被分配的下一个节点编号;当需要查询某个点的某一段时间的数据时,根据月份直接定位到数据所在的存储节点。
5.如权利要求4所述的一种能源SCADA海量数据分布式处理系统及其方法,其特征在于,所述采用的一致性哈希方法过程如下:
使用哈希函数H(m)=mMODn,其中n=232;其哈希值空间为0-(232-1),每个空间可以看做一个桶,将编号为0-(232-1)的桶头尾相连,形成一个虚拟环;
把月份m通过步骤1)中使用的哈希函数计算出对应的key值,然后散列到虚拟环上;
把存储节点的主机名作为输入值通过同步骤1)一样的哈希函数也映射到虚拟环中,然后以顺时针的方向计算,将所有月份m存储到离自己最近的机器中。
6.如权利要求2所述的一种能源SCADA海量数据分布式处理系统及其方法,其特征在于,所述步骤S7中数据文件存储在月份文件夹下,二进制文件以一天来分割进行存储,即不同一天的数据存储在不同的二进制文件中;如果是模拟量,则二进制文件以具体的日期和采样频率的组合来命名,采样频率可以在配置库中进行配置;如果是数字量,二进制文件以具体的日期命名,二进制文件中每一条都要存储具体时间,而数据信息只用存储第一条数据,以后只用存储相对于第一条数据的偏移量;如果是字符,则二进制文件以具体的日期命名,而且全部存储;当超过设置的最大值时,自动删除存储时间最早的文件。
7.如权利要求2所述的一种能源SCADA海量数据分布式处理系统及其方法,其特征在于,所述步骤S5中对某个IO点的某一段时间的数据进行访问时,客户端(1)会将查询请求先提交给管理服务器(3),管理服务器(3)进行报文解析,根据存储时的哈希算法计算出目标主机,然后根据路由表把查询信息路由到目标主机。
8.如权利要求7所述的一种能源SCADA海量数据分布式处理系统及其方法,其特征在于,所述查询信息路由到目标主机分三种情况:
1)如果查询的是同一天的数据,则查询进程会先在目的主机中的内存中查找,当内存中没有请求的数据时,再到硬盘中的tagName(点名)和月份文件夹下找到对应的二进制文件,然后根据具体的时间计算出偏移量,定位到文件中的某一行或者某几行,然后读取;
2)如果查询的是同月份的不同N天的数据,则开启N个线程分别读取,具体方法同步骤1);
3)如果查询的是不同月份的数据,则分别到对应的主机中的二进制文件中读取数据,具体方法同步骤1)。
CN201510541792.8A 2015-08-28 2015-08-28 一种能源scada海量数据分布式处理系统及其方法 Active CN105117171B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510541792.8A CN105117171B (zh) 2015-08-28 2015-08-28 一种能源scada海量数据分布式处理系统及其方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510541792.8A CN105117171B (zh) 2015-08-28 2015-08-28 一种能源scada海量数据分布式处理系统及其方法

Publications (2)

Publication Number Publication Date
CN105117171A true CN105117171A (zh) 2015-12-02
CN105117171B CN105117171B (zh) 2018-11-30

Family

ID=54665174

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510541792.8A Active CN105117171B (zh) 2015-08-28 2015-08-28 一种能源scada海量数据分布式处理系统及其方法

Country Status (1)

Country Link
CN (1) CN105117171B (zh)

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106445991A (zh) * 2016-06-30 2017-02-22 中国石化销售有限公司 加气站scada系统海量数据处理方法
CN106528618A (zh) * 2016-09-30 2017-03-22 许继集团有限公司 一种电网监控系统数据存储查询的方法、装置及系统
CN106713465A (zh) * 2016-12-27 2017-05-24 北京锐安科技有限公司 一种分布式存储系统
CN106708439A (zh) * 2016-12-23 2017-05-24 深圳市中博科创信息技术有限公司 一种分布式文件系统中节点选择计算方法及系统
CN106980540A (zh) * 2017-03-07 2017-07-25 清华大学 一种分布式多维离散数据的计算方法
CN107347093A (zh) * 2017-07-03 2017-11-14 北京京东尚科信息技术有限公司 用于分布式服务器系统的配置方法和装置
CN108509296A (zh) * 2018-03-19 2018-09-07 网宿科技股份有限公司 一种处理设备故障的方法和系统
CN108762612A (zh) * 2018-05-24 2018-11-06 维沃移动通信有限公司 一种操作方法及移动终端
CN109257403A (zh) * 2017-07-14 2019-01-22 杭州海康威视数字技术股份有限公司 数据存储方法及设备、分布式存储系统
CN109299121A (zh) * 2018-09-13 2019-02-01 南京国电南自轨道交通工程有限公司 一种scada系统历史报警高效查询方法
CN109597811A (zh) * 2018-11-26 2019-04-09 湖南节点新火信息安全有限公司 一种分布式安全数据库链块存储方法
CN110308998A (zh) * 2019-07-11 2019-10-08 中通服创立信息科技有限责任公司 一种海量数据的采样方法及装置
CN110971872A (zh) * 2019-11-14 2020-04-07 北京中盾安全技术开发公司 一种基于分布式集群的视频图像信息采集方法
CN111125261A (zh) * 2020-03-31 2020-05-08 四川新网银行股份有限公司 基于分布式缓存的数据传输方法
CN111445349A (zh) * 2020-03-13 2020-07-24 贵州电网有限责任公司 一种适用于能源互联网的混合式数据存储处理方法及系统
CN112207833A (zh) * 2020-10-16 2021-01-12 深圳市华成工业控制股份有限公司 一种运动路径的规划方法、系统、主机及存储介质
CN112788070A (zh) * 2019-11-01 2021-05-11 千寻位置网络有限公司 碰撞检测预警系统及其方法
CN117406924A (zh) * 2023-10-19 2024-01-16 合肥力高动力科技有限公司 一种bms中基于tf卡的数据存储方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101339570A (zh) * 2008-08-12 2009-01-07 北京航空航天大学 一种高效的海量遥感数据分布式组织管理方法
CN102012946A (zh) * 2010-12-22 2011-04-13 武汉上博科技有限公司 一种高效的安全监控视频/图像数据存储方法
CN102375853A (zh) * 2010-08-24 2012-03-14 中国移动通信集团公司 分布式数据库系统、在其中建立索引的方法和查询方法
CN102737127A (zh) * 2012-06-20 2012-10-17 厦门聚海源物联网络技术有限公司 一种海量数据存储方法
CN103116661A (zh) * 2013-03-20 2013-05-22 广东宜通世纪科技股份有限公司 一种数据库的数据处理方法
CN103905530A (zh) * 2014-03-11 2014-07-02 浪潮集团山东通用软件有限公司 一种高性能全局负载均衡的分布式数据库数据路由方法
US20140277797A1 (en) * 2013-03-15 2014-09-18 Open Access Technology International, Inc. Systems and Methods of Determining Optimal Scheduling and Dispatch of Power Resources

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101339570A (zh) * 2008-08-12 2009-01-07 北京航空航天大学 一种高效的海量遥感数据分布式组织管理方法
CN102375853A (zh) * 2010-08-24 2012-03-14 中国移动通信集团公司 分布式数据库系统、在其中建立索引的方法和查询方法
CN102012946A (zh) * 2010-12-22 2011-04-13 武汉上博科技有限公司 一种高效的安全监控视频/图像数据存储方法
CN102737127A (zh) * 2012-06-20 2012-10-17 厦门聚海源物联网络技术有限公司 一种海量数据存储方法
US20140277797A1 (en) * 2013-03-15 2014-09-18 Open Access Technology International, Inc. Systems and Methods of Determining Optimal Scheduling and Dispatch of Power Resources
CN103116661A (zh) * 2013-03-20 2013-05-22 广东宜通世纪科技股份有限公司 一种数据库的数据处理方法
CN103905530A (zh) * 2014-03-11 2014-07-02 浪潮集团山东通用软件有限公司 一种高性能全局负载均衡的分布式数据库数据路由方法

Cited By (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106445991B (zh) * 2016-06-30 2019-03-08 中国石化销售有限公司 加气站scada系统海量数据处理方法
CN106445991A (zh) * 2016-06-30 2017-02-22 中国石化销售有限公司 加气站scada系统海量数据处理方法
CN106528618A (zh) * 2016-09-30 2017-03-22 许继集团有限公司 一种电网监控系统数据存储查询的方法、装置及系统
CN106708439A (zh) * 2016-12-23 2017-05-24 深圳市中博科创信息技术有限公司 一种分布式文件系统中节点选择计算方法及系统
CN106713465A (zh) * 2016-12-27 2017-05-24 北京锐安科技有限公司 一种分布式存储系统
CN106713465B (zh) * 2016-12-27 2020-11-17 北京锐安科技有限公司 一种分布式存储系统
CN106980540A (zh) * 2017-03-07 2017-07-25 清华大学 一种分布式多维离散数据的计算方法
CN107347093A (zh) * 2017-07-03 2017-11-14 北京京东尚科信息技术有限公司 用于分布式服务器系统的配置方法和装置
CN109257403A (zh) * 2017-07-14 2019-01-22 杭州海康威视数字技术股份有限公司 数据存储方法及设备、分布式存储系统
CN109257403B (zh) * 2017-07-14 2022-01-18 杭州海康威视数字技术股份有限公司 数据存储方法及设备、分布式存储系统
WO2019178891A1 (zh) * 2018-03-19 2019-09-26 网宿科技股份有限公司 一种处理设备故障的方法和系统
CN108509296A (zh) * 2018-03-19 2018-09-07 网宿科技股份有限公司 一种处理设备故障的方法和系统
CN108762612A (zh) * 2018-05-24 2018-11-06 维沃移动通信有限公司 一种操作方法及移动终端
CN108762612B (zh) * 2018-05-24 2021-06-04 维沃移动通信有限公司 一种操作方法及移动终端
CN109299121B (zh) * 2018-09-13 2022-02-15 南京国电南自轨道交通工程有限公司 一种scada系统历史报警高效查询方法
CN109299121A (zh) * 2018-09-13 2019-02-01 南京国电南自轨道交通工程有限公司 一种scada系统历史报警高效查询方法
CN109597811A (zh) * 2018-11-26 2019-04-09 湖南节点新火信息安全有限公司 一种分布式安全数据库链块存储方法
CN110308998B (zh) * 2019-07-11 2021-09-07 中通服创立信息科技有限责任公司 一种海量数据的采样方法及装置
CN110308998A (zh) * 2019-07-11 2019-10-08 中通服创立信息科技有限责任公司 一种海量数据的采样方法及装置
CN112788070B (zh) * 2019-11-01 2022-10-11 千寻位置网络有限公司 碰撞检测预警系统及其方法
CN112788070A (zh) * 2019-11-01 2021-05-11 千寻位置网络有限公司 碰撞检测预警系统及其方法
CN110971872A (zh) * 2019-11-14 2020-04-07 北京中盾安全技术开发公司 一种基于分布式集群的视频图像信息采集方法
CN111445349A (zh) * 2020-03-13 2020-07-24 贵州电网有限责任公司 一种适用于能源互联网的混合式数据存储处理方法及系统
CN111445349B (zh) * 2020-03-13 2023-09-05 贵州电网有限责任公司 一种适用于能源互联网的混合式数据存储处理方法及系统
CN111125261A (zh) * 2020-03-31 2020-05-08 四川新网银行股份有限公司 基于分布式缓存的数据传输方法
CN112207833B (zh) * 2020-10-16 2021-08-17 深圳市华成工业控制股份有限公司 一种运动路径的规划方法、系统、主机及存储介质
CN112207833A (zh) * 2020-10-16 2021-01-12 深圳市华成工业控制股份有限公司 一种运动路径的规划方法、系统、主机及存储介质
CN117406924A (zh) * 2023-10-19 2024-01-16 合肥力高动力科技有限公司 一种bms中基于tf卡的数据存储方法

Also Published As

Publication number Publication date
CN105117171B (zh) 2018-11-30

Similar Documents

Publication Publication Date Title
CN105117171A (zh) 一种能源scada海量数据分布式处理系统及其方法
US20130031229A1 (en) Traffic reduction method for distributed key-value store
CN103067525B (zh) 一种基于特征码的云存储数据备份方法
US9424274B2 (en) Management of intermediate data spills during the shuffle phase of a map-reduce job
CN104486445B (zh) 一种基于云平台的分布式可扩展资源监控系统
CN110225074B (zh) 一种基于设备地址域的通讯报文分发系统及分发方法
CN109933631A (zh) 基于Infiniband网络的分布式并行数据库系统及数据处理方法
CN103345508B (zh) 一种适用于社会网络图的数据存储方法及系统
CN111258978B (zh) 一种数据存储的方法
CN105608188A (zh) 数据处理方法和数据处理装置
CN105138615A (zh) 一种构建大数据分布式日志的方法和系统
CN103617287A (zh) 一种分布式环境下的日志管理方法和装置
CN104778188A (zh) 一种分布式设备日志采集方法
CN105303456A (zh) 电力传输设备监控数据处理方法
CN106934048A (zh) 数据在线迁移方法、代理节点
CN103927331A (zh) 数据查询方法、装置及系统
CN107784098A (zh) 实时数据仓库平台
CN113900810A (zh) 分布式图处理方法、系统及存储介质
CN106156328A (zh) 一种银行运行日志数据监控方法及系统
CN104486116A (zh) 多维度查询流量数据的方法及系统
CN104468274A (zh) 一种集群监控管理方法及系统
US20180052858A1 (en) Methods and procedures for timestamp-based indexing of items in real-time storage
CN104281980B (zh) 基于分布式计算的火力发电机组远程诊断方法及系统
CN102480489A (zh) 一种用于分布式环境下的日志记录方法和设备
CN103823846A (zh) 一种基于图论的大数据存储及查询方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information
CB02 Change of applicant information

Address after: 210032 Jiangsu province Nanjing city Pukou high tech Zone Huidalu No. 9

Applicant after: Nanjing Guodian Nanzi 710086 Automation Co. Ltd.

Address before: Spark Road, Pukou high tech Development Zone, Nanjing City, Jiangsu Province, No. 8 210032

Applicant before: Nanjing Guodian Nanzi Meizhuo Control System Co.,Ltd.

GR01 Patent grant
GR01 Patent grant