CN105608144A - 一种基于多层模型迭代的大数据分析平台装置及方法 - Google Patents

一种基于多层模型迭代的大数据分析平台装置及方法 Download PDF

Info

Publication number
CN105608144A
CN105608144A CN201510954797.3A CN201510954797A CN105608144A CN 105608144 A CN105608144 A CN 105608144A CN 201510954797 A CN201510954797 A CN 201510954797A CN 105608144 A CN105608144 A CN 105608144A
Authority
CN
China
Prior art keywords
data
monitoring
result
memory
time series
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510954797.3A
Other languages
English (en)
Other versions
CN105608144B (zh
Inventor
丁书耕
邢宏伟
张建辉
王震
丛兴滋
刘涛
杨立涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong Luruan Digital Technology Co Ltd
Original Assignee
Shandong Luneng Software Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong Luneng Software Technology Co Ltd filed Critical Shandong Luneng Software Technology Co Ltd
Priority to CN201510954797.3A priority Critical patent/CN105608144B/zh
Publication of CN105608144A publication Critical patent/CN105608144A/zh
Application granted granted Critical
Publication of CN105608144B publication Critical patent/CN105608144B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/283Multi-dimensional databases or data warehouses, e.g. MOLAP or ROLAP
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases

Abstract

一种基于多层模型迭代的大数据分析平台装置及方法,包括依次连接的数据源获取装置、数据整合单元、时序数据存储器、计算单元、无线终端和数据服务终端,可以快速、高效、及时地处理海量实时数据,同时保证设备安全、稳定、高效地运行。

Description

一种基于多层模型迭代的大数据分析平台装置及方法
技术领域
本发明涉及设备监测分析应用领域,具体涉及到一种基于多层模型迭代的大数据分析平台装置及方法。
背景技术
随着计算机技术的飞速发展,各行业的数据急速增长,数据量变的越来越大,类型也越来越多,数据结构也趋于复杂化,传统的数据库不但各设备独立放置,并且需要较大的部署空间,存在不易部署、成本较高等缺点,不能满足用户的一般要求。
时序数据是带时间标签的时间序列数据,其典型特点是产生频率快、严重依赖于采集时间、测点多信息量大。在电力行业中,为了保证设备安全、稳定、高效地运行,通常会对发电、变电等各类设备的运行状态进行实时监测,采集获得大量的时序数据可作为设备运行状态评估、设备运行故障预警、设备可靠性分析等高级应用的基础,因而,如何快速、高效、及时地处理海量实时数据,一直是电力、化工、石油、钢铁等重资产行业面临的一项重大课题。
电力行业中历史业务数据收集和分析、实时或准实时数据的即时分析是电力行业中信息化建设过程中比较重要的内容,它需要一套完整、稳定、契合实际业务场景的大数据分析装置的解决方案,对设备故障预警等实时分析类业务场景提供稳定可靠的底层数据支撑。
近年来,随着云计算、大数据、机器学习、数据挖掘等IT技术迅猛发展,分布式存储、高性能计算在理论研究和技术实践层面均获得了关键性突破,业界涌现出了一批以Hadoop为代表的大数据处理和应用解决方案。
Hadoop是一个分布式系统基础架构,包括分布式文件系统HDFS(HadoopDistributedFileSystem)、分布式存储系统HBase、并行计算编程模型MapReduce等几个核心部分,它可以极大地简化大规模数据的处理过程,但它在功能完整性、运行稳定性方面存在一定的局限性,而基于Hadoop衍生的一些商用大数据平台又跟电力业务场景的实际需求存在偏差,因而,深度分析研究电力行业的业务需求,构建一种基于分布式时序数据服务的大数据分析装置,具有深远的意义和较强的利用价值。
多层模型迭代计算是重资产行业中大数据多维度分析平台的重要应用,通过多层模型迭代计算,能够提高计算结果的精确度,对重资产行业中多维度的分析至关重要。
然而,目前并没有专门针对大数据分析平台装置而设计的结合了分布式系统基础架构以及多层模型迭代计算方式的装置。
发明内容
本发明的目的在于克服现有技术的不足,提供一种基于多层模型迭代的大数据分析平台装置及方法,可以快速、高效、及时地处理海量实时数据,同时保证设备安全、稳定、高效地运行。
本发明提供了一种基于多层模型迭代的大数据分析平台装置,包括依次连接的数据源获取装置、数据整合单元、时序数据存储器、计算单元、无线终端和数据服务终端,其中数据服务终端还分别与时序数据存储器、数据源获取装置和无线终端连接;
数据源获取装置,用于获取设备监测数据和常规的设备数据,并发送至数据整合单元;
数据整合单元,用于以接收来自数据源获取装置发送的设备监测数据和常规的设备数据,经过预处理后将结果发送给时序数据存储器;
时序数据存储器,用于存储预处理后的数据和配置数据,并且将访问频度高、性能要求高的数据集中缓存到时序数据存储器中的内存器;
计算单元,用于驱动调度引擎来调用和接收时序数据存储器存储的数据,并且依据预先编排好的处理逻辑对调用和接收的数据进行处理,训练形成数据挖掘模型,其中计算单元包括多个子计算单元M,数据挖掘模型为N层,其中每一层分别包括M1,M2,…,MN个子计算单元,第N层的每2个子计算单元的输出结果作为第N-1层子计算单元的输入,不断地执行迭代计算,最终得出第1层的计算结果,计算结果在计算引擎的调度下,通过数据连接器,解析成不同的表现形式后回传时序数据存储器和/或数据服务端;
数据服务端,包括数据服务端处理器、接口单元和显示装置,其中数据服务端处理器用于从时序数据存储器直接读取数据和/或接收来自计算单元处理后的数据,并且进行分析处理,将处理后的结果通过显示装置进行显示,同时通过接口单元将处理后的结果发送给无线终端;
无线终端,用于接收来自数据服务端发送的处理后的结果,并且能够无线发送控制命令至数据服务端,数据服务端接收到控制命令后控制数据源获取装置,调整数据源获取装置的数据采集频率。
进一步地,数据源获取装置包括监测传感器、监测数据存储器和设备数据存储器,其中监测数据存储器分别与监测传感器和数据整合单元连接,数据整合单元还连接设备数据存储器:
监测传感器,用于实时或准实时获取设备监测数据,并将采集到的设备监测数据传输给监测数据存储器;
监测数据存储器,用于将设备监测数据存储,并且以流式输出的方式,将设备监测数据输出至数据整合单元;
设备数据存储器,用于存储常规的设备数据,并且以批量输出的方式,将常规的设备数据输出至数据整合单元;
进一步地,数据连接器为关系型数据连接器、时序数据连接器和/或非结构化数据连接器。
进一步地,所述迭代计算的中间结果采用Redis集群式缓存的形式存储。
进一步地,还包括与数据整合单元连接的人工输入装置,用于在因安全要求实施了隔离措施或不支撑数据接入的情形下输入监测设备数据。
进一步地,配置数据为描述设备监测数据和/或常规的设备数据的业务含义数据、存储结构数据和/或处理逻辑数据。
进一步地,所述访问频度高、性能要求高的数据是指近期的监测数据、常规的设备数据,以及关注率较高的历史指标数据、模型元数据和预处理规则数据。
进一步地,数据服务端处理后的结果为故障预警结果和/或负荷预测结果。
进一步地,所述无线终端为笔记本电脑、平板电脑和/或手机。
本发明还提供了一种基于多层模型迭代的大数据分析平台装置的大数据分析方法,依次包括如下步骤:
(1)初始化,设置数据服务端的初始参数,根据设置好的初始参数控制监测传感器的采样周期为每秒6次,采样时间为1分钟,将1分钟内采样的数据求平均值A;
(2)在同样的初始参数条件下,重复步骤(1)3次,分别求得3次的平均值B、C、D;
(3)将平均值A、B、C、D求和后再求平均值P:
A.如果则监测传感器性能稳定,进入步骤(4);
B.如果则监测传感器性能不稳定,则进入步骤(1);
(4)实时或准实时获取设备监测数据,并将采集到的设备监测数据传输给监测数据存储器后存储,以流式输出的方式,将设备监测数据输出至数据整合单元;
(5)以批量接入的方式,通过预定义的调度计划自动获取设备数据存储器中的常规的设备数据,将设备监测数据和常规的设备数据以预处理规则进行数据的清洗、过滤、转换的预处理,并将预处理后的数据输出至时序数据存储器进行存储;
(6)将近期的监测数据、常规的设备数据,以及关注率较高的历史指标数据、模型元数据和预处理规则数据集中缓存到时序数据存储器中的内存器;
(7)通过计算单元驱动调度引擎来调用和接收时序数据存储器存储的数据,并且依据预先编排好的处理逻辑对调用和接收的数据进行处理,训练形成数据挖掘模型,其中计算单元包括多个子计算单元M,数据挖掘模型为N层,其中每一层分别包括M1,M2,…,MN个子计算单元,第N层的每2个子计算单元的输出结果作为第N-1层子计算单元的输入,不断地执行迭代计算,最终得出第1层的计算结果,计算结果在计算引擎的调度下,通过数据连接器,解析成不同的表现形式后回传时序数据存储器和/或数据服务端;
(8)从时序数据存储器直接读取数据和/或接收来自计算单元处理后的数据,并且进行分析处理,将处理后的结果通过显示装置进行显示,同时通过接口单元将处理后的结果发送给无线终端;
(9)通过无线终端接收来自数据服务端发送的处理后的结果,根据处理后的结果决定是否发送控制命令至数据服务端,数据服务端接收到控制命令后控制监测传感器,调整监测传感器的数据采集频率,其中处理后的结果为故障预警结果和/或负荷预测结果,根据处理后的结果决定是否发送控制命令至数据服务端满足:
A.当故障预警结果和/或负荷预测结果为正常时,降低监测传感器的数据采集频率;
B.当故障预警结果和/或负荷预测结果为不正常时,提高监测传感器的数据采集频率,并且重复步骤(1)-(9),同时在数据服务端发出警报,在数据服务端的显示装置上实时显示故障预警结果和/或负荷预测结果,并且通知维修人员。
本发明的大数据分析装置和方法,可以实现:
1)以稳定、可靠、高效的开源分布式存储系统和并行计算服务为核心,针对重资产行业时间序列数据存储和访问需求定向封装,为设备故障预警等实时分析类业务场景提供了稳定可靠的底层数据支撑;
2)实时和准时的采集数据,时效性高,并且优化设计了数据采集频率,采集效率高,能效低但是效能高,并且装置功能强大,可以使得监测和维修人员在远程控制和监控设备状态,即时处理,处理时效性更高,并且因为缩短了处理时间使得减少了设备损耗,节约了成本;
3)针对系统数据的可靠性,设计了平均值数据确认方案,使得监测数据更加稳定可靠,并且通过根据设备的实时状态调整监测频率,减轻了装置的工作负荷,使用寿命更长,性能更加稳定;
4)通过多层模型迭代计算,能够提高计算结果的精确度,对重资产行业中多维度的分析至关重要。
附图说明
图1大数据分析平台装置结构示意图
图2多层模型迭代计算方法流程图
具体实施方式
下面详细说明本发明的具体实施,有必要在此指出的是,以下实施只是用于本发明的进一步说明,不能理解为对本发明保护范围的限制,该领域技术熟练人员根据上述本发明内容对本发明做出的一些非本质的改进和调整,仍然属于本发明的保护范围。
本发明提供了一种基于多层模型迭代的大数据分析平台装置,如附图1所示,包括监测传感器1、监测数据存储器2、设备数据存储器3组成的数据源获取装置,还包括数据整合单元4、时序数据存储器5、计算单元6、无线终端8和数据服务终端7,其中监测数据存储器2分别与监测传感器1和数据整合单元4,数据整合单元4还分别连接设备数据存储器3和时序数据存储器5,数据整合单元4、时序数据存储器5、计算单元6和数据服务终端7依次连接,数据服务终端7还分别与时序数据存储器5、监测传感器1和无线终端8连接;
监测传感器,用于实时或准实时获取设备监测数据,并将采集到的设备监测数据传输给监测数据存储器,监测传感器为安装于监测设备上的信息采集传感器,还可以为监测设备安装区域的摄像头、温度检测器等传感器,监测数据存储器可以实时的将设备监测数据存储,并且以流式输出的方式,将设备监测数据输出至数据整合单元。
设备数据存储器用于存储常规的设备数据,并且以批量输出的方式,将常规的设备数据输出至数据整合单,其中常规的设备数据来自于系统配置管理,主要用于描述业务数据的业务含义、存储结构和处理逻辑,一般在系统配置阶段产生。
数据整合单元,用于以流式接入的方式接收来自监测数据存储器发送的设备监测数据和以批量接入的方式,通过预定义的调度计划自动获取设备数据存储器中的常规的设备数据,数据整合单元将采集到的数据通过批量接入、流式接入、人工导入等多种形式获取,也可以直接连接采集点获取监测数据。接入的数据在存储之前,可以进行必要的预处理,利用预先配置好的预处理规则进行清洗、过滤、转换等操作,数据经过数据整合或者直接存储到时序数据存储器中,对于一些规则等一些访问频率高的数据,一般存储在缓存数据中,对于一些历史业务数据,访问频率不大的数据,经过数据整合后,一般存储在业务数据中;对于系统定义的一些数据预处理规则,计算规则,模型数据等数据,一般存储在配置数据中;数据访问服务通过数据访问接口直接读取数据。无论是业务数据还是配置数据,其访问频度、性能需求在具体业务场景中存在较大的差异,对于访问频度高、性能要求高的数据,系统将其集中缓存到了系统内存中,这些被缓存的业务数据和配置数据统称为缓存数据。一般而言,近期的业务数据、关注率较高的历史指标、模型元数据、数据预处理规则等数据访问频度较高,可视作缓存数据。数据存储能够为数据查询服务提供基础保障,能够为在线计算服务和离线分析服务提供输入,同时也支持相应计算结果的回写。时序数据存储器5中涉及的数据库主要有分布式文件系统HDFS(HadoopDistributedFileSystem),列式数据库HBase(HadoopDatabase)、内存数据库Redis、关系数据库Oracle等。Oracle数据库主要用于存储配置数据以及部分业务数据,HDFS作为大数据平台底层的分布式文件系统单元,为上层的HBASE提供支撑,也可以直接存储业务数据中的非时序部分,HBASE是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统,主要用于存储业务数据中的时序部分,Redis是一个基于内存的key-value存储系统,在这里主要用于存放缓存数据。
计算单元可以利用行业专家的管理经验结合统计学原理研究分析挖掘算法,以电力设备运行相关的历史数据为输入,训练形成数据挖掘模型,不同的样本数据可形成不同的数据挖掘模型(例:按季节区分),针对设备运行产生的新的时序数据可以重复执行训练过程,进行数据挖掘模型的持续改进;创建完成的数据挖掘模型可参与在线计算,采用实时或准实时的方式分析电力设备的各项评价指标。挖掘模型的训练过程涉及到了批量计算,通过批量计算作业实现;挖掘模型的应用过程涉及到了流式计算,通过流式计算作业实现;此外,两种计算模式还可以用于实现设备评价指标、语音语义识别、文本语义分析等等与挖掘模型无关的计算任务。
计算单元通过驱动调度引擎来调用和接收时序数据存储器存储的数据,并且依据预先编排好的处理逻辑对调用和接收的数据进行处理,训练形成数据挖掘模型,其中计算单元包括多个子计算单元M,数据挖掘模型为N层,其中每一层分别包括M1,M2,…,MN个子计算单元,第N层的每2个子计算单元的输出结果作为第N-1层子计算单元的输入,不断地执行迭代计算,最终得出第1层的计算结果,计算结果在计算引擎的调度下,通过数据连接器,解析成不同的表现形式后回传时序数据存储器和/或数据服务端;数据连接器主要是用于连接外部系统的数据,如关系型数据连接器、时序数据连接器、非结构化数据连接器等。对于基于消息服务的实时计算结果使用kafka技术,使用kafka的目的是通过Hadoop的并行加载机制来统一线上和离线的消息处理,也是为了通过集群机来提供实时的消费;
对于时序数据与计算结果的列式分布式存储,通过封装PI、EDNA、Inova、庚盾等异构类型的实时数据库采用数据连接器,采用的是Hadoop平台中面向列家族的分布式存储大数据HBASE;
对于中间计算结果的集群式缓存,使用Redis;大数据平台中提供的大量数据都需要在短时间快速完成,对于系统的吞吐量要求很高,借助分布式内存数据库机制对访问的数据进行缓存可以极大的提高效率。
Redis是一个key-value存储系统,和Memcached类似,它支持存储的value类型相对更多,包括string(字符串)、list(链表)、set(集合)、zset(sortedset--有序集合)和hash(哈希类型)。这些数据类型都支持push/pop、add/remove及取交集并集和差集及更丰富的操作,而且这些操作都是原子性的。在此基础上,redis支持各种不同方式的排序。与memcached一样,为了保证效率,数据都是缓存在内存中。此外,Redis支持集群模式,可以对在集群节点上的数据进行分片,镜像,极大的提高了分布式内存的可靠性和可扩展性。
不同的外部数据源,对应不同的整合方式:Sqoop支持关系库中的数据导入到大数据平台中;SparkStreaming支持流式数据导入;普通的SparkJob可以提供批量的数据解析和处理。企业服务总线ESB提供了服务的集成和管理。
批量计算作业通过调度引擎驱动,从数据存储区域读入业务历史数据,依据预先编排好的处理逻辑进行计算,计算结果可以回写到数据存储区,也可以通过离线分析服务直接对外提供;流式计算作业也是通过调度引擎驱动,数据从数据存储中以流的方式接入进来,依据预先编排好的处理逻辑进行计算,计算结果可以回写到数据存储区,也可以通过在线计算服务直接对外提供。
计算作业用于定义计算任务的(也称作业节点)拓扑结构和执行逻辑,类似于工作流(Workflow),其定义过程可在系统提供的作业设计器中完成,从计算引擎的视角看,每个作业节点对应于一个计算单元(ComputeUnit),计算单元对应的程序逻辑称之为算子(Transformation)。系统提供可视化建模工具、预置丰富的数据处理和数据展示算子,同时开放算子开发规范,支持实际业务场景的二次开发。
数据服务端可以实现对基于多层模型迭代的大数据分析平台装置各类功能的封装,可以实现数据访问服务、在线计算服务和离线分析服务。数据访问服务直接从数据存储区读取数据,它的交互过程不涉及数据计算,可以进一步细分为配置信息访问服务、交互式查询服务,典型应用场景主要是综合查询、可视化展示等。在线计算服务通常的时间跨度在数百毫秒到数秒之间,高并发并且需要快速响应分析结果,典型应用场景包括故障预警、负荷预测等。离线分析服务的时间跨度在数十分钟到数小时之间,主要用于多维统计预测、准实时分析以及聚类、分类等数据挖掘应用,典型应用场景包括故障模式识别、稳定工况分析等。数据服务的交互模式包括同步、异步两种,在线计算服务通常采用同步模式,离线分析服务通常采用异步模式,异步模式会引入消息服务中间件接管计算状态和计算结果信息的传递。
无线终端可以为笔记本电脑、平板电脑和/或手机,监测人员或者维修工作人员可以通过无线终端远程的和数据服务端实现交互,可以主动的实时查询或者被动接收数据服务端推送的监测结果,并且也可以通过无线终端远程的操控数据服务端及装置的其他的部分,实现远程实时的操控、监测,此外对于出现异常的情况,也可以及时的处理。
本发明还提供一种基于多层模型迭代的大数据分析平台装置的大数据分析方法,依次包括如下步骤:
(1)初始化,设置数据服务端的初始参数,根据设置好的初始参数控制监测传感器的采样周期为每秒6次,采样时间为1分钟,将1分钟内采样的数据求平均值A;
(2)在同样的初始参数条件下,重复步骤(1)3次,分别求得3次的平均值B、C、D;
(3)将平均值A、B、C、D求和后再求平均值P:
A.如果则监测传感器性能稳定,进入步骤(4);
B.如果则监测传感器性能不稳定,则进入步骤(1);
(4)实时或准实时获取设备监测数据,并将采集到的设备监测数据传输给监测数据存储器后存储,以流式输出的方式,将设备监测数据输出至数据整合单元;
(5)以批量接入的方式,通过预定义的调度计划自动获取设备数据存储器中的常规的设备数据,将设备监测数据和常规的设备数据以预处理规则进行数据的清洗、过滤、转换的预处理,并将预处理后的数据输出至时序数据存储器进行存储;
(6)将近期的监测数据、常规的设备数据,以及关注率较高的历史指标数据、模型元数据和预处理规则数据集中缓存到时序数据存储器中的内存器;
(7)通过计算单元驱动调度引擎来调用和接收时序数据存储器存储的数据,并且依据预先编排好的处理逻辑对调用和接收的数据进行处理,训练形成数据挖掘模型,其中计算单元包括多个子计算单元M,数据挖掘模型为N层,其中每一层分别包括M1,M2,…,MN个子计算单元,第N层的每2个子计算单元的输出结果作为第N-1层子计算单元的输入,不断地执行迭代计算,最终得出第1层的计算结果,计算结果在计算引擎的调度下,通过数据连接器,解析成不同的表现形式后回传时序数据存储器和/或数据服务端;
(8)从时序数据存储器直接读取数据和/或接收来自计算单元处理后的数据,并且进行分析处理,将处理后的结果通过显示装置进行显示,同时通过接口单元将处理后的结果发送给无线终端;
(9)通过无线终端接收来自数据服务端发送的处理后的结果,根据处理后的结果决定是否发送控制命令至数据服务端,数据服务端接收到控制命令后控制监测传感器,调整监测传感器的数据采集频率,其中处理后的结果为故障预警结果和/或负荷预测结果,根据处理后的结果决定是否发送控制命令至数据服务端满足:
A.当故障预警结果和/或负荷预测结果为正常时,降低监测传感器的数据采集频率;
B.当故障预警结果和/或负荷预测结果为不正常时,提高监测传感器的数据采集频率,并且重复步骤(1)-(9),同时在数据服务端发出警报,在数据服务端的显示装置上实时显示故障预警结果和/或负荷预测结果,并且通知维修人员。
本发明的多层模型迭代的大数据分析平台装置及方法是通过软件和硬件装置的配合完成,但是并不局限于此,在一定条件下,也可以完全通过硬件的方式实现。
尽管为了说明的目的,已描述了本发明的示例性实施方式,但是本领域的技术人员将理解,不脱离所附权利要求中公开的发明的范围和精神的情况下,可以在形式和细节上进行各种修改、添加和替换等的改变,而所有这些改变都应属于本发明所附权利要求的保护范围,并且本发明要求保护的产品各个部门和方法中的各个步骤,可以以任意组合的形式组合在一起。因此,对本发明中所公开的实施方式的描述并非为了限制本发明的范围,而是用于描述本发明。相应地,本发明的范围不受以上实施方式的限制,而是由权利要求或其等同物进行限定。

Claims (10)

1.一种基于多层模型迭代的大数据分析平台装置,包括依次连接的数据源获取装置、数据整合单元、时序数据存储器、计算单元、无线终端和数据服务终端,其中数据服务终端还分别与时序数据存储器、数据源获取装置和无线终端连接,其特征在于:
数据源获取装置,用于获取设备监测数据和常规的设备数据,并发送至数据整合单元;
数据整合单元,用于以接收来自数据源获取装置发送的设备监测数据和常规的设备数据,经过预处理后将结果发送给时序数据存储器;
时序数据存储器,用于存储预处理后的数据和配置数据,并且将访问频度高、性能要求高的数据集中缓存到时序数据存储器中的内存器;
计算单元,用于驱动调度引擎来调用和接收时序数据存储器存储的数据,并且依据预先编排好的处理逻辑对调用和接收的数据进行处理,训练形成数据挖掘模型,其中计算单元包括多个子计算单元M,数据挖掘模型为N层,其中每一层分别包括M1,M2,…,MN个子计算单元,第N层的每2个子计算单元的输出结果作为第N-1层子计算单元的输入,不断地执行迭代计算,最终得出第1层的计算结果,计算结果在计算引擎的调度下,通过数据连接器,解析成不同的表现形式后回传时序数据存储器和/或数据服务端;
数据服务端,包括数据服务端处理器、接口单元和显示装置,其中数据服务端处理器用于从时序数据存储器直接读取数据和/或接收来自计算单元处理后的数据,并且进行分析处理,将处理后的结果通过显示装置进行显示,同时通过接口单元将处理后的结果发送给无线终端;
无线终端,用于接收来自数据服务端发送的处理后的结果,并且能够无线发送控制命令至数据服务端,数据服务端接收到控制命令后控制数据源获取装置,调整数据源获取装置的数据采集频率。
2.如权利要求1所述的装置,其特征在于:数据源获取装置包括监测传感器、监测数据存储器和设备数据存储器,其中监测数据存储器分别与监测传感器和数据整合单元连接,数据整合单元还连接设备数据存储器:
监测传感器,用于实时或准实时获取设备监测数据,并将采集到的设备监测数据传输给监测数据存储器;
监测数据存储器,用于将设备监测数据存储,并且以流式输出的方式,将设备监测数据输出至数据整合单元;
设备数据存储器,用于存储常规的设备数据,并且以批量输出的方式,将常规的设备数据输出至数据整合单元。
3.如权利要求2所述的装置,其特征在于:数据连接器为关系型数据连接器、时序数据连接器和/或非结构化数据连接器。
4.如权利要求3所述的装置,其特征在于:所述迭代计算的中间结果采用Redis集群式缓存的形式存储。
5.如权利要求2或3任一项所述的装置,其特征在于:还包括与数据整合单元连接的人工输入装置,用于在因安全要求实施了隔离措施或不支撑数据接入的情形下输入监测设备数据。
6.如权利要求5所述的装置,其特征在于:配置数据为描述设备监测数据和/或常规的设备数据的业务含义数据、存储结构数据和/或处理逻辑数据。
7.如权利要求6所述的装置,其特征在于:所述访问频度高、性能要求高的数据是指近期的监测数据、常规的设备数据,以及关注率较高的历史指标数据、模型元数据和预处理规则数据。
8.如权利要求7所述的装置,其特征在于:数据服务端处理后的结果为故障预警结果和/或负荷预测结果。
9.如权利要求1或8任一项所述的装置,其特征在于:所述无线终端为笔记本电脑、平板电脑和/或手机。
10.一种利用如上述权利要求2-9任一项所述的装置的大数据分析方法,其特征在于,依次包括如下步骤:
(1)初始化,设置数据服务端的初始参数,根据设置好的初始参数控制监测传感器的采样周期为每秒6次,采样时间为1分钟,将1分钟内采样的数据求平均值A;
(2)在同样的初始参数条件下,重复步骤(1)3次,分别求得3次的平均值B、C、D;
(3)将平均值A、B、C、D求和后再求平均值P:
A.如果则监测传感器性能稳定,进入步骤(4);
B.如果则监测传感器性能不稳定,则进入步骤(1);
(4)实时或准实时获取设备监测数据,并将采集到的设备监测数据传输给监测数据存储器后存储,以流式输出的方式,将设备监测数据输出至数据整合单元;
(5)以批量接入的方式,通过预定义的调度计划自动获取设备数据存储器中的常规的设备数据,将设备监测数据和常规的设备数据以预处理规则进行数据的清洗、过滤、转换的预处理,并将预处理后的数据输出至时序数据存储器进行存储;
(6)将近期的监测数据、常规的设备数据,以及关注率较高的历史指标数据、模型元数据和预处理规则数据集中缓存到时序数据存储器中的内存器;
(7)通过计算单元驱动调度引擎来调用和接收时序数据存储器存储的数据,并且依据预先编排好的处理逻辑对调用和接收的数据进行处理,训练形成数据挖掘模型,其中计算单元包括多个子计算单元M,数据挖掘模型为N层,其中每一层分别包括M1,M2,…,MN个子计算单元,第N层的每2个子计算单元的输出结果作为第N-1层子计算单元的输入,不断地执行迭代计算,最终得出第1层的计算结果,计算结果在计算引擎的调度下,通过数据连接器,解析成不同的表现形式后回传时序数据存储器和/或数据服务端;
(8)从时序数据存储器直接读取数据和/或接收来自计算单元处理后的数据,并且进行分析处理,将处理后的结果通过显示装置进行显示,同时通过接口单元将处理后的结果发送给无线终端;
(9)通过无线终端接收来自数据服务端发送的处理后的结果,根据处理后的结果决定是否发送控制命令至数据服务端,数据服务端接收到控制命令后控制监测传感器,调整监测传感器的数据采集频率,其中处理后的结果为故障预警结果和/或负荷预测结果,根据处理后的结果决定是否发送控制命令至数据服务端满足:
A.当故障预警结果和/或负荷预测结果为正常时,降低监测传感器的数据采集频率;
B.当故障预警结果和/或负荷预测结果为不正常时,提高监测传感器的数据采集频率,并且重复步骤(1)-(9),同时在数据服务端发出警报,在数据服务端的显示装置上实时显示故障预警结果和/或负荷预测结果,并且通知维修人员。
CN201510954797.3A 2015-12-17 2015-12-17 一种基于多层模型迭代的大数据分析平台装置及方法 Active CN105608144B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510954797.3A CN105608144B (zh) 2015-12-17 2015-12-17 一种基于多层模型迭代的大数据分析平台装置及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510954797.3A CN105608144B (zh) 2015-12-17 2015-12-17 一种基于多层模型迭代的大数据分析平台装置及方法

Publications (2)

Publication Number Publication Date
CN105608144A true CN105608144A (zh) 2016-05-25
CN105608144B CN105608144B (zh) 2019-02-26

Family

ID=55988084

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510954797.3A Active CN105608144B (zh) 2015-12-17 2015-12-17 一种基于多层模型迭代的大数据分析平台装置及方法

Country Status (1)

Country Link
CN (1) CN105608144B (zh)

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106209866A (zh) * 2016-07-15 2016-12-07 上海数据交易中心有限公司 一种数据处理和传输系统、前置端及数据系统
CN106709012A (zh) * 2016-12-26 2017-05-24 北京锐安科技有限公司 一种大数据分析方法及装置
CN107465574A (zh) * 2017-08-07 2017-12-12 南京华盾电力信息安全测评有限公司 互联网网站群平台系统及其并行隔离流式计算方法
CN107577767A (zh) * 2017-09-05 2018-01-12 江苏电力信息技术有限公司 一种基于大数据的统一服务层建立方法
CN107656156A (zh) * 2017-09-22 2018-02-02 安徽科技学院 一种基于云平台的设备故障诊断及运行状态评估方法与系统
CN108595473A (zh) * 2018-03-09 2018-09-28 广州市优普计算机有限公司 一种基于云计算的大数据应用平台
CN109189839A (zh) * 2018-07-20 2019-01-11 广微数据科技(苏州)有限公司 基于大数据平台的多层业务模型
CN109213909A (zh) * 2017-09-11 2019-01-15 南京弹跳力信息技术有限公司 一种融合搜索与计算的大数据分析系统及其分析方法
CN109241112A (zh) * 2018-08-28 2019-01-18 北京明朝万达科技股份有限公司 一种数据处理方法及装置
CN109597837A (zh) * 2018-11-29 2019-04-09 深圳前海微众银行股份有限公司 时序数据的存储方法、查询方法及相关设备
CN109614574A (zh) * 2018-11-23 2019-04-12 成都景中教育软件有限公司 一种动态几何软件中迭代的实现方法
CN109766363A (zh) * 2019-01-08 2019-05-17 北京江融信科技有限公司 流式数据处理方法、系统、电子设备及存储介质
CN110019209A (zh) * 2017-11-16 2019-07-16 国网新源控股有限公司 一种基于水电企业业务数据的大数据融合系统及方法
CN111124806A (zh) * 2019-11-25 2020-05-08 山东鲁能软件技术有限公司 一种基于分布式调度任务的设备状态实时监测方法及系统
WO2021017646A1 (zh) * 2019-07-29 2021-02-04 中兴通讯股份有限公司 一种业务请求消息发送方法、分布式数据库架构及计算机可读存储介质
CN113485694A (zh) * 2021-07-06 2021-10-08 算话信息科技(上海)有限公司 一种算法的变量数据智能中台系统
CN113792608A (zh) * 2021-08-19 2021-12-14 广州云硕科技发展有限公司 一种智能语义分析方法及系统
CN115114353A (zh) * 2022-08-29 2022-09-27 湖南警云智慧信息科技有限公司 一种大数据的筛选方法和系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110145286A1 (en) * 2009-12-15 2011-06-16 Chalklabs, Llc Distributed platform for network analysis
CN102685221A (zh) * 2012-04-29 2012-09-19 华北电力大学(保定) 一种状态监测数据的分布式存储与并行挖掘方法
CN103761309A (zh) * 2014-01-23 2014-04-30 中国移动(深圳)有限公司 一种运营数据处理方法及系统
CN105069703A (zh) * 2015-08-10 2015-11-18 国家电网公司 一种电网海量数据管理方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110145286A1 (en) * 2009-12-15 2011-06-16 Chalklabs, Llc Distributed platform for network analysis
CN102685221A (zh) * 2012-04-29 2012-09-19 华北电力大学(保定) 一种状态监测数据的分布式存储与并行挖掘方法
CN103761309A (zh) * 2014-01-23 2014-04-30 中国移动(深圳)有限公司 一种运营数据处理方法及系统
CN105069703A (zh) * 2015-08-10 2015-11-18 国家电网公司 一种电网海量数据管理方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
王德文 等: "电力用户侧大数据分析与并行负荷预测", 《中国电机工程学报》 *
王继业 等: "智能配用电大数据需求分析与应用研究", 《中国电机工程学报》 *

Cited By (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106209866A (zh) * 2016-07-15 2016-12-07 上海数据交易中心有限公司 一种数据处理和传输系统、前置端及数据系统
CN106709012A (zh) * 2016-12-26 2017-05-24 北京锐安科技有限公司 一种大数据分析方法及装置
CN107465574A (zh) * 2017-08-07 2017-12-12 南京华盾电力信息安全测评有限公司 互联网网站群平台系统及其并行隔离流式计算方法
CN107465574B (zh) * 2017-08-07 2020-11-10 南京华盾电力信息安全测评有限公司 互联网网站群平台系统及其并行隔离流式计算方法
CN107577767A (zh) * 2017-09-05 2018-01-12 江苏电力信息技术有限公司 一种基于大数据的统一服务层建立方法
CN109213909A (zh) * 2017-09-11 2019-01-15 南京弹跳力信息技术有限公司 一种融合搜索与计算的大数据分析系统及其分析方法
CN107656156A (zh) * 2017-09-22 2018-02-02 安徽科技学院 一种基于云平台的设备故障诊断及运行状态评估方法与系统
CN110019209A (zh) * 2017-11-16 2019-07-16 国网新源控股有限公司 一种基于水电企业业务数据的大数据融合系统及方法
CN108595473A (zh) * 2018-03-09 2018-09-28 广州市优普计算机有限公司 一种基于云计算的大数据应用平台
CN109189839A (zh) * 2018-07-20 2019-01-11 广微数据科技(苏州)有限公司 基于大数据平台的多层业务模型
CN109241112A (zh) * 2018-08-28 2019-01-18 北京明朝万达科技股份有限公司 一种数据处理方法及装置
CN109614574A (zh) * 2018-11-23 2019-04-12 成都景中教育软件有限公司 一种动态几何软件中迭代的实现方法
CN109597837A (zh) * 2018-11-29 2019-04-09 深圳前海微众银行股份有限公司 时序数据的存储方法、查询方法及相关设备
CN109597837B (zh) * 2018-11-29 2023-12-01 深圳前海微众银行股份有限公司 时序数据的存储方法、查询方法及相关设备
CN109766363A (zh) * 2019-01-08 2019-05-17 北京江融信科技有限公司 流式数据处理方法、系统、电子设备及存储介质
CN109766363B (zh) * 2019-01-08 2021-06-11 北京江融信科技有限公司 流式数据处理方法、系统、电子设备及存储介质
US11824924B2 (en) 2019-07-29 2023-11-21 Xi'an Zhongxing New Software Co., Ltd. Service request message sending method, distributed database architecture and computer readable storage medium
WO2021017646A1 (zh) * 2019-07-29 2021-02-04 中兴通讯股份有限公司 一种业务请求消息发送方法、分布式数据库架构及计算机可读存储介质
CN111124806A (zh) * 2019-11-25 2020-05-08 山东鲁能软件技术有限公司 一种基于分布式调度任务的设备状态实时监测方法及系统
CN111124806B (zh) * 2019-11-25 2023-09-05 山东鲁软数字科技有限公司 一种基于分布式调度任务的设备状态实时监测方法及系统
CN113485694A (zh) * 2021-07-06 2021-10-08 算话信息科技(上海)有限公司 一种算法的变量数据智能中台系统
CN113792608B (zh) * 2021-08-19 2022-05-10 广州云硕科技发展有限公司 一种智能语义分析方法及系统
CN113792608A (zh) * 2021-08-19 2021-12-14 广州云硕科技发展有限公司 一种智能语义分析方法及系统
CN115114353A (zh) * 2022-08-29 2022-09-27 湖南警云智慧信息科技有限公司 一种大数据的筛选方法和系统
CN115114353B (zh) * 2022-08-29 2022-12-13 湖南警云智慧信息科技有限公司 一种大数据的筛选方法和系统

Also Published As

Publication number Publication date
CN105608144B (zh) 2019-02-26

Similar Documents

Publication Publication Date Title
CN105608144A (zh) 一种基于多层模型迭代的大数据分析平台装置及方法
CN105608758A (zh) 一种基于算法组态和分布式流计算的大数据分析平台装置及方法
CN105427193B (zh) 一种基于分布式时序数据服务的大数据分析装置及方法
CN106294644B (zh) 一种基于大数据技术的海量时序数据收集处理装置及方法
US20220164384A1 (en) Efficient storage and processing of high-dimensional feature vectors
Bin et al. Research on data mining models for the internet of things
US7930143B2 (en) Systems and methods for sensor-based computing
CN109543067A (zh) 基于人工智能的企业生产状况实时监控分析系统
CN104636751A (zh) 基于时间递归神经网络的人群异常检测和定位系统及方法
Mehdipour et al. Fog computing realization for big data analytics
KR20190106369A (ko) 공장 자동화 설비의 수명과 생산성 향상을 위한 plc 패턴 분석 시스템 및 패턴 분석 방법
Campbell Smart edge: The effects of shifting the center of data gravity out of the cloud
CN103258047B (zh) 一种面向药企作业成本控制数据仓库的数据组织方法
CN109800133A (zh) 一种统一监控告警的方法、一站式监控告警平台及系统
CN106649034B (zh) 一种可视化智能运维方法及平台
CN111077851A (zh) 一种基于气相色谱雾计算框架的化工过程故障诊断系统
CN204790999U (zh) 一种工业大数据收集和处理系统
Mangla et al. A comprehensive review: Internet of things (IoT)
CN106648672A (zh) 一种大数据开发与运行方法及系统
CN104346678A (zh) 一种业务接收与服务管理一体化的高效法律服务方法及系统
CN111105202A (zh) 一种设备管理系统
CN107436947B (zh) 一种大数据储存及并行处理方法
Liu et al. Research on environmental monitoring system based on microservices and data mining
CN109165203A (zh) 基于Hadoop架构的大型公共建筑能耗数据存储分析方法
Marinov et al. Towards Big Data and Internet of Things as key aspects of energy efficiency

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP01 Change in the name or title of a patent holder
CP01 Change in the name or title of a patent holder

Address after: 250101 5th floor, block B, Yinhe building, 2008 Xinluo street, high tech Zone, Jinan City, Shandong Province

Patentee after: Shandong luruan Digital Technology Co.,Ltd.

Address before: 250101 5th floor, block B, Yinhe building, 2008 Xinluo street, high tech Zone, Jinan City, Shandong Province

Patentee before: SHANDONG LUNENG SOFTWARE TECHNOLOGY Co.,Ltd.