CN108759902A - 一种基于大数据的燃气管网智能监测系统 - Google Patents
一种基于大数据的燃气管网智能监测系统 Download PDFInfo
- Publication number
- CN108759902A CN108759902A CN201810275714.1A CN201810275714A CN108759902A CN 108759902 A CN108759902 A CN 108759902A CN 201810275714 A CN201810275714 A CN 201810275714A CN 108759902 A CN108759902 A CN 108759902A
- Authority
- CN
- China
- Prior art keywords
- gas ductwork
- data
- gas
- monitoring
- big data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01D—MEASURING NOT SPECIALLY ADAPTED FOR A SPECIFIC VARIABLE; ARRANGEMENTS FOR MEASURING TWO OR MORE VARIABLES NOT COVERED IN A SINGLE OTHER SUBCLASS; TARIFF METERING APPARATUS; MEASURING OR TESTING NOT OTHERWISE PROVIDED FOR
- G01D21/00—Measuring or testing not otherwise provided for
- G01D21/02—Measuring two or more variables by means not covered by a single other subclass
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
Abstract
本发明提供了一种基于大数据的燃气管网智能监测系统,包括多个燃气管网监测子系统和大数据处理系统,每个燃气管网监测子系统皆连接至大数据处理系统,每个燃气管网监测子系统用于采集一个燃气管网监测区域内的多个燃气管网监测节点的燃气管网监测数据;大数据处理系统用于对采集的燃气管网监测数据进行处理分析,实现对燃气管网的实时监测。
Description
技术领域
本发明涉及燃气管网监测技术领域,具体涉及一种基于大数据的燃气管网智能监测系统。
背景技术
随着城市建设步伐的不断加快和城市规模的日益扩大,城镇燃气业务飞速发展,燃气设施管理工作也日趋复杂,燃气管网已成为经济发展的重要基础设施之一,关系到人民群众的日常生活。由于燃气管网监测点众多且分布极广,采集的数据量大、难处理、监测效果差,迫切需要实时掌握管网压力、管网流量及闸井内的积水高度等运行数据,利用大数据技术,实现广泛的数据监控、智慧的分析和决策,及时掌握城市燃气管网整体运行情况,提高城市燃气管网安全运行管理水平。
发明内容
针对上述问题,本发明提供一种基于大数据的燃气管网智能监测系统。
本发明的目的采用以下技术方案来实现:
提供了一种基于大数据的燃气管网智能监测系统,包括多个燃气管网监测子系统和大数据处理系统,每个燃气管网监测子系统皆连接至大数据处理系统,每个燃气管网监测子系统用于采集一个燃气管网监测区域内的多个燃气管网监测节点的燃气管网监测数据;大数据处理系统用于对采集的燃气管网监测数据进行处理分析,实现对燃气管网的实时监测。
优选地,大数据处理系统包括大容量数据库、数据相似分析模块,其中燃气管网监测子系统将采集的燃气管网监测数据发送至大容量数据库进行存储,以建立存储有大量燃气管网监测数据的数据量;数据相似分析模块用于对存储在大容量数据库中的燃气管网监测数据进行相似连接,找出相似度值大于设定阈值的两个燃气管网监测数据作为相似燃气管网监测数据对,并将找出的相似燃气管网监测数据对发送到大容量数据库中进行存储。
优选地,燃气管网监测子系统包括设置在燃气管网监测节点上的传感器节点。
优选地,所述的传感器节点包括无线芯片和传感器,无线芯片与传感器信号连接,所述传感器为压力传感器、气体传感器或水位传感器的一种或多种。
本发明的有益效果为:基于大数据处理技术将众多传感器节点采集的数据进行汇总并统一分析处理,可进行数据分析利用,提高对燃气管网的监测能力,智能便捷,节省人力;有利于监控人员及时掌握城市燃气管网整体运行情况,提高城市燃气管网安全运行管理水平。
附图说明
利用附图对本发明作进一步说明,但附图中的实施例不构成对本发明的任何限制,对于本领域的普通技术人员,在不付出创造性劳动的前提下,还可以根据以下附图获得其它的附图。
图1是本发明一个示例性实施例的燃气管网智能监测系统的结构示意框图;
图2是本发明一个示例性实施例的大数据处理系统的结构示意框图。
附图标记:
燃气管网监测子系统1、大数据处理系统2、大容量数据库10、数据相似分析模块20。
具体实施方式
结合以下实施例对本发明作进一步描述。
参见图1,本实施例提供的一种基于大数据的燃气管网智能监测系统,包括多个燃气管网监测子系统1和大数据处理系统2,每个燃气管网监测子系统1皆连接至大数据处理系统2,每个燃气管网监测子系统1用于采集一个燃气管网监测区域内的多个燃气管网监测节点的燃气管网监测数据;大数据处理系统2用于对采集的燃气管网监测数据进行处理分析,实现对燃气管网的实时监测。
如图2所示,大数据处理系统2包括大容量数据库10、数据相似分析模块20,其中燃气管网监测子系统1将采集的燃气管网监测数据发送至大容量数据库10进行存储,以建立存储有大量燃气管网监测数据的数据量;数据相似分析模块20用于对存储在大容量数据库10中的燃气管网监测数据进行相似连接,找出相似度值大于设定阈值的两个燃气管网监测数据作为相似燃气管网监测数据对,并将找出的相似燃气管网监测数据对发送到大容量数据库10中进行存储。
在一个实施例中,燃气管网监测子系统1包括设置在燃气管网监测节点上的传感器节点。
在一种可选的方式中,所述的传感器节点包括无线芯片和传感器,无线芯片与传感器信号连接,所述传感器为压力传感器、气体传感器或水位传感器的一种或多种。
本发明上述实施例基于大数据处理技术将众多传感器节点采集的数据进行汇总并统一分析处理,可进行数据分析利用,提高对燃气管网的监测能力,智能便捷,节省人力;对变压器室内的环境进行实时监测,保障了变压器的可靠运行,燃气管网监测数据通过无线方式进行传输,减少了布线的麻烦。
在一个实施例中,所述对存储在大容量数据库10中的燃气管网监测数据进行相似连接,具体包括:
(1)随机提取所述大容量数据库10中的一段燃气管网监测数据,并按照燃气管网监测数据的采集时间顺序构建时间序列,从时间序列中选择多个参考点,基于选择的参考点,针对时间序列中的燃气管网监测数据建立基于距离树的数据索引结构,利用数据索引结构生成MapReduce的数据分区方案;
(2)将参考节点集合、数据索引结构以及MapReduce的数据分区方案信息作为全局变量,利用MapReduce任务对存在相似性的燃气管网监测数据进行精确计算,得到时间序列中所有满足相似度值大于设定阈值的燃气管网监测数据对。
参考点的选择影响到对燃气管网监测数据进行数据相似性分析的性能,一个好的参考点集合可以将时间序列进行较为恰当的分割。在一个实施例中,数据相似分析模块20从时间序列中选择多个参考点时,具体执行:
(1)随机从时间序列中选择一个燃气管网监测数据,并在时间序列中找到距离该燃气管网监测数据最远的燃气管网监测数据,设为r1,并将r1设置为第一个参考点,找出离r1距离最远的燃气管网监测数据,设为r2,并将r2设置为第二个参考点;
(2)利用已经选择的参考点,针对每个未被选为参考点的燃气管网监测数据ai,按照下列公式计算距离差权值,并选择最小距离差权值的燃气管网监测数据作为下一个参考点:
式中,表示未被选为参考点的燃气管网监测数据ai的距离差权值,Q(r1,r2)表示参考点r1,r2之间的距离,Q(rk,ai)表示燃气管网监测数据ai与已经选择的参考点rk之间的距离,Ω表示已经选择的参考点集合;
(3)重复(2)直至选出设定数量的参考点,归入参考点序列集。
本实施例设定了参考点的选取机制,通过该选取机制,能够使得时间序列的离群值具有更大的概率成为参考点,且使得选取的参考点之间的距离较远,从而使得选取到的参考点集合能够较好地对时间序列进行分割,有利于优化对燃气管网监测数据进行数据相似性分析的性能。
在一个实施例中,针对时间序列中的燃气管网监测数据建立基于距离树的数据索引结构,具体包括:
(1)初始化距离树,构建树的根结点,将参考点序列集中的第一个参考点r1作为该根结点对应的参考点,并设置根结点的所属层次为0,位置P=0,个数m=0;
(2)利用第一个参考点对根结点进行划分,生成属于根结点的子结点的多个叶结点,其中每个叶结点包含所属层次、其内部的燃气管网监测数据数量以及位置信息三个属性,其中位置信息表明该叶结点距离其父结点对应的参考点的距离和设定的距离阈值L的倍数关系;
进行燃气管网监测数据插入,通过逐个插入的方式构建距离树,插入燃气管网监测数据的过程就是把每个燃气管网监测数据分发到对应的叶结点的过程;
其中,分发到叶结点α内部的燃气管网监测数据满足与其父结点对应的参考点的距离在区间[(Pα-1)×L,Pα×L)内,其中Pα为叶结点α的位置信息,且叶结点α内部存放的燃气管网监测数据量小于设定的最大容量;
其中,设要分发的燃气管网监测数据集为{a1,a2,..,an},则设置的区间数量为:
式中,Q(aa,rr)为燃气管网监测数据aa与父结点对应的参考点r的距离;
(3)若叶结点存放的燃气管网监测数据量到达设定的最大容量,从参考点序列集中选取新的参考点对该叶结点进行划分,生成相应的子结点,将该叶结点中的多余燃气管网监测数据分发到其子结点中,重复该过程,直至所有的叶结点或者子结点包含的燃气管网监测数据数量都小于设定的最大容量。
相关技术中采用基于磁盘的相似性连接算法或者暴力算法对燃气管网监测数据进行相似连接,基于磁盘的相似性连接算法在内存连接计算方面缺乏有效性和可扩展性。暴力算法,也就是对数据集中任意两条数据记录进行比较,计算成本会随着数据个数指数性增长,问题的关键是暴力算法对于现实数据是不可行的。在过去的二十几年的相关研究中,实验证明在相似性连接过程中采用一些剪枝策略是一个可行的办法。本实施例采用基于距离树的数据索引结构对燃气管网监测数据进行相似连接。
采用本实施例的方式对燃气管网监测数据进行相似连接,可以剪枝不必要的燃气管网监测数据对比较,降低燃气管网监测数据相似计算的冗余花费,节省燃气管网智能监测系统的数据计算成本。其中根据与参考点的最大距离设定了区间数量的计算公式,有利于构建合理的距离树,从而为后续的数据分区奠定良好的基础。
在一个实施例中,所述的利用数据索引结构生成MapReduce的数据分区方案,具体包括:
(1)根据基于距离树的数据索引结构创建一个图X(B,E),顶点B的集合是距离树的所有叶结点,边E的集合是不能被剪枝原则剪枝的结点对,每个顶点有一个与其自身相连的边,设置顶点b的权重g(b)是对应叶结点的燃气管网监测数据量,边e的权重g(e)等于其上两个顶点的权重的乘积;
(2)将X(B,E)分成两个子图X(B,E)1、X(B,E)2,划分后的两个子图X(B,E)1、X(B,E)2需满足下列均衡度条件:
式中,θ为设定的均衡度阈值,
(3)将子图X(B,E)1、X(B,E)2添加到一个优先队列中,优先队列中的子图按照代价进行降序排列;
其中子图X(B,E)i的代价的计算公式为:
(4)在下一轮的迭代中,从优先队列中选出排在最前面的子图,将其随机分成两个顶点个数相同的子图,并将分成的子图添加值优先队列,重复该过程直至优先队列中排在最前面的子图的代价满足小于设定的代价阈值时,输出最终的分区方案,将其作为成MapReduce的数据分区方案。
其中,所述的剪枝原则为:
给定在H1层和H2层的两个叶结点α1和α2,假设H1≥H2;从根结点到α1和α2经过的叶结点的位置序列分别为{w1,w2,...,wH1}和{λ1,λ2,...,λH2}。如果对于任意的t≤H2,都有wt+2<λt或者wt>λt+2,则α1中的任何燃气管网监测数据和α2中的任何燃气管网监测数据之间的距离大于L。
本实施例基于图分区将存在相似性的燃气管网监测数据尽可能地分布在同一个分区,能够尽可能地减少分区间的燃气管网监测数据交换和副本量,其中在进行分区时设定要满足均衡度条件以及代价条件,有利于在Reduce任务中,在确保负载均衡的情况下最小化燃气管网监测数据传输成本和冗余。
最后应当说明的是,以上实施例仅用以说明本发明的技术方案,而非对本发明保护范围的限制,尽管参照较佳实施例对本发明作了详细地说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的实质和范围。
Claims (6)
1.一种基于大数据的燃气管网智能监测系统,其特征是,包括多个燃气管网监测子系统和大数据处理系统,每个燃气管网监测子系统皆连接至大数据处理系统,每个燃气管网监测子系统用于采集一个燃气管网监测区域内的多个燃气管网监测节点的燃气管网监测数据;大数据处理系统用于对采集的燃气管网监测数据进行处理分析,实现对燃气管网的实时监测;大数据处理系统包括大容量数据库、数据相似分析模块,其中燃气管网监测子系统将采集的燃气管网监测数据发送至大容量数据库进行存储,以建立存储有大量燃气管网监测数据的数据量;数据相似分析模块用于对存储在大容量数据库中的燃气管网监测数据进行相似连接,找出相似度值大于设定阈值的两个燃气管网监测数据作为相似燃气管网监测数据对,并将找出的相似燃气管网监测数据对发送到大容量数据库中进行存储。
2.根据权利要求1所述的一种基于大数据的燃气管网智能监测系统,其特征是,燃气管网监测子系统包括设置在燃气管网监测节点上的传感器节点。
3.根据权利要求2所述的一种基于大数据的燃气管网智能监测系统,其特征是,所述的传感器节点包括无线芯片和传感器,无线芯片与传感器信号连接。
4.根据权利要求3所述的一种基于大数据的燃气管网智能监测系统,其特征是,所述传感器为压力传感器、气体传感器或水位传感器的一种或多种。
5.根据权利要求1-4任一项所述的一种基于大数据的燃气管网智能监测系统,其特征是,所述对存储在大容量数据库中的燃气管网监测数据进行相似连接,具体包括:
(1)随机提取所述大容量数据库中的一段燃气管网监测数据,并按照燃气管网监测数据的采集时间顺序构建时间序列,从时间序列中选择多个参考点,基于选择的参考点,针对时间序列中的燃气管网监测数据建立基于距离树的数据索引结构,利用数据索引结构生成MapReduce的数据分区方案;
(2)将参考节点集合、数据索引结构以及MapReduce的数据分区方案信息作为全局变量,利用MapReduce任务对存在相似性的燃气管网监测数据进行精确计算,得到时间序列中所有满足相似度值大于设定阈值的燃气管网监测数据对。
6.根据权利要求5所述的一种基于大数据的燃气管网智能监测系统,其特征是,所述的利用数据索引结构生成MapReduce的数据分区方案,具体包括:
(1)根据基于距离树的数据索引结构创建一个图X(B,E),顶点B的集合是距离树的所有叶结点,边E的集合是不能被剪枝原则剪枝的结点对,每个顶点有一个与其自身相连的边,设置顶点b的权重g(b)是对应叶结点的燃气管网监测数据量,边e的权重g(e)等于其上两个顶点的权重的乘积;
(2)将X(B,E)分成两个子图X(B,E)1、X(B,E)2,划分后的两个子图X(B,E)1、X(B,E)2需满足下列均衡度条件:
式中,θ为设定的均衡度阈值,
(3)将子图X(B,E)1、X(B,E)2添加到一个优先队列中,优先队列中的子图按照代价进行降序排列;
其中子图X(B,E)i的代价的计算公式为:
(4)在下一轮的迭代中,从优先队列中选出排在最前面的子图,将其随机分成两个顶点个数相同的子图,并将分成的子图添加值优先队列,重复该过程直至优先队列中排在最前面的子图的代价满足小于设定的代价阈值时,输出最终的分区方案,将其作为成MapReduce的数据分区方案。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810275714.1A CN108759902A (zh) | 2018-03-30 | 2018-03-30 | 一种基于大数据的燃气管网智能监测系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810275714.1A CN108759902A (zh) | 2018-03-30 | 2018-03-30 | 一种基于大数据的燃气管网智能监测系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108759902A true CN108759902A (zh) | 2018-11-06 |
Family
ID=63980838
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810275714.1A Pending CN108759902A (zh) | 2018-03-30 | 2018-03-30 | 一种基于大数据的燃气管网智能监测系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108759902A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111179118A (zh) * | 2019-12-31 | 2020-05-19 | 上海杰狮信息技术有限公司 | 基于空间数据模型的城市排水管网监控点布设方法及系统 |
CN114562684A (zh) * | 2022-02-16 | 2022-05-31 | 上海天麦能源科技有限公司 | 一种燃气管网关键监测节点选择方法和系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104732295A (zh) * | 2015-03-31 | 2015-06-24 | 国家电网公司 | 一种基于大数据技术的电力负荷预测模型 |
CN105160039A (zh) * | 2015-10-13 | 2015-12-16 | 四川携创信息技术服务有限公司 | 一种基于大数据的查询方法 |
CN105843907A (zh) * | 2016-03-24 | 2016-08-10 | 复旦大学 | 一种内存索引结构-距离树的构建及基于距离树的相似性连接算法 |
CN106777133A (zh) * | 2016-12-16 | 2017-05-31 | 浙江大学 | 一种基于MapReduce的度量空间相似连接处理方法 |
CN206478455U (zh) * | 2016-12-14 | 2017-09-08 | 厦门精图信息技术有限公司 | 一种基于大数据的燃气管网监测系统 |
-
2018
- 2018-03-30 CN CN201810275714.1A patent/CN108759902A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104732295A (zh) * | 2015-03-31 | 2015-06-24 | 国家电网公司 | 一种基于大数据技术的电力负荷预测模型 |
CN105160039A (zh) * | 2015-10-13 | 2015-12-16 | 四川携创信息技术服务有限公司 | 一种基于大数据的查询方法 |
CN105843907A (zh) * | 2016-03-24 | 2016-08-10 | 复旦大学 | 一种内存索引结构-距离树的构建及基于距离树的相似性连接算法 |
CN206478455U (zh) * | 2016-12-14 | 2017-09-08 | 厦门精图信息技术有限公司 | 一种基于大数据的燃气管网监测系统 |
CN106777133A (zh) * | 2016-12-16 | 2017-05-31 | 浙江大学 | 一种基于MapReduce的度量空间相似连接处理方法 |
Non-Patent Citations (1)
Title |
---|
刘文: "海量时间序列数据处理的关键技术研究", 《博士学位论文库》 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111179118A (zh) * | 2019-12-31 | 2020-05-19 | 上海杰狮信息技术有限公司 | 基于空间数据模型的城市排水管网监控点布设方法及系统 |
CN111179118B (zh) * | 2019-12-31 | 2023-11-03 | 上海杰狮信息技术有限公司 | 基于空间数据模型的城市排水管网监控点布设方法及系统 |
CN114562684A (zh) * | 2022-02-16 | 2022-05-31 | 上海天麦能源科技有限公司 | 一种燃气管网关键监测节点选择方法和系统 |
CN114562684B (zh) * | 2022-02-16 | 2023-08-22 | 上海天麦能源科技有限公司 | 一种燃气管网关键监测节点选择方法和系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Tun et al. | Federated learning based energy demand prediction with clustered aggregation | |
CN111539722A (zh) | 基于区块链的碳交易系统及方法 | |
CN103106253B (zh) | 一种MapReduce计算模型中基于遗传算法的数据平衡方法 | |
CN106294644A (zh) | 一种基于大数据技术的海量时序数据收集处理装置及方法 | |
CN109933620A (zh) | 基于Spark的火电大数据挖掘方法 | |
CN108759902A (zh) | 一种基于大数据的燃气管网智能监测系统 | |
Lin et al. | A K-means clustering with optimized initial center based on Hadoop platform | |
CN110442143A (zh) | 一种基于组合多目标鸽群优化的无人机态势数据聚类方法 | |
CN102945198A (zh) | 一种表征高性能计算应用特征的方法 | |
CN110336875B (zh) | 一种提高物联网应用的计算和存储速度的方法 | |
CN110287237B (zh) | 一种基于社会网络结构分析社团数据挖掘方法 | |
CN107679127A (zh) | 基于地理位置的点云信息并行提取方法及其系统 | |
CN108509594A (zh) | 一种基于云计算框架的交通大数据清洗系统 | |
CN108518315A (zh) | 一种基于云存储技术的风电机组智能监测系统 | |
CN117477545A (zh) | 一种智能软开关与储能设备联合规划方法及相关装置 | |
CN110048418B (zh) | 一种基于细胞-组织算法的微电网经济调度方法及装置 | |
CN110458321A (zh) | 一种跟踪风力发电计划的储能容量配置方法及装置 | |
CN108414018A (zh) | 一种基于大数据的电力变压器环境监测系统 | |
Xiang et al. | HDFS efficiency storage strategy for big data in smart city | |
Wang et al. | Block storage optimization and parallel data processing and analysis of product big data based on the hadoop platform | |
CN103096380A (zh) | 无线接入点负载均衡优化方法 | |
CN114858378A (zh) | 一种城市地震灾害情景匹配方法 | |
Niu et al. | Toward scalable analysis of multidimensional scientific data: A case study of electrode arrays | |
CN107341241A (zh) | 一种基于云计算的风电大数据分析系统 | |
CN105490871B (zh) | 一种测试Hadoop集群稳定性的方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20181106 |