CN115759785A - 一种基于k-means均值聚类的DMA小区漏损评价方法 - Google Patents

一种基于k-means均值聚类的DMA小区漏损评价方法 Download PDF

Info

Publication number
CN115759785A
CN115759785A CN202211578330.XA CN202211578330A CN115759785A CN 115759785 A CN115759785 A CN 115759785A CN 202211578330 A CN202211578330 A CN 202211578330A CN 115759785 A CN115759785 A CN 115759785A
Authority
CN
China
Prior art keywords
dma
clustering
leakage
cells
night
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211578330.XA
Other languages
English (en)
Inventor
周韧
高云
王兴双
周柯
徐光东
花秀霞
陈春芳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Changzhou Tongyong Water Supply Co ltd
Original Assignee
Changzhou Tongyong Water Supply Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Changzhou Tongyong Water Supply Co ltd filed Critical Changzhou Tongyong Water Supply Co ltd
Priority to CN202211578330.XA priority Critical patent/CN115759785A/zh
Publication of CN115759785A publication Critical patent/CN115759785A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明公开了一种基于k‑means均值聚类的DMA小区漏损评价方法,步骤包括:统计所有DMA小区某时期夜间最小流量;选出需评价漏损情况的DMA小区;选择聚类变量:7天平均夜间最小流量、7天平均夜间最小流量/日均流量、单位管长夜间最小流量;数据标准化;根据漏损评价等级确定合理的聚类数目k;采用K‑means均值聚类算法进行聚类分析;根据聚类结果评价不同DMA小区漏损情况并确定处理漏损的优先级。

Description

一种基于k-means均值聚类的DMA小区漏损评价方法
技术领域
本发明涉及DMA分区管理技术领域,特别是一种基于k-means均值聚类的DMA小区漏损评价方法。
背景技术
目前,国家对公共管网的漏损率要求不断提高,现有技术中,DMA分区管理是常用的手段,DMA为供配水系统中一个被切割分离的独立区域,通常采取关闭阀门或安装流量计,形成虚拟或实际独立区域[张志明.供水管网漏损控制分区装表计量技术和应用[D].上海:同济大学,2006]。所以,各地水司纷纷建立各级DMA分区,在DMA入口端加装流量计及远传装置进行实时监控,由此建立的leakview漏损管理平台得到许多水司的采用[王瑞彬,陈峰,张蕊等.DMA管理在济南市供水漏损控制中的应用[J].净水技术,2019,38(2):1-6.;周晨.LeakView平台在徐州首创管网漏损控制中的实践与应用.城镇供水,2017,37(03):33-39],众多DMA小区因此产生。一个城市往往建立了几百个DMA小区,每天产生大量的各类数据,那么如何深入挖掘这些数据,如何利用这些数据评价如此众多小区的漏损情况,对漏损小区进行聚类分级处理,是一个值得探讨的问题。
MNF法即夜间最小流量法是常用的分析评价方法,但是仅仅用这一指标评价DMA小区漏损情况显得比较片面,因为MNF还和DMA小区用水量和管线长度有关
发明内容
针对现有技术中存在的问题,本发明提供了一种基于k-means均值聚类的DMA小区漏损评价方法,采用MNF(夜间最小流量)、夜间最小流量/日均流量、单位管长夜间流量三个变量指标,用K-means均值聚类法对DMA小区漏损进行聚类分级评价。
本发明的目的通过以下技术方案实现。
一种基于k-means均值聚类的DMA小区漏损评价方法,步骤包括:
1)统计所有DMA小区某时期夜间最小流量;
2)选出需评价漏损情况的DMA小区;
3)选择聚类变量:7天平均夜间最小流量、7天平均夜间最小流量/日均流量、单位管长夜间最小流量;
4)数据标准化;
5)根据漏损评价等级确定合理的聚类数目k;
6)采用K-means均值聚类算法进行聚类分析;
7)根据聚类结果评价不同DMA小区漏损情况并确定处理漏损的优先级。
步骤3)具体为:设有n个DMA小区:D1、D2…Dn,统计n个DMA小区7天平均MNF夜间最小流量、7天平均夜间最小流量/日均流量、单位管长夜间最小流量,分别记为Ave7_MNF,Ave7_RMNF,UNPI_MNF,在n个DMA小区中,令ap1=Ave7_MNF,ap2=
Ave7_RMNF,ap3=UNPI_MNF。p=1…n,则n个DMA小区数据集可以表示为:
D1(a11,a12,a13),
D2(a21,a22,a23),
………
Dn(an1,an2,an3)。
步骤4)采用Z-score法对数据标准化。
步骤6)应用k-means算法进行聚类分析:
a)指定聚类数目k;
b)确定k个类的初始中心点;
c)根据距离最近原则进行分类:依次计算每个数据点到k类中心点的平方欧式距离,
平方欧式距离定义如下:两个体(x,y)的平方欧式距离是2个体p个变量值之差的平方和,数学定义如下:
Figure BDA0003982201880000021
其中:SED(x,y)为两个体(x,y)的平方欧式距离
xi为个体x中第i个变量值,i=1…p
yi为个体y中第i个变量值,i=1…p
依次计算出每个数据点到k个类中心点的平方欧式距离,并按照与k个类中心点距离最短的原则将所有数据点分派到k个类中;
d)重新确定k个类中心点:
重新确定k个类中心点的原则是:依次计算各类中各变量的均值,并以均值点作为各类的新的中心点,完成一次迭代;
e)判断是否满足聚类终止的条件:
是通过类中心点的偏移程度来判断,当新确定的类中心点距离上次迭代的类中心点距离小于0.02的时候,聚类终止,否则,返回到步骤c)。
步骤7)将n个DMA小区分成k类,并且可以得到最终的k类中心点,比较k类中心点各变量值的大小,k类中心点中各变量值最大的一类即为漏损程度最高类,其次为漏损程度次高类,以此类推。漏损处理优先级也是按照这个顺序。
相比于现有技术,本发明的优点在于:本发明利用MNF(夜间最小流量)、夜间最小流量/日均流量、单位管长夜间流量三个变量指标,采用k-means均值聚类法对DMA小区进行聚类漏损分析评价,并且确定DMA小区漏损处理的优先级。
附图说明
图1为本发明流程图。
具体实施方式
下面结合说明书附图和具体的实施例,对本发明作详细描述。
如图1所示,一种基于k-means均值聚类的DMA小区漏损评价方法,步骤包括:
1)统计所有DMA小区某时期夜间最小流量;
2)选出需评价漏损情况的DMA小区;
3)选择聚类变量:7天平均夜间最小流量、7天平均夜间最小流量/日均流量、单位管长夜间最小流量;
4)数据标准化;
5)根据漏损评价等级确定合理的聚类数目k;
6)采用K-means均值聚类算法进行聚类分析;
7)根据聚类结果评价不同DMA小区漏损情况并确定处理漏损的优先级。
步骤3)具体为:设有n个DMA小区:D1、D2…Dn,统计n个DMA小区7天平均MNF夜间最小流量、7天平均夜间最小流量/日均流量、单位管长夜间最小流量,分别记为Ave7_MNF,Ave7_RMNF,Unpi_MNF,在n个DMA小区中,令ap1=Ave7_MNF,ap2=
Ave7_RMNF,ap3=Unpi_MNF。p=1…n,则n个DMA小区数据集可以表示为:
D1(a11,a12,a13),
D2(a21,a22,a23),
………
Dn(an1,an2,an3)。
目前我司共管理321个DMA小区,根据leakview漏损管理系统2022.9.1日的数据,绝大部分MNF都低于5(m3·h-1),根据我司经验,这部分小区漏损可能性不是很大,所以取超过5(m3·h-1)的13个小区(见表1)。采用K-means聚类分析的方法把这13个小区作为研究对象分析评价这些DMA小区的漏损情况,根据聚类结果确立漏损处理的优先级。聚类变量的选择非常重要,所选取的变量要能够对目标分析产生作用,我们分析的目标主要是对DMA小区漏损情况进行分析评价,因此,选择MNF(夜间最小流量),夜间最小流量/日均流量,单位管长夜间流量3个变量指标,这3个都是漏损评价常用指标。为了避免异常值的干扰,取7天平均MNF(夜间最小流量)、7天平均(夜间最小流量/日均流量)、单位管长夜间最小流量(MNF/小区管线总长度)。分别记为Ave7_MNF,Ave7_RMNF,Unpi_MNF如表1所示。
表1 13个小区变量指标表
Figure BDA0003982201880000041
上述3个变量存在量纲上的差异,需进行标准化处理后方可聚类分析。在这里采用Z-score法(标准差法),其是基于原始数据的均值和标准差进行数据的标准化的一种方法,转换后数据均值为0,标准差为1,如表2所示。
表2 13个小区变量标准化表
Figure BDA0003982201880000042
关于聚类数目k是比较重要的问题,考虑聚类目的和所选个体不是很多,所以将聚类的数目k=3。分别定义为漏损情况严重、中等、一般。
采用SPSS软件进行K-means聚类,聚类数目k=3,初始类中心点软件系统自定。结果如表3所示,然后根据分类结果,对每类数据进行描述性统计如表4所示。
表3聚类结果
Figure BDA0003982201880000051
表4每类的数学统计
Figure BDA0003982201880000052
由上述聚类结果可知,第一类有3个小区,是三个群类里面小区数最少的,但3个变量指标的均值都很高,在三类里面都是最高,这说明了这3个小区漏损严重,应该优先处理。其中滨江明珠城东区和怡康花园3个变量指标都很高,但中意宝第相对于这一类其他小区,Ave7_MNF较低而Unpi_MNF较高,这说明该小区单位管长的夜间最小流量偏高,漏损严重,同时由于管长在13个小区里面是最低的(见表1),这说明该小区易于查找漏点。
第二类有6个小区,是三个群类里面小区数最多的,3个变量指标中Ave7_MNF、Unpi_MNF均值在三类中处在中等程度,而Ave7_RMNF均值0.29却比较高,略低于第一类该变量的最高均值0.3,这说明该类小区夜间最小流量与日均用水量的比值偏高,存在漏损的可能性比较大。总体而言,该类小区的漏损情况为中等,处理的优先级应该是第二。
第三类有4个小区,3个变量指标的均值都不高,在三类里面都是最低的。3个变量指标中Ave7_MNF均值相对于其他类来说,差距不是特别大,尤其是和第二类接近,但其他2个变量Ave7_RMNF和Unpi_MNF却和其他2类差距较大。这说明该类小区,存在合理的夜间最小流量的可能性比较大。所以,该类小区的漏损程度为一般,处理的优先级应该是最后。
综上所述,对于上述3类DMA小区的漏损情况评价为,第一类>第二类>第三类,处理的优先级也按照这个顺序。从上面的分析可以看出DMA小区的漏损评价,应该综合Ave7_MNF,Ave7_RMNF,Unpi_MNF三个变量综合考虑,而不是以夜间最小流量单一评价,因为每个DMA小区的夜间最小流量、用水规模和管线长度都不一样,夜间最小流量与日均用水量相关,日均用水量越高,说明了该小区用户数量大,夜间最小流量也相应增加,夜间最小流量还与管线长度有关,管线长度越长说明连接的用户数越多,夜间最小流量也会相应增加。
本发明应用K-means均值聚类法对常州市13个DMA小区进行了聚类分析,根据聚类结果对DMA小区漏损程度进行了评价,同时确定DMA小区漏损处理的优先级别。结果显示,k-means均值聚类法在DMA小区漏损分析评价中适用,可以根据相似性把13个DMA小区分成3类;根据聚类结果分析,对13个DMA小区的漏损情况进行评价,第一类>第二类>第三类,处理漏损的优先级也是这个顺序。

Claims (5)

1.一种基于k-means均值聚类的DMA小区漏损评价方法,其特征在于步骤包括:
1)统计所有DMA小区某时期夜间最小流量;
2)选出需评价漏损情况的DMA小区;
3)选择聚类变量:7天平均夜间最小流量、7天平均夜间最小流量/日均流量、单位管长夜间最小流量;
4)数据标准化;
5)根据漏损评价等级确定合理的聚类数目k;
6)采用K-means均值聚类算法进行聚类分析;
7)根据聚类结果评价不同DMA小区漏损情况并确定处理漏损的优先级。
2.根据权利要求1所述的一种基于k-means均值聚类的DMA小区漏损评价方法,其特征在于步骤3)具体为:设有n个DMA小区:D1、D2…Dn,统计n个DMA小区7天平均MNF夜间最小流量、7天平均夜间最小流量/日均流量、单位管长夜间最小流量,分别记为Ave7_MNF,Ave7_RMNF,Unpi_MNF,在n个DMA小区中,令ap1=Ave7_MNF,ap2=Ave7_RMNF,ap3=Unpi_MNF。p=1…n,则n个DMA小区数据集可以表示为:
D1(a11,a12,a13),
D2(a21,a22,a23),
………
Dn(an1,an2,an3)。
3.根据权利要求1所述的一种基于k-means均值聚类的DMA小区漏损评价方法,其特征在于步骤4)采用Z-score法对数据标准化。
4.根据权利要求1所述的一种基于k-means均值聚类的DMA小区漏损评价方法,其特征在于步骤6)应用k-means算法进行聚类分析:
a)指定聚类数目K;
b)确定k个类的初始中心点;
c)根据距离最近原则进行分类:依次计算每个数据点到k类中心点的平方欧式距离,
平方欧式距离定义如下:两个体(x,y)的平方欧式距离是2个体p个变量值之差的平方和,数学定义如下:
Figure FDA0003982201870000011
其中:SED(x,y)为两个体(x,y)的平方欧式距离
xi为个体x中第i个变量值,i=1…p
yi为个体y中第i个变量值,i=1…p
依次计算出每个数据点到k个类中心点的平方欧式距离,并按照与k个类中心点距离最短的原则将所有数据点分派到k个类中;
d)重新确定k个类中心点:
重新确定k个类中心点的原则是:依次计算各类中各变量的均值,并以均值点作为各类的新的中心点,完成一次迭代;
e)判断是否满足聚类终止的条件:
是通过类中心点的偏移程度来判断,当新确定的类中心点距离上次迭代的类中心点距离小于0.02的时候,聚类终止,否则,返回到步骤c)。
5.根据权利要求4所述的一种基于k-means均值聚类的DMA小区漏损评价方法,其特征在于步骤7)将n个DMA小区分成k类,并且可以得到最终的k类中心点,比较k类中心点各变量值的大小,k类中心点中各变量值最大的一类即为漏损程度最高类,其次为漏损程度次高类,以此类推,漏损处理优先级也是按照这个顺序。
CN202211578330.XA 2022-12-06 2022-12-06 一种基于k-means均值聚类的DMA小区漏损评价方法 Pending CN115759785A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211578330.XA CN115759785A (zh) 2022-12-06 2022-12-06 一种基于k-means均值聚类的DMA小区漏损评价方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211578330.XA CN115759785A (zh) 2022-12-06 2022-12-06 一种基于k-means均值聚类的DMA小区漏损评价方法

Publications (1)

Publication Number Publication Date
CN115759785A true CN115759785A (zh) 2023-03-07

Family

ID=85345078

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211578330.XA Pending CN115759785A (zh) 2022-12-06 2022-12-06 一种基于k-means均值聚类的DMA小区漏损评价方法

Country Status (1)

Country Link
CN (1) CN115759785A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116433088A (zh) * 2023-04-07 2023-07-14 常州通用自来水有限公司 一种基于层次聚类法的dma小区产销差率处理优先级的评价方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090220488A1 (en) * 2005-08-31 2009-09-03 Humphrey Gardner Evaluating and treating scleroderma
CN106959608A (zh) * 2017-02-27 2017-07-18 同济大学 一种基于聚类粒子群算法的供水管网渗漏优化控制方法
CN107194621A (zh) * 2017-07-14 2017-09-22 水联网技术服务中心(北京)有限公司 一种供水管网管理系统和方法
CN108647470A (zh) * 2018-05-29 2018-10-12 杭州电子科技大学 一种基于聚类和深度信念网络的漏损初定位方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090220488A1 (en) * 2005-08-31 2009-09-03 Humphrey Gardner Evaluating and treating scleroderma
CN106959608A (zh) * 2017-02-27 2017-07-18 同济大学 一种基于聚类粒子群算法的供水管网渗漏优化控制方法
CN107194621A (zh) * 2017-07-14 2017-09-22 水联网技术服务中心(北京)有限公司 一种供水管网管理系统和方法
CN108647470A (zh) * 2018-05-29 2018-10-12 杭州电子科技大学 一种基于聚类和深度信念网络的漏损初定位方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
郝志萍 等: "计量小区(DMA)夜间最小流量解析方法探讨与案例研究", 《南水北调与水利科技》, pages 124 - 127 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116433088A (zh) * 2023-04-07 2023-07-14 常州通用自来水有限公司 一种基于层次聚类法的dma小区产销差率处理优先级的评价方法
CN116433088B (zh) * 2023-04-07 2023-12-26 常州通用自来水有限公司 一种基于层次聚类法的dma小区产销差率处理优先级的评价方法

Similar Documents

Publication Publication Date Title
CN111199016A (zh) 一种基于DTW的改进K-means的日负荷曲线聚类方法
CN106408939B (zh) 基于密度峰值聚类的交通流量序列划分方法
CN110377605B (zh) 一种结构化数据的敏感属性识别与分类分级方法
CN110134719B (zh) 一种结构化数据敏感属性的识别与分类分级方法
CN108681744B (zh) 一种基于数据划分的电力负荷曲线层次聚类方法
CN111368891B (zh) 一种基于免疫克隆灰狼优化算法的K-Means文本分类方法
CN111008504B (zh) 一种基于气象模式识别的风电功率预测误差建模方法
CN111415025A (zh) 一种赤潮等级预测的方法
CN115759785A (zh) 一种基于k-means均值聚类的DMA小区漏损评价方法
CN102088709A (zh) 基于聚类和arima模型的话务量预测方法
CN111062425B (zh) 基于c-k-smote算法的不平衡数据集处理方法
CN101808339A (zh) 一种应用k-means和先验知识的话务小区自适应分类方法
CN110085322A (zh) 一种k-means聚类糖尿病预警模型的改进方法
CN113657678A (zh) 一种基于信息新鲜度的电网电力数据预测方法
CN110544047A (zh) 一种不良数据辨识方法
CN113222027A (zh) 基于加权共享最近邻的自适应聚类中心密度峰值聚类算法
CN110796159A (zh) 基于k-means算法的电力数据分类方法及系统
CN110689266A (zh) 一种基于多源数据的用地潜力研判方法
CN111324790A (zh) 基于支持向量机分类的负荷类型识别方法
CN107093005A (zh) 基于大数据挖掘算法实现办税服务厅自动分级的方法
CN111625578B (zh) 适用于文化科技融合领域时间序列数据的特征提取方法
CN109409394A (zh) 一种基于半监督聚类的cop-kmeans方法与系统
Cui et al. An improved method for K-means clustering
CN116976574A (zh) 一种基于两阶段混合聚类算法的建筑负荷曲线降维方法
CN116433088B (zh) 一种基于层次聚类法的dma小区产销差率处理优先级的评价方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination