CN118095606B - 基于图论和机器学习的城市排水管网监测点优化布置方法 - Google Patents

基于图论和机器学习的城市排水管网监测点优化布置方法 Download PDF

Info

Publication number
CN118095606B
CN118095606B CN202410509860.1A CN202410509860A CN118095606B CN 118095606 B CN118095606 B CN 118095606B CN 202410509860 A CN202410509860 A CN 202410509860A CN 118095606 B CN118095606 B CN 118095606B
Authority
CN
China
Prior art keywords
node
pipe network
planning
nodes
algorithm
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202410509860.1A
Other languages
English (en)
Other versions
CN118095606A (zh
Inventor
沈寅杰
彭越
殷实磊
何东
苟茂华
陈雅丹
蔡艳伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Supcon Information Industry Co Ltd
Original Assignee
Zhejiang Supcon Information Industry Co Ltd
Filing date
Publication date
Application filed by Zhejiang Supcon Information Industry Co Ltd filed Critical Zhejiang Supcon Information Industry Co Ltd
Priority to CN202410509860.1A priority Critical patent/CN118095606B/zh
Publication of CN118095606A publication Critical patent/CN118095606A/zh
Application granted granted Critical
Publication of CN118095606B publication Critical patent/CN118095606B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

本发明涉及排水管网监测点规划技术领域,尤其涉及一种基于图论和机器学习的城市排水管网监测点优化布置方法,包括步骤:基于排水管网的拓扑属性与管网属性构建有向图,有向图中的节点为窨井,边为排水管网;使用第一优化算法对多个节点的点位指标进行同时规划寻优,寻找得到多个侧重点不同的备选规划方案,从多个备选规划方案中选出满足项目需求的备选方案,对于初次规划,将备选方案作为最终的监测点布置方案。对于非初次规划,综合考虑已有监测点的规划特征,结合第二机器学习算法对备选规划方案进行调优,从而确定最终的监测点优化布置方案。本发明可实现准确、高效、个性化地对排水管网监测点位进行规划。

Description

基于图论和机器学习的城市排水管网监测点优化布置方法
技术领域
本发明涉及排水管网监测点规划技术领域,尤其涉及一种基于图论和机器学习的城市排水管网监测点优化布置方法。
背景技术
随着智慧水务的发展,排水公司对管网智能分析的需求越来越大,而作为让管网“看得见”的“眼睛”,监测点位的布置对管网分析的结果有着重要的影响。但由于成本限制,不可能在排水管网的每个节点都安装监测设备,因此如何在有限的成本约束下使得监测点的布设更为合理对智慧水务的建设至关重要。
当前,管网监测点位的规划主要依赖于人工经验,一般的规划人员根据管网的日常运行状况来识别重要节点,比如易冒溢点、关键枢纽点等;并由专业的规划人员综合考虑管网系统的拓扑特性、排水瓶颈来确定主干管、交汇处、泵站前后等重要位置的监测点位。但受限于预算和技术条件,资源配置可能存在一定的主观性和非优化性,难以兼顾全面覆盖与重点监控的需求,且人工规划对专业人员要求较高,仅是管线的梳理与校正就需耗费巨大的精力和较长的时间。
针对以上问题,目前也有不少关于城市排水管网系统监测点优化布置的方法公开。例如,专利号为“CN201610849707.9”的发明专利“一种排水管网监测点的自动识别方法”,该方法首先对收集信息建立排水管网模型,模拟管网模型在多种工况情景下的运行态势,得到每个节点的监测指标(液位、流量或水质)对应的状态曲线,然后结合管网拓扑结构和所在排水分区对节点进行初步分组,接着计算节点状态曲线间相关性,依据相关性大小进行聚类,根据聚类情况,在同类节点中选择与其他点平均相关性最大的作为代表性监测点,确定最终监测点布置方案。
又如,专利号为“CN202310694673.0”的发明专利“基于双层相似度聚类的排水管网监测点优化布置方法”,该方法首先建立排水管网模型,通过排水管网模型获得各降雨事件下的时间序列数据,使用时滞互相关系数聚类算法构建加权形态相似度矩阵,控制形态相似度阈值,对各监测点时间序列数据进行形态相似聚类,然后使用DTW距离聚类算法构建加权幅度相似度矩阵,控制幅度相似度阈值,对形态相似聚类结果进行二次聚类,对聚类结果进行评估,最后调整形态相似度阈值和幅度相似度阈值,得到不同相似度阈值下的最优聚类结果,从而确定监测点布置方案。
以上这类方法需要对排水管网系统建模,再根据模拟结果对节点进行分类,对节点的重要性进行定义,从而选取出具有代表性的节点作为监测点的布置方案。但这类方法有一个共同的问题,就是对数据的需求量大,且对属性数据准确性的依赖程度高,管线和节点属性数据的准确性对方案结果有很大影响。而在对管网规划监测点布置方案之前,往往缺乏这些基础数据,对管网的真实情况了解不足。也正因为如此,才需要安装监测点,通过监测数据了解管网的运行态势,发现关键问题,从而更有针对性地去排查和解决问题,甚至指导管线勘查工作。因此这类先对管网建模,通过分析数据,再规划监测点布置方案的方法并不实用,现实中难以落地。
针对以上通过构建管网水力水质模型来优化监测点布置方法存在的问题,也有其他不需要建模的方法被提出,例如,专利号为“CN202210816536 .5” 的发明专利“一种基于改进K-means的排水管网监测点优化布置方法及系统”,将排水管网中的实际监测点分为重点监测点和非重点监测点两类,先通过BIRCH聚类分析对其进行预聚类,分别得出重点监测点和非重点监测点的聚类个数和聚类中心,再将其作为K值和初始聚类中心输入K-means中,得出最终聚类中心,从而对监测点进行优化布置,该方法解决了现有技术中存在的K-means聚类中K值随机选择且对初始聚类中心样本点敏感影响优化效果以及优化方案不合理的技术问题,但需要以排水管网现有的监测点数据作为原始数据来分析,还需要人为去判断哪些是重点哪些是非重点监测点,且不说判断的合理与否,对于初次规划监测点的排水系统来说,根本没有监测点数据,因此该种方法也存在局限性。
发明内容
(一)要解决的技术问题
鉴于现有技术的上述缺点、不足,本发明提供一种基于图论和机器学习的城市排水管网监测点优化布置方法,其解决了现有实际项目中排水管网监测点规划需求大、规划慢以及规划前数据不足的技术问题。
(二)技术方案
为了达到上述目的,本发明采用的主要技术方案包括:
第一方面,本发明实施例提供一种基于图论和机器学习的城市排水管网监测点优化布置方法,包括以下步骤:
基于排水管网的拓扑属性与管网属性构建有向图,有向图中的节点为窨井,边为排水管网;节点的点位指标包括:当前节点与上下游节点的计算重要性、中介中心性、度中心性和长度因子;
使用第一优化算法对多个节点的点位指标进行同时规划寻优,寻找得到多个侧重点不同的备选规划方案,所述备选规划方案包括选出的多个可供布置流量监测点的备选节点的集合;选出的多个备选节点均满足计算重要性、中介中心性和长度因子较大,而度中心性较小的前提条件;
从多个备选规划方案中选出满足项目需求的备选方案,对于初次规划,将备选方案作为最终的监测点布置方案。
本发明实施例提出的基于图论和机器学习的城市排水管网监测点优化布置方法,引入图论的相关概念来定义节点属性,包括节点的计算重要性、中介中心性、度中心性和长度因子(可代表此节点在图中的重要程度、拓扑关系、几何关系等),这些属性是决定其是否能选为监测点的依据,首先通过计算每个节点的计算重要性、中介中心性、度中心性和长度因子作为选点依据,然后利用第一优化算法进行优化选点(首先得确定选点数量),得到监测点的多个备选规划方案。对于初次规划,可以从中选择方案作为最终的布置方案。
可选地,节点的点位指标还包括:流入流出此节点的管径、地块属性和项目需求指标;
对于非初次规划,方法还包括以下步骤:
收集历史已完成的规划方案中的已有监测点和在完成对应的规划方案的过程中的所有备选规划方案包含的历史备选节点,按照节点的点位指标构建数据集,对数据集中的已有监测点添加标签;通过第二机器学习算法学习数据集中已有监测点的规划偏好与规划习惯的相关特征;进行带标签的机器学习训练得到监测点位优化模型;
将当前规划过程中的第一优化算法计算得到的多个备选规划方案的备选节点作为输入数据;输入监测点位优化模型进行优选,输出得到符合规划偏好与规划习惯的优选节点集合,根据各备选规划方案与优选节点集合的重合率,选择最终的排水管网的监测点优化布置方案。
上述步骤,对于非初次规划,先从历史的监测点中选取合理的多个已有监测点,然后采用第二机器学习算法学习已有监测点布置的规划偏好与规划习惯的相关特征,对利用第一优化算法选点得到的备选规划方案进行调优,得到最终的监测点规划布置方案。
可选地,地块属性包括商业区、住宅区以及工业区,地块属性可判断此节点污水的主要来源属性;项目需求指标包括优先在入流入渗严重区、管网瓶颈点和易冒溢点增加监测点的数量。流入流出此节点的管径可以判断此节点是否是主干管或支线。通过构建节点评价指标体系,可以使得规划的监测点能更加符合实际需求。
可选地,在基于排水管网的拓扑属性与管网属性构建有向图之前,方法还包括对管网的拓扑属性与管网属性进行校正;
拓扑属性与管网属性包括:管点的地理位置、节点间的拓扑关系、管线流向、管段管径尺寸和已有监测点数据;
校正包括:管线是否连通、泵站附近污水流向是否正确、重要节点地理位置是否正确、管径是否大面积缺失、泵站的交叉运行以及已有流量损坏中的任一项或者多项进行校正。
可选地,第一优化算法为遗传算法、蚁群优化算法、模拟退火算法或粒子群优化算法。
可选地,当第一优化算法为遗传算法时,使用第一优化算法对多个节点的点位指标进行同时规划寻优,包括以下步骤:
将节点作为染色体,根据节点个数进行编码;
定义适应度函数为k1*节点计算重要性+k2*节点中介中心性-k3*节点的度中心性+k4*节点长度因子;
计算各代种群中各个个体的适应度,并对其染色体进行遗传操作;采用赌轮选择法进行选择,每个个体进入下一代的概率等于它的适应度值与整个种群中个体适应度值和的比例;然后进行交叉和变异;
通过改变适应度函数,得到侧重点不同的备选规划方案;备选规划方案中的多个节点均满足计算重要性、中介中心性和长度因子较大,而度中心性较小的前提条件。
可选地,第二机器学习算法为随机森林算法、支持向量机算法、决策树算法、梯度提升算法、贝叶斯算法以及神经网络。
可选地,第二机器学习算法为随机森林算法时,通过第二机器学习算法训练预测模型,包括以下步骤:
使用有放回抽样的方式从原始的训练集中抽取包含N个样本的自助抽样集(bootstrap样本集),用于单独训练每棵决策树;
在构建每个决策节点时,从特征集合中随机选择一个特征维度子集,然后在这个特征维度子集中找到最优分隔特征;
重复上述过程,生成多棵独立的决策树,每棵决策树都是对原始数据的不同随机表示的学习结果;
对于分类问题,基于每棵决策树的预测结果进行多数表决作为输出;
对于回归问题,取所有决策树的预测结果的平均值作为最终输出。
可选地,当前节点与上下游节点的计算重要性,通过以下步骤计算得到:
当一个节点被作为流量监测点后,管网在该节点处划分为两段管网,将两段管网中的较大的复杂度作为节点的计算复杂度;
节点的计算复杂度Nnode=max(N1,N2);
其中,Nnode为节点的计算复杂度,N1和N2分别为管网在节点处划分的两段管网的计算复杂度;
管网的计算复杂度等于管网未知变量减去管网方程组个数;
Ncom=Nnum-Nequ
其中,Ncom为管网的计算复杂度,Nnum为管网的管网未知变量,且:
Nnum=1*Nindegree=1+2*Nindegree>1;indegree为管网入度;Nequ为管网方程组个数,且Nequ=Nlink-(n-2)*Ndegree=n(n>=2),degree为节点度数;Nlink为边数;n为节点度数;
计算重要性:I=1-Nnode/(N1+N2);其中,I为节点的计算重要性。
可选地,中介中心性,通过以下步骤计算得到:
其中,为节点i的中介中心性的标准化值,为节点i的中介中心性,分母为节点j与节点k两点间路径的条数,g是节点的总数。
可选地,度中心性,通过以下步骤计算得到:
其中,为节点i的度中心性的标准化值,为节点i的度中心性值,表示节点i与其它g-1个节点的直接联系总数。
可选地,长度因子,通过以下步骤计算得到:
管线总长度为Ls,在节点J处添加流量监测点,则流量监测点J将管网分割为G1和G2,对应的管线总长度分别为L1和L2,此时节点的长度因子L等于1-max(L1,L2)/(L1+L2)。
(三)有益效果
本发明的有益效果是:本发明实施例提出的基于图论和机器学习的城市排水管网监测点优化布置方法,引入图论的相关概念来定义节点属性,包括节点的计算重要性、中介中心性、度中心性和长度因子(可代表此节点在图中的重要程度、拓扑关系、几何关系等),这些属性是决定其是否能选为监测点的依据,首先通过计算每个节点的计算重要性、中介中心性、度中心性和长度因子作为选点依据,然后利用第一优化算法进行优化选点(首先得确定选点数量),得到监测点的多个备选规划方案。对于初次规划,可以从中选择方案作为最终的布置方案。本发明数据需求少,落地性强:相对于现有技术而言,相比现有技术对排水管网建模的方法,其需要大量的管网和节点的属性数据,且对管网和节点的属性数据的准确度要求高,而本发明对排水管网数据要求很低,只需要主要节点和主干管线,且具有基础的拓扑和几何关系即可,不仅能够适用于初次规划,还能适用于非初次规划。
在优选方案中,对于非初次规划,先从历史的监测点中选取合理的多个已有监测点,然后采用第二机器学习算法学习已有监测点布置的规划偏好与规划习惯的相关特征,对利用遗传算法选点得到的备选规划方案进行调优,得到最终的监测点规划布置方案。可使得规划方案更符合实际使用场景和应用需求。
附图说明
图1为本发明优选实施例的基于图论和机器学习的城市排水管网监测点优化布置方法的流程示意图;
图2为本发明优选实施例的针对非初次进行管网监测点规划的项目的基于图论和机器学习的城市排水管网监测点优化布置方法的示意图;
图3为本发明优选实施例的示例管线A-C的有向图;
图4为本发明优选实施例的示例管线A-D的有向图;
图5为本发明优选实施例的示例多入流管线A-D的有向图;
图6为本发明优选实施例的示例多入流管线A-E的有向图;
图7为本发明优选实施例的中介中心性的示意图;
图8为本发明优选实施例的度中心性示意图;
图9为本发明优选实施例的遗传算法流程图。
具体实施方式
为了更好的解释本发明,以便于理解,下面结合附图,通过具体实施方式,对本发明作详细描述。
本发明实施例提出的基于图论和机器学习的城市排水管网监测点优化布置方法,目的是为了给城市排水管网的监测点优化布置提供一种实用的方法,规避传统规划选点方法中的主观性大和可解释性弱等问题,旨在推动智慧水务的发展。本发明引入图论的相关概念来定义节点属性,包括节点的计算重要性、中介中心性、度中心性和长度因子,这些属性是决定其是否能选为监测点的依据,首先通过计算每个节点的计算重要性、中介中心性、度中心性和长度因子作为选点依据,然后利用第一优化算法(本实施例中采用遗传算法)进行优化选点(首先得确定选点数量),得到监测点的布置方案。对于初次规划(或者训练数据不足的场景),此方案就是最终的布置方案。
对于非初次规划,先从历史的监测点中选取合理的多个已有监测点,然后采用第二机器学习算法(本实施例中采用随机森林算法)学习已有监测点布置的规划偏好与规划习惯的相关特征,对利用遗传算法选点得到的备选规划方案进行调优,得到最终的监测点规划布置方案。
为了更好的理解上述技术方案,下面将参照附图更详细地描述本发明的示例性实施例。虽然附图中显示了本发明的示例性实施例,然而应当理解,可以以各种形式实现本发明而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更清楚、透彻地理解本发明,并且能够将本发明的范围完整的传达给本领域的技术人员。
实施例1
图1为本发明实施例中基于图论和机器学习的城市排水管网监测点优化布置方法的流程示意图。
本发明实施例提供一种基于图论和机器学习的城市排水管网监测点优化布置方法,包括以下步骤:
基于排水管网的拓扑属性与管网属性构建有向图,有向图中的节点为窨井,边为排水管网;节点的点位指标包括:当前节点与上下游节点的计算重要性、中介中心性、度中心性和长度因子;
使用第一优化算法对多个节点的点位指标进行同时规划寻优,寻找得到多个侧重点不同的备选规划方案,备选规划方案包括选出的多个可供布置流量监测点的备选节点的集合;选出的多个备选节点均满足计算重要性、中介中心性和长度因子较大,而度中心性较小的前提条件;
从多个备选规划方案中选出满足项目需求的备选方案,对于初次规划,将备选方案作为最终的监测点布置方案。
上述步骤,引入图论的相关概念来定义节点属性,包括节点的计算重要性、中介中心性、度中心性和长度因子(可代表此节点在图中的重要程度、拓扑关系、几何关系等),这些属性是决定其是否能选为监测点的依据,首先通过计算每个节点的计算重要性、中介中心性、度中心性和长度因子作为选点依据,然后利用第一优化算法进行优化选点(首先得确定选点数量),得到监测点的多个备选规划方案。对于初次规划,可以从中选择方案作为最终的布置方案。该方法的鲁棒性较强,对数据要求低,对于初次规划或者训练数据不足的场景,也可以迅速地做出备选规划方案。
实际实施时,节点的点位指标还包括:流入流出此节点的管径、地块属性和项目需求指标。地块属性包括商业区、住宅区以及工业区等,地块属性可判断此节点污水的主要来源属性;项目需求指标依项目实际情况有所差异,一般包括需要优先考虑在入流入渗严重区、管网瓶颈点和易冒溢点等有特殊需求的位置增加监测点的数量。流入流出此节点的管径可以判断此节点是否是主干管或支线。通过构建节点评价指标体系,可以使得规划的监测点能更加符合实际需求。
实施时,参见图2,对于非初次规划,方法还包括以下步骤:
收集历史已完成的规划方案中的已有监测点和在完成对应的规划方案的过程中的所有备选规划方案包含的历史备选节点,按照节点的点位指标构建数据集,对数据集中的已有监测点添加标签;通过第二机器学习算法学习数据集中已有监测点的规划偏好与规划习惯的相关特征;进行带标签的机器学习训练得到监测点位优化模型;
将当前规划过程中的第一优化算法计算得到的多个备选规划方案的备选节点作为输入数据;输入监测点位优化模型进行优选,输出得到符合规划偏好与规划习惯的优选节点集合,根据各备选规划方案与优选节点集合的重合率,选择最终(唯一)的排水管网的监测点优化布置方案。
本实施例中,通过第二机器学习算法训练得到的监测点位优化模型,其优化目标为准确率最高(验证集的召回率最高)。
本实施例中,监测点位优化模型的训练过程如下:
对于已经完成过至少一次规划的A项目,其包含了历史已完成的规划方案中的多个监测点,这些监测点数据的布置位置是否合理,需要综合考虑多种因素,可通过人工对这些监测点数据的合理与否进行确定,将人工(依据经验,或者根据项目落地的效果对这些已完成的监测点进行评分,按照评分分值排序选取部分实施效果评价较好的监测点)选取的合理的监测点作为已有监测点。这些已有监测点属于确实可行的且实施效果较好的监测点。在数据集中为这些已有监测点添加标签为1。在完成对应的规划方案的过程中,使用第一优化算法得到了A项目的所有备选规划方案,得到了所有备选规划方案的所有备选点位(作为历史备选节点)。将历史备选节点和已有监测点一同构建数据集。在数据集中,为已有监测点添加标签1,属于历史备选节点但不属于已有监测点的节点,添加标签为0(或者不添加任何标签)。通过第二机器学习算法学习数据集中已有监测点的规划偏好与规划习惯的相关特征;进行带标签的机器学习(学习不同的标签的特征)训练得到监测点位优化模型。当规划B项目或者再次进行A项目的进一步优化(条件变化或者按使用周期更新)时,均可以用A项目训练好的监测点位优化模型去规划预测B项目的监测点的点位(优选点位)或者A项目的进一步优化的优选点位。
本实施例中,当将在A项目数据集训练得到的监测点位优化模型用于对B项目进行规划时,监测点位优化模型输出的是符合A项目规划特征(规划偏好与规划习惯)的所有B项目的优选节点集合。实际使用时,为了获得最终的规划方案,可从备选规划方案中选取覆盖了最多数量的模型输出的优选节点集合中的节点,或人工在模型输出优选节点集合中选择最终B项目的规划方案,从而得到最终且唯一的排水管网的监测点优化布置方案。
实际实施时,在建立排水管网信息系统时,由于测量、记录或录入等环节可能出现误差,导致地理位置、管径大小、材质、埋深、连接关系等基础信息不准确,所以在基于排水管网的拓扑属性与管网属性构建有向图之前,方法还包括对管网的拓扑属性与管网属性进行校正。即需要对获取(收集)的数据需要进行校正,此处校正的数据主要针对管网的拓扑信息与管线属性,拓扑属性与管网属性包括:管点的地理位置、节点间的拓扑关系、管线流向、管段管径尺寸和已有监测点数据。例如如管线是否连通、泵站附近污水流向是否正确、重要节点地理位置是否正确、管径是否大面积缺失等等,在实际工程应用中还可能会出现更多的问题,如泵站的交叉运行、已有流量损坏等,基于此,本发明将所需指标与重要性进行了列举,如表1所示:
表1 所需指标与质量要求
管段属性 数据质量
重要管点地理位置 +
关键节点间拓扑关系 ++
重要管线流向 ++
主要管段管径尺寸 +
已有监测点数据 +
(其中+代表对数据质量有要求,++代表对数据质量有较高要求)
这种校正包括:管线是否连通、泵站附近污水流向是否正确、重要节点地理位置是否正确、管径是否大面积缺失、泵站的交叉运行以及已有流量损坏中的任一项或者多项进行校正。通过对管线信息的校正,我们可以基本确定管网泵站间的联系,确定污水的基本流向,确定已知监测点位的信息,方便建立有向图进行计算。
本实施例中,节点的点位指标包括:当前节点与上下游节点的计算重要性、中介中心性、度中心性和长度因子。这些因子分别通过以下的方法进行计算:
节点的计算重要性:
在不影响排水管网拓扑关系前提下做出如下假设:
假设(1):每个管点Ji除管线连接的入流和出流外,均有额外的流入流量fi;
假设(2):管线全程不漏损,无额外流量损失;
假设(3):流量监测点设置在管点Ji的出口部分,如若有多个出口,则流量计流量等于出口流量总和;
假设(4):流量监测点仅考虑管线入流,不考虑额外入流。
基于以上四条假设,为了计算每个管点的流量,对于图3的A-C管线的排水流量有以下计算关系:
qA + fB = qB
qB + fC = qC
其中,q为管点流量(这里指出流),f为管点入流;
如若已知A和C的管点流量,即A和C的位置有流量计,当fc为0时,可求得qB等于qC,fB等于qC - qA,此时,这是一个可解问题。
而对于图4的A-D管线,可以得到以下方程:
qA + fB = qB
qB + fC = qC
qC + fD = qD
当fD为0,且A和D点的流量已知的情况下,共有3个方程,有fB、qB、fC和qC 这4个未知数,所以想要此问题可解,仍然需要一个未知数可知,此时如若在B点放置流量计,则qB已知,问题可解。
定义1:管网的计算复杂度N:
在特定边界条件下,若想要计算一段管网中所有点位的流量,将计算过程中的未知数减去方程数定义为这段管网的计算复杂度。由定义可知,管网的计算复杂度可以代表管网在进行节点流量计算时的复杂程度,即管网的计算复杂度越大,流量计算越困难。
对于图5的多入流A-D管线,可以得到以下方程:
qA + fB + qC = qB
qB + fD = qD
此时,在fD为0,且A和D点的流量已知的情况下,可以看到C点的qC = fC,此时有3个未知数,2个方程,此时的计算复杂度为1,同样,此时如若在C点放置流量计,则qC已知,此问题可解。而在fD为0的条件下,qB等于qD,所以在B点放置流量计无意义。
对于图6的多入流A-E管线,可以得到以下方程:
qA + fB + qC + qD = qB
qB + fE = qE
此时,在fE为0,且A和E点的流量已知的情况下,可以看到C点的qC = fC,D点的qD =fD,此时有4个未知数,2个方程,此时的计算复杂度为2,同样,此时如若在C点放置流量计,则qC已知,计算复杂度变为1,此问题可仍然无确定解,所以需要在C点和D点各放置一个流量计。
综上所述:计算复杂度等于管网未知变量减去管网方程组个数。
接下来对管网未知变量和管网方程组个数进行归纳总结:
对于一段管线,可以将其看作是一个图,对于管网未知变量:由假设(1)可知,管网每个管点都有额外入流,即每个节点的未知变量有2个;而由上述A-E管线可知,在管点入度为0的条件下,管点入流等于管点流量,此时未知变量有1个;而在流量监测点处,由假设(4)可知,流量监测点的未知变量为0,由此可得以下公式:
Nnum = 1 * Nindegree=1 + 2 * Nindegree>1
其中,Nnum为管网的管网未知变量,indegree为管网入度。
对于管网方程组数:由以上A-C,A-D,A-E管段方程组个数可知,在无交叉条件下,有几条边就有几个方程,在有一个节点度数为3的情况下,方程组个数等于边数减1,在有一个节点度数为4的情况下,方程组个数等于边数减2,不失规律性,在有一个节点度数为n的情况下,方程组个数等于边数减去n,由此可得以下公式:
Nequ = Nlink - (n - 2)* Ndegree=n(n>=2)
其中,Nequ为管网方程组个数,degree为节点度数;Nlink为边数。
由此可得管网计算复杂度的公式:
Ncom = Nnum - Nequ
其中,Ncom为管网的计算复杂度。管网的计算复杂度可以用来表示管网在进行简单的逻辑推理计算,特别是流量计算时的难度,管网计算复杂度越大,流量计算越困难,计算精度越低,准确性越差,所以需要加装流量监测点将计算精度控制在一个较高的范围。
在此基础上,引申出如下定义:
定义2:节点计算复杂度Nnode与计算重要性I。
如一段管网G(A-E)的计算复杂度为N,现在在管网G中的管点J处加装流量监测点,此时管网被划分为A-J和J-E两段,其计算复杂度分别为N1和N2,将max(N1, N2)定义为这个节点的计算复杂度Nnode,将1 - Nnode/ (N1 + N2)定义为这个节点的重要性I,由计算过程可知,I的取值范围为(0,1/2]。
由定义可知,当某个节点被作为流量监测点后,管网在这个节点处划分为两段管网,将这两段管网中的较大的复杂度作为节点复杂度,节点复杂度可以代表这个节点作为流量监测点是否合适,节点的计算复杂度越大,表明管网被划分后的流量计算越复杂,这个节点也就越不适合作为流量监测点。而节点的计算重要性则是1减去划分后的管网最大复杂度占两个管网复杂度之和的比例,节点的计算复杂度越小,1减去上述比例就越大,表明当这个节点作为流量监测点时,管网被划分后的流量计算越简单,即这个节点越重要,越适合作为流量监测点。
节点的中介中心性和度中心性。
为了确保流量监测点规划在重要分支且节点度数尽可能少的地方,引入图论中的中介中心性和度中心性概念:
中介中心性(Between Centrality)CB:如图7,中介中心性用于衡量一个顶点出现在其他任意两个顶点对之间的最短路径的次数,从而来刻画节点重要性。中介中心性测量了某个节点在多大程度上能够成为“中介”,即在多大程度上控制他人。如果一个节点处于多个节点之间,则可以认为该节点起到重要的“中介”作用,处于该位置的人可以控制信息的传递而影响群体。
计算方式如下:
其中sd(j,i,k)表示j到k的最短路径经过了i,即i处于j到k的最短路径上。
进行标准化:
其中,为节点i的中介中心性的标准化值,为节点i的中介中心性,分母为节点j与节点k两点间路径的条数,即所有路径的数量。g是节点的总数。
度中心性(Degree Centrality)CD
如图8,度中心性测量网络中一个节点与所有其它节点相联系的程度。在无向图(Undirected Graph)中,度中心性测量网络中一个节点与所有其它节点直接相连的程度。对于一个拥有g个节点的无向图,节点i的度中心性是i与其它g-1个节点的直接联系总数(如果是有向图,则需要考虑的出度和入度的问题):
由上述公式可见,网络规模越大,度中心性的最大可能值就越高。为了消除网络规模变化对度中心性的影响,需要进行标准化:
其中,为节点i的度中心性的标准化值,为节点i的度中心性值,表示节点i与其它g-1个节点的直接联系总数。在这个标准化度中心性测量公式中,使用节点i的度中心性值除以其它g-1个节点最大可能的连接数,得到与节点i有直接联系的网络节点的比例。这个比例越大,则表明其中心性越高。
由上述定义和计算公式可知,中介中心性越大,这个节点的“位置”就越关键,就如古代的咽喉要道,兵法必争之地,而度中心性越大,表示这个节点周围的边就越多,而我们流量计的设置更偏向于中介中心性越大、度中心性越小的节点。
节点的长度因子:
考虑管网监测点布置密度及管网信息准确性的问题,引入管线长度因子作为评判标准之一,与节点重要性定义类似,节点长度因子L定义如下:
定义3:节点长度因子L。
若管线总长度为Ls,在节点J处添加流量监测点,则此流量监测点将管网分割为G1和G2,其管线总长度分别为L1和L2,定义此时节点的长度因子L等于1-max(L1,L2)/(L1+L2),其取值范围为(0,1/2]。
由定义可知,节点的长度因子越大,表明这个节点越偏向管线中心的位置,代表了节点在管线中的几何属性,同时,当管网需要多个监测点时,也可以避免监测点间距离过近引起配置效率低的问题,一定程度上可以防止因管网信息不准确导致的节点计算重要性和中介性计算不准确的问题。
对于一张由泵站和管点构成的排水管网图,首先将泵站所在点位作为流量已知点进行计算,由此可将这一张排水管网图根据泵站的位置分割为许多张子排水管网图,对于每一个子排水管网图,计算管网中每个节点的计算重要性、中介中心性、度中心性和长度因子,从而得到一整张由泵站和管点构成的排水管网图的每个节点的节点属性。
实施时,当依据节点属性将某一节点作为监测点位后,其他节点的属性将会发生改变,据此在实际测试中发现,以规划一个节点进行迭代的方式会引发规划失效问题,即规划完一个节点再去规划下一个节点,会使这张图的计算复杂度提高,为了解决这个问题,必须在一张图内同时规划多个节点。为解决多个监测点位同时规划引发的计算量指数爆炸问题,本实施例使用第一优化算法进行优化。
实施时,本发明实施例所称的第一优化算法可以为遗传算法、蚁群优化算法、模拟退火算法或粒子群优化算法。
本实施例中,以第一优化算法为遗传算法时举例说明,使用第一优化算法对多个节点的点位指标进行同时规划寻优,包括以下步骤:
遗传算法流程图如图9,主要包括了编码、初始化种群、个体适应度评估、选择、交叉、变异等模块。详细过程如下:
(1)根据节点个数进行编码,即染色体,本发明实施例采用整数编码的方式,对节点排列顺序进行编码,染色体个数由规划监测点位个数决定。
(2)定义适应度函数为k1*节点计算重要性+k2*节点中介中心性-k3*节点的度中心性+k4*节点长度因子,初始的k1-k4均为1,项目中可根据实际所需进行调整。
(3)计算各代种群中各个个体的适应度,并对其染色体进行遗传操作,本发明在选择过程中采用赌轮选择法,赌轮选择法是一种回放式随机采样方法,每个个体进入下一代的概率等于它的适应度值与整个种群中个体适应度值和的比例;然后进行交叉和变异;交叉过程中交叉率为100%,即所有的染色体都进行交叉运算;变异过程中变异率选择0.001。
通过改变遗传算法的适应度函数,可以得到侧重点不同的备选规划方案,这些备选规划方案中,选出的节点均满足计算重要性、中介中心性和长度因子较大,而度中心性较小的前提条件,对于初次规划,可以根据实际项目需要选择最适合的方案,作为监测点布置方案。
实施时,第二机器学习算法可以为随机森林算法、支持向量机算法、决策树算法、梯度提升算法、贝叶斯算法以及神经网络。
本实施例中,以第二机器学习算法为随机森林算法举例,说明具体步骤:
对于非初次规划,前期已有一些监测点数据,而这些已有监测点的布置位置有些是合理的,有些是不合理的,我们可以提前对这些已有的监测点的合理与否进行定义,然后采用随机森林算法学习已有监测点布置的“好”与“坏”,对遗传算法得到的备选规划方案进行调优。
随机森林的核心思想是通过集成大量决策树模型来提高预测准确性和鲁棒性。其主要步骤包括:
自助采样(Bootstrap Sampling):
使用有放回抽样的方式从原始训练集中抽取一定数量(通常是N个样本)的子集,称为自助抽样集(bootstrap样本集),用于单独训练每棵决策树。
特征随机化:
在构建每个决策节点时,不是使用所有特征进行最佳分割点的选择,而是从特征集合中随机选择一个特征维度子集(特征维度mtry),然后在这个特征维度子集中找到最优分隔特征。
多棵树的建立:
重复上述过程,生成多棵独立的决策树,每棵树都是对原始数据的不同随机表示的学习结果。
投票或平均:
对于分类问题,最终的类别预测是基于每棵树的预测结果进行多数表决(众数投票)作为输出;对于回归问题,则取所有树预测结果的平均值作为最终输出。
特征重要性评估:
随机森林还能计算出各个特征的重要性,可用于特征选择和理解模型内部工作机制。
为了使规划的监测点位满足项目不同的需求以及不同个人监测点位的规划习惯,本发明使用随机森林分类算法对已有项目的监测点位进行学习,可适用于不同的监测规划需求,可实现对流量、液位、电导等监测点位的确定,具体步骤如下:
(1)确定节点评价指标
本发明使用当前节点与上下游节点的计算重要性、中介中心性、度中心性、长度因子,以及流入流出此节点的管径、地块属性(商业区、住宅区、工业区等)、项目需求指标作为点位指标。通过构建节点评价指标体系,可以使得规划的监测点能更加符合实际需求。
(2)数据集构建
按照以上指标构建数据集,数据集的点位由遗传算法计算出的所有备选点位构成,如遗传算法计算出了前100个方案,则将此100个方案中所有的备选点位作为数据集进行训练,这样可以保证点位数据的高质量与训练的高效率,预测指标为是否作为规划节点,0代表否,1代表是,按照6:3:1的比例构建训练集、测试集和验证集。
(3)模型训练与参数调优
在模型训练的过程中,需要调整的主要超参有:树的数量、树的深度、叶子节点个数、节点所需的最小样本数等,这些参数根据不同的项目进行调整,在此不进行展开。
(4)进行预测
预测后可以得到唯一的排水管网监测点优化布置方案,可按照此方案进行监测点位的布置与规划。
本发明基于排水管网几何属性与拓扑属性构建有向图,通过遗传算法高效率地寻找最优监测点位组合,结合管段属性与随机森林算法学习不同的监测点布置方案,实现准确、高效、个性化地对排水管网监测点位进行规划。
监测点优化布置方案与项目实际需求息息相关,不仅受管网系统自身特征的影响、与管网实际运行情况有关,还受到成本的制约,因此规划人员需要根据实际情况提前确定安装监测点的个数,再通过上述步骤得到监测点的优化布置方案。本发明通过引入图论的方法,依据数学原理建立指标体系,具有很强的可解释性,每一个监测点位的布置均有其具体的原因,并综合考虑了项目实际需要,采用随机森林的机器学习算法,学习已有的合理的监测点位布置,考虑实际项目的特殊性(如入流入渗需求),将理论与实际相结合,使方案更具合理性。
本发明实施例的基于图论和机器学习的城市排水管网监测点优化布置方法基于排水管网几何属性与拓扑属性构建有向图,通过遗传算法高效率地寻找最优监测点位组合,结合管段属性与随机森林算法学习不同的监测点布置方案,实现准确、高效、个性化地对排水管网监测点位进行规划。本发明使用算法替代人工进行规划,可节省规划人员梳理管线、实地调研的时间,加快整体进度,可以有效地节约项目时间。
在本发明的描述中,需要理解的是,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本发明的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。
在本发明中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”、“固定”等术语应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或成一体;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连;可以是两个元件内部的连通或两个元件的相互作用关系。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。
在本发明中,除非另有明确的规定和限定,第一特征在第二特征 “上”或“下”,可以是第一和第二特征直接接触,或第一和第二特征通过中间媒介间接接触。而且,第一特征在第二特征“之上”、“上方”和“上面”,可以是第一特征在第二特征正上方或斜上方,或仅仅表示第一特征水平高度高于第二特征。第一特征在第二特征“之下”、“下方”和“下面”,可以是第一特征在第二特征正下方或斜下方,或仅仅表示第一特征水平高度低于第二特征。
在本说明书的描述中,术语“一个实施例”、“一些实施例”、“实施例”、“示例”、“具体示例”或“一些示例”等的描述,是指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行改动、修改、替换和变型。

Claims (10)

1.一种基于图论和机器学习的城市排水管网监测点优化布置方法,其特征在于,包括以下步骤:
基于排水管网的拓扑属性与管网属性构建有向图,所述有向图中的节点为窨井,边为排水管网;节点的点位指标包括:当前节点与上下游节点的计算重要性、中介中心性、度中心性和长度因子;
使用第一优化算法对多个节点的点位指标进行同时规划寻优,寻找得到多个侧重点不同的备选规划方案,所述备选规划方案包括选出的多个可供布置流量监测点的备选节点的集合;选出的多个所述备选节点均满足计算重要性、中介中心性和长度因子较大,而度中心性较小的前提条件;
从多个所述备选规划方案中选出满足项目需求的备选方案,对于初次规划,将所述备选方案作为最终的监测点布置方案;
对于非初次规划,所述方法还包括以下步骤:
收集历史已完成的规划方案中的已有监测点和在完成对应的规划方案的过程中的所有备选规划方案包含的历史备选节点,按照节点的点位指标构建数据集,对数据集中的已有监测点添加标签;通过第二机器学习算法学习数据集中已有监测点的规划偏好与规划习惯的相关特征;进行带标签的机器学习训练得到监测点位优化模型;
将当前规划过程中的所述第一优化算法计算得到的多个备选规划方案的备选节点作为输入数据;输入所述监测点位优化模型进行优选,输出得到符合所述规划偏好与规划习惯的优选节点集合,根据各备选规划方案与所述优选节点集合的重合率,选择最终的排水管网的监测点优化布置方案;
所述当前节点与上下游节点的计算重要性,通过以下步骤计算得到:
当一个节点被作为流量监测点后,管网在所述节点处划分为两段管网,将所述两段管网中的较大的复杂度作为节点的计算复杂度;
节点的计算复杂度Nnode=max(N1,N2);
其中,Nnode为节点的计算复杂度,N1和N2分别为管网在节点处划分的两段管网的计算复杂度;
管网的计算复杂度等于管网未知变量减去管网方程组个数;
Ncom=Nnum-Nequ
其中,Ncom为管网的计算复杂度,Nnum为管网的管网未知变量,且:
Nnum=1*Nindegree=1+2*Nindegree>1;indegree为管网入度;Nequ为管网方程组个数,且Nequ=Nlink-(n-2)*Ndegree=n(n>=2),degree为节点度数;Nlink为边数;n为节点度数;
计算重要性:I=1-Nnode/(N1+N2);其中,I为节点的计算重要性;
所述长度因子,通过以下步骤计算得到:
管线总长度为Ls,在节点J处添加流量监测点,则所述流量监测点J将管网分割为G1和G2,对应的管线总长度分别为L1和L2,此时节点的长度因子L等于1-max(L1,L2)/(L1+L2)。
2.如权利要求1所述的优化布置方法,其特征在于,所述节点的点位指标还包括:流入流出此节点的管径、地块属性和项目需求指标。
3.如权利要求2所述的优化布置方法,其特征在于,所述地块属性包括商业区、住宅区以及工业区;所述项目需求指标包括优先在入流入渗严重区、管网瓶颈点和易冒溢点增加监测点的数量。
4.如权利要求1所述的优化布置方法,其特征在于,在基于排水管网的拓扑属性与管网属性构建有向图之前,所述方法还包括对管网的拓扑属性与管网属性进行校正;
所述拓扑属性与管网属性包括:管点的地理位置、节点间的拓扑关系、管线流向、管段管径尺寸和已有监测点数据;
所述校正包括:管线是否连通、泵站附近污水流向是否正确、重要节点地理位置是否正确、管径是否大面积缺失、泵站的交叉运行以及已有流量损坏中的任一项或者多项进行校正。
5.如权利要求1所述的优化布置方法,其特征在于,所述第一优化算法为遗传算法、蚁群优化算法、模拟退火算法或粒子群优化算法。
6.如权利要求5所述的优化布置方法,其特征在于,当所述第一优化算法为遗传算法时,所述使用第一优化算法对多个节点的点位指标进行同时规划寻优,包括以下步骤:
将节点作为染色体,根据节点个数进行编码;
定义适应度函数为k1*节点计算重要性+k2*节点中介中心性-k3*节点的度中心性+k4*节点长度因子;
计算各代种群中各个个体的适应度,并对其染色体进行遗传操作;采用赌轮选择法进行选择,每个个体进入下一代的概率等于它的适应度值与整个种群中个体适应度值和的比例;然后进行交叉和变异;
通过改变适应度函数,得到侧重点不同的备选规划方案;所述备选规划方案中的多个节点均满足计算重要性、中介中心性和长度因子较大,而度中心性较小的前提条件。
7.如权利要求2所述的优化布置方法,其特征在于,所述第二机器学习算法为随机森林算法、支持向量机算法、决策树算法、梯度提升算法、贝叶斯算法以及神经网络。
8.如权利要求7所述的优化布置方法,其特征在于,所述第二机器学习算法为随机森林算法时,所述通过第二机器学习算法训练预测模型,包括以下步骤:
使用有放回抽样的方式从原始的训练集中抽取包含N个样本的自助抽样集,用于单独训练每棵决策树;
在构建每个决策节点时,从特征集合中随机选择一个特征维度子集,然后在这个特征维度子集中找到最优分隔特征;
重复上述过程,生成多棵独立的决策树,每棵决策树都是对原始数据的不同随机表示的学习结果;
对于分类问题,基于每棵决策树的预测结果进行多数表决作为输出;
对于回归问题,取所有决策树的预测结果的平均值作为最终输出。
9.如权利要求1所述的优化布置方法,其特征在于,所述中介中心性,通过以下步骤计算得到:
其中,为节点i的中介中心性的标准化值,为节点i的中介中心性,分母为节点j与节点k两点间路径的条数,g是节点的总数。
10.如权利要求1所述的优化布置方法,其特征在于,所述度中心性,通过以下步骤计算得到:
其中,为节点i的度中心性的标准化值,为节点i的度中心性值,表示节点i与其它g-1个节点的直接联系总数。
CN202410509860.1A 2024-04-26 基于图论和机器学习的城市排水管网监测点优化布置方法 Active CN118095606B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410509860.1A CN118095606B (zh) 2024-04-26 基于图论和机器学习的城市排水管网监测点优化布置方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202410509860.1A CN118095606B (zh) 2024-04-26 基于图论和机器学习的城市排水管网监测点优化布置方法

Publications (2)

Publication Number Publication Date
CN118095606A CN118095606A (zh) 2024-05-28
CN118095606B true CN118095606B (zh) 2024-06-28

Family

ID=

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109117985A (zh) * 2018-07-13 2019-01-01 上海市水利工程设计研究院有限公司 一种基于矩阵与遗传算法的管网压力监测点优化布置方法
CN115048804A (zh) * 2022-06-30 2022-09-13 浙江树人学院 一种城市管网多传感器优化部署方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109117985A (zh) * 2018-07-13 2019-01-01 上海市水利工程设计研究院有限公司 一种基于矩阵与遗传算法的管网压力监测点优化布置方法
CN115048804A (zh) * 2022-06-30 2022-09-13 浙江树人学院 一种城市管网多传感器优化部署方法

Similar Documents

Publication Publication Date Title
CN106022518B (zh) 一种基于bp神经网络的管道破损概率预测方法
CN109408848B (zh) 一种考虑径流演变时空异质性的分布式归因方法
CN112016175B (zh) 一种基于树状层次聚类的供水管网测压点优化布置方法
CN108799844B (zh) 一种基于模糊集的供水管网压力监测点选址方法
CN105069537A (zh) 一种组合式空气质量预报模型的构建方法
CN115906675B (zh) 基于时序多目标预测模型的井位及注采参数联合优化方法
CN107067341A (zh) 一种基于多级熵权的rbfnn配电自动化系统状态操作评价方法
CN107295537A (zh) 一种测评无线传感器网络可靠性的方法及系统
CN108717584B (zh) 一种供水管网多目标分区方法
CN110751176A (zh) 一种基于决策树算法的湖泊水质预测方法
CN114777192A (zh) 基于数据关联和深度学习的二级网供热自主优化调控方法
CN115948964A (zh) 一种基于ga-bp神经网络的路面平整度预测方法
CN118095606B (zh) 基于图论和机器学习的城市排水管网监测点优化布置方法
CN112434887B (zh) 一种结合网络核密度估计和svm的供水管网风险预测方法
CN113689004A (zh) 基于机器学习的地下管网承载力评价方法及系统
CN116451963B (zh) 一种基于集成学习的多因子养老服务设施优化配置的方法
CN118095606A (zh) 基于图论和机器学习的城市排水管网监测点优化布置方法
CN117350146A (zh) 一种基于ga-bp神经网络的排水管网健康性评价方法
CN107977727B (zh) 一种基于社会发展和气候因素预测光缆网阻断概率的方法
CN114862007A (zh) 一种面向碳酸盐岩气井的短周期产气量预测方法及系统
CN116090696A (zh) 适用于山区铁路沿线的滑坡地质灾害风险分类预测方法
Wu et al. Evolving effective hydraulic model for municipal water systems
CN114549026B (zh) 基于算法组件库分析的未知诈骗的识别方法及系统
CN117807510B (zh) 结合多源数据处理的河网动态分区方法及系统
CN117057516B (zh) 一种基于系统动力学的碳核算参数分析预测方法

Legal Events

Date Code Title Description
PB01 Publication
SE01 Entry into force of request for substantive examination
GR01 Patent grant