CN114021644A - 一种基于K-means和去丛聚法的区域代表性地下水位计算方法 - Google Patents

一种基于K-means和去丛聚法的区域代表性地下水位计算方法 Download PDF

Info

Publication number
CN114021644A
CN114021644A CN202111294055.4A CN202111294055A CN114021644A CN 114021644 A CN114021644 A CN 114021644A CN 202111294055 A CN202111294055 A CN 202111294055A CN 114021644 A CN114021644 A CN 114021644A
Authority
CN
China
Prior art keywords
water level
well
clustering
value
wells
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111294055.4A
Other languages
English (en)
Inventor
曹文庚
南天
康玮
付宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Hydrogeology and Environmental Geology CAGS
Original Assignee
Institute of Hydrogeology and Environmental Geology CAGS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Hydrogeology and Environmental Geology CAGS filed Critical Institute of Hydrogeology and Environmental Geology CAGS
Priority to CN202111294055.4A priority Critical patent/CN114021644A/zh
Publication of CN114021644A publication Critical patent/CN114021644A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/11Complex mathematical operations for solving equations, e.g. nonlinear equations, general mathematical optimization problems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Mathematical Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Analysis (AREA)
  • Computational Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Operations Research (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Algebra (AREA)
  • Probability & Statistics with Applications (AREA)
  • Software Systems (AREA)
  • Remote Sensing (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供了一种基于K‑means和去丛聚法的区域代表性地下水位计算方法,包括:确定井数量n和监测数据连续年份m;当井数量n小于或等于监测数据连续年份m时,直接建立单井水位变动值与水均衡法算得的区域整体水位变化值之间的线性方程组,求解线性方程组得唯一解;当井数量n大于监测数据连续年份m时,利用k‑means方法基于井的坐标位置进行聚类,直至全部井群分类出的子群中均满足n≤m;在各类别中利用泰森多边形去丛聚法确定单井控制面积,然后基于单井控制面积,采用水均衡法计算区域整体水位变化值,再代入步骤S2中求解,进而计算区域水位变化特征值。本发明能够快速求解区域水位变化特征值,极大的减少统计和评估的工作量。

Description

一种基于K-means和去丛聚法的区域代表性地下水位计算 方法
技术领域
本发明涉及地下水安全监测技术领域,特别是涉及一种基于K-means和去丛聚法的区域代表性地下水位计算方法。
背景技术
目前,在地下水管理和超采治理评价工作中主要应用四种方法计算区域地下水位变化值:水位变化平均法、水位变化状况统计法、水均衡反算法和数值模拟法。四种方法在效率和准确性上各有特点:水位变化平均法和水位变化状况统计法这类直接调查类型的方法求解过程简单,方便工作开展,但代表性较差,对于含水层结构、补排条件稍微复杂的区域的适用性差;水均衡反算法得到的计算结果比较有代表性,但需要统计的数据量较大,各类不同数据收集涉及到的单位较多,成本较直接调查法较高;而模拟计算方法准确性较高,但往往需要大量的各类源汇项数据作为支撑,且模型构建耗费时间较长。
地下水位的动态变化是地下水资源储量变化最直接的体现,也是研究地下水赋存与演变规律所需的基础信息,因此获取地下水位变化数据是解决水资源问题的必要工作之一。在实际工作中,受区域补排条件差异和含水介质渗透性的影响,单井水位变化的影响范围具有局限性,而同一研究区内群井观测水位各自的变化规律也不尽相同。目前,水位变化情况已经作为水利部、地方政府和相关单位开展地下水超采治理评估的主要依据,因此如何获取能够代表区域整体水位变化水平的特征值是亟待解决的关键问题。
发明内容
本发明的目的是提供一种基于K-means和去丛聚法的区域代表性地下水位计算方法,能够快速求解区域水位变化特征值,极大的减少统计和评估的工作量,为超采治理工作提供更加准确、全面的数据参考。
为实现上述目的,本发明提供了如下方案:
一种基于K-means和去丛聚法的区域代表性地下水位计算方法,包括如下步骤:
S1,基于井群的历史监测数据,确定井数量n和监测数据连续年份m,并判断井数量n和监测数据连续年份m之间的大小关系;
S2,当井数量n小于或等于监测数据连续年份m时,建立单井水位变动值与水均衡法算得的区域整体水位变化值之间的线性方程组,求解线性方程组得唯一解;
S3,当井数量n大于监测数据连续年份m时,利用k-means方法基于井的坐标位置进行聚类,直至全部井群分类出的子群中均满足n≤m;
S4,在各类别中利用泰森多边形去丛聚法确定单井控制面积Sn
S5,在各类别中,基于单井控制面积Sn,采用水均衡法计算区域整体水位变化值,建立单井水位变动值与水均衡法算得的区域整体水位变化值之间的线性方程组,求解线性方程组得唯一解;
S6,根据步骤S2或S6求解到的唯一解确定单井唯一权重系数,进而计算区域水位变化特征值。
进一步的,步骤S2中,建立单井水位变动值与水均衡法算得的区域整体水位变化值之间的线性方程组,求解线性方程组得唯一解,具体包括:
对于分布在同一区域内的多个水文观测井,观测水位的变化是连续且相互关联的,根据这一特点,已知m个连续年间,n口井各自的水位变化值,建立单井水位变差与水均衡计算地下水储变量之间的线性方程组:
Figure BDA0003335830860000021
式中,xmn为第n口井m年的水位变动值,单位为米,αn为第n口井的单井权重值,
Figure BDA0003335830860000022
为第m年根据水均衡法算得的区域整体水位变化值,单位为米;
上式亦可矩阵化表述为:
Figure BDA0003335830860000023
求解上述方程组即可得到单井的权重分配系数,根据线性方程组解的规律或行列式值的特征,在去除等比例项后自变量个数与方程个数相等,即系数矩阵满秩时,方程有唯一解;此时便可获得单井的权重分配系数值,利用该系数向量便可在后续工作中直接利用井群水位观测值计算出区域的水位变化特征值,即:
Figure BDA0003335830860000031
式中,x′n为第n口井的年水位变动观测值,单位为米,αn为第n口井的单井权重值,
Figure BDA0003335830860000032
为计算年区域整体水位变化特征值,单位为米。
进一步的,步骤S3中,利用k-means方法基于井的坐标位置进行聚类,直至全部井群分类出的子群中均满足n≤m,具体为:
S301,给出待聚类的多维数据集:研究区范围内n口井的单井井位坐标数据,根据地下水位变差数据先验经验,选择合适的聚类数值k:
Figure BDA0003335830860000033
式中,xij为代表源数据进行聚类分析的样本点的多维向量;n为样本中点的总个数,即井群中井的个数;q为源数据中样本所包含的特征数目,即样本维度;k为聚类分析时设定的类别数目,即连续年年份m;
S302,从数据集
Figure BDA0003335830860000034
中随机选取K个样本作为每一类的初始聚类中心,分别计算其他所有样本点与确定的初始聚类中心间的欧式距离,以最短距离作为判断标准将各样本分别聚入该簇中,两点欧氏距离计算如下:
Figure BDA0003335830860000035
式中,
Figure BDA0003335830860000036
为第k簇初始聚类中心;
S303,聚类完成之后,在结果中的每类数据中给出新的聚类中心点,判断新的聚类中心与该簇中其他样本间是否满足给定的限制条件,若满足则聚类完成,输出最终的聚类中心,若不满足,则将新的聚类中心作为初始,再次进行聚类,直到达到限制条件,所述限制条件通过规定误差平方和的值来规定,即算法将不断重新进行聚类工作直到满足所有类别中每一个样本点与该样本点所在类聚类中心间欧式距离之和小于一个定值E,误差平方和计算公式如下:
Figure BDA0003335830860000041
式中,Ci为第i簇样本,m为连续年年份,也是聚类类别数,当完成全部聚类后,在每一个最小类别中均有n不大于m,此时在各自类别中均能够构建相关方程。
进一步的,步骤S4中,在各类别中利用泰森多边形去丛聚法确定单井控制面积Sn,具体包括:
S401,连接相邻离散点,即各单井所在的坐标点构成井群中井间三角形网格;
S402,对于每个独立的三角形网格,作其各边的中垂线,全部中垂线围成一个新的多边形网;
S403,每一个独立多边形网格中包含唯一井位,此时该多边形网格所包围的区域即为该井位对应的控制范围,其面积为Sn
进一步的,步骤S5中,在各类别中,基于单井控制面积Sn,采用水均衡法计算区域整体水位变化值,建立单井水位变动值与水均衡法算得的区域整体水位变化值之间的线性方程组,求解线性方程组得唯一解,具体包括:
利用步骤S4确定各单井的控制范围,得到聚类后某个井群的总控制范围,对应的井群类别中全部井的控制范围内第n个应力期采用水均衡法计算得到的水位变差值,由下式计算得出:
Figure BDA0003335830860000042
式中,ΔQn为地下水储变量,将结果代入步骤S2中得到线性方程组,按步骤S2的方式,求解线性方程组得唯一解。
根据本发明提供的具体实施例,本发明公开了以下技术效果:本发明提供的基于K-means和去丛聚法的区域代表性地下水位计算方法,在总结常用方法的基础上,将新兴的聚类分析方法融入了传统的调查统计和均衡计算法;此计算方法能够在充分利用调查资料的前提下,通过对参与计算的井群合理分配固定的权重值,达到快速求解区域水位变化特征值的效果;该方法只需进行一次权重系数求解过程,获取单井特征值后,可在之后的统计中直接利用各井观测水位变化值与对应系数算得研究区整体水位变化特征值,据此对区域水位整体变化进行评价,极大的减少了统计和评估的工作量;同时,采用多种科学方法联合求得的水位变化特征值建立了各井点处地质条件与区域整体地质条件之间的相关性关系,与传统方法相比能够给出更加准确和显著的超采治理工作效果,在实际工作中具有较高的推广价值。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例基于K-means和去丛聚法的区域代表性地下水位计算方法的流程示意图;
图2为算例研究区概况图;
图3为k-means聚类算法观测点位置;
图4为k-means聚类算法聚类结果。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的目的是提供一种基于K-means和去丛聚法的区域代表性地下水位计算方法,能够快速求解区域水位变化特征值,极大的减少统计和评估的工作量,为超采治理工作提供更加准确、全面的数据参考。使用本方法计算水位变化表征值主要数据需求为监测井群的历史观测数据,针对计算过程中可能出现的情况需引入k-means聚类算法和泰森多边形去丛聚法对井群进行分类,分层次构建群井水位变化与区域水位变化间的线性关系。
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
如图1所示,本发明实施例提供的基于K-means和去丛聚法的区域代表性地下水位计算方法,包括如下步骤:
S1,基于井群的历史监测数据,确定井数量n和监测数据连续年份m,并判断井数量n和监测数据连续年份m之间的大小关系;
S2,当井数量n小于或等于监测数据连续年份m时,建立单井水位变动值与水均衡法算得的区域整体水位变化值之间的线性方程组,求解线性方程组得唯一解;
实际情况中往往出现n大于m的情况,此时直接建立的方程组会出现无解的情况,无法确定单井特征值,为解决这一问题,在以下步骤引入k-means聚类算法和泰森多边形方法对井群进行聚类分析后,通过多步求解确定单井唯一权重系数,进而计算区域水位变化特征值;
S3,当井数量n大于监测数据连续年份m时,利用k-means方法基于井的坐标位置进行聚类,直至全部井群分类出的子群中均满足n≤m;
S4,在各类别中利用泰森多边形去丛聚法确定单井控制面积Sn
S5,在各类别中,基于单井控制面积Sn,采用水均衡法计算区域整体水位变化值,建立单井水位变动值与水均衡法算得的区域整体水位变化值之间的线性方程组,求解线性方程组得唯一解;
S6,根据步骤S2或S6求解到的唯一解确定单井唯一权重系数,进而计算区域水位变化特征值。
其中,步骤S2中,建立单井水位变动值与水均衡法算得的区域整体水位变化值之间的线性方程组,求解线性方程组得唯一解,具体包括:
对于分布在同一区域内的多个水文观测井,观测水位的变化是连续且相互关联的,根据这一特点,已知m个连续年间,n口井各自的水位变化值,建立单井水位变差与水均衡计算地下水储变量之间的线性方程组:
Figure BDA0003335830860000061
式中,xmn为第n口井m年的水位变动值,单位为米,αn为第n口井的单井权重值,
Figure BDA0003335830860000071
为第m年根据水均衡法算得的区域整体水位变化值,即水均衡计算地下水储变量,单位为米;
上式亦可矩阵化表述为:
Figure BDA0003335830860000072
求解上述方程组即可得到单井的权重分配系数,根据线性方程组解的规律或行列式值的特征,在去除等比例项后自变量个数与方程个数相等,即系数矩阵满秩时,方程有唯一解;此时便可获得单井的权重分配系数值,利用该系数向量便可在后续工作中直接利用井群水位观测值计算出区域的水位变化特征值,即:
Figure BDA0003335830860000073
式中,x′n为第n口井的年水位变动观测值,单位为米,αn为第n口井的单井权重值,
Figure BDA0003335830860000074
为计算年区域整体水位变化特征值,单位为米。
k-means聚类算法是一种无监督的学习方法,是计算机科学近年来常用的分类计算方法,最早由MacQueen提出,其基本训练思路是基于样本数据间的欧几里得距离分析样本之间的相似性,将同条件判断下更相似的数据聚为一簇,形成多个簇,每一个簇内部的样本相互间相似度高于与其他簇中数据相互间相似度,最终得到几个差异性较高的不同簇以实现聚类,k-means聚类算法相较于其他分类或聚类法具有客观性,科学性,广泛性等优点,聚类可用的维度(即参考特征的个数)相对灵活,与其他数学方法相结合的研究效果较好,在气象科学、煤炭工业科学、环境保护与污染治理以及水文地质学等许多领域已有效果较好的应用实例。
本发明为解决由观测井数量多于连续年数据(即n>m)造成的方程组无解问题,将以井群观测值为基础数据,以空间分布为特征变量,利用k-means方法对井群进行聚类。在聚类后的m类井群中分别求得该类中各单井在该井群中的权重值,再将每一类整体作为一个虚拟井,类别数作为井数进行多次求解,最终得到单井在全部井群中的权重值。
具体地,步骤S3中,利用k-means方法基于井的坐标位置进行聚类,直至全部井群分类出的子群中均满足n≤m,具体为:
S301,给出待聚类的多维数据集:研究区范围内n口井的单井井位坐标数据,根据地下水位变差数据先验经验,选择合适的聚类数值k:
Figure BDA0003335830860000081
式中,xij为代表源数据进行聚类分析的样本点的多维向量;n为样本中点的总个数,即井群中井的个数;q为源数据中样本所包含的特征数目,即样本维度;k为聚类分析时设定的类别数目,即连续年年份m;
S302,从数据集
Figure BDA0003335830860000082
中随机选取K个样本作为每一类的初始聚类中心,分别计算其他所有样本点与确定的初始聚类中心间的欧式距离,以最短距离作为判断标准将各样本分别聚入该簇中,两点欧氏距离计算如下:
Figure BDA0003335830860000083
式中,
Figure BDA0003335830860000084
为第k簇初始聚类中心;
S303,聚类完成之后,在结果中的每类数据中给出新的聚类中心点,判断新的聚类中心与该簇中其他样本间是否满足给定的限制条件,若满足则聚类完成,输出最终的聚类中心,若不满足,则将新的聚类中心作为初始,再次进行聚类,直到达到限制条件,所述限制条件通过规定误差平方和的值来规定,即算法将不断重新进行聚类工作直到满足所有类别中每一个样本点与该样本点所在类聚类中心间欧式距离之和小于一个定值E,误差平方和计算公式如下:
Figure BDA0003335830860000085
式中,Ci为第i簇样本,m为连续年年份,也是聚类类别数,当完成全部聚类后,在每一个最小类别中均有n不大于m,此时在各自类别中均能够构建相关方程。
为了使地下水位监测点数据的统计结果更客观地反映典型区域实际水位变化情况,需要对水位监测点数据进行去丛聚处理,其核心思想就是给密集的数据赋较小的权值,给稀疏的数据赋较大的权值,本发明主要采用泰森多边形去丛聚方法。泰森多边形是一种广泛应用于定性分析、统计分析、邻近分析等研究的多边形去丛聚方法,其最早由荷兰气候学家A·H·Thiessen提出并用于计算基于离散分布气象站记录的降雨量的地区平均降雨量,在去丛聚过程中具有较高的精确度。为计算各观测井所在分区的面积,从而根据分区储变量计算区域水位变化,使用泰森多边形去丛聚法对研究区面积进行分割。
其中,步骤S4中,在各类别中利用泰森多边形去丛聚法确定单井控制面积Sn,具体包括:
S401,连接相邻离散点,即各单井所在的坐标点构成井群中井间三角形网格;
S402,对于每个独立的三角形网格,作其各边的中垂线,全部中垂线围成一个新的多边形网;
S403,每一个独立多边形网格中包含唯一井位,此时该多边形网格所包围的区域即为该井位对应的控制范围,其面积为Sn
步骤S5中,在各类别中,基于单井控制面积Sn,采用水均衡法计算区域整体水位变化值,建立单井水位变动值与水均衡法算得的区域整体水位变化值之间的线性方程组,求解线性方程组得唯一解,具体包括:
利用步骤S4确定各单井的控制范围,得到聚类后某个井群的总控制范围,对应的井群类别中全部井的控制范围内第n个应力期采用水均衡法计算得到的水位变差值,由下式计算得出:
Figure BDA0003335830860000091
式中,ΔQn为地下水储变量,将结果代入步骤S2中得到线性方程组,按步骤S2的方式,求解线性方程组得唯一解。
在具体实施例中,使用GMS软件建立单元格大小为70*70单位长度,共约7000个单元的算例模型。渗透系数设定为10m/d;给水度设定为0.3;源汇项部分以降雨入渗量为主要补给项,排泄项主要为面状开采;应力期设定为5年。随机选择五个点位作为观测井,基于泰森多边形法对研究区进行分割作为均衡分区,如图2所示。运行模型记录算例区5年每年年末时观测点水位数据,逐年作差获取观测点4组水位变差值,同时根据补给量和排泄量计算逐年地下水储变量并根据泰森多边形法分割的均衡区计算各均衡区水位的变化值,见表1。
表1算例研究区模拟水位及计算水位变差表
Figure BDA0003335830860000101
根据算例研究区概况和观测点数量建立线性方程组:
Figure BDA0003335830860000102
式中,
Figure BDA0003335830860000103
为对应的井群类别中全部井的控制范围内第n个应力期采用水均衡法计算得到的水位变差值,由式(7)计算得出。
算例中n=5,m=3,此时需要进行两次三元线性方程组求解的过程,使用k-means算法对观测点位置信息进行聚类分析,算法生成的观测点位置信息和聚类结果如图3和图4所示,初次求解时将如图4中第Ⅱ类中2,3,4号三个观测点位的数据代入方程组中进行求解;第二次求解时,将第Ⅰ类中1号,第Ⅱ类整体的以及第Ⅲ类中的5号观测点位数据代入方程求解。
根据算例研究区井群聚类分析结果,整理确定每一类井群对应的区域内各井水位变化数据和井群泰森多边形水均衡分区内储变量变化数据。聚类分析结果表明,2、3、4号井聚于一类,同时另外两口井分别聚于一类。故需分两次计算线性方程:1)对2、3、4号井构建线性方程:
Figure BDA0003335830860000111
其中,xnm为n井m组水位变化数据;an为II类中n号井的系数;
Figure BDA0003335830860000112
是三个井区域合并后,使用水均衡法计算的第m组水位变化。
2)对1、5号井和II类总体构建线性方程:
Figure BDA0003335830860000113
其中,
Figure BDA0003335830860000114
为2、3、4三个井区域合并后,使用水均衡法计算的第m组水位变化;A为研究区中II类整体的系数;
Figure BDA0003335830860000115
是全区域合并后,使用水均衡法计算的第m组水位变化。
3)计算结果:
通过两次方程计算得到一组权重系数:
aT=[α1,Aα2,Aα3,Aα4,α5] (11)
使用上述计算方法对算例数据进行计算,其中前三组变差数据用于观测水位加权计算,第四组数据代入得到的权重系数矩阵与实际值对比作为验证。代入求解后解得得一组权重系数如表2所示。
表2算例观测井水位变化权重值
Figure BDA0003335830860000116
利用观测井第五年水位变差数据和解得的水位变化权重值进行计算,得到第五年研究区整体水位变差为0.23m;同时利用储变量变化计算第五年研究区整体水位变差为0.21m。两者计算结果相差0.02m,误差为9.5%,算例计算结果较为准确,说明方法具备有效性。
本发明提供的基于K-means和去丛聚法的区域代表性地下水位计算方法,在总结常用方法的基础上,将新兴的聚类分析方法融入了传统的调查统计和均衡计算法;此计算方法能够在充分利用调查资料的前提下,通过对参与计算的井群合理分配固定的权重值,达到快速求解区域水位变化特征值的效果;该方法只需进行一次权重系数求解过程,获取单井特征值后,可在之后的统计中直接利用各井观测水位变化值与对应系数算得研究区整体水位变化特征值,据此对区域水位整体变化进行评价,极大的减少了统计和评估的工作量;同时,采用多种科学方法联合求得的水位变化特征值建立了各井点处地质条件与区域整体地质条件之间的相关性关系,与传统方法相比能够给出更加准确和显著的超采治理工作效果,在实际工作中具有较高的推广价值。
本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。

Claims (5)

1.一种基于K-means和去丛聚法的区域代表性地下水位计算方法,其特征在于,包括以如下步骤:
S1,基于井群的历史监测数据,确定井数量n和监测数据连续年份m,并判断井数量n和监测数据连续年份m之间的大小关系;
S2,当井数量n小于或等于监测数据连续年份m时,建立单井水位变动值与水均衡法算得的区域整体水位变化值之间的线性方程组,求解线性方程组得唯一解;
S3,当井数量n大于监测数据连续年份m时,利用k-means方法基于井的坐标位置进行聚类,直至全部井群分类出的子群中均满足n≤m;
S4,在各类别中利用泰森多边形去丛聚法确定单井控制面积Sn
S5,在各类别中,基于单井控制面积Sn,采用水均衡法计算区域整体水位变化值,建立单井水位变动值与水均衡法算得的区域整体水位变化值之间的线性方程组,求解线性方程组得唯一解;
S6,根据步骤S2或S5求解到的唯一解确定单井唯一权重系数,进而计算区域水位变化特征值。
2.根据权利要求1所述的基于K-means和去丛聚法的区域代表性地下水位计算方法,其特征在于,步骤S2中,建立单井水位变动值与水均衡法算得的区域整体水位变化值之间的线性方程组,求解线性方程组得唯一解,具体包括:
对于分布在同一区域内的多个水文观测井,观测水位的变化是连续且相互关联的,根据这一特点,已知m个连续年间,n口井各自的水位变化值,建立单井水位变差与水均衡计算地下水储变量之间的线性方程组:
Figure FDA0003335830850000011
Figure FDA0003335830850000012
Figure FDA0003335830850000014
Figure FDA0003335830850000013
式中,xmn为第n口井m年的水位变动值,单位为米,αn为第n口井的单井权重值,
Figure FDA0003335830850000015
为第m年根据水均衡法算得的区域整体水位变化值,单位为米;
上式亦可矩阵化表述为:
Figure FDA0003335830850000021
求解上述方程组即可得到单井的权重分配系数,根据线性方程组解的规律或行列式值的特征,在去除等比例项后自变量个数与方程个数相等,即系数矩阵满秩时,方程有唯一解;此时便可获得单井的权重分配系数值,利用该系数向量便可在后续工作中直接利用井群水位观测值计算出区域的水位变化特征值,即:
Figure FDA0003335830850000022
式中,x′n为第n口井的年水位变动观测值,单位为米,αn为第n口井的单井权重值,
Figure FDA0003335830850000023
为计算年区域整体水位变化特征值,单位为米。
3.根据权利要求2所述的基于K-means和去丛聚法的区域代表性地下水位计算方法,其特征在于,步骤S3中,利用k-means方法基于井的坐标位置进行聚类,直至全部井群分类出的子群中均满足n≤m,具体为:
S301,给出待聚类的多维数据集:研究区范围内n口井的单井井位坐标数据,根据地下水位变差数据先验经验,选择合适的聚类数值k:
Figure FDA0003335830850000026
式中,xij为代表源数据进行聚类分析的样本点的多维向量;n为样本中点的总个数,即井群中井的个数;q为源数据中样本所包含的特征数目,即样本维度;k为聚类分析时设定的类别数目,即连续年年份m;
S302,从数据集
Figure FDA0003335830850000027
中随机选取K个样本作为每一类的初始聚类中心,分别计算其他所有样本点与确定的初始聚类中心间的欧式距离,以最短距离作为判断标准将各样本分别聚入该簇中,两点欧氏距离计算如下:
Figure FDA0003335830850000024
式中,
Figure FDA0003335830850000025
为第k簇初始聚类中心;
S303,聚类完成之后,在结果中的每类数据中给出新的聚类中心点,判断新的聚类中心与该簇中其他样本间是否满足给定的限制条件,若满足则聚类完成,输出最终的聚类中心,若不满足,则将新的聚类中心作为初始,再次进行聚类,直到达到限制条件,所述限制条件通过规定误差平方和的值来规定,即算法将不断重新进行聚类工作直到满足所有类别中每一个样本点与该样本点所在类聚类中心间欧式距离之和小于一个定值E,误差平方和计算公式如下:
Figure FDA0003335830850000031
式中,Ci为第i簇样本,m为连续年年份,也是聚类类别数,当完成全部聚类后,在每一个最小类别中均有n不大于m,此时在各自类别中均能够构建相关方程。
4.根据权利要求3所述的基于K-means和去丛聚法的区域代表性地下水位计算方法,其特征在于,步骤S4中,在各类别中利用泰森多边形去丛聚法确定单井控制面积Sn,具体包括:
S401,连接相邻离散点,即各单井所在的坐标点构成井群中井间三角形网格;
S402,对于每个独立的三角形网格,作其各边的中垂线,全部中垂线围成一个新的多边形网;
S403,每一个独立多边形网格中包含唯一井位,此时该多边形网格所包围的区域即为该井位对应的控制范围,其面积为Sn
5.根据权利要求4所述的基于K-means和去丛聚法的区域代表性地下水位计算方法,其特征在于,步骤S5中,在各类别中,基于单井控制面积Sn,采用水均衡法计算区域整体水位变化值,建立单井水位变动值与水均衡法算得的区域整体水位变化值之间的线性方程组,求解线性方程组得唯一解,具体包括:
利用步骤S4确定各单井的控制范围,得到聚类后某个井群的总控制范围,对应的井群类别中全部井的控制范围内第n个应力期采用水均衡法计算得到的水位变差值,由下式计算得出:
Figure FDA0003335830850000032
式中,ΔQn为地下水储变量,将结果代入步骤S2中得到线性方程组,按步骤S2的方式,求解线性方程组得唯一解。
CN202111294055.4A 2021-11-03 2021-11-03 一种基于K-means和去丛聚法的区域代表性地下水位计算方法 Pending CN114021644A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111294055.4A CN114021644A (zh) 2021-11-03 2021-11-03 一种基于K-means和去丛聚法的区域代表性地下水位计算方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111294055.4A CN114021644A (zh) 2021-11-03 2021-11-03 一种基于K-means和去丛聚法的区域代表性地下水位计算方法

Publications (1)

Publication Number Publication Date
CN114021644A true CN114021644A (zh) 2022-02-08

Family

ID=80060113

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111294055.4A Pending CN114021644A (zh) 2021-11-03 2021-11-03 一种基于K-means和去丛聚法的区域代表性地下水位计算方法

Country Status (1)

Country Link
CN (1) CN114021644A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115146447A (zh) * 2022-06-10 2022-10-04 济南轨道交通集团有限公司 一种岩溶含水层连通性判别方法及系统、设备及介质

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115146447A (zh) * 2022-06-10 2022-10-04 济南轨道交通集团有限公司 一种岩溶含水层连通性判别方法及系统、设备及介质

Similar Documents

Publication Publication Date Title
CN108240208B (zh) 一种油田水驱分类井组开发效果对标方法
WO2020063689A1 (zh) 一种电力系统热负荷预测的方法和装置
CN106650797B (zh) 一种基于集成elm的配电网窃电嫌疑用户智能识别方法
CN108446711A (zh) 一种基于迁移学习的软件缺陷预测方法
CN113236228B (zh) 一种单井产量快速预测方法及系统
CN106991509A (zh) 基于径向基函数神经网络模型的测井曲线预测方法
CN110287516A (zh) 一种页岩气藏压裂水平井可压性综合评价方法
Wazneh et al. Depth‐based regional index‐flood model
CN113722997A (zh) 一种基于静态油气田数据的新井动态产量预测方法
CN111753461A (zh) 潮汐水位修正方法、目标余水位获取方法、装置和设备
CN111428419A (zh) 悬浮泥沙浓度预测方法、装置、计算机设备和存储介质
CN103902798B (zh) 数据预处理方法
CN108733003A (zh) 基于kmeans聚类算法的回转类零件工序工时预测方法及系统
CN107092794B (zh) 用于台风混合气候地区极值风速估算的分析方法及装置
CN114021644A (zh) 一种基于K-means和去丛聚法的区域代表性地下水位计算方法
CN109389517B (zh) 一种量化线路损耗影响因素的分析方法及装置
CN117408167A (zh) 基于深度神经网络的泥石流灾害易发性预测方法
CN117235510A (zh) 节理粗糙度预测方法与节理粗糙度预测模型训练方法
CN112906762A (zh) 一种水资源系统临界状态的定义及辨识方法和系统
DE112014006799T5 (de) Verfahren zur Messung eines Benutzerverhalten-Konsistenzgrades auf Basis eines komplexen Korrespondenzsystems
CN108665090B (zh) 基于主成分分析与Verhulst模型的城市电网饱和负荷预测方法
Noor et al. Prediction map of rainfall classification using random forest and inverse distance weighted (IDW)
CN115310719B (zh) 基于三阶段k-means的农田土壤采样方案设计方法
CN116304948A (zh) 一种融合多尺度模糊信息粒的无监督用电异常检测方法
Wang et al. A Novel Multi‐Input AlexNet Prediction Model for Oil and Gas Production

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination