CN117034051B - 基于birch算法的水利信息聚合方法、装置及介质 - Google Patents

基于birch算法的水利信息聚合方法、装置及介质 Download PDF

Info

Publication number
CN117034051B
CN117034051B CN202310934316.7A CN202310934316A CN117034051B CN 117034051 B CN117034051 B CN 117034051B CN 202310934316 A CN202310934316 A CN 202310934316A CN 117034051 B CN117034051 B CN 117034051B
Authority
CN
China
Prior art keywords
node
information
clustering
water conservancy
entry
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310934316.7A
Other languages
English (en)
Other versions
CN117034051A (zh
Inventor
袁明道
李培聪
李晓杨
谢安君
莫土有
李田贵
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Research Institute of Water Resources and Hydropower
Original Assignee
Guangdong Research Institute of Water Resources and Hydropower
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Research Institute of Water Resources and Hydropower filed Critical Guangdong Research Institute of Water Resources and Hydropower
Priority to CN202310934316.7A priority Critical patent/CN117034051B/zh
Publication of CN117034051A publication Critical patent/CN117034051A/zh
Application granted granted Critical
Publication of CN117034051B publication Critical patent/CN117034051B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0637Strategic management or analysis, e.g. setting a goal or target of an organisation; Planning actions based on goals; Analysis or evaluation of effectiveness of goals
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A10/00TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE at coastal zones; at river basins
    • Y02A10/40Controlling or monitoring, e.g. of flood or hurricane; Forecasting, e.g. risk assessment or mapping

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Tourism & Hospitality (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Educational Administration (AREA)
  • Physics & Mathematics (AREA)
  • Marketing (AREA)
  • Development Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Operations Research (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Game Theory and Decision Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Quality & Reliability (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请公开了一种基于BIRCH算法的水利信息聚合方法、装置及介质,所述方法包括:获取水利工程信息;根据所述水利工程信息,确定层次划分信息;针对所述层次划分信息执行节点分层构建操作,确定节点信息;根据所述节点信息,建立水利工程信息树;获取水利聚类数据;所述水利聚类数据包括多个待执行聚类操作的空间数据点位;根据所述水利聚类数据以及所述水利工程信息树,执行信息树全局聚类操作,建立聚类特征树。本申请通过BIRCH算法开展信息树全局聚类,不需要进行多次迭代计算,提升聚类质量,具备拓展性,能够依据水利工程信息的水利专业特性开展聚类,满足水利工程信息应用的要求。本申请广泛应用于水利工程信息技术领域。

Description

基于BIRCH算法的水利信息聚合方法、装置及介质
技术领域
本申请涉及水利工程信息技术领域,特别涉及一种基于BIRCH算法的水利信息聚合方法、装置及介质。
背景技术
目前,现有技术中针对水利工程信息进行聚类的方法或地图插件,存在计算速率慢以及图标错漏等技术问题,导致上述技术问题的出现,一方面是由于水利工程数量大,涉及区域广,同时水利工程监测、运行管理设备类型繁杂,在大数据量下,算法需要多次迭代才能完成,不具备拓展性,计算时间较长,另一方面是由于水利工程存在大量监测仪器,坐标相近,因此在聚类过程中容易出现图标重叠或者点个点位漏掉等问题,同时,水利工程设备及地理信息具备水利专业特性,现有的地图插件无法满足使用要求。
发明内容
为了解决至少一个上述相关技术中的技术问题,本申请实施例提供了一种基于BIRCH算法的水利信息聚合方法、装置及介质。
本申请实施例的第一方面提出了一种基于BIRCH算法的水利信息聚合方法,所述方法包括:
获取水利工程信息;
根据所述水利工程信息,确定层次划分信息;
针对所述层次划分信息执行节点分层构建操作,确定节点信息;
根据所述节点信息,建立水利工程信息树;
获取水利聚类数据;所述水利聚类数据包括多个待执行聚类操作的空间数据点位;
根据所述水利聚类数据以及所述水利工程信息树,执行信息树全局聚类操作,建立聚类特征树。
在一些实施例,所述针对所述层次划分信息执行节点分层构建操作,确定节点信息这一步骤,具体包括:
根据所述层次划分信息,确定节点层级以及各节点层级中的节点;所述节点层级包括根节点层、叶子节点层以及若干个内部节点层。
在一些实施例,所述根据所述水利聚类数据以及所述水利工程信息树,执行信息树全局聚类操作,建立聚类特征树这一步骤,具体包括:
获取第一分支因子、第二分支因子以及聚合半径阈值;所述第一分支因子用于限制非叶子节点的子节点数;所述第二分支因子用于限制叶子节点的条目数量;所述聚合半径阈值为叶子节点中条目的最大样本半径阈值;
根据所述第一分支因子、所述第二分支因子以及所述聚合半径阈值,执行聚类操作,将所述水利聚类数据动态插入所述水利工程信息树中,确定各个节点中的聚类特征信息;
根据所述聚类特征信息以及所述水利工程信息树,建立所述聚类特征树。
在一些实施例,所述根据所述第一分支因子、所述第二分支因子以及所述聚合半径阈值,执行聚类操作,将所述水利聚类数据动态插入所述水利工程信息树中,确定各个节点的聚类特征信息这一步骤,具体包括:
针对所述空间数据点位执行动态插入操作,从根节点开始执行递归向下的距离计算,确定与所述空间数据点位距离最近的第一节点条目以及包含所述第一节点条目的第一叶子节点;
计算所述空间数据点位与所述第一节点条目的空间距离;
将所述空间距离与所述聚合半径阈值进行比较,确定第一比较结果;
根据所述第一比较结果进行空间数据点位的插入处理,判断是否将所述空间数据点位插入至所述第一节点条目。
在一些实施例,所述计算所述空间数据点位与所述第一节点条目的空间距离这一步骤,具体用下式表示:
式1:
式2:
式3:
其中,N为当前条目中包含的空间数据点位的数目,当前条目中包含与空间数据点位数目对应的N个数据对象{O1,O2,……,ON},Oi为第i个数据对象的空间距离属性值,LS为当前条目对应的子簇中的N个空间数据点位的空间距离属性值的线性和,SS为当前条目对应的子簇中的N个空间数据点位的空间距离属性值的平方和,R为空间数据点位与节点条目的空间距离,Omcenter为当前条目对应的子簇的质心的空间距离属性值。
在一些实施例,所述根据所述第一比较结果进行空间数据点位的插入处理,判断是否将所述空间数据点位插入至所述第一节点条目这一步骤,具体包括:
当所述第一比较结果为所述空间距离小于所述聚合半径阈值,所述插入节点条目吸收所述空间数据点位,更新所述第一节点条目的聚类特征信息;
当所述第一比较结果为所述空间距离大于所述聚合半径阈值,将当前节点条目数量与所述第二分支因子进行比较,确定第二比较结果,根据所述第二比较结果,判断是否创建第二节点条目;所述当前节点条目数量为所述第一叶子节点的节点条目数量。
在一些实施例,所述当所述空间距离大于所述聚合半径阈值,将所述插入节点的当前条目数量与所述第二分支因子进行比较,确定第二比较结果,根据所述第二比较结果,判断是否创建第二节点条目这一步骤,具体包括:
当所述第二比较结果为所述第二分支因子大于所述当前节点条目数量时,创建所述第二节点条目,将所述空间数据点位插入至所述第二节点条目中,更新所述第二节点条目的聚类特征信息;
当所述第二比较结果为所述第二分支因子等于所述当前节点条目数量时,将当前叶子节点数量与所述第一分支因子进行比较,确定第三比较结果,根据所述第三比较结果,判断是否执行叶子节点分裂操作;所述当前叶子节点数量为所述第一叶子节点所归属的上一层非叶子节点中包含的叶子节点数量。
在一些实施例,所述当所述第二比较结果为所述第二分支因子等于所述当前节点条目数量时,将当前叶子节点数量与第一分支因子进行比较,确定第三比较结果,根据所述第三比较结果,判断是否执行叶子节点分裂操作这一步骤,具体包括:
当所述第三比较结果为所述第一分支因子大于所述当前叶子节点数量时,确定所述第一叶子节点中距离最远的第三节点条目与第四节点条目,执行所述叶子节点分裂操作,生成第二叶子节点与第三叶子节点,以及删除第一叶子节点,重新执行所述空间数据点位的动态插入操作;所述第三节点条目为所述第二叶子节点的起始条目;所述第四节点条目为所述第三叶子节点的起始条目;
当所述第三比较结果为所述第一分支因子等于所述当前叶子节点数量时,增大所述聚合半径阈值,重新执行所述空间数据点位的动态插入操作。
本申请实施例的第二方面提出了一种基于BIRCH算法的水利信息聚合装置,包括:
第一模块,用于获取水利工程信息;
第二模块,用于根据所述水利工程信息,确定层次划分信息;
第三模块,用于针对所述层次划分信息执行节点分层构建操作,确定节点信息;
第四模块,用于根据所述节点信息,建立水利信息工程树;
第五模块,用于获取水利聚类数据;所述水利聚类数据包括多个待执行聚类操作的空间数据点位;
第六模块,用于根据所述水利聚类数据以及所述水利工程信息树,执行信息树全局聚类操作,建立聚类特征树。
本申请实施例的第三方面提出了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述第一方面所述的水利信息聚合方法。
本申请提供的基于BIRCH算法的水利信息聚合方法、装置及介质,其通过获取水利工程信息,根据水利工程信息,确定层次划分信息,针对层次划分信息执行节点分层构建操作,确定节点信息,建立水利工程信息树,获取水利聚类数据,根据水利聚类数据以及水利工程信息树,执行信息树全局聚类操作,建立聚类特征树。本申请通过BIRCH算法开展信息树全局聚类,不需要进行多次迭代计算,提升聚类质量,具备拓展性,能够依据水利工程信息的水利专业特性开展聚类,满足水利工程信息应用的要求。
附图说明
图1是本申请实施例提供的一种基于BIRCH算法的水利信息聚合方法的流程图;
图2是本申请实施例的水利信息工程树的结构示意图;
图3是本申请实施例的聚类特征树的结构示意图;
图4是本申请实施例的通过聚类特征树聚合水利工程相关信息的效果示意图;
图5是本申请实施例提供的一种基于BIRCH算法的水利信息聚合装置的结构示意图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本申请,并不用于限定本申请。
需要说明的是,虽然在装置示意图中进行了功能模块划分,在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于装置中的模块划分,或流程图中的顺序执行所示出或描述的步骤。说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。
除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同。本文中所使用的术语只是为了描述本申请实施例的目的,不是旨在限制本申请。
参照图1,图1是本申请实施例提供的一种基于BIRCH算法的水利信息聚合方法的一个可选的流程图,该方法可以包括但不限于包括步骤S101至步骤S106:
步骤S101,获取水利工程信息;
步骤S102,根据水利工程信息,确定层次划分信息;
步骤S103,针对层次划分信息执行节点分层构建操作,确定节点信息;
步骤S104,根据节点信息,建立水利工程信息树;
步骤S105,获取水利聚类数据;
步骤S106,根据水利聚类数据以及水利工程信息树,执行信息树全局聚类操作,建立聚类特征树。
在一些实施例的步骤S101中,水利工程信息,主要是各类水利工程管理有关的信息集合,包括水电站、水闸、水库、堤防等基本水利信息,以及一些水利相关设备基本信息,水利区域信息等。
在一些实施例的步骤S102中,根据水利工程信息,进行层次划分,可选地,可以根据水利工程的基本分类进行划分,再根据工程等级、所属区域、设备类型、设备等分类进行多种层次的划分,获得层次划分信息,其中,工程等级,根据水利相关规范,依据工程规模、经济效益、影响范围进行分级,主要包括Ⅰ级、Ⅱ级、Ⅲ级、Ⅳ级、Ⅴ级等,分级的指标有库容、防洪、灌溉、治涝、供水和发电等,所属区域,依据行政区、流域范围等进行划分,包括省、市、县,大中小流域等。设备类型,依据设备用途、适用对象进行划分,包括运行管理类、安全监测类、环境监测类等,设备,根据设备使用位置进行划分,如,同一种类仪器在工程多个位置进行布置。
在一些实施例的步骤S103中,根据层次划分信息,确定节点层级以及各节点层级中的节点,节点层级包括根节点层、叶子节点层以及若干个内部节点层,可选地,根节点主要为水利工程的基本分类,包括水库、水电站、水闸、堤防等分类,根据工程等级、所属区域、设备类型、设备等水利工程的相关分类构建多层内部节点层以及对应的内部节点。
在一些实施例的步骤S104中,根据上述构建的节点层级以及各节点层级的节点,建立水利信息工程树。
参照图2,图2是本申请实施例的水利信息工程树的一个可选的结构示意图,其中,根节点层包括多个根节点,根节点包括水库、水电站、堤防、水闸等水利工程的基本分类,第一层的内部节点层根据工程地区分布进行节点的构建,该第一层内部节点包括广州市、佛山市、珠海市以及深圳市等,第二层的内部节点层根据工程特性分类进行节点的构建,该第二层内部节点包括混凝土坝、土坝、节制闸以及挡潮闸等,第三层的内部节点层根据工程特性细节分类进行节点的构建,该第三层的内部节点包括重力坝、拱坝、心墙坝以及支墩坝等,叶子节点层根据工程设备仪器分类进行节点的构建,叶子节点包括测斜仪、渗压计、测缝计以及GNSS等。
在一些实施例的步骤S105中,水利聚类数据包括多个待执行聚类操作的空间数据点位,具体为多个待聚类的水利监测仪器的空间数据点位。
在一些实施例中,采用BIRCH算法执行聚类操作,步骤S106可以包括但不限于包括步骤S201至步骤S203:
步骤S201,获取第一分支因子、第二分支因子以及聚合半径阈值;
步骤S202,根据第一分支因子、第二分支因子以及聚合半径阈值,执行聚类操作,将水利聚类数据动态插入水利工程信息树中,确定各个节点中的聚类特征信息;
步骤S203,根据聚类特征信息以及水利工程信息树,建立聚类特征树。
在一些实施例的步骤S201中,第一分支因子用于限制非叶子节点的子节点数,即每个非叶子节点最多可拥有的子节点数目;第二分支因子用于限制叶子节点的条目数量,即每个叶子节点最多可拥有的条目数量;聚合半径阈值为叶子节点中条目的最大样本半径阈值,即存储在叶子节点中的子簇的最大半径。
在一些实施例的步骤S202和步骤S203中,将水利工程信息树建立后存放在内存中,进行聚类操作,也就是对水利工程信息树进行空间数据点位的动态插入操作,获得各个节点的聚类特征信息,建立起聚类特征树。
在一些实施例中,步骤S202可以包括但不限于包括步骤S301至步骤S304:
步骤S301,针对空间数据点位执行动态插入操作,从根节点开始执行递归向下的距离计算,确定与空间数据点位距离最近的第一节点条目以及包含第一节点条目的第一叶子节点;
步骤S302,计算空间数据点位与第一节点条目的空间距离;
步骤S303,将空间距离与聚合半径阈值进行比较,确定第一比较结果;
步骤S304,根据第一比较结果进行空间数据点位的插入处理,判断是否将空间数据点位插入至第一节点条目。
在一些实施例的步骤S301中,从根节点root开始递归往下,计算当前条目与要插入数据点之间的距离,寻找距离最小的那个路径,直到找到与该数据点最接近的叶节点中的条目(第一节点条目)。
在一些实施例的步骤S302中,具体根据下式计算空间距离:
式1:
式2:
式3:
其中,N为当前条目中包含的空间数据点位的数目,当前条目中包含与空间数据点位数目对应的N个数据对象{O1,O2,……,ON},Oi为第i个数据对象的空间距离属性值,LS为当前条目对应的子簇中的N个空间数据点位的空间距离属性值的线性和,SS为当前条目对应的子簇中的N个空间数据点位的空间距离属性值的平方和,R为空间数据点位与节点条目的空间距离,Omcenter为当前条目对应的子簇的质心的空间距离属性值。
在一些实施例的步骤S304中,当第一比较结果为空间距离小于所述聚合半径阈值,插入节点条目吸收空间数据点位,更新第一节点条目的聚类特征信息;当第一比较结果为空间距离大于聚合半径阈值,将当前节点条目数量与第二分支因子进行比较,确定第二比较结果,根据第二比较结果,判断是否创建第二节点条目;当前节点条目数量为第一叶子节点的节点条目数量。
当第二比较结果为第二分支因子大于当前节点条目数量时,创建第二节点条目,将空间数据点位插入至第二节点条目中,更新第二节点条目的聚类特征信息;当第二比较结果为第二分支因子等于当前节点条目数量时,将当前叶子节点数量与第一分支因子进行比较,确定第三比较结果,根据第三比较结果,判断是否执行叶子节点分裂操作;当前叶子节点数量为第一叶子节点所归属的上一层非叶子节点中包含的叶子节点数量。
当第三比较结果为第一分支因子大于当前叶子节点数量时,确定第一叶子节点中距离最远的第三节点条目与第四节点条目,执行叶子节点分裂操作,生成第二叶子节点与第三叶子节点,以及删除第一叶子节点,重新执行空间数据点位的动态插入操作;第三节点条目为第二叶子节点的起始条目;第四节点条目为第三叶子节点的起始条目;
当第三比较结果为第一分支因子等于当前叶子节点数量时,增大聚合半径阈值,重新执行空间数据点位的动态插入操作。增大聚合半径阈值后,需要重建水利工程信息树,在水利信息工程树重建过程中,通过利用初始水利工程信息树(第一次导入水利工程信息生成的信息树)的内部节点来重新构建新分支即可,因而信息树的重建过程不需要访问所有点,即构建水利工程信息树只需访问数据一次。
在一些实施例中,参照图3,图3是本申请实施例的聚类特征树的一个可选的结构示意图,其中,叶子节点中的每个条目都对应着一个子簇,每个子簇都拥有一个聚类特征信息,该聚类特征信息(CF)可以对子簇包含的内容进行概括及存储,非叶子节点(内部节点和根节点)中也拥有多个聚类特征信息(CF),其中的每个聚类特征信息则用于概括和存储对应的非叶子节点的子节点内容,基于此,通过节点以及节点中存储的聚类特征信息,建立起聚类特征树。
参照图4,图4是本申请实施例的通过聚类特征树聚合水利工程相关信息的一个可选的效果示意图,以广东省内的各个城市作为单独的信息区域进行某一种类型的水利工程设备的数量汇总,其中,地图上结果显示,广州区域的该种水利工程设备的数量为301,江门区域的该种水利工程设备的数量为559,深圳区域的该种水利工程设备的数量为179,以此类推,可以清楚获得各个城市区域内的该种水利工程设备数量。
参照图5,图5是本申请实施例提供的一种基于BIRCH算法的水利信息聚合装置的一个可选的结构示意图,包括:
第一模块,用于获取水利工程信息;
第二模块,用于根据水利工程信息,确定层次划分信息;
第三模块,用于针对层次划分信息执行节点分层构建操作,确定节点信息;
第四模块,用于根据节点信息,建立水利信息工程树;
第五模块,用于获取水利聚类数据;
第六模块,用于根据水利聚类数据以及水利工程信息树,执行信息树全局聚类操作,建立聚类特征树。
本申请实施例还提供了一种计算机可读存储介质,该计算机可读存储介质存储有计算机程序,该计算机程序被处理器执行时实现上述基于BIRCH算法的水利信息聚合方法。
存储器作为一种非暂态计算机可读存储介质,可用于存储非暂态软件程序以及非暂态性计算机可执行程序。此外,存储器可以包括高速随机存取存储器,还可以包括非暂态存储器,例如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在一些实施方式中,存储器可选包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至该处理器。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
本申请实施例提供的一种基于BIRCH算法的水利信息聚合方法、装置及介质,其通过获取水利工程信息,根据水利工程信息,确定层次划分信息,针对层次划分信息执行节点分层构建操作,确定节点信息,建立水利工程信息树,获取水利聚类数据,根据水利聚类数据以及水利工程信息树,执行信息树全局聚类操作,建立聚类特征树。本申请通过BIRCH算法开展信息树全局聚类,不需要进行多次迭代计算,提升聚类质量,具备拓展性,能够依据水利工程信息的水利专业特性开展聚类,满足水利工程信息应用的要求。
本申请实施例描述的实施例是为了更加清楚的说明本申请实施例的技术方案,并不构成对于本申请实施例提供的技术方案的限定,本领域技术人员可知,随着技术的演变和新应用场景的出现,本申请实施例提供的技术方案对于类似的技术问题,同样适用。
本领域技术人员可以理解的是,图中示出的技术方案并不构成对本申请实施例的限定,可以包括比图示更多或更少的步骤,或者组合某些步骤,或者不同的步骤。
以上参照附图说明了本申请实施例的优选实施例,并非因此局限本申请实施例的权利范围。本领域技术人员不脱离本申请实施例的范围和实质内所作的任何修改、等同替换和改进,均应在本申请实施例的权利范围之内。

Claims (8)

1.一种基于BIRCH算法的水利信息聚合方法,其特征在于,包括:
获取水利工程信息;
根据所述水利工程信息,确定层次划分信息;所述水利工程信息至少包括水利工程的类别、工程等级、所属区域、设备类型和设备使用位置;
针对所述层次划分信息执行节点分层构建操作,确定节点信息;
根据所述节点信息,建立水利工程信息树;
获取水利聚类数据;所述水利聚类数据包括多个待执行聚类操作的空间数据点位;
根据所述水利聚类数据以及所述水利工程信息树,执行信息树全局聚类操作,建立聚类特征树;
所述根据所述水利工程信息,确定层次划分信息这一步骤,具体包括:
至少根据所述水利工程的类别、工程等级、所属区域、设备类型和设备使用位置,进行层次划分,获得所述层次划分信息;
所述针对所述层次划分信息执行节点分层构建操作,确定节点信息这一步骤,具体包括:
根据所述层次划分信息,确定节点层级以及各节点层级中的节点;所述节点层级包括根节点层、叶子节点层以及若干个内部节点层;
所述根据所述水利聚类数据以及所述水利工程信息树,执行信息树全局聚类操作,建立聚类特征树这一步骤,具体包括:
获取第一分支因子、第二分支因子以及聚合半径阈值;所述第一分支因子用于限制非叶子节点的子节点数;所述第二分支因子用于限制叶子节点的条目数量;所述聚合半径阈值为叶子节点中条目的最大样本半径阈值;
根据所述第一分支因子、所述第二分支因子以及所述聚合半径阈值,执行聚类操作,将所述水利聚类数据动态插入所述水利工程信息树中,确定各个节点中的聚类特征信息;
根据所述聚类特征信息以及所述水利工程信息树,建立所述聚类特征树。
2.根据权利要求1所述的水利信息聚合方法,其特征在于,所述根据所述第一分支因子、所述第二分支因子以及所述聚合半径阈值,执行聚类操作,将所述水利聚类数据动态插入所述水利工程信息树中,确定各个节点的聚类特征信息这一步骤,具体包括:
针对所述空间数据点位执行动态插入操作,从根节点开始执行递归向下的距离计算,确定与所述空间数据点位距离最近的第一节点条目以及包含所述第一节点条目的第一叶子节点;
计算所述空间数据点位与所述第一节点条目的空间距离;
将所述空间距离与所述聚合半径阈值进行比较,确定第一比较结果;
根据所述第一比较结果进行空间数据点位的插入处理,判断是否将所述空间数据点位插入至所述第一节点条目。
3.根据权利要求2所述的水利信息聚合方法,其特征在于,所述计算所述空间数据点位与所述第一节点条目的空间距离这一步骤,具体用下式表示:
式1:
式2:
式3:
其中,N为当前条目中包含的空间数据点位的数目,当前条目中包含与空间数据点位数目对应的N个数据对象{O1,O2,……,ON},Oi为第i个数据对象的空间距离属性值,LS为当前条目对应的子簇中的N个空间数据点位的空间距离属性值的线性和,SS为当前条目对应的子簇中的N个空间数据点位的空间距离属性值的平方和,R为空间数据点位与节点条目的空间距离,Omcenter为当前条目对应的子簇的质心的空间距离属性值。
4.根据权利要求2所述的水利信息聚合方法,其特征在于,所述根据所述第一比较结果进行空间数据点位的插入处理,判断是否将所述空间数据点位插入至所述第一节点条目这一步骤,具体包括:
当所述第一比较结果为所述空间距离小于所述聚合半径阈值,所述第一节点条目吸收所述空间数据点位,更新所述第一节点条目的聚类特征信息;
当所述第一比较结果为所述空间距离大于所述聚合半径阈值,将当前节点条目数量与所述第二分支因子进行比较,确定第二比较结果,根据所述第二比较结果,判断是否创建第二节点条目;所述当前节点条目数量为所述第一叶子节点的节点条目数量。
5.根据权利要求4所述的水利信息聚合方法,其特征在于,当所述空间距离大于所述聚合半径阈值,将插入节点的当前条目数量与所述第二分支因子进行比较,确定第二比较结果,根据所述第二比较结果,判断是否创建第二节点条目这一步骤,具体包括:
当所述第二比较结果为所述第二分支因子大于所述当前节点条目数量时,创建所述第二节点条目,将所述空间数据点位插入至所述第二节点条目中,更新所述第二节点条目的聚类特征信息;
当所述第二比较结果为所述第二分支因子等于所述当前节点条目数量时,将当前叶子节点数量与所述第一分支因子进行比较,确定第三比较结果,根据所述第三比较结果,判断是否执行叶子节点分裂操作;所述当前叶子节点数量为所述第一叶子节点所归属的上一层非叶子节点中包含的叶子节点数量。
6.根据权利要求5所述的水利信息聚合方法,其特征在于,所述当所述第二比较结果为所述第二分支因子等于所述当前节点条目数量时,将当前叶子节点数量与第一分支因子进行比较,确定第三比较结果,根据所述第三比较结果,
判断是否执行叶子节点分裂操作这一步骤,具体包括:
当所述第三比较结果为所述第一分支因子大于所述当前叶子节点数量时,确定所述第一叶子节点中距离最远的第三节点条目与第四节点条目,执行所述叶子节点分裂操作,生成第二叶子节点与第三叶子节点,以及删除第一叶子节点,重新执行所述空间数据点位的动态插入操作;所述第三节点条目为所述第二叶子节点的起始条目;所述第四节点条目为所述第三叶子节点的起始条目;
当所述第三比较结果为所述第一分支因子等于所述当前叶子节点数量时,增大所述聚合半径阈值,重新执行所述空间数据点位的动态插入操作。
7.一种基于BIRCH算法的水利信息聚合装置,其特征在于,包括:
第一模块,用于获取水利工程信息;
第二模块,用于根据所述水利工程信息,确定层次划分信息;所述水利工程信息至少包括水利工程的类别、工程等级、所属区域、设备类型和设备使用位置;所述根据所述水利工程信息,确定层次划分信息这一步骤,具体包括:
至少根据所述水利工程的类别、工程等级、所属区域、设备类型和设备使用位置,进行层次划分,获得所述层次划分信息;
第三模块,用于针对所述层次划分信息执行节点分层构建操作,确定节点信息;所述针对所述层次划分信息执行节点分层构建操作,确定节点信息这一步骤,具体包括:
根据所述层次划分信息,确定节点层级以及各节点层级中的节点;所述节点层级包括根节点层、叶子节点层以及若干个内部节点层;
第四模块,用于根据所述节点信息,建立水利信息工程树;
第五模块,用于获取水利聚类数据;所述水利聚类数据包括多个待执行聚类操作的空间数据点位;
第六模块,用于根据所述水利聚类数据以及所述水利工程信息树,执行信息树全局聚类操作,建立聚类特征树;所述根据所述水利聚类数据以及所述水利工程信息树,执行信息树全局聚类操作,建立聚类特征树这一步骤,具体包括:
获取第一分支因子、第二分支因子以及聚合半径阈值;所述第一分支因子用于限制非叶子节点的子节点数;所述第二分支因子用于限制叶子节点的条目数量;所述聚合半径阈值为叶子节点中条目的最大样本半径阈值;
根据所述第一分支因子、所述第二分支因子以及所述聚合半径阈值,执行聚类操作,将所述水利聚类数据动态插入所述水利工程信息树中,确定各个节点中的聚类特征信息;
根据所述聚类特征信息以及所述水利工程信息树,建立所述聚类特征树。
8.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的水利信息聚合方法。
CN202310934316.7A 2023-07-27 2023-07-27 基于birch算法的水利信息聚合方法、装置及介质 Active CN117034051B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310934316.7A CN117034051B (zh) 2023-07-27 2023-07-27 基于birch算法的水利信息聚合方法、装置及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310934316.7A CN117034051B (zh) 2023-07-27 2023-07-27 基于birch算法的水利信息聚合方法、装置及介质

Publications (2)

Publication Number Publication Date
CN117034051A CN117034051A (zh) 2023-11-10
CN117034051B true CN117034051B (zh) 2024-05-03

Family

ID=88628999

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310934316.7A Active CN117034051B (zh) 2023-07-27 2023-07-27 基于birch算法的水利信息聚合方法、装置及介质

Country Status (1)

Country Link
CN (1) CN117034051B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117494587B (zh) * 2023-12-29 2024-04-09 杭州行芯科技有限公司 芯片封装结构的空间关系管理方法、电子设备及存储介质

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104573050A (zh) * 2015-01-20 2015-04-29 安徽科力信息产业有限责任公司 一种基于Canopy聚类和BIRCH层次聚类的连续属性离散化方法
CN108154157A (zh) * 2017-12-06 2018-06-12 西安交通大学 一种基于集成的快速谱聚类方法
CN109902111A (zh) * 2019-03-20 2019-06-18 水利部交通运输部国家能源局南京水利科学研究院 一种土石坝安全信息挖掘方法
CN110532553A (zh) * 2019-08-21 2019-12-03 河海大学 一种水利空间关系词识别与提取的方法
CN110569316A (zh) * 2019-08-07 2019-12-13 浙江大学 基于t-SNE降维技术和BIRCH聚类的低压台区用户拓扑辨识方法
CN111221937A (zh) * 2020-01-10 2020-06-02 江苏大学 一种动态k值聚类构建主题r树方法
CN112183567A (zh) * 2019-07-05 2021-01-05 浙江宇视科技有限公司 Birch算法的优化方法、装置、设备及存储介质
CN113139570A (zh) * 2021-03-05 2021-07-20 河海大学 一种基于最优混合估值的大坝安全监测数据补全方法
CN114266249A (zh) * 2021-12-20 2022-04-01 东北大学 一种基于birch聚类的海量文本聚类方法
CN114487835A (zh) * 2022-01-17 2022-05-13 国网甘肃省电力公司经济技术研究院 一种粒子群优化birch算法的退役动力电池等级划分方法
CN114707059A (zh) * 2022-03-14 2022-07-05 河海大学 一种基于用户偏好的水利对象元数据推荐系统构建方法
CN116383680A (zh) * 2023-03-29 2023-07-04 平安银行股份有限公司 聚类方法、装置、电子设备及计算机可读存储介质

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9146988B2 (en) * 2012-06-05 2015-09-29 King Fahd University Of Petroleum And Minerals Hierarchal clustering method for large XML data

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104573050A (zh) * 2015-01-20 2015-04-29 安徽科力信息产业有限责任公司 一种基于Canopy聚类和BIRCH层次聚类的连续属性离散化方法
CN108154157A (zh) * 2017-12-06 2018-06-12 西安交通大学 一种基于集成的快速谱聚类方法
CN109902111A (zh) * 2019-03-20 2019-06-18 水利部交通运输部国家能源局南京水利科学研究院 一种土石坝安全信息挖掘方法
CN112183567A (zh) * 2019-07-05 2021-01-05 浙江宇视科技有限公司 Birch算法的优化方法、装置、设备及存储介质
CN110569316A (zh) * 2019-08-07 2019-12-13 浙江大学 基于t-SNE降维技术和BIRCH聚类的低压台区用户拓扑辨识方法
CN110532553A (zh) * 2019-08-21 2019-12-03 河海大学 一种水利空间关系词识别与提取的方法
CN111221937A (zh) * 2020-01-10 2020-06-02 江苏大学 一种动态k值聚类构建主题r树方法
CN113139570A (zh) * 2021-03-05 2021-07-20 河海大学 一种基于最优混合估值的大坝安全监测数据补全方法
CN114266249A (zh) * 2021-12-20 2022-04-01 东北大学 一种基于birch聚类的海量文本聚类方法
CN114487835A (zh) * 2022-01-17 2022-05-13 国网甘肃省电力公司经济技术研究院 一种粒子群优化birch算法的退役动力电池等级划分方法
CN114707059A (zh) * 2022-03-14 2022-07-05 河海大学 一种基于用户偏好的水利对象元数据推荐系统构建方法
CN116383680A (zh) * 2023-03-29 2023-07-04 平安银行股份有限公司 聚类方法、装置、电子设备及计算机可读存储介质

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Improving Clustering Method Performance Using K-Means, Mini Batch K-Means, BIRCH and Spectral;Tenia Wahyuningrum 等;《2021 4th International Seminar on Research of Information Technology and Intelligent Systems》;206-210 *
基于本地差分隐私的BIRCH混合数据算法;王豪石 等;《华北理工大学学报(自然科学版)》;第45卷(第1期);89-98 *
天津水务信息资源聚合方式技术研究;田源;《信息系统工程》;19-21 *

Also Published As

Publication number Publication date
CN117034051A (zh) 2023-11-10

Similar Documents

Publication Publication Date Title
CN107402955B (zh) 确定地理围栏的索引网格的方法和装置
CN102915227B (zh) 面向大区域流域提取的并行方法
CN103927389B (zh) 一种洪涝灾害地理分析评估动态模型的构建方法
CN117034051B (zh) 基于birch算法的水利信息聚合方法、装置及介质
Bayesteh et al. Stochastic optimization of reservoir operation by applying hedging rules
CN101477547B (zh) 一种基于规则的空间数据整合方法
CN105138722A (zh) 基于数字河湖网络的平原河网区流域集水单元划分方法
CN1897023A (zh) 水资源信息管理与规划系统
CN105740245A (zh) 频繁项集挖掘方法
Gong et al. Spatiotemporal dynamics in the cultivated and built-up land of Guangzhou: Insights from zoning
CN112985443B (zh) 路径规划方法、装置及终端设备
CN104268243B (zh) 一种位置数据处理方法及装置
CN111798032B (zh) 支撑国土空间规划双评价的精细化网格评价方法
CN114048204A (zh) 基于数据库倒排索引的北斗网格空间索引方法和装置
Arge et al. I/O-efficient computation of water flow across a terrain
CN103268342A (zh) 基于cuda的dem动态可视化加速系统和方法
CN109885638B (zh) 一种三维立体空间索引方法及系统
CN114648617A (zh) 一种基于数字高程模型dem的水系提取方法
CN112215864B (zh) 电子地图的轮廓处理方法、装置及电子设备
CN112116709B (zh) 一种提高地形表达精度的地形特征线处理方法
CN104008147A (zh) 三维地质结构模型多体索引构建方法
CN106373192A (zh) 一种非拓扑一致性三维网格块体追踪算法
CN114049387A (zh) 一种基于3d点云的树木骨架提取方法
Cheng et al. Structural equation model of the spatial distribution of water engineering facilities along the Beijing-Hangzhou grand canal and its relationship with natural factors
CN106326492A (zh) 空间矢量数据生成方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant