CN117764290B - 一种水利工程施工用bim模型数据管理方法 - Google Patents

一种水利工程施工用bim模型数据管理方法 Download PDF

Info

Publication number
CN117764290B
CN117764290B CN202410194889.5A CN202410194889A CN117764290B CN 117764290 B CN117764290 B CN 117764290B CN 202410194889 A CN202410194889 A CN 202410194889A CN 117764290 B CN117764290 B CN 117764290B
Authority
CN
China
Prior art keywords
material data
water conservancy
clustering
center
data point
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202410194889.5A
Other languages
English (en)
Other versions
CN117764290A (zh
Inventor
程华进
董舒迪
付变芳
杨兵
张伟
李永涛
樊雪桃
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Zhidesen Water Technology Co ltd
Original Assignee
Shenzhen Zhidesen Water Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Zhidesen Water Technology Co ltd filed Critical Shenzhen Zhidesen Water Technology Co ltd
Priority to CN202410194889.5A priority Critical patent/CN117764290B/zh
Publication of CN117764290A publication Critical patent/CN117764290A/zh
Application granted granted Critical
Publication of CN117764290B publication Critical patent/CN117764290B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Testing And Monitoring For Control Systems (AREA)

Abstract

本发明涉及数据处理技术领域,具体涉及一种水利工程施工用BIM模型数据管理方法,包括:采集若干物料种类的水利物料数据点;根据水利物料数据点得到物料数据综合密集度;根据物料数据综合密集度得到初始聚类中心点;根据同一物料种类下水利物料数据点整体的使用次数的变化连续情况、物料数据综合密集度以及初始聚类中心点,得到中心选取度;根据中心选取度得到若干聚类中心;根据聚类中心对所有水利物料数据点进行聚类得到最终水利自适应聚类簇;根据最终水利自适应聚类簇进行异常检测。本发明提高了聚类结果的准确性,提高了异常检测结果的准确性,提高了数据管理的效率。

Description

一种水利工程施工用BIM模型数据管理方法
技术领域
本发明涉及数据处理技术领域,具体涉及一种水利工程施工用BIM模型数据管理方法。
背景技术
在基于BIM模型对水利工程的物料数据进行管理之前,需要对物料数据进行异常检测;现有方法通常利用CBLOF(Clustering Based Local Outlier Factor)基于局部离群因子的聚类离群因子算法对物料数据进行异常检测,而在CBLOF基于局部离群因子的聚类离群因子算法对物料数据进行异常检测时,通常先利用ISODATA(IterativeSelforganizing Data Analysis Techniques Algorithm)迭代自组织聚类算法对物料数据进行聚类,根据聚类结果获取异常数据;但在实际的水利工程中,不同种类的物料在不同施工阶段中的需求不同,使不同种类的物料之间存在各自的数据变化特征,而传统的ISODATA迭代自组织聚类算法仅通过构建数据点计算其均值作为聚类中心,并没结合不同种类物料的需求情况,降低了传统聚类结果的准确性,降低了异常检测结果的准确性,降低了数据管理的效率。
发明内容
本发明提供一种水利工程施工用BIM模型数据管理方法,以解决现有的问题:在实际的水利工程中,不同种类的物料在不同施工阶段中的需求不同,使不同种类的物料之间存在各自的数据变化特征,而传统的ISODATA迭代自组织聚类算法仅通过构建数据点计算其均值作为聚类中心,并没结合不同种类物料的需求情况。
本发明的一种水利工程施工用BIM模型数据管理方法采用如下技术方案:
包括以下步骤:
采集若干物料种类的若干水利物料数据点,所述水利物料数据点对应一个使用次数;
根据水利物料数据点与周围水利物料数据点之间距离的差异分布情况,得到每个水利物料数据点的物料数据综合密集度;根据物料数据综合密集度从多个水利物料数据点中,筛选出若干初始聚类中心点;
根据同一物料种类下水利物料数据点整体的使用次数的变化连续情况、物料数据综合密集度以及初始聚类中心点,得到每个水利物料数据点的中心选取度;根据中心选取度从初始聚类中心点中,筛选出若干聚类过程的若干聚类中心;根据聚类中心对所有水利物料数据点进行聚类得到若干最终水利自适应聚类簇;
根据最终水利自适应聚类簇进行异常检测。
优选的,所述根据水利物料数据点与周围水利物料数据点之间距离的差异分布情况,得到每个水利物料数据点的物料数据综合密集度,包括的具体方法为:
将任意一个水利物料数据点记为目标水利物料数据点,将除目标水利物料数据点以外的每个水利物料数据点记为参考水利物料数据点;
将每个参考水利物料数据点与目标水利物料数据点的欧式距离的反比例值记为第一距离;将所有参考水利物料数据点与目标水利物料数据点的第一距离的累加和记为目标水利物料数据点的物料数据综合密集度。
优选的,所述根据物料数据综合密集度从多个水利物料数据点中,筛选出若干初始聚类中心点,包括的具体方法为:
获取所有水利物料数据点中的若干极大值点,将每个极大值点记为待筛选聚类中心数据点;将任意一个待筛选聚类中心数据点记为目标待筛选聚类中心点,将与目标待筛选聚类中心点的欧式距离最小的待筛选聚类中心数据点,记为目标待筛选聚类中心点的对照待筛选聚类中心点;获取目标待筛选聚类中心点的所有对照待筛选聚类中心点;根据目标待筛选聚类中心点的每个对照待筛选聚类中心点与目标待筛选聚类中心点的距离关系,得到参考判定距离阈值
对于任意两个待筛选聚类中心数据点,若这两个待筛选聚类中心数据点之间的欧式距离小于,将这两个待筛选聚类中心数据点中物料数据综合密集度最小的待筛选聚类中心数据点记为中心干扰数据点,以此类推,获取所有中心干扰数据点;将除中心干扰数据点以外的每个待筛选聚类中心数据点记为初始聚类中心点。
优选的,所述根据目标待筛选聚类中心点的每个对照待筛选聚类中心点与目标待筛选聚类中心点的距离关系,得到参考判定距离阈值,包括的具体方法为:
将对照待筛选聚类中心点与目标待筛选聚类中心的欧式距离记为目标待筛选聚类中心的参考判定距离,获取所有待筛选聚类中心数据点的参考判定距离;将所有待筛选聚类中心数据点的参考判定距离的均值记为参考判定距离阈值
优选的,所述根据同一物料种类下水利物料数据点整体的使用次数的变化连续情况、物料数据综合密集度以及初始聚类中心点,得到每个水利物料数据点的中心选取度,包括的具体方法为:
将每个初始聚类中心点作为ISODATA迭代自组织聚类算法中第一次聚类过程中的聚类中心,根据聚类中心,利用ISODATA迭代自组织聚类算法对所有水利物料数据点进行聚类,得到第一次聚类过程中的若干聚类簇;根据第一次聚类过程中的若干聚类簇,得到第二次聚类过程中的若干聚类中心的具体获取过程为:
对于第一次聚类过程中任意一个聚类簇,将聚类簇内的聚类中心与聚类簇内所有水利物料数据点之间欧式距离的方差记为聚类簇的分裂程度,获取所有聚类簇的分裂程度;将所有聚类簇按照分裂程度进行降序排列,将排列后的序列记为聚类簇序列;将聚类簇序列中相邻的任意两个聚类簇之间分裂程度的差值的绝对值记为参考分裂值,获取所有参考分裂值;将数值最大的参考分裂值对应的两个聚类簇中的第二个聚类簇记为待分裂终止聚类簇;
将任意一个待分裂聚类簇中任意一个水利物料数据点记为第一目标水利物料数据点;在待分裂聚类簇中,将与第一目标水利物料数据点所属同一个物料种类的所有水利物料数据点构成的序列,记为第一目标水利物料数据点的同物料数据点序列;
根据第一目标水利物料数据点的同物料数据点序列中相邻水利物料数据点对应使用次数之间的差异变化,得到第一目标水利物料数据点的水利工程变化连贯性;
根据第一目标水利物料数据点的同物料数据点序列中不同水利物料数据点与第一目标水利物料数据点之间的欧式距离、第一目标水利物料数据点的水利工程变化连贯性以及物料数据综合密集度,得到第一目标水利物料数据点的中心选取度。
优选的,所述根据第一目标水利物料数据点的同物料数据点序列中相邻水利物料数据点对应使用次数之间的差异变化,得到第一目标水利物料数据点的水利工程变化连贯性,包括的具体方法为:
在第一目标水利物料数据点的同物料数据点序列中,将相邻的任意两个水利物料数据点之间对应使用次数的差值的绝对值,记为第一绝对值;将所有第一绝对值的均值记为第一均值;将第一均值的反比例归一化值记为第一目标水利物料数据点的水利工程变化连贯性。
优选的,所述根据第一目标水利物料数据点的同物料数据点序列中不同水利物料数据点与第一目标水利物料数据点之间的欧式距离、第一目标水利物料数据点的水利工程变化连贯性以及物料数据综合密集度,得到第一目标水利物料数据点的中心选取度,包括的具体方法为:
在第一目标水利物料数据点的同物料数据点序列中,将所有水利物料数据点与第一目标水利物料数据点的欧式距离的累加和记为第一累加和;将第一累加和的反比例归一化值记为第一反比例值;将第一目标水利物料数据点的水利工程变化连贯性、第一目标水利物料数据点的物料数据综合密集度以及第一反比例值,这三者的乘积记为第一目标水利物料数据点的中心选取度。
优选的,所述根据中心选取度从初始聚类中心点中,筛选出若干聚类过程的若干聚类中心,包括的具体方法为:
将所有水利物料数据点按照中心选取度进行降序排列,将排列后的序列记为中心水利物料数据点序列;对于中心水利物料数据点序列中相邻的任意两个水利物料数据点,在这两个水利物料数据点中,将每个水利物料数据点与待分裂聚类簇内的聚类中心的欧式距离记为每个水利物料数据点的中心参考距离,将这两个水利物料数据点的参考距离的和记为这两个水利物料数据点的中心对照距离,获取任意两个水利物料数据点的中心对照距离;
将数值最大的中心对照距离对应的两个水利物料数据点均记为待分配聚类中心,获取所有待分配聚类中心,将每个待分配聚类中心作为第二次聚类过程中的聚类中心。
优选的,所述根据聚类中心对所有水利物料数据点进行聚类得到若干最终水利自适应聚类簇,包括的具体方法为:
参考根据第一次聚类过程中的若干聚类簇,得到第二次聚类过程中的若干聚类中心的具体获取过程;不断将最新聚类过程的聚类中心输入ISODATA迭代自组织聚类算法进行迭代聚类,直至最新聚类过程获取的若干聚类簇与其上一次聚类过程获取的若干聚类簇并没有变化时停止聚类,获取最新聚类过程的所有聚类簇,并将每个聚类簇记为最终水利自适应聚类簇。
优选的,所述根据最终水利自适应聚类簇进行异常检测,包括的具体方法为:
根据所有最终水利自适应聚类簇获取若干异常数据点,将所有异常数据点对应实际用料数据以及剩余用料数据均记为异常数据,使用BIM模型对异常数据进行核对,将核对后不匹配的异常数据删除,将删除后剩余的实际用料数据以及剩余用料数据重新存储在新的数据库中。
本发明的技术方案的有益效果是:通过结合不同物料种类的水利物料数据点的分布情况以及数据连续情况,自适应调整的ISODATA迭代自组织聚类算法中每次迭代聚类过程内的聚类中心,提高了聚类过程的效率,提高了聚类结果的准确性;根据水利物料数据点与周围水利物料数据点之间距离的差异分布情况,得到水利物料数据点的物料数据综合密集度,用于反映水利物料数据点作为初始聚类中心的可能性,降低了传统随机选取初始聚类中心对聚类结果效率的延迟情况;然后根据同一物料种类下水利物料数据点整体的使用次数的变化连续情况、物料数据综合密集度以及初始聚类中心点,得到水利物料数据点的中心选取度,用于反映水利物料数据点的作为后续聚类过程的聚类中心的概率,提高了每次迭代聚类过程中聚类结果的准确性;本发明通过结合不同种类物料的需求情况,自适应调整聚类中心,获取最终水利自适应聚类簇并进行异常检测,提高了异常检测结果的准确性,提高了数据管理的效率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明一种水利工程施工用BIM模型数据管理方法的步骤流程图;
图2为本发明一种水利工程施工用BIM模型数据管理方法的特征关系流程图。
具体实施方式
为了更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明提出的一种水利工程施工用BIM模型数据管理方法,其具体实施方式、结构、特征及其功效,详细说明如下。在下述说明中,不同的“一个实施例”或“另一个实施例”指的不一定是同一实施例。此外,一或多个实施例中的特定特征、结构或特点可由任何合适形式组合。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。
下面结合附图具体的说明本发明所提供的一种水利工程施工用BIM模型数据管理方法的具体方案。
请参阅图1,其示出了本发明一个实施例提供的一种水利工程施工用BIM模型数据管理方法的步骤流程图,该方法包括以下步骤:
步骤S001:采集若干物料种类的若干水利物料数据点。
需要说明的是,在CBLOF基于局部离群因子的聚类离群因子算法对物料数据进行异常检测时,通常先利用ISODATA(Iterative Selforganizing Data AnalysisTechniques Algorithm)迭代自组织聚类算法对物料数据进行聚类,根据聚类结果获取异常数据;但在实际的水利工程中,不同种类的物料在不同施工阶段中的需求不同,使不同种类的物料之间存在各自的数据变化特征,而传统的ISODATA迭代自组织聚类算法仅通过构建数据点计算其均值作为聚类中心,并没结合不同种类物料的需求情况,降低了传统聚类结果的准确性,降低了异常检测结果的准确性,降低了数据管理的效率。请参阅图2,其示出了本实施例提供的一种水利工程施工用BIM模型数据管理方法的特征关系流程图。
具体的,首先需要采集水利物料数据点,具体过程为:获取水利施工物料数据库中近一周的若干个物料种类每次使用时的实际用料数据以及剩余用料数据;以实际用料数据作为横轴、剩余用料数据作为纵轴,根据横轴与纵轴构建一个二维坐标系,将所有物料种类的所有使用次数下的实际用料数据与剩余用料数据输入二维坐标系中,获取若干数据点,将每个数据点记为水利物料数据点。其中每个物料种类对应多次使用次数,且每个物料种类对应使用次数的数量并不完全一致,每个物料种类的每次使用次数对应一个实际用料数据以及一个剩余用料数据,每个水利物料数据点对应一个实际用料数据、一个剩余用料数据以及一个物料种类。另外需要说明的是,本实施例不对实际用料数据以及剩余用料数据的获取时长进行限定,其中实际用料数据以及剩余用料数据的获取时长可通过具体实施情况而定;对于任意一次使用次数下的任意一种物料种类而言,该使用次数的实际用料数据为在本次使用次数下该物料种类的实际用量,该使用次数的剩余用料数据为本次使用次数下该物料种类的剩余量。
至此,通过上述方法得到所有水利物料数据点。
步骤S002:根据水利物料数据点与周围水利物料数据点之间距离的差异分布情况,得到每个水利物料数据点的物料数据综合密集度;根据物料数据综合密集度从多个水利物料数据点中,筛选出若干初始聚类中心点。
需要说明的是,传统的ISODATA迭代自组织聚类算法对数据进行聚类时,首先会随机选择若干个数据点作为第一次聚类过程的聚类中心;但由于第一次聚类过程的聚类中心是随机选取的,存在较大的不确定性,因此会极大程度地干扰后续获取聚类结果的效率,从而降低数据管理的效率;对于水利工程施工的若干水利物料数据点而言,这些水利物料数据点对应着不同的物料种类;而在实际的水利工程施工环境中,整体的施工过程是由多个施工环节构成,同一种物料种类在这些施工环节之间的需求量存在一定程度的区别,导致这些水利物料数据点之间会较大程度地受到物料种类以及对应使用次数的影响。为了提高数据管理的效率,本实施例首先通过分析不同水利物料数据点综合维度之间的分布距离确定物料数据综合密集度,然后根据物料数据综合密集度确定初始聚类中心点,以便后续异常检测处理。
具体的,将任意一个水利物料数据点记为目标水利物料数据点,将除目标水利物料数据点以外的每个水利物料数据点记为参考水利物料数据点,根据所有参考水利物料数据点与目标水利物料数据点之间距离的差异分布情况,得到目标水利物料数据点的物料数据综合密集度。作为一种示例,可通过如下公式计算目标水利物料数据点的物料数据综合密集度:
式中,表示目标水利物料数据点的物料数据综合密集度;/>表示目标水利物料数据点的所有参考水利物料数据点的数量;/>表示第/>个参考水利物料数据点与目标水利物料数据点的欧式距离;/>表示以自然常数为底的指数函数,实施例采用/>模型来呈现反比例关系,/>为模型的输入,实施者可根据实际情况选择反比例函数。其中若目标水利物料数据点的物料数据综合密集度越大,说明目标水利物料数据点周围分布的水利物料数据点越密集,反映目标水利物料数据点越能作为初始的聚类中心。获取所有水利物料数据点的物料数据综合密集度。另外需要说明的是,欧式距离的获取是公知技术,本实施例不再赘述。
进一步的,获取所有水利物料数据点中的若干极大值点,将每个极大值点记为待筛选聚类中心数据点;将任意一个待筛选聚类中心数据点记为目标待筛选聚类中心点,将与目标待筛选聚类中心点的欧式距离最小的待筛选聚类中心数据点,记为目标待筛选聚类中心点的对照待筛选聚类中心点;将对照待筛选聚类中心点与目标待筛选聚类中心的欧式距离记为目标待筛选聚类中心的参考判定距离,获取所有待筛选聚类中心数据点的参考判定距离;将所有待筛选聚类中心数据点的参考判定距离的均值记为参考判定距离阈值。其中每个待筛选聚类中心数据点对应一个水利物料数据点,每个待筛选聚类中心数据点对应一个对照待筛选聚类中心点。
进一步的,以任意两个待筛选聚类中心数据点为例,若这两个待筛选聚类中心数据点之间的欧式距离小于,将这两个待筛选聚类中心数据点中物料数据综合密集度最小的待筛选聚类中心数据点记为中心干扰数据点,以此类推,获取所有中心干扰数据点;将除中心干扰数据点以外的每个待筛选聚类中心数据点记为初始聚类中心点。
至此,通过上述方法得到所有初始聚类中心点。
步骤S003:根据同一物料种类下水利物料数据点整体的使用次数的变化连续情况、物料数据综合密集度以及初始聚类中心点,得到每个水利物料数据点的中心选取度;根据中心选取度从初始聚类中心点中,筛选出若干聚类过程的若干聚类中心;根据聚类中心对所有水利物料数据点进行聚类得到若干最终水利自适应聚类簇。
需要说明的是,随着时间的推移,水利工程的施工环节会按照工程的施工规划不断依次推进,对于同一物料种类的所有水利物料数据点而言,这些水利物料数据点会存在一定程度的连续性;但由于不同物料种类对应的水利物料数据点数量并不完全一致,导致不同物料种类的水利物料数据点整体对应表征的数据变化特征也存在差异区别;为了提高数据管理的效率,本实施例通过分析不同物料种类对应的水利物料数据点之间使用次数的差异,得到水利工程变化连贯性;根据物料数据综合密集度以及水利工程变化连贯性得到中心选取度,根据中心选取度获取每次迭代过程中的聚类中心,进而获取最终的聚类簇,以便后续数据管理处理。
具体的,将每个初始聚类中心点作为ISODATA迭代自组织聚类算法中第一次聚类过程中的聚类中心,根据聚类中心对所有水利物料数据点进行聚类,得到第一次聚类过程中的若干聚类簇。根据第一次聚类过程中的若干聚类簇,得到第二次聚类过程中的若干聚类中心,具体获取过程如下:
以第一次聚类过程中任意一个聚类簇为例,将该聚类簇内的聚类中心与该聚类簇内所有水利物料数据点之间欧式距离的方差记为该聚类簇的分裂程度,获取所有聚类簇的分裂程度;将所有聚类簇按照分裂程度进行降序排列,将排列后的序列记为聚类簇序列;将该聚类簇序列中相邻的任意两个聚类簇之间分裂程度的差值的绝对值记为参考分裂值,获取所有参考分裂值;将数值最大的参考分裂值对应的两个聚类簇中的第二个聚类簇记为待分裂终止聚类簇;在该聚类簇序列中,将该待分裂终止聚类簇左侧的每个聚类簇均记为待分裂聚类簇。其中根据聚类中心对数据进行聚类的过程是ISODATA迭代自组织聚类算法的公知内容,本实施例不再赘述;每个参考分裂值对应两个聚类簇。
进一步的,将任意一个待分裂聚类簇中任意一个水利物料数据点记为第一目标水利物料数据点;在该待分裂聚类簇中,将与第一目标水利物料数据点所属同一个物料种类的所有水利物料数据点构成的序列,记为第一目标水利物料数据点的同物料数据点序列。其中每个待聚类簇包含多个水利物料数据点,每个水利物料数据点对应一个同物料数据点序列,每个同物料数据点序列包含多个水利物料数据点,每个水利物料数据点对应一个使用次数。
进一步的,根据第一目标水利物料数据点的同物料数据点序列中相邻水利物料数据点对应使用次数之间的差异变化,得到第一目标水利物料数据点的水利工程变化连贯性。作为一种示例,可通过如下公式计算第一目标水利物料数据点的水利工程变化连贯性:
式中,表示第一目标水利物料数据点的水利工程变化连贯性;/>表示第一目标水利物料数据点的同物料数据点序列中所有水利物料数据点的数量;/>表示第/>个水利物料数据点对应的使用次数;/>表示第/>个水利物料数据点对应的使用次数;/>表示以自然常数为底的指数函数,实施例采用/>模型来呈现反比例关系及归一化处理,/>为模型的输入,实施者可根据实际情况选择反比例函数及归一化函数。其中若第一目标水利物料数据点的水利工程变化连贯性越大,说明该待分裂聚类簇中第一目标水利物料数据点所属的物料种类在水利施工过程中变化趋势越平滑,反映第一目标水利物料数据点越有可能作为下一次聚类过程的聚类中心。
进一步的,根据第一目标水利物料数据点的同物料数据点序列中不同水利物料数据点与第一目标水利物料数据点之间的欧式距离、第一目标水利物料数据点的水利工程变化连贯性以及物料数据综合密集度,得到第一目标水利物料数据点的中心选取度。作为一种示例,可通过如下公式计算第一目标水利物料数据点的中心选取度:
式中,表示第一目标水利物料数据点的中心选取度;/>表示第一目标水利物料数据点的物料数据综合密集度;/>表示第一目标水利物料数据点的水利工程变化连贯性;/>表示第一目标水利物料数据点的同物料数据点序列中所有水利物料数据点的数量;/>表示第/>个水利物料数据点与第一目标水利物料数据点的欧式距离;/>表示以自然常数为底的指数函数,实施例采用/>模型来呈现反比例关系及归一化处理,/>为模型的输入,实施者可根据实际情况选择反比例函数及归一化函数。其中若第一目标水利物料数据点的中心选取度越大,说明在该待分裂聚类簇中,第一目标水利物料数据点与周围水利物料数据点之间分布趋势越明显,反映第一目标水利物料数据点越有利于表达后续的异常检测结果。获取所有水利物料数据点的中心选取度。
进一步的,将所有水利物料数据点按照中心选取度进行降序排列,将排列后的序列记为中心水利物料数据点序列;以中心水利物料数据点序列中相邻的任意两个水利物料数据点为例,在这两个水利物料数据点中,将每个水利物料数据点与该待分裂聚类簇内的聚类中心的欧式距离记为每个水利物料数据点的中心参考距离,将这两个水利物料数据点的参考距离的和记为这两个水利物料数据点的中心对照距离,获取任意两个水利物料数据点的中心对照距离;将数值最大的中心对照距离对应的两个水利物料数据点均记为待分配聚类中心,获取所有待分配聚类中心,将每个待分配聚类中心作为第二次聚类过程中的聚类中心。其中每个中心对照距离对应两个水利物料数据点。
至此,通过上述方法得到第二次聚类过程中的若干聚类中心。
进一步的,参考根据第一次聚类过程中的若干聚类簇,得到第二次聚类过程中的若干聚类中心的具体获取过程;不断将最新聚类过程的聚类中心输入ISODATA迭代自组织聚类算法进行迭代聚类,直至最新聚类过程获取的若干聚类簇与其上一次聚类过程获取的若干聚类簇并没有变化时停止聚类,获取最新聚类过程的所有聚类簇,并将每个聚类簇记为最终水利自适应聚类簇。其中根据聚类中心进行迭代聚类的过程是ISODATA迭代自组织聚类算法的公知内容,本实施例不再赘述。
至此,通过上述方法得到所有最终水利自适应聚类簇。
步骤S004:根据最终水利自适应聚类簇进行异常检测。
具体的,根据所有最终水利自适应聚类簇获取若干异常数据点,将所有异常数据点对应实际用料数据以及剩余用料数据均记为异常数据,使用BIM模型对异常数据进行核对,将核对后不匹配的异常数据删除,将删除后剩余的实际用料数据以及剩余用料数据重新存储在新的数据库中,完成对水利工程施工数据的管理。其中根据最终水利自适应聚类簇获取异常数据点的过程是CBLOF基于局部离群因子的聚类离群因子算法的公知内容,利用BIM模型对异常数据进行核对的过程是BIM模型的公知内容,本实施例不再赘述。
至此,本实施例完成。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (7)

1.一种水利工程施工用BIM模型数据管理方法,其特征在于,该方法包括以下步骤:
采集若干物料种类的若干水利物料数据点,一个水利物料数据点对应一个使用次数;
根据水利物料数据点与周围水利物料数据点之间距离的差异分布情况,得到每个水利物料数据点的物料数据综合密集度;根据物料数据综合密集度从多个水利物料数据点中,筛选出若干初始聚类中心点;
根据同一物料种类下水利物料数据点整体的使用次数的变化连续情况、物料数据综合密集度以及初始聚类中心点,得到每个水利物料数据点的中心选取度;根据中心选取度从初始聚类中心点中,筛选出若干聚类过程的若干聚类中心;根据聚类中心对所有水利物料数据点进行聚类得到若干最终水利自适应聚类簇;
根据最终水利自适应聚类簇进行异常检测;
所述根据同一物料种类下水利物料数据点整体的使用次数的变化连续情况、物料数据综合密集度以及初始聚类中心点,得到每个水利物料数据点的中心选取度,包括的具体方法为:
将每个初始聚类中心点作为ISODATA迭代自组织聚类算法中第一次聚类过程中的聚类中心,根据聚类中心,利用ISODATA迭代自组织聚类算法对所有水利物料数据点进行聚类,得到第一次聚类过程中的若干聚类簇;根据第一次聚类过程中的若干聚类簇,得到第二次聚类过程中的若干聚类中心的具体获取过程为:
对于第一次聚类过程中任意一个聚类簇,将聚类簇内的聚类中心与聚类簇内所有水利物料数据点之间欧式距离的方差记为聚类簇的分裂程度,获取所有聚类簇的分裂程度;将所有聚类簇按照分裂程度进行降序排列,将排列后的序列记为聚类簇序列;将聚类簇序列中相邻的任意两个聚类簇之间分裂程度的差值的绝对值记为参考分裂值,获取所有参考分裂值;将数值最大的参考分裂值对应的两个聚类簇中的第二个聚类簇记为待分裂终止聚类簇;
将任意一个待分裂聚类簇中任意一个水利物料数据点记为第一目标水利物料数据点;在待分裂聚类簇中,将与第一目标水利物料数据点所属同一个物料种类的所有水利物料数据点构成的序列,记为第一目标水利物料数据点的同物料数据点序列;
根据第一目标水利物料数据点的同物料数据点序列中相邻水利物料数据点对应使用次数之间的差异变化,得到第一目标水利物料数据点的水利工程变化连贯性;
根据第一目标水利物料数据点的同物料数据点序列中不同水利物料数据点与第一目标水利物料数据点之间的欧式距离、第一目标水利物料数据点的水利工程变化连贯性以及物料数据综合密集度,得到第一目标水利物料数据点的中心选取度;
所述根据第一目标水利物料数据点的同物料数据点序列中相邻水利物料数据点对应使用次数之间的差异变化,得到第一目标水利物料数据点的水利工程变化连贯性,包括的具体方法为:
在第一目标水利物料数据点的同物料数据点序列中,将相邻的任意两个水利物料数据点之间对应使用次数的差值的绝对值,记为第一绝对值;将所有第一绝对值的均值记为第一均值;将第一均值的反比例归一化值记为第一目标水利物料数据点的水利工程变化连贯性;
所述根据第一目标水利物料数据点的同物料数据点序列中不同水利物料数据点与第一目标水利物料数据点之间的欧式距离、第一目标水利物料数据点的水利工程变化连贯性以及物料数据综合密集度,得到第一目标水利物料数据点的中心选取度,包括的具体方法为:
在第一目标水利物料数据点的同物料数据点序列中,将所有水利物料数据点与第一目标水利物料数据点的欧式距离的累加和记为第一累加和;将第一累加和的反比例归一化值记为第一反比例值;将第一目标水利物料数据点的水利工程变化连贯性、第一目标水利物料数据点的物料数据综合密集度以及第一反比例值,这三者的乘积记为第一目标水利物料数据点的中心选取度。
2.根据权利要求1所述一种水利工程施工用BIM模型数据管理方法,其特征在于,所述根据水利物料数据点与周围水利物料数据点之间距离的差异分布情况,得到每个水利物料数据点的物料数据综合密集度,包括的具体方法为:
将任意一个水利物料数据点记为目标水利物料数据点,将除目标水利物料数据点以外的每个水利物料数据点记为参考水利物料数据点;
将每个参考水利物料数据点与目标水利物料数据点的欧式距离的反比例值记为第一距离;将所有参考水利物料数据点与目标水利物料数据点的第一距离的累加和记为目标水利物料数据点的物料数据综合密集度。
3.根据权利要求1所述一种水利工程施工用BIM模型数据管理方法,其特征在于,所述根据物料数据综合密集度从多个水利物料数据点中,筛选出若干初始聚类中心点,包括的具体方法为:
获取所有水利物料数据点中的若干极大值点,将每个极大值点记为待筛选聚类中心数据点;将任意一个待筛选聚类中心数据点记为目标待筛选聚类中心点,将与目标待筛选聚类中心点的欧式距离最小的待筛选聚类中心数据点,记为目标待筛选聚类中心点的对照待筛选聚类中心点;获取目标待筛选聚类中心点的所有对照待筛选聚类中心点;根据目标待筛选聚类中心点的每个对照待筛选聚类中心点与目标待筛选聚类中心点的距离关系,得到参考判定距离阈值
对于任意两个待筛选聚类中心数据点,若这两个待筛选聚类中心数据点之间的欧式距离小于,将这两个待筛选聚类中心数据点中物料数据综合密集度最小的待筛选聚类中心数据点记为中心干扰数据点,以此类推,获取所有中心干扰数据点;将除中心干扰数据点以外的每个待筛选聚类中心数据点记为初始聚类中心点。
4.根据权利要求3所述一种水利工程施工用BIM模型数据管理方法,其特征在于,所述根据目标待筛选聚类中心点的每个对照待筛选聚类中心点与目标待筛选聚类中心点的距离关系,得到参考判定距离阈值,包括的具体方法为:
将对照待筛选聚类中心点与目标待筛选聚类中心的欧式距离记为目标待筛选聚类中心的参考判定距离,获取所有待筛选聚类中心数据点的参考判定距离;将所有待筛选聚类中心数据点的参考判定距离的均值记为参考判定距离阈值
5.根据权利要求1所述一种水利工程施工用BIM模型数据管理方法,其特征在于,所述根据中心选取度从初始聚类中心点中,筛选出若干聚类过程的若干聚类中心,包括的具体方法为:
将所有水利物料数据点按照中心选取度进行降序排列,将排列后的序列记为中心水利物料数据点序列;对于中心水利物料数据点序列中相邻的任意两个水利物料数据点,在这两个水利物料数据点中,将每个水利物料数据点与待分裂聚类簇内的聚类中心的欧式距离记为每个水利物料数据点的中心参考距离,将这两个水利物料数据点的参考距离的和记为这两个水利物料数据点的中心对照距离,获取任意两个水利物料数据点的中心对照距离;
将数值最大的中心对照距离对应的两个水利物料数据点均记为待分配聚类中心,获取所有待分配聚类中心,将每个待分配聚类中心作为第二次聚类过程中的聚类中心。
6.根据权利要求1所述一种水利工程施工用BIM模型数据管理方法,其特征在于,所述根据聚类中心对所有水利物料数据点进行聚类得到若干最终水利自适应聚类簇,包括的具体方法为:
参考根据第一次聚类过程中的若干聚类簇,得到第二次聚类过程中的若干聚类中心的具体获取过程;不断将最新聚类过程的聚类中心输入ISODATA迭代自组织聚类算法进行迭代聚类,直至最新聚类过程获取的若干聚类簇与其上一次聚类过程获取的若干聚类簇并没有变化时停止聚类,获取最新聚类过程的所有聚类簇,并将每个聚类簇记为最终水利自适应聚类簇。
7.根据权利要求1所述一种水利工程施工用BIM模型数据管理方法,其特征在于,所述根据最终水利自适应聚类簇进行异常检测,包括的具体方法为:
根据所有最终水利自适应聚类簇获取若干异常数据点,将所有异常数据点对应实际用料数据以及剩余用料数据均记为异常数据,使用BIM模型对异常数据进行核对,将核对后不匹配的异常数据删除,将删除后剩余的实际用料数据以及剩余用料数据重新存储在新的数据库中。
CN202410194889.5A 2024-02-22 2024-02-22 一种水利工程施工用bim模型数据管理方法 Active CN117764290B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410194889.5A CN117764290B (zh) 2024-02-22 2024-02-22 一种水利工程施工用bim模型数据管理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202410194889.5A CN117764290B (zh) 2024-02-22 2024-02-22 一种水利工程施工用bim模型数据管理方法

Publications (2)

Publication Number Publication Date
CN117764290A CN117764290A (zh) 2024-03-26
CN117764290B true CN117764290B (zh) 2024-06-07

Family

ID=90314827

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202410194889.5A Active CN117764290B (zh) 2024-02-22 2024-02-22 一种水利工程施工用bim模型数据管理方法

Country Status (1)

Country Link
CN (1) CN117764290B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118013301B (zh) * 2024-04-09 2024-06-11 青岛奥维特智能科技有限公司 基于bim的公路桥梁施工信息数字化管理方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8175851B1 (en) * 2009-09-24 2012-05-08 L-3 Services, Inc. Using statistical learning methods to fuse parameter estimates
CN117313016A (zh) * 2023-11-28 2023-12-29 北京易能中网技术有限公司 一种新能源电力交易现货电价价差数据处理方法
CN117390471A (zh) * 2023-12-12 2024-01-12 山东省地质矿产勘查开发局第八地质大队(山东省第八地质矿产勘查院) 一种水文地质数据管理方法及系统
CN117453447A (zh) * 2023-12-21 2024-01-26 临沂大学 一种汽车电驱动系统的模拟测试方法
CN117498735A (zh) * 2024-01-02 2024-02-02 深圳市爱宝科技有限公司 一种步进电机动态平稳驱动方法及系统
CN117540238A (zh) * 2024-01-05 2024-02-09 长春同泰企业管理服务有限责任公司 一种工业数字化信息采集装置用数据安全管理方法
CN117557569A (zh) * 2024-01-12 2024-02-13 吉林交通职业技术学院 一种道路路面施工质量检测方法及系统

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8175851B1 (en) * 2009-09-24 2012-05-08 L-3 Services, Inc. Using statistical learning methods to fuse parameter estimates
CN117313016A (zh) * 2023-11-28 2023-12-29 北京易能中网技术有限公司 一种新能源电力交易现货电价价差数据处理方法
CN117390471A (zh) * 2023-12-12 2024-01-12 山东省地质矿产勘查开发局第八地质大队(山东省第八地质矿产勘查院) 一种水文地质数据管理方法及系统
CN117453447A (zh) * 2023-12-21 2024-01-26 临沂大学 一种汽车电驱动系统的模拟测试方法
CN117498735A (zh) * 2024-01-02 2024-02-02 深圳市爱宝科技有限公司 一种步进电机动态平稳驱动方法及系统
CN117540238A (zh) * 2024-01-05 2024-02-09 长春同泰企业管理服务有限责任公司 一种工业数字化信息采集装置用数据安全管理方法
CN117557569A (zh) * 2024-01-12 2024-02-13 吉林交通职业技术学院 一种道路路面施工质量检测方法及系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
一种优化初始聚类中心的自适应聚类算法;曹端喜;唐加山;陈香;;软件导刊;20200715(第07期);全文 *
一种基于初始点密度最大的改进型ISODATA聚类算法;李润青;谢明鸿;黄冰晶;;软件导刊;20171215(第12期);全文 *

Also Published As

Publication number Publication date
CN117764290A (zh) 2024-03-26

Similar Documents

Publication Publication Date Title
CN117764290B (zh) 一种水利工程施工用bim模型数据管理方法
CN110969290A (zh) 一种基于深度学习的径流概率预测方法及系统
TWI684139B (zh) 基於自動學習的基地台異常之預測的系統與方法
CN116760908B (zh) 基于数字孪生的农业信息优化管理方法及系统
CN113515512A (zh) 一种工业互联网平台数据的质量治理及提升方法
CN117078048B (zh) 基于数字孪生的智慧城市资源管理方法及系统
CN117151657B (zh) 一种塑料包装材料管理方法及系统
CN106354803B (zh) 基于特性指标的电力输变电设备负荷坏数据检测方法
CN114416707A (zh) 工业时序数据的自动化特征工程方法和装置
CN115952067A (zh) 一种数据库操作异常行为检测方法及可读存储介质
CN115222138A (zh) 一种基于eemd-lstm微网光伏短期功率区间预测方法
CN117473351B (zh) 基于物联网的电源信息远程传输系统
CN110533111A (zh) 一种基于局部密度与球哈希的自适应k均值聚类方法
CN113379116A (zh) 基于聚类和卷积神经网络的台区线损预测方法
CN116504314B (zh) 基于细胞动态分化的基因调控网络构建方法
CN112348360A (zh) 一种基于大数据技术的中药生产工艺参数分析系统
CN114219051B (zh) 图像分类方法、分类模型的训练方法、装置及电子设备
CN116502802A (zh) 一种基于大数据与无线传感技术的数据管理系统
CN116365519A (zh) 一种电力负荷预测方法、系统、存储介质及设备
CN115525927A (zh) 基于人工智能的科技成果转化数据智能监测方法及系统
CN115017988A (zh) 一种用于状态异常诊断的竞争聚类方法
CN114662056A (zh) 镀膜厚度控制方法、装置和存储介质
CN111652384B (zh) 一种数据量分布的平衡方法及数据处理方法
CN105721199A (zh) 一种基于核密度估计与模糊推理系统的实时云服务瓶颈检测方法
CN110598933A (zh) 一种停电敏感用户管理方法、系统及相关组件

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant