CN117764290B

CN117764290B - 一种水利工程施工用bim模型数据管理方法

Info

Publication number: CN117764290B
Application number: CN202410194889.5A
Authority: CN
Inventors: 程华进; 董舒迪; 付变芳; 杨兵; 张伟; 李永涛; 樊雪桃
Original assignee: Shenzhen Zhidesen Water Technology Co ltd
Current assignee: Shenzhen Zhidesen Water Technology Co ltd
Priority date: 2024-02-22
Filing date: 2024-02-22
Publication date: 2024-06-07
Anticipated expiration: 2044-02-22
Also published as: CN117764290A

Abstract

本发明涉及数据处理技术领域，具体涉及一种水利工程施工用BIM模型数据管理方法，包括：采集若干物料种类的水利物料数据点；根据水利物料数据点得到物料数据综合密集度；根据物料数据综合密集度得到初始聚类中心点；根据同一物料种类下水利物料数据点整体的使用次数的变化连续情况、物料数据综合密集度以及初始聚类中心点，得到中心选取度；根据中心选取度得到若干聚类中心；根据聚类中心对所有水利物料数据点进行聚类得到最终水利自适应聚类簇；根据最终水利自适应聚类簇进行异常检测。本发明提高了聚类结果的准确性，提高了异常检测结果的准确性，提高了数据管理的效率。

Description

一种水利工程施工用BIM模型数据管理方法

技术领域

本发明涉及数据处理技术领域，具体涉及一种水利工程施工用BIM模型数据管理方法。

背景技术

在基于BIM模型对水利工程的物料数据进行管理之前，需要对物料数据进行异常检测；现有方法通常利用CBLOF（Clustering Based Local Outlier Factor）基于局部离群因子的聚类离群因子算法对物料数据进行异常检测，而在CBLOF基于局部离群因子的聚类离群因子算法对物料数据进行异常检测时，通常先利用ISODATA（IterativeSelforganizing Data Analysis Techniques Algorithm）迭代自组织聚类算法对物料数据进行聚类，根据聚类结果获取异常数据；但在实际的水利工程中，不同种类的物料在不同施工阶段中的需求不同，使不同种类的物料之间存在各自的数据变化特征，而传统的ISODATA迭代自组织聚类算法仅通过构建数据点计算其均值作为聚类中心，并没结合不同种类物料的需求情况，降低了传统聚类结果的准确性，降低了异常检测结果的准确性，降低了数据管理的效率。

发明内容

本发明提供一种水利工程施工用BIM模型数据管理方法，以解决现有的问题：在实际的水利工程中，不同种类的物料在不同施工阶段中的需求不同，使不同种类的物料之间存在各自的数据变化特征，而传统的ISODATA迭代自组织聚类算法仅通过构建数据点计算其均值作为聚类中心，并没结合不同种类物料的需求情况。

本发明的一种水利工程施工用BIM模型数据管理方法采用如下技术方案：

包括以下步骤：

采集若干物料种类的若干水利物料数据点，所述水利物料数据点对应一个使用次数；

根据水利物料数据点与周围水利物料数据点之间距离的差异分布情况，得到每个水利物料数据点的物料数据综合密集度；根据物料数据综合密集度从多个水利物料数据点中，筛选出若干初始聚类中心点；

根据同一物料种类下水利物料数据点整体的使用次数的变化连续情况、物料数据综合密集度以及初始聚类中心点，得到每个水利物料数据点的中心选取度；根据中心选取度从初始聚类中心点中，筛选出若干聚类过程的若干聚类中心；根据聚类中心对所有水利物料数据点进行聚类得到若干最终水利自适应聚类簇；

根据最终水利自适应聚类簇进行异常检测。

优选的，所述根据水利物料数据点与周围水利物料数据点之间距离的差异分布情况，得到每个水利物料数据点的物料数据综合密集度，包括的具体方法为：

将任意一个水利物料数据点记为目标水利物料数据点，将除目标水利物料数据点以外的每个水利物料数据点记为参考水利物料数据点；

将每个参考水利物料数据点与目标水利物料数据点的欧式距离的反比例值记为第一距离；将所有参考水利物料数据点与目标水利物料数据点的第一距离的累加和记为目标水利物料数据点的物料数据综合密集度。

优选的，所述根据物料数据综合密集度从多个水利物料数据点中，筛选出若干初始聚类中心点，包括的具体方法为：

获取所有水利物料数据点中的若干极大值点，将每个极大值点记为待筛选聚类中心数据点；将任意一个待筛选聚类中心数据点记为目标待筛选聚类中心点，将与目标待筛选聚类中心点的欧式距离最小的待筛选聚类中心数据点，记为目标待筛选聚类中心点的对照待筛选聚类中心点；获取目标待筛选聚类中心点的所有对照待筛选聚类中心点；根据目标待筛选聚类中心点的每个对照待筛选聚类中心点与目标待筛选聚类中心点的距离关系，得到参考判定距离阈值；

对于任意两个待筛选聚类中心数据点，若这两个待筛选聚类中心数据点之间的欧式距离小于，将这两个待筛选聚类中心数据点中物料数据综合密集度最小的待筛选聚类中心数据点记为中心干扰数据点，以此类推，获取所有中心干扰数据点；将除中心干扰数据点以外的每个待筛选聚类中心数据点记为初始聚类中心点。

优选的，所述根据目标待筛选聚类中心点的每个对照待筛选聚类中心点与目标待筛选聚类中心点的距离关系，得到参考判定距离阈值，包括的具体方法为：

将对照待筛选聚类中心点与目标待筛选聚类中心的欧式距离记为目标待筛选聚类中心的参考判定距离，获取所有待筛选聚类中心数据点的参考判定距离；将所有待筛选聚类中心数据点的参考判定距离的均值记为参考判定距离阈值。

优选的，所述根据同一物料种类下水利物料数据点整体的使用次数的变化连续情况、物料数据综合密集度以及初始聚类中心点，得到每个水利物料数据点的中心选取度，包括的具体方法为：

将每个初始聚类中心点作为ISODATA迭代自组织聚类算法中第一次聚类过程中的聚类中心，根据聚类中心，利用ISODATA迭代自组织聚类算法对所有水利物料数据点进行聚类，得到第一次聚类过程中的若干聚类簇；根据第一次聚类过程中的若干聚类簇，得到第二次聚类过程中的若干聚类中心的具体获取过程为：

对于第一次聚类过程中任意一个聚类簇，将聚类簇内的聚类中心与聚类簇内所有水利物料数据点之间欧式距离的方差记为聚类簇的分裂程度，获取所有聚类簇的分裂程度；将所有聚类簇按照分裂程度进行降序排列，将排列后的序列记为聚类簇序列；将聚类簇序列中相邻的任意两个聚类簇之间分裂程度的差值的绝对值记为参考分裂值，获取所有参考分裂值；将数值最大的参考分裂值对应的两个聚类簇中的第二个聚类簇记为待分裂终止聚类簇；

将任意一个待分裂聚类簇中任意一个水利物料数据点记为第一目标水利物料数据点；在待分裂聚类簇中，将与第一目标水利物料数据点所属同一个物料种类的所有水利物料数据点构成的序列，记为第一目标水利物料数据点的同物料数据点序列；

根据第一目标水利物料数据点的同物料数据点序列中相邻水利物料数据点对应使用次数之间的差异变化，得到第一目标水利物料数据点的水利工程变化连贯性；

根据第一目标水利物料数据点的同物料数据点序列中不同水利物料数据点与第一目标水利物料数据点之间的欧式距离、第一目标水利物料数据点的水利工程变化连贯性以及物料数据综合密集度，得到第一目标水利物料数据点的中心选取度。

优选的，所述根据第一目标水利物料数据点的同物料数据点序列中相邻水利物料数据点对应使用次数之间的差异变化，得到第一目标水利物料数据点的水利工程变化连贯性，包括的具体方法为：

在第一目标水利物料数据点的同物料数据点序列中，将相邻的任意两个水利物料数据点之间对应使用次数的差值的绝对值，记为第一绝对值；将所有第一绝对值的均值记为第一均值；将第一均值的反比例归一化值记为第一目标水利物料数据点的水利工程变化连贯性。

优选的，所述根据第一目标水利物料数据点的同物料数据点序列中不同水利物料数据点与第一目标水利物料数据点之间的欧式距离、第一目标水利物料数据点的水利工程变化连贯性以及物料数据综合密集度，得到第一目标水利物料数据点的中心选取度，包括的具体方法为：

在第一目标水利物料数据点的同物料数据点序列中，将所有水利物料数据点与第一目标水利物料数据点的欧式距离的累加和记为第一累加和；将第一累加和的反比例归一化值记为第一反比例值；将第一目标水利物料数据点的水利工程变化连贯性、第一目标水利物料数据点的物料数据综合密集度以及第一反比例值，这三者的乘积记为第一目标水利物料数据点的中心选取度。

优选的，所述根据中心选取度从初始聚类中心点中，筛选出若干聚类过程的若干聚类中心，包括的具体方法为：

将所有水利物料数据点按照中心选取度进行降序排列，将排列后的序列记为中心水利物料数据点序列；对于中心水利物料数据点序列中相邻的任意两个水利物料数据点，在这两个水利物料数据点中，将每个水利物料数据点与待分裂聚类簇内的聚类中心的欧式距离记为每个水利物料数据点的中心参考距离，将这两个水利物料数据点的参考距离的和记为这两个水利物料数据点的中心对照距离，获取任意两个水利物料数据点的中心对照距离；

将数值最大的中心对照距离对应的两个水利物料数据点均记为待分配聚类中心，获取所有待分配聚类中心，将每个待分配聚类中心作为第二次聚类过程中的聚类中心。

优选的，所述根据聚类中心对所有水利物料数据点进行聚类得到若干最终水利自适应聚类簇，包括的具体方法为：

参考根据第一次聚类过程中的若干聚类簇，得到第二次聚类过程中的若干聚类中心的具体获取过程；不断将最新聚类过程的聚类中心输入ISODATA迭代自组织聚类算法进行迭代聚类，直至最新聚类过程获取的若干聚类簇与其上一次聚类过程获取的若干聚类簇并没有变化时停止聚类，获取最新聚类过程的所有聚类簇，并将每个聚类簇记为最终水利自适应聚类簇。

优选的，所述根据最终水利自适应聚类簇进行异常检测，包括的具体方法为：

根据所有最终水利自适应聚类簇获取若干异常数据点，将所有异常数据点对应实际用料数据以及剩余用料数据均记为异常数据，使用BIM模型对异常数据进行核对，将核对后不匹配的异常数据删除，将删除后剩余的实际用料数据以及剩余用料数据重新存储在新的数据库中。

本发明的技术方案的有益效果是：通过结合不同物料种类的水利物料数据点的分布情况以及数据连续情况，自适应调整的ISODATA迭代自组织聚类算法中每次迭代聚类过程内的聚类中心，提高了聚类过程的效率，提高了聚类结果的准确性；根据水利物料数据点与周围水利物料数据点之间距离的差异分布情况，得到水利物料数据点的物料数据综合密集度，用于反映水利物料数据点作为初始聚类中心的可能性，降低了传统随机选取初始聚类中心对聚类结果效率的延迟情况；然后根据同一物料种类下水利物料数据点整体的使用次数的变化连续情况、物料数据综合密集度以及初始聚类中心点，得到水利物料数据点的中心选取度，用于反映水利物料数据点的作为后续聚类过程的聚类中心的概率，提高了每次迭代聚类过程中聚类结果的准确性；本发明通过结合不同种类物料的需求情况，自适应调整聚类中心，获取最终水利自适应聚类簇并进行异常检测，提高了异常检测结果的准确性，提高了数据管理的效率。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明一种水利工程施工用BIM模型数据管理方法的步骤流程图；

图2为本发明一种水利工程施工用BIM模型数据管理方法的特征关系流程图。

具体实施方式

为了更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效，以下结合附图及较佳实施例，对依据本发明提出的一种水利工程施工用BIM模型数据管理方法，其具体实施方式、结构、特征及其功效，详细说明如下。在下述说明中，不同的“一个实施例”或“另一个实施例”指的不一定是同一实施例。此外，一或多个实施例中的特定特征、结构或特点可由任何合适形式组合。

除非另有定义，本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。

下面结合附图具体的说明本发明所提供的一种水利工程施工用BIM模型数据管理方法的具体方案。

请参阅图1，其示出了本发明一个实施例提供的一种水利工程施工用BIM模型数据管理方法的步骤流程图，该方法包括以下步骤：

步骤S001：采集若干物料种类的若干水利物料数据点。

需要说明的是，在CBLOF基于局部离群因子的聚类离群因子算法对物料数据进行异常检测时，通常先利用ISODATA（Iterative Selforganizing Data AnalysisTechniques Algorithm）迭代自组织聚类算法对物料数据进行聚类，根据聚类结果获取异常数据；但在实际的水利工程中，不同种类的物料在不同施工阶段中的需求不同，使不同种类的物料之间存在各自的数据变化特征，而传统的ISODATA迭代自组织聚类算法仅通过构建数据点计算其均值作为聚类中心，并没结合不同种类物料的需求情况，降低了传统聚类结果的准确性，降低了异常检测结果的准确性，降低了数据管理的效率。请参阅图2，其示出了本实施例提供的一种水利工程施工用BIM模型数据管理方法的特征关系流程图。

具体的，首先需要采集水利物料数据点，具体过程为：获取水利施工物料数据库中近一周的若干个物料种类每次使用时的实际用料数据以及剩余用料数据；以实际用料数据作为横轴、剩余用料数据作为纵轴，根据横轴与纵轴构建一个二维坐标系，将所有物料种类的所有使用次数下的实际用料数据与剩余用料数据输入二维坐标系中，获取若干数据点，将每个数据点记为水利物料数据点。其中每个物料种类对应多次使用次数，且每个物料种类对应使用次数的数量并不完全一致，每个物料种类的每次使用次数对应一个实际用料数据以及一个剩余用料数据，每个水利物料数据点对应一个实际用料数据、一个剩余用料数据以及一个物料种类。另外需要说明的是，本实施例不对实际用料数据以及剩余用料数据的获取时长进行限定，其中实际用料数据以及剩余用料数据的获取时长可通过具体实施情况而定；对于任意一次使用次数下的任意一种物料种类而言，该使用次数的实际用料数据为在本次使用次数下该物料种类的实际用量，该使用次数的剩余用料数据为本次使用次数下该物料种类的剩余量。

至此，通过上述方法得到所有水利物料数据点。

步骤S002：根据水利物料数据点与周围水利物料数据点之间距离的差异分布情况，得到每个水利物料数据点的物料数据综合密集度；根据物料数据综合密集度从多个水利物料数据点中，筛选出若干初始聚类中心点。

需要说明的是，传统的ISODATA迭代自组织聚类算法对数据进行聚类时，首先会随机选择若干个数据点作为第一次聚类过程的聚类中心；但由于第一次聚类过程的聚类中心是随机选取的，存在较大的不确定性，因此会极大程度地干扰后续获取聚类结果的效率，从而降低数据管理的效率；对于水利工程施工的若干水利物料数据点而言，这些水利物料数据点对应着不同的物料种类；而在实际的水利工程施工环境中，整体的施工过程是由多个施工环节构成，同一种物料种类在这些施工环节之间的需求量存在一定程度的区别，导致这些水利物料数据点之间会较大程度地受到物料种类以及对应使用次数的影响。为了提高数据管理的效率，本实施例首先通过分析不同水利物料数据点综合维度之间的分布距离确定物料数据综合密集度，然后根据物料数据综合密集度确定初始聚类中心点，以便后续异常检测处理。

具体的，将任意一个水利物料数据点记为目标水利物料数据点，将除目标水利物料数据点以外的每个水利物料数据点记为参考水利物料数据点，根据所有参考水利物料数据点与目标水利物料数据点之间距离的差异分布情况，得到目标水利物料数据点的物料数据综合密集度。作为一种示例，可通过如下公式计算目标水利物料数据点的物料数据综合密集度：

式中，表示目标水利物料数据点的物料数据综合密集度；/>表示目标水利物料数据点的所有参考水利物料数据点的数量；/>表示第/>个参考水利物料数据点与目标水利物料数据点的欧式距离；/>表示以自然常数为底的指数函数，实施例采用/>模型来呈现反比例关系，/>为模型的输入，实施者可根据实际情况选择反比例函数。其中若目标水利物料数据点的物料数据综合密集度越大，说明目标水利物料数据点周围分布的水利物料数据点越密集，反映目标水利物料数据点越能作为初始的聚类中心。获取所有水利物料数据点的物料数据综合密集度。另外需要说明的是，欧式距离的获取是公知技术，本实施例不再赘述。

进一步的，获取所有水利物料数据点中的若干极大值点，将每个极大值点记为待筛选聚类中心数据点；将任意一个待筛选聚类中心数据点记为目标待筛选聚类中心点，将与目标待筛选聚类中心点的欧式距离最小的待筛选聚类中心数据点，记为目标待筛选聚类中心点的对照待筛选聚类中心点；将对照待筛选聚类中心点与目标待筛选聚类中心的欧式距离记为目标待筛选聚类中心的参考判定距离，获取所有待筛选聚类中心数据点的参考判定距离；将所有待筛选聚类中心数据点的参考判定距离的均值记为参考判定距离阈值。其中每个待筛选聚类中心数据点对应一个水利物料数据点，每个待筛选聚类中心数据点对应一个对照待筛选聚类中心点。

进一步的，以任意两个待筛选聚类中心数据点为例，若这两个待筛选聚类中心数据点之间的欧式距离小于，将这两个待筛选聚类中心数据点中物料数据综合密集度最小的待筛选聚类中心数据点记为中心干扰数据点，以此类推，获取所有中心干扰数据点；将除中心干扰数据点以外的每个待筛选聚类中心数据点记为初始聚类中心点。

至此，通过上述方法得到所有初始聚类中心点。

步骤S003：根据同一物料种类下水利物料数据点整体的使用次数的变化连续情况、物料数据综合密集度以及初始聚类中心点，得到每个水利物料数据点的中心选取度；根据中心选取度从初始聚类中心点中，筛选出若干聚类过程的若干聚类中心；根据聚类中心对所有水利物料数据点进行聚类得到若干最终水利自适应聚类簇。

需要说明的是，随着时间的推移，水利工程的施工环节会按照工程的施工规划不断依次推进，对于同一物料种类的所有水利物料数据点而言，这些水利物料数据点会存在一定程度的连续性；但由于不同物料种类对应的水利物料数据点数量并不完全一致，导致不同物料种类的水利物料数据点整体对应表征的数据变化特征也存在差异区别；为了提高数据管理的效率，本实施例通过分析不同物料种类对应的水利物料数据点之间使用次数的差异，得到水利工程变化连贯性；根据物料数据综合密集度以及水利工程变化连贯性得到中心选取度，根据中心选取度获取每次迭代过程中的聚类中心，进而获取最终的聚类簇，以便后续数据管理处理。

具体的，将每个初始聚类中心点作为ISODATA迭代自组织聚类算法中第一次聚类过程中的聚类中心，根据聚类中心对所有水利物料数据点进行聚类，得到第一次聚类过程中的若干聚类簇。根据第一次聚类过程中的若干聚类簇，得到第二次聚类过程中的若干聚类中心，具体获取过程如下：

以第一次聚类过程中任意一个聚类簇为例，将该聚类簇内的聚类中心与该聚类簇内所有水利物料数据点之间欧式距离的方差记为该聚类簇的分裂程度，获取所有聚类簇的分裂程度；将所有聚类簇按照分裂程度进行降序排列，将排列后的序列记为聚类簇序列；将该聚类簇序列中相邻的任意两个聚类簇之间分裂程度的差值的绝对值记为参考分裂值，获取所有参考分裂值；将数值最大的参考分裂值对应的两个聚类簇中的第二个聚类簇记为待分裂终止聚类簇；在该聚类簇序列中，将该待分裂终止聚类簇左侧的每个聚类簇均记为待分裂聚类簇。其中根据聚类中心对数据进行聚类的过程是ISODATA迭代自组织聚类算法的公知内容，本实施例不再赘述；每个参考分裂值对应两个聚类簇。

进一步的，将任意一个待分裂聚类簇中任意一个水利物料数据点记为第一目标水利物料数据点；在该待分裂聚类簇中，将与第一目标水利物料数据点所属同一个物料种类的所有水利物料数据点构成的序列，记为第一目标水利物料数据点的同物料数据点序列。其中每个待聚类簇包含多个水利物料数据点，每个水利物料数据点对应一个同物料数据点序列，每个同物料数据点序列包含多个水利物料数据点，每个水利物料数据点对应一个使用次数。

进一步的，根据第一目标水利物料数据点的同物料数据点序列中相邻水利物料数据点对应使用次数之间的差异变化，得到第一目标水利物料数据点的水利工程变化连贯性。作为一种示例，可通过如下公式计算第一目标水利物料数据点的水利工程变化连贯性：

式中，表示第一目标水利物料数据点的水利工程变化连贯性；/>表示第一目标水利物料数据点的同物料数据点序列中所有水利物料数据点的数量；/>表示第/>个水利物料数据点对应的使用次数；/>表示第/>个水利物料数据点对应的使用次数；/>表示以自然常数为底的指数函数，实施例采用/>模型来呈现反比例关系及归一化处理，/>为模型的输入，实施者可根据实际情况选择反比例函数及归一化函数。其中若第一目标水利物料数据点的水利工程变化连贯性越大，说明该待分裂聚类簇中第一目标水利物料数据点所属的物料种类在水利施工过程中变化趋势越平滑，反映第一目标水利物料数据点越有可能作为下一次聚类过程的聚类中心。

进一步的，根据第一目标水利物料数据点的同物料数据点序列中不同水利物料数据点与第一目标水利物料数据点之间的欧式距离、第一目标水利物料数据点的水利工程变化连贯性以及物料数据综合密集度，得到第一目标水利物料数据点的中心选取度。作为一种示例，可通过如下公式计算第一目标水利物料数据点的中心选取度：

式中，表示第一目标水利物料数据点的中心选取度；/>表示第一目标水利物料数据点的物料数据综合密集度；/>表示第一目标水利物料数据点的水利工程变化连贯性；/>表示第一目标水利物料数据点的同物料数据点序列中所有水利物料数据点的数量；/>表示第/>个水利物料数据点与第一目标水利物料数据点的欧式距离；/>表示以自然常数为底的指数函数，实施例采用/>模型来呈现反比例关系及归一化处理，/>为模型的输入，实施者可根据实际情况选择反比例函数及归一化函数。其中若第一目标水利物料数据点的中心选取度越大，说明在该待分裂聚类簇中，第一目标水利物料数据点与周围水利物料数据点之间分布趋势越明显，反映第一目标水利物料数据点越有利于表达后续的异常检测结果。获取所有水利物料数据点的中心选取度。

进一步的，将所有水利物料数据点按照中心选取度进行降序排列，将排列后的序列记为中心水利物料数据点序列；以中心水利物料数据点序列中相邻的任意两个水利物料数据点为例，在这两个水利物料数据点中，将每个水利物料数据点与该待分裂聚类簇内的聚类中心的欧式距离记为每个水利物料数据点的中心参考距离，将这两个水利物料数据点的参考距离的和记为这两个水利物料数据点的中心对照距离，获取任意两个水利物料数据点的中心对照距离；将数值最大的中心对照距离对应的两个水利物料数据点均记为待分配聚类中心，获取所有待分配聚类中心，将每个待分配聚类中心作为第二次聚类过程中的聚类中心。其中每个中心对照距离对应两个水利物料数据点。

至此，通过上述方法得到第二次聚类过程中的若干聚类中心。

进一步的，参考根据第一次聚类过程中的若干聚类簇，得到第二次聚类过程中的若干聚类中心的具体获取过程；不断将最新聚类过程的聚类中心输入ISODATA迭代自组织聚类算法进行迭代聚类，直至最新聚类过程获取的若干聚类簇与其上一次聚类过程获取的若干聚类簇并没有变化时停止聚类，获取最新聚类过程的所有聚类簇，并将每个聚类簇记为最终水利自适应聚类簇。其中根据聚类中心进行迭代聚类的过程是ISODATA迭代自组织聚类算法的公知内容，本实施例不再赘述。

至此，通过上述方法得到所有最终水利自适应聚类簇。

步骤S004：根据最终水利自适应聚类簇进行异常检测。

具体的，根据所有最终水利自适应聚类簇获取若干异常数据点，将所有异常数据点对应实际用料数据以及剩余用料数据均记为异常数据，使用BIM模型对异常数据进行核对，将核对后不匹配的异常数据删除，将删除后剩余的实际用料数据以及剩余用料数据重新存储在新的数据库中，完成对水利工程施工数据的管理。其中根据最终水利自适应聚类簇获取异常数据点的过程是CBLOF基于局部离群因子的聚类离群因子算法的公知内容，利用BIM模型对异常数据进行核对的过程是BIM模型的公知内容，本实施例不再赘述。

至此，本实施例完成。

以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种水利工程施工用BIM模型数据管理方法，其特征在于，该方法包括以下步骤：

采集若干物料种类的若干水利物料数据点，一个水利物料数据点对应一个使用次数；

根据最终水利自适应聚类簇进行异常检测；

所述根据同一物料种类下水利物料数据点整体的使用次数的变化连续情况、物料数据综合密集度以及初始聚类中心点，得到每个水利物料数据点的中心选取度，包括的具体方法为：

根据第一目标水利物料数据点的同物料数据点序列中不同水利物料数据点与第一目标水利物料数据点之间的欧式距离、第一目标水利物料数据点的水利工程变化连贯性以及物料数据综合密集度，得到第一目标水利物料数据点的中心选取度；

所述根据第一目标水利物料数据点的同物料数据点序列中相邻水利物料数据点对应使用次数之间的差异变化，得到第一目标水利物料数据点的水利工程变化连贯性，包括的具体方法为：

在第一目标水利物料数据点的同物料数据点序列中，将相邻的任意两个水利物料数据点之间对应使用次数的差值的绝对值，记为第一绝对值；将所有第一绝对值的均值记为第一均值；将第一均值的反比例归一化值记为第一目标水利物料数据点的水利工程变化连贯性；

所述根据第一目标水利物料数据点的同物料数据点序列中不同水利物料数据点与第一目标水利物料数据点之间的欧式距离、第一目标水利物料数据点的水利工程变化连贯性以及物料数据综合密集度，得到第一目标水利物料数据点的中心选取度，包括的具体方法为：

2.根据权利要求1所述一种水利工程施工用BIM模型数据管理方法，其特征在于，所述根据水利物料数据点与周围水利物料数据点之间距离的差异分布情况，得到每个水利物料数据点的物料数据综合密集度，包括的具体方法为：

3.根据权利要求1所述一种水利工程施工用BIM模型数据管理方法，其特征在于，所述根据物料数据综合密集度从多个水利物料数据点中，筛选出若干初始聚类中心点，包括的具体方法为：

4.根据权利要求3所述一种水利工程施工用BIM模型数据管理方法，其特征在于，所述根据目标待筛选聚类中心点的每个对照待筛选聚类中心点与目标待筛选聚类中心点的距离关系，得到参考判定距离阈值，包括的具体方法为：

5.根据权利要求1所述一种水利工程施工用BIM模型数据管理方法，其特征在于，所述根据中心选取度从初始聚类中心点中，筛选出若干聚类过程的若干聚类中心，包括的具体方法为：

6.根据权利要求1所述一种水利工程施工用BIM模型数据管理方法，其特征在于，所述根据聚类中心对所有水利物料数据点进行聚类得到若干最终水利自适应聚类簇，包括的具体方法为：

7.根据权利要求1所述一种水利工程施工用BIM模型数据管理方法，其特征在于，所述根据最终水利自适应聚类簇进行异常检测，包括的具体方法为：