CN117874690A

CN117874690A - 一种地理信息测绘数据智能管理方法

Info

Publication number: CN117874690A
Application number: CN202410283271.6A
Authority: CN
Inventors: 侯政彰; 何孟桥; 解际迎; 朱淑芹
Original assignee: Shandong Institute of Geological Surveying and Mapping
Current assignee: Shandong Institute of Geological Surveying and Mapping
Priority date: 2024-03-13
Filing date: 2024-03-13
Publication date: 2024-04-12
Anticipated expiration: 2044-03-13
Also published as: CN117874690B

Abstract

本发明涉及数据处理技术领域，具体涉及一种地理信息测绘数据智能管理方法，包括：获取待检测区域的点云数据；获取每个地理信息测绘数据点的多维属性显著程度，获取调整后的点云数据；对调整后的点云数据中所有地理信息测绘数据点进行若干次聚类，获取初始聚类簇集合和若干次聚类过程的若干个聚类簇；根据每个聚类簇的误差可接受程度，获取初始聚类簇集合的目标簇；根据每个地理信息测绘数据点目标簇的中心之间的距离，获取每个地理信息测绘数据点的修正后CBLOF因子；根据修正后CBLOF因子对所有地理信息测绘数据点进行异常检测。本发明提高了地理信息测绘数据异常检测的准确性。

Description

一种地理信息测绘数据智能管理方法

技术领域

本发明涉及数据处理技术领域，具体涉及一种地理信息测绘数据智能管理方法。

背景技术

由于地理信息测绘数据包含目标地理区域的多类型属性数据化信息，可广泛应用于城市规划、土地管理、环境保护、公共安全等领域；因此地理信息测绘数据的准确性和完整性直接影响后续应用的结果，因此需要对地理信息测绘多类型属性数据进行数据完整性验证，以减少数据测绘采集、存储过程造成的错误，提高数据质量和可靠性。

通过现有技术基于聚类的局部异常因子检测算法对地理信息测绘数据进行异常数据检测处理，可以有效提取出地理空间位置上异常数据的位置信息，便于实现地理信息测绘数据的完整性验证；但利用基于聚类的局部异常因子检测算法对地理信息测绘数据进行异常数据检测的过程中，其地理空间位置上的数据点往往存在多维度属性数据，其维度属性数据的显著程度对所有地理信息测绘数据点的异常状况表现的影响不同，使得难以实现基于聚类的局部异常因子检测算法的突降规则的区分度的调整，进而降低了地理信息测绘数据异常检测的准确性。

发明内容

为了解决上述问题，本发明提供一种地理信息测绘数据智能管理方法，所述方法包括：

获取待检测区域的点云数据；所述点云数据包括若干个地理信息测绘数据点，每个地理信息测绘数据点包括若干个维度属性数据；

根据每个地理信息测绘数据点的不同维度属性数据与所有地理信息测绘数据点的不同维度属性数据之间整体数值大小的差异，获取每个地理信息测绘数据点的多维属性显著程度；根据任意两个地理信息测绘数据点之间多维属性显著程度的差异，对点云数据中所有地理信息测绘数据点进行调整，获取调整后的点云数据；

对调整后的点云数据中所有地理信息测绘数据点进行若干次聚类，获取初始聚类簇集合和若干次聚类过程的若干个聚类簇，所述初始聚类簇集合包括若干个聚类簇；根据初始聚类簇集合中每个聚类簇中地理信息测绘数据点的多维属性显著程度，获取初始聚类簇集合中每个聚类簇的误差可接受程度；根据每个聚类簇的误差可接受程度，获取初始聚类簇集合的目标簇；根据每个地理信息测绘数据点目标簇的中心之间的距离，获取每个地理信息测绘数据点的修正后CBLOF因子；

根据修正后CBLOF因子对所有地理信息测绘数据点进行异常检测。

优选的，所述根据每个地理信息测绘数据点的不同维度属性数据与所有地理信息测绘数据点的不同维度属性数据之间整体数值大小的差异，获取每个地理信息测绘数据点的多维属性显著程度，包括的具体方法为：

根据每个地理信息测绘数据点的每个维度属性数据与所有地理信息测绘数据点的每个维度属性数据的均值的差异，获取每个地理信息测绘数据点的每个维度属性数据的属性差异；

根据每个地理信息测绘数据点不同维度属性数据的属性差异，获取每个地理信息测绘数据点的多维属性显著因子；

获取所有地理信息测绘数据点的多维属性显著因子，将所有多维属性显著因子进行线性归一化后的每个多维属性显著因子记为多维属性显著程度。

优选的，所述根据每个地理信息测绘数据点的每个维度属性数据与所有地理信息测绘数据点的每个维度属性数据的均值的差异，获取每个地理信息测绘数据点的每个维度属性数据的属性差异，包括的具体方法为：

将所有地理信息测绘数据点的第个维度属性数据的均值记为第一均值；

对于任意一个地理信息测绘数据点，将地理信息测绘数据点的第个维度属性数据与第一均值的差值的绝对值，记为第一绝对值；将第一绝对值与第一均值的比值，作为地理信息测绘数据点的第/>个维度属性数据的属性差异。

优选的，所述根据每个地理信息测绘数据点不同维度属性数据的属性差异，获取每个地理信息测绘数据点的多维属性显著因子，包括的具体方法为：

对于任意一个地理信息测绘数据点，将地理信息测绘数据点的所有维度属性数据的属性差异的均值记为第二均值；

将地理信息测绘数据点的第个维度属性数据的属性差异与第二均值的比值，记为第一比值；将1与第一比值的差值的绝对值，记为地理信息测绘数据点的第/>个维度属性数据的第二绝对值；将地理信息测绘数据点的所有维度属性数据的第二绝对值的均值，作为地理信息测绘数据点的多维属性显著因子。

优选的，所述根据任意两个地理信息测绘数据点之间多维属性显著程度的差异，对点云数据中所有地理信息测绘数据点进行调整，获取调整后的点云数据，包括的具体方法为：

根据任意两个地理信息测绘数据点之间多维属性显著程度的差异，获取任意两个地理信息测绘数据点之间调整后的欧式距离；

根据点云数据中任意两个地理信息测绘数据点之间调整后的欧式距离，对点云数据中所有地理信息测绘数据点进行调整，获取调整后的点云数据。

优选的，所述根据任意两个地理信息测绘数据点之间多维属性显著程度的差异，获取任意两个地理信息测绘数据点之间调整后的欧式距离，包括的具体方法为：

对于第个地理信息测绘数据点与第/>个地理信息测绘数据点，将第/>个地理信息测绘数据点的多维属性显著程度与第/>个地理信息测绘数据点的多维属性显著程度的差值的绝对值，记为第三绝对值；将第/>个地理信息测绘数据点与第/>个地理信息测绘数据点之间的欧式距离与第三绝对值的乘积，作为第/>个地理信息测绘数据点与第/>个地理信息测绘数据点之间调整后的欧式距离。

优选的，所述对调整后的点云数据中所有地理信息测绘数据点进行若干次聚类，获取初始聚类簇集合和若干次聚类过程的若干个聚类簇，包括的具体方法为：

预设三个参数，将调整后的点云数据中所有任意两个地理信息测绘数据点之间的欧式距离的最大值，作为点云数据的数据点分布长度；将点云数据的数据点分布长度与/>的乘积作为邻域参数输入密度聚类算法中，获取若干个聚类簇，并将所有聚类簇组成初始聚类簇集合；将点云数据的数据点分布长度与/>的乘积，记为第一次聚类参数，并将第一次聚类参数作为邻域参数输入密度聚类算法中对调整后的点云数据进行聚类，获取第一次聚类过程的若干个聚类簇，并将所有聚类簇组成初始聚类簇集合；将点云数据的数据点分布长度与/>的乘积，记为聚类步长；将聚类步长与第一次聚类参数的和，记为第二次聚类参数，并将第二次聚类参数作为新的邻域参数输入密度聚类算法中对调整后的点云数据进行聚类，获取第二次聚类过程的若干个聚类簇；以此类推，直至最新邻域参数等于点云数据的数据点分布长度与/>的乘积，停止聚类，得到若干次聚类过程的若干个聚类簇。

优选的，所述根据初始聚类簇集合中每个聚类簇中地理信息测绘数据点的多维属性显著程度，获取初始聚类簇集合中每个聚类簇的误差可接受程度，包括的具体方法为：

获取初始聚类簇集合中第个聚类簇的误差可接受因子的计算方法为：

式中，表示初始聚类簇集合中第/>个聚类簇的误差可接受因子；/>表示初始聚类簇集合中第/>个聚类簇，在第/>次聚类过程中对应聚类簇内所有地理信息测绘数据点的总数量；/>表示初始聚类簇集合中第/>个聚类簇，在第/>次聚类过程中对应聚类簇内所有地理信息测绘数据点的多维属性显著程度的均值；/>表示初始聚类簇集合中第/>个聚类簇，在第/>次聚类过程中对应聚类簇内所有地理信息测绘数据点的总数量；表示初始聚类簇集合中第/>个聚类簇，在第/>次聚类过程中对应聚类簇内所有地理信息测绘数据点的多维属性显著程度的均值；/>表示预设参数；/>表示取绝对值；

获取初始聚类簇集合中所有聚类簇的误差可接受因子，将所有误差可接受因子进行线性归一化后的每个误差可接受因子记为误差可接受程度。

优选的，所述根据每个聚类簇的误差可接受程度，获取初始聚类簇集合的目标簇，包括的具体方法为：

预设一个规整参数，将初始聚类簇集合中所有聚类簇按照误差可接受程度，从大到小进行排序，获得排序后的初始聚类簇集合；若排序后的初始聚类簇集合中第一个聚类簇内所有地理信息测绘数据点的总数量，与排序后的初始聚类簇集合中除第一个聚类簇以外的所有其他所有聚类簇内所有地理信息测绘数据点的总数量之和，的比值小于规整参数，将排序后的初始聚类簇集合中第一个聚类簇和第二个聚类簇进行合并，并记为目标簇；若目标簇内所有地理信息测绘数据点的总数量，与排序后的初始聚类簇集合中除目标簇以外的所有其他聚类簇内所有地理信息测绘数据点的总数量之和，的比值小于规整参数/>，将排序后的初始聚类簇集合中第一个聚类簇、第二个聚类簇和第三个聚类簇进行合并，并记为目标簇；以此类推，直至最新的目标簇内所有地理信息测绘数据点的总数量，与排序后的初始聚类簇集合中除目标簇以外的所有其他聚类簇内所有地理信息测绘数据点的总数量之和，的比值大于或等于规整参数/>，停止合并，获取初始聚类簇集合的目标簇。

优选的，所述根据每个地理信息测绘数据点目标簇的中心之间的距离，获取每个地理信息测绘数据点的修正后CBLOF因子，包括的具体方法为：

将第个地理信息测绘数据点所属聚类簇的误差可接受程度与初始聚类簇集合的目标簇内所有聚类簇的误差可接受程度的均值的比值，记为第二比值；将1与第二比值的差值的绝对值，记为第四绝对值，将第四绝对值与第/>个地理信息测绘数据点到初始聚类簇集合的目标簇的中心之间欧氏距离的乘积，作为第/>个地理信息测绘数据点的修正后CBLOF因子。

本发明的技术方案的有益效果是：本发明根据任意两个地理信息测绘数据点之间多维属性显著程度的差异，对点云数据中所有地理信息测绘数据点进行调整，获取调整后的点云数据，以此获取不同维度属性数据的显著程度对所有地理信息测绘数据点的异常状况表现的影响；根据每个聚类簇的误差可接受程度，获取初始聚类簇集合的目标簇；根据每个地理信息测绘数据点目标簇的中心之间的距离，获取每个地理信息测绘数据点的修正后CBLOF因子，以此实现基于聚类的局部异常因子检测算法的突降规则的区分度的调整，进而提高了地理信息测绘数据异常检测的准确性。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明一种地理信息测绘数据智能管理方法的步骤流程图；

图2为本发明一种地理信息测绘数据智能管理方法的特征关系流程图。

具体实施方式

为了更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效，以下结合附图及较佳实施例，对依据本发明提出的一种地理信息测绘数据智能管理方法，其具体实施方式、结构、特征及其功效，详细说明如下。在下述说明中，不同的“一个实施例”或“另一个实施例”指的不一定是同一实施例。此外，一或多个实施例中的特定特征、结构或特点可由任何合适形式组合。

除非另有定义，本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。

下面结合附图具体的说明本发明所提供的一种地理信息测绘数据智能管理方法的具体方案。

请参阅图1，其示出了本发明一个实施例提供的一种地理信息测绘数据智能管理方法的步骤流程图，该方法包括以下步骤：

步骤S001：获取待检测区域的点云数据；所述点云数据包括若干个地理信息测绘数据点，每个地理信息测绘数据点包括若干个维度属性数据。

需要说明的是，在利用地理信息测绘装置进行地理信息测绘多维信息数据获取的过程中，多维信息各自获取方式各不相同，也即不同维度信息数据的采集方式采用不同的地理信息测绘装置。

具体的，首先，采集待检测区域中若干个地理信息测绘数据点形成待检测区域的点云数据，具体过程为：

对于点云数据中任意一个地理信息测绘数据点，该地理信息测绘数据点为包括空间位置信息数据、海拔高度信息数据、路况指标信息数据、区间车流量信息数据和植被覆盖信息数据的五个维度属性数据。

其中，空间位置信息数据利用无人机航拍检测，海拔高度信息数据利用GPS卫星定位系统获取，路况指标信息数据利用钻芯取样获取，区间车流量信息数据利用待检测区域内的交通系统获取，植被覆盖信息数据利用遥感影像解译获取；点云数据包括若干个地理信息测绘数据点，每个地理信息测绘数据点包括若干个维度属性数据；请参阅图2，其示出了一种地理信息测绘数据智能管理方法的特征关系流程图。

至此，通过上述方法得到待检测区域的点云数据。

步骤S002：根据每个地理信息测绘数据点的不同维度属性数据与所有地理信息测绘数据点的不同维度属性数据之间整体数值大小的差异，获取每个地理信息测绘数据点的多维属性显著程度；根据任意两个地理信息测绘数据点之间多维属性显著程度的差异，对点云数据中所有地理信息测绘数据点进行调整，获取调整后的点云数据。

需要说明的是，在利用基于聚类的局部异常因子检测算法对待检测区域的点云数据进行聚类的异常度分析的过程中，其聚类算法可采用基于密度的聚类算法，其点云数据中地理信息测绘数据点的相似度度量除了与地理信息测绘数据点之间的欧式距离有关外，还受到地理信息测绘数据点的维度属性数据的差异度影响，反映到地理信息测绘数据点的若干个维度属性数据的差异对地理信息测绘数据点间相似度的影响；并且地理信息测绘数据点间的相似度的区分度与待检测区域内地理信息测绘数据点的分布特征相关，当地理信息测绘数据点由于地理结构特征趋于聚集性分布时，其多维度属性差异加权的欧式距离对异常状况的区分度就比较小，因此需要根据待检测区域内地理信息测绘数据点的分布特征及地理信息测绘数据点的多维度属性数据差异，来获取区域的误差可接受程度，用于后续聚类簇突降规则的区分度的调整。

具体的，根据每个地理信息测绘数据点的每个维度属性数据与所有地理信息测绘数据点的每个维度属性数据的均值的差异，获取每个地理信息测绘数据点的每个维度属性数据的属性差异。

作为一种示例，获取每个地理信息测绘数据点的第个维度属性数据的属性差异的计算方法为：

式中，表示任意一个地理信息测绘数据点的第/>个维度属性数据的属性差异；/>表示地理信息测绘数据点的第/>个维度属性数据；/>表示所有地理信息测绘数据点的第/>个维度属性数据的均值；/>表示取绝对值。

进一步的，根据每个地理信息测绘数据点不同维度属性数据的属性差异，获取每个地理信息测绘数据点的多维属性显著程度。

作为一种示例，获取每个地理信息测绘数据点的多维属性显著因子的计算方法为：

式中，表示任意一个地理信息测绘数据点的多维属性显著因子；/>表示地理信息测绘数据点的所有维度属性数据的总数量；/>表示地理信息测绘数据点的第/>个维度属性数据的属性差异；/>表示地理信息测绘数据点的所有维度属性数据的属性差异的均值；/>表示取绝对值。

进一步的，获取所有地理信息测绘数据点的多维属性显著因子，将所有多维属性显著因子进行线性归一化后的每个多维属性显著因子记为多维属性显著程度。

需要说明的是，由于地理信息测绘数据点的多维属性显著程度是基于地理信息测绘数据点的维度属性相关关系体现的显著特征，而地理信息测绘数据点会因为待检测区域的特征分布存在结构性聚集，例如：待检测区域的建筑区域中的地理信息测绘数据点分布于建筑区域的不同结构性外观的表面分布，道路区域则沿着道路延伸方向分布于道路表面，则地理信息测绘数据点会在聚类过程中表现出结构性分布特征，导致后续密度聚类算法对聚类簇的形态分布发生相应的变化；因此在利用基于密度的聚类算法对点云数据进行聚类分析的过程中，衡量地理信息测绘数据点间相似度的欧氏距离采用多维属性显著程度差异进行加权。

具体的，根据任意两个地理信息测绘数据点之间多维属性显著程度的差异，获取任意两个地理信息测绘数据点之间调整后的欧式距离。

作为一种示例，对于第个地理信息测绘数据点与第/>个地理信息测绘数据点，获取第/>个地理信息测绘数据点与第/>个地理信息测绘数据点之间调整后的欧式距离的计算方法为：

式中，表示第/>个地理信息测绘数据点与第/>个地理信息测绘数据点之间调整后的欧式距离；/>表示第/>个地理信息测绘数据点与第/>个地理信息测绘数据点之间的欧式距离；/>表示第/>个地理信息测绘数据点的多维属性显著程度；/>表示第/>个地理信息测绘数据点的多维属性显著程度；/>表示取绝对值。

进一步的，根据点云数据中任意两个地理信息测绘数据点之间调整后的欧式距离，对点云数据中所有地理信息测绘数据点进行调整，获取调整后的点云数据。

至此，通过上述方法得到调整后的点云数据。

步骤S003：对调整后的点云数据中所有地理信息测绘数据点进行若干次聚类，获取初始聚类簇集合和若干次聚类过程的若干个聚类簇，所述初始聚类簇集合包括若干个聚类簇；根据初始聚类簇集合中每个聚类簇中地理信息测绘数据点的多维属性显著程度，获取初始聚类簇集合中每个聚类簇的误差可接受程度；根据每个聚类簇的误差可接受程度，获取初始聚类簇集合的目标簇；根据每个地理信息测绘数据点目标簇的中心之间的距离，获取每个地理信息测绘数据点的修正后CBLOF因子。

需要说明的是，由于数据点的结构性分布可表现为聚类簇的形态特征，并且呈现出显著的聚集态分布，主要表现为不受聚类算法参数较大的影响，因此对于数据点的显著变化特征而言，其数据点在多次聚类的尺度下的结构性分布特征会呈现出稳定的区域性变化，即位于同一地理测绘区域结构上的数据点的显著变化特征会趋于一致，这是由于地理区域的相关物理及性质相同决定的，其表征的是数据点显著变化特征的可信度，总体变化越小的表明结构分布特征越稳定，则其数据点显著变化越突出，其数据点属于异常数据点的可能性越大；因此需要对调整后的点云数据进行不同邻域参数的聚类。

预设三个参数，其中本实施例以/>为例进行叙述，本实施例不进行具体限定，其中/>根据具体实施情况而定。

具体的，将调整后的点云数据中所有任意两个地理信息测绘数据点之间的欧式距离的最大值，作为点云数据的数据点分布长度；将点云数据的数据点分布长度与的乘积作为邻域参数输入密度聚类算法中，获取若干个聚类簇，并将所有聚类簇组成初始聚类簇集合；将点云数据的数据点分布长度与/>的乘积，记为第一次聚类参数，并将第一次聚类参数作为邻域参数输入密度聚类算法中对调整后的点云数据进行聚类，获取第一次聚类过程的若干个聚类簇，并将所有聚类簇组成初始聚类簇集合；将点云数据的数据点分布长度与/>的乘积，记为聚类步长；将聚类步长与第一次聚类参数的和，记为第二次聚类参数，并将第二次聚类参数作为新的邻域参数输入密度聚类算法中对调整后的点云数据进行聚类，获取第二次聚类过程的若干个聚类簇；将聚类步长与第二次聚类参数的和，记为第三次聚类参数，并将第三次聚类参数作为新的邻域参数输入密度聚类算法中对调整后的点云数据进行聚类，获取第三次聚类过程的若干个聚类簇；以此类推，直至最新邻域参数等于点云数据的数据点分布长度与/>的乘积，停止聚类，得到若干次聚类过程的若干个聚类簇。

其中，根据邻域参数进行聚类的过程是密度聚类算法的公知内容，本实施例此处，不作过多赘述。

需要说明的是，初始聚类簇集合中任意一个聚类簇中所有地理信息测绘数据点，均全部对应在任意一次聚类过程的某一个聚类簇中。

对于初始聚类簇集合中任意一个聚类簇，根据初始聚类簇集合中每个聚类簇中地理信息测绘数据点的多维属性显著程度，获取初始聚类簇集合中每个聚类簇的误差可接受因子。

作为一种示例，获取初始聚类簇集合中第个聚类簇的误差可接受因子的计算方法为：

式中，表示初始聚类簇集合中第/>个聚类簇的误差可接受因子；/>表示初始聚类簇集合中第/>个聚类簇，在第/>次聚类过程中对应聚类簇内所有地理信息测绘数据点的总数量；/>表示初始聚类簇集合中第/>个聚类簇，在第/>次聚类过程中对应聚类簇内所有地理信息测绘数据点的多维属性显著程度的均值；/>表示初始聚类簇集合中第个聚类簇，在第/>次聚类过程中对应聚类簇内所有地理信息测绘数据点的总数量；/>表示初始聚类簇集合中第/>个聚类簇，在第/>次聚类过程中对应聚类簇内所有地理信息测绘数据点的多维属性显著程度的均值；/>表示预设参数；/>表示取绝对值；/>表示所有次聚类过程的总数量。

进一步的，获取初始聚类簇集合中所有聚类簇的误差可接受因子，将所有误差可接受因子进行线性归一化后的每个误差可接受因子记为误差可接受程度。

至此，获得初始聚类簇集合中每个聚类簇的误差可接受程度。

需要说明的是，根据获得初始聚类簇集合中每个聚类簇的误差可接受程度，计算调整后的点云数据的CBLOF因子的过程中，地理信息测绘数据点到目标簇的距离表征的是地理信息测绘数据点的离群度，则调整后的点云数据的初始聚类簇集合中每个聚类簇的误差可接受程度影响着，基于聚类的局部异常因子检测算法中突降规则下的因子区分度。

预设一个规整参数，其中本实施例以/>为例进行叙述，本实施例不进行具体限定，其中/>根据具体实施情况而定。

具体的，将初始聚类簇集合中所有聚类簇按照误差可接受程度，从大到小进行排序，获得排序后的初始聚类簇集合；若排序后的初始聚类簇集合中第一个聚类簇内所有地理信息测绘数据点的总数量，与排序后的初始聚类簇集合中除第一个聚类簇以外的所有其他所有聚类簇内所有地理信息测绘数据点的总数量之和，的比值小于规整参数，将排序后的初始聚类簇集合中第一个聚类簇和第二个聚类簇进行合并，并记为目标簇；若目标簇内所有地理信息测绘数据点的总数量，与排序后的初始聚类簇集合中除目标簇以外的所有其他聚类簇内所有地理信息测绘数据点的总数量之和，的比值小于规整参数/>，将排序后的初始聚类簇集合中第一个聚类簇、第二个聚类簇和第三个聚类簇进行合并，并记为目标簇；以此类推，直至最新的目标簇内所有地理信息测绘数据点的总数量，与排序后的初始聚类簇集合中除目标簇以外的所有其他聚类簇内所有地理信息测绘数据点的总数量之和，的比值大于或等于规整参数/>，停止合并，获取初始聚类簇集合的目标簇。

根据每个地理信息测绘数据点目标簇的中心之间的距离，获取每个地理信息测绘数据点的修正后CBLOF因子。

作为一种示例，获取第个地理信息测绘数据点的修正后CBLOF因子的计算方法为：

式中，表示第/>个地理信息测绘数据点的修正后CBLOF因子；/>表示第/>个地理信息测绘数据点所属聚类簇的误差可接受程度；/>表示初始聚类簇集合的目标簇内所有聚类簇的误差可接受程度的均值；/>表示第/>个地理信息测绘数据点到初始聚类簇集合的目标簇的中心之间欧氏距离；/>表示取绝对值。

至此，通过上述方法得到所有地理信息测绘数据点的修正后CBLOF因子。

步骤S004：根据修正后CBLOF因子对所有地理信息测绘数据点进行异常检测。

具体的，将所有地理信息测绘数据点的修正后CBLOF因子输入基于聚类的局部异常因子检测算法中，对所有地理信息测绘数据点进行异常检测，获取所有异常地理信息测绘数据点，并将其存储至数据库中。

其中，根据CBLOF因子进行异常检测的过程是基于聚类的局部异常因子检测算法的公知内容，本实施例此处，不作过多赘述。

至此，本实施例完成。

以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种地理信息测绘数据智能管理方法，其特征在于，该方法包括以下步骤：

2.根据权利要求1所述一种地理信息测绘数据智能管理方法，其特征在于，所述根据每个地理信息测绘数据点的不同维度属性数据与所有地理信息测绘数据点的不同维度属性数据之间整体数值大小的差异，获取每个地理信息测绘数据点的多维属性显著程度，包括的具体方法为：

3.根据权利要求2所述一种地理信息测绘数据智能管理方法，其特征在于，所述根据每个地理信息测绘数据点的每个维度属性数据与所有地理信息测绘数据点的每个维度属性数据的均值的差异，获取每个地理信息测绘数据点的每个维度属性数据的属性差异，包括的具体方法为：

4.根据权利要求2所述一种地理信息测绘数据智能管理方法，其特征在于，所述根据每个地理信息测绘数据点不同维度属性数据的属性差异，获取每个地理信息测绘数据点的多维属性显著因子，包括的具体方法为：

5.根据权利要求1所述一种地理信息测绘数据智能管理方法，其特征在于，所述根据任意两个地理信息测绘数据点之间多维属性显著程度的差异，对点云数据中所有地理信息测绘数据点进行调整，获取调整后的点云数据，包括的具体方法为：

6.根据权利要求5所述一种地理信息测绘数据智能管理方法，其特征在于，所述根据任意两个地理信息测绘数据点之间多维属性显著程度的差异，获取任意两个地理信息测绘数据点之间调整后的欧式距离，包括的具体方法为：

7.根据权利要求1所述一种地理信息测绘数据智能管理方法，其特征在于，所述对调整后的点云数据中所有地理信息测绘数据点进行若干次聚类，获取初始聚类簇集合和若干次聚类过程的若干个聚类簇，包括的具体方法为：

预设三个参数，将调整后的点云数据中所有任意两个地理信息测绘数据点之间的欧式距离的最大值，作为点云数据的数据点分布长度；将点云数据的数据点分布长度与的乘积作为邻域参数输入密度聚类算法中，获取若干个聚类簇，并将所有聚类簇组成初始聚类簇集合；将点云数据的数据点分布长度与/>的乘积，记为第一次聚类参数，并将第一次聚类参数作为邻域参数输入密度聚类算法中对调整后的点云数据进行聚类，获取第一次聚类过程的若干个聚类簇，并将所有聚类簇组成初始聚类簇集合；将点云数据的数据点分布长度与/>的乘积，记为聚类步长；将聚类步长与第一次聚类参数的和，记为第二次聚类参数，并将第二次聚类参数作为新的邻域参数输入密度聚类算法中对调整后的点云数据进行聚类，获取第二次聚类过程的若干个聚类簇；以此类推，直至最新邻域参数等于点云数据的数据点分布长度与/>的乘积，停止聚类，得到若干次聚类过程的若干个聚类簇。

8.根据权利要求1所述一种地理信息测绘数据智能管理方法，其特征在于，所述根据初始聚类簇集合中每个聚类簇中地理信息测绘数据点的多维属性显著程度，获取初始聚类簇集合中每个聚类簇的误差可接受程度，包括的具体方法为：

9.根据权利要求1所述一种地理信息测绘数据智能管理方法，其特征在于，所述根据每个聚类簇的误差可接受程度，获取初始聚类簇集合的目标簇，包括的具体方法为：

预设一个规整参数，将初始聚类簇集合中所有聚类簇按照误差可接受程度，从大到小进行排序，获得排序后的初始聚类簇集合；若排序后的初始聚类簇集合中第一个聚类簇内所有地理信息测绘数据点的总数量，与排序后的初始聚类簇集合中除第一个聚类簇以外的所有其他所有聚类簇内所有地理信息测绘数据点的总数量之和，的比值小于规整参数/>，将排序后的初始聚类簇集合中第一个聚类簇和第二个聚类簇进行合并，并记为目标簇；若目标簇内所有地理信息测绘数据点的总数量，与排序后的初始聚类簇集合中除目标簇以外的所有其他聚类簇内所有地理信息测绘数据点的总数量之和，的比值小于规整参数/>，将排序后的初始聚类簇集合中第一个聚类簇、第二个聚类簇和第三个聚类簇进行合并，并记为目标簇；以此类推，直至最新的目标簇内所有地理信息测绘数据点的总数量，与排序后的初始聚类簇集合中除目标簇以外的所有其他聚类簇内所有地理信息测绘数据点的总数量之和，的比值大于或等于规整参数/>，停止合并，获取初始聚类簇集合的目标簇。

10.根据权利要求1所述一种地理信息测绘数据智能管理方法，其特征在于，所述根据每个地理信息测绘数据点目标簇的中心之间的距离，获取每个地理信息测绘数据点的修正后CBLOF因子，包括的具体方法为：