CN117874690B - 一种地理信息测绘数据智能管理方法 - Google Patents

一种地理信息测绘数据智能管理方法 Download PDF

Info

Publication number
CN117874690B
CN117874690B CN202410283271.6A CN202410283271A CN117874690B CN 117874690 B CN117874690 B CN 117874690B CN 202410283271 A CN202410283271 A CN 202410283271A CN 117874690 B CN117874690 B CN 117874690B
Authority
CN
China
Prior art keywords
geographic information
information mapping
mapping data
data
cluster
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202410283271.6A
Other languages
English (en)
Other versions
CN117874690A (zh
Inventor
侯政彰
何孟桥
解际迎
朱淑芹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong Institute of Geological Surveying and Mapping
Original Assignee
Shandong Institute of Geological Surveying and Mapping
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong Institute of Geological Surveying and Mapping filed Critical Shandong Institute of Geological Surveying and Mapping
Priority to CN202410283271.6A priority Critical patent/CN117874690B/zh
Publication of CN117874690A publication Critical patent/CN117874690A/zh
Application granted granted Critical
Publication of CN117874690B publication Critical patent/CN117874690B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/2433Single-class perspective, e.g. one-against-all classification; Novelty detection; Outlier detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/254Fusion techniques of classification results, e.g. of results related to same input data
    • G06F18/256Fusion techniques of classification results, e.g. of results related to same input data of results relating to different input data, e.g. multimodal recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及数据处理技术领域,具体涉及一种地理信息测绘数据智能管理方法,包括:获取待检测区域的点云数据;获取每个地理信息测绘数据点的多维属性显著程度,获取调整后的点云数据;对调整后的点云数据中所有地理信息测绘数据点进行若干次聚类,获取初始聚类簇集合和若干次聚类过程的若干个聚类簇;根据每个聚类簇的误差可接受程度,获取初始聚类簇集合的目标簇;根据每个地理信息测绘数据点目标簇的中心之间的距离,获取每个地理信息测绘数据点的修正后CBLOF因子;根据修正后CBLOF因子对所有地理信息测绘数据点进行异常检测。本发明提高了地理信息测绘数据异常检测的准确性。

Description

一种地理信息测绘数据智能管理方法
技术领域
本发明涉及数据处理技术领域,具体涉及一种地理信息测绘数据智能管理方法。
背景技术
由于地理信息测绘数据包含目标地理区域的多类型属性数据化信息,可广泛应用于城市规划、土地管理、环境保护、公共安全等领域;因此地理信息测绘数据的准确性和完整性直接影响后续应用的结果,因此需要对地理信息测绘多类型属性数据进行数据完整性验证,以减少数据测绘采集、存储过程造成的错误,提高数据质量和可靠性。
通过现有技术基于聚类的局部异常因子检测算法对地理信息测绘数据进行异常数据检测处理,可以有效提取出地理空间位置上异常数据的位置信息,便于实现地理信息测绘数据的完整性验证;但利用基于聚类的局部异常因子检测算法对地理信息测绘数据进行异常数据检测的过程中,其地理空间位置上的数据点往往存在多维度属性数据,其维度属性数据的显著程度对所有地理信息测绘数据点的异常状况表现的影响不同,使得难以实现基于聚类的局部异常因子检测算法的突降规则的区分度的调整,进而降低了地理信息测绘数据异常检测的准确性。
发明内容
为了解决上述问题,本发明提供一种地理信息测绘数据智能管理方法,所述方法包括:
获取待检测区域的点云数据;所述点云数据包括若干个地理信息测绘数据点,每个地理信息测绘数据点包括若干个维度属性数据;
根据每个地理信息测绘数据点的不同维度属性数据与所有地理信息测绘数据点的不同维度属性数据之间整体数值大小的差异,获取每个地理信息测绘数据点的多维属性显著程度;根据任意两个地理信息测绘数据点之间多维属性显著程度的差异,对点云数据中所有地理信息测绘数据点进行调整,获取调整后的点云数据;
对调整后的点云数据中所有地理信息测绘数据点进行若干次聚类,获取初始聚类簇集合和若干次聚类过程的若干个聚类簇,所述初始聚类簇集合包括若干个聚类簇;根据初始聚类簇集合中每个聚类簇中地理信息测绘数据点的多维属性显著程度,获取初始聚类簇集合中每个聚类簇的误差可接受程度;根据每个聚类簇的误差可接受程度,获取初始聚类簇集合的目标簇;根据每个地理信息测绘数据点目标簇的中心之间的距离,获取每个地理信息测绘数据点的修正后CBLOF因子;
根据修正后CBLOF因子对所有地理信息测绘数据点进行异常检测。
优选的,所述根据每个地理信息测绘数据点的不同维度属性数据与所有地理信息测绘数据点的不同维度属性数据之间整体数值大小的差异,获取每个地理信息测绘数据点的多维属性显著程度,包括的具体方法为:
根据每个地理信息测绘数据点的每个维度属性数据与所有地理信息测绘数据点的每个维度属性数据的均值的差异,获取每个地理信息测绘数据点的每个维度属性数据的属性差异;
根据每个地理信息测绘数据点不同维度属性数据的属性差异,获取每个地理信息测绘数据点的多维属性显著因子;
获取所有地理信息测绘数据点的多维属性显著因子,将所有多维属性显著因子进行线性归一化后的每个多维属性显著因子记为多维属性显著程度。
优选的,所述根据每个地理信息测绘数据点的每个维度属性数据与所有地理信息测绘数据点的每个维度属性数据的均值的差异,获取每个地理信息测绘数据点的每个维度属性数据的属性差异,包括的具体方法为:
将所有地理信息测绘数据点的第个维度属性数据的均值记为第一均值;
对于任意一个地理信息测绘数据点,将地理信息测绘数据点的第个维度属性数据与第一均值的差值的绝对值,记为第一绝对值;将第一绝对值与第一均值的比值,作为地理信息测绘数据点的第/>个维度属性数据的属性差异。
优选的,所述根据每个地理信息测绘数据点不同维度属性数据的属性差异,获取每个地理信息测绘数据点的多维属性显著因子,包括的具体方法为:
对于任意一个地理信息测绘数据点,将地理信息测绘数据点的所有维度属性数据的属性差异的均值记为第二均值;
将地理信息测绘数据点的第个维度属性数据的属性差异与第二均值的比值,记为第一比值;将1与第一比值的差值的绝对值,记为地理信息测绘数据点的第/>个维度属性数据的第二绝对值;将地理信息测绘数据点的所有维度属性数据的第二绝对值的均值,作为地理信息测绘数据点的多维属性显著因子。
优选的,所述根据任意两个地理信息测绘数据点之间多维属性显著程度的差异,对点云数据中所有地理信息测绘数据点进行调整,获取调整后的点云数据,包括的具体方法为:
根据任意两个地理信息测绘数据点之间多维属性显著程度的差异,获取任意两个地理信息测绘数据点之间调整后的欧式距离;
根据点云数据中任意两个地理信息测绘数据点之间调整后的欧式距离,对点云数据中所有地理信息测绘数据点进行调整,获取调整后的点云数据。
优选的,所述根据任意两个地理信息测绘数据点之间多维属性显著程度的差异,获取任意两个地理信息测绘数据点之间调整后的欧式距离,包括的具体方法为:
对于第个地理信息测绘数据点与第/>个地理信息测绘数据点,将第/>个地理信息测绘数据点的多维属性显著程度与第/>个地理信息测绘数据点的多维属性显著程度的差值的绝对值,记为第三绝对值;将第/>个地理信息测绘数据点与第/>个地理信息测绘数据点之间的欧式距离与第三绝对值的乘积,作为第/>个地理信息测绘数据点与第/>个地理信息测绘数据点之间调整后的欧式距离。
优选的,所述对调整后的点云数据中所有地理信息测绘数据点进行若干次聚类,获取初始聚类簇集合和若干次聚类过程的若干个聚类簇,包括的具体方法为:
预设三个参数,将调整后的点云数据中所有任意两个地理信息测绘数据点之间的欧式距离的最大值,作为点云数据的数据点分布长度;将点云数据的数据点分布长度与/>的乘积作为邻域参数输入密度聚类算法中,获取若干个聚类簇,并将所有聚类簇组成初始聚类簇集合;将点云数据的数据点分布长度与/>的乘积,记为第一次聚类参数,并将第一次聚类参数作为邻域参数输入密度聚类算法中对调整后的点云数据进行聚类,获取第一次聚类过程的若干个聚类簇,并将所有聚类簇组成初始聚类簇集合;将点云数据的数据点分布长度与/>的乘积,记为聚类步长;将聚类步长与第一次聚类参数的和,记为第二次聚类参数,并将第二次聚类参数作为新的邻域参数输入密度聚类算法中对调整后的点云数据进行聚类,获取第二次聚类过程的若干个聚类簇;以此类推,直至最新邻域参数等于点云数据的数据点分布长度与/>的乘积,停止聚类,得到若干次聚类过程的若干个聚类簇。
优选的,所述根据初始聚类簇集合中每个聚类簇中地理信息测绘数据点的多维属性显著程度,获取初始聚类簇集合中每个聚类簇的误差可接受程度,包括的具体方法为:
获取初始聚类簇集合中第个聚类簇的误差可接受因子的计算方法为:
式中,表示初始聚类簇集合中第/>个聚类簇的误差可接受因子;/>表示初始聚类簇集合中第/>个聚类簇,在第/>次聚类过程中对应聚类簇内所有地理信息测绘数据点的总数量;/>表示初始聚类簇集合中第/>个聚类簇,在第/>次聚类过程中对应聚类簇内所有地理信息测绘数据点的多维属性显著程度的均值;/>表示初始聚类簇集合中第/>个聚类簇,在第/>次聚类过程中对应聚类簇内所有地理信息测绘数据点的总数量;表示初始聚类簇集合中第/>个聚类簇,在第/>次聚类过程中对应聚类簇内所有地理信息测绘数据点的多维属性显著程度的均值;/>表示预设参数;/>表示取绝对值;
获取初始聚类簇集合中所有聚类簇的误差可接受因子,将所有误差可接受因子进行线性归一化后的每个误差可接受因子记为误差可接受程度。
优选的,所述根据每个聚类簇的误差可接受程度,获取初始聚类簇集合的目标簇,包括的具体方法为:
预设一个规整参数,将初始聚类簇集合中所有聚类簇按照误差可接受程度,从大到小进行排序,获得排序后的初始聚类簇集合;若排序后的初始聚类簇集合中第一个聚类簇内所有地理信息测绘数据点的总数量,与排序后的初始聚类簇集合中除第一个聚类簇以外的所有其他所有聚类簇内所有地理信息测绘数据点的总数量之和,的比值小于规整参数,将排序后的初始聚类簇集合中第一个聚类簇和第二个聚类簇进行合并,并记为目标簇;若目标簇内所有地理信息测绘数据点的总数量,与排序后的初始聚类簇集合中除目标簇以外的所有其他聚类簇内所有地理信息测绘数据点的总数量之和,的比值小于规整参数/>,将排序后的初始聚类簇集合中第一个聚类簇、第二个聚类簇和第三个聚类簇进行合并,并记为目标簇;以此类推,直至最新的目标簇内所有地理信息测绘数据点的总数量,与排序后的初始聚类簇集合中除目标簇以外的所有其他聚类簇内所有地理信息测绘数据点的总数量之和,的比值大于或等于规整参数/>,停止合并,获取初始聚类簇集合的目标簇。
优选的,所述根据每个地理信息测绘数据点目标簇的中心之间的距离,获取每个地理信息测绘数据点的修正后CBLOF因子,包括的具体方法为:
将第个地理信息测绘数据点所属聚类簇的误差可接受程度与初始聚类簇集合的目标簇内所有聚类簇的误差可接受程度的均值的比值,记为第二比值;将1与第二比值的差值的绝对值,记为第四绝对值,将第四绝对值与第/>个地理信息测绘数据点到初始聚类簇集合的目标簇的中心之间欧氏距离的乘积,作为第/>个地理信息测绘数据点的修正后CBLOF因子。
本发明的技术方案的有益效果是:本发明根据任意两个地理信息测绘数据点之间多维属性显著程度的差异,对点云数据中所有地理信息测绘数据点进行调整,获取调整后的点云数据,以此获取不同维度属性数据的显著程度对所有地理信息测绘数据点的异常状况表现的影响;根据每个聚类簇的误差可接受程度,获取初始聚类簇集合的目标簇;根据每个地理信息测绘数据点目标簇的中心之间的距离,获取每个地理信息测绘数据点的修正后CBLOF因子,以此实现基于聚类的局部异常因子检测算法的突降规则的区分度的调整,进而提高了地理信息测绘数据异常检测的准确性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明一种地理信息测绘数据智能管理方法的步骤流程图;
图2为本发明一种地理信息测绘数据智能管理方法的特征关系流程图。
具体实施方式
为了更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明提出的一种地理信息测绘数据智能管理方法,其具体实施方式、结构、特征及其功效,详细说明如下。在下述说明中,不同的“一个实施例”或“另一个实施例”指的不一定是同一实施例。此外,一或多个实施例中的特定特征、结构或特点可由任何合适形式组合。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。
下面结合附图具体的说明本发明所提供的一种地理信息测绘数据智能管理方法的具体方案。
请参阅图1,其示出了本发明一个实施例提供的一种地理信息测绘数据智能管理方法的步骤流程图,该方法包括以下步骤:
步骤S001:获取待检测区域的点云数据;所述点云数据包括若干个地理信息测绘数据点,每个地理信息测绘数据点包括若干个维度属性数据。
需要说明的是,在利用地理信息测绘装置进行地理信息测绘多维信息数据获取的过程中,多维信息各自获取方式各不相同,也即不同维度信息数据的采集方式采用不同的地理信息测绘装置。
具体的,首先,采集待检测区域中若干个地理信息测绘数据点形成待检测区域的点云数据,具体过程为:
对于点云数据中任意一个地理信息测绘数据点,该地理信息测绘数据点为包括空间位置信息数据、海拔高度信息数据、路况指标信息数据、区间车流量信息数据和植被覆盖信息数据的五个维度属性数据。
其中,空间位置信息数据利用无人机航拍检测,海拔高度信息数据利用GPS卫星定位系统获取,路况指标信息数据利用钻芯取样获取,区间车流量信息数据利用待检测区域内的交通系统获取,植被覆盖信息数据利用遥感影像解译获取;点云数据包括若干个地理信息测绘数据点,每个地理信息测绘数据点包括若干个维度属性数据;请参阅图2,其示出了一种地理信息测绘数据智能管理方法的特征关系流程图。
至此,通过上述方法得到待检测区域的点云数据。
步骤S002:根据每个地理信息测绘数据点的不同维度属性数据与所有地理信息测绘数据点的不同维度属性数据之间整体数值大小的差异,获取每个地理信息测绘数据点的多维属性显著程度;根据任意两个地理信息测绘数据点之间多维属性显著程度的差异,对点云数据中所有地理信息测绘数据点进行调整,获取调整后的点云数据。
需要说明的是,在利用基于聚类的局部异常因子检测算法对待检测区域的点云数据进行聚类的异常度分析的过程中,其聚类算法可采用基于密度的聚类算法,其点云数据中地理信息测绘数据点的相似度度量除了与地理信息测绘数据点之间的欧式距离有关外,还受到地理信息测绘数据点的维度属性数据的差异度影响,反映到地理信息测绘数据点的若干个维度属性数据的差异对地理信息测绘数据点间相似度的影响;并且地理信息测绘数据点间的相似度的区分度与待检测区域内地理信息测绘数据点的分布特征相关,当地理信息测绘数据点由于地理结构特征趋于聚集性分布时,其多维度属性差异加权的欧式距离对异常状况的区分度就比较小,因此需要根据待检测区域内地理信息测绘数据点的分布特征及地理信息测绘数据点的多维度属性数据差异,来获取区域的误差可接受程度,用于后续聚类簇突降规则的区分度的调整。
具体的,根据每个地理信息测绘数据点的每个维度属性数据与所有地理信息测绘数据点的每个维度属性数据的均值的差异,获取每个地理信息测绘数据点的每个维度属性数据的属性差异。
作为一种示例,获取每个地理信息测绘数据点的第个维度属性数据的属性差异的计算方法为:
式中,表示任意一个地理信息测绘数据点的第/>个维度属性数据的属性差异;/>表示地理信息测绘数据点的第/>个维度属性数据;/>表示所有地理信息测绘数据点的第/>个维度属性数据的均值;/>表示取绝对值。
进一步的,根据每个地理信息测绘数据点不同维度属性数据的属性差异,获取每个地理信息测绘数据点的多维属性显著程度。
作为一种示例,获取每个地理信息测绘数据点的多维属性显著因子的计算方法为:
式中,表示任意一个地理信息测绘数据点的多维属性显著因子;/>表示地理信息测绘数据点的所有维度属性数据的总数量;/>表示地理信息测绘数据点的第/>个维度属性数据的属性差异;/>表示地理信息测绘数据点的所有维度属性数据的属性差异的均值;/>表示取绝对值。
进一步的,获取所有地理信息测绘数据点的多维属性显著因子,将所有多维属性显著因子进行线性归一化后的每个多维属性显著因子记为多维属性显著程度。
需要说明的是,由于地理信息测绘数据点的多维属性显著程度是基于地理信息测绘数据点的维度属性相关关系体现的显著特征,而地理信息测绘数据点会因为待检测区域的特征分布存在结构性聚集,例如:待检测区域的建筑区域中的地理信息测绘数据点分布于建筑区域的不同结构性外观的表面分布,道路区域则沿着道路延伸方向分布于道路表面,则地理信息测绘数据点会在聚类过程中表现出结构性分布特征,导致后续密度聚类算法对聚类簇的形态分布发生相应的变化;因此在利用基于密度的聚类算法对点云数据进行聚类分析的过程中,衡量地理信息测绘数据点间相似度的欧氏距离采用多维属性显著程度差异进行加权。
具体的,根据任意两个地理信息测绘数据点之间多维属性显著程度的差异,获取任意两个地理信息测绘数据点之间调整后的欧式距离。
作为一种示例,对于第个地理信息测绘数据点与第/>个地理信息测绘数据点,获取第/>个地理信息测绘数据点与第/>个地理信息测绘数据点之间调整后的欧式距离的计算方法为:
式中,表示第/>个地理信息测绘数据点与第/>个地理信息测绘数据点之间调整后的欧式距离;/>表示第/>个地理信息测绘数据点与第/>个地理信息测绘数据点之间的欧式距离;/>表示第/>个地理信息测绘数据点的多维属性显著程度;/>表示第/>个地理信息测绘数据点的多维属性显著程度;/>表示取绝对值。
进一步的,根据点云数据中任意两个地理信息测绘数据点之间调整后的欧式距离,对点云数据中所有地理信息测绘数据点进行调整,获取调整后的点云数据。
至此,通过上述方法得到调整后的点云数据。
步骤S003:对调整后的点云数据中所有地理信息测绘数据点进行若干次聚类,获取初始聚类簇集合和若干次聚类过程的若干个聚类簇,所述初始聚类簇集合包括若干个聚类簇;根据初始聚类簇集合中每个聚类簇中地理信息测绘数据点的多维属性显著程度,获取初始聚类簇集合中每个聚类簇的误差可接受程度;根据每个聚类簇的误差可接受程度,获取初始聚类簇集合的目标簇;根据每个地理信息测绘数据点目标簇的中心之间的距离,获取每个地理信息测绘数据点的修正后CBLOF因子。
需要说明的是,由于数据点的结构性分布可表现为聚类簇的形态特征,并且呈现出显著的聚集态分布,主要表现为不受聚类算法参数较大的影响,因此对于数据点的显著变化特征而言,其数据点在多次聚类的尺度下的结构性分布特征会呈现出稳定的区域性变化,即位于同一地理测绘区域结构上的数据点的显著变化特征会趋于一致,这是由于地理区域的相关物理及性质相同决定的,其表征的是数据点显著变化特征的可信度,总体变化越小的表明结构分布特征越稳定,则其数据点显著变化越突出,其数据点属于异常数据点的可能性越大;因此需要对调整后的点云数据进行不同邻域参数的聚类。
预设三个参数,其中本实施例以/>为例进行叙述,本实施例不进行具体限定,其中/>根据具体实施情况而定。
具体的,将调整后的点云数据中所有任意两个地理信息测绘数据点之间的欧式距离的最大值,作为点云数据的数据点分布长度;将点云数据的数据点分布长度与的乘积作为邻域参数输入密度聚类算法中,获取若干个聚类簇,并将所有聚类簇组成初始聚类簇集合;将点云数据的数据点分布长度与/>的乘积,记为第一次聚类参数,并将第一次聚类参数作为邻域参数输入密度聚类算法中对调整后的点云数据进行聚类,获取第一次聚类过程的若干个聚类簇,并将所有聚类簇组成初始聚类簇集合;将点云数据的数据点分布长度与/>的乘积,记为聚类步长;将聚类步长与第一次聚类参数的和,记为第二次聚类参数,并将第二次聚类参数作为新的邻域参数输入密度聚类算法中对调整后的点云数据进行聚类,获取第二次聚类过程的若干个聚类簇;将聚类步长与第二次聚类参数的和,记为第三次聚类参数,并将第三次聚类参数作为新的邻域参数输入密度聚类算法中对调整后的点云数据进行聚类,获取第三次聚类过程的若干个聚类簇;以此类推,直至最新邻域参数等于点云数据的数据点分布长度与/>的乘积,停止聚类,得到若干次聚类过程的若干个聚类簇。
其中,根据邻域参数进行聚类的过程是密度聚类算法的公知内容,本实施例此处,不作过多赘述。
需要说明的是,初始聚类簇集合中任意一个聚类簇中所有地理信息测绘数据点,均全部对应在任意一次聚类过程的某一个聚类簇中。
对于初始聚类簇集合中任意一个聚类簇,根据初始聚类簇集合中每个聚类簇中地理信息测绘数据点的多维属性显著程度,获取初始聚类簇集合中每个聚类簇的误差可接受因子。
作为一种示例,获取初始聚类簇集合中第个聚类簇的误差可接受因子的计算方法为:
式中,表示初始聚类簇集合中第/>个聚类簇的误差可接受因子;/>表示初始聚类簇集合中第/>个聚类簇,在第/>次聚类过程中对应聚类簇内所有地理信息测绘数据点的总数量;/>表示初始聚类簇集合中第/>个聚类簇,在第/>次聚类过程中对应聚类簇内所有地理信息测绘数据点的多维属性显著程度的均值;/>表示初始聚类簇集合中第/>个聚类簇,在第/>次聚类过程中对应聚类簇内所有地理信息测绘数据点的总数量;/>表示初始聚类簇集合中第/>个聚类簇,在第/>次聚类过程中对应聚类簇内所有地理信息测绘数据点的多维属性显著程度的均值;/>表示预设参数;/>表示取绝对值;/>表示所有次聚类过程的总数量。
进一步的,获取初始聚类簇集合中所有聚类簇的误差可接受因子,将所有误差可接受因子进行线性归一化后的每个误差可接受因子记为误差可接受程度。
至此,获得初始聚类簇集合中每个聚类簇的误差可接受程度。
需要说明的是,根据获得初始聚类簇集合中每个聚类簇的误差可接受程度,计算调整后的点云数据的CBLOF因子的过程中,地理信息测绘数据点到目标簇的距离表征的是地理信息测绘数据点的离群度,则调整后的点云数据的初始聚类簇集合中每个聚类簇的误差可接受程度影响着,基于聚类的局部异常因子检测算法中突降规则下的因子区分度。
预设一个规整参数,其中本实施例以/>为例进行叙述,本实施例不进行具体限定,其中/>根据具体实施情况而定。
具体的,将初始聚类簇集合中所有聚类簇按照误差可接受程度,从大到小进行排序,获得排序后的初始聚类簇集合;若排序后的初始聚类簇集合中第一个聚类簇内所有地理信息测绘数据点的总数量,与排序后的初始聚类簇集合中除第一个聚类簇以外的所有其他所有聚类簇内所有地理信息测绘数据点的总数量之和,的比值小于规整参数,将排序后的初始聚类簇集合中第一个聚类簇和第二个聚类簇进行合并,并记为目标簇;若目标簇内所有地理信息测绘数据点的总数量,与排序后的初始聚类簇集合中除目标簇以外的所有其他聚类簇内所有地理信息测绘数据点的总数量之和,的比值小于规整参数/>,将排序后的初始聚类簇集合中第一个聚类簇、第二个聚类簇和第三个聚类簇进行合并,并记为目标簇;以此类推,直至最新的目标簇内所有地理信息测绘数据点的总数量,与排序后的初始聚类簇集合中除目标簇以外的所有其他聚类簇内所有地理信息测绘数据点的总数量之和,的比值大于或等于规整参数/>,停止合并,获取初始聚类簇集合的目标簇。
根据每个地理信息测绘数据点目标簇的中心之间的距离,获取每个地理信息测绘数据点的修正后CBLOF因子。
作为一种示例,获取第个地理信息测绘数据点的修正后CBLOF因子的计算方法为:
式中,表示第/>个地理信息测绘数据点的修正后CBLOF因子;/>表示第/>个地理信息测绘数据点所属聚类簇的误差可接受程度;/>表示初始聚类簇集合的目标簇内所有聚类簇的误差可接受程度的均值;/>表示第/>个地理信息测绘数据点到初始聚类簇集合的目标簇的中心之间欧氏距离;/>表示取绝对值。
至此,通过上述方法得到所有地理信息测绘数据点的修正后CBLOF因子。
步骤S004:根据修正后CBLOF因子对所有地理信息测绘数据点进行异常检测。
具体的,将所有地理信息测绘数据点的修正后CBLOF因子输入基于聚类的局部异常因子检测算法中,对所有地理信息测绘数据点进行异常检测,获取所有异常地理信息测绘数据点,并将其存储至数据库中。
其中,根据CBLOF因子进行异常检测的过程是基于聚类的局部异常因子检测算法的公知内容,本实施例此处,不作过多赘述。
至此,本实施例完成。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (7)

1.一种地理信息测绘数据智能管理方法,其特征在于,该方法包括以下步骤:
获取待检测区域的点云数据;所述点云数据包括若干个地理信息测绘数据点,每个地理信息测绘数据点包括若干个维度属性数据;
根据每个地理信息测绘数据点的不同维度属性数据与所有地理信息测绘数据点的不同维度属性数据之间整体数值大小的差异,获取每个地理信息测绘数据点的多维属性显著程度;根据任意两个地理信息测绘数据点之间多维属性显著程度的差异,对点云数据中所有地理信息测绘数据点进行调整,获取调整后的点云数据;
对调整后的点云数据中所有地理信息测绘数据点进行若干次聚类,获取初始聚类簇集合和若干次聚类过程的若干个聚类簇,所述初始聚类簇集合包括若干个聚类簇;根据初始聚类簇集合中每个聚类簇中地理信息测绘数据点的多维属性显著程度,获取初始聚类簇集合中每个聚类簇的误差可接受程度;根据每个聚类簇的误差可接受程度,获取初始聚类簇集合的目标簇;根据每个地理信息测绘数据点与目标簇的中心之间的距离,获取每个地理信息测绘数据点的修正后CBLOF因子;
根据修正后CBLOF因子对所有地理信息测绘数据点进行异常检测;
所述对调整后的点云数据中所有地理信息测绘数据点进行若干次聚类,获取初始聚类簇集合和若干次聚类过程的若干个聚类簇,包括的具体方法为:
预设三个参数α,β,c,将调整后的点云数据中所有任意两个地理信息测绘数据点之间的欧式距离的最大值,作为点云数据的数据点分布长度;将点云数据的数据点分布长度与α的乘积作为邻域参数输入密度聚类算法中,获取若干个聚类簇,并将所有聚类簇组成初始聚类簇集合;将点云数据的数据点分布长度与α的乘积,记为第一次聚类参数,并将第一次聚类参数作为邻域参数输入密度聚类算法中对调整后的点云数据进行聚类,获取第一次聚类过程的若干个聚类簇,并将所有聚类簇组成初始聚类簇集合;将点云数据的数据点分布长度与c的乘积,记为聚类步长;将聚类步长与第一次聚类参数的和,记为第二次聚类参数,并将第二次聚类参数作为新的邻域参数输入密度聚类算法中对调整后的点云数据进行聚类,获取第二次聚类过程的若干个聚类簇;以此类推,直至最新邻域参数等于点云数据的数据点分布长度与β的乘积,停止聚类,得到若干次聚类过程的若干个聚类簇;
所述根据初始聚类簇集合中每个聚类簇中地理信息测绘数据点的多维属性显著程度,获取初始聚类簇集合中每个聚类簇的误差可接受程度,包括的具体方法为:
获取初始聚类簇集合中第k个聚类簇的误差可接受因子的计算方法为:
;
式中,表示初始聚类簇集合中第/>个聚类簇的误差可接受因子;/>表示初始聚类簇集合中第k个聚类簇,在第q-1次聚类过程中对应聚类簇内所有地理信息测绘数据点的总数量;/>表示初始聚类簇集合中第k个聚类簇,在第/>次聚类过程中对应聚类簇内所有地理信息测绘数据点的多维属性显著程度的均值;/>表示初始聚类簇集合中第k个聚类簇,在第q次聚类过程中对应聚类簇内所有地理信息测绘数据点的总数量;/>表示初始聚类簇集合中第k个聚类簇,在第q次聚类过程中对应聚类簇内所有地理信息测绘数据点的多维属性显著程度的均值;α,β,c表示预设参数;/>表示取绝对值;
获取初始聚类簇集合中所有聚类簇的误差可接受因子,将所有误差可接受因子进行线性归一化后的每个误差可接受因子记为误差可接受程度;
所述根据每个地理信息测绘数据点与目标簇的中心之间的距离,获取每个地理信息测绘数据点的修正后CBLOF因子,包括的具体方法为:
将第个地理信息测绘数据点所属聚类簇的误差可接受程度与初始聚类簇集合的目标簇内所有聚类簇的误差可接受程度的均值的比值,记为第二比值;将1与第二比值的差值的绝对值,记为第四绝对值,将第四绝对值与第/>个地理信息测绘数据点到初始聚类簇集合的目标簇的中心欧氏距离的乘积,作为第/>个地理信息测绘数据点的修正后CBLOF因子。
2.根据权利要求1所述一种地理信息测绘数据智能管理方法,其特征在于,所述根据每个地理信息测绘数据点的不同维度属性数据与所有地理信息测绘数据点的不同维度属性数据之间整体数值大小的差异,获取每个地理信息测绘数据点的多维属性显著程度,包括的具体方法为:
根据每个地理信息测绘数据点的每个维度属性数据与所有地理信息测绘数据点的每个维度属性数据的均值的差异,获取每个地理信息测绘数据点的每个维度属性数据的属性差异;
根据每个地理信息测绘数据点不同维度属性数据的属性差异,获取每个地理信息测绘数据点的多维属性显著因子;
获取所有地理信息测绘数据点的多维属性显著因子,将所有多维属性显著因子进行线性归一化后的每个多维属性显著因子记为多维属性显著程度。
3.根据权利要求2所述一种地理信息测绘数据智能管理方法,其特征在于,所述根据每个地理信息测绘数据点的每个维度属性数据与所有地理信息测绘数据点的每个维度属性数据的均值的差异,获取每个地理信息测绘数据点的每个维度属性数据的属性差异,包括的具体方法为:
将所有地理信息测绘数据点的第个维度属性数据的均值记为第一均值;
对于任意一个地理信息测绘数据点,将地理信息测绘数据点的第个维度属性数据与第一均值的差值的绝对值,记为第一绝对值;将第一绝对值与第一均值的比值,作为地理信息测绘数据点的第/>个维度属性数据的属性差异。
4.根据权利要求2所述一种地理信息测绘数据智能管理方法,其特征在于,所述根据每个地理信息测绘数据点不同维度属性数据的属性差异,获取每个地理信息测绘数据点的多维属性显著因子,包括的具体方法为:
对于任意一个地理信息测绘数据点,将地理信息测绘数据点的所有维度属性数据的属性差异的均值记为第二均值;
将地理信息测绘数据点的第个维度属性数据的属性差异与第二均值的比值,记为第一比值;将1与第一比值的差值的绝对值,记为地理信息测绘数据点的第/>个维度属性数据的第二绝对值;将地理信息测绘数据点的所有维度属性数据的第二绝对值的均值,作为地理信息测绘数据点的多维属性显著因子。
5.根据权利要求1所述一种地理信息测绘数据智能管理方法,其特征在于,所述根据任意两个地理信息测绘数据点之间多维属性显著程度的差异,对点云数据中所有地理信息测绘数据点进行调整,获取调整后的点云数据,包括的具体方法为:
根据任意两个地理信息测绘数据点之间多维属性显著程度的差异,获取任意两个地理信息测绘数据点之间调整后的欧式距离;
根据点云数据中任意两个地理信息测绘数据点之间调整后的欧式距离,对点云数据中所有地理信息测绘数据点进行调整,获取调整后的点云数据。
6.根据权利要求5所述一种地理信息测绘数据智能管理方法,其特征在于,所述根据任意两个地理信息测绘数据点之间多维属性显著程度的差异,获取任意两个地理信息测绘数据点之间调整后的欧式距离,包括的具体方法为:
对于第r个地理信息测绘数据点与第z个地理信息测绘数据点,将第r个地理信息测绘数据点的多维属性显著程度与第z个地理信息测绘数据点的多维属性显著程度的差值的绝对值,记为第三绝对值;将第r个地理信息测绘数据点与第z个地理信息测绘数据点之间的欧式距离与第三绝对值的乘积,作为第r个地理信息测绘数据点与第z个地理信息测绘数据点之间调整后的欧式距离。
7.根据权利要求1所述一种地理信息测绘数据智能管理方法,其特征在于,所述根据每个聚类簇的误差可接受程度,获取初始聚类簇集合的目标簇,包括的具体方法为:
预设一个规整参数,将初始聚类簇集合中所有聚类簇按照误差可接受程度,从大到小进行排序,获得排序后的初始聚类簇集合;若排序后的初始聚类簇集合中第一个聚类簇内所有地理信息测绘数据点的总数量,与排序后的初始聚类簇集合中除第一个聚类簇以外的所有其他所有聚类簇内所有地理信息测绘数据点的总数量之和,的比值小于规整参数/>,将排序后的初始聚类簇集合中第一个聚类簇和第二个聚类簇进行合并,并记为目标簇;若目标簇内所有地理信息测绘数据点的总数量,与排序后的初始聚类簇集合中除目标簇以外的所有其他聚类簇内所有地理信息测绘数据点的总数量之和,的比值小于规整参数/>,将排序后的初始聚类簇集合中第一个聚类簇、第二个聚类簇和第三个聚类簇进行合并,并记为目标簇;以此类推,直至最新的目标簇内所有地理信息测绘数据点的总数量,与排序后的初始聚类簇集合中除目标簇以外的所有其他聚类簇内所有地理信息测绘数据点的总数量之和,的比值大于或等于规整参数/>,停止合并,获取初始聚类簇集合的目标簇。
CN202410283271.6A 2024-03-13 2024-03-13 一种地理信息测绘数据智能管理方法 Active CN117874690B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410283271.6A CN117874690B (zh) 2024-03-13 2024-03-13 一种地理信息测绘数据智能管理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202410283271.6A CN117874690B (zh) 2024-03-13 2024-03-13 一种地理信息测绘数据智能管理方法

Publications (2)

Publication Number Publication Date
CN117874690A CN117874690A (zh) 2024-04-12
CN117874690B true CN117874690B (zh) 2024-05-28

Family

ID=90590390

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202410283271.6A Active CN117874690B (zh) 2024-03-13 2024-03-13 一种地理信息测绘数据智能管理方法

Country Status (1)

Country Link
CN (1) CN117874690B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118059428B (zh) * 2024-04-17 2024-07-26 大连欣洋电子设备有限公司 一种车载超细干粉灭火器压力智能监测方法
CN118133059B (zh) * 2024-05-08 2024-08-06 武汉鼎业安环科技集团有限公司 一种基于数字孪生的安全风险智能检测方法及系统
CN118171120B (zh) * 2024-05-14 2024-07-23 临沂润恒信息科技有限公司 一种基于多元数据融合的国土测绘方法及系统
CN118296216B (zh) * 2024-06-06 2024-08-02 厦门市华林测绘信息有限公司 一种族谱信息与地理信息的关联匹配方法及系统
CN118362194A (zh) * 2024-06-20 2024-07-19 无锡倍奥特能源科技有限公司 基于物联网的城市垃圾产量数据监测方法
CN118535942A (zh) * 2024-07-25 2024-08-23 北京凯博瑞石油科技有限公司 一种基于地质与工程参数的聚类分析方法

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104101902A (zh) * 2013-04-10 2014-10-15 中国石油天然气股份有限公司 地震属性聚类方法及装置
WO2020155755A1 (zh) * 2019-01-28 2020-08-06 平安科技(深圳)有限公司 基于谱聚类的异常点比例优化方法、装置及计算机设备
CN112819958A (zh) * 2021-03-01 2021-05-18 徐一帆 一种基于三维激光扫描的工程地质测绘方法与系统
CN116383450A (zh) * 2023-06-05 2023-07-04 沧州中铁装备制造材料有限公司 一种铁路公路物流运输信息综合管理系统
CN117252863A (zh) * 2023-11-13 2023-12-19 山东省地质测绘院 一种地理信息异常数据快速检测分析方法
CN117271683A (zh) * 2023-09-13 2023-12-22 北京欣智恒科技股份有限公司 一种测绘数据的智能分析评价方法
CN117421618A (zh) * 2023-11-24 2024-01-19 上海东方低碳科技产业股份有限公司 一种建筑能耗监测方法及系统
CN117473350A (zh) * 2023-12-28 2024-01-30 江苏高特高金属科技有限公司 基于数据处理的焊管焊接生产过程监测方法
CN117665935A (zh) * 2024-01-30 2024-03-08 山东鑫国矿业技术开发有限公司 一种破碎岩体支护施工过程的监测数据处理方法

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104101902A (zh) * 2013-04-10 2014-10-15 中国石油天然气股份有限公司 地震属性聚类方法及装置
WO2020155755A1 (zh) * 2019-01-28 2020-08-06 平安科技(深圳)有限公司 基于谱聚类的异常点比例优化方法、装置及计算机设备
CN112819958A (zh) * 2021-03-01 2021-05-18 徐一帆 一种基于三维激光扫描的工程地质测绘方法与系统
CN116383450A (zh) * 2023-06-05 2023-07-04 沧州中铁装备制造材料有限公司 一种铁路公路物流运输信息综合管理系统
CN117271683A (zh) * 2023-09-13 2023-12-22 北京欣智恒科技股份有限公司 一种测绘数据的智能分析评价方法
CN117252863A (zh) * 2023-11-13 2023-12-19 山东省地质测绘院 一种地理信息异常数据快速检测分析方法
CN117421618A (zh) * 2023-11-24 2024-01-19 上海东方低碳科技产业股份有限公司 一种建筑能耗监测方法及系统
CN117473350A (zh) * 2023-12-28 2024-01-30 江苏高特高金属科技有限公司 基于数据处理的焊管焊接生产过程监测方法
CN117665935A (zh) * 2024-01-30 2024-03-08 山东鑫国矿业技术开发有限公司 一种破碎岩体支护施工过程的监测数据处理方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
An Advanced LiDAR Point cloud sequence Coding Scheme for Autonomous Driving;Xuebin Sun et al.;《MM`20: Proceeding of the 28th ACM International Conference on MUltimedia》;20201016;第2793-2801页 *
基于无人机图像与激光融合的铁路运行环境异常识别方法研究;李齐贤;《中国优秀硕士学位论文全文数据库 工程科技Ⅰ辑》;20220315;B026-185 *

Also Published As

Publication number Publication date
CN117874690A (zh) 2024-04-12

Similar Documents

Publication Publication Date Title
CN117874690B (zh) 一种地理信息测绘数据智能管理方法
CN110188093A (zh) 一种基于大数据平台针对ais信息源的数据挖掘系统
CN104820718A (zh) 基于地理位置特征与全局视觉特征的图像分类和检索方法
CN111649763B (zh) 一种基于重力灯塔建立的潜艇导航方法及系统
CN110536257B (zh) 一种基于深度自适应网络的室内定位方法
CN110081888A (zh) 一种基于可信度的惯导和地磁融合的室内定位算法
CN102711239A (zh) 基于rss指纹数据库的二次模糊聚类室内定位方法
CN109348416B (zh) 基于二分k均值的指纹室内定位方法
CN103533647A (zh) 一种基于分簇机制及稳健回归的射频地图自适应定位方法
CN104392113B (zh) 一种近海海面冷空气大风风速的估算方法
CN111985389A (zh) 一种基于流域属性距离的流域相似判别方法
CN117668583A (zh) 一种基于人工智能投资研究的投资优化方法
CN116008671A (zh) 一种基于时差和聚类的闪电定位方法
CN113721254B (zh) 一种基于道路指纹空间关联矩阵的车辆定位方法
CN110135451A (zh) 一种基于点到线段集距离的航迹聚类方法
CN113468982A (zh) 一种城市功能区分类方法、装置及存储介质
CN112767429A (zh) 一种地面-雪面点云快速分割方法
CN115442887A (zh) 一种基于蜂窝网络rssi的室内定位方法
CN108399413B (zh) 一种图片拍摄区域识别及地理定位方法及装置
CN114047508A (zh) 一种对海雷达探测范围统计评估方法及系统
CN113724343A (zh) 一种基于结构感知的树木点云压缩方法
CN114679683A (zh) 一种基于派生指纹迁移的室内智能定位方法
CN108848138B (zh) 一种监测效果良好的环境监测系统
CN109241866B (zh) 一种基于历史作物分布图的农作物自动分类方法及装置
CN113190633A (zh) 一种基于双重距离的气候空间分区方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant