CN112417078A - 一种航空地球物理制图数据空间点聚合方法 - Google Patents

一种航空地球物理制图数据空间点聚合方法 Download PDF

Info

Publication number
CN112417078A
CN112417078A CN202011375697.2A CN202011375697A CN112417078A CN 112417078 A CN112417078 A CN 112417078A CN 202011375697 A CN202011375697 A CN 202011375697A CN 112417078 A CN112417078 A CN 112417078A
Authority
CN
China
Prior art keywords
point
clustering
data
matrix
degree
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011375697.2A
Other languages
English (en)
Other versions
CN112417078B (zh
Inventor
孙晨星
陈占龙
董宇璇
王林飞
闫红雨
江宝得
熊盛青
陶留锋
何辉
周彰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China University of Geosciences
China Aero Geophysical Survey and Remote Sensing Center for Natural Resources
Original Assignee
China University of Geosciences
China Aero Geophysical Survey and Remote Sensing Center for Natural Resources
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China University of Geosciences, China Aero Geophysical Survey and Remote Sensing Center for Natural Resources filed Critical China University of Geosciences
Priority to CN202011375697.2A priority Critical patent/CN112417078B/zh
Publication of CN112417078A publication Critical patent/CN112417078A/zh
Application granted granted Critical
Publication of CN112417078B publication Critical patent/CN112417078B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/285Clustering or classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/16Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization

Abstract

本发明提供一种航空地球物理制图数据空间点聚合方法,包括对提取出来的目标点群进行数据划分,构建相似度矩阵;使用聚类算法对构建的相似度矩阵进行聚类操作,得到聚类结果;对得到的聚类结果进行数据重构,得到最终点注记目标结果;本发明在一定程度上,能够提升海量航空地球物理数据处理效率,提高成果图展示效果,给用户带来更好的体验,达到快速制图的目的。

Description

一种航空地球物理制图数据空间点聚合方法
技术领域
本发明涉及制图数据处理技术领域,尤其涉及一种航空地球物理制图数据 空间点聚合方法。
背景技术
在地理空间中,存在某些区域有大量注记类标识与对象需要显示的情况, 而在有限范围内同时显示这些空间点会相互堆叠和覆盖。然而在某一固定区域 的样本数据中,往往并不只有一种类型,通常是多种不同的样本对象存在于同 一片范围内,如同一片区域内的酒店、商场、加油站。此时就需要对该区域的 注记对象,根据语义特征进行数据划分,得到不同语义特征的样本数据。之后 对同一类型的数据进行聚合,得到理想的结果。
聚类是一种机器学习技术,它设计到数据点的分组。即给定一组数据,通 过聚类算法将每个数据点划分为一个特定的组。聚类的结果满足在同一个子集 内部各个样本之间相似度较高,不同子集的样本之间的没有相同的。相似度的 标准由聚类算法本身的准则决定。常见的聚类算法有基于层次的聚类、基于质 心的聚类、基于概率分布的聚类、基于密度的聚类和基于图的聚类。其中基于 图的聚类把样本集中的每个数据看作图结点,结点之间构建连接边,为每条连 接边赋权重后形成图结构;然后通过图切割把图分割为若干个子图,每个子图 即为一个子簇。基于图聚类与基于质心聚类的不同点在于,基于图聚类使用数 据之间的连接边权重代替了数据之间的相似度值。所以,基于图聚类需要定义 连接边的权值计算方法。
为了实现对复杂区域内大量样本的数据划分,更高效的获取不同语义特征 的样本数据,本发明基于现有的AP算法进行改进,使用一种较为稀疏的图结构 作为信息传播的载体,在全连接图被KD树划分的基础上,各个分区里构建k邻 近图时各个数据点只与其最邻近的k个点建立连接关系可以大量的减少点之间 的连接边的数量,从而减少大量的连接边,进而提高聚类操作的效率。
发明内容
有鉴于此,本发明目的是提供一种航空地球物理制图数据空间点聚合方法, 包括以下步骤:
S1、对提取出来的目标点群进行数据划分,构建相似度矩阵;
S2、使用聚类算法对步骤S1构建的相似度矩阵进行聚类操作,得到聚类结 果;
S3、对步骤S2得到的聚类结果进行数据重构,得到最终点注记目标结果。
本发明提供的技术方案带来的有益效果是:在一定程度上,能够提升海量 航空地球物理数据处理效率,提高成果图展示效果,给用户带来更好的体验, 达到快速制图的目的。
附图说明
图1是本发明一种航空地球物理制图数据空间点聚合方法的空间点聚合模 型构建流程图;
图2是本发明一种航空地球物理制图数据空间点聚合方法的聚类算法示例 图;
图3是本发明一种航空地球物理制图数据空间点聚合方法的近邻传播算法 实现过程;
图4是本发明一种航空地球物理制图数据空间点聚合方法的构建相似度矩 阵的图结构;
图5是本发明一种航空地球物理制图数据空间点聚合方法的点注记典型化 模型构建;
图6是本发明一种航空地球物理制图数据空间点聚合方法的近邻传播算法 信息传递过程;
图7是本发明一种航空地球物理制图数据空间点聚合方法的目标重构过程 图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明 实施方式作进一步地描述。
请参考图1,本发明基于现有的AP算法进行改进,使用一种较为稀疏的图结 构作为信息传播的载体,在全连接图被KD树划分的基础上,各个分区里构建k邻 近图时各个数据点只与其最邻近的k个点建立连接关系可以大量的减少点之间 的连接边的数量,从而减少大量的连接边,进而提高聚类操作的效率,请参考 图2,本发明一种航空地球物理制图数据空间点聚合方法,包括以下步骤:
S1、对提取出来的目标点群进行数据划分,构建相似度矩阵,具体如下:
S11、输入原始注记数据Z={z1,z2,…,zn},根据注记外包矩形参数Tsize,提取 注记目标控制点数据M={m1,m2,…,mn};
S12、对提取的控制点数据M={m1,m2,…,mn},根据数据的特征值E={e1,e2,…,en},进行控制点数据区分,得到具有单一特征的点集数据X={x1,x2,…,xn};
S13、对单一特征的点集数据X={x1,x2,…,xn},根据提前确定的阈值Num, 进行KD树分区,得到多个分区的点集数据X={x1,x2,…,xn};
S131、更新KD树深度,输出分区点集数据大小n;
S132、若n==Num,输出X,否则执行S131;
S14、根据分区的点集数据X,计算相似度矩阵S,设置统一参考度p;
假设点注记目标群集合为X={x1,x2,…xi,…xj,…xn},某目标比例尺下点群的保留数量为n,则其相似度矩阵S如下:
Figure BDA0002808135160000041
如图4所示,构建k(k=5)邻近连接图,可以大量的减少点之间的连接边的 数量,从而减少大量的连接边,进而提高聚类操作的效率。此时,数据点xi和xj之间的相似度定义为sij,表示点xj作为点xi的聚类中心的能力,使用负的欧氏距 离作为两点间的相似度,如下式所示:
Figure BDA0002808135160000042
上式中,d表示每个数据点的描述特征的个数,xik和xjk分别表示xi和xj的第 k个特征属性值,1≤k≤d,且sij越大,两个数据点的距离越近,相似度越高;
参考度sii的定义如下:
Figure BDA0002808135160000043
在相似度矩阵对角线位置的参考度取值会对类代表点的选择产生影响。当 所有样本数据的性质都相同时,设置统一的参考度值为p,p一般采用所有取值 为非-∞的顶点相似度的平均值或中位数,q表示目标xi的语义重要性程度,0≤ q≤1,q的取值越大,表示目标xi的语义重要性程度越高,p<0,q取值越接近 1,参考度sii的值越接近0,xi被选为聚类中心的概率越高。
AP算法的顶点相似度矩阵建立在全连接的图结构G=(V,E)上,其中,顶点 vi∈V对应目标xi,连接边eij∈E表示目标xi与目标xj之间的连接关系,eij的欧 氏距离定义为两个目标之间的相似度,如图3所示,该算法的时间复杂度较高, 为O(N2T),其中N为样本数,T为迭代次数,因此当N比较大时(N>3000), AP聚类算法往往需要算很久;如上文所述,KD树能够解决样本数量过多造成 的算法效率低的问题,基于KD树进行AP聚类算法,能够在一定程度上对算法 效率进行提升;
S2、使用聚类算法对步骤S1构建的相似度矩阵进行聚类操作,得到聚类结 果;
S21、构建k邻近图,计算相似度矩阵S,设置点注记目标语义重要性Q= {q1,q2,…},参考度数值p,阻尼系数λ,吸引度矩阵和归属度矩阵的最大迭代次 数tmax,聚类结果稳定次数e,参考度调整步长μ,先设k=1;
S22、执行第k轮AP聚类;
S221、设吸引度矩阵R=[rik]=[0]、归属度矩阵A=[aik]=[0]、更新迭代 次数t=0以及聚类稳定次数ek=0;
S222、更新R和A,t=t+1;
S223、若当前聚类结果判断与t-1次聚类结果一致,ek=ek+1,否则ek=0;
S224、若t达到最大迭代次数tmax或者聚类结果稳定次数达到e,则终止 该轮聚类过程,记录聚类结果并统计子类数量ak,执行步骤S23;否则,执行步 骤S222;
S23、判断是否满足ak-1≤n≤ak或者ak≤n≤ak-1其中之一,若满足,按步 骤S231输出最终聚类结果;否则,执行步骤S232;
S231、若|ak-1-n|<|ak-n|,输出第k-1轮聚类结果;否则,输出 第k轮聚类结果;
S232、若ak>n,调整参数p=(1+μ)×p;否则,调整p=(1-μ)×p; 重新计算每个目标参考度并更新相似度矩阵S,k=k+1,执行步骤S22。
空间点聚合模型构建如图5所示,确定相似度矩阵后,需要设置吸引度(Responsibility)和归属度(Availability)矩阵。吸引度指点xk适合作为数据点 xi的聚类中心的程度,记为r(xi,xk)。而归属度指点xi选择点xk作为其聚类中心 的适合程度,记为a(xi,xk),近邻传播算法信息传递过程见图6。
归属度矩阵和吸引度矩阵需要多次更新迭代,以得到公平的聚类中心。在 初次迭代时,归属度矩阵被初始化为0,a(xi,xk)=0,而吸引度矩阵定义如下:
Figure BDA0002808135160000061
在后面的迭代中,为了避免振荡,AP算法更新信息时引入了阻尼系数λ,λ∈ [0,1],一般默认为0.5,每条信息都被设置为前一次迭代更新值的λ倍加上本次 信息更新值的1-λ倍。
设t为矩阵更新次数,则吸引度矩阵R的更新迭代方法如下:
rt+1(xi,xk)=(1-λ)·rt+1(xi,xk)+λ·rt(xi,xk)
其中,
Figure BDA0002808135160000062
其中,t为矩阵R的更新次数,xk′为竞争点,候选点xk适合作为数据点xi的 聚类中心的程度,记为吸引度r(xi,xk),数据点xi选择候选点xk作为其聚类中心 的适合程度,记为归属度a(xi,xk),数据点xi与候选点xk的相似度矩阵记为 s(xi,xk)。
归属度矩阵A的更新迭代方法如下:
at+1(xi,xk)=(1-λ)·at+1(xi,xk)+λ·at(xi,xk)
其中,
Figure BDA0002808135160000071
其中,t为矩阵A的更新次数,xk′为竞争点,数据点xi选择候选点xk作为其聚 类中心的适合程度,记为归属度a(xi,xk),候选点xk适合作为数据点xi的聚类中 心的程度,记为吸引度r(xi,xk)。
S3、对步骤S2得到的聚类结果进行数据重构,得到最终点注记目标结果。
请参考图7,所述步骤S3具体如下:
S31、设当前需要重构的点群子类为Y={y1,y2,…,yk},语义重要性分别为 Q={q1,q2,…,qk},获取子类Y中所有目标的包括字体、尺寸、位置、子类个数、 以及语义重要度信息;
S32、设聚类中心点yc,的语义重要性为qc,c≤k,0≤qc≤1,当
Figure BDA0002808135160000072
时, 通过当前子类所有目标的综合属性,包括字体、尺寸、位置以及个数的,计算 得出聚类中心点yc的多项属性,包括字体、尺寸、位置和子类个数;
S33、对各个分区中重构后的聚类中心点注记进行融合,得到最终的全局聚 类结果。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本 发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的, 本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它 实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要 符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (6)

1.一种航空地球物理制图数据空间点聚合方法,其特征在于,包括以下几个步骤:
S1、对提取出来的目标点群进行数据划分,构建相似度矩阵;
S2、使用聚类算法对步骤S1构建的相似度矩阵进行聚类操作,得到聚类结果;
S3、对步骤S2得到的聚类结果进行数据重构,得到最终点注记目标结果。
2.根据权利要求1所述的一种航空地球物理制图数据空间点聚合方法,其特征在于,步骤S1所述构建的相似度矩阵具体如下:
假设数据点集合为X={x1,x2,…,xn},则其相似度矩阵S如下:
Figure FDA0002808135150000011
数据点xi和xj之间的相似度定义为sij,表示点xj作为点xi的聚类中心的能力,使用负的欧氏距离作为两点间的相似度,如下式所示:
Figure FDA0002808135150000012
上式中,d表示每个数据点的描述特征的个数,xik和xjk分别表示xi和xj的第k个特征属性值,1≤k≤d,且sij越大,两个数据点的距离越近,相似度越高;
参考度sii的定义如下:
sii=(1-q)×p
其中,p为设置的参考度值,q表示目标xi的语义重要性程度,0≤q≤1,q的取值越大,表示目标xi的语义重要性程度越高,p<0,q取值越接近1,参考度sii的值越接近0,xi被选为聚类中心的概率越高。
3.根据权利要求1所述的一种航空地球物理制图数据空间点聚合方法,其特征在于,步骤S2中所述聚类操作具体如下:
S21、构建k邻近图,计算相似度矩阵S,设置点注记目标语义重要性Q={q1,q2,…},参考度数值p,阻尼系数λ,吸引度矩阵和归属度矩阵的最大迭代次数tmax,聚类结果稳定次数e,参考度调整步长μ,先设k=1;
S22、执行第k轮AP聚类;
S221、设吸引度矩阵R=[rik]=[0]、归属度矩阵A=[aik]=[0]、更新迭代次数t=0以及聚类稳定次数ek=0;
S222、更新R和A,t=t+1;
S223、若当前聚类结果判断与t-1次聚类结果一致,ek=ek+1,否则ek=0;
S224、若t达到最大迭代次数tmax或者聚类结果稳定次数达到e,则终止该轮聚类过程,记录聚类结果并统计子类数量ak,执行步骤S23;否则,执行步骤S222;
S23、判断是否满足ak-1≤n≤ak或者ak≤n≤ak-1其中之一,若满足,按步骤S231输出最终聚类结果;否则,执行步骤S232;
S231、若|ak-1-n|<|ak-n|,输出第k-1轮聚类结果;否则,输出第k轮聚类结果;
S232、若ak>n,调整参数p=(1+μ)×p;否则,调整p=(1-μ)×p;重新计算每个目标参考度并更新相似度矩阵S,k=k+1,执行步骤S22。
4.根据权利要求3所述的一种航空地球物理制图数据空间点聚合方法,其特征在于,设t为矩阵更新次数,则吸引度矩阵R的更新迭代方法如下:
rt+1(xi,xk)=(1-λ)·rt+1(xi,xk)+λ·rt(xi,xk)
其中,
Figure FDA0002808135150000021
其中,λ为阻尼系数,λ∈[0,1],t为矩阵R的更新次数,xk′为竞争点,候选点xk适合作为数据点xi的聚类中心的程度,记为吸引度r(xi,xk),数据点xi选择候选点xk作为其聚类中心的适合程度,记为归属度a(xi,xk),数据点xi与候选点xk的相似度矩阵记为s(xi,xk)。
5.根据权利要求3所述的一种航空地球物理制图数据空间点聚合方法,其特征在于,归属度矩阵A的更新迭代方法如下:
at+1(xi,xk)=(1-λ)·at+1(xi,xk)+λ·at(xi,xk)
其中,
Figure FDA0002808135150000031
其中,λ为阻尼系数,λ∈[0,1],t为矩阵A的更新次数,xk′为竞争点,数据点xi选择候选点xk作为其聚类中心的适合程度,记为归属度a(xi,xk),候选点xk适合作为数据点xi的聚类中心的程度,记为吸引度r(xi,xk)。
6.根据权利要求1所述的一种航空地球物理制图数据空间点聚合方法,其特征在于,所述步骤S3具体如下:
S31、设当前需要重构的点群子类为Y={y1,y2,…,yk},语义重要性分别为Q={q1,q2,…,qk},获取子类Y中所有目标的包括字体、尺寸、位置、子类个数、以及语义重要度信息;
S32、设聚类中心点yc,的语义重要性为qc,c≤k,0≤qc≤1,当
Figure FDA0002808135150000032
时,通过当前子类所有目标的综合属性,包括字体、尺寸、位置以及个数的,计算得出聚类中心点yc的多项属性,包括字体、尺寸、位置和子类个数;
S33、对各个分区中重构后的聚类中心点注记进行融合,得到最终的全局聚类结果。
CN202011375697.2A 2020-11-30 2020-11-30 一种航空地球物理制图数据空间点聚合方法 Active CN112417078B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011375697.2A CN112417078B (zh) 2020-11-30 2020-11-30 一种航空地球物理制图数据空间点聚合方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011375697.2A CN112417078B (zh) 2020-11-30 2020-11-30 一种航空地球物理制图数据空间点聚合方法

Publications (2)

Publication Number Publication Date
CN112417078A true CN112417078A (zh) 2021-02-26
CN112417078B CN112417078B (zh) 2022-06-24

Family

ID=74829023

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011375697.2A Active CN112417078B (zh) 2020-11-30 2020-11-30 一种航空地球物理制图数据空间点聚合方法

Country Status (1)

Country Link
CN (1) CN112417078B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102136218A (zh) * 2011-03-17 2011-07-27 武汉大学 一种计算机地图制图中的地图注记自动配置方法
CN103489363A (zh) * 2012-06-08 2014-01-01 北京华胜天成科技股份有限公司 电子地图制图系统中线状要素标注数据处理方法和系统
CN104537254A (zh) * 2015-01-07 2015-04-22 中国科学院地理科学与资源研究所 一种基于社会统计数据的精细化制图方法
CN109242759A (zh) * 2018-07-16 2019-01-18 杭州电子科技大学 基于密度聚类的图收缩分组配准方法
CN109542990A (zh) * 2018-10-25 2019-03-29 中国地质大学(武汉) 航空地球物理制图数据点要素自动化注记配置方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102136218A (zh) * 2011-03-17 2011-07-27 武汉大学 一种计算机地图制图中的地图注记自动配置方法
CN103489363A (zh) * 2012-06-08 2014-01-01 北京华胜天成科技股份有限公司 电子地图制图系统中线状要素标注数据处理方法和系统
CN104537254A (zh) * 2015-01-07 2015-04-22 中国科学院地理科学与资源研究所 一种基于社会统计数据的精细化制图方法
CN109242759A (zh) * 2018-07-16 2019-01-18 杭州电子科技大学 基于密度聚类的图收缩分组配准方法
CN109542990A (zh) * 2018-10-25 2019-03-29 中国地质大学(武汉) 航空地球物理制图数据点要素自动化注记配置方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
张榆薪等: "基于近邻传播算法的航迹聚类分析", 《软件导刊》 *

Also Published As

Publication number Publication date
CN112417078B (zh) 2022-06-24

Similar Documents

Publication Publication Date Title
CN107808518B (zh) 一种基于多路谱聚类理论的交通小区划分方法
Ding et al. A multiway p-spectral clustering algorithm
CN108320293A (zh) 一种结合改进粒子群算法的快速点云边界提取技术
Yu et al. Zinb-based graph embedding autoencoder for single-cell rna-seq interpretations
CN106845536B (zh) 一种基于图像缩放的并行聚类方法
CN102571431B (zh) 针对复杂网络的基于群思想改进的Fast-Newman聚类方法
Zhou et al. A density based link clustering algorithm for overlapping community detection in networks
Zhang et al. An affinity propagation clustering algorithm for mixed numeric and categorical datasets
CN110580252B (zh) 多目标优化下的空间对象索引与查询方法
CN115293919A (zh) 面向社交网络分布外泛化的图神经网络预测方法及系统
CN115310554A (zh) 基于深度聚类的品项分配策略、系统、存储介质和设备
CN107832583B (zh) 一种基于图匹配的跨物种生物通路发现方法
CN103164487B (zh) 一种基于密度与几何信息的数据聚类方法
CN105138607B (zh) 一种基于混合粒度分布式内存网格索引的knn查询方法
CN112417078B (zh) 一种航空地球物理制图数据空间点聚合方法
CN108897820B (zh) 一种denclue算法的并行化方法
CN108614932B (zh) 基于边图的线性流重叠社区发现方法、系统及存储介质
CN109934344B (zh) 一种改进的基于规则模型的多目标分布估计方法
CN111738514A (zh) 利用局部距离和节点秩优化函数的社交网络社区发现方法
CN109033746A (zh) 一种基于节点向量的蛋白质复合物识别方法
CN115481682A (zh) 一种基于监督对比学习与结构推断的图分类训练方法
Obaid et al. Hybrid Variable-Length Spider Monkey Optimization with Good-Point Set Initialization for Data Clustering
Aparco-Cardenas et al. Object delineation by iterative dynamic trees
CN113744073B (zh) 一种基于节点簇的社交网络的社区划分方法
CN110688533A (zh) 一种基于密度峰值聚类的社团划分方法及其用途

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant