CN112417078B - 一种航空地球物理制图数据空间点聚合方法 - Google Patents
一种航空地球物理制图数据空间点聚合方法 Download PDFInfo
- Publication number
- CN112417078B CN112417078B CN202011375697.2A CN202011375697A CN112417078B CN 112417078 B CN112417078 B CN 112417078B CN 202011375697 A CN202011375697 A CN 202011375697A CN 112417078 B CN112417078 B CN 112417078B
- Authority
- CN
- China
- Prior art keywords
- point
- clustering
- data
- matrix
- degree
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 31
- 238000013507 mapping Methods 0.000 title claims abstract description 16
- 230000002776 aggregation Effects 0.000 title claims description 8
- 238000004220 aggregation Methods 0.000 title claims description 8
- 239000011159 matrix material Substances 0.000 claims abstract description 45
- 230000004931 aggregating effect Effects 0.000 claims abstract description 11
- 238000005192 partition Methods 0.000 claims description 6
- 238000013016 damping Methods 0.000 claims description 5
- 230000006641 stabilisation Effects 0.000 claims description 2
- 238000011105 stabilization Methods 0.000 claims description 2
- 238000012545 processing Methods 0.000 abstract description 3
- 230000000694 effects Effects 0.000 abstract description 2
- 238000010276 construction Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000010355 oscillation Effects 0.000 description 1
- 230000004043 responsiveness Effects 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/29—Geographical information databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/284—Relational databases
- G06F16/285—Clustering or classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/16—Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Mathematical Physics (AREA)
- General Engineering & Computer Science (AREA)
- Computational Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Computing Systems (AREA)
- Remote Sensing (AREA)
- Algebra (AREA)
- Software Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供一种航空地球物理制图数据空间点聚合方法,包括对提取出来的目标点群进行数据划分,构建相似度矩阵;使用聚类算法对构建的相似度矩阵进行聚类操作,得到聚类结果;对得到的聚类结果进行数据重构,得到最终点注记目标结果;本发明在一定程度上,能够提升海量航空地球物理数据处理效率,提高成果图展示效果,给用户带来更好的体验,达到快速制图的目的。
Description
技术领域
本发明涉及制图数据处理技术领域,尤其涉及一种航空地球物理制图数据 空间点聚合方法。
背景技术
在地理空间中,存在某些区域有大量注记类标识与对象需要显示的情况, 而在有限范围内同时显示这些空间点会相互堆叠和覆盖。然而在某一固定区域 的样本数据中,往往并不只有一种类型,通常是多种不同的样本对象存在于同 一片范围内,如同一片区域内的酒店、商场、加油站。此时就需要对该区域的 注记对象,根据语义特征进行数据划分,得到不同语义特征的样本数据。之后 对同一类型的数据进行聚合,得到理想的结果。
聚类是一种机器学习技术,它设计到数据点的分组。即给定一组数据,通 过聚类算法将每个数据点划分为一个特定的组。聚类的结果满足在同一个子集 内部各个样本之间相似度较高,不同子集的样本之间的没有相同的。相似度的 标准由聚类算法本身的准则决定。常见的聚类算法有基于层次的聚类、基于质 心的聚类、基于概率分布的聚类、基于密度的聚类和基于图的聚类。其中基于 图的聚类把样本集中的每个数据看作图结点,结点之间构建连接边,为每条连 接边赋权重后形成图结构;然后通过图切割把图分割为若干个子图,每个子图 即为一个子簇。基于图聚类与基于质心聚类的不同点在于,基于图聚类使用数 据之间的连接边权重代替了数据之间的相似度值。所以,基于图聚类需要定义 连接边的权值计算方法。
为了实现对复杂区域内大量样本的数据划分,更高效的获取不同语义特征 的样本数据,本发明基于现有的AP算法进行改进,使用一种较为稀疏的图结构 作为信息传播的载体,在全连接图被KD树划分的基础上,各个分区里构建k邻 近图时各个数据点只与其最邻近的k个点建立连接关系可以大量的减少点之间 的连接边的数量,从而减少大量的连接边,进而提高聚类操作的效率。
发明内容
有鉴于此,本发明目的是提供一种航空地球物理制图数据空间点聚合方法, 包括以下步骤:
S1、对提取出来的目标点群进行数据划分,构建相似度矩阵;
S2、使用聚类算法对步骤S1构建的相似度矩阵进行聚类操作,得到聚类结 果;
S3、对步骤S2得到的聚类结果进行数据重构,得到最终点注记目标结果。
本发明提供的技术方案带来的有益效果是:在一定程度上,能够提升海量 航空地球物理数据处理效率,提高成果图展示效果,给用户带来更好的体验, 达到快速制图的目的。
附图说明
图1是本发明一种航空地球物理制图数据空间点聚合方法的空间点聚合模 型构建流程图;
图2是本发明一种航空地球物理制图数据空间点聚合方法的聚类算法示例 图;
图3是本发明一种航空地球物理制图数据空间点聚合方法的近邻传播算法 实现过程;
图4是本发明一种航空地球物理制图数据空间点聚合方法的构建相似度矩 阵的图结构;
图5是本发明一种航空地球物理制图数据空间点聚合方法的点注记典型化 模型构建;
图6是本发明一种航空地球物理制图数据空间点聚合方法的近邻传播算法 信息传递过程;
图7是本发明一种航空地球物理制图数据空间点聚合方法的目标重构过程 图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明 实施方式作进一步地描述。
请参考图1,本发明基于现有的AP算法进行改进,使用一种较为稀疏的图结 构作为信息传播的载体,在全连接图被KD树划分的基础上,各个分区里构建k邻 近图时各个数据点只与其最邻近的k个点建立连接关系可以大量的减少点之间 的连接边的数量,从而减少大量的连接边,进而提高聚类操作的效率,请参考 图2,本发明一种航空地球物理制图数据空间点聚合方法,包括以下步骤:
S1、对提取出来的目标点群进行数据划分,构建相似度矩阵,具体如下:
S11、输入原始注记数据Z={z1,z2,…,zn},根据注记外包矩形参数Tsize,提取 注记目标控制点数据M={m1,m2,…,mn};
S12、对提取的控制点数据M={m1,m2,…,mn},根据数据的特征值E={e1,e2,…,en},进行控制点数据区分,得到具有单一特征的点集数据X={x1,x2,…,xn};
S13、对单一特征的点集数据X={x1,x2,…,xn},根据提前确定的阈值Num, 进行KD树分区,得到多个分区的点集数据X={x1,x2,…,xn};
S131、更新KD树深度,输出分区点集数据大小n;
S132、若n==Num,输出X,否则执行S131;
S14、根据分区的点集数据X,计算相似度矩阵S,设置统一参考度p;
假设点注记目标群集合为X={x1,x2,…xi,…xj,…xn},某目标比例尺下点群的保留数量为n,则其相似度矩阵S如下:
如图4所示,构建k(k=5)邻近连接图,可以大量的减少点之间的连接边的 数量,从而减少大量的连接边,进而提高聚类操作的效率。此时,数据点xi和xj之间的相似度定义为sij,表示点xj作为点xi的聚类中心的能力,使用负的欧氏距 离作为两点间的相似度,如下式所示:
上式中,d表示每个数据点的描述特征的个数,xik和xjk分别表示xi和xj的第 k个特征属性值,1≤k≤d,且sij越大,两个数据点的距离越近,相似度越高;
参考度sii的定义如下:
在相似度矩阵对角线位置的参考度取值会对类代表点的选择产生影响。当 所有样本数据的性质都相同时,设置统一的参考度值为p,p一般采用所有取值 为非-∞的顶点相似度的平均值或中位数,q表示目标xi的语义重要性程度,0≤ q≤1,q的取值越大,表示目标xi的语义重要性程度越高,p<0,q取值越接近 1,参考度sii的值越接近0,xi被选为聚类中心的概率越高。
AP算法的顶点相似度矩阵建立在全连接的图结构G=(V,E)上,其中,顶点 vi∈V对应目标xi,连接边eij∈E表示目标xi与目标xj之间的连接关系,eij的欧 氏距离定义为两个目标之间的相似度,如图3所示,该算法的时间复杂度较高, 为O(N2T),其中N为样本数,T为迭代次数,因此当N比较大时(N>3000), AP聚类算法往往需要算很久;如上文所述,KD树能够解决样本数量过多造成 的算法效率低的问题,基于KD树进行AP聚类算法,能够在一定程度上对算法 效率进行提升;
S2、使用聚类算法对步骤S1构建的相似度矩阵进行聚类操作,得到聚类结 果;
S21、构建k邻近图,计算相似度矩阵S,设置点注记目标语义重要性Q= {q1,q2,…},参考度数值p,阻尼系数λ,吸引度矩阵和归属度矩阵的最大迭代次 数tmax,聚类结果稳定次数e,参考度调整步长μ,先设k=1;
S22、执行第k轮AP聚类;
S221、设吸引度矩阵R=[rik]=[0]、归属度矩阵A=[aik]=[0]、更新迭代 次数t=0以及聚类稳定次数ek=0;
S222、更新R和A,t=t+1;
S223、若当前聚类结果判断与t-1次聚类结果一致,ek=ek+1,否则ek=0;
S224、若t达到最大迭代次数tmax或者聚类结果稳定次数达到e,则终止 该轮聚类过程,记录聚类结果并统计子类数量ak,执行步骤S23;否则,执行步 骤S222;
S23、判断是否满足ak-1≤n≤ak或者ak≤n≤ak-1其中之一,若满足,按步 骤S231输出最终聚类结果;否则,执行步骤S232;
S231、若|ak-1-n|<|ak-n|,输出第k-1轮聚类结果;否则,输出 第k轮聚类结果;
S232、若ak>n,调整参数p=(1+μ)×p;否则,调整p=(1-μ)×p; 重新计算每个目标参考度并更新相似度矩阵S,k=k+1,执行步骤S22。
空间点聚合模型构建如图5所示,确定相似度矩阵后,需要设置吸引度(Responsibility)和归属度(Availability)矩阵。吸引度指点xk适合作为数据点 xi的聚类中心的程度,记为r(xi,xk)。而归属度指点xi选择点xk作为其聚类中心 的适合程度,记为a(xi,xk),近邻传播算法信息传递过程见图6。
归属度矩阵和吸引度矩阵需要多次更新迭代,以得到公平的聚类中心。在 初次迭代时,归属度矩阵被初始化为0,a(xi,xk)=0,而吸引度矩阵定义如下:
在后面的迭代中,为了避免振荡,AP算法更新信息时引入了阻尼系数λ,λ∈ [0,1],一般默认为0.5,每条信息都被设置为前一次迭代更新值的λ倍加上本次 信息更新值的1-λ倍。
设t为矩阵更新次数,则吸引度矩阵R的更新迭代方法如下:
rt+1(xi,xk)=(1-λ)·rt+1(xi,xk)+λ·rt(xi,xk)
其中,
其中,t为矩阵R的更新次数,xk′为竞争点,候选点xk适合作为数据点xi的 聚类中心的程度,记为吸引度r(xi,xk),数据点xi选择候选点xk作为其聚类中心 的适合程度,记为归属度a(xi,xk),数据点xi与候选点xk的相似度矩阵记为 s(xi,xk)。
归属度矩阵A的更新迭代方法如下:
at+1(xi,xk)=(1-λ)·at+1(xi,xk)+λ·at(xi,xk)
其中,
其中,t为矩阵A的更新次数,xk′为竞争点,数据点xi选择候选点xk作为其聚 类中心的适合程度,记为归属度a(xi,xk),候选点xk适合作为数据点xi的聚类中 心的程度,记为吸引度r(xi,xk)。
S3、对步骤S2得到的聚类结果进行数据重构,得到最终点注记目标结果。
请参考图7,所述步骤S3具体如下:
S31、设当前需要重构的点群子类为Y={y1,y2,…,yk},语义重要性分别为 Q={q1,q2,…,qk},获取子类Y中所有目标的包括字体、尺寸、位置、子类个数、 以及语义重要度信息;
S32、设聚类中心点yc,的语义重要性为qc,c≤k,0≤qc≤1,当时, 通过当前子类所有目标的综合属性,包括字体、尺寸、位置以及个数的,计算 得出聚类中心点yc的多项属性,包括字体、尺寸、位置和子类个数;
S33、对各个分区中重构后的聚类中心点注记进行融合,得到最终的全局聚 类结果。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本 发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的, 本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它 实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要 符合与本文所公开的原理和新颖特点相一致的最宽的范围。
Claims (4)
1.一种航空地球物理制图数据空间点聚合方法,其特征在于,包括以下几个步骤:
S1、对提取出来的目标点群进行数据划分,构建相似度矩阵;
所述构建的相似度矩阵具体如下:
假设数据点集合为X={x1,x2,…,xn},则其相似度矩阵S如下:
数据点xi和xj之间的相似度定义为sij,表示点xj作为点xi的聚类中心的能力,使用负的欧氏距离作为两点间的相似度,如下式所示:
上式中,d表示每个数据点的描述特征的个数,xik和xjk分别表示xi和xj的第k个特征属性值,1≤k≤d,且sij越大,两个数据点的距离越近,相似度越高;
参考度sii的定义如下:
sii=(1-q)×p
其中,p为设置的参考度值,q表示目标xi的语义重要性程度,0≤q≤1,q的取值越大,表示目标xi的语义重要性程度越高,p<0,q取值越接近1,参考度sii的值越接近0,xi被选为聚类中心的概率越高;
S2、使用聚类算法对步骤S1构建的相似度矩阵进行聚类操作,得到聚类结果;
S3、对步骤S2得到的聚类结果进行数据重构,得到最终点注记目标结果;
步骤S3具体实现如下:
S31、设当前需要重构的点群子类为Y={y1,y2,…,yk},语义重要性分别为Q={q1,q2,…,qk},获取子类Y中所有目标的包括字体、尺寸、位置、子类个数、以及语义重要度信息;
S32、设聚类中心点yc,的语义重要性为qc,c≤k,0≤qc≤1,当时,通过当前子类所有目标的综合属性,包括字体、尺寸、位置以及个数的,计算得出聚类中心点yc的多项属性,包括字体、尺寸、位置和子类个数;
S33、对各个分区中重构后的聚类中心点注记进行融合,得到最终的全局聚类结果。
2.根据权利要求1所述的一种航空地球物理制图数据空间点聚合方法,其特征在于,步骤S2中所述聚类操作具体如下:
S21、构建k邻近图,计算相似度矩阵S,设置点注记目标语义重要性Q={q1,q2,…},参考度数值p,阻尼系数λ,吸引度矩阵和归属度矩阵的最大迭代次数tmax,聚类结果稳定次数e,参考度调整步长μ,先设k=1;
S22、执行第k轮AP聚类;
S221、设吸引度矩阵R=[rik]=[0]、归属度矩阵A=[aik]=[0]、更新迭代次数t=0以及聚类稳定次数ek=0;
S222、更新R和A,t=t+1;
S223、若当前聚类结果判断与t-1次聚类结果一致,ek=ek+1,否则ek=0;
S224、若t达到最大迭代次数tmax或者聚类结果稳定次数达到e,则终止该轮聚类过程,记录聚类结果并统计子类数量ak,执行步骤S23;否则,执行步骤S222;
S23、判断是否满足ak-1≤n≤ak或者ak≤n≤ak-1其中之一,若满足,按步骤S231输出最终聚类结果;否则,执行步骤S232;
S231、若|ak-1-n|<|ak-n|,输出第k-1轮聚类结果;否则,输出第k轮聚类结果;
S232、若ak>n,调整参数p=(1+μ)×p;否则,调整p=(1-μ)×p;重新计算每个目标参考度并更新相似度矩阵S,k=k+1,执行步骤S22。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011375697.2A CN112417078B (zh) | 2020-11-30 | 2020-11-30 | 一种航空地球物理制图数据空间点聚合方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011375697.2A CN112417078B (zh) | 2020-11-30 | 2020-11-30 | 一种航空地球物理制图数据空间点聚合方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112417078A CN112417078A (zh) | 2021-02-26 |
CN112417078B true CN112417078B (zh) | 2022-06-24 |
Family
ID=74829023
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011375697.2A Active CN112417078B (zh) | 2020-11-30 | 2020-11-30 | 一种航空地球物理制图数据空间点聚合方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112417078B (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102136218A (zh) * | 2011-03-17 | 2011-07-27 | 武汉大学 | 一种计算机地图制图中的地图注记自动配置方法 |
CN103489363A (zh) * | 2012-06-08 | 2014-01-01 | 北京华胜天成科技股份有限公司 | 电子地图制图系统中线状要素标注数据处理方法和系统 |
CN104537254A (zh) * | 2015-01-07 | 2015-04-22 | 中国科学院地理科学与资源研究所 | 一种基于社会统计数据的精细化制图方法 |
CN109242759A (zh) * | 2018-07-16 | 2019-01-18 | 杭州电子科技大学 | 基于密度聚类的图收缩分组配准方法 |
CN109542990A (zh) * | 2018-10-25 | 2019-03-29 | 中国地质大学(武汉) | 航空地球物理制图数据点要素自动化注记配置方法 |
-
2020
- 2020-11-30 CN CN202011375697.2A patent/CN112417078B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102136218A (zh) * | 2011-03-17 | 2011-07-27 | 武汉大学 | 一种计算机地图制图中的地图注记自动配置方法 |
CN103489363A (zh) * | 2012-06-08 | 2014-01-01 | 北京华胜天成科技股份有限公司 | 电子地图制图系统中线状要素标注数据处理方法和系统 |
CN104537254A (zh) * | 2015-01-07 | 2015-04-22 | 中国科学院地理科学与资源研究所 | 一种基于社会统计数据的精细化制图方法 |
CN109242759A (zh) * | 2018-07-16 | 2019-01-18 | 杭州电子科技大学 | 基于密度聚类的图收缩分组配准方法 |
CN109542990A (zh) * | 2018-10-25 | 2019-03-29 | 中国地质大学(武汉) | 航空地球物理制图数据点要素自动化注记配置方法 |
Non-Patent Citations (1)
Title |
---|
基于近邻传播算法的航迹聚类分析;张榆薪等;《软件导刊》;20180415(第04期);第90,100页 * |
Also Published As
Publication number | Publication date |
---|---|
CN112417078A (zh) | 2021-02-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107247961B (zh) | 一种应用模糊轨迹序列的轨迹预测方法 | |
CN103678671B (zh) | 一种社交网络中的动态社区检测方法 | |
CN102253961A (zh) | 基于Voronoi图的路网k聚集最近邻居节点查询方法 | |
CN110188228A (zh) | 基于草图检索三维模型的跨模态检索方法 | |
CN108320293A (zh) | 一种结合改进粒子群算法的快速点云边界提取技术 | |
Ding et al. | A multiway p-spectral clustering algorithm | |
CN102571431B (zh) | 针对复杂网络的基于群思想改进的Fast-Newman聚类方法 | |
CN115481682A (zh) | 一种基于监督对比学习与结构推断的图分类训练方法 | |
Zhou et al. | A density based link clustering algorithm for overlapping community detection in networks | |
CN110909172B (zh) | 一种基于实体距离的知识表示学习方法 | |
Chandramouli et al. | Image classification using chaotic particle swarm optimization | |
CN106528705A (zh) | 一种基于rbf神经网络的重复记录检测方法和系统 | |
CN115293919A (zh) | 面向社交网络分布外泛化的图神经网络预测方法及系统 | |
CN107832583B (zh) | 一种基于图匹配的跨物种生物通路发现方法 | |
CN110580252A (zh) | 多目标优化下的空间对象索引与查询方法 | |
CN115983341A (zh) | 一种基于关系聚合超图的节点分类方法 | |
CN103164487B (zh) | 一种基于密度与几何信息的数据聚类方法 | |
CN108614932B (zh) | 基于边图的线性流重叠社区发现方法、系统及存储介质 | |
CN112417078B (zh) | 一种航空地球物理制图数据空间点聚合方法 | |
CN108897820B (zh) | 一种denclue算法的并行化方法 | |
CN111738514A (zh) | 利用局部距离和节点秩优化函数的社交网络社区发现方法 | |
CN115273645B (zh) | 一种室内面要素自动聚类的地图制图方法 | |
CN111353525A (zh) | 一种不均衡不完整数据集的建模及缺失值填补方法 | |
CN114662012A (zh) | 一种面向基因调控网络的社区查询分析方法 | |
CN109033746A (zh) | 一种基于节点向量的蛋白质复合物识别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |