CN116340788A - 一种聚落聚类方法及装置 - Google Patents

一种聚落聚类方法及装置 Download PDF

Info

Publication number
CN116340788A
CN116340788A CN202211656421.0A CN202211656421A CN116340788A CN 116340788 A CN116340788 A CN 116340788A CN 202211656421 A CN202211656421 A CN 202211656421A CN 116340788 A CN116340788 A CN 116340788A
Authority
CN
China
Prior art keywords
resistance
distance
clustering
important influence
grid
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211656421.0A
Other languages
English (en)
Inventor
于丽君
朱建峰
蔡丹路
刘芳
聂跃平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Aerospace Information Research Institute of CAS
Original Assignee
Aerospace Information Research Institute of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Aerospace Information Research Institute of CAS filed Critical Aerospace Information Research Institute of CAS
Priority to CN202211656421.0A priority Critical patent/CN116340788A/zh
Publication of CN116340788A publication Critical patent/CN116340788A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/11Complex mathematical operations for solving equations, e.g. nonlinear equations, general mathematical optimization problems
    • G06F17/13Differential equations

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Operations Research (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Algebra (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明实施例涉及一种聚落聚类方法及装置,该方法包括:根据待聚类聚落的矢量数据和基本信息,选取多个重要影响因子;对多个重要影响因子进行重要性评价,并计算每个重要影响因子的影响力成本权重值;针对每个重要影响因子生成阻力栅格图,基于所述多个重要影响因子的阻力栅格图和每个重要影响因子的影响力成本权重值,生成总阻力图;基于总阻力图计算待聚类聚落间的阻力距离;采用基于阻力距离的聚类算法对待聚类聚落进行聚类,以得出聚类结果。本发明实施例的技术方案选取重要影响因子,通过层次分析法建立并计算各重要影响因子权重,从而能够很好地体现出地形对于周围遗址的影响,利于更加清晰地体现和探索聚落聚集形式和发展演化过程。

Description

一种聚落聚类方法及装置
技术领域
本发明实施例涉及古聚落聚类技术领域,尤其涉及一种聚落聚类方法及装置。
背景技术
聚落是人类聚居和生活的场所,分为城市聚落和乡村聚落。聚类作为聚落形态研究的一个方法,可深入理解和探索聚落聚集形式和发展演化过程。聚落形态及其发展演变分析,不仅仅是对地理环境的分析,更能反映出一个地区的兴盛与衰落,以及一个时代的社会文化特点,也能更好理解聚落发展,从而促进和指导城市发展预测和规划。从考古层面上说,聚落的聚类及发展演化分析,是了解掌握古文明发展的重要途径,是指导遗址预测的重要方法。
目前,古遗址聚落聚类采用的聚类方式大多数都直接或间接地采用欧式距离作为聚类的标准,未考虑地形因素影响,一方面不能体现多个大型中心遗址间相互作用对于周围遗址的影响;另一方面欧式距离无法体现山脉,河流的阻碍作用。
发明内容
基于现有技术的上述情况,本发明实施例的目的在于提供一种聚落聚类方法及装置,采用约束距离代替欧式距离进行聚类分析,旨在提供一种地形约束下基于空间阻力距离算法的聚落聚类方法及装置,解决了现有的聚类方法对地形考虑不足、无法体现聚落间相互影响的问题。
为达到上述目的,根据本发明的一个方面,提供了一种聚落聚类方法,包括:
根据待聚类聚落的矢量数据、基本信息、地形信息和水系信息,选取多个重要影响因子;
对多个重要影响因子进行重要性评价,并计算每个重要影响因子的影响力成本权重值;
针对每个重要影响因子生成阻力栅格图,基于所述多个重要影响因子的阻力栅格图和每个重要影响因子的影响力成本权重值,生成总阻力图;
基于总阻力图计算待聚类聚落间的阻力距离;
采用基于阻力距离的聚类算法对待聚类聚落进行聚类,以得出聚类结果。
进一步的,所述对多个重要影响因子进行重要性评价,并计算每个重要影响因子的影响力成本权重值,包括:
对多个重要影响因子进行两两判断,并根据判断结果建立重要性判断矩阵;
计算重要性判断矩阵的特征值和特征向量,依据特征值和特征向量得出各个重要影响因子的影响力成本权重值。
进一步的,所述针对每个重要影响因子生成阻力栅格图,基于所述多个重要影响因子的阻力栅格图和每个重要影响因子的影响力成本权重值,生成总阻力图,包括:
对每个重要影响因子的栅格图进行栅格值重分类,形成各重要影响因子的阻力栅格图;
采用阻力模型来进行阻力距离计算,阻力栅格图中每个栅格的值就是阻力值,计算每两点位置的最短加权距离;
采用方向栅格记录周围最小路径值方向。
进一步的,所述基于总阻力图计算待聚类聚落间的阻力距离,包括:
基于总阻力栅格图,依据阻力距离公式计算每两点i和j之间的最短阻力距离,所述阻力距离公式为:
Figure BDA0004012959730000021
其中,all是j在总阻力栅格图中指向i方向的横向上一个相邻单元a的累计阻力距离,costa为总阻力栅格图中单元a的阻力值,costj为总阻力栅格图中单元j的阻力值,da,j为单元a,j之间的距离,若a,j为横向及垂直相邻结点,则da,j=1,若a,j为对角相邻结点,则
Figure BDA0004012959730000022
进一步的,所述采用基于阻力距离的聚类算法对待聚类聚落进行聚类,包括:
(1)输入数据集S和聚类阈值ε,聚类过程中聚类阈值ε的定义为:
ε=θ*Dis(C1,Z2)
其中Dis(i,j)=Dcost(i)―Dcost(j)i,j为两个不同的点,
其中,C1是第一类的中点或质心,Z2指距离C1最远的点,θ的范围是0<θ<1;
(2)依据数据集S建立泰森多边形;
(3)结合地形调用函数Dis(i,j)计算每两点或每两类质心点之间的阻力距离,将得到的阻力距离放在矩阵Dc中;
(4)将矩阵Dc进行排序,选出最小距离值,当最小距离min(dis)<ε,合并两点形成一个新类gi
(5)计算新类gi.的质心,添加质心的坐标到矩阵S;
(6)递归循环步骤(3)-(5),直到min(dis)>ε,停止;并输出聚类结果。
根据本发明的另一个方面,提供了一种聚落聚类装置,包括:
重要影响因子选取模块,用于根据待聚类聚落的矢量数据、基本信息、地形信息和水系信息,选取多个重要影响因子;
影响力成本权重值计算模块,用于对多个重要影响因子进行重要性评价,并计算每个重要影响因子的影响力成本权重值;
总阻力图生成模块,用于针对每个重要影响因子生成阻力栅格图,基于所述多个重要影响因子的阻力栅格图和每个重要影响因子的影响力成本权重值,生成总阻力图;
阻力距离计算模块,用于基于总阻力图计算待聚类聚落间的阻力距离;
聚类模块,用于采用基于阻力距离的聚类算法对待聚类聚落进行聚类,以得出聚类结果。
进一步的,所述述影响力成本权重值计算模块,对多个重要影响因子进行重要性评价,并计算每个重要影响因子的影响力成本权重值,包括:
对多个重要影响因子进行两两判断,并根据判断结果建立重要性判断矩阵;
计算重要性判断矩阵的特征值和特征向量,依据特征值和特征向量得出各个重要影响因子的影响力成本权重值。
进一步的,所述总阻力图生成模块,针对每个重要影响因子生成阻力栅格图,基于所述多个重要影响因子的阻力栅格图和每个重要影响因子的影响力成本权重值,生成总阻力图,包括:
对每个重要影响因子的栅格图进行栅格值重分类,形成各重要影响因子的阻力栅格图;
采用阻力模型来进行阻力距离计算,阻力栅格图中每个栅格的值就是阻力值,计算每两点位置的最短加权距离;
采用方向栅格记录周围最小路径值方向。
进一步的,所述阻力距离计算模块,基于总阻力图计算待聚类聚落间的阻力距离,包括:
基于总阻力栅格图,依据阻力距离公式计算每两点i和j之间的最短阻力距离,所述阻力距离公式为:
Figure BDA0004012959730000041
其中,all是j在总阻力栅格图中指向i方向的横向上一个相邻单元a的累计阻力距离,costa为总阻力栅格图中单元a的阻力值,costj为总阻力栅格图中单元j的阻力值,da,j为单元a,j之间的距离,若a,j为横向及垂直相邻结点,则da,j=1,若a,j为对角相邻结点,则
Figure BDA0004012959730000042
进一步的,所述聚类模块,采用基于阻力距离的聚类算法对待聚类聚落进行聚类,包括:
(1)输入数据集S和聚类阈值ε,聚类过程中聚类阈值ε的定义为:
ε=θ*Dis(C1,Z2)其中,C1是第一类的中点或质心,Z2指距离C1最远的点,θ的范围是0<θ<1;
(2)依据数据集S建立泰森多边形;
(3)结合地形调用函数Dis(i,j)计算每两点或每两类质心点之间的阻力距离,将得到的阻力距离放在矩阵Dc中;
(4)将矩阵Dc进行排序,选出最小距离值,当最小距离min(dis)<ε,合并两点形成一个新类gi
(5)计算新类gi.的质心,添加质心的坐标到矩阵S;
(6)递归循环步骤(3)-(5),直到min(dis)>ε,停止;并输出聚类结果。
综上所述,本发明实施例提供了一种聚落聚类方法及装置,该方法包括:根据待聚类聚落的矢量数据和基本信息,选取多个重要影响因子;对多个重要影响因子进行重要性评价,并计算每个重要影响因子的影响力成本权重值;针对每个重要影响因子生成阻力栅格图,基于所述多个重要影响因子的阻力栅格图和每个重要影响因子的影响力成本权重值,生成总阻力图;基于总阻力图计算待聚类聚落间的阻力距离;采用基于阻力距离的聚类算法对待聚类聚落进行聚类,以得出聚类结果。本发明实施例的技术方案具有如下有益的技术效果:
(1)本发明实施例的技术方案将地貌、水系等影响遗址分布的重要因素,以及坡度、高程、地形起伏度和河流宽度作为重要影响因子,通过层次分析法建立并计算各重要影响因子权重,从而能够很好地结合地形信息,体现出地形对于周围遗址的影响,利于更加清晰地体现和探索聚落聚集形式和发展演化过程。
(2)本发明实施例的技术方案以地形约束的空间阻力距离为基础进行聚类,体现出山脉、河流等因素对古遗址选址的影响,并能对离散的聚落点能进行良好的划分,减少了类别预设过程中的主观性。
附图说明
图1是本发明实施例提供聚落聚类方法的流程图;
图2是总阻力图的示意图
图3是阻力距离计算方法示意图;
图4是采用本发明实施例的聚类方法得到的上述具体示例中龙山时期古聚落遗址分类结果图;
图5是阻力距离与欧式距离对比的示意图,其中,图5(a)是欧式距离的示意图,图5(b)是阻力距离的示意图;
图6是本发明实施例提供的聚类过程的示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明了,下面结合具体实施方式并参照附图,对本发明进一步详细说明。应该理解,这些描述只是示例性的,而并非要限制本发明的范围。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本发明的概念。
需要说明的是,除非另外定义,本发明一个或多个实施例使用的技术术语或者科学术语应当为本公开所属领域内具有一般技能的人士所理解的通常意义。本发明一个或多个实施例中使用的“第一”、“第二”以及类似的词语并不表示任何顺序、数量或者重要性,而只是用来区分不同的组成部分。“包括”或者“包含”等类似的词语意指出现该词前面的元件或者物件涵盖出现在该词后面列举的元件或者物件及其等同,而不排除其他元件或者物件。“连接”或者“相连”等类似的词语并非限定于物理的或者机械的连接,而是可以包括电性的连接,不管是直接的还是间接的。
下面结合附图对本发明的技术方案进行详细说明。图1是本发明实施例提供的聚落聚类方法100的流程图,如图1所示,该方法包括如下步骤:
S102、根据待聚类聚落的矢量数据、基本信息、地形信息和水系信息,选取多个重要影响因子。例如针对待聚类聚落为古遗址聚落的,选取影响古聚落遗址分布的,影响程度较高且具有独立意义的变量:包括但不限于古遗址聚落所在区域的高程信息、坡度信息、地形起伏度及河流宽度等地貌信息,作为重要影响因子。以一个具体示例进行说明,获取待聚类分析的古聚落遗址的矢量数据、古聚落遗址的基本信息、地形信息、水系信息,并选取重要影响因子。古聚落基本信息包含古聚落遗址数量、古聚落遗址的时期;选取古聚落遗址丰富的临汾地区,古聚落遗址时期为龙山时期,选取古聚落遗址点共215个。地形信息包含古聚落遗址周边DEM数据信息,并提取聚落遗址的高程、坡度、山谷线、山脊线、地形起伏度信息。水系信息包含古聚落遗址周边河流名称、河流宽度等信息,周边主要水系为汾河、浍河、清水河、沁河、鄂河。依据前期研究区内聚落遗址的分布特征,选取高程、坡度、地形起伏度和河流宽度作为重要影响因子。其中,坡度是反映地表单元陡缓;地形起伏度是描述一个区域地形特征的一个宏观性的指标,描述的是区域范围内相对高度;河流的宽度指河流的河面宽度。古人沿河而居,便于取水,旅行时,河流是他们的主要路线。地面流水是地貌形成的外营力之一,同时洪灾的发生又威胁着人类的生存。河流对于古人的影响重大,故而选取其作为其中一个指标。
S104、对多个重要影响因子进行重要性评价,并计算每个重要影响因子的影响力成本权重值。本实施例该步骤中,采用层次分析法(Analytic Hierarchy Process,以下简称“AHP”),即多目标决策法进行各重要影响因子的重要性评价,并计算每个因子的影响力成本权重值。可以通过以下步骤实现:
S1042、对多个重要影响因子进行两两判断,并根据判断结果建立重要性判断矩阵。该步骤通过构建一个多层次的结构模型,层次化问题的性质和目标,使得看似复杂问题的每个因素得以简单量化,并对影响因素进行两两判断,建立影响因素之间的重要性矩阵。其中因素相对重要性的判断通过将每两个重要影响因子进行比较,由数字1-9表示比较结果,1表示两个因子同等重要,9表示极为重要,从1-9重要性逐步增加,用其倒数表示相反的重要级别。根据上文中所举的具体示例,在选取高程、坡度、地形起伏度和河流宽度作为重要影响因子时,所得到的各因子的重要性判断矩阵如表1所示:
表1各因子的重要性判断矩阵
Figure BDA0004012959730000071
S1044、计算重要性判断矩阵的特征值和特征向量,依据特征值和特征向量得出各个重要影响因子的影响力成本权重值。基于上一步骤中得到的重要性判断矩阵,计算得出各个重要影响因子的影响力成本权重值。根据上文中所举的具体示例,基于表1列出的重要性矩阵,得到各个重要影响因子的影响力成本权重值表如表2所示:
表2重要影响因子的影响力成本权重值表
Figure BDA0004012959730000081
为评价矩阵的一致性程度,还可以引入一致性指标(C.I.),如以下公式:
Figure BDA0004012959730000082
其中,u是重要影响因子的数量,λ是矩阵的特征向量。经过计算得出矩阵的最大特征值为4.0686,越接近于影响因子个数4,说明判断矩阵的一致性很高。C.I.值为0.0228,其值越小,说明矩阵的一致性程度越高。
S106、针对高程、坡度、地形起伏度、河流宽度各个重要影响因子生成阻力栅格图,基于所述多个重要影响因子的阻力栅格图和每个重要影响因子的影响力成本权重值,生成总阻力图。
S1062、对每个重要影响因子的栅格图进行栅格值重分类,形成各因子阻力栅格图。栅格图可以包括数字高程模型栅格图、地形起伏度(栅格图)、坡度(栅格图)以及河流宽度(栅格图)。其中,地形起伏度(栅格图)数字高程模型栅格图中每个像素取11*11的区域,区域内最大高程减去最小高程,得到的值赋予像素,计算所有像素值然后得到一张栅格图。坡度(栅格图)可以由数字高程模型做坡度分析得到,河流宽度(栅格图)可以通过提取河流、水系等要素生成栅格图。针对多个重要影响因子,按照上一步骤计算出的影响力成本权重值w进行加权计算,从而得出待聚类聚落区域的总阻力栅格图,总阻力栅格图=0.474*高程(栅格图)+0.334*坡度(栅格图)+0.139*地形起伏度(栅格图)+0.053*河流宽度(栅格图)。
S108、基于步骤S106中生成的总阻力图计算待聚类聚落间的阻力距离。图2中示出了总阻力图的示意图,图中颜色越深表示阻力值越大,颜色越浅阻力值越小。阻力距离是指距离最近源位置的每个像素的最短加权距离(累积行程成本),是以成本单位表示的距离,而不是以地理单位表示的距离。图3中示出了阻力距离计算方法的示意图,结合图3所示的示意图,基于总阻力图计算待聚类聚落间的阻力距离,包括如下步骤:
基于总阻力栅格图,依据阻力距离公式计算每两点i和j之间的最短阻力距离,结合图2和图3,将图2的总阻力图放大后是如图3中所示的栅格图样式,是有一个一个像素格子组成,在总阻力栅格图的基础上计算阻力距离。
所述阻力距离公式为:
Figure BDA0004012959730000091
其中,all是j在总阻力栅格图中指向i方向的横向上一个相邻单元a的累计阻力距离,costa为总阻力栅格图中单元a的阻力值,costj为总阻力栅格图中单元j的阻力值,da,j为单元a,j之间的距离,若a,j为横向及垂直相邻结点,则da,j=1,若a,j为对角相邻结点,则
Figure BDA0004012959730000092
在计算起始点下一步行进方向时候,选择周围8邻域进行计算行进。可以从i点出发,选取周围8邻域进行阻力值计算,选出阻力路径最小的点b,记录累计阻力值和行进方向,计算累计阻力值直至终点j。
根据上文中所举的具体示例,将高程、坡度、地形起伏度和河流宽度四个因子的栅格图,将每个因子的栅格值重分类。再利用进行加权计算,得出整体研究区域的总阻力栅格图像,采用阻力模型来进行阻力距离计算,阻力栅格图像中每个栅格的值就是阻力值,计算每两点位置的最短加权距离(亦称累计行程成本)。每两点的阻力距离都记录在一个矩阵中,形成阻力距离矩阵。
S110、采用基于阻力距离的聚类算法对待聚类聚落进行聚类,以得出聚类结果。将数据集生成泰森多边形,按照计算出的阻力距离,设置阈值,聚类过程如图6所示,点与点之间阻力距离最近的点划分为一类,新的类组重新计算进行组间阻力距离,直至满足阈值要求。通过设置不同的阈值可以得到不同的聚类结果。具体可以按照以下步骤进行:
S1102、输入数据集S和聚类阈值ε,聚类过程中聚类阈值ε的定义为:
ε=θ*Dis(C1,Z2)
其中,C1是第一类的中点或质心,Z2指距离C1最远的点,θ的范围是0<θ<1。
S1104、依据数据集S建立泰森多边形;
S1106、结合地形调用函数Dis(i,j)计算每两点(或两个类)之间的阻力距离,将得到的阻力距离放在矩阵DC中,该矩阵DC用于计算每两个点之间的阻力距离(成本距离),用矩阵形式记录。
S1108、将矩阵DC进行排序,选出最小距离值,当最小距离min(dis)<ε,合并两点(或两个矩阵)形成一个新类gi
S1110、计算新类gi.的质心,添加质心的坐标到数据集矩阵S,同时标记S中已合并的数据(标记数据不作为下一次计算的数据);
S1112、递归循环步骤S1106-S1110,直到min(dis)>ε,停止。
在具体执行时,通过设置参数,将θ设置为1/2,阈值ε为150,000,按照上述各步骤执行聚类,得到古聚落遗址的基于阻力距离的聚类结果。图4中示出了采用本发明实施例的聚类方法得到的上述具体示例中龙山时期古聚落遗址分类结果图。图4中点代表龙山时期的古聚落,不同区域中的点是聚类后用以区分不同类别,图中6个区域中的点表示聚类结果为6类,各个区域分隔的实线是按本发明实施例方法进行类别划分后显示的区分线。聚类后,中部汾河流域的古聚落分为南北两个聚落群;东部形成以沁河为中心的聚落群;西部划分为3个聚落群,西北部受水系影响较小形成一个小聚落群,西中部主要以昕水河为中心的聚落群,西南部则受黄河及其支流影响划分为一个聚落群。从以上结果可以看出,地形约束下基于空间阻力距离算法的聚落聚类方法能很好的体现地形特征。
本发明的实施例,还提供了一种聚落聚类装置,包括:
重要影响因子选取模块,用于根据待聚类聚落的矢量数据、基本信息、地形信息和水系信息,选取多个重要影响因子;
影响力成本权重值计算模块,用于对多个重要影响因子进行重要性评价,并计算每个重要影响因子的影响力成本权重值;
总阻力图生成模块,用于针对每个重要影响因子生成阻力栅格图,基于所述多个重要影响因子的阻力栅格图和每个重要影响因子的影响力成本权重值,生成总阻力图;
阻力距离计算模块,用于基于总阻力图计算待聚类聚落间的阻力距离;
聚类模块,用于采用基于阻力距离的聚类算法对待聚类聚落进行聚类,以得出聚类结果。
本发明该实施例聚落聚类装置中各模块的具体实现过程与本发明上述实施例中聚落聚类方法的各步骤相同,在此将省略其重复描述。
图5中示出了阻力距离与欧式距离对比的示意图,图5(a)中,从A点到D点,欧式距离即为A、D两点的连线,没有考虑到太岳山的阻隔,图5(b)中,从A点到D点走的路程看似比图5(a)中走的远,但这条路径是从山脚下的路径绕过太岳山,太岳山海拔2566.6米,所以相对于翻山,图5(b)中路线比较省力,更符合出行的实际情况。因此,本发明实施例提供的基于阻力距离的聚落聚类方法相比于现有技术中基于欧式距离的聚类方法更符合实际应用的需要。
综上所述,本发明实施例涉及一种聚落聚类方法及装置,该方法包括:根据待聚类聚落的矢量数据和基本信息,选取多个重要影响因子;对多个重要影响因子进行重要性评价,并计算每个重要影响因子的影响力成本权重值;针对每个重要影响因子生成阻力栅格图,基于所述多个重要影响因子的阻力栅格图和每个重要影响因子的影响力成本权重值,生成总阻力图;基于总阻力图计算待聚类聚落间的阻力距离;采用基于阻力距离的聚类算法对待聚类聚落进行聚类,以得出聚类结果。本发明实施例的技术方案将地貌、水系等影响遗址分布的重要因素,以及坡度、高程、地形起伏度和河流宽度作为重要影响因子,通过层次分析法建立并计算各重要影响因子权重,从而能够很好地结合地形信息,体现出地形对于周围遗址的影响,利于更加清晰地体现和探索聚落聚集形式和发展演化过程。本发明实施例的技术方案以地形约束的空间阻力距离为基础进行聚类,体现出山脉、河流等因素对古遗址选址的影响,并能对离散的聚落点能进行良好的划分,减少了类别预设过程中的主观性。
应当理解的是,以上任何实施例的讨论仅为示例性的,并非旨在暗示本发明的范围(包括权利要求)被限于这些例子;在本发明的思路下,以上实施例或者不同实施例中的技术特征之间也可以进行组合,步骤可以以任意顺序实现,并存在如上所述的本发明一个或多个实施例的不同方面的许多其它变化,为了简明它们没有在细节中提供。本发明的上述具体实施方式仅仅用于示例性说明或解释本发明的原理,而不构成对本发明的限制。因此,在不偏离本发明的精神和范围的情况下所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。此外,本发明所附权利要求旨在涵盖落入所附权利要求范围和边界、或者这种范围和边界的等同形式内的全部变化和修改例。

Claims (10)

1.一种聚落聚类方法,其特征在于,包括:
根据待聚类聚落的矢量数据、基本信息、地形信息和水系信息,选取多个重要影响因子;
对多个重要影响因子进行重要性评价,并计算每个重要影响因子的影响力成本权重值;
针对每个重要影响因子生成阻力栅格图,基于所述多个重要影响因子的阻力栅格图和每个重要影响因子的影响力成本权重值,生成总阻力图;
基于总阻力图计算待聚类聚落间的阻力距离;
采用基于阻力距离的聚类算法对待聚类聚落进行聚类,以得出聚类结果。
2.根据权利要求1所述的方法,其特征在于,所述对多个重要影响因子进行重要性评价,并计算每个重要影响因子的影响力成本权重值,包括:
对多个重要影响因子进行两两判断,并根据判断结果建立重要性判断矩阵;
计算重要性判断矩阵的特征值和特征向量,依据特征值和特征向量得出各个重要影响因子的影响力成本权重值。
3.根据权利要求2所述的方法,其特征在于,所述针对每个重要影响因子生成阻力栅格图,基于所述多个重要影响因子的阻力栅格图和每个重要影响因子的影响力成本权重值,生成总阻力图,包括:
对每个重要影响因子的栅格图进行栅格值重分类,形成各重要影响因子的阻力栅格图;
采用阻力模型来进行阻力距离计算,阻力栅格图中每个栅格的值就是阻力值,计算每两点位置的最短加权距离;
采用方向栅格记录周围最小路径值方向。
4.根据权利要求3所述的方法,其特征在于,所述基于总阻力图计算待聚类聚落间的阻力距离,包括:
基于总阻力栅格图,依据阻力距离公式计算每两点i和j之间的最短阻力距离,所述阻力距离公式为:
Figure FDA0004012959720000021
其中,all是j在总阻力栅格图中指向i方向的横向上一个相邻单元a的累计阻力距离,costa为总阻力栅格图中单元a的阻力值,costj为总阻力栅格图中单元j的阻力值,da,j为单元a,j之间的距离,若a,j为横向及垂直相邻结点,则da,j=1,若a,j为对角相邻结点,则
Figure FDA0004012959720000022
5.根据权利要求4所述的方法,其特征在于,所述采用基于阻力距离的聚类算法对待聚类聚落进行聚类,包括:
(1)输入数据集S和聚类阈值ε,聚类过程中聚类阈值ε的定义为:
ε=θ*Dis(C1,Z2)
其中,C1是第一类的中点或质心,Z2指距离C1最远的点,θ的范围是0<θ<1;
(2)依据数据集S建立泰森多边形;
(3)结合地形调用函数Dis(i,j)计算每两点之间的阻力距离,将得到的阻力距离放在矩阵Dc中;
(4)将矩阵Dc进行排序,选出最小距离值,当最小距离min(dis)<ε,合并两点形成一个新类gi
(5)计算新类gi.的质心,添加质心的坐标到矩阵S;;
(6)递归循环步骤(3)-(5),直到min(dis)>ε,停止;并输出聚类结果。
6.一种聚落聚类装置,其特征在于,包括:
重要影响因子选取模块,用于根据待聚类聚落的矢量数据、基本信息、地形信息和水系信息,选取多个重要影响因子;
影响力成本权重值计算模块,用于对多个重要影响因子进行重要性评价,并计算每个重要影响因子的影响力成本权重值;
总阻力图生成模块,用于针对每个重要影响因子生成阻力栅格图,基于所述多个重要影响因子的阻力栅格图和每个重要影响因子的影响力成本权重值,生成总阻力图;
阻力距离计算模块,用于基于总阻力图计算待聚类聚落间的阻力距离;
聚类模块,用于采用基于阻力距离的聚类算法对待聚类聚落进行聚类,以得出聚类结果。
7.根据权利要求6所述的装置,其特征在于,所述述影响力成本权重值计算模块,对多个重要影响因子进行重要性评价,并计算每个重要影响因子的影响力成本权重值,包括:
对多个重要影响因子进行两两判断,并根据判断结果建立重要性判断矩阵;
计算重要性判断矩阵的特征值和特征向量,依据特征值和特征向量得出各个重要影响因子的影响力成本权重值。
8.根据权利要求7所述的装置,其特征在于,所述总阻力图生成模块,针对每个重要影响因子生成阻力栅格图,基于所述多个重要影响因子的阻力栅格图和每个重要影响因子的影响力成本权重值,生成总阻力图,包括:
对每个重要影响因子的栅格图进行栅格值重分类,形成各重要影响因子的阻力栅格图;
采用阻力模型来进行阻力距离计算,阻力栅格图中每个栅格的值就是阻力值,计算每两点位置的最短加权距离;
采用方向栅格记录周围最小路径值方向。
9.根据权利要求8所述的装置,其特征在于,所述阻力距离计算模块,基于总阻力图计算待聚类聚落间的阻力距离,包括:
基于总阻力栅格图,依据阻力距离公式计算每两点i和j之间的最短阻力距离,所述阻力距离公式为:
Figure FDA0004012959720000031
其中,all是j在总阻力栅格图中指向i方向的横向上一个相邻单元a的累计阻力距离,costa为总阻力栅格图中单元a的阻力值,costj为总阻力栅格图中单元j的阻力值,da,j为单元a,j之间的距离,若a,j为横向及垂直相邻结点,则da,j=1,若a,j为对角相邻结点,则
Figure FDA0004012959720000041
10.根据权利要求9所述的装置,其特征在于,所述聚类模块,采用基于阻力距离的聚类算法对待聚类聚落进行聚类,包括:
(1)输入数据集S和聚类阈值ε,聚类过程中聚类阈值ε的定义为:
ε=θ*Dis(C1,Z2)
其中,C1是第一类的中点或质心,Z2指距离C1最远的点,θ的范围是0<θ<1;
(2)依据数据集S建立泰森多边形;
(3)结合地形调用函数Dis(i,j)计算每两点之间的阻力距离,将得到的阻力距离放在矩阵Dc中;
(4)将矩阵Dc进行排序,选出最小距离值,当最小距离min(dis)<ε,合并两点形成一个新类gi
(5)计算新类gi.的质心,添加质心的坐标到矩阵S;
(6)递归循环步骤(3)-(5),直到min(dis)>ε,停止;并输出聚类结果。
CN202211656421.0A 2022-12-22 2022-12-22 一种聚落聚类方法及装置 Pending CN116340788A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211656421.0A CN116340788A (zh) 2022-12-22 2022-12-22 一种聚落聚类方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211656421.0A CN116340788A (zh) 2022-12-22 2022-12-22 一种聚落聚类方法及装置

Publications (1)

Publication Number Publication Date
CN116340788A true CN116340788A (zh) 2023-06-27

Family

ID=86888258

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211656421.0A Pending CN116340788A (zh) 2022-12-22 2022-12-22 一种聚落聚类方法及装置

Country Status (1)

Country Link
CN (1) CN116340788A (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20200234170A1 (en) * 2018-01-30 2020-07-23 China University Of Mining And Technology Method for classifying eco-geological environment types based on coal resource exploitation
CN112990976A (zh) * 2021-03-29 2021-06-18 华南理工大学 基于开源数据挖掘的商业网点选址方法、系统、设备及介质
CN113780459A (zh) * 2021-09-18 2021-12-10 东南大学 一种基于空间谱系的城乡聚落类型自动识别的方法与系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20200234170A1 (en) * 2018-01-30 2020-07-23 China University Of Mining And Technology Method for classifying eco-geological environment types based on coal resource exploitation
CN112990976A (zh) * 2021-03-29 2021-06-18 华南理工大学 基于开源数据挖掘的商业网点选址方法、系统、设备及介质
CN113780459A (zh) * 2021-09-18 2021-12-10 东南大学 一种基于空间谱系的城乡聚落类型自动识别的方法与系统

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
LIU, F等: "Spatiotemporal analysis of prehistoric settlement clustering based on terrain constraints in the Linfen area of China", GEOARCHAEOLOGY-AN INTERNATIONAL JOURNAL, vol. 34, no. 5, 9 September 2019 (2019-09-09) *
刘芳;: "临汾地区先秦时期聚落形态分析与时空演化研究", 北京测绘, no. 04, 21 April 2020 (2020-04-21) *
王金安, 焦申华, 徐勇: "综放开采端面变形控制的模糊聚类分析", 煤炭学报, no. 01, 25 February 2005 (2005-02-25) *
胡珂;莫多闻;毛龙江;李水城;王辉;曹炜;张翼飞;: "无定河流域全新世中期人类聚落选址的空间分析及地貌环境意义", 地理科学, no. 04, 15 April 2011 (2011-04-15) *

Similar Documents

Publication Publication Date Title
Sun et al. Modeling urban land use change and urban sprawl: Calgary, Alberta, Canada
Arnold A new approach for dealing with depressions in digital elevation models when calculating flow accumulation values
Gong et al. Spatiotemporal dynamics in the cultivated and built-up land of Guangzhou: Insights from zoning
CN111210142B (zh) 一种景观综合管理单元划分方法
CN111898315A (zh) 基于分形—机器学习混合模型的滑坡易发性评估方法
CN110135354A (zh) 一种基于实景三维模型的变化检测方法
CN111724033A (zh) 一种基于随机集理论的洪灾风险评价与精细区划方法
CN112270266B (zh) 多特征约束的网状河流主流识别方法
CN114692521A (zh) 一种风电场测风塔的优化布局方法
CN104573234B (zh) 一种基于ArcGIS的流域库容密度空间化方法
CN107680102A (zh) 一种基于空间约束的机载点云数据电力杆塔自动提取方法
CN115759669A (zh) 一种基于复合功能的城市蓝绿生态网络构建方法
Chirico et al. On the definition of the flow width for calculating specific catchment area patterns from gridded elevation data
CN111047072B (zh) 一种基于低影响开发理论的长江中下游地区水系规划方法
CN112257496A (zh) 一种基于深度学习的输电通道周围环境分类方法及系统
CN112116709B (zh) 一种提高地形表达精度的地形特征线处理方法
CN116340788A (zh) 一种聚落聚类方法及装置
CN109697521A (zh) 基于任意断面构建洪水预报方案的方法
CN109900242A (zh) 一种跨国流域生态监测方法及系统
CN114138926B (zh) 一种人口分布格网大小确定方法及系统
CN115759883A (zh) 基于网络群组特征的生态管理分区方法
CN115841042A (zh) 一种基于韧性理论构建的城市生态韧性三维评价方法
CN112233234B (zh) 一种洪水模拟预测中河道地形的重构方法
CN113052084A (zh) 一种基于手机定位数据的社区级矢量道路网提取方法
CN106682237A (zh) 一种山体边界自动提取方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination