CN116226697B - 空间数据聚类方法、系统、设备及介质 - Google Patents

空间数据聚类方法、系统、设备及介质 Download PDF

Info

Publication number
CN116226697B
CN116226697B CN202310501476.2A CN202310501476A CN116226697B CN 116226697 B CN116226697 B CN 116226697B CN 202310501476 A CN202310501476 A CN 202310501476A CN 116226697 B CN116226697 B CN 116226697B
Authority
CN
China
Prior art keywords
sliding window
grid
category
grid unit
space
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310501476.2A
Other languages
English (en)
Other versions
CN116226697A (zh
Inventor
宋长青
王昊煜
高培超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Normal University
Original Assignee
Beijing Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Normal University filed Critical Beijing Normal University
Priority to CN202310501476.2A priority Critical patent/CN116226697B/zh
Publication of CN116226697A publication Critical patent/CN116226697A/zh
Application granted granted Critical
Publication of CN116226697B publication Critical patent/CN116226697B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Image Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供一种空间数据聚类方法、系统、设备及介质,属于空间数据处理技术领域,该方法包括:获取待测地理空间的至少一个栅格单元;基于各所述栅格单元的属性值,确定各所述栅格单元的初始类别;基于滑动窗口遍历各所述栅格单元,基于所述滑动窗口内的各所述栅格单元的属性值,将所述滑动窗口内的各所述栅格单元划分为空间异常点和非空间异常点;基于所述滑动窗口内的各所述栅格单元的属性值,更新各所述非空间异常点对应的栅格单元的类别,通过更新非空间异常点对应的栅格单元的类别,提升了空间数据聚类的空间连续性。

Description

空间数据聚类方法、系统、设备及介质
技术领域
本发明涉及空间数据处理技术领域,尤其涉及一种空间数据聚类方法、系统、设备及介质。
背景技术
空间聚类,又称空间分区,是地理学的一个传统研究课题。空间聚类揭示了聚类内部的共同过程和特征以及聚类之间的差异。新的聚类比原始空间对象具有更丰富的地理含义,使聚类成为进一步综合研究的基础。空间异常点的处理是空间聚类需要解决的关键问题。
空间聚类方法将具有相似属性的空间单元进分为同一个聚类,同时施加空间连续的约束。施加约束的方法有两种,严格约束或非严格约束。严格约束意味着同一聚类的空间单元必须在空间上是连续的。非严格约束不要求聚类的所有空间单元都是连续的,但只要求它们中的大多数是连续的。严格空间约束聚类方法会将一些非常相似但距离较远的空间单元划分为不同的类别,且会在一个聚类中包含一些相邻但不是非常相似的单元。
空间连续性和属性相似性由地理坐标或位置相异性的权重控制。若位置的权重太大,空间异常点将与邻近的空间单元聚为一类,从而导致该聚类的属性差异极大。如果位置的权重太小,虽然可以正确划分出空间异常点,但得到的聚类在空间上是分散的,空间连续性差。
发明内容
本发明提供一种空间数据聚类方法、系统、设备及介质,用以解决现有技术中空间数据聚类属性差异太大,空间连续性差的缺陷,实现对空间数据聚类的灵活处理,提高栅格空间数据聚类结果的属性相似性和空间连续性。
本发明提供一种空间数据聚类方法,包括:
获取待测地理空间的至少一个栅格单元;
基于各所述栅格单元的属性值,确定各所述栅格单元的初始类别;
基于滑动窗口遍历各所述栅格单元,基于所述滑动窗口内的各所述栅格单元的属性值,将所述滑动窗口内的各所述栅格单元划分为空间异常点和非空间异常点;
基于所述滑动窗口内的各所述栅格单元的属性值,更新各所述非空间异常点对应的栅格单元的类别;
所述更新各所述非空间异常点对应的栅格单元的类别,包括以下至少一项:
将所述滑动窗口内的各所述栅格单元的类别修改为第一目标类别,所述第一目标类别为所述滑动窗口内数量最多的所述栅格单元的初始类别;
将所述滑动窗口内的各所述栅格单元的类别修改为第二目标类别,所第二目标类别为所述滑动窗口内所有栅格单元的属性值的平均值所对应的所述初始类别。
根据本发明提供的一种空间数据聚类方法,所述基于所述滑动窗口内的各所述栅格单元的属性值,将所述滑动窗口内的各所述栅格单元划分为空间异常点和非空间异常点,包括:
获取所述滑动窗口内的各所述栅格单元的属性值极差;
在所述属性值极差大于第一预设阈值的情况下,判定所述滑动窗口内包括空间异常点;
在所述属性值极差小于或等于所述第一预设阈值的情况下,判定所述滑动窗口内的各所述栅格单元为所述非空间异常点。
根据本发明提供的一种空间数据聚类方法,所述在所述属性值极差大于第一预设阈值的情况下,判定所述滑动窗口内包括空间异常点,包括:
在所述滑动窗口内的各所述栅格单元的属性值的平均值大于各所述栅格单元的属性值的中位数值的情况下,划定所述滑动窗口内所述属性值最大的所述栅格单元为所述空间异常点;
在所述滑动窗口内的各所述栅格单元的属性值的平均值小于或等于各所述栅格单元的属性值的中位数值的情况下,划定所述滑动窗口内所述属性值最小的所述栅格单元为所述空间异常点。
根据本发明提供的一种空间数据聚类方法,所述在所述属性值极差大于第一预设阈值的情况下,判定所述滑动窗口内包括空间异常点之后,还包括:
移除所述滑动窗口内的所述空间异常点对应的所述栅格单元;
在所述滑动窗口内的剩余所述栅格单元的属性值标准差大于第二预设阈值的情况下,划定所述剩余所述栅格单元为空间异常点;
在所述滑动窗口内的所述剩余所述栅格单元的属性值标准差小于或等于所述第二预设阈值的情况下,划定所述剩余所述栅格单元为非空间异常点。
根据本发明提供的一种空间数据聚类方法,所述空间异常点对应的各所述栅格单元的类别为各所述栅格单元的初始类别。
根据本发明提供的一种空间数据聚类方法,所述基于滑动窗口遍历各所述栅格单元,包括:
所述滑动窗口在所述待测地理空间内从左至右和/或从上至下依次遍历所述待测地理空间内的各所述栅格单元,滑动步长为一个栅格。
根据本发明提供的一种空间数据聚类方法,所述滑动窗口为固定边长的正方形。
本发明还提供一种空间数据聚类系统,包括:
获取模块,用于获取待测地理空间的至少一个栅格单元;
类别确定模块,用于基于各所述栅格单元的属性值,确定各所述栅格单元的初始类别;
划分模块,用于基于滑动窗口遍历各所述栅格单元,基于所述滑动窗口内的各所述栅格单元的属性值,将所述滑动窗口内的各所述栅格单元划分为空间异常点和非空间异常点;
类别更新模块,用于基于所述滑动窗口内的各所述栅格单元的属性值,更新各所述非空间异常点对应的栅格单元的类别;
所述类别更新模块,具体用于:
将所述滑动窗口内的各所述栅格单元的类别修改为第一目标类别,所述第一目标类别为所述滑动窗口内数量最多的所述栅格单元的初始类别;
或,将所述滑动窗口内的各所述栅格单元的类别修改为第二目标类别,所第二目标类别为所述滑动窗口内所有栅格单元的属性值的平均值所对应的所述初始类别。
本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述的空间数据聚类方法。
本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述的空间数据聚类方法。
本发明提供的一种空间数据聚类方法、系统、设备及介质,对待测地理空间内的栅格单元基于属性值进行类别划分,通过滑动窗口遍历待测地理空间内的栅格单元,划分出空间异常点和非空间异常点,基于各栅格单元的属性值,对非空间异常点对应的栅格单元的类别进行更新,保留了空间异常点对应的栅格单元的属性值,通过更新非空间异常点对应的栅格单元的类别,提升了空间数据聚类的空间连续性。
附图说明
为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明提供的空间数据聚类方法的流程示意图之一;
图2是本发明提供的空间数据聚类方法的划分示意图之一;
图3是本发明提供的空间数据聚类方法的滑动窗口示意图;
图4是本发明提供的空间数据聚类方法的类别更新示意图之一;
图5是本发明提供的空间数据聚类方法的类别更新示意图之二;
图6是本发明提供的空间数据聚类方法的流程示意图之二;
图7是本发明提供的空间数据聚类方法的划分示意图之二;
图8是本发明提供的空间数据聚类方法的流程示意图之三;
图9是本发明提供的空间数据聚类系统的结构示意图;
图10是本发明提供的电子设备的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
下面结合图1-图10描述本发明的空间数据聚类方法、系统、设备及介质。
图1是本发明提供的空间数据聚类方法的流程示意图之一,如图1所示,该方法包括:
S1、获取待测地理空间的至少一个栅格单元;
可选的,在本实施例中,待测地理空间为待研究区域,可以将整个待测地理空间看做有一个栅格文件,栅格文件为一个矩阵文件,以像素或是点的方式进行描述并能独立用于绘图或显示的图形文件,矩阵中的每一个数值为对应位置栅格的属性值,背景值例如为-9999。栅格文件内,包含若干个栅格单元,基于栅格文件内的若干个栅格单元的属性值,进行后续操作。
S2、基于各栅格单元的属性值,确定各栅格单元的初始类别;
可选地,在本实施例中,获取的栅格单元的属性值,是经过预处理的属性值,预处理为标准化处理。本实施例的栅格单元需要获得单变量栅格数据,即每个栅格的属性为定量数据,可以理解为,每个栅格有若干属性值,本实施例针对单变量属性值进行处理,待测地理空间栅格单元的属性值可以包含但不限于海拔高度值,温度值等,本实施例针对单变量属性值进行处理,且属性值为定量不变数据,本实施例以海拔高度值为栅格单元的属性值为研究对象。
可选地,在本实施例中,栅格数据的输入格式为txt格式的数值矩阵,将待测地理空间内的每个栅格单元的属性值减去所有栅格单元的平均属性值,再除以所有栅格单元属性值的标准差,为标准化后的属性值,存储为txt格式的数值矩阵。
可选地,在本实施例中,基于栅格单元的属性值,确定栅格单元的初始类别,每个类别对应一个属性值范围,本实施例中,将所有栅格分为三类。图2是本发明提供的空间数据聚类方法的划分示意图之一,如图2所示:
当栅格单元的属性值落在1-35内时,将栅格单元分为第一类别,即图2中带有向右斜纹的栅格为第一类别;当栅格单元的属性值落在36-70时,将栅格单元分为第二类别,即图2中带有向左斜纹的栅格为第二类别;当栅格单元的属性值落在71-100时,将栅格单元分为第三类别,即图2中带有交叉斜纹的栅格为第三类别。在本实施例中,初始类别包括第一类别、第二类别和第三类别。
可选地,分类方法可以选择自然断点分类法或者头尾分割分类法对单变量数据即属性值进行非空间分类;自然断点法根据数据中的间隙将数据分为几个类别,自然断点法遵循聚类原则,最小化类内方差,同时最大化类间方差,但需要预先指定类别数量;头/尾分割是专门为具有重尾分布的数据设计的,重尾分布(Heavy-tailed distribution)是一种概率分布模型,它的尾部比指数分布还要厚。在许多情况下,右边尾部的部分比较受到重视,但左边尾部比较厚,或是两边尾部都比较厚的状况,也被认为是一种重尾分布。本实施例选择自然断点法,将所有栅格分为三类,每个类别各自对应一个属性值数值范围。
S3、基于滑动窗口遍历各栅格单元,基于滑动窗口内的各栅格单元的属性值,将滑动窗口内的各栅格单元划分为空间异常点和非空间异常点;
可选地,在具体实施中,待测地理空间中的所有栅格大小均匀且排列整齐,选定一个固定大小的正方形作为滑动窗口,对所有栅格单元进行局部处理,固定大小的滑动窗口遍历整个待测地理空间中的所有栅格,探测待测地理空间中的空间异常点,滑动步长为一个栅格,滑动方向为从待测地理空间从左至右,从上至下进行滑动。图3是本发明提供的空间数据聚类方法的滑动窗口示意图,如图3所示:在本实施例中,滑动窗口的边长是3,每个由3行3列的栅格组成的区域是一个滑动窗口,如图3中左上角的加粗黑框为一个滑动窗口。
S4、基于滑动窗口内的各栅格单元的属性值,更新各非空间异常点对应的栅格单元的类别;
上述更新各非空间异常点对应的栅格单元的类别,包括以下至少一项:
将滑动窗口内的各栅格单元的类别修改为第一目标类别,第一目标类别为滑动窗口内数量最多的栅格单元的初始类别;
将滑动窗口内的各栅格单元的类别修改为第二目标类别,第二目标类别为滑动窗口内所有栅格单元的属性值的平均值所对应的初始类别。
可选地,在本实施例中,基于滑动窗口内的各栅格单元的属性值对滑动窗口内非空间异常点对应的栅格单元的类别进行更新,事实上是将上述栅格单元的类别修改为同一个类别,以提高空间数据聚类的空间连续性,本实施例提出两种更新修改机制。
第一类修改更新机制,将滑动窗口内的各栅格单元的类别修改为第一目标类别,第一目标类别为滑动窗口内数量最多的栅格单元的初始类别;第一类修改更新机制为“多数占领”机制,将滑动窗口内的所有非空间异常点对应的栅格单元的类别修改为滑动窗口中数量最多的类别,图4是本发明提供的空间数据聚类方法的类别更新示意图之一,如图4所示,滑动窗口1中的所有栅格单元都为非空间异常点,滑动窗口1中共有9个栅格单元,其中,属于第二类别的栅格单元为4个,属于第三类别的栅格单元有5个,按照第一类修改机制,将滑动窗口内的所有栅格单元的类别修改为数量最多的类别,即第三类别,本实施例中,将滑动窗口内的所有栅格单元的类别修改为第一目标类别,即初始类别中的第三类别。
第二类修改更新机制,将滑动窗口内的各栅格单元的类别修改为第二目标类别,第二目标类别为滑动窗口内所有栅格单元的属性值的平均值所对应的初始类别;第二类修改更新机制为“平均化”机制,基于滑动窗口内栅格单元的属性值进行修改,图5是本发明提供的空间数据聚类方法的类别更新示意图之二,如图5所示,滑动窗口1内的栅格单元的属性值平均值为70.3,在上述步骤S2中可以确定,对应的类别为初始类别中的第二类别,在本实施例中,将滑动窗口内的所有栅格单元的类别修改为第二目标类别,即初始类别中的第二类别。
在具体实施中,第一类修改更新机制更侧重保护空间的连续性,第二类修改更新机制在提高空间连续性的同时也兼顾了待测地理空间内栅格的属性相似性,可以灵活的适用地理区域位置的变化,满足不同场景下的实际需求。
本实施例提供的空间数据聚类方法,通过自然断点分类法对测待测地理空间中的栅格单元,基于栅格单元的属性值进行初始分类,再通过滑动窗口遍历栅格单元,对滑动窗口内局部的栅格单元基于属性值进行空间异常点和非空间异常点的划分,再对非空间异常点的类别进行修改更新,保留了整个待测地理空间中的空间异常点对应的栅格单元,保证了空间数据聚类的属性相似性,通过对非空间异常点的类别进行更新修改,避免相似的栅格单元被分成不同的类别,提升了空间数据聚类结果的空间连续性,通过滑动窗口的探测方式,使得该方法的应用场景更加灵活,满足不同场景下的地理分析应用要求,输出不同区域、不同空间精度的空间数据聚类结果,提升了空间数据聚类方法的性能,使得空间异常点的刻画更加合理。
图6是本发明提供的空间数据聚类方法的流程示意图之二,基于上述实施例,进一步地,如图6所示,上述步骤S3具体包括:
S31、获取滑动窗口内的各栅格单元的属性值极差;
S311、在属性值极差大于第一预设阈值的情况下,判定滑动窗口内包括空间异常点;
S312、在属性值极差小于或等于第一预设阈值的情况下,判定滑动窗口内的各栅格单元为非空间异常点。
可选地,在本实施例中,第一预设阈值设为70,图7是本发明提供的空间数据聚类方法的划分示意图之二,如图7所示:
滑动窗口1内的栅格单元的属性值极差为25,小于第一预设阈值70,此时判定滑动窗口1中不包括空间异常点;
滑动窗口2内的栅格单元的属性值极差为85,大于第一预设阈值70,此时判定滑动窗口2中包括空间异常点。
本实施例提供的空间数据聚类方法,基于各个滑动窗口内的栅格单元的属性值极差与第一预设阈值的比较结果,判定各个滑动窗内是否包含空间异常点,便于后续步骤对空间异常点的判定,若滑动窗口内不包含空间异常点,则可以直接进行后续的处理,有效提升了数据处理效率。
图8是本发明提供的空间数据聚类方法的流程示意图之三,基于上述实施例,进一步地,如图8所示,上述步骤S311具体包括:
S3111、在滑动窗口内的各栅格单元的属性值的平均值大于各栅格单元的属性值的中位数值的情况下,划定滑动窗口内属性值最大的栅格单元为空间异常点;
S3112、在滑动窗口内的各栅格单元的属性值的平均值小于或等于各栅格单元的属性值的中位数值的情况下,划定滑动窗口内属性值最小的栅格单元为空间异常点。
经过上述步骤,确定滑动窗口2内包含空间异常点,进一步的确定哪些栅格单元为空间异常点,如图7所示,滑动窗口2内的栅格单元的属性值平均值为46.9,中位数为41,此种情况为栅格单元的属性值的平均值大于各栅格单元的属性值的中位数值,此时划定滑动窗口2内属性值最大的栅格单元为空间异常点,即属性值为100的栅格单元为空间异常点。
基于上述实施例,进一步地,上述步骤S311之后还包括:
移除滑动窗口内的空间异常点对应的栅格单元;
在滑动窗口内的剩余栅格单元的属性值标准差大于第二预设阈值的情况下,划定剩余所述栅格单元为空间异常点;
在滑动窗口内的剩余栅格单元的属性值标准差小于或等于第二预设阈值的情况下,划定剩余栅格单元为非空间异常点。
如上述图7所示,可选地,在本实施例中,判定属性值为100的栅格单元为空间异常点,接着移除滑动窗口2内的空间异常点对应的栅格单元;基于属性值标准差对滑动窗口2内的剩余栅格单元进行进一步的判定,本实施例中,设定第二预设阈值设置为20。滑动窗口2中剩余的栅格单元的属性值标准差为8.1,小于第二预设阈值20,在这种情况下,滑动窗口内剩余的所有栅格单元都为非空间异常点,滑动窗口1中的栅格单元的属性值标准差为22.4,大于第二预设阈值22.4,在这种情况下,滑动窗口1内的所有栅格单元都为空间异常点,全部从滑动窗口1中移除。
本实施例提供的空间数据聚类方法,基于第一预设阈值和第二预设阈值,即极差阈值和标准差阈值,对各个滑动窗口内的栅格单元进行判定,通过极差阈值进行初步判定之后,还需要经过标准差阈值的进一步判定,有效提高了滑动窗口内栅格单元空间数据聚类结果的属性相似性,通过滑动窗口的方式进行探测和判定,提高了判定的灵活性,可以进行局部的栅格单元的判定,扩展了上述空间数据聚类方法的应用场景,本实施里的空间数据聚类方法,一定程度上提高了空间的集成度,使得每个聚类尽可能相连,同时保护了待测地理空间中的空间异常点,避免过度掩盖各个栅格单元的属性差异。
可选地,在本实施例中,上述空间异常点对应的各栅格单元的类别为各栅格单元的初始类别。
本实施例提供的空间数据聚类方法,通过修改更新经过判定的非空间异常点的类别,避免了相似栅格单元被分成不同的类别,提升了空间数据聚类的空间连续性,对空间异常点的类别不进行修改更新,能够保留大规模空间连续聚类中的空间异常点的属性值,保证了空间数据聚类的属性相似性,解决了现有技术中属性相似性与空间连续性会出现冲突的缺陷,本实施里的空间数据聚类方法是一种非严格约束空间方法,通过计算每个滑动窗口中所有栅格的极差和标准差来判断应该进一步提高空间连续性,或是应该保护空间异常点,使得该空间数据聚类方法的最终聚类结果更加合理。
可选地,在本实施例中,上述滑动窗口在待测地理空间内从左至右和/或从上至下依次遍历待测地理空间内的各栅格单元,滑动步长为一个栅格。滑动窗口为固定边长的正方形。
本实施例提供的空间数据聚类方法,通过固定边长的正方形滑动窗口对待测地理空间内的栅格单元进行固定滑动步长的遍历,可以在每个滑动窗口内寻找局部空间异常点和非空间异常点,进行后续的处理,灵活适应空间数据聚类区域范围和位置的变化,满足地理分析应用要求,经过上述步骤得到的聚类结果仍为栅格形式,形成1个矩阵文件。
本发明还提供一种空间数据聚类系统,图9是本发明提供的空间数据聚类系统的结构示意图,如图9所示,空间数据聚类系统包括:
获取模块91,用于获取待测地理空间的至少一个栅格单元;
类别确定模块92,用于基于各栅格单元的属性值,确定各栅格单元的初始类别;
划分模块93,用于基于滑动窗口遍历各栅格单元,基于滑动窗口内的各栅格单元的属性值,将滑动窗口内的各栅格单元划分为空间异常点和非空间异常点;
类别更新模块94,用于基于滑动窗口内的各栅格单元的属性值,更新各非空间异常点对应的栅格单元的类别;
其中,类别更新模块94具体用于:
将所述滑动窗口内的各所述栅格单元的类别修改为第一目标类别,所述第一目标类别为所述滑动窗口内数量最多的所述栅格单元的初始类别;
或,将所述滑动窗口内的各所述栅格单元的类别修改为第二目标类别,所第二目标类别为所述滑动窗口内所有栅格单元的属性值的平均值所对应的所述初始类别。
本实施例提供的空间数据聚类系统,通过各个模块之间的相互配合,通过获取模块获取待测取待测地理空间的至少一个栅格单元,通过类别确定模块,基于自然断点分类法对测待测地理空间中的栅格单元,基于栅格单元的属性值进行初始分类,划分模块中可以通过滑动窗口遍历栅格单元,对滑动窗口内局部的栅格单元基于属性值进行空间异常点和非空间异常点的划分,类别更新模块用于对非空间异常点的类别进行修改更新,本实施例的空间数据聚类系统通过各个模块使用上述的空间数据聚类方法,保留了整个待测地理空间中的空间异常点对应的栅格单元,保证了空间数据聚类的属性相似性,通过对非空间异常点的类别进行更新修改,避免相似的栅格单元被分成不同的类别,提升了空间数据聚类结果的空间连续性,通过滑动窗口的探测方式,使得该方法的应用场景更加灵活,满足不同场景下的地理分析应用要求,可以输出不同区域、不同空间精度的空间数据聚类结果。
图10示例了一种电子设备的实体结构示意图,如图10所示,该电子设备可以包括:处理器(processor)1010、通信接口(Communications Interface)1020、存储器(memory)1030和通信总线1040,其中,处理器1010,通信接口1020,存储器1030通过通信总线1040完成相互间的通信。处理器1010可以调用存储器1030中的逻辑指令,以执行空间数据聚类方法,该方法包括:
获取待测地理空间的至少一个栅格单元;
基于各所述栅格单元的属性值,确定各所述栅格单元的初始类别;
基于滑动窗口遍历各所述栅格单元,基于所述滑动窗口内的各所述栅格单元的属性值,将所述滑动窗口内的各所述栅格单元划分为空间异常点和非空间异常点;
基于所述滑动窗口内的各所述栅格单元的属性值,更新各所述非空间异常点对应的栅格单元的类别;
所述更新各所述非空间异常点对应的栅格单元的类别,包括以下至少一项:
将所述滑动窗口内的各所述栅格单元的类别修改为第一目标类别,所述第一目标类别为所述滑动窗口内数量最多的所述栅格单元的初始类别;
将所述滑动窗口内的各所述栅格单元的类别修改为第二目标类别,所第二目标类别为所述滑动窗口内所有栅格单元的属性值的平均值所对应的所述初始类别。
此外,上述的存储器1030中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
又一方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行空间数据聚类方法,该方法包括:
获取待测地理空间的至少一个栅格单元;
基于各所述栅格单元的属性值,确定各所述栅格单元的初始类别;
基于滑动窗口遍历各所述栅格单元,基于所述滑动窗口内的各所述栅格单元的属性值,将所述滑动窗口内的各所述栅格单元划分为空间异常点和非空间异常点;
基于所述滑动窗口内的各所述栅格单元的属性值,更新各所述非空间异常点对应的栅格单元的类别;
所述更新各所述非空间异常点对应的栅格单元的类别,包括以下至少一项:
将所述滑动窗口内的各所述栅格单元的类别修改为第一目标类别,所述第一目标类别为所述滑动窗口内数量最多的所述栅格单元的初始类别;
将所述滑动窗口内的各所述栅格单元的类别修改为第二目标类别,所第二目标类别为所述滑动窗口内所有栅格单元的属性值的平均值所对应的所述初始类别。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (10)

1.一种空间数据聚类方法,其特征在于,包括:
获取待测地理空间的至少一个栅格单元;
基于各所述栅格单元的属性值,确定各所述栅格单元的初始类别;
基于滑动窗口遍历各所述栅格单元,基于所述滑动窗口内的各所述栅格单元的属性值,将所述滑动窗口内的各所述栅格单元划分为空间异常点和非空间异常点;
基于所述滑动窗口内的各所述栅格单元的属性值,更新各所述非空间异常点对应的栅格单元的类别;
所述更新各所述非空间异常点对应的栅格单元的类别,包括以下至少一项:
将所述滑动窗口内的各所述栅格单元的类别修改为第一目标类别,所述第一目标类别为所述滑动窗口内数量最多的所述栅格单元的初始类别;
将所述滑动窗口内的各所述栅格单元的类别修改为第二目标类别,所述第二目标类别为所述滑动窗口内所有栅格单元的属性值的平均值所对应的所述初始类别;
所述各所述栅格单元的属性值为定量不变数据。
2.根据权利要求1所述的空间数据聚类方法,其特征在于,所述基于所述滑动窗口内的各所述栅格单元的属性值,将所述滑动窗口内的各所述栅格单元划分为空间异常点和非空间异常点,包括:
获取所述滑动窗口内的各所述栅格单元的属性值极差;
在所述属性值极差大于第一预设阈值的情况下,判定所述滑动窗口内包括空间异常点;
在所述属性值极差小于或等于所述第一预设阈值的情况下,判定所述滑动窗口内的各所述栅格单元为所述非空间异常点。
3.根据权利要求2所述的空间数据聚类方法,其特征在于,所述在所述属性值极差大于第一预设阈值的情况下,判定所述滑动窗口内包括空间异常点,包括:
在所述滑动窗口内的各所述栅格单元的属性值的平均值大于各所述栅格单元的属性值的中位数值的情况下,划定所述滑动窗口内所述属性值最大的所述栅格单元为所述空间异常点;
在所述滑动窗口内的各所述栅格单元的属性值的平均值小于或等于各所述栅格单元的属性值的中位数值的情况下,划定所述滑动窗口内所述属性值最小的所述栅格单元为所述空间异常点。
4.根据权利要求3所述的空间数据聚类方法,其特征在于,所述在所述属性值极差大于第一预设阈值的情况下,判定所述滑动窗口内包括空间异常点之后,还包括:
移除所述滑动窗口内的所述空间异常点对应的所述栅格单元;
在所述滑动窗口内的剩余所述栅格单元的属性值标准差大于第二预设阈值的情况下,划定所述剩余所述栅格单元为空间异常点;
在所述滑动窗口内的所述剩余所述栅格单元的属性值标准差小于或等于所述第二预设阈值的情况下,划定所述剩余所述栅格单元为非空间异常点。
5.根据权利要求1所述的空间数据聚类方法,其特征在于,所述空间异常点对应的各所述栅格单元的类别为各所述栅格单元的初始类别。
6.根据权利要求1所述的空间数据聚类方法,其特征在于,所述基于滑动窗口遍历各所述栅格单元,包括:
所述滑动窗口在所述待测地理空间内从左至右和/或从上至下依次遍历所述待测地理空间内的各所述栅格单元,滑动步长为一个栅格。
7.根据权利要求1所述的空间数据聚类方法,其特征在于,所述滑动窗口为固定边长的正方形。
8.一种空间数据聚类系统,其特征在于,包括:
获取模块,用于获取待测地理空间的至少一个栅格单元;
类别确定模块,用于基于各所述栅格单元的属性值,确定各所述栅格单元的初始类别;
划分模块,用于基于滑动窗口遍历各所述栅格单元,基于所述滑动窗口内的各所述栅格单元的属性值,将所述滑动窗口内的各所述栅格单元划分为空间异常点和非空间异常点;
类别更新模块,用于基于所述滑动窗口内的各所述栅格单元的属性值,更新各所述非空间异常点对应的栅格单元的类别;
所述类别更新模块具体用于:
将所述滑动窗口内的各所述栅格单元的类别修改为第一目标类别,所述第一目标类别为所述滑动窗口内数量最多的所述栅格单元的初始类别;
或,将所述滑动窗口内的各所述栅格单元的类别修改为第二目标类别,所述第二目标类别为所述滑动窗口内所有栅格单元的属性值的平均值所对应的所述初始类别;
所述各所述栅格单元的属性值为定量不变数据。
9.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至7任一项所述的空间数据聚类方法。
10.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的空间数据聚类方法。
CN202310501476.2A 2023-05-06 2023-05-06 空间数据聚类方法、系统、设备及介质 Active CN116226697B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310501476.2A CN116226697B (zh) 2023-05-06 2023-05-06 空间数据聚类方法、系统、设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310501476.2A CN116226697B (zh) 2023-05-06 2023-05-06 空间数据聚类方法、系统、设备及介质

Publications (2)

Publication Number Publication Date
CN116226697A CN116226697A (zh) 2023-06-06
CN116226697B true CN116226697B (zh) 2023-07-25

Family

ID=86579075

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310501476.2A Active CN116226697B (zh) 2023-05-06 2023-05-06 空间数据聚类方法、系统、设备及介质

Country Status (1)

Country Link
CN (1) CN116226697B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117974927B (zh) * 2024-03-28 2024-06-25 煤炭科学研究总院有限公司 四维属性地质模型的煤矿灾害实时预警方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110909671A (zh) * 2019-11-21 2020-03-24 大连理工大学 一种融合概率和高度信息的栅格地图障碍物检测方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104699728B (zh) * 2013-12-05 2018-06-05 中国科学院地理科学与资源研究所 一种基于滑动窗口的生态交错带自动识别方法
US10121106B2 (en) * 2014-06-30 2018-11-06 Digitalglobe, Inc. Spectral data analytic cube classifier (SPADACC) for continuous wide area geospatial modeling using normalized and highly dimensional multispectal raster data
CN110569749B (zh) * 2019-08-22 2021-11-30 江苏徐工工程机械研究院有限公司 一种矿山道路的边界线及可行驶区域检测方法及系统
CN111985322B (zh) * 2020-07-14 2024-02-06 西安理工大学 一种基于激光雷达的道路环境要素感知方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110909671A (zh) * 2019-11-21 2020-03-24 大连理工大学 一种融合概率和高度信息的栅格地图障碍物检测方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
An overview of clustering methods for geo-referenced time series: from one-way clustering to co- and tri-clustering;Xiaojing Wu等;International Journal of Geographical Information Science;第1822-1848页 *
Clustering of the self-organizing map using a clustering validity index based on inter-cluster density;Sitao Wu等;Pattern Recognition;第175-188页 *

Also Published As

Publication number Publication date
CN116226697A (zh) 2023-06-06

Similar Documents

Publication Publication Date Title
CN112883820B (zh) 基于激光雷达点云的道路目标3d检测方法及系统
CN116226697B (zh) 空间数据聚类方法、系统、设备及介质
CN111383244B (zh) 一种目标检测跟踪方法
CN106815842A (zh) 一种改进的基于超像素的图像显著性检测方法
CN111739020B (zh) 周期纹理背景缺陷标签自动标注方法、装置、设备及介质
US20170178341A1 (en) Single Parameter Segmentation of Images
CN115439615B (zh) 一种基于三维bim的分布式综合管理系统
CN107527356B (zh) 一种基于懒交互方式的视频跟踪方法
CN112785591A (zh) 一种ct影像中肋骨骨折的检测与分割方法及装置
CN113569830A (zh) 陈列物品行列位置的确定方法、装置、设备及存储介质
CN114674826A (zh) 基于布匹的视觉检测方法及检测系统
CN111445411B (zh) 图像去噪方法、装置、计算机设备和存储介质
CN109657577B (zh) 一种基于熵和运动偏移量的动物检测方法
CN114882192B (zh) 一种建筑立面的分割方法、装置、电子设备以及存储介质
CN116092035A (zh) 车道线检测方法、装置、计算机设备和存储介质
CN114511862A (zh) 表格识别方法、装置及电子设备
CN112491999B (zh) 一种数据上报方法及装置
CN111127701B (zh) 车辆失效场景检测方法及系统
CN113657196A (zh) Sar图像目标检测方法、装置、电子设备和存储介质
CN113808144A (zh) 基于直方图拟合的密度峰值聚类土壤图像阴影检测方法
CN109727218B (zh) 一种完整图形提取方法
CN117315458B (zh) 遥感图像的目标检测方法、装置、电子设备及存储介质
CN116128715B (zh) 一种图形仿射变换方法及装置
CN117874158B (zh) 聚类地图位置数据的自适应调整方法和装置
Wang Research on Remote Sensing Image Target Detection Algorithm Based on Optical Measurement Information

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant