CN108537274A - 一种基于网格的空间多尺度快速聚类方法 - Google Patents

一种基于网格的空间多尺度快速聚类方法 Download PDF

Info

Publication number
CN108537274A
CN108537274A CN201810307824.1A CN201810307824A CN108537274A CN 108537274 A CN108537274 A CN 108537274A CN 201810307824 A CN201810307824 A CN 201810307824A CN 108537274 A CN108537274 A CN 108537274A
Authority
CN
China
Prior art keywords
grid
density
matrix
scale
point
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810307824.1A
Other languages
English (en)
Other versions
CN108537274B (zh
Inventor
桂志鹏
隆玺
彭德华
吴华意
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan University WHU
Original Assignee
Wuhan University WHU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan University WHU filed Critical Wuhan University WHU
Priority to CN201810307824.1A priority Critical patent/CN108537274B/zh
Publication of CN108537274A publication Critical patent/CN108537274A/zh
Application granted granted Critical
Publication of CN108537274B publication Critical patent/CN108537274B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/231Hierarchical techniques, i.e. dividing or merging pattern sets so as to obtain a dendrogram

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于网格的空间多尺度快速聚类方法,包括:S1、选择数据尺度,确定网格的尺寸,对样本数据进行网格化,统计各网格的密度值;S2、指定初始密度阈值保留满足阈值条件的所有网格,得到初步的密度矩阵;S3、根据观察尺度指定滤波器模板,对全局网格空间进行卷积操作;S4、通过邻域搜索生成连通区作为初步聚类结果;对网格进行积分操作将网格空间映射到原始点集上得到原始点集聚类结果;S5、调整观察尺度,用变换的新滤波器对结果矩阵重复S3和S4,得到下一个观察尺度的聚类结果;S6、改变数据尺度,重复S1至S5,得到不同数据尺度下的聚类结果。本发明算法复杂度低,聚类效率和精度高,能满足海量点集实时多尺度聚类及可视化分析需求。

Description

一种基于网格的空间多尺度快速聚类方法
技术领域
本发明涉及大数据分析挖掘与可视化领域,尤其涉及一种基于网格的空间多尺度快速聚类方法。
背景技术
聚类是探索性数据分析的一个重要手段,具有广泛的应用。但传统的聚类方法未明确提出数据尺度和观察尺度的概念并说明其在聚类分析中发挥的作用,也很少显式的将这两个尺度因素作为聚类的依据,这限制了我们观察、分析事物的维度,使得聚类结果不够客观全面。尤其是海量时空数据场景下,数据中蕴含的信息通常更加复杂、结构更加丰富,单一尺度的聚类算法很难充分挖掘其中的模式规律。针对现有聚类算法尺度单一导致的认知片面问题,有学者提出了如Ripley,sK函数、层次聚类等多尺度聚类方法,但这些方法通常具有较高的计算复杂度,难以适应海量数据聚类的需求;而小波聚类、STING 聚类等基于网格的多尺度聚类算法,虽然聚类效率很高,但尺度定义不够清晰、聚类结果也不够精细,而且难以解决聚类簇内部密度分布变化较大、多个聚类簇之间密度不均的问题。
发明内容
本发明要解决的技术问题在于针对现有技术中大规模数据集中,聚类尺度单一、聚类效率较低以及网格聚类无法识别多密度聚类簇的缺陷,提供一种基于网格的空间多尺度快速聚类方法。
本发明解决其技术问题所采用的技术方案是:
本发明提供一种基于网格的空间多尺度快速聚类方法,该方法包括以下步骤:
S1、获取包含N维样本的海量点数据集,选定一个数据尺度,以该尺度上各数据维度属性的分辨率作为划分网格单元大小的依据,将N维空间划分成不相交的网格单元;统计落在每个网格单元中原始数据点的数量,将其定义为网格单元的密度属性,以此构建网格密度矩阵;
S2、指定密度阈值T,对网格单元进行筛选并得到满足阈值条件的新网格密度矩阵;
S3、指定一个滤波器模板,对密度阈值过滤后的网格密度矩阵进行全局滤波处理;
S4、通过邻域搜索,连接密度非零的网格单元生成连通区,对每个连通区包含的网格单元进行积分操作,并根据密度积分阈值V剔除密度积分不满足条件的连通区,得到剔除后的网格连通区;将每个网格连通区作为一个聚类,并将网格单元对应的聚类类别信息映射到原始数据点上,得到最终的聚类结果;
S5、对滤波器模板进行尺度变换,使用变换后新生成的滤波器模板对步骤S2中得到的密度矩阵重复步骤S3和步骤S4,得到不同观察尺度下的聚类结果;
S6、改变数据尺度,以新的网络单元格大小对N维空间重新进行网格划分,重复步骤S1至步骤S5,得到不同数据尺度下的聚类结果。
进一步地,本发明的步骤S1的具体方法为:
S11、获取包含N维样本的海量点数据集X={x1,x2,x3,x4},根据数据尺度下各维度属性的分辨率,确定在该数据尺度下每个维度上的网格尺寸 E={ε1,ε2,ε3...εd};
S12、根据数据集X上各维度属性取值的最大最小值,分别计算网格各维度的划分数量,并据此对各个维度空间进行网格划分:
M={m1,m2,m3…md},
其中,mi表示第i个维度上网格的划分数量,xi为X中所有样本第i个维属性值构成的向量,max(Xi)和min(Xi)分别是向量Xi对应属性维度取值的最大和最小值,则M构成了d维属性空间各属性维度划分数量的向量表达;
S13、遍历原始数据点集,把每一个点都映射到相应的网格中:
定义网格集合G(g1,g2,g3...gs)为所有网格单元构成的集合(其中),G0为缓存网格集合,用来缓存与当前点存在交集的网格,即包含该点的网格;遍历点集,若对于点集中的某一点则把gi加入进缓存网格集合中,即令G0=G0∪{gi};
根据点在网格单元中的隶属关系,调整网格单元密度;若点落在某一网格内部,则令该网格密度值增加1;若点落在网格边线上,那么该点与两个网格单元存在交集,则令这两个网格单元的密度值同时增加0.5;若点落在四个网格共享的顶点处,则令这四个网格单元的密度值同时增加0.25,即采用如下公式更新网格密度矩阵中各个网格单元对应的密度值:
其中Matrix0(G0)表示集合G0所包含网格在密度矩阵Matrix0中对应的密度值, |G0|表示G0中元素个数;
然后清空缓存集合G0,遍历下一个点对象,直至遍历完所有的点对象,记最终密度矩阵为Matrix1
进一步地,本发明的步骤S2的具体方法为:
基于密度阈值参数T对Matrix1中每一个网格单元进行阈值筛选,当网格单元密度值小于阈值T时,调整该网格单元密度值为0;否则,不作任何调整;遍历所有网格单元,得到密度阈值过滤后的新网格密度矩阵Matrix2
进一步地,本发明的步骤S3的具体方法为:
S31、选取一个d维的滤波器模板F=(f1,f2,f3...fd),其中fi是一个长度为l 的一维信号向量;
S32、对每个数据属性维度分别进行离散卷积操作:
其中,Matrix3(k1,k2,...,kd)表示在网格密度矩阵Matrix3中索引为 (k1,k2,...,kd)网格单元的密度,符号表示向下取整操作,从而得到卷积之后的网格密度矩阵Matrix3
进一步地,本发明的步骤S4的具体方法为:
S41、根据Matrix3中密度值非零网格单元之间邻接关系生成网格单元连通区,并为每个连通区赋予不同的类别标签作为初始的聚类结果,连通区计算方法包括四邻域、八邻域及其高维拓展;
S42、根据连通区密度积分阈值V分别对每个连通区域中网格单元密度值进行累加,剔除密度积分值小于阈值V的连通区,每个保留下来的满足密度积分阈值条件的连通区域即为一个聚类簇;
S43、将网格的连通区结果映射到原始点集,为每一个点赋予所在网格单元对应的类别标签,即得到每个点在该观察尺度下的聚类类属信息;若网格单元不属于任何聚类簇,则对应点属于噪声点。
进一步地,本发明的步骤S5的具体方法为:
S51、根据观察尺度对滤波器模板进行尺度变换,拓展滤波器模板长度。使用滤波器的目的在于除去孤立的噪声网格单元,并通过网格密度补值的方式连接距离邻近但不相邻网格单元,达到网格平滑的效果;通过不断拓展滤波器模板长度,实现由识别高密度热点区域到更大范围中低密度连通区域逐渐拓展的多层次聚类效果,以反映和刻画人观察和认识对象时候的层次化和阶段化过程。滤波器模板拓展方法包括离散二进小波变换和高斯滤波器的参数调整法;
S52、将网格矩阵Matrix2作为新的网格矩阵计数,利用新得到的模板对网格矩阵Matrix2进行步骤S3至步骤S4的操作,得到不同观察尺度下的聚类结果。
进一步地,本发明的步骤S6的具体方法为:
改变数据尺度,以该数据尺度上各数据属性维度的分辨率作为依据,重新划分网格空间的单元格大小,重复步骤S1至步骤S5的操作,得到不同数据尺度下的聚类结果。
本发明产生的有益效果是:本发明提出了一种新的基于网格的海量数据多尺度聚类算法处理流程,将数据尺度和观察尺度作为尺度维度引入聚类过程,并通过滤波器模板拓展建立不同尺度聚类结果之间的内在逻辑关系。该算法复杂度低、聚类效率高;同时,相对于小波聚类等基于网格的聚类算法,本算法的聚类结果在聚类边缘的精度表现更好,而且能够解决聚类簇内部密度变化较大、不同聚类簇之间密度分布不均的问题。
附图说明
下面将结合附图及实施例对本发明作进一步说明,附图中:
图1是本算法的核心概念图;
图2是本算法的计算流程图;
图3是不同数据尺度下的一组聚类结果;
图4是256×256网格单元数量对应数据尺度下不同观察尺度的聚类结果;
图5是对网格采取的滤波器示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
现有一千三百万中国大陆企业的位置数据,需要对上述企业POI位置点进行聚类,从而得到不同空间尺度下企业的空间分布模式(如:分布范围、企业集聚与共位模式)。由于点规模巨大,传统聚类算法很难高效地聚类,也无法得到多个数据尺度和观察尺度下的聚类效果。其中不同的数据尺度是指企业 POI数据不同粒度的空间统计单元或地理空间分辨率(如,个体POI点、千米格网),体现在不同大小的网格划分;而观察尺度则是模拟人在观察时不同的认知阶段,体现在同一数据尺度下,聚类认知范围从局部高密度聚类核心区域向更大范围中/低密度连通区域扩展的渐变过程。
本发明通过基于网格的聚类算法,采用不同的网格单元大小和不同长度的滤波器模板,生成不同数据尺度和观察尺度约束下的多组聚类结果。
下面将结合本发明中的附图,对本发明的算法过程进行详细阐述,具体步骤如下:
1)将中国地图的最小外接矩形进行网格划分,根据数据尺度的不同调整网格划分的单元格大小;
2)将所有的POI点映射到每个网格单元当中,统计并记录每个网格单元的密度值和每个点对应网格的索引标识ID;
3)设置自适应数据尺度的密度阈值,基于密度阈值对网格单元进行初步筛选:
其中r表示网络划分的行数或列数。
通过阈值T去除极低密度的网格;若暂时不考虑观察尺度的改变,直接计算不同数据尺度的聚类结果,则:
4)对所有密度值非零的网格单元进行四邻域的连通区搜索,搜索算法如下:
①设定标记值的初始值mark=0,并将mark值赋给第一个网格单元;
②向右逐行对网格单元进行遍历,选择密度值大于0的网格单元进行赋值,赋值情况如下:
i.如果当前网格单元左边的相邻网格单元密度值大于0,并且上方的相邻网格单元密度值为0,那么给当前网格单元赋予和左边网格单元一样的标记值mark(i,j)=left_mark(i,j);
ii.如果当前网格单元左边的相邻网格单元密度值等于0,而上方的相邻网格单元密度值大于0,那么给当前网格单元赋予和上方网格单元一样的标记值mark(i,j)=top_mark(i,j);
iii.如果当前网格单元左边和上方的相邻网格单元密度值都等于0,那么让 mark=mark+1,给当前网格赋予新的标记mark(i,j)=mark值;
iv.如果当前网格单元左边和上方的相邻网格单元密度值都大于0,那么让当前网格单元赋予左边网格单元的标记值left_mark(i,j),并且重新遍历已遍历的网格单元,统一当前网格单元左邻和上邻对应的标注,让标记值等于top_mark(i,j)的网格单元更新标记值为left_mark(i,j);
③标注过程中可能产生不同聚类簇的标注值不连续的情况,将标记值更新为1,2,3…顺序的聚类类别ID值,统计不同标记取值的个数n,n对应聚类结果中的聚类簇个数。
通过搜索连通区,可以得到如图3所示的不同数据尺度下的一组聚类结果,其中a)是在4096×4096的网格划分下的聚类结果,b)是在1024×1024的网格划分下的聚类结果,c)是在256×256的网格划分下的聚类结果,d)是在64×64 的网格划分下的聚类结果,e)是在16×16网格划分下的聚类结果。
固定数据尺度,生成该数据尺度下不同观察尺度对应的聚类结果(以 256×256网格划分对应的数据尺度为例),操作步骤如下:
5)使用如图5所示滤波器对网格进行滤波操作,其中图4中的a)采取了3×3 的滤波器,b)采取了5×5的滤波器,c)采取了7×7的滤波器,d)-f)依照递增规律采取了更大的滤波器。利用这类滤波器进行滤波操作不仅可以除去噪声网格,也可以对整个网格空间进行平滑插值,使聚类结果更加平滑连续。利用多组不同大小的滤波器,达到在观察尺度上从局部高密度聚类区域到全局中低密度连通区域聚类的多尺度聚类效果。
6)通过对非零网格单元的连通区搜索,统计每个聚类簇的网格密度总值,将该参数作为密度积分阈值筛选的依据;
根据观察尺度设置筛选聚类的积分阈值。对所有聚类簇的密度积分从大到小排序,设置密度积分阈值为第一个十分位数(对应密度积分阈值为150),提取出高密度的聚类簇作为第一个观察尺度的聚类结果,表示初步的观察范围会停留在高密度的区域,如图4a)所示。图4b)中取第二个十分位数作为密度积分阈值,得到了更大范围的聚类效果。以此类推,可以得到其余观察尺度的聚类结果。
应当理解的是,对本领域普通技术人员来说,可以根据上述说明加以改进或变换,而所有这些改进和变换都应属于本发明所附权利要求的保护范围。

Claims (7)

1.一种基于网格的空间多尺度快速聚类方法,其特征在于,该方法包括以下步骤:
S1、获取包含N维样本的海量点数据集,选定一个数据尺度,以该尺度上各数据维度属性的分辨率作为划分网格单元大小的依据,将N维空间划分成不相交的网格单元;统计落在每个网格单元中原始数据点的数量,将其定义为网格单元的密度属性,以此构建网格密度矩阵;
S2、指定密度阈值T,对网格单元进行筛选并得到满足阈值条件的新网格密度矩阵;
S3、指定一个滤波器模板,对密度阈值过滤后的网格密度矩阵进行全局滤波处理;
S4、通过邻域搜索,连接密度非零的网格单元生成连通区,对每个连通区包含的网格单元进行积分操作,并根据密度积分阈值V剔除密度积分不满足条件的连通区,得到剔除后的网格连通区;将每个网格连通区作为一个聚类,并将网格单元对应的聚类类别信息映射到原始数据点上,得到最终的聚类结果;
S5、对滤波器模板进行尺度变换,使用变换后新生成的滤波器模板对步骤S2中得到的密度矩阵重复步骤S3和步骤S4,得到不同观察尺度下的聚类结果;
S6、改变数据尺度,以新的网络单元格大小对N维空间重新进行网格划分,重复步骤S1至步骤S5,得到不同数据尺度下的聚类结果。
2.根据权利要求1所述的基于网格的空间多尺度快速聚类方法,其特征在于,步骤S1的具体方法为:
S11、获取包含N维样本的海量点数据集X={x1,x2,x3,x4},根据数据尺度下各维度属性的分辨率,确定在该数据尺度下每个维度上的网格尺寸E={ε1,ε2,ε3...εd};
S12、根据数据集X上各维度属性取值的最大最小值,分别计算网格各维度的划分数量,并据此对各个维度空间进行网格划分:
其中,mi表示第i个维度上网格的划分数量,xi为X中所有样本第i个维属性值构成的向量,max(Xi)和min(Xi)分别是向量Xi对应属性维度取值的最大和最小值,则M构成了d维属性空间各属性维度划分数量的向量表达;
S13、遍历原始数据点集,把每一个点都映射到相应的网格中:
定义网格集合G(g1,g2,g3...gs)为所有网格单元构成的集合(其中),G0为缓存网格集合,用来缓存与当前点存在交集的网格,即包含该点的网格;遍历点集,若对于点集中的某一点xj=(a1,a2,a3...ad),则把gi加入进缓存网格集合中,即令G0=G0∪{gi};
根据点在网格单元中的隶属关系,调整网格单元密度;若点落在某一网格内部,则令该网格密度值增加1;若点落在网格边线上,那么该点与两个网格单元存在交集,则令这两个网格单元的密度值同时增加0.5;若点落在四个网格共享的顶点处,则令这四个网格单元的密度值同时增加0.25,即采用如下公式更新网格密度矩阵中各个网格单元对应的密度值:
其中Matrix0(G0)表示集合G0所包含网格在密度矩阵Matrix0中对应的密度值,|G0|表示G0中元素个数;
然后清空缓存集合G0,遍历下一个点对象,直至遍历完所有的点对象,记最终密度矩阵为Matrix1
3.根据权利要求2所述的基于网格的空间多尺度快速聚类方法,其特征在于,步骤S2的具体方法为:
基于密度阈值参数T对Matrix1中每一个网格单元进行阈值筛选,当网格单元密度值小于阈值T时,调整该网格单元密度值为0;否则,不作任何调整;遍历所有网格单元,得到密度阈值过滤后的新网格密度矩阵Matrix2
4.根据权利要求2所述的基于网格的空间多尺度快速聚类方法,其特征在于,步骤S3的具体方法为:
S31、选取一个d维的滤波器模板F=(f1,f2,f3...fd),其中fi是一个长度为l的一维信号向量;
S32、对每个数据属性维度分别进行离散卷积操作:
其中,Matrix3(k1,k2,...,kd)表示在网格密度矩阵Matrix3中索引为(k1,k2,...,kd)网格单元的密度,符号表示向下取整操作,从而得到卷积之后的网格密度矩阵Matrix3
5.根据权利要求2所述的基于网格的空间多尺度快速聚类方法,其特征在于,步骤S4的具体方法为:
S41、根据Matrix3中密度值非零网格单元之间邻接关系生成网格单元连通区,并为每个连通区赋予不同的类别标签作为初始的聚类结果,连通区计算方法包括四邻域、八邻域及其高维拓展;
S42、根据连通区密度积分阈值V分别对每个连通区域中网格单元密度值进行累加,剔除密度积分值小于阈值V的连通区,每个保留下来的满足密度积分阈值条件的连通区域即为一个聚类簇;
S43、将网格的连通区结果映射到原始点集,为每一个点赋予所在网格单元对应的类别标签,即得到每个点在该观察尺度下的聚类类属信息;若网格单元不属于任何聚类簇,则对应点属于噪声点。
6.根据权利要求2所述的基于网格的空间多尺度快速聚类方法,其特征在于,步骤S5的具体方法为:
S51、根据观察尺度对滤波器模板进行尺度变换,拓展滤波器模板长度。使用滤波器的目的在于除去孤立的噪声网格单元,并通过网格密度补值的方式连接距离邻近但不相邻网格单元,达到网格平滑的效果;通过不断拓展滤波器模板长度,实现由识别高密度热点区域到更大范围中低密度连通区域逐渐拓展的多层次聚类效果,以反映和刻画人观察和认识对象时候的层次化和阶段化过程。滤波器模板拓展方法包括离散二进小波变换和高斯滤波器的参数调整法;
S52、将网格矩阵Matrix2作为新的网格矩阵计数,利用新得到的模板对网格矩阵Matrix2进行步骤S3至步骤S4的操作,得到不同观察尺度下的聚类结果。
7.根据权利要求1所述的基于网格的空间多尺度快速聚类方法,其特征在于,步骤S6的具体方法为:
改变数据尺度,以该数据尺度上各数据属性维度的分辨率作为依据,重新划分网格空间的单元格大小,重复步骤S1至步骤S5的操作,得到不同数据尺度下的聚类结果。
CN201810307824.1A 2018-04-08 2018-04-08 一种基于网格的企业poi位置点快速空间多尺度聚类方法 Active CN108537274B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810307824.1A CN108537274B (zh) 2018-04-08 2018-04-08 一种基于网格的企业poi位置点快速空间多尺度聚类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810307824.1A CN108537274B (zh) 2018-04-08 2018-04-08 一种基于网格的企业poi位置点快速空间多尺度聚类方法

Publications (2)

Publication Number Publication Date
CN108537274A true CN108537274A (zh) 2018-09-14
CN108537274B CN108537274B (zh) 2020-06-19

Family

ID=63483372

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810307824.1A Active CN108537274B (zh) 2018-04-08 2018-04-08 一种基于网格的企业poi位置点快速空间多尺度聚类方法

Country Status (1)

Country Link
CN (1) CN108537274B (zh)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110309437A (zh) * 2019-06-26 2019-10-08 京东数字科技控股有限公司 一种信息推送方法和装置
CN110427531A (zh) * 2019-07-19 2019-11-08 清华大学 对多个样本进行网格布局可视化的方法和系统
CN110806509A (zh) * 2019-11-29 2020-02-18 广州供电局有限公司 雷电活动空间特征检测方法和装置
CN111291276A (zh) * 2020-01-13 2020-06-16 武汉大学 一种基于局部方向中心性度量的聚类方法
CN111680751A (zh) * 2020-06-09 2020-09-18 南京农业大学 一种谷物产量图异常数据检测算法
CN111738894A (zh) * 2020-07-29 2020-10-02 武大吉奥信息技术有限公司 一种构建平衡网格的方法、系统和终端设备
CN111967696A (zh) * 2020-10-23 2020-11-20 北京国新智电新能源科技有限责任公司 基于神经网络的电动汽车充电需求预测方法、系统及装置
CN113379345A (zh) * 2021-05-27 2021-09-10 芜湖锋珉信息科技有限公司 一种基于轨迹追踪的智能物流处理方法和系统
CN113537329A (zh) * 2021-07-30 2021-10-22 山西大学 一种逐位置快速估算各类地物概率分布的方法
CN113704608A (zh) * 2021-08-26 2021-11-26 武汉卓尔数字传媒科技有限公司 个性化项目推荐方法、装置、电子设备及存储介质
CN113822048A (zh) * 2021-09-16 2021-12-21 电子科技大学 一种基于时空突发特征的社交媒体文本去噪方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140372444A1 (en) * 2013-06-14 2014-12-18 Samsung Sds Co., Ltd. Data clustering apparatus and method
CN104361578A (zh) * 2014-10-20 2015-02-18 北京大学 一种多尺度精度控制下的层次化网格分割方法
CN107038248A (zh) * 2017-04-27 2017-08-11 杭州杨帆科技有限公司 一种基于弹性分布数据集的海量空间数据密度聚类方法
CN107491779A (zh) * 2017-06-27 2017-12-19 重庆邮电大学 一种基于密度峰值的网格聚类算法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140372444A1 (en) * 2013-06-14 2014-12-18 Samsung Sds Co., Ltd. Data clustering apparatus and method
CN104361578A (zh) * 2014-10-20 2015-02-18 北京大学 一种多尺度精度控制下的层次化网格分割方法
CN107038248A (zh) * 2017-04-27 2017-08-11 杭州杨帆科技有限公司 一种基于弹性分布数据集的海量空间数据密度聚类方法
CN107491779A (zh) * 2017-06-27 2017-12-19 重庆邮电大学 一种基于密度峰值的网格聚类算法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
TAKUYA TSUJI,AKIHITO ITO: "Multi-scale of clustering particles", 《POWDER TECHNOLOGY》 *
杨悦: "面向空间数据复杂性特征的聚类分析方法研究", 《中国博士学位论文全文数据库 信息科技辑》 *
沙占江,马海州: "多尺度空间分层聚类算法在土地利用与土地覆被研究中的应用", 《地理科学》 *
游兰,张海兵: "一种时区聚类协同过滤的空间信息服务质量预测", 《测绘科学》 *

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110309437A (zh) * 2019-06-26 2019-10-08 京东数字科技控股有限公司 一种信息推送方法和装置
CN110427531A (zh) * 2019-07-19 2019-11-08 清华大学 对多个样本进行网格布局可视化的方法和系统
CN110806509A (zh) * 2019-11-29 2020-02-18 广州供电局有限公司 雷电活动空间特征检测方法和装置
CN111291276B (zh) * 2020-01-13 2023-05-19 武汉大学 一种基于局部方向中心性度量的聚类方法
CN111291276A (zh) * 2020-01-13 2020-06-16 武汉大学 一种基于局部方向中心性度量的聚类方法
CN111680751A (zh) * 2020-06-09 2020-09-18 南京农业大学 一种谷物产量图异常数据检测算法
CN111738894A (zh) * 2020-07-29 2020-10-02 武大吉奥信息技术有限公司 一种构建平衡网格的方法、系统和终端设备
CN111967696A (zh) * 2020-10-23 2020-11-20 北京国新智电新能源科技有限责任公司 基于神经网络的电动汽车充电需求预测方法、系统及装置
CN111967696B (zh) * 2020-10-23 2021-01-29 北京国新智电新能源科技有限责任公司 基于神经网络的电动汽车充电需求预测方法、系统及装置
CN113379345A (zh) * 2021-05-27 2021-09-10 芜湖锋珉信息科技有限公司 一种基于轨迹追踪的智能物流处理方法和系统
CN113537329A (zh) * 2021-07-30 2021-10-22 山西大学 一种逐位置快速估算各类地物概率分布的方法
CN113704608A (zh) * 2021-08-26 2021-11-26 武汉卓尔数字传媒科技有限公司 个性化项目推荐方法、装置、电子设备及存储介质
CN113822048A (zh) * 2021-09-16 2021-12-21 电子科技大学 一种基于时空突发特征的社交媒体文本去噪方法
CN113822048B (zh) * 2021-09-16 2023-03-21 电子科技大学 一种基于时空突发特征的社交媒体文本去噪方法

Also Published As

Publication number Publication date
CN108537274B (zh) 2020-06-19

Similar Documents

Publication Publication Date Title
CN108537274A (zh) 一种基于网格的空间多尺度快速聚类方法
CN109272170B (zh) 一种基于Louvain算法的交通小区划分系统
CN106548141B (zh) 一种基于三角网的面向对象耕地信息自动提取方法
CN107784657A (zh) 一种基于颜色空间分类的无人机遥感图像分割方法
CN109753995A (zh) 一种基于3d目标分类和场景语义分割的网络优化结构
CN104376556B (zh) 一种岩石ct图像目标分割方法
CN106981092B (zh) 基于Priority-Flood的内流流域提取方法
CN106845536B (zh) 一种基于图像缩放的并行聚类方法
Raimbault et al. Space matters: Extending sensitivity analysis to initial spatial conditions in geosimulation models
Yang et al. A modified clustering method based on self-organizing maps and its applications
CN107292336A (zh) 一种基于dcgan的极化sar图像分类方法
CN101908213A (zh) 基于量子免疫克隆的sar图像变化检测方法
CN111507415A (zh) 一种基于分布密度的多源大气数据聚类方法
CN106649339A (zh) 离群点的挖掘方法及挖掘装置
CN115187127B (zh) 基于空间分析的详细规划分级管理智能检测方法
CN109255485A (zh) 基于rbfn机器学习的降雨型地质灾害预警预报模型及学习方法
CN113807437A (zh) 一种基于dbscan聚类分析的山脊线和山谷线提取方法
CN110245692A (zh) 一种用于集合数值天气预报成员的层次聚类方法
Frankhauser et al. Fractals and geography
CN114943902A (zh) 基于多尺度特征感知网络的城市植被无人机遥感分类方法
CN115775634A (zh) 一种基于多变量核密度估计的虫媒疾病预测方法及系统
CN104537254B (zh) 一种基于社会统计数据的精细化制图方法
CN114186889A (zh) 一种基于层次分析的城市绿地景观评价方法
CN108510010A (zh) 一种基于预筛选的密度峰值聚类方法及系统
CN107276807B (zh) 一种基于社区动态紧密度的层次化网络社区树剪枝方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant