CN107066572A - 基于众源地理数据空间聚类的地表覆盖分类方法及系统 - Google Patents
基于众源地理数据空间聚类的地表覆盖分类方法及系统 Download PDFInfo
- Publication number
- CN107066572A CN107066572A CN201710227858.5A CN201710227858A CN107066572A CN 107066572 A CN107066572 A CN 107066572A CN 201710227858 A CN201710227858 A CN 201710227858A CN 107066572 A CN107066572 A CN 107066572A
- Authority
- CN
- China
- Prior art keywords
- data point
- ground mulching
- data
- many source
- space
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 31
- 238000004458 analytical method Methods 0.000 claims abstract description 12
- ATJFFYVFTNAWJD-UHFFFAOYSA-N Tin Chemical compound [Sn] ATJFFYVFTNAWJD-UHFFFAOYSA-N 0.000 claims description 11
- 238000000605 extraction Methods 0.000 claims description 5
- GSJBKPNSLRKRNR-UHFFFAOYSA-N $l^{2}-stannanylidenetin Chemical compound [Sn].[Sn] GSJBKPNSLRKRNR-UHFFFAOYSA-N 0.000 claims description 3
- 230000001174 ascending effect Effects 0.000 claims description 3
- 238000004364 calculation method Methods 0.000 claims description 3
- 239000000203 mixture Substances 0.000 claims description 3
- 239000000284 extract Substances 0.000 claims description 2
- 238000012216 screening Methods 0.000 claims description 2
- 238000009826 distribution Methods 0.000 description 17
- 230000008859 change Effects 0.000 description 3
- 238000013480 data collection Methods 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 244000097202 Rathbunia alamosensis Species 0.000 description 2
- 235000009776 Rathbunia alamosensis Nutrition 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 241001269238 Data Species 0.000 description 1
- 244000061176 Nicotiana tabacum Species 0.000 description 1
- 235000002637 Nicotiana tabacum Nutrition 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 235000013334 alcoholic beverage Nutrition 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004177 carbon cycle Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/29—Geographical information databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Probability & Statistics with Applications (AREA)
- Remote Sensing (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了基于众源地理数据空间聚类的地表覆盖分类方法及系统;获取众源地理数据,将众源地理数据作为地表覆盖分类数据;利用所获取的众源地理数据的数据点中表示空间位置的坐标信息,进行数据点的空间聚类,将数据点聚类为若干组数据点;利用空间聚类得到的若干组数据点,划定包含每组数据点的地表覆盖区域;将每个地表覆盖区域中的文本信息输入概率潜在语义分析模型,概率潜在语义分析模型输出由各地表覆盖区域里文本信息中的词语所构成的地表覆盖主题及主题权重,筛选地表覆盖区域内文本信息中权重最高的主题所对应的地表覆盖类型作为判断地表覆盖类型的依据,根据判断地表覆盖类型的依据对待检测地表覆盖区域进行地表覆盖类型的判断。
Description
技术领域
本发明属于地表覆盖分类技术领域,涉及基于众源地理数据空间聚类的地表覆盖分类方法及系统。
背景技术
地表覆盖是环境变化研究、地理世情监测、可持续发展规划等不可或缺的重要基础信息和关键参量,对于研究地球系统的能量平衡、碳循环及其他生物地球化学循环、气候变化等有着十分重要的意义。目前地表覆盖分类主要利用航天、航空遥感影像中的光谱和纹理信息,结合先验知识和经验,来提取地表覆盖的类型分布及变化信息。该方法耗时耗力、生产周期长,难以满足地表覆盖产品快速制图的需求。为减少制图成本,满足用户对地表覆盖产品日益变化的应用需求,需要发展一种新的地表覆盖分类方法。
随着移动互联网技术的发展,已有学者将带有地理标记的文本、图片等众源地理数据应用于地表覆盖的研究中。“Hou,Dongyang,et al."Active collection of landcover sample data from geo-tagged web texts."Remote Sensing 7.5(2015):5805-5827.”通过获取搜房网上带有地理标记的文本信息,对地表覆盖中的人造地表分类进行验证,但文本信息难以对地表覆盖类型进行准确定义。“Sitthi,Asamaporn,et al."Exploring Land Use and Land Cover of Geotagged Social-Sensing Images UsingNaive Bayes Classifier."Sustainability 8.9(2016):921.”中通过提取Flickr图片中的地表覆盖信息,构建地表覆盖分类模型,实现了基于众源图片数据的地表覆盖分类,该方法需要人工解译大量的样本图片,耗时费力“Johnson,Brian A.,et al."Employingcrowdsourced geographic data and multi-temporal/multi-sensor satelliteimagery to monitor land cover change:A case study in an urbanizing region ofthe Philippines."Computers,Environment and Urban Systems 64(2017):184-193.”提出了一种将众源地理数据中的文本信息与遥感影像相结合的地表覆盖分类方法,该方法成功得到了土地利用分类图,但是其同样受限于遥感影像的获取技术。
上述方法大多将视角聚焦在了众源地理数据的图像、文本特征等方面,忽略了数据本身的空间分布特征对地表覆盖分类的影响。
发明内容
本发明的目的就是为了解决上述问题,提供基于众源地理数据空间聚类的地表覆盖分类方法及系统,虽然众源地理数据中的文本、图片等信息能够直接反映地表覆盖类型,但忽略了数据本身空间分布对地表覆盖分类的影响。
为了实现上述目的,本发明采用如下技术方案:
基于众源地理数据空间聚类的地表覆盖分类方法,包括如下步骤:
步骤(1):获取众源地理数据,将众源地理数据作为地表覆盖分类数据;众源地理数据包括:反映地表覆盖类型的文本信息和表示空间位置的坐标信息;
步骤(2):利用步骤(1)所获取的众源地理数据的数据点中表示空间位置的坐标信息,进行数据点的空间聚类,将数据点聚类为若干组数据点,数据点的聚类结果由数据点间的影响范围Eps和每组聚类中的数据点的最小数量Minpts所确定;
步骤(3):利用步骤(2)空间聚类得到的若干组数据点,划定包含每组数据点的地表覆盖区域;
步骤(4):利用步骤(3)所得地表覆盖区域,将每个地表覆盖区域中的文本信息输入概率潜在语义分析模型,概率潜在语义分析模型输出由各地表覆盖区域里文本信息中的词语所构成的地表覆盖主题及主题权重,筛选地表覆盖区域内文本信息中权重最高的主题,将权重最高的主题所对应的地表覆盖类型作为判断地表覆盖类型的依据,根据判断地表覆盖类型的依据对待检测地表覆盖区域进行地表覆盖类型的判断。
所述众源地理数据集包括:带地理坐标的众源POI数据集、众源图片数据集和众源文本数据集。
所述步骤(2)包括:
步骤(21):提取步骤(1)所获取的众源地理数据的数据点的经度坐标信息和纬度坐标信息,作为用于数据点空间聚类的位置信息;
步骤(22):利用步骤(21)提取的位置信息,计算所有数据点彼此之间的最近距离D;继而将最近距离D按照从小到大的顺序排列,继而,以设定距离范围为间隔,对各距离范围内的众源地理数据进行统计,得到数据点数量最多的距离范围D',作为数据点间的影响范围Eps。
步骤(23):将步骤(1)所获取的众源地理数据的数据点与同一地区的遥感影像数据相叠加,利用监督分类中的最小距离法,提取遥感影像中的地表覆盖地块,并统计构成每个地表覆盖地块的数据点的数量N,以地表覆盖地块中数据点的最小数量,作为每组聚类中的数据点的最小数量Minpts。
步骤(24):利用步骤(22)所得数据点间的影响范围Eps和(23)所得每组聚类中的数据点的最小数量Minpts,将坐标信息输入DBSCAN(Density-Based Spatial Clusteringof Applications with Noise)模型,进行数据点的空间聚类。
对于步骤(22)聚类中的每组数据之间的距离范围Eps,若数据点之间的最近距离D>Eps,则不会被分类为同一组点数据,反之,若数据点间的最近距离D≤Eps,则会被分为同一组数据。
对于步骤(23)构成每组聚类中的数据点的最小数量Minpts,若聚类中某组数据点的数量N≥Minpts,则该组数据点保留为空间聚类结果,若某组数据点的数量N<Minpts,则该组数据全部划分为噪音,不作为空间聚类的结果进行地表覆盖分类。
其中,计算每个数据点之间的最近距离D的计算公式为:
式中,D表示数据点P到数据点V的最近距离,Px表示数据点P的经度信息,Py表示数据点P的纬度信息,Vx表示数据点V的经度信息,Vy表示数据点V的纬度信息。
所述步骤(3)包括:
步骤(31):提取步骤(2)所得空间聚类结果,构建不规则三角网TIN;
步骤(32):利用步骤(31)中构建的不规则三角网,计算其中每个三角形的外接圆半径r,继而,对同一组数据中所有三角形的外接圆半径r按照由小到大进行排序,对各外接圆半径r内的众源地理数据进行统计,得到数据点数量最多的外接圆半径r';
步骤(33):将每组数据的坐标信息分别输入凹包(Concave Hull)模型,凹包模型中的参数α由步骤(32)所得到的外接圆半径r'所确定。凹包模型输出覆盖每组数据点的面数据,作为用于分类的地表覆盖区域。
所述计算其中每个三角形的外接圆半径r的公式为:
式中,a、b、c分别为不规则三角网中三角形的三条边,S为三角形的面积。
基于众源地理数据空间聚类的地表覆盖分类系统,包括:
获取模块:获取众源地理数据,将众源地理数据作为地表覆盖分类数据;众源地理数据包括:反映地表覆盖类型的文本信息和表示空间位置的坐标信息;
聚类模块:利用获取模块所获取的众源地理数据的数据点中表示空间位置的坐标信息,进行数据点的空间聚类,将数据点聚类为若干组数据点,数据点的聚类结果由数据点间的影响范围Eps和每组聚类中的数据点的最小数量Minpts所确定;
区域划定模块:利用聚类模块空间聚类得到的若干组数据点,划定包含每组数据点的地表覆盖区域;
分析模块:利用区域划定模块所得地表覆盖区域,利用概率潜在语义分析主题模型,分析每个地表覆盖区域的文本信息,判断地表覆盖类型。
本发明的有益效果:
1以POI(兴趣点)数据为例,在某个大型的城市中心商业区,聚集了成百上千个标记为“购物”、“公厕”、“餐馆”等属性的POI点,通过对这些点的空间聚类,不仅可以识别出其地表覆盖类型为人造地表,并可划定出其分布范围。因此,本专利提出一种顾及众源地理数据空间聚类的地表覆盖分类方法。
2利用众源地理数据的位置信息,采用DBSCAN聚类算法,对数据进行空间聚类;继而,利用聚类结果,采用凹包模型划定地表覆盖区域;最后,提取地表覆盖区域中众源地理数据的文本信息,输入主题模型,判断地表覆盖分类。
附图说明
图1(a)-图1(d)为部分众源地理数据分布图;
图2为数据点距离分布图;
图3(a)-图3(d)为DBSCAN空间聚类结果图;
图4为数据点的不规则三角网构建;
图5为三角形外接圆半径分布图;
图6(a)-图6(c)为基于凹包模型的地表覆盖区域划定图;
图7(a)-图7(d)为部分区域地表覆盖分类结果;
图8为本发明的流程图。
具体实施方式
下面结合附图与实施例对本发明作进一步说明。
为了对本发明的技术特征、目的和效果有更加清楚的理解,现以山东省的新浪微博POI数据集和百度地图POI数据集为例,对照附图说明本发明的具体实施方式。
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。
本发明所提出的一种基于众源地理数据空间聚类的地表覆盖分类方法,如图8所示,所述方法用于基于众源地理数据的地表覆盖分类;所述地表覆盖分类方法包括基于DBSCAN的众源地理数据空间聚类方法和基于凹包模型的地表覆盖区域构建方法;所述方法包括如下步骤:
A、获取众源地理数据,将众源地理数据作为地表覆盖分类数据;众源地理数据包括:反映地表覆盖类型的文本信息与表示空间位置的坐标信息。
所获取数据点中的新浪微博POI和百度地图POI,其文本信息和空间信息如表1所示。
表1众源地理数据的文本和空间信息
经度坐标 | 纬度坐标 | POI类型 |
116.4627 | 39.94505 | 休闲娱乐歌舞厅 |
116.4778 | 39.9212 | 医疗综合医院 |
116.3237 | 39.82448 | 医疗疗养院 |
116.5229 | 39.77134 | 医疗专科医院 |
116.8351 | 40.05272 | 购物便利店 |
116.835 | 40.05291 | 交通设施服务区 |
B、利用步骤A所获取的数据点中表示空间位置的坐标信息,进行数据点的空间聚类,将数据点聚类为空间位置相近的若干组数据。
a.利用步骤B1提取的位置信息,计算每个数据点之间的最近距离D(公式如(1)所示)。继而按照从小到大的顺序排列,选取数据点数量占比最大的距离范围D,作为数据点间的影响范围Eps。
式中,D表示数据点P到数据点V的最近距离,Px表示数据点P的经度信息,Py表示数据点P的纬度信息,Vx表示数据点V的经度信息,Vy表示数据点V的纬度信息。
数据点间的最近距离如图2所示。大多数POI间的距离均在100米以内,当POI间的距离大于100米后,曲线急剧升高,这表明只有少量POI间的最短距离分布在100米之外。因此选取数据点间的影响范围Eps为100米。
c.将数据点与同一地区的遥感影像数据相叠加,统计构成每个地表覆盖地块的数据点的数量N,以此确定每组聚类中的数据点的最小数量Minpts。
部分地表覆盖地块的数据点分布如图1(a)-图1(d)所示。图1(a)为城市区域,聚集的数据点较多且分布密集。图1(b)、图1(c)中的数据分布相对较少,而图1(d)中散落分布的数据,不足以作为地表覆盖的分类数据进行聚类。依据构成每个地表覆盖地块的数据点的数量N,将聚类中的数据点的最小数量Minpts确定为3。
d.利用步骤b、c所得数据点间的最近距离D和构成每个地表覆盖地块的数据点数量N,将坐标信息输入DBSCAN(Density-Based Spatial Clustering of Applicationswith Noise)模型,进行数据点的空间聚类。
对于步骤b聚类中的每组数据之间的距离范围Eps,若数据点之间的最近距离D>Eps,则不会被分类为同一组点数据,反之,若数据点间的最近距离D<Eps,则会被分为同一组数据。
对于步骤c构成每组聚类中的数据点的最小数量Minpts,若聚类中某组数据点的数量N>Minpts,则该组数据点保留为空间聚类结果,若某组数据点的数量N<Minpts,则该组数据全部划分为噪音,不作为空间聚类的结果进行地表覆盖分类。
为验证Minpts的取值,选取聚类中的每组数据之间的最近距离Eps为100米,分别选取每组聚类中的数据点的最小数量Minpts为1、3、5、10,所得部分DBSCAN空间聚类结果如图3(a)-图3(d)所示,其中黑色代表无法进行空间聚类的噪音数据。图3(a)中由于Minpts=1,导致周边散落分布的数据点被空间聚类为若干组数据,图3(b)中Minpts=3,无法进行地表覆盖分类的散落分布的数据点被划分为噪音数据,图3(c)、图3(d)中由于Minpts的取值过大,使得聚集分布的数据点被错误划分为噪音。因此,本专利选取由Eps=100、Minpts=3所得DBSCAN空间聚类结果进行地表覆盖区域划定。
C、利用步骤B空间聚类得到的若干组数据点,划定包含每组数据点的地表覆盖区域。
a.提取步骤B所得空间聚类结果,对于每组数据点,分别构建不规则三角网(TIN)。
以某组数据点的空间聚类结果为例,其不规则三角网构建如图4所示。
b.利用步骤a中构建的不规则三角网,计算其中每个三角形的外接圆半径r,计算公式如(1)所示。继而,对同一组数据中所有三角形的外接圆半径r按照由小到大进行排序。
式中,a、b、c分别为不规则三角网中三角形的三条边,S为三角形的面积。
以图4所构建的不规则三角网为例,其外接圆半径r如图5所示。当外接圆半径r>150米时,分布曲线急剧上升,说明多数外接圆半径r分布于150米以内。
c.将每组数据的坐标信息分别输入凹包(Concave Hull)模型,凹包模型中的参数α由步骤C2所得到的外接圆半径r所确定,即选取三角形数量占比最大的外接圆半径r,作为参数α的取值。模型输出覆盖每组数据点的面数据,以此作为用于分类的地表覆盖区域。
以图5所得外接圆半径r的分布情况为例,取参数α分别为30、150、300,利用凹包模型划定地表覆盖区域,如图6(a)-图6(c)所示。图6(a)中参数α为30米,划定的地表覆盖区域较为散乱,不能完全覆盖全部区域,图6(b)中参数α为150米,与步骤b的所得外接圆半径r的分布情况相吻合,图6(c)中参数α为300米,所得地表覆盖区域面积过大。因此选取参数α为150米。
D、利用步骤C所得地表覆盖区域,提取每个地表覆盖区域内数据点的文本信息,将文本信息输入主题模型,分析每个地表覆盖区域的文本主题,判断地表覆盖类型。
计算所得部分文本主题如表2所示。主题2的文本信息多与校园生活相关,反映了地表覆盖中的人造地表类型;主题21的文本信息与生活、娱乐相关,多位于商业区、住宅区,同样反映了人造地表类型;而主题37则与旅游风景区相关,反映了地表覆盖中的非人造地表类型。
表2众源地理数据部分文本主题分布
主题2 | 主题21 | 主题37 |
高校中心点 | 便利店 | 旅游景点 |
校园生活 | 便民商店 | 风景区 |
出行住宿 | 专卖店 | 公共厕所 |
高等院校 | 美容美发店 | 生活服务 |
图书馆 | 电讯营业厅 | 文物古迹 |
楼宇机构 | 烟酒专卖店 | 停车场 |
餐饮美食 | 生活娱乐 | 公园 |
…… | …… | …… |
图7(a)基于以上文本主题计算结果,以图1(a)-图1(d)中所示区域为例,所得地表覆盖分类结果如图7(a)-图7(d)所示:图7(a)、图7(b)分别位于城市与乡镇,被正确分为人造地表,图7(c)位于森林地区,其地表覆盖区域被正确分为非人造地表,而图7(d)由于数据点分布较为散乱且数量较少,无法进行地表覆盖分类。
本发明提出了一种基于众源地理数据空间聚类的地表覆盖分类方法,利用众源地理数据的位置信息,采用DBSCAN聚类算法,对位置数据进行空间聚类;继而利用聚类结果,采用凹包模型划定地表覆盖区域;最后,提取地表覆盖区域中众源地理数据的文本信息,输入主题模型,判断地表覆盖分类。
所述概率潜在语义分析(probabilistic latent semantic analysis)主题模型,参照文献“Leung D,Newsam S.Exploring Geotagged images for land-useclassification[C]//ACM Multimedia 2012Workshop on Geotagging and ITSApplications in Multimedia.ACM,2012:3-8.”中的方法。
TIN的英文全称是Triangulated Irregular Network。
所述不规则三角网的构建过程参照文献“武晓波,王世新.Delaunay三角网的生成算法研究[J].测绘学报,1999,28(1):28-35.”
上述虽然结合附图对本发明的具体实施方式进行了描述,但并非对本发明保护范围的限制,所属领域技术人员应该明白,在本发明的技术方案的基础上,本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本发明的保护范围以内。
Claims (8)
1.基于众源地理数据空间聚类的地表覆盖分类方法,其特征是,包括如下步骤:
步骤(1):获取众源地理数据,将众源地理数据作为地表覆盖分类数据;众源地理数据包括:反映地表覆盖类型的文本信息和表示空间位置的坐标信息;
步骤(2):利用步骤(1)所获取的众源地理数据的数据点中表示空间位置的坐标信息,进行数据点的空间聚类,将数据点聚类为若干组数据点,数据点的聚类结果由数据点间的影响范围Eps和每组聚类中的数据点的最小数量Minpts所确定;
步骤(3):利用步骤(2)空间聚类得到的若干组数据点,划定包含每组数据点的地表覆盖区域;
步骤(4):利用步骤(3)所得地表覆盖区域,将每个地表覆盖区域中的文本信息输入概率潜在语义分析模型,概率潜在语义分析模型输出由各地表覆盖区域里文本信息中的词语所构成的地表覆盖主题及主题权重,筛选地表覆盖区域内文本信息中权重最高的主题,将权重最高的主题所对应的地表覆盖类型作为判断地表覆盖类型的依据,根据判断地表覆盖类型的依据对待检测地表覆盖区域进行地表覆盖类型的判断。
2.如权利要求1所述的基于众源地理数据空间聚类的地表覆盖分类方法,其特征是,
所述步骤(2)包括:
步骤(21):提取步骤(1)所获取的众源地理数据的数据点的经度坐标信息和纬度坐标信息,作为用于数据点空间聚类的位置信息;
步骤(22):利用步骤(21)提取的位置信息,计算所有数据点彼此之间的最近距离D;继而将最近距离D按照从小到大的顺序排列,继而,以设定距离范围为间隔,对各距离范围内的众源地理数据进行统计,得到数据点数量最多的距离范围D',作为数据点间的影响范围Eps;
步骤(23):将步骤(1)所获取的众源地理数据的数据点与同一地区的遥感影像数据相叠加,利用监督分类中的最小距离法,提取遥感影像中的地表覆盖地块,并统计构成每个地表覆盖地块的数据点的数量N,以地表覆盖地块中数据点的最小数量,作为每组聚类中的数据点的最小数量Minpts;
步骤(24):利用步骤(22)所得数据点间的影响范围Eps和(23)所得每组聚类中的数据点的最小数量Minpts,将坐标信息输入DBSCAN模型,进行数据点的空间聚类。
3.如权利要求2所述的基于众源地理数据空间聚类的地表覆盖分类方法,其特征是,
对于步骤(22)聚类中的每组数据之间的距离范围Eps,若数据点之间的最近距离D>Eps,则不会被分类为同一组点数据,反之,若数据点间的最近距离D≤Eps,则会被分为同一组数据。
4.如权利要求3所述的基于众源地理数据空间聚类的地表覆盖分类方法,其特征是,
对于步骤(23)构成每组聚类中的数据点的最小数量Minpts,若聚类中某组数据点的数量N≥Minpts,则该组数据点保留为空间聚类结果,若某组数据点的数量N<Minpts,则该组数据全部划分为噪音,不作为空间聚类的结果进行地表覆盖分类。
5.如权利要求2所述的基于众源地理数据空间聚类的地表覆盖分类方法,其特征是,
其中,计算每个数据点之间的最近距离D的计算公式为:
<mrow>
<mi>D</mi>
<mo>=</mo>
<msqrt>
<mrow>
<msup>
<mrow>
<mo>(</mo>
<msub>
<mi>P</mi>
<mi>x</mi>
</msub>
<mo>-</mo>
<msub>
<mi>V</mi>
<mi>x</mi>
</msub>
<mo>)</mo>
</mrow>
<mn>2</mn>
</msup>
<mo>+</mo>
<msup>
<mrow>
<mo>(</mo>
<msub>
<mi>P</mi>
<mi>y</mi>
</msub>
<mo>-</mo>
<msub>
<mi>V</mi>
<mi>y</mi>
</msub>
<mo>)</mo>
</mrow>
<mn>2</mn>
</msup>
</mrow>
</msqrt>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>1</mn>
<mo>)</mo>
</mrow>
<mo>;</mo>
</mrow>
1
式中,D表示数据点P到数据点V的最近距离,Px表示数据点P的经度信息,Py表示数据点P的纬度信息,Vx表示数据点V的经度信息,Vy表示数据点V的纬度信息。
6.如权利要求1所述的基于众源地理数据空间聚类的地表覆盖分类方法,其特征是,
所述步骤(3)包括:
步骤(31):提取步骤(2)所得空间聚类结果,构建不规则三角网TIN;
步骤(32):利用步骤(31)中构建的不规则三角网,计算其中每个三角形的外接圆半径r,继而,对同一组数据中所有三角形的外接圆半径r按照由小到大进行排序,对各外接圆半径r内的众源地理数据进行统计,得到数据点数量最多的外接圆半径r';
步骤(33):将每组数据的坐标信息分别输入凹包模型,凹包模型中的参数α由步骤(32)所得到的外接圆半径r'所确定;凹包模型输出覆盖每组数据点的面数据,作为用于分类的地表覆盖区域。
7.如权利要求6所述的基于众源地理数据空间聚类的地表覆盖分类方法,其特征是,
所述计算其中每个三角形的外接圆半径r的公式为:
<mrow>
<mi>r</mi>
<mo>=</mo>
<mfrac>
<mrow>
<mi>a</mi>
<mo>*</mo>
<mi>b</mi>
<mo>*</mo>
<mi>c</mi>
</mrow>
<mrow>
<mn>4</mn>
<mo>*</mo>
<mi>S</mi>
</mrow>
</mfrac>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>2</mn>
<mo>)</mo>
</mrow>
<mo>;</mo>
</mrow>
式中,a、b、c分别为不规则三角网中三角形的三条边,S为三角形的面积。
8.基于众源地理数据空间聚类的地表覆盖分类系统,其特征是,包括:
获取模块:获取众源地理数据,将众源地理数据作为地表覆盖分类数据;众源地理数据包括:反映地表覆盖类型的文本信息和表示空间位置的坐标信息;
聚类模块:利用获取模块所获取的众源地理数据的数据点中表示空间位置的坐标信息,进行数据点的空间聚类,将数据点聚类为若干组数据点,数据点的聚类结果由数据点间的影响范围Eps和每组聚类中的数据点的最小数量Minpts所确定;
区域划定模块:利用聚类模块空间聚类得到的若干组数据点,划定包含每组数据点的地表覆盖区域;
分析模块:利用区域划定模块所得地表覆盖区域,利用概率潜在语义分析主题模型,分析每个地表覆盖区域的文本信息,判断地表覆盖类型。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710227858.5A CN107066572B (zh) | 2017-04-10 | 2017-04-10 | 基于众源地理数据空间聚类的地表覆盖分类方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710227858.5A CN107066572B (zh) | 2017-04-10 | 2017-04-10 | 基于众源地理数据空间聚类的地表覆盖分类方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107066572A true CN107066572A (zh) | 2017-08-18 |
CN107066572B CN107066572B (zh) | 2019-07-23 |
Family
ID=59601643
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710227858.5A Expired - Fee Related CN107066572B (zh) | 2017-04-10 | 2017-04-10 | 基于众源地理数据空间聚类的地表覆盖分类方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107066572B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110674208A (zh) * | 2018-07-03 | 2020-01-10 | 百度在线网络技术(北京)有限公司 | 用于确定用户的职住地信息的方法和装置 |
CN111831760A (zh) * | 2019-04-23 | 2020-10-27 | 腾讯科技(深圳)有限公司 | 处理位置数据的方法及相应的装置、计算机可读存储介质 |
CN112395516A (zh) * | 2020-12-03 | 2021-02-23 | 中煤航测遥感集团有限公司 | 空间区域分析处理方法、装置、设备及存储介质 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6571242B1 (en) * | 2000-07-25 | 2003-05-27 | Verizon Laboratories Inc. | Methods and systems for updating a land use and land cover map using postal records |
US20070047820A1 (en) * | 2005-08-12 | 2007-03-01 | Microsoft Corporation | Computer generated land cover classification |
CN101599070A (zh) * | 2009-07-07 | 2009-12-09 | 武汉大学 | 在土地利用信息多尺度表达中的空间数据库综合方法 |
CN102096826A (zh) * | 2010-11-24 | 2011-06-15 | 清华大学 | 基于真实似然特征的多分辨率遥感图像复合分类方法 |
CN102129571A (zh) * | 2011-01-31 | 2011-07-20 | 重庆大学 | 基于半监督流形学习的多光谱遥感数据土地利用分类方法 |
CN102521273A (zh) * | 2011-11-23 | 2012-06-27 | 中国科学院地理科学与资源研究所 | 一种高分辨率遥感的多功能城市用地空间信息生成方法 |
CN103942821A (zh) * | 2014-05-06 | 2014-07-23 | 龚威平 | 一种利用遥感影像快速获取城市用地现状图序列的方法 |
US20160171302A1 (en) * | 2014-12-12 | 2016-06-16 | Kristin Lavigne | System and method for managing water |
CN105760421A (zh) * | 2016-01-12 | 2016-07-13 | 西安科技大学 | 土地利用类型分类的方法 |
CN105956610A (zh) * | 2016-04-22 | 2016-09-21 | 中国人民解放军军事医学科学院卫生装备研究所 | 一种基于多层编码结构的遥感图像地形分类方法 |
-
2017
- 2017-04-10 CN CN201710227858.5A patent/CN107066572B/zh not_active Expired - Fee Related
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6571242B1 (en) * | 2000-07-25 | 2003-05-27 | Verizon Laboratories Inc. | Methods and systems for updating a land use and land cover map using postal records |
US20070047820A1 (en) * | 2005-08-12 | 2007-03-01 | Microsoft Corporation | Computer generated land cover classification |
CN101599070A (zh) * | 2009-07-07 | 2009-12-09 | 武汉大学 | 在土地利用信息多尺度表达中的空间数据库综合方法 |
CN102096826A (zh) * | 2010-11-24 | 2011-06-15 | 清华大学 | 基于真实似然特征的多分辨率遥感图像复合分类方法 |
CN102129571A (zh) * | 2011-01-31 | 2011-07-20 | 重庆大学 | 基于半监督流形学习的多光谱遥感数据土地利用分类方法 |
CN102521273A (zh) * | 2011-11-23 | 2012-06-27 | 中国科学院地理科学与资源研究所 | 一种高分辨率遥感的多功能城市用地空间信息生成方法 |
CN103942821A (zh) * | 2014-05-06 | 2014-07-23 | 龚威平 | 一种利用遥感影像快速获取城市用地现状图序列的方法 |
US20160171302A1 (en) * | 2014-12-12 | 2016-06-16 | Kristin Lavigne | System and method for managing water |
CN105760421A (zh) * | 2016-01-12 | 2016-07-13 | 西安科技大学 | 土地利用类型分类的方法 |
CN105956610A (zh) * | 2016-04-22 | 2016-09-21 | 中国人民解放军军事医学科学院卫生装备研究所 | 一种基于多层编码结构的遥感图像地形分类方法 |
Non-Patent Citations (5)
Title |
---|
JOHN RTHOMLINSON等: "Coordinating Methodologies for Scaling Landcover Classifications from Site-Specific to Global: Steps toward Validating Global Map Products", 《REMOTE SENSING OF ENVIRONMENT》 * |
SHI JUN等: "Sparsity-Constrained Probabilistic Latent Semantic Analysis For Land Cover Classification", 《IEEE INTERNATIONAL SYMPOSIUM ON GEOSCIENCE AND REMOTE SENSING IGARSS》 * |
WENWEN LI等: "An Integrated Software Framework to Support Semantic Modeling and Reasoning of Spatiotemporal Change of Geographical Objects: A Use Case of Land Use and Land Cover Change Study", 《ISPRS INTERNATIONAL JOURNAL OF GEO-INFORMATION》 * |
刘炜: "土地利用/覆被变化信息遥感图像自动分类识别与提取方法研究", 《中国博士学位论文全文数据库 信息科技辑》 * |
牛继强: "面向土地用途分区的空间数据挖掘", 《中国博士学位论文全文数据库 基础科学辑》 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110674208A (zh) * | 2018-07-03 | 2020-01-10 | 百度在线网络技术(北京)有限公司 | 用于确定用户的职住地信息的方法和装置 |
CN110674208B (zh) * | 2018-07-03 | 2022-12-02 | 百度在线网络技术(北京)有限公司 | 用于确定用户的职住地信息的方法和装置 |
CN111831760A (zh) * | 2019-04-23 | 2020-10-27 | 腾讯科技(深圳)有限公司 | 处理位置数据的方法及相应的装置、计算机可读存储介质 |
CN111831760B (zh) * | 2019-04-23 | 2023-08-18 | 腾讯科技(深圳)有限公司 | 处理位置数据的方法及相应的装置、计算机可读存储介质 |
CN112395516A (zh) * | 2020-12-03 | 2021-02-23 | 中煤航测遥感集团有限公司 | 空间区域分析处理方法、装置、设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN107066572B (zh) | 2019-07-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Hu et al. | A graph-based approach to detecting tourist movement patterns using social media data | |
Yu et al. | Integration of nighttime light remote sensing images and taxi GPS tracking data for population surface enhancement | |
Zhao et al. | A trajectory clustering approach based on decision graph and data field for detecting hotspots | |
Zheng et al. | Mining interesting locations and travel sequences from GPS trajectories | |
Haklay | How good is volunteered geographical information? A comparative study of OpenStreetMap and Ordnance Survey datasets | |
Hu et al. | Automated urban land-use classification with remote sensing | |
Zhan et al. | Inferring urban land use using large-scale social media check-in data | |
US11935082B2 (en) | Discovering neighborhood clusters and uses therefor | |
Krueger et al. | Visual analysis of movement behavior using web data for context enrichment | |
Hu et al. | Extraction and monitoring approach of dynamic urban commercial area using check-in data from Weibo | |
Liu et al. | Investigating urban metro stations as cognitive places in cities using points of interest | |
CN106919680B (zh) | 一种利用poi数据进行地表覆盖分类的方法及系统 | |
Liu et al. | Identifying and understanding road-constrained areas of interest (AOIs) through spatiotemporal taxi GPS data: A case study in New York City | |
Sharif et al. | Context-awareness in similarity measures and pattern discoveries of trajectories: a context-based dynamic time warping method | |
CN105183870A (zh) | 一种利用微博位置信息的城市功能区探测方法及系统 | |
CN114548811B (zh) | 一种机场可达性的检测方法、装置、电子设备及存储介质 | |
CN107066572B (zh) | 基于众源地理数据空间聚类的地表覆盖分类方法及系统 | |
CN104679942A (zh) | 一种基于数据挖掘的建设用地承载效率测度方法 | |
CN106547842A (zh) | 一种在虚拟地球平台上可视化基于位置的情感的方法 | |
Lai et al. | A name‐led approach to profile urban places based on geotagged Twitter data | |
Liu et al. | Study on urban spatial function mixture and individual activity space from the perspectives of resident activity | |
Shi et al. | Finding communities in bicycle sharing system | |
Yu et al. | Analyzing the structure of tourism destination network based on digital footprints: Taking Guilin, China as a case | |
Yan et al. | Identification of secondary functional areas and functional structure analysis based on multisource geographic data | |
Shende et al. | Analyzing changes in travel patterns due to Covid-19 using Twitter data in India |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20190723 |