CN111814596B - 一种遥感影像与出租车轨迹融合的自动城市功能分区方法 - Google Patents
一种遥感影像与出租车轨迹融合的自动城市功能分区方法 Download PDFInfo
- Publication number
- CN111814596B CN111814596B CN202010569583.5A CN202010569583A CN111814596B CN 111814596 B CN111814596 B CN 111814596B CN 202010569583 A CN202010569583 A CN 202010569583A CN 111814596 B CN111814596 B CN 111814596B
- Authority
- CN
- China
- Prior art keywords
- area
- block
- cluster
- remote sensing
- taxi
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 34
- 238000000638 solvent extraction Methods 0.000 title claims abstract description 13
- 238000003066 decision tree Methods 0.000 claims abstract description 13
- 238000013316 zoning Methods 0.000 claims abstract 2
- 238000004422 calculation algorithm Methods 0.000 claims description 22
- 238000001228 spectrum Methods 0.000 claims description 9
- 238000007621 cluster analysis Methods 0.000 claims description 8
- 238000012360 testing method Methods 0.000 claims description 4
- 238000002790 cross-validation Methods 0.000 claims description 3
- 238000005070 sampling Methods 0.000 claims description 3
- 238000010606 normalization Methods 0.000 claims description 2
- 238000012545 processing Methods 0.000 claims description 2
- 230000004927 fusion Effects 0.000 claims 2
- 230000011218 segmentation Effects 0.000 claims 2
- 231100000773 point of departure Toxicity 0.000 claims 1
- 238000005192 partition Methods 0.000 abstract description 8
- 230000029305 taxis Effects 0.000 abstract description 3
- 238000012795 verification Methods 0.000 abstract 1
- 230000006870 function Effects 0.000 description 36
- 238000012549 training Methods 0.000 description 33
- 238000001514 detection method Methods 0.000 description 14
- 230000008569 process Effects 0.000 description 6
- 238000012937 correction Methods 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 4
- 238000012732 spatial analysis Methods 0.000 description 4
- 238000012216 screening Methods 0.000 description 3
- 238000002372 labelling Methods 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 238000013439 planning Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 208000025174 PANDAS Diseases 0.000 description 1
- 208000021155 Paediatric autoimmune neuropsychiatric disorders associated with streptococcal infection Diseases 0.000 description 1
- 240000000220 Panda oleosa Species 0.000 description 1
- 235000016496 Panda oleosa Nutrition 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 230000001351 cycling effect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 238000004451 qualitative analysis Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/10—Terrestrial scenes
- G06V20/176—Urban or other man-made structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/29—Geographical information databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/10—Terrestrial scenes
- G06V20/182—Network patterns, e.g. roads or rivers
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Business, Economics & Management (AREA)
- General Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Tourism & Hospitality (AREA)
- Multimedia (AREA)
- Bioinformatics & Computational Biology (AREA)
- Health & Medical Sciences (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Development Economics (AREA)
- Educational Administration (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- Economics (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Probability & Statistics with Applications (AREA)
- Remote Sensing (AREA)
- Image Analysis (AREA)
Abstract
本发明提出了一种遥感影像与出租车轨迹融合的自动城市功能分区方法。首先,利用将目标城市划分为街区单元,计算各街区的轨迹时空信息熵并设定预设阈值,将街区分为两类区域。第一区域轨迹信息量充足,由各时段出租车上下客点的频度信息作为社会功能类别的解译标志,采用KMeans++聚类得到分区结果。第二区域通过区分遥感影像中有典型解译标志和非典型解译标志的地物,使用决策树对识别后地物的置信结果进行分类,得到分区结果;调整预设阈值结合交叉验证重复上述步骤,直到精度满足规定条件,最终得到目标城市的社会功能分区结果。本发明充分发挥了轨迹数据空间精度高、时间连续的优点,同时结合了遥感影像覆盖面广且地物识别能力强的优势。
Description
技术领域
本发明属于地理信息技术领域,具体涉及一种遥感影像与出租车轨迹融合的自动城市功能分区方法。
背景技术
城市功能区域的自动分区给城市规划设计与管理提供了一个有力途径,并帮助政府部门更加了解城市的规划布局,以提供居民更加幸福的生活环境。目前城市功能区域的识别与分类主要由专业且有经验的人员实地勘测与数字化,实施范围广难度大,无法短期自动更新,造成了极大的人力物力开销。目前也有一些学者尝试使用遥感或人类感知数据挖掘城市的功能区域,但数据源较为单一,且使用方法较为陈旧,识别的结果多处于定性分析与总结,无法泛化到其他区域。
发明内容
鉴于上述问题,本发明的目的是提供一种遥感影像与出租车轨迹融合的自动城市功能分区方法,以解决目前分区过多依赖于人力的问题。
为解决上述技术问题,本发明采用的技术方案如下:
S1.利用道路和河流将目标城市划分为若干个街区;
S2.根据如下公式计算各个所述街区的轨迹时空信息熵TSTEi;
其中,其中n代表街区数量,Nij代表第i个街区中第j时刻的上下客点数量,Si代表第i个街区的面积;
S3.根据计算得到的各个所述街区的轨迹时空信息熵TSTEi和预设的轨迹时空信息熵阈值,将所述目标城市分为第一区域与第二区域,所述第一区域由轨迹数据信息量充足的街区构成,所述第二区域由轨迹数据信息量缺乏的街区构成;
S4.针对所述第一区域,将所述第一区域中各个街区各时段出租车上下客点的频度信息作为各街区城市功能类别的解译标志,采用KMeans++进行聚类分析,将所述第一区域分为多个聚类簇,并判别每一个聚类簇代表的城市功能类型,得到所述第一区域的城市功能区类别的识别结果;
针对所述第二区域,识别街区影像中有典型解译标志和非典型解译标志的地物,并使用决策树算法根据第二区域中的遥感影像地物识别置信结果及空间信息进行功能分类,得到所述第二区域的功能区类别识别结果;
S5.综合所述第一区域的功能识别结果和所述第二区域的功能识别结果,得到所述目标城市的功能识别结果;
S6.采用分层随机抽样的10折交叉验证法测试步骤S5得到的所述目标城市的识别结果的平均精度和平均Kappa系数,若所述平均精度和平均Kappa系数均达到预设条件,步骤S5得到的所述目标城市的识别结果为最终结果,否则重新确定轨迹时空信息熵阈值后转向步骤S3。
进一步的,步骤S4中,针对所述第一区域,将所述第一区域中各个街区各时段出租车上下客点的频度信息作为各街区城市功能类别的解译标志,采用KMeans++进行聚类分析,将所述第一区域分为多个聚类簇,并判别每一个聚类簇代表的城市功能类型,得到所述第一区域的城市功能区类别的识别结果,具体为:
S41.统计所述第一区域中各个街区各时段出租车上下客点的频度信息,获得各个街区的出租车频度序列,并根据如下公式对各个所述街区的出租车频度序列进行归一化处理,
其中,表示第i个街区第m种的频度序列,/>表示第i个街区第m种归一化波谱,N表示街区数量;
S42.根据预设的相似度指标和预设的聚类数量,采用K-Means++算法进行聚类分析,将所述第一区域分为多个聚类簇;
S43.根据各个所述聚类簇中各个街区的用地类型分布情况,采取如下式所示的最大占比原则确定每一个聚类簇代表的社会功能属性,得到所述第一区域的功能区识别结果,
其中,是指每一个聚类簇确定的社会功能属性,K指聚类的类别数量,ck指第k个聚类簇,/>指原ck中街区的功能类别集合,x是第k个聚类簇中各个街区的类别,/>是第k个聚类簇中街区的总数量。
进一步的,所述出租车频度序列包括:总上客点时间频度序列、节假日上客点时间频度序列、工作日上客点时间频度序列、总下客点时间频度序列、节假日下客点时间频度序列和工作日下客点时间频度序列;
所述总上客点时间频度序列为:其中,/>代表第j时刻在第i个街区的上客点平均数量;
所述节假日上客点时间频度序列为:其中,/>代表节假日里第j时刻在第i个街区的上客点平均数量;
所述工作日上客点时间频度序列为:其中,代表工作日里第j时刻在第i个街区的上客点平均数量;
所述总下客点时间频度序列为:其中,/>代表第j时刻在第i个街区的下客点平均数量;
所述节假日下客点时间频度序列为:其中,/>代表节假日里第j时刻在第i个街区的下客点平均数量;
所述工作日下客点时间频度序列为:其中,代表工作日里第j时刻在第i个街区的下客点平均数量。
进一步的,所述根据预设的相似度指标和预设的聚类簇数量,采用K-Means++算法进行聚类分析,将所述第一区域分为多个聚类簇,具体包括:
S41.从所述第一区域中随机选取1个样本街区作为数据的聚类中心,并以确保各聚类中心之间相似度较小的原则选择其它聚类中心,形成K个初始的聚类中心集合CC={cc1,cc2,...,cck};
S42.根据所述预设的相似度指标计算所述第一区域中每一个街区与各个所述聚类中心的相似度;
S43.将所述第一区域中的各个街区归为与其相似度最高的聚类中心,得到K个聚类簇;
S44.求各个聚类簇中各街区出租车频度信息的均值作为新的聚类中心;
其中,为第k个聚类簇的第m种HDS′的均值,/>为第k簇第l个街区的第m种归一化波谱,/>为第k簇中街区的数量,K为簇的数量。
S45.循环步骤S42到步骤S44,直到得到的聚类中心不再变动或达到最大迭代次数时停止。
进一步的,所述相似度指标如下式所示:
其中,n代表街区数量,K代表聚类数量,cckm代表k个聚类中心的第m种归一化波谱。
进一步的,步骤S6中所述预设条件为:所述平均精度为80%,所述平均Kappa系数为0.7。
与现在技术相比,本发明包括:首先使用道路和河流数据将城市划分为街区,通过计算街区的轨迹时空信息熵将街区分为轨迹数据信息丰富的第一区域和轨迹数据信息不足的第二区域。第一区域轨迹信息量充足,由各时段出租车上下客点的频度信息作为社会功能类别的解译标志,采用KMeans++聚类得到识别结果,充分考虑了居民出行的时空分布规律,将轨迹数据包含的出行规律转换为社会功能类别的解译标志,发挥了轨迹数据空间精度高且可连续获取的优势。第二区域通过区分遥感影像中有典型解译标志和非典型解译标志的地物,使用决策树算法根据第二区域中的遥感影像地物识别置信结果及空间信息进行功能分类,得到第二区域城市功能区识别结果,充分发挥了遥感影响覆盖区域广和地物识别能力的特点。基于分治策略针对不同区域内的街区分别采用基于轨迹和遥感影像数据的识别方案,充分发挥了两种数据的优势,实现了城市功能分区的短周期更新,提高了各街区社会功能属性识别的精度,保证城市自动分区的准确性。
附图说明
图1是本发明实施例的一种遥感影像与出租车轨迹融合的自动城市功能分区方法的流程图;
图2是本发明实施例中轨迹时空信息熵的分布图;
图3是本发明实施例中第一区域的城市功能区的分类结果;
图4是本发明实施例中第二区域内部分影像的城市功能区识别结果。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。
如图1所示,本发明实施例提供了一种遥感影像与出租车轨迹融合的自动城市功能分区方法,包含以下步骤:
S100.利用道路和河流将目标城市划分为若干个街区;
首先,使用百度地图提供的开放路网获取接口,利用网络爬虫技术,基于地理方位爬取目标城市中的路网数据和河网数据。
然后,对于获得的路网、河网数据,进行数据清洗,具体过程为:
地理范围筛选。因路网数据通过网络地图接口获取,部分数据存在地理范围越界问题,需在地理信息系统软件中对该部分数据进行编辑剔除。
文件格式转换。原始路网数据为文本格式,不易于在地理信息系统软件中进行空间分析,需将该类文件转换为图形文件(ShapeFile),便于空间分析和可视化操作。
地图匹配。路网数据的空间参考与其他步骤中的数据空间参考不一致,导致空间分析时其位置无法相互匹配,因此需在ArcGIS软件中将数据转换为相应的地理坐标系,并进行几何校正。
最后,使用清洗后的路网数据和河网数据分割目标城市,形成若干街区,具体过程为:
使用ArcGIS软件从路网数据和河网数据中筛选三级以上的道路数据和主要河流数据,将其转为面状数据,并合并;
使用合并的道路和河流数据,分割城市,形成若干个街区。
S200.计算各个街区的轨迹时空信息熵TSTEi;
在南通市出租车管理系统上获取出租车轨迹数据,并使用Python程序通过空重变化提取上下客点信息,其中由空车变为重车时为上客点,由重车变为空车时为下客点。
利用ArcGIS中的Arcpy模块以及Numpy库提取各街区中不同时间段上下客点数量,根据如下公式计算各个街区的轨迹时空信息熵TSTEi;
其中,其中n代表街区数量,Nij代表第i个街区中第j时刻的上下客点数量,Si代表第i个街区的面积;
S300.根据计算得到的各个街区的轨迹时空信息熵TSTEi和预设的轨迹时空信息熵阈值,将目标城市分为第一区域与第二区域,第一区域由轨迹数据信息量充足的街区构成,第二区域由轨迹数据信息量缺乏的街区构成;
本发明实施例中,将所有街区的轨迹时空信息熵的中位数作为预设的轨迹时空信息熵阈值。
S301.在ArcGIS中,根据各个街区的轨迹时空信息熵TSTEi进行属性筛选并标识,若轨迹时空信息熵TSTEi大于等于预设的轨迹时空信息熵阈值(所有街区的轨迹时空信息熵的中位数),则标记为第一区域,若小于,则标记为第二区域;
S302.将标识为第一区域和第二区域的街区分别导出。
S400.对第一区域中的街区进行功能区类别识别;
具体地,包括以下步骤:
S401.获取第一区域中各个街区各时段出租车上下客点的频度信息;
本发明实施例中,各个街区各时段出租车上下客点的频度信息包括:
总上客点时间频度序列为:其中,/>代表第j时刻在第i个街区的上客点平均数量;
节假日上客点时间频度序列为:其中,/>代表节假日里第j时刻在第i个街区的上客点平均数量;
工作日上客点时间频度序列为:其中,/>代表工作日里第j时刻在第i个街区的上客点平均数量;
总下客点时间频度序列为:其中,/>代表第j时刻在第i个街区的下客点平均数量;
节假日下客点时间频度序列为:其中,/>代表节假日里第j时刻在第i个街区的下客点平均数量;
工作日下客点时间频度序列为:其中,/>代表工作日里第j时刻在第i个街区的下客点平均数量。
S402.根据如下公式对各个街区的出租车频度序列进行归一化处理,
其中,表示第i个街区第m种的频度序列,/>表示第i个街区第m种归一化波谱,N表示街区数量;
S403.根据预设的相似度指标和预设的聚类数量,采用K-Means++算法进行聚类分析,将所述第一区域分为多个聚类簇;
本发明实施例中,选用街区功能类型数量的三倍为聚类数量,预设的相似度指标如下式所示:
其中,n代表街区数量,K代表聚类数量,cckm代表k个聚类中心的第m种归一化波谱。
S404.从第一区域中随机选取1个样本街区作为数据的聚类中心,并以确保各聚类中心之间相似度较小的原则选择其它聚类中心,形成K个初始的聚类中心集合CC={cc1,cc2,...,cck};
具体的,
随机选取一个样本街区作为第一个聚类中心cc1;
根据式(3)计算每个样本街区与当前已有聚类中心的相似度;
将相似度作为选取该样本街区为聚类中心的概率权重,相似度越高表示被样本街区选取作为聚类中心的概率较大;
选取相似度较低的样本街区作为下一个聚类中心;
重复上述三个步骤,直到选出K个聚类中心,形成聚类中心集合CC={cc1,cc2,...,cck}。
S405.根据式(3)所示的相似度指标计算公式计算第一区域中每一个街区与各个所述聚类中心的相似度;
S406.将第一区域中的各个街区归为与其相似度最高的聚类中心,得到K个聚类簇;
S407.求各个聚类簇中各街区出租车频度信息的均值作为新的聚类中心;
其中,为第k个聚类簇的第m种HDS′的均值,/>为第k簇第l个街区的第m种归一化波谱,/>为第k簇中街区的数量,K为簇的数量。
S408.循环步骤S405到步骤S407,直到得到的聚类中心不再变动或达到最大迭代次数时停止。
S409.根据步骤S408得到的各个聚类簇中各个街区的用地类型分布情况,采取如下式所示的最大占比原则确定每一个聚类簇代表的社会功能属性,进而得到第一区域的功能区识别结果;
其中,是指每一个聚类簇确定的社会功能属性,K指聚类的类别数量,ck指第k个聚类簇,/>指原ck中街区的功能类别集合,x是第k个聚类簇中各个街区的类别,/>是第k个聚类簇中街区的总数量。
S500.对第二区域中的街区进行功能区类别识别;
针对所述第二区域,识别街区影像中有典型解译标志和非典型解译标志的地物,并使用决策树算法根据第二区域中的遥感影像地物识别置信结果及空间信息进行功能分类,得到所述第二区域的功能区类别识别结果,具体包括以下步骤:
S501.样本采集与标注:采集遥感影像样本,标记遥感影像样本中的各遥感影像的地物类型,得到具有地物类型标签的遥感影像数据库,将所述遥感影像数据库分为第一训练集和第二训练集,并对所述第二训练集中的遥感影像进行功能类型标记;
本发明实施例中,首先,从地理空间数据云获取遥感影像;
然后,对于获得的遥感影像进行大气校正和地理配准后得到遥感影像样本,具体过程为:
大气校正。在遥感影像处理软件中对遥感影像进行大气校正,减小云和雾对城市遥感影像清晰度的影响;
地理配准。路网数据的空间参考与其他步骤中的数据空间参考不一致,导致空间分析时其位置无法相互匹配,因此需在ArcGIS软件中将数据转换为相应的地理坐标系,并进行几何校正。
最后,标记遥感影像样本中的各遥感影像的地物类型,得到具有地物类型标签的遥感影像数据库;
本发明实施例中,地物类型选择为居民区、工厂、裸地/农田和操场。以独热编码方式对遥感影像进行居民区、工厂、裸地/农田和操场(学校)等地物类型标记,若遥感影像为居民区,则编码为(1,0,0,0),若遥感影像为工厂则编码为(0,1,0,0),若遥感影像为裸地/农田则编码为(0,0,1,0),若遥感影像为操场则编码为操场则编码为(0,0,0,1),若遥感影像包含全部地物则编码为(1,1,1,1)其他情况同理;
得到遥感影像数据库后,将其分为第一训练集和第二训练集,并对第二训练集中的遥感影像进行功能区类型标记。
S502.构建并训练多标签分类网络模型:根据所述第一训练集中的遥感影像的地物类型确定非典型地物遥感数据集和典型地物遥感数据集;采用所述非典型地物遥感数据集对构建好的多标签分类网络模型进行训练,得到训练后的多标签分类网络模型;
具体的,
首先,根据所述第一训练集中的遥感影像的地物类型确定非典型地物遥感数据集和典型地物遥感数据集;
若遥感影像包含的地物类型为非典型地物,则将该遥感影像归为非典型地物遥感数据集;若遥感影像包含的地物类型为典型地物,则将该遥感影像归为典型地物遥感数据集;若遥感影像既包含非典型地物又包含典型地物,则将该遥感影像归为典型地物遥感数据集同时归为典型地物遥感数据集和非典型地物遥感数据集;其中,非典型地物为遥感影像数据中空间纹理特征不明显的地物,典型地物为遥感影像数据中空间纹理特征明显的地物;本发明实施例中,居民区、工厂、裸地/农田为非典型地物,操场为典型地物。
然后,构建多标签分类网络。
基于GeForce RTX 2080Ti GPU硬件平台,利用Python Keras模块,以残差神经网络为基础架构,构建多标签分类网络。该多标签分类网络中输入图像的尺寸确定为M*M像素。本发明实施例中M取值为300。
最后,对构建的多标签分类网络进行训练,得到训练后的多标签分类网络模型。具体过程为:
将非典型地物遥感数据集中的遥感影像的尺寸统一变换为300*300像素后,将其与对应的地物类型标记数据输入多标签分类网络模型中,前向传播获得多标签分类网络模型输出的所述变换后的遥感影像样本地物的类型置信度;利用二元交叉熵为损失函数,将损失函数值按极小化误差的方法进行反向传播,调整所述多标签分类网络模型的权重,得到训练后的多标签分类网络模型,其中,损失函数计算公式如下:
上式中,J(θ)为二元交叉熵,N代表样本数,x(i)代表第i个变换后的遥感影像样本,hθ()代表激活函数,y(i)代表第i个变换后的遥感影像样本的标签,w为多标签分类网络模型的权重。
S502.构建并训练YOLO目标检测算法模型:将典型地物遥感数据集中的遥感影像样本添加典型地物的尺寸和空间位置信息后,得到具有空间信息标签的典型地物遥感数据集,采用具有空间信息标签的典型地物遥感数据集对构建好的YOLO目标检测算法模型进行训练,得到训练后的YOLO目标检测算法模型具体的,包括以下过程:首先首先,利用LabelImg工具,为典型地物遥感数据集中的遥感影像添加典型地物的尺寸和空间位置信息,如(w,h,x,y,c),其中w和h分别代表操场的宽和长,x和y分别代表操场的中心点坐标,c代表该遥感影像含有操场(学校)的置信度。
然后,使用YOLO v3开源程序,基于GeForce RTX 2080Ti GPU硬件平台,利用Python Keras模块,构建YOLO目标检测算法模型。
最后,对YOLO目标检测算法模型进行训练,得到训练后的YOLO目标检测算法模型。具体的,将典型地物遥感数据集中遥感影像的尺寸统一为N*N像素,本发明实施例中N取值为256。对统一尺寸后的遥感影像下采样32倍、16倍和8倍,得到下采样32倍的特征图、下采样16倍的特征图和下采样8倍的特征图,构建多尺度典型地物特征图集。将多尺度典型地物特征图集中的特征图及其对应的地物类型和空间信息的标注数据输入构建好的YOLO目标检测算法模型中,前向传播获得YOLO目标检测算法模型输出的遥感影像的地物类型置信度、地物尺寸和地物空间位置信息;将损失函数值按极小化误差的方法进行反向传播,调整YOLO目标检测算法模型的权重以调整先验框的大小和类别置信度(C),得到训练后的YOLO目标检测算法模型。本发明实施例中,先验框的大小包括宽度(w),长度(h)和中心点坐标(x,y),其中损失函数计算公式如下:
上式中,Loss1,Loss2,Loss3,Loss4,Loss5分别代表空间位置误差、尺寸误差、有地物时的置信度误差,没有地物时的置信度误差以及分类误差,代表示性函数,其中,如果第i个网格中的第j个先验框中有物体时,/>反之为0,S代表特征图的网格数量,B代表先验框的数量。/>代表第i个网格中的第j个先验框中的识别精度。
S503.决策树模型训练。
首先,将第二训练集中的遥感影像数据作为训练后的多标签分类网络模型的输入,获取训练后的多标签分类网络模型输出的遥感影像非典型地物类型置信度;
本发明实施例中,输出的遥感影像非典型地物类型置信度为{Pi res,Pi ind,Pi bar},其中,Pi res为第二训练集中第i个遥感影像为居民地的置信度,Pi ind为第二训练集中第i个遥感影像为工厂的置信度,Pi bar为第二训练集中第i个遥感影像为裸地/农田的置信度;
然后,将第二训练集中的遥感影像数据作为训练后的YOLO目标检测算法模型的输入,获取训练后的YOLO目标检测算法模型输出的遥感影像典型地物类型置信度、典型地物尺寸和典型地物空间位置信息;
本发明实施例中,典型地物为操场,输出的遥感影像典型地物类型置信度为{Pi sch},其中,Pi sch为操场的置信度;输出的典型地物尺寸为宽度长度/>典型地物位置信息为中心点坐标(xi,yi)。
根据典型地物面积占比率公式计算操场的面积占比率。
其中,Ai sch为典型地物面积占比,为典型地物的宽度,/>为典型地物的长度。
最后,根据第二训练集中遥感影像的非典型地物类型置信度、典型地物类型置信度、典型地物面积占比率和地物类型标签,采用所述第二训练集对构建好的决策树模型进行训练,得到训练后的决策树模型;
其中,采用采用第二训练集对构建好的决策树模型进行训练的过程为:
将第二训练集中的各个遥感影像设定为决策树模型的当前叶节点;
针对遥感影像的每一属性,以多个互不相同的特征阈值分别对所述当前叶节点进行划分,并求取每次划分后所对应的基尼系数;其中,特征阈值在对应于属性的所有遥感影像的特征值的范围内任意取值;
在本发明实施例中,属性包括遥感影像的非典型地物类型置信度、典型地物类型置信度和典型地物面积占比率;针对每一个属性,即分别针对非典型地物类型置信度属性、典型地物类型置信度属性和典型地物面积占比率属性,以多个互不相同的特征阈值分别对所述当前叶节点进行划分,并求取每次划分后所对应的基尼系数;
本发明实施例中,基尼系数的计算公式为:
上式中,Gini_Index为基尼系数,Prob2(j|h)指第二训练集中所述属性特征值为h的遥感影像属于第j类功能的概率,nj(h)为第二训练集中所述属性的特征值为h且属于第j类功能的遥感影像个数,n(h)为第二训练集中所述属性特征值为h的遥感影像的个数,J为功能区的类型数;
本发明实施例中,J=4,功能区的类型包括居民区、工业区、裸地/农田和教研区。
以与最小所述基尼系数所对应的划分来分裂该当前叶节点,以形成所述决策树的下一层叶节点;
将所述下一层叶节点设为所述当前叶节点,重复上述两步骤,直至满足预设树高时停止。
本发明实施例中,树高设为4。
S504.第二区域城市功能分区。
具体过程如下:
首先,将各个第二区域目标街区的遥感影像数据作为训练后的多标签分类网络模型的输入,获取训练后的多标签分类网络模型输出的各个目标街区遥感影像非典型地物类型置信度;
然后,将各个第二区域目标街区的遥感影像数据作为训练后的YOLO目标检测算法模型的输入,获取训练后的YOLO目标检测算法模型输出的各个目标街区遥感影像典型地物类型置信度、典型地物尺寸和典型地物空间位置信息,根据典型地物尺寸计算得到典型地物面积占比率;
最后,将各个第二区域目标街区遥感影像的非典型地物类型置信度、典型地物类型置信度和典型地物面积占比率作为训练后的决策树模型的输入,获取决策树模型输出的第二区域的功能分区结果。
S600.综合第一区域的功能区识别结果和所述第二区域的功能识别结果,得到所述目标城市的功能识别结果;
S700.采用分层随机抽样的10折交叉验证法测试步骤S5得到的所述目标城市的识别结果的平均精度和平均Kappa系数,若所述平均精度和平均Kappa系数均达到预设条件,步骤S5得到的所述目标城市的识别结果为最终结果,否则重新确定预设阈值后转向步骤S300。
下面结合实际应用场景对本发明实施例提供的技术方案进行详细说明。
本发明实施例中目标城市为南通市港闸区。体环境为:Jupyter Notebook和ArcGIS软件平台以及GeForce RTX 2080Ti GPU等硬件平台,利用Python及其相关库进行开发实验,如Numpy、Sklearn、Pandas、Keras、Matplotlib等。其中,路网数据利用网络爬虫通过百度地图API获取;遥感影像数据为2018年遥感影像,分辨率为0.5米;其他数据分别从相关平台获取。使用2018年9至11月的南通市出租车轨迹数据作为实验数据,街区的轨迹时空信息熵如图2所示。第一区域的功能分区结果如图3所示,其中Pub为公共服务区,Res为居民区,Ind为工业区,Edu为教研区,Adm为行政区,Bus为商业区,Mix为混合区,Bar为裸地农田。所采集的遥感影像样本中第一训练集包括从江浙沪一带和南通市除港闸区、崇川区以外的其他区域选取的一系列遥感影像,其中,非典型地物特征遥感数据集包括具有工厂地物标记的遥感影像200张,具有居民区地物标记的遥感影像200张,具有裸地/农田地物标记的遥感影像200张,这些地物类型的混合图像400张,典型地物特征遥感数据集包括具有操场地物标记的遥感影像400张。本发明实施例中所采集的遥感影像样本中第二训练集包括从南通市崇川区选取的420张遥感影像,其中,具有居民区地物标记的遥感影像232张,具有学校地物标记的遥感影像18张、具有工厂地物标记的遥感影像109张、具有裸地/农田标记的遥感影像61张。部分数据如图4所示。根据第二训练集中遥感影像的非典型地物类型置信度、典型地物类型置信度、典型地物面积占比率和功能类型标签构建结构化表,部分数据如表1所示,使用结构化表训练决策树模型。
结合第一区域和第二区域的城市功能分区结果,当阈值达到TSTE的90%分位数时,平均测试精度达到82.0%,Kappa系数为73.5%。
表1图像识别结构化表
本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。
Claims (6)
1.一种遥感影像与出租车轨迹融合的自动城市功能分区方法,其特征在于,包含以下步骤:
S1.利用道路和河流将目标城市划分为若干个街区;
S2.根据如下公式计算各个所述街区的轨迹时空信息熵TSTEi;
其中,其中n代表街区数量,Nij代表第i个街区中第j时刻的上下客点数量,Si代表第i个街区的面积;
S3.根据计算得到的各个所述街区的轨迹时空信息熵TSTEi和预设的轨迹时空信息熵阈值,将所述目标城市分为第一区域与第二区域,所述第一区域由轨迹数据信息量充足的街区构成,所述第二区域由轨迹数据信息量缺乏的街区构成;
S4.针对所述第一区域,将所述第一区域中各个街区各时段出租车上下客点的频度信息作为各街区城市功能类别的解译标志,采用KMeans++进行聚类分析,将所述第一区域分为多个聚类簇,并判别每一个聚类簇代表的城市功能类型,得到所述第一区域的功能区类别的识别结果;
针对所述第二区域,识别街区影像中有典型解译标志和非典型解译标志的地物,并使用决策树算法根据第二区域中的遥感影像地物识别置信结果及空间信息进行功能分类,得到所述第二区域的功能区类别识别结果;
S5.综合所述第一区域的功能区类别的识别结果和所述第二区域的功能区类别的识别结果,得到所述目标城市的功能识别结果;
S6.采用分层随机抽样的10折交叉验证法测试步骤S5得到的所述目标城市的识别结果的平均精度和平均Kappa系数,若所述平均精度和平均Kappa系数均达到预设条件,步骤S5得到的所述目标城市的识别结果为最终结果,否则重新确定轨迹时空信息熵阈值后转向步骤S3。
2.按照权利要求1所述的一种遥感影像与出租车轨迹融合的自动城市功能分区方法,其特征在于,步骤S4中,针对所述第一区域,将所述第一区域中各个街区各时段出租车上下客点的频度信息作为各街区城市功能类别的解译标志,采用KMeans++进行聚类分析,将所述第一区域分为多个聚类簇,并判别每一个聚类簇代表的城市功能类型,得到所述第一区域的城市功能区类别的识别结果,具体为:
S41.统计所述第一区域中各个街区各时段出租车上下客点的频度信息,获得各个街区的出租车频度序列,并根据如下公式对各个所述街区的出租车频度序列进行归一化处理,
其中,表示第i个街区第m种的频度序列,/>表示第i个街区第m种归一化波谱,N表示街区数量;
S42.根据预设的相似度指标和预设的聚类数量,采用K-Means++算法进行聚类分析,将所述第一区域分为多个聚类簇;
S43.根据各个所述聚类簇中各个街区的用地类型分布情况,采取如下式所示的最大占比原则确定每一个聚类簇代表的社会功能属性,得到所述第一区域的功能区识别结果,
其中,是指每一个聚类簇确定的社会功能属性,K指聚类的类别数量,ck指第k个聚类簇,/>指原ck中街区的功能类别集合,x是第k个聚类簇中各个街区的类别,/>是第k个聚类簇中街区的总数量。
3.根据权利要求2所述的一种遥感影像与出租车轨迹融合的自动城市功能分区方法,其特征在于,所述出租车频度序列包括:总上客点时间频度序列、节假日上客点时间频度序列、工作日上客点时间频度序列、总下客点时间频度序列、节假日下客点时间频度序列和工作日下客点时间频度序列;
所述总上客点时间频度序列为:其中,/>代表第j时刻在第i个街区的上客点平均数量;
所述节假日上客点时间频度序列为:其中,/>代表节假日里第j时刻在第i个街区的上客点平均数量;
所述工作日上客点时间频度序列为:其中,/>代表工作日里第j时刻在第i个街区的上客点平均数量;
所述总下客点时间频度序列为:其中,/>代表第j时刻在第i个街区的下客点平均数量;
所述节假日下客点时间频度序列为:其中,/>代表节假日里第j时刻在第i个街区的下客点平均数量;
所述工作日下客点时间频度序列为:其中,/>代表工作日里第j时刻在第i个街区的下客点平均数量。
4.根据权利要求2所述的一种遥感影像与出租车轨迹融合的自动城市功能分区方法,其特征在于,所述根据预设的相似度指标和预设的聚类簇数量,采用K-Means++算法进行聚类分析,将所述第一区域分为多个聚类簇,具体包括:
S41.从所述第一区域中随机选取1个样本街区作为数据的聚类中心,并以确保各聚类中心之间相似度较小的原则选择其它聚类中心,形成K个初始的聚类中心集合CC={cc1,cc2,…,cck};
S42.根据所述预设的相似度指标计算所述第一区域中每一个街区与各个所述聚类中心的相似度;
S43.将所述第一区域中的各个街区归为与其相似度最高的聚类中心,得到K个聚类簇;
S44.求各个聚类簇中各街区出租车频度信息的均值作为新的聚类中心;
其中,为第k个聚类簇的第m种HDS′的均值,/>为第k簇第l个街区的第m种归一化波谱,/>为第k簇中街区的数量,K为簇的数量;
S45.循环步骤S42到步骤S44,直到得到的聚类中心不再变动或达到最大迭代次数时停止。
5.根据权利要求2或4所述的一种遥感影像与出租车轨迹融合的自动城市功能分区方法,其特征在于,所述相似度指标如下式所示:
其中,n代表街区数量,K代表聚类数量,cckm代表k个聚类中心的第m种归一化波谱。
6.根据权利要求1所述的一种遥感影像与出租车轨迹融合的自动城市功能分区方法,其特征在于,步骤S6中所述预设条件为:所述平均精度为80%,所述平均Kappa系数为0.7。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010569583.5A CN111814596B (zh) | 2020-06-20 | 2020-06-20 | 一种遥感影像与出租车轨迹融合的自动城市功能分区方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010569583.5A CN111814596B (zh) | 2020-06-20 | 2020-06-20 | 一种遥感影像与出租车轨迹融合的自动城市功能分区方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111814596A CN111814596A (zh) | 2020-10-23 |
CN111814596B true CN111814596B (zh) | 2023-12-01 |
Family
ID=72845340
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010569583.5A Active CN111814596B (zh) | 2020-06-20 | 2020-06-20 | 一种遥感影像与出租车轨迹融合的自动城市功能分区方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111814596B (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112364776A (zh) * | 2020-11-12 | 2021-02-12 | 中国地质大学(武汉) | 一种城市功能区识别模型建立、分类方法及装置 |
CN112733781B (zh) * | 2021-01-20 | 2022-05-27 | 中国科学院地理科学与资源研究所 | 结合poi数据的城市功能区识别方法、存储介质和电子设备 |
CN113343781B (zh) * | 2021-05-17 | 2022-02-01 | 武汉大学 | 使用遥感数据和出租车轨迹数据的城市功能区识别方法 |
CN113739814B (zh) * | 2021-08-27 | 2023-09-26 | 南通大学 | 一种基于出租车轨迹序列的乘客下客点提取优化方法 |
CN115691170B (zh) * | 2022-11-03 | 2023-08-29 | 东南大学 | 一种基于号牌数据的城市干线道路子区划分方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2016141753A1 (zh) * | 2015-03-06 | 2016-09-15 | 中山大学 | 基于路网和兴趣点的声环境功能区划分方法 |
CN106778605A (zh) * | 2016-12-14 | 2017-05-31 | 武汉大学 | 导航数据辅助下的遥感影像道路网自动提取方法 |
CN109325085A (zh) * | 2018-08-08 | 2019-02-12 | 中南大学 | 一种城市用地功能识别与变化检测方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9147132B2 (en) * | 2013-09-11 | 2015-09-29 | Digitalglobe, Inc. | Classification of land based on analysis of remotely-sensed earth images |
-
2020
- 2020-06-20 CN CN202010569583.5A patent/CN111814596B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2016141753A1 (zh) * | 2015-03-06 | 2016-09-15 | 中山大学 | 基于路网和兴趣点的声环境功能区划分方法 |
CN106778605A (zh) * | 2016-12-14 | 2017-05-31 | 武汉大学 | 导航数据辅助下的遥感影像道路网自动提取方法 |
CN109325085A (zh) * | 2018-08-08 | 2019-02-12 | 中南大学 | 一种城市用地功能识别与变化检测方法 |
Non-Patent Citations (1)
Title |
---|
结合地籍数据的高密度城区面向对象遥感分类;余其鹏;张晓祥;梅丹丹;徐盼;遥感技术与应用;第29卷(第2期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN111814596A (zh) | 2020-10-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111814596B (zh) | 一种遥感影像与出租车轨迹融合的自动城市功能分区方法 | |
CN108629978B (zh) | 一种基于高维路网和循环神经网络的交通轨迹预测方法 | |
CN108446470B (zh) | 基于车辆轨迹数据和人口分布的医疗设施可达性分析方法 | |
CN114897444B (zh) | 一种城市分区域内服务设施需求识别方法及系统 | |
Minetto et al. | Measuring human and economic activity from satellite imagery to support city-scale decision-making during covid-19 pandemic | |
CN113378891B (zh) | 基于轨迹分布表示的城市区域关系可视分析方法 | |
CN113204718A (zh) | 一种顾及时空语义及驾驶状态的车辆轨迹目的地预测方法 | |
Shang et al. | Estimating building-scale population using multi-source spatial data | |
Ahmed | Urban land cover change detection analysis and modeling spatio-temporal Growth dynamics using Remote Sensing and GIS Techniques: A case study of Dhaka, Bangladesh | |
CN110990661B (zh) | 一种基于路网约束和密度聚类的兴趣区域出入口提取方法 | |
Chen et al. | UVLens: Urban village boundary identification and population estimation leveraging open government data | |
Zhang et al. | How road network transformation may be associated with reduced carbon emissions: An exploratory analysis of 19 major Chinese cities | |
Werder et al. | Semi-automatic interpretation of buildings and settlement areas in user-generated spatial data | |
Al-Rubkhi et al. | Land Use Change Analysis and Modeling Using Open Source (QGis)-Case Study: Boasher Willayat | |
CN112559909B (zh) | 一种基于gcn嵌入空间聚类模型的商业区发现方法 | |
Padmanaban | Integrating of urban growth modelling and utility management system using spatio temporal data mining | |
Stanislawski et al. | Automated road breaching to enhance extraction of natural drainage networks from elevation models through deep learning | |
Tayyebi et al. | Monitoring land use change by multi-temporal Landsat remote sensing imagery | |
CN115563652A (zh) | 轨迹嵌入预防泄露方法及系统 | |
CN115169922A (zh) | 一种基于大数据机器学习的充电桩选址方法 | |
Meedeniya et al. | Land‐Use Classification with Integrated Data | |
Albattah | Optimum highway design and site location using spatial geoinformatics engineering | |
CN113343781B (zh) | 使用遥感数据和出租车轨迹数据的城市功能区识别方法 | |
Makki | Geographical Information Systems in Analysis and Enhancement for Problems Solving and Decision Making | |
Beykaei et al. | Extracting urban subzonal land uses through morphological and spatial arrangement analyses using geographic data and remotely sensed imagery |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |