CN116956133B - 基于时序手机信令数据和机器学习的建筑功能识别方法 - Google Patents
基于时序手机信令数据和机器学习的建筑功能识别方法 Download PDFInfo
- Publication number
- CN116956133B CN116956133B CN202310924447.7A CN202310924447A CN116956133B CN 116956133 B CN116956133 B CN 116956133B CN 202310924447 A CN202310924447 A CN 202310924447A CN 116956133 B CN116956133 B CN 116956133B
- Authority
- CN
- China
- Prior art keywords
- mobile phone
- time sequence
- data
- phone signaling
- building function
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000006870 function Effects 0.000 title claims abstract description 80
- 230000011664 signaling Effects 0.000 title claims abstract description 67
- 238000000034 method Methods 0.000 title claims abstract description 34
- 238000010801 machine learning Methods 0.000 title claims abstract description 18
- 238000007637 random forest analysis Methods 0.000 claims abstract description 36
- 238000012549 training Methods 0.000 claims abstract description 23
- 238000012360 testing method Methods 0.000 claims abstract description 11
- 230000008859 change Effects 0.000 claims abstract description 10
- 238000013145 classification model Methods 0.000 claims abstract description 7
- 238000010606 normalization Methods 0.000 claims abstract description 6
- 230000001419 dependent effect Effects 0.000 claims abstract description 5
- 238000012545 processing Methods 0.000 claims abstract description 5
- 238000007781 pre-processing Methods 0.000 claims abstract description 4
- 238000003066 decision tree Methods 0.000 claims description 24
- 238000005070 sampling Methods 0.000 claims description 11
- 238000004422 calculation algorithm Methods 0.000 claims description 7
- 230000008569 process Effects 0.000 claims description 6
- 238000004364 calculation method Methods 0.000 claims description 3
- 230000007246 mechanism Effects 0.000 claims description 3
- 238000002759 z-score normalization Methods 0.000 claims description 3
- 238000007726 management method Methods 0.000 abstract description 3
- 230000004044 response Effects 0.000 abstract description 2
- 230000000694 effects Effects 0.000 description 7
- 230000007781 signaling event Effects 0.000 description 7
- 230000003595 spectral effect Effects 0.000 description 4
- 230000008566 social perception Effects 0.000 description 3
- 230000002123 temporal effect Effects 0.000 description 3
- 238000010276 construction Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 238000011835 investigation Methods 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 239000013598 vector Substances 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000002790 cross-validation Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000007721 medicinal effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000035699 permeability Effects 0.000 description 1
- 238000012502 risk assessment Methods 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/29—Geographical information databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/24323—Tree-organised classifiers
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A30/00—Adapting or protecting infrastructure or their operation
- Y02A30/60—Planning or developing urban green infrastructure
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Databases & Information Systems (AREA)
- Remote Sensing (AREA)
- Mobile Radio Communication Systems (AREA)
Abstract
本发明公开了一种基于时序手机信令数据和机器学习的建筑功能识别方法,获取时序手机信令数据和GIS平台数据,对所述时序手机信令数据和GIS平台数据进行预处理;基于建筑物内工作日和非工作日人口动态变化规律对城市建筑功能类型进行划分,对所述手机信令时间序列数据进行归一化处理,选取模型训练和测试样本,以归一化时序手机信令数据作为自变量、真实建筑功能类型作为因变量,基于随机森林机器学习方法构建建筑功能分类模型,通过所述手机信令随机森林分类模型提取建筑功能类型。本发明基于手机信令时间序列信息和建筑功能类型的关联性用以识别建筑功能类型,可应用于城市规划、管理和应急响应的数据决策中。
Description
技术领域
本发明涉及数据识别技术领域,尤其涉及一种基于时序手机信令数据和机器学习的建筑功能识别方法。
背景技术
建筑作为城市居民活动的基本结构单元,扮演着支撑市民生活、工作、娱乐和其他社会活动的关键角色。建筑功能类型的识别不仅有助于了解城市功能布局,也有助于了解不同时空模式行为信息与建筑功能类型之间的紧密联系,为城市规划管理和地震应急救援提供有效参考。现有的建筑功能类型提取方法主要有实地调研、遥感方法以及社会感知方法三种。实地调研方法成熟、精度高、可靠性强,但需要耗费大量的人力物力财力、成本高、时效性差,不适用于大范围建筑功能提取。遥感技术通过卫星、无人机等手段对地表进行全面、高效、实时监测,为大范围城市功能信息提取提供了新的方法。但由于遥感方法着眼于直接从数据中获得“信息”,包括几何特征、光谱特征和纹理特征,忽略了地物空间分异和高级语义特征,因此目前更多地应用于土地利用类型分类,在建筑功能类型识别方面存在明显的局限性。社会感知方法多基于人与环境之间的交互信息来识别建筑功能,该手段基于人类活动产生的海量“数据标签”,通过数据挖掘实现城市功能分类,不仅解决了传统影像分类的“语义鸿沟”,还提高了城市功能分类的精细化程度。然而,目前研究所用到的社会感知数据往往存在明显的局限性,即:极大的空间异质性和相对较低的采样率。难以满足大范围、智能化建筑功能类型提取的要求。近年来,手机信令数据以其覆盖范围广、观测接近实时、采样率高、能充分反映人类活动信息等优点引起了研究学者的广泛关注,然而,很少有发明将建筑功能类型识别与手机信令(MS)数据直接联系起来,以生产由人口动态驱动的建筑功能类型产品。
近年来,受益于机器学习算法和计算机计算能力的迅猛发展,计算机自动分类技术逐渐成为透视人类社会活动特征,揭示地表土地利用变化的有效途径。机器学习方法已广泛应用到各个研究领域,如城市功能分类,灾害检测和风险评估。随着大数据时代对数据分析的需求不断增长,如何基于机器学习对复杂多样的数据进行深度分析,更高效地利用信息,成为当前大数据环境下机器学习发明的主要方向。因此需要一种基于时序手机信令数据和机器学习的建筑功能识别方法。
发明内容
本发明的目的是为了解决现有技术问题而提出的一种基于时序手机信令数据和机器学习方法的建筑功能识别方法。
为了实现上述目的,本发明采用了如下技术方案:A获取时序手机信令数据和GIS平台数据,对所述时序手机信令数据和GIS平台数据进行预处理;
B基于建筑物内工作日和非工作日人口动态变化规律对城市建筑功能类型进行划分,分类后的所述建筑功能类型包括居住类,办公类,娱乐类,参观类和医疗类;
C对所述手机信令时间序列数据进行归一化处理,对GIS平台数据中的所述OSM数据中的建筑功能类型标签根据所述建筑功能分类方案进行汇总分类;
D选取模型训练和测试样本,以归一化时序手机信令数据作为自变量、真实建筑功能类型作为因变量,基于随机森林机器学习方法构建建筑功能分类模型;
E导入待识别数据和相应的时序手机信令数据通过所述手机信令随机森林分类模型提取建筑功能类型。
进一步地,所述随机森林算法包括:
(1)随机采样:从原始数据集中随机选择一部分样本,并用这些样本来训练每个决策树;
(2)构建决策树:对于每个采样后的数据集,构建一颗决策树;
(3)特征选择:对于每棵决策树,从所有特征中随机选择一部分特征,用来建立该决策树;
(4)预测结果:采用投票机制对所有决策树结果进行投票,取得最多票的结果作为最终结果对所述建筑物类型分类。
进一步地,所述随机森林的分类过程包括训练阶段和预测阶段;在训练阶段,随机森林通过随机采样和随机特征选择来构造多棵决策树,对于一个由n个样本组成的训练集,随机森林从中采样n次,每次采样得到一个大小为n的子集,用于训练一棵决策树;同时在节点上,随机森林随机选择k个特征,通常k<<p,p是总特征数,并从这k个特征中选择最佳的特征用于分类。
进一步地,在步骤A中使用分类和聚类算法中常用的Z-Score标准化方法对每个样本的48小时时间序列数据进行归一化处理,归一化后的时序手机信令数据符合标准正态分布,均值为0,标准差为1。网格(i,j)归一化计算公式可表示为:
式中,和Zscoreij(t)分别代表t时刻网格(i,j)内时序手机信令数据的原始绝对值和归一化值;i和j分别表示网格在经度方向和纬度方向的坐标值;/>表示网格(i,j)内时序手机信令数据在48小时时间序列上的平均值;/>表示网格(i,j)内时序手机信令数据在48小时时间序列上的标准差。
相比现有技术,本发明的有益效果为:
1.本发明的基于移动设备的高渗透率产生了以高时间分辨率反映人体动态的数据,与其他基于社会感知的方法相比,用于建筑功能类型识别的高时间分辨率时间序列信息相比较传统的广泛使用的卫星遥感数据,对建筑功能类型识别更有用,审查的人口空间和时间动态变化与建筑功能类型的相关性大于遥感图像中的几何或光谱特征。
2,本发明基于工作日和非工作日的时间序列手机信令数据表示的人口动态来提取建筑功能类型,在城市规划、管理和应急响应中提供信息决策。
附图说明
图1为本发明提出的一种基于时序手机信令数据和机器学习的建筑功能识别方法的流程示意图;
图2为本发明提出的随机森林模型构建与预测流程示意图;
图3为本发明提出的一种基于时序手机信令数据和机器学习的建筑功能识别方法的四种手机信令指标对五种建筑功能类型样本归一化时序手机信令活动均值时序变化曲线图:
其中(a)居住类;(b)办公类;(c)娱乐类;(d)参观类;(e)医疗类;
图4为本发明提出的一种基于时序手机信令数据和机器学习的建筑功能识别方法的四种时序手机信令指标的OOB建筑功能分类精度示意图。
具体实施方式
参照图1,A获取时序手机信令数据和GIS平台数据,对所述时序手机信令数据和GIS平台数据进行预处理;
本发明中使用的时序手机信令数据来源于提供Android和iOS推送软件开发工具包(SDK)服务的第三方移动推送服务提供商GeTui公司(https://www.getui.com/),SDK,全称Software Development Kit,镶嵌在用户的移动设备中,可以根据移动设备上报的实时位置,原始数据通过GeTui进行预处理,并以Geohash格式存储。在基于地址检索数据时,Geohash是大量空间数据存储常用的方法,它将地球理解为一个二维平面,整个地球空间划分为不同级别的矩形(网格)。二维的纬度和经度被转换成不同长度Geohash格式的字符串,每个字符串代表一个特定的地理网格。同一网格中的所有对象共享相同的Geohash位置字符串。字符串越长,表示的范围位置精度就越高。
在本实施例子中,在步骤A中使用分类和聚类算法中常用的Z-Score标准化方法对每个样本的48小时时间序列数据进行归一化处理,归一化后的时序手机信令数据符合标准正态分布,均值为0,标准差为1。网格(i,j)归一化计算公式可表示为:
式中,和Zscoreij(t)分别代表t时刻网格(i,j)内时序手机信令数据的原始绝对值和归一化值;i和j分别表示网格在经度方向和纬度方向的坐标值;/>表示网格(i,j)内时序手机信令数据在48小时时间序列上的平均值;/>表示网格(i,j)内时序手机信令数据在48小时时间序列上的标准差。
分别对四个时序手机信令指标进行归一化处理,计算各建筑功能类型样本在t时刻的Z-Score平均值,得到各建筑功能类型在48小时时间序列上的平均时序手机信令活动,如图3所示,横轴1-24代表工作日24小时,25-28代表非工作日24小时。由于本发明使用的时序手机信令数据的时间分辨率为一小时,因此绘制的曲线可能不够光滑。然而,不难看出,不同建筑功能类型的时序手机信令数据呈现出不同的动态变化模式。
分类任务是通过学习将每个属性集(x)映射到一个预定义的类别标签(y)来获得一个目标函数(f),也就是说,本发明基于一些已知的样本,包括属性和类别标签,获得一个分类模型,即获得样本属性和类别标签之间的函数,然后利用这个目标函数对只包含属性的样本数据进行分类,基于一些已知样本在人群的时间序列属性和建筑功能类型之间构建一个函数,以识别建筑功能类型,通过引入OpenStreetMap(OSM)数据和高德地图的街景作为真实的建筑功能类型参考数据,以基于所提出的面向种群动态的建筑功能类型分类框架构建随机森林(RF)分类模型,根据给定的建筑功能类型分类方案对建筑物进行分类。
B基于建筑物内工作日和非工作日人口动态变化规律对城市建筑功能类型进行划分,分类后的所述建筑功能类型包括居住类,办公类,娱乐类,参观类和医疗类;
本发明使用最优时序手机信令指标的最优特征组合作为自变量,真实建筑功能作为因变量,构建基于时序手机信令数据的随机森林分类模型(手机信令随机森林分类)。同时,基于Sentinel-2图像的12个光谱波段、每个波段的6个光谱指标和8个纹理特征,采用相同的样本数据构建了Sentinel-2随机森林分类模型(S2-RF)作为对照试验。在构建随机森林模型时,采用交叉验证方法,从750个样本中随机选取70%作为训练数据,其余30%作为测试数据,来评估模型的分类性能。
图4显示了由四个时序手机信令指标分别构建的随机森林分类模型所对应的OOB分类精度。从图中可以看出,无论是总体分类精度还是5个建筑功能类型的个体分类精度,基于移动设备数建立的分类模型的分类精度都比其他模型高。
在构建随机森林模型时,需选取OSM数据作为模型训练和测试参考。但由于OSM数据包含多种建筑功能类别标签,远远超过3.2中定义的五个建筑类别。因此,我们首先将OSM中所有具有有效建筑物标签的建筑物按照本发明分类方案划分为5类,如表1所示。为了增加模型样本量,当原始OSM数据中没有建筑功能标签时,使用高德街景地图来识别建筑物类型。对于混合功能建筑,其主要功能类型被分配给相应的建筑矢量。例如,一些多层住宅楼的一层被用作餐厅或零售,但由于大多数楼层都具有居住功能,因此它们被划分为居住类建筑。
表1OSM、Gaode建筑功能类型标签分类
各建筑功能类型定义如下:
(1)居住类建筑代表具有居住属性的建筑物的集合,如房屋、公寓、学生宿舍等。一般情况下,居民早上起床,工作日上午7:00-9:00左右离开住所,根据不同出行目的分散到其他类型建筑中,下午18:00-19:00左右回到自己的住所。相比于非工作日较为自由的时间安排,居民工作日在建筑物内的时空活动和出行模式呈现出更为明显的变化规律,如图3a,居住类建筑的时序手机信令活动在工作日变化更为显著。在工作日,居住类建筑的活跃设备数在清晨7:00-9:00和傍晚18:00-21:00存在两个峰值,中间存在凹陷。在非工作日,时序手机信令活动表现出较为温和的变化。
(2)办公类代表工作或学习类建筑,如商业/政府办公楼、教学楼、写字楼等。一般在工作日的白天,办公类建筑物内人口密集,工作日夜晚和非工作日人口稀少,如图3b,在工作日上午9:00至下午17:00,办公类建筑内的活跃设备数较多,工作日的夜晚和非工作日活跃设备数显著降低。
(3)娱乐类代表可以用于娱乐的建筑物。这些建筑包括购物中心、电影院、酒吧、餐馆等。娱乐类建筑内的人口变化规律与办公类建筑相似,相较于夜晚,白天的人口一般更为密集,但娱乐类建筑的人口峰值时间一般要略晚于办公类建筑,而且娱乐类建筑一般在非工作日人口更为密集,如图3c,在工作日,娱乐类建筑的时序手机信令活动集中在10:00-18:00之间,而非工作日时序手机信令数据高峰阶段一般略晚于工作日,在12:00-22:00之间。并且非工作日的活跃设备数高于工作日。
(4)参观类建筑是指具有参观或教育性质的休闲建筑,如旅游景点、博物馆、美术馆等。与娱乐类建筑不同,参观类建筑一般有较为固定的开放时间,夜间不开放。工作日,参观类建筑的人口动态变化特点与工作类建筑相似,人口活跃时间集中在白天;非工作日,与娱乐类建筑相似,人口密度比工作日高,如图3d,参观类建筑内时序手机信令活动集中在9:00-17:00,且非工作日的活跃设备总数略高于工作日。
(5)医疗类建筑代表具有医疗性质的建筑集合,例如医院、诊所等。这类建筑与工作类建筑相似,在工作日的白天,人口比较密集,在非工作日和工作日的晚上,人口比较稀少。然而,医疗类建筑内有一个特殊的人口变化模式,上午8点到10点之间人类活动最为活跃,上午10点之后呈现下降趋势,因为人们往往倾向于在一天的早些时候到达医院,如图3e,医疗类建筑的时序手机信令在工作日白天比较活跃,非工作日和工作日晚上较弱。此外,无论是工作日还是非工作日,时序手机信令活动在上午8:00-10:00之间都存在一个特殊的高峰时段。
本发明使用的时序手机信令数据以Geohash格式存储,空间分辨率为150m×150m。为配合时序手机信令数据,矢量格式的建筑功能类型数据同样转换为空间分辨率为150m×150m的栅格。对于包含一种以上建筑类型的混合像元,将面积比例最大的优势类型分配给相应的像元。发明区750个样本,其中居住类样本291个,工作类样本168个,娱乐类样本70个,参观类样本174个,医疗类样本47个。
D选取OSM数据作为模型训练和测试参考,所述OSM数据中的建筑物类别包括居住类,办公类,娱乐类,参观类和医疗类,通过所述手机信令随机森林分类模型对采集到的建筑物进行标注识别。
为了更直观地比较这两个模型在分类结果上的差异,本发明将10次重复实验中排名第5的分类结果进行对比,如表2和表3所示。在训练集和测试集完全相同的情况下,基于手机信令随机森林分类模型的5个建筑功能类型分类结果的生产者精度和用户精度均较S2-RF模型有所提高。手机信令随机森林分类模型的总体分类准确率84.89%,Kappa系数为0.79,而S2-RF模型的总体分类准确率为73.33%,Kappa系数为0.62。
表2手机信令随机森林分类模型10次独立实验中分类精度排名第五的测试集数据分类混淆矩阵
表3S2-RF模型10次独立实验中分类精度排名第五的测试集数据分类混淆矩阵
C对所述手机信令时间序列数据进行归一化处理,对GIS平台数据中的所述OSM数据中的建筑功能类型标签根据所述建筑功能分类方案进行汇总分类;
D选取模型训练和测试样本,以归一化时序手机信令数据作为自变量、真实建筑功能类型作为因变量,基于随机森林机器学习方法构建建筑功能分类模型;
E导入待识别数据和相应的时序手机信令数据通过所述手机信令随机森林分类模型提取建筑功能类型。
本发明对模型构建区共70613栋建筑进行功能识别,共识别出居住类建筑41549个、办公类建筑13826个、娱乐类建筑4258个、参观类建筑7301个以及医疗类建筑1808个。
在本实施例子中,所述随机森林算法包括:
(5)随机采样:从原始数据集中随机选择一部分样本,并用这些样本来训练每个决策树;
(6)构建决策树:对于每个采样后的数据集,构建一颗决策树;
(7)特征选择:对于每棵决策树,从所有特征中随机选择一部分特征,用来建立该决策树;
(8)预测结果:采用投票机制对所有决策树结果进行投票,取得最多票的结果作为最终结果对所述建筑物类型分类。
在本实施例子中,所述随机森林的分类过程包括训练阶段和预测阶段;在训练阶段,随机森林通过随机采样和随机特征选择来构造多棵决策树,对于一个由n个样本组成的训练集,随机森林从中采样n次,每次采样得到一个大小为n的子集,用于训练一棵决策树;同时在节点上,随机森林随机选择k个特征,通常k<<p,p是总特征数,并从这k个特征中选择最佳的特征用于分类。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。
Claims (1)
1.一种基于时序手机信令数据和机器学习的建筑功能识别方法,包括以下步骤,其特征在于,
A获取时序手机信令数据和GIS平台数据,对所述时序手机信令数据和GIS平台数据进行预处理,在步骤A中使用分类和聚类算法中常用的Z-Score标准化方法对每个样本的48小时时间序列数据进行归一化处理,归一化后的时序手机信令数据符合标准正态分布,均值为0,标准差为1,网格(i,j)归一化计算公式可表示为:
式中,和Zscoreij(t)分别代表t时刻网格(i,j)内时序手机信令数据的原始绝对值和归一化值;i和j分别表示网格在经度方向和纬度方向的坐标值;/>表示网格(i,j)内时序手机信令数据在48小时时间序列上的平均值;/>表示网格(i,j)内时序手机信令数据在48小时时间序列上的标准差;
B基于建筑物内工作日和非工作日人口动态变化规律对城市建筑功能类型进行划分,分类后的所述建筑功能类型包括居住类,办公类,娱乐类,参观类和医疗类;
C对所述手机信令时间序列数据进行归一化处理,对GIS平台数据中的所述OSM数据中的建筑功能类型标签根据所述建筑功能分类方案进行汇总分类;
D选取模型训练和测试样本,以归一化时序手机信令数据作为自变量、真实建筑功能类型作为因变量,基于随机森林机器学习方法构建建筑功能分类模型,所述随机森林算法包括
(1)随机采样:从原始数据集中随机选择一部分样本,并用这些样本来训练每个决策树;
(2)构建决策树:对于每个采样后的数据集,构建一颗决策树;
(3)特征选择:对于每棵决策树,从所有特征中随机选择一部分特征,用来建立该决策树;
(4)预测结果:采用投票机制对所有决策树结果进行投票,取得最多票的结果作为最终结果对所述建筑物类型分类,
随机森林的分类过程包括训练阶段和预测阶段;在训练阶段,随机森林通过随机采样和随机特征选择来构造多棵决策树,对于一个由n个样本组成的训练集,随机森林从中采样n次,每次采样得到一个大小为n的子集,用于训练一棵决策树;同时在节点上,随机森林随机选择k个特征,通常k<<p,p是总特征数,并从这k个特征中选择最佳的特征用于分类;
E导入待识别数据和相应的时序手机信令数据通过所述手机信令随机森林分类模型提取建筑功能类型。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310924447.7A CN116956133B (zh) | 2023-07-26 | 2023-07-26 | 基于时序手机信令数据和机器学习的建筑功能识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310924447.7A CN116956133B (zh) | 2023-07-26 | 2023-07-26 | 基于时序手机信令数据和机器学习的建筑功能识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116956133A CN116956133A (zh) | 2023-10-27 |
CN116956133B true CN116956133B (zh) | 2024-02-27 |
Family
ID=88450867
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310924447.7A Active CN116956133B (zh) | 2023-07-26 | 2023-07-26 | 基于时序手机信令数据和机器学习的建筑功能识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116956133B (zh) |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111178179A (zh) * | 2019-12-16 | 2020-05-19 | 广州地理研究所 | 一种基于像元尺度的城市功能区的识别方法及装置 |
CN111639672A (zh) * | 2020-04-23 | 2020-09-08 | 中国科学院空天信息创新研究院 | 一种基于多数投票的深度学习城市功能区分类方法 |
CN111813835A (zh) * | 2020-07-14 | 2020-10-23 | 上海元卓信息科技有限公司 | 一种基于手机信令和poi数据的公共活动中心识别系统 |
CN114819589A (zh) * | 2022-04-20 | 2022-07-29 | 湖南师范大学 | 城市空间高质量利用测定方法、系统、计算机设备及终端 |
CN114969007A (zh) * | 2022-06-01 | 2022-08-30 | 南京大学 | 一种基于功能混合度和集成学习的城市功能区识别方法 |
CN115129802A (zh) * | 2022-07-05 | 2022-09-30 | 南京大学 | 一种基于多源数据和集成学习的人口空间化方法 |
CN115512216A (zh) * | 2022-08-10 | 2022-12-23 | 华中师范大学 | 耦合街区时空特征和集成学习的城市功能区精细化识别方法 |
CN115511210A (zh) * | 2022-10-20 | 2022-12-23 | 郑州市规划勘测设计研究院 | 基于多源大数据的社区生活圈划定方法和装置 |
CN115967950A (zh) * | 2023-02-17 | 2023-04-14 | 东南大学 | 基于手机信令数据的特征与时序的城际出行模式辨识方法 |
-
2023
- 2023-07-26 CN CN202310924447.7A patent/CN116956133B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111178179A (zh) * | 2019-12-16 | 2020-05-19 | 广州地理研究所 | 一种基于像元尺度的城市功能区的识别方法及装置 |
CN111639672A (zh) * | 2020-04-23 | 2020-09-08 | 中国科学院空天信息创新研究院 | 一种基于多数投票的深度学习城市功能区分类方法 |
CN111813835A (zh) * | 2020-07-14 | 2020-10-23 | 上海元卓信息科技有限公司 | 一种基于手机信令和poi数据的公共活动中心识别系统 |
CN114819589A (zh) * | 2022-04-20 | 2022-07-29 | 湖南师范大学 | 城市空间高质量利用测定方法、系统、计算机设备及终端 |
CN114969007A (zh) * | 2022-06-01 | 2022-08-30 | 南京大学 | 一种基于功能混合度和集成学习的城市功能区识别方法 |
CN115129802A (zh) * | 2022-07-05 | 2022-09-30 | 南京大学 | 一种基于多源数据和集成学习的人口空间化方法 |
CN115512216A (zh) * | 2022-08-10 | 2022-12-23 | 华中师范大学 | 耦合街区时空特征和集成学习的城市功能区精细化识别方法 |
CN115511210A (zh) * | 2022-10-20 | 2022-12-23 | 郑州市规划勘测设计研究院 | 基于多源大数据的社区生活圈划定方法和装置 |
CN115967950A (zh) * | 2023-02-17 | 2023-04-14 | 东南大学 | 基于手机信令数据的特征与时序的城际出行模式辨识方法 |
Non-Patent Citations (1)
Title |
---|
聂富强等.《中国国库统计体系研究 以政府财政统计和货币与金融统计的协调为视角》.中国统计出版社,2005, * |
Also Published As
Publication number | Publication date |
---|---|
CN116956133A (zh) | 2023-10-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Xia et al. | Analyzing spatial relationships between urban land use intensity and urban vitality at street block level: A case study of five Chinese megacities | |
Wang et al. | Unsupervised machine learning in urban studies: A systematic review of applications | |
CN111932036B (zh) | 基于位置大数据的精细时空尺度动态人口预测方法及系统 | |
Pei et al. | A new insight into land use classification based on aggregated mobile phone data | |
Malik et al. | Population bias in geotagged tweets | |
Hu et al. | A framework for extracting urban functional regions based on multiprototype word embeddings using points-of-interest data | |
Yuan et al. | Extracting dynamic urban mobility patterns from mobile phone data | |
Aubrecht et al. | Multi-level geospatial modeling of human exposure patterns and vulnerability indicators | |
Bernardini et al. | Sight communities: the social significance of shared visual landmarks | |
Khalifa et al. | Identifying urban crowds using geo-located Social media data: a Twitter experiment in New York City | |
Scepanovic et al. | Jane Jacobs in the sky: predicting urban vitality with open satellite data | |
Câmara et al. | Geocomputation techniques for spatial analysis: are they relevant to health data? | |
Mazimpaka et al. | Exploring the potential of combining taxi GPS and flickr data for discovering functional regions | |
CN111125553B (zh) | 一种支持多源数据的城市建成区智能提取方法 | |
CN111782980A (zh) | 地图兴趣点的挖掘方法、装置、设备及存储介质 | |
Dong et al. | Mapping relationships between mobile phone call activity and regional function using self-organizing map | |
CN116956133B (zh) | 基于时序手机信令数据和机器学习的建筑功能识别方法 | |
Wei et al. | Constructing and analyzing spatial-social networks from location-based social media data | |
Azri et al. | Classified and clustered data constellation: An efficient approach of 3D urban data management | |
Leidner | A survey of textual data & geospatial technology | |
Olajuyigbe et al. | Assessment of Quality of Life Using Geographical Information System Approach for Poverty Alleviation Decision-Making | |
CN115442748A (zh) | 一种使用手机信令数据进行城市空间结构识别方法 | |
CN114510648A (zh) | 城市社会群体与住宅空间的聚类与匹配程度的分析方法 | |
Hennig et al. | Implementing geo citizen science solutions: experiences from the citizenMorph project | |
Silveira et al. | TensorAnalyzer: identification of urban patterns in big cities using non-negative tensor factorization |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |