CN115146990A - 一种集成多源地理大数据的城市活力定量评价方法 - Google Patents

一种集成多源地理大数据的城市活力定量评价方法 Download PDF

Info

Publication number
CN115146990A
CN115146990A CN202210852776.0A CN202210852776A CN115146990A CN 115146990 A CN115146990 A CN 115146990A CN 202210852776 A CN202210852776 A CN 202210852776A CN 115146990 A CN115146990 A CN 115146990A
Authority
CN
China
Prior art keywords
data
vitality
urban
block
calculating
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210852776.0A
Other languages
English (en)
Other versions
CN115146990B (zh
Inventor
夏南
王梓宇
李满春
赵鑫
张家榕
陈振杰
庄苏丹
高醒
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University
Original Assignee
Nanjing University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University filed Critical Nanjing University
Priority to CN202210852776.0A priority Critical patent/CN115146990B/zh
Publication of CN115146990A publication Critical patent/CN115146990A/zh
Application granted granted Critical
Publication of CN115146990B publication Critical patent/CN115146990B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9537Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Development Economics (AREA)
  • Tourism & Hospitality (AREA)
  • Educational Administration (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Software Systems (AREA)
  • Remote Sensing (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • General Health & Medical Sciences (AREA)
  • Game Theory and Decision Science (AREA)
  • Artificial Intelligence (AREA)
  • Primary Health Care (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开一种集成多源地理大数据的城市活力定量评价方法,本评价方法包括以下步骤:S1、对道路数据进行预处理获取街区数据,S2、将街区范围内获取的城市活力评价数据进行汇总,形成特征,S3、计算Pearson相关系数矩阵,确定特征与城市活力的相关性,同时排除冗余特征,S4、构建综合指标和机器学习模型模拟城市活力,S5、对城市活力模拟结果进行精度评价,分析各特征的贡献。本发明通过集成多源地理大数据,构建综合指标和构建机器学习模型,可以解决现有技术中城市活力评价方法精度不足、数据来源较少的问题,建立衡量各因素对城市活力的贡献的方法,并形成综合城市活力评价体系。

Description

一种集成多源地理大数据的城市活力定量评价方法
技术领域
本发明涉及城市研究技术领域,具体为一种集成多源地理大数据的城市活力定量评价方法。
背景技术
城市活力指城市空间支持生活功能、生态需求,为市民营造人性化生存、为城市自身谋求发展的能力。建设有活力的城市空间是优质城市空间需求的根本,有助于提高居民生活质量,推动实现可持续发展,是城市空间旺盛生命力和城市功能生存发展的保证。当前我国正在着力推动高质量发展,城市规划与建设应当追求更高的建设质量和空间品质,城市活力研究能评价城市内部活力现状,检验城市空间品质及分布特征,辅助优化城镇布局,服务于城市规划与建设,近年来在城市管理中受到重视。
城市活力定量评价是城市活力研究的重要课题之一,可辅助城市活力时空对比、城市活力影响因素分析等研究。城市活力定量评价的主要方法包括两种,一是选取可表征城市活力的数据,对获取的数据进行一定简单运算,将计算结果作为指标或指标体系用以评价城市活力,可称为指标法;二是结合与城市活力相关的数据与特征,建立模型对城市活力进行评价,可称为模型法,模型法使用了较多经典方法建立模型,例如耦合度模型、熵值法、地理加权回归模型、空间权重矩阵模型等,近年来的研究也使用新技术手段建立更为复杂的机器学习模型。
总体而言,现有技术存在以下不足:
目前对城市活力进行定量评价的方法中,建立指标的方法相对单一且精度不高,对数据的处理也相对简单,城市活力定量评价指标通常只采用POI数据、热力图数据、手机信令数据等单类数据,单一指标通常可以反映某一方面的城市活力,但缺乏代表性和对不同类型城市活动的考虑。同时,不同数据对城市活力的影响作用机理和强度可能不同,指标法很难全面地考虑对指标的结构及其构建方法。
模型法使用的经典模型具有坚实的理论基础和较好的精度,但能使用的数据种类较少,无法使用多源数据,计算过程也较为复杂,对目前使用更加广泛的地理大数据的利用并不充分。例如使用多元线性回归模型,使用既往方法,回归自变量通常不超过10种。而如果引入机器学习方法,自变量可以达到数十种,对数据的应用更为广泛。机器学习方法在城市活力定量评价中研究潜力甚大,目前应用还不够广泛。
发明内容
本发明的目的在于提供一种集成多源地理大数据的城市活力定量评价方法,以解决上述背景技术中提出的问题。
一种集成多源地理大数据的城市活力定量评价方法,本评价方法包括以下步骤:
S1、对道路数据进行预处理获取街区数据;
S2、将街区范围内获取的城市活力评价数据进行汇总,形成特征;
S3、计算Pearson相关系数矩阵,确定特征与城市活力的相关性,同时排除冗余特征;
S4、构建综合指标和机器学习模型模拟城市活力;
S5、对城市活力模拟结果进行精度评价、分析各特征的贡献。
作为本发明的进一步改进,本方法中步骤S1包括以下步骤:
a1、检查所述道路数据的一致性,剔除相互重叠的道路;
a2、进行拓扑检查,去除悬垂道路和独立路段。
作为本发明的进一步改进,本方法步骤S2中城市活力评价数据包括基础地理数据、地理大数据和遥感数据产品,所述特征包括路网数据特征、土地利用数据特征、出租车数据特征、租金数据特征、微博签到数据特征、夜光遥感数据特征和MODIS数据特征等,其中:
基础地理数据包括行政区划数据和OSM路网数据;
地理大数据包括POI兴趣点数据、出租车轨迹数据、房屋租金数据和微博签到数据;
遥感数据产品包括土地利用数据、MODIS植被指数数据和夜光遥感数据;土地利用数据包括耕地、林地、草地、水体、城市用地和裸地。
作为本发明的进一步改进,本方法中路网数据特征计算包括以下步骤:
b1、将OSM路网数据分为主干道、次干道和其他道路;
b2、计算各街区内主干道的总长度、主干道和次干道的总长度之和、所有道路的长度之和,以及上述三种长度除以街区图斑面积所得的密度值。
作为本发明的进一步改进,本方法中土地利用数据特征计算包括以下步骤:
c1、使用分区统计方法计算每个街区内城市用地的占比、生态用地的占比及水体的占比,其中生态用地包括林地、草地和耕地等;
c2、利用香农指数计算土地利用混合度,计算公式为:
Figure BDA0003738956950000031
其中,SHDI表示香农指数,A表示街区的总面积,n表示该街区内土地利用种类的个数,Ai表示街区内每种土地利用类型的面积。
作为本发明的进一步改进,本方法中出租车数据特征计算包括以下步骤:
d1、以街区为单元,统计终点落在该街区内的出租车轨迹线,记为驶入轨迹线,以及起点落在该街区内的出租车轨迹线,记为驶出轨迹线;
d2、计算每个街区所有驶入轨迹线、所有驶出轨迹线的总长度和平均长度,计算驶入轨迹线平均长度和驶出轨迹线平均长度的平均值。
作为本发明的进一步改进,本方法中租金数据特征和微博签到数据特征计算步骤为计算每个街区内房屋租金平均值,计算每个街区内日间微博签到数总和、夜间微博签到数总和、全天微博签到数总和;
夜光遥感数据特征和MODIS数据特征计算步骤为计算每个街区范围内所有像元值的总和、平均值。
作为本发明的进一步改进,本方法中步骤S3包括以下步骤:
e1、计算特征间的Pearson相关系数,其公式为:
Figure BDA0003738956950000041
其中,r指Pearson相关系数,n为特征的数量,Xi和Yi指各项数据的值,
Figure BDA0003738956950000042
Figure BDA0003738956950000043
指数据的均值;
e2、去除冗余特征,若两项特征的Pearson相关系数超过0.6,即视为冗余特征,需结合与其他特征的相关性去除一项;
e3、根据各特征之间Pearson相关系数的符号,确定其相关性质为正相关或负相关。
作为本发明的进一步改进,本方法中步骤S4包括以下步骤:
f1、构建综合指标,将不同特征归一化后进行运算,组合为结构更复杂的指标,用复杂指标定量评价城市活力;
f2、构建机器学习模型,通过训练样本的特征拟合结果定量评价城市活力,权重可通过机器学习方法得到。
作为本发明的进一步改进,本方法中步骤S5包括以下步骤:
g1、将POI密度数据作为城市活力真实值,通过计算城市活力模拟结果与真实值的Pearson相关系数进行精度评价;
g2、通过对城市活力模拟结果与真实值进行聚类分析,对比聚类分析结果进行精度评价,聚类分析方法计算局部莫兰指数及其Z得分,计算公式为:
Figure BDA0003738956950000051
Figure BDA0003738956950000052
其中xi是要素i的值,xj是其邻近要素j的值,n为要素数量,
Figure BDA0003738956950000056
指要素值的均值,s2为要素值与其均值的方差,wij为权重,Z得分的计算公式为:
Figure BDA0003738956950000053
Figure BDA0003738956950000054
Figure BDA0003738956950000055
与现有技术相比,本发明的有益效果是:
本发明通过使用不同性质和来源的地理大数据,分别进行分区处理,对城市活力进行全方位评价,并建立衡量不同数据的贡献程度的方法、精度评价方法,解决现有技术中城市活力评价方法单一、缺乏衡量不同数据贡献程度和评价精度的方法带来的局限性,形成综合城市活力定量评价体系,也可为城市规划、建设与管理提供参考。
附图说明
图1为本发明一种集成多源地理大数据的城市活力定量评价方法流程图;
图2为本发明一种集成多源地理大数据的城市活力定量评价方法POI密度数据表征的城市活力真实值图;
图3为本发明一种集成多源地理大数据的城市活力定量评价方法香农指数表征的城市活力空间分布图;
图4为本发明一种集成多源地理大数据的城市活力定量评价方法综合指标1表征的城市活力空间分布图;
图5为本发明一种集成多源地理大数据的城市活力定量评价方法综合指标2表征的城市活力空间分布图;
图6为本发明一种集成多源地理大数据的城市活力定量评价方法随机森林模型反演的城市活力空间分布图;
图7为本发明一种集成多源地理大数据的城市活力定量评价方法指标法和模型法相关系数对比图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例
请参阅图1-7,本发明提供如下技术方案:一种集成多源地理大数据的城市活力定量评价方法。
本发明中实施例中,选用深圳市城市活力作为分析对象,通过集成多源地理大数据,引入综合指标和机器学习模型,以深圳市街区为研究单元,计算各街区的指标特征,用各指标特征构建综合模型和机器学习模型对城市活力进行定量评价,具体步骤如下:
S1、对道路数据进行预处理获取街区数据;
街区根据OSM路网数据中的高速公路、主干道和次干道进行划分,在深圳市划分出街区6699个;
a1、检查所述道路数据的一致性,剔除相互重叠的道路;
a2、进行拓扑检查,去除悬垂道路和独立路段。
S2、将街区范围内获取的城市活力评价数据进行汇总,形成特征;
城市活力评价数据包括基础地理数据、地理大数据和遥感数据产品,其中:
基础地理数据包括行政区划数据和OSM路网数据;
地理大数据包括POI兴趣点数据、出租车轨迹数据、房屋租金数据和微博签到数据;
遥感数据产品包括土地利用数据、MODIS植被指数数据和夜光遥感数据;土地利用数据类别包括耕地、林地、草地、水体、城市用地和裸地;
特征包括路网数据特征、土地利用数据特征、出租车数据特征、租金数据特征、微博签到数据特征、夜光遥感数据特征和MODIS数据特征等;
路网数据特征计算包括以下步骤:
b1、将OSM路网数据分为主干道、次干道和其他道路;
b2、计算各街区内主干道的总长度、主干道和次干道的总长度之和、所有道路的长度之和,以及上述三种长度除以街区图斑面积所得的密度值,以全部道路长度为例,最小值为0,最大值为143922米,均值为5270.90米,中位数为3079.05米;
土地利用数据特征计算包括以下步骤:
c1、使用分区统计方法计算每个街区内城市用地的占比、生态用地的占比及水体的占比,其中生态用地包括林地、草地和耕地等,深圳市街区中城市用地比例较高;
c2、利用香农指数计算土地利用混合度,计算公式为:
Figure BDA0003738956950000071
其中,SHDI表示香农指数,A表示街区的总面积,n表示该街区内土地利用种类的个数,Ai表示街区内每种土地利用类型的面积。
出租车数据特征计算包括以下步骤:
获取的出租车数据共有约4693万条,包括出租车ID、轨迹点的时间和经纬度坐标、载客状态等属性;
d1、以街区为单元,统计终点落在该街区内的出租车轨迹线,记为驶入轨迹线,以及起点落在该街区内的出租车轨迹线,记为驶出轨迹线;
d2、计算每个街区所有驶入轨迹线、所有驶出轨迹线的总长度和平均长度,计算驶入轨迹线平均长度和驶出轨迹线平均长度的平均值,以总平均值为例,最小值为168.76米,最大值为42565.0米,平均值为6084.78米,中位数为5153.52米;
租金数据特征和微博签到数据特征计算步骤为计算每个街区内房屋租金平均值;
计算每个街区内日间微博签到数总和、夜间微博签到数总和、全天微博签到数总和,以全天总和为例,最大值为46165,平均值为557.19,中位数为55;
夜光遥感数据特征和MODIS数据特征计算步骤为计算每个街区范围内所有像元值的总和、平均值。
S3、计算Pearson相关系数矩阵,确定特征与城市活力的相关性,同时排除冗余特征;
e1、计算特征间的Pearson相关系数,其公式为:
Figure BDA0003738956950000081
其中,r指Pearson相关系数,n为特征的数量,Xi和Yi指各项数据的值,
Figure BDA0003738956950000091
Figure BDA0003738956950000092
指数据的均值;
e2、去除冗余特征,若两项特征的Pearson相关系数超过0.6,即视为冗余特征,需结合与其他特征的相关性去除一项,深圳市总共得到25种特征,如表1所示,部分指标的Pearson相关系数如表2所示;
e3、根据各特征之间Pearson相关系数的符号,确定其相关性质为正相关或负相关。
S4、构建综合指标和机器学习模型模拟城市活力;
f1、构建综合指标,将不同特征归一化后进行运算,组合为结构更复杂的指标,用复杂指标定量评价城市活力;
f2、构建机器学习模型,通过训练样本的特征拟合结果定量评价城市活力,权重可通过机器学习方法得到,使用随机森林(RF)模型对深圳市城市活力进行反演与评价。
S5、对城市活力模拟结果进行精度评价、分析各特征的贡献;
g1、将POI密度数据作为城市活力真实值,通过计算城市活力模拟结果与真实值的Pearson相关系数进行精度评价,步骤S4建立的指标和模型中,综合指标相关系数约为0.55-0.60,机器学习模型约为0.80;
根据随机森林模型计算各指标的贡献,其中贡献最高的是出租车驶入OD线平均长度,约为30%,其次为夜光遥感数据均值,约为18%;
g2、通过对城市活力模拟结果与真实值进行聚类分析,对比聚类分析结果进行精度评价,聚类分析方法计算局部莫兰指数及其Z得分,计算公式为:
Figure BDA0003738956950000093
Figure BDA0003738956950000094
其中xi是要素i的值,xj是其邻近要素j的值,n为要素数量,
Figure BDA0003738956950000106
指要素值的均值,s2为要素值与其均值的方差,wij为权重,Z得分的计算公式为:
Figure BDA0003738956950000101
Figure BDA0003738956950000102
Figure BDA0003738956950000103
表1城市活力指标体系
Figure BDA0003738956950000104
表2指标相关性分析
Figure BDA0003738956950000105
Figure BDA0003738956950000111
注:P:POI数量,S:香农指数,IM:出租车驶入OD线平均长度,IS:出租车驶入OD线长度总和,OM:出租车驶出OD线平均长度,OS:出租车驶出OD线长度总和,T:IM和OM的平均值,W:微博日签到总数,WN:微博夜间签到数,WD:微博日间签到数,C:平均房屋租金价格。
以下为利用本发明展开的具体实施例研究与结果分析:
本发明使用POI密度数据表征城市活力的真实值(图2)。其中城市活力值最高的区域位于南山区、罗湖区和福田区,此外在宝安区和龙岗区中部的龙城街道,也存在城市活力的高值集聚区域。深圳的城市活力分布在经济发达、人口密集的区域较高,从较高的区域向外逐渐减小,在距离大型公园、风景名胜区较近区域达到最低值。
对比本发明提出的单一指标、综合指标和随机森林模拟的城市活力定量评价结果,计算与城市活力真实值的Pearson相关系数。单一指标法中香农指数并无明显的集中分布区域,数值较高的街区分布在城市的不同区域,在城市活力较高的区域的数值也并未明显高于其他区域(图3)。这说明香农指数作为单一指标,并不能完全表征城市活力分布情况。综合指标法中得到的最好指标是综合指标1:(C+W-T)/(C+W+T)(图4)和综合指标2:lnC-lnT+eW(图5)(C:平均房屋租金价格;W:微博日签到总数;T:出租车驶入和驶出OD线平均长度的均值),Pearson相关系数分别为0.6004和0.5690。指标法对城市活力较高的区域的拟合效果较好,综合指标1和综合指标2都正确反映了南山区、福田区、罗湖区、龙城街道等的城市活力高值分布区域。
随机森林模型得到的城市活力模拟数据,则不存在城市活力真实值较低的区域拟合值较高的问题,也较好地反映了城市活力值较高的区域,但在城市活力值较高的区域,有较多街区拟合值偏低(图6)。产生这一现象的原因是模型法使用的是未归一化的数据,数据绝对值的影响较大。本研究使用的数据中,微博数据和出租车数据的缺省值较多,而微博数据和出租车数据往往数值较大,较多街区的数值超过104,缺省微博数据和出租车数据的街区拟合值较低。然而从整体上看,模型法使用不同特征的线性组合,在数据缺省时拟合值偏低,而非像综合指标1那样产生偏高的结果,对整体的影响要略低,且如果在因缺省数据而导致拟合值偏低的街区的附近存在得到正常拟合结果的街区,依然能对该街区的城市活力情况进行推测;模型法使用的数据较多,若干项数据的缺省对整体的影响也相应降低。可见模型法受到异常数据影响的程度低于指标法,对城市活力的定量评价能力更优。
综上所述,综合指标法与城市活力真实值的相关系数约为0.60,随机森林模型法约为0.78,不同的方法对城市活力定量评价的拟合程度截然不同,模型法高于综合指标法,综合指标法高于单一指标法,如图7所示。
由上可见,本发明提出的方法可以较好地对城市活力进行定量评价,并分析不同特征的贡献,探究城市活力的影响因素,进一步为城市规划与建设提供科学决策,推动高质量发展,本发明提出的方法具有较高的精度,能正确反映深圳市城市活力的分布规律,同时,可对评价的结果进行进一步分析。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性地包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。
尽管已经示出了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

Claims (10)

1.一种集成多源地理大数据的城市活力定量评价方法,其特征在于:本评价方法包括以下步骤:
S1、对道路数据进行预处理获取街区数据;
S2、将街区范围内获取的城市活力评价数据进行汇总,形成特征;
S3、计算Pearson相关系数矩阵,确定特征与城市活力的相关性,同时排除冗余特征;
S4、构建综合指标和机器学习模型模拟城市活力;
S5、对城市活力模拟结果进行精度评价,分析各特征的贡献。
2.根据权利要求1所述的集成多源地理大数据的城市活力定量评价方法,其特征在于:本方法中步骤S1包括以下步骤:
a1、检查所述道路数据的一致性,剔除相互重叠的道路;
a2、进行拓扑检查,去除悬垂道路和独立路段。
3.根据权利要求1所述的集成多源地理大数据的城市活力定量评价方法,其特征在于:本方法步骤S2中城市活力评价数据包括基础地理数据、地理大数据和遥感数据产品,所述特征包括路网数据特征、土地利用数据特征、出租车数据特征、租金数据特征、微博签到数据特征、夜光遥感数据特征和MODIS数据特征,其中:
基础地理数据包括行政区划数据和OSM路网数据;
地理大数据包括POI兴趣点数据、出租车轨迹数据、房屋租金数据和微博签到数据;
遥感数据产品包括土地利用数据、MODIS植被指数数据和夜光遥感数据;土地利用数据包括耕地、林地、草地、水体、城市用地和裸地。
4.根据权利要求3所述的集成多源地理大数据的城市活力定量评价方法,其特征在于:本方法中路网数据特征计算包括以下步骤:
b1、将OSM路网数据分为主干道、次干道和其他道路;
b2、计算各街区内主干道的总长度、主干道和次干道的总长度之和、所有道路的长度之和,以及上述三种长度除以街区图斑面积所得的密度值。
5.根据权利要求3所述的集成多源地理大数据的城市活力定量评价方法,其特征在于:本方法中土地利用数据特征计算包括以下步骤:
c1、使用分区统计方法计算每个街区内城市用地的占比、生态用地的占比及水体的占比,其中生态用地包括林地、草地和耕地等;
c2、利用香农指数计算土地利用混合度,计算公式为:
Figure FDA0003738956940000021
其中,SHDI表示香农指数,A表示街区的总面积,n表示该街区内土地利用种类的个数,Ai表示街区内每种土地利用类型的面积。
6.根据权利要求3所述的集成多源地理大数据的城市活力定量评价方法,其特征在于:本方法中出租车数据特征计算包括以下步骤:
d1、以街区为单元,统计终点落在该街区内的出租车轨迹线,记为驶入轨迹线,以及起点落在该街区内的出租车轨迹线,记为驶出轨迹线;
d2、计算每个街区所有驶入轨迹线、所有驶出轨迹线的总长度和平均长度,计算驶入轨迹线平均长度和驶出轨迹线平均长度的平均值。
7.根据权利要求3所述的集成多源地理大数据的城市活力定量评价方法,其特征在于:本方法中租金数据特征和微博签到数据特征计算步骤为计算每个街区内房屋租金平均值,计算每个街区内日间微博签到数总和、夜间微博签到数总和、全天微博签到数总和;
夜光遥感数据特征和MODIS数据特征计算步骤为计算每个街区范围内所有像元值的总和、平均值。
8.根据权利要求1所述的集成多源地理大数据的城市活力定量评价方法,其特征在于:本方法中步骤S3包括以下步骤:
e1、计算特征间的Pearson相关系数,其公式为:
Figure FDA0003738956940000031
其中,r指Pearson相关系数,n为特征的数量,Xi和Yi指各项数据的值,
Figure FDA0003738956940000032
Figure FDA0003738956940000033
指数据的均值;
e2、去除冗余特征,若两项特征的Pearson相关系数超过0.6,即视为冗余特征,需结合与其他特征的相关性去除一项;
e3、根据各特征之间Pearson相关系数的符号,确定其相关性质为正相关或负相关。
9.根据权利要求1所述的集成多源地理大数据的城市活力定量评价方法,其特征在于:本方法中步骤S4包括以下步骤:
f1、构建综合指标,将不同特征归一化后进行运算,组合为结构更复杂的指标,用复杂指标定量评价城市活力;
f2、构建机器学习模型,通过训练样本的特征拟合结果定量评价城市活力,权重可通过机器学习方法得到。
10.根据权利要求1所述的集成多源地理大数据的城市活力定量评价方法,其特征在于:本方法中步骤S5包括以下步骤:
g1、将POI密度作为城市活力真实值,通过计算城市活力模拟结果与真实值的Pearson相关系数进行精度评价;
g2、通过对城市活力模拟结果与真实值进行聚类分析,对比聚类分析结果进行精度评价,聚类分析方法计算局部莫兰指数及其Z得分,计算公式为:
Figure FDA0003738956940000041
Figure FDA0003738956940000042
其中xi是要素i的值,xj是其邻近要素j的值,n为要素数量,
Figure FDA0003738956940000046
指要素值的均值,s2为要素值与其均值的方差,wij为权重,Z得分的计算公式为:
Figure FDA0003738956940000043
Figure FDA0003738956940000044
Figure FDA0003738956940000045
CN202210852776.0A 2022-07-11 2022-07-11 一种集成多源地理大数据的城市活力定量评价方法 Active CN115146990B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210852776.0A CN115146990B (zh) 2022-07-11 2022-07-11 一种集成多源地理大数据的城市活力定量评价方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210852776.0A CN115146990B (zh) 2022-07-11 2022-07-11 一种集成多源地理大数据的城市活力定量评价方法

Publications (2)

Publication Number Publication Date
CN115146990A true CN115146990A (zh) 2022-10-04
CN115146990B CN115146990B (zh) 2024-02-27

Family

ID=83411669

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210852776.0A Active CN115146990B (zh) 2022-07-11 2022-07-11 一种集成多源地理大数据的城市活力定量评价方法

Country Status (1)

Country Link
CN (1) CN115146990B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116882831A (zh) * 2023-07-17 2023-10-13 苏州科技大学 城市历史文化街区公共空间活力评价方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2020102465A4 (en) * 2020-09-28 2020-11-12 Chen, Rundong Mr A method of predicting housing price using the method of combining multiple source data with mathematical model
CN112819319A (zh) * 2021-01-29 2021-05-18 华南理工大学 一种城市活力与空间社会特征相关性的测度方法及应用
CN114581622A (zh) * 2022-03-15 2022-06-03 南京大学 顾及三维空间的土地利用混合度综合计算及空间制图方法
CN114662774A (zh) * 2022-04-02 2022-06-24 东南大学 一种城市街区活力预测方法、存储介质和终端

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2020102465A4 (en) * 2020-09-28 2020-11-12 Chen, Rundong Mr A method of predicting housing price using the method of combining multiple source data with mathematical model
CN112819319A (zh) * 2021-01-29 2021-05-18 华南理工大学 一种城市活力与空间社会特征相关性的测度方法及应用
CN114581622A (zh) * 2022-03-15 2022-06-03 南京大学 顾及三维空间的土地利用混合度综合计算及空间制图方法
CN114662774A (zh) * 2022-04-02 2022-06-24 东南大学 一种城市街区活力预测方法、存储介质和终端

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116882831A (zh) * 2023-07-17 2023-10-13 苏州科技大学 城市历史文化街区公共空间活力评价方法及系统

Also Published As

Publication number Publication date
CN115146990B (zh) 2024-02-27

Similar Documents

Publication Publication Date Title
González-García et al. Embedding environmental, economic and social indicators in the evaluation of the sustainability of the municipalities of Galicia (northwest of Spain)
Henderson et al. Measuring economic growth from outer space
WO2022198963A1 (zh) 基于大数据的商业空间品质评价方法、系统、设备及介质
CN112966899B (zh) 一种影响人口密度的城市公共服务设施建设决策方法
CN111401692B (zh) 一种度量城市空间功能紧凑度的方法
Rabiei‐Dastjerdi et al. Who gets what, where, and how much? Composite index of spatial inequality for small areas in Tehran
CN112561401A (zh) 一种基于多源大数据的城市活力测度与表征方法及系统
Mansour et al. Spatial disparity patterns of green spaces and buildings in arid urban areas
CN113239316A (zh) 一种顾及人群消费特征的城市商服设施布局合理性评价方法及系统
CN113204719A (zh) 一种基于位置信息叠加与深度神经网络的城市房屋租金估价方法
CN112949997A (zh) 用于城市规划设计中的社区画像的系统和方法
CN116796904A (zh) 一种轨道交通新线客流预测方法、系统、电子设备及介质
CN110377679B (zh) 一种基于轨迹定位数据的公共空间活力测度方法及系统
CN115146990B (zh) 一种集成多源地理大数据的城市活力定量评价方法
CN114154880A (zh) 一种评价街道单元层面公共服务设施步行可达性的方法
Topcu et al. The analysis of urban features that affect land values in residential areas
CN113343164A (zh) 一种基于公共服务设施配置的农村居民点社会网络建模方法
CN111008730B (zh) 基于城市空间结构的人群聚集度预测模型构建方法及装置
Du et al. Suitability analysis for greenway planning in China: an example of Chongming Island
Mazhi et al. Site selection of retail shop based on spatial analysis and machine learning
CN113887993A (zh) 体育设施与人口耦合协调性评价方法、系统、设备及介质
CN114282934A (zh) 一种基于手机信令数据的城市低收入人群分布预测方法、系统及存储介质
Maleta et al. Distance Based Synthetic Measure of Agricultural Parcel Locations
CN111582683A (zh) 一种基于网络热度的城市公共服务设施供给效率评价方法
Mazi et al. Urban Planning in Al-Madinah Al-Munawarah using new green spaces modelling through GIS Application

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant