CN112288048B - 一种基于多源数据驱动的城市人群出行识别方法 - Google Patents

一种基于多源数据驱动的城市人群出行识别方法 Download PDF

Info

Publication number
CN112288048B
CN112288048B CN202011573263.3A CN202011573263A CN112288048B CN 112288048 B CN112288048 B CN 112288048B CN 202011573263 A CN202011573263 A CN 202011573263A CN 112288048 B CN112288048 B CN 112288048B
Authority
CN
China
Prior art keywords
city
data
urban
poi data
bus
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011573263.3A
Other languages
English (en)
Other versions
CN112288048A (zh
Inventor
张锦
张建忠
汪飞
郭芊
陈谏滔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hunan Normal University
Original Assignee
Hunan Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hunan Normal University filed Critical Hunan Normal University
Priority to CN202011573263.3A priority Critical patent/CN112288048B/zh
Publication of CN112288048A publication Critical patent/CN112288048A/zh
Application granted granted Critical
Publication of CN112288048B publication Critical patent/CN112288048B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Probability & Statistics with Applications (AREA)
  • Traffic Control Systems (AREA)

Abstract

本发明公开了一种基于多源数据驱动的城市人群出行识别方法,所述方法如下:S1、爬取城市POI数据并对公交站点POI数据聚类,确定该聚类簇中心点以构建城市Voronoi图;S2、基于步骤S1中的数据对该城市的功能区域进行划分;S3、获取城市人群出行数据并进行聚类,确定该城市人群出行聚类的簇中心点;S4、将城市人群出行聚类的簇中心点展示到城市Voronoi图上,识别出该城市人群出行分布规律。本发明利用城市POI数据划分城市的功能区域,基于该城市的功能区域获取不同时间段的城市人群出行数据从而识别出不同时间段该城市的人群出行分布规律,为智慧城市的建设提供了依据。

Description

一种基于多源数据驱动的城市人群出行识别方法
技术领域
本发明属于交通控制技术领域,具体涉及了一种基于多源数据驱动的城市人群出行识别方法。
背景技术
城市既是历史和文化的产物,也是社会和政治网络,还是经济体,城市的内涵超越了其自身形态,是高度结构化的复杂空间系统。合理的城市功能区规划是城市可持续发展的重要前提,而准确识别城市功能区对城市规划十分重要。好的城市功能区结构可以缓解交通拥堵、提高人们生活幸福度和合理利用资源等。目前,部分城市功能区规划仅根据土地使用类型现状数据和区域人口密度等社会经济统计数据来识别城市区域功能,导致功能区识别不够准确,而且也较少考虑人们社会活动因素与城市功能区间的联系,无法反映人类活动对区域功能动态变化的影响。时空轨迹数据作为城市大数据的重要组成部分,能够反映车辆行驶状况与人们的出行模式。并且利用轨迹数据进行功能区的划分与识别,能够帮助城市管理者更好地分析城市区域的功能性与人们出行的关系。
近年来,也有很多学者对城市功能区识别展开了相关研究,于翔(Yu X.Discovering Zones of Different Function Using Bus Smart Card Data and Poitsof Interest:A Case Study of Beijing.[D].Hangzhou: Zhejiang University,2014)使用公交 IC 卡刷卡数据及 POI 数据构建了城市功能区识别模型。蒋云良(Jiang Y L,Dong M X, Fan J etc. Research on identifying urban regions of differentfunctions based on POI data[J]. Journal of Zhejiang Normal University(Nat.Sci.), 2017,40(4):398-405)等人着眼于“功能区”这一概念,设计了一种基于兴趣点( Point of Interest,POI) 数据识别城市功能区的算法,使用POI数据对城市的各个区域进行了功能识别,并使用手机基站位置信息划分城市基本单元。出租车已成为城市交通系统中的重要组成部分,其运行状态、网络结构和活动空间分布对于揭示城市出行活动规律具有重要意义,其GPS数据被广泛应用于城市计算、城市规划等领域。陈世莉(Chen S L,Tao H Y,Li X L,等.Recognition of urban functional areas based on latentsemantic information—GPS Spatiotemporal Data Mining of Floating Vehicles inGuangzhou[J].Acta Geographica Sinica,2016,71(3) : 471-483)等人结合广州市浮动车辆 GPS 数据提出了一种基于语义信息的城市功能区识别方法,可识别出城市不同类型的功能区,从一个新的视角揭示城市功能区的形成及其机制。付鑫(Fu X,Yang Y,Sun H.Structural complexity and spatial differentiation characteristics of taxitrip trajectory network[J].Journal of Traffic and Transportation Engineering,2017,17(2) : 106-116)等通过对西安市出租车轨迹网络结构复杂性与空间分异特征的研究,揭示了城市居民活动的空间特征、活动规律及其与城市功能空间布局之间的相互影响作用。
对于公共出行数据与城市人群类型识别这两个方面,师富民(Shi F M. Researchon the Construction Method of Public Transport OD Matrix Based on IC CardData[D]. Jilin University, 2004)在其硕士论文中提出了利用IC卡刷卡数据的公交调查方法和数据处理的算法。具体包括通过公交IC卡数据库,判断出该次出行的起讫点,进而得到公交线路OD矩阵,但是该论文未对人群进行分类。牟彤(Mou T. Research onResident Travel Characteristics Analysis and Recommendation Based on MobilePhone Location Data[D]. Southwest Jiaotong University, 2019)对基于手机定位数据GPS对居民出行特征与出行推荐算法进行了研究,首先确定停留点的位置信息,采用了DBSCAN算法对轨迹数据进行挖掘分析,其次设计时空因素的推荐算法,给出不同时段不同居民适宜出行地点的针对性推荐,并结合实际案例,分析算法的可行性,本文也在考虑使用DBSCAN算法对轨迹数据进行挖掘分析,但本文将进一步结合POI进行识别与展示。对于POI数据,房佳萱(Fang J X. Research of Walking Accessibility Based On Poi InNanshan District,ShenZhen [D].Harbin Institute of Technology, 2017)在其硕士论文中基于POI对于深圳市南山区步行可行性评价研究中提出,人群在POI附近600米之内范围步行活动处于舒适和易于到达状态。王定(Wang D, Guo L, Lu Q B. Research onSpace Utilization of Wuhan Rail Transit Station Based on POI Data[C]. ChinaUrban Planning Society、Chongqing Municipal People's Government.Vibrant urbanand rural beautiful habitat——Proceedings of China Urban Planning AnnualConference 2019(05 New Technology Application in Urban Planning). China UrbanPlanning Society、Chongqing Municipal People's Government:China Urban PlanningSociety, 2019:1329-1338)等在基于POI数据的武汉市轨道交通站点空间使用研究中,对武汉市轨道交通站点类型进行识别,并分析不同类型轨道交通站点的形成机制,为轨道交通站点用地功能优化提供科学依据。袁晶(Yuan Jing,Zheng Yu,Xie Xing. Discoveringregions of different functions in a city using human mobility and POIs[C]//KDD 12th Proceedings of 18th ACM SIGKSS International Conference on KnowledgeDiscovery and Data Mining. Beijing: ACM,2012: 186-194)等提出了一个利用出租车GPS 轨迹数据和区域 POI 数据构成的 Discovers Regions of Different Functions框架。POI数据包括的类型全面,涉及各个层面,且抓取十分方便,这也是POI 数据被广泛使用的原因之一。
鉴于此,本发明研究了一种基于多源数据驱动的城市人群出行识别方法,该方法通过获取城市POI数据以对城市功能区进行划分,然后结合城市人群出行数据实现了对城市人群出行的活动情况进行准确分析,为智慧城市的建设提供了依据。
发明内容
为解决上述技术问题,本发明提供一种基于多源数据驱动的城市人群出行识别方法,所述方法包括以下步骤:
S1、爬取城市POI数据并对所爬取的城市POI数据中的公交站点POI数据进行聚类,然后确定公交站点POI数据聚类的簇中心点并根据所确定的公交站点POI数据聚类的簇中心点构建对应的城市Voronoi图;
S2、基于所述步骤S1中城市POI数据、公交站点POI数据聚类的簇中心点和城市Voronoi图对该城市的功能区域进行划分;
S3、获取所述城市不同时间段的人群出行数据并分别进行聚类,同时确定所述城市不同时间段的人群出行聚类的簇中心点;
S4、将步骤S3中确定的城市不同时间段的人群出行聚类的簇中心点分别展示到所述城市Voronoi图上,从而根据该城市的功能区域划分识别出所述城市不同时间段的人群出行分布规律。
优选地,所述城市POI数据按照该城市的功能区域进行分类,其包括餐饮服务、旅游景点、公共服务、公司企业、购物服务、科学,教育和文化服务、商务住宿、生活服务、体育娱乐,以及政府机构和社会团体十类功能性类别。
优选地,每一条所述城市POI数据中均包括经度、纬度、POI名称、地址、省份名称、城市名称、经营区域、big_type、meddle_type、small_type和所属辖区十一个属性。
优选地,所述步骤S1的具体实现方式包括:
S11、利用现有APP软件爬取城市的全部POI数据并对所爬取的全部POI数据进行清洗,然后选取该城市的公交站台POI数据并计算公交站台之间的实际距离,其计算公式表示为:
Figure 256350DEST_PATH_IMAGE001
(1)
式(1)中,
Figure 889456DEST_PATH_IMAGE002
表示半正矢函数,
Figure 599923DEST_PATH_IMAGE003
表示两个公交站台之间的距离,
Figure 609468DEST_PATH_IMAGE004
表示地球赤道半径,
Figure 195214DEST_PATH_IMAGE005
Figure 264802DEST_PATH_IMAGE006
分别表示两个公交站台的纬度,
Figure 196986DEST_PATH_IMAGE007
Figure 275800DEST_PATH_IMAGE008
分别表示两个公交站台的经度;
S12、设定一个DBSCAN算法的半径参数和邻域密度阈值并进行聚类,然后将DBSCAN算法聚类后的簇的总数作为K-means算法中的K进行聚类,并确定K-means算法中公交站台POI数据聚类的簇中心点;
S13、根据K-means算法中公交站台POI数据聚类的簇中心点和城市POI数据构建对应的城市Voronoi图。
优选地,所述步骤S12中的半径参数为500米,邻域密度阈值为5。
优选地,所述步骤S2的具体实现方式为:首先以公交站台的每个簇中心点为中心并设定一个半径值,然后收集每个簇中心点周围的城市POI数据并构建文档,分析各个簇中心点周围出现的POI数量和种类,最后利用权重概率算法并基于城市Voronoi图确定该城市的功能区域,其中权重概率算法用公式表示为:
Figure 242619DEST_PATH_IMAGE009
(2)
Figure 466796DEST_PATH_IMAGE010
(3)
式(2)和式(3)中,
Figure 151855DEST_PATH_IMAGE011
表示城市POI数据中属性的序号,
Figure 503202DEST_PATH_IMAGE012
表示城市POI数据中第
Figure 324527DEST_PATH_IMAGE011
个属性的概率;
Figure 486650DEST_PATH_IMAGE013
表示城市POI数据中第
Figure 393426DEST_PATH_IMAGE011
个属性在该簇中心点周围出现的数量;
Figure 814043DEST_PATH_IMAGE014
表示在该簇中心点周围所有的城市POI数据出现的数量;
Figure 489875DEST_PATH_IMAGE015
表示城市POI数据中第
Figure 72166DEST_PATH_IMAGE011
个属性的权重,
Figure 715506DEST_PATH_IMAGE016
表示该城市中所有POI数据的数量,
Figure 408655DEST_PATH_IMAGE017
表示城市POI数据中第
Figure 470152DEST_PATH_IMAGE011
个属性的全部数量。
优选地,所述步骤S3中的人群出行数据包括出租车数据、公交卡数据和公交车数据中的至少一种。
优选地,所述步骤S3中不同时间段的人群出行数据需要删除重复和异常的数据之后再分别进行聚类。
优选地,所述步骤S3中的不同时间段为每天均等的十二个时间段。
优选地,每一条所述出租车数据和公交车数据的信息包含车辆ID、设备号、方向角、经度、维度和处理时间,每一条公交卡数据的信息包含公交卡编号、刷卡日期和刷卡机ID。
与现有技术相比,本发明首先利用城市POI数据构建城市的Voronoi图以对城市的功能区域进行划分,然后通过获取不同时间段的城市人群出行数据并分别展示到所构建的城市Voronoi图上,从而根据所划分的城市功能区域识别出不同时间段该城市的人群出行分布规律,为智慧城市的建设提供了依据。
附图说明
图1是本发明一种基于多源数据驱动的城市人群出行识别方法的步骤流程图,
图2是本发明中构建城市Voronoi图的方法流程图。
具体实施方式
为了使本技术领域的人员更好地理解本发明的技术方案,下面结合附图对本发明作进一步的详细说明。
需要说明的是,本实施例中,所述Voronoi图,又叫泰森多边形或Dirichlet图,它是由一组由连接两邻点直线的垂直平分线组成的连续多边形组成。
如图1所示,一种基于多源数据驱动的城市人群出行识别方法,所述方法包括以下步骤:
S1、爬取城市POI数据并对所爬取POI数据中的公交站点POI数据进行聚类,然后确定公交站点POI数据聚类的簇中心点并根据所确定的公交站点POI数据聚类的簇中心点构建对应的城市Voronoi图;
S2、基于所述步骤S1中城市POI数据、公交站点POI数据聚类的簇中心点和城市Voronoi图对该城市的功能区域进行划分;
S3、获取所述城市不同时间段的人群出行数据并分别进行聚类,同时确定所述城市不同时间段的人群出行聚类的簇中心点;
S4、将步骤S3中确定的城市不同时间段的人群出行聚类的簇中心点分别展示到所述城市Voronoi图上,从而根据该城市的功能区域划分识别出所述城市不同时间段的人群出行分布规律。
本实施例中,首先通过现有嵌入的APP软件(APP软件包括电子地图,如高德地图或百度地图)爬取城市的全部POI数据(城市POI数据是指电子地图上的景点、政府机构、公司、商场、饭馆等),然后对所爬取的POI数据进行清洗,再选取清洗后的城市POI数据中公交站台的POI数据并进行聚类,同时确定公交站台聚类的簇中心点,由于公交站点主要分布在城市道路上,并没有直接覆盖城市建筑用地,因此无法使用公交站点的分布表示城市功能区,因此根据公交站台聚类的簇中心点和城市的全部POI数据构建出城市的Voronoi图并基于该城市的Voronoi图对城市的功能区域进行划分;而在一定程度上,人群出行数据能够反映出该城市各个功能区的人群分布状,通过获取不同时间段的城市人群出行数据进行聚类并确定该聚类的簇中心点,将不同时间段的城市人群出行数据及其聚类的簇中心点分别展示到所构建的城市Voronoi图上,进而根据城市Voronoi图上所划分的各个功能区域可识别出不同时间段该城市的人群出行分布规律,从而为智慧城市的建设提供了依据。
其中,所述城市POI数据按照该城市的功能区域进行分类,其包括餐饮服务、旅游景点、公共服务、公司企业、购物服务、科学,教育和文化服务、商务住宿、生活服务、体育娱乐,以及政府机构和社会团体十类功能性类别。
其中,每一条所述城市POI数据中均包括经度、纬度、POI名称、地址、省份名称、城市名称、经营区域、big_type、meddle_type、small_type和所属辖区十一个属性。
本实施例中,为了更准确的划分城市的功能区,所爬取的城市的全部POI数据设定为十类功能性类别,其包括餐饮服务、旅游景点、公共服务、公司企业、购物服务、科学,教育和文化服务、商务住宿、生活服务、体育娱乐,以及政府机构和社会团体,同时根据功能性类别建立“POI类别-功能性”查找表,而每一条POI数据包含十一个属性,分别为经度、纬度、POI名称、地址、省份名称、城市名称、经营区域、big_type、meddle_type、small_type和所属辖区,其中,big_type属性是一些描述性词语,包括餐饮服务、风景名胜、公司企业、休闲娱乐等;meddle_type属性较big_type属性更具体一点,如餐饮服务中包括中餐厅、外国餐厅、咖啡厅、快餐厅等;small_type属性是三者之间最具体的,如快餐厅包括肯德基、麦当劳、必胜客等。
如图2所示,所述步骤S1的具体实现方式包括:
S11、利用现有APP软件爬取城市的全部POI数据并对所爬取的全部POI数据进行清洗,然后选取该城市的公交站台POI数据并计算公交站台之间的实际距离,其计算公式表示为:
Figure 223344DEST_PATH_IMAGE018
(1)
式(1)中,
Figure 589866DEST_PATH_IMAGE019
表示半正矢函数,
Figure 86706DEST_PATH_IMAGE020
表示两个公交站台之间的距离,
Figure 2710DEST_PATH_IMAGE021
表示地球赤道半径,
Figure 926803DEST_PATH_IMAGE022
Figure 295468DEST_PATH_IMAGE023
Figure 845267DEST_PATH_IMAGE024
分别表示两个公交站台的纬度,
Figure 350197DEST_PATH_IMAGE025
Figure 445192DEST_PATH_IMAGE026
分别表示两个公交站台的经度;
S12、设定一个DBSCAN算法的半径参数和邻域密度阈值并进行聚类,然后将DBSCAN算法聚类后的簇的总数作为K-means算法中的K进行聚类并确定K-means算法中公交站台POI数据聚类的簇中心点;
S13、根据K-means算法中公交站台POI数据聚类的簇中心点和城市POI数据构建对应的城市Voronoi图。
本实施例中,所述DBSCAN算法(Density-Based Spatial Clustering ofApplications with Noise,是一个比较有代表性的基于密度的聚类算法)中的半径参数(即Eps邻域)设为500米,邻域密度阈值(即minPts)设为5。首先利用现有的嵌入式APP软件爬取城市的全部POI数据并进行清洗,然后利用全部POI数据中的公交站台POI数据并通过DBSCAN算法先确定其分类个数,再使用K-means算法(k-means clustering algorithm,k均值聚类算法)确定该聚类的簇中心点,最后基于该聚类的簇中心点构建该城市的Voronoi图,最后结合该聚类的簇中心点、城市POI数据和城市的Voronoi图实现对该城市的功能区域划分。值得一提的是,由于所爬取的POI数据时基于地理位置坐标来表示的,故不能使用计算欧氏距离进行密度的计算,本实施例中采用半正矢函数计算公交站台之间的实际距离。
其中,所述步骤S2的具体实现方式为:首先以公交站台的每个簇中心点为中心并设定一个半径值,然后收集每个簇中心点周围的城市POI数据并构建文档,分析各个簇中心点周围出现的POI数量和种类,最后利用权重概率算法并基于城市Voronoi图确定该城市的功能区域,其中权重概率算法用公式表示为:
Figure 35574DEST_PATH_IMAGE027
(2)
Figure 139796DEST_PATH_IMAGE028
(3)
式(2)和式(3)中,
Figure 515545DEST_PATH_IMAGE029
表示城市POI数据中属性的序号,
Figure 515862DEST_PATH_IMAGE030
表示城市POI数据中第
Figure 593539DEST_PATH_IMAGE029
个属性的概率;
Figure 219562DEST_PATH_IMAGE031
表示城市POI数据中第
Figure 964664DEST_PATH_IMAGE029
个属性在该簇中心点周围出现的数量;
Figure 401461DEST_PATH_IMAGE032
表示在该簇中心点周围所有的城市POI数据出现的数量;
Figure 232014DEST_PATH_IMAGE033
表示城市POI数据中第
Figure 412460DEST_PATH_IMAGE029
个属性的权重,
Figure 762801DEST_PATH_IMAGE034
表示该城市中所有POI数据的数量,
Figure 370499DEST_PATH_IMAGE035
表示城市POI数据中第
Figure 157190DEST_PATH_IMAGE029
个属性的全部数量。
本实施例中,以公交站台的每个簇中心点为中心设定其半径值为500米,若500米内没有任何POI数据时,则将范围扩大至1000米,然后收集每个簇中心点周围的城市POI数据并构建文档,分析各个簇中心点周围出现的城市POI数据的数量和种类。在某一些特殊场合中,其对应的所爬取的POI数据的数量可能极少(如景区和小区等),但是其周围有许多其它的POI类别(如餐馆等),由于数量的严重不均衡,依据同种POI数量的多少来确定城市功能区的性质,可能会导致判断出现误差,因此利用权重概率算法可有效提高城市功能区域划分的准确性。在其他实施例中,半径值的扩大范围也可以是其它数值。
其中,所述步骤S3中的人群出行数据包括出租车数据、公交卡数据和公交车数据中的至少一种,并将人群出行数据的不同时间段设为每天均等的十二个时间段,同时所获取的不同时间段的人群出行数据需要删除重复和异常的数据之后再分别进行聚类。
其中,每一条所述出租车数据和公交车数据的信息包含车辆ID、设备号、方向角、GPS响应时间、经度、维度和处理时间,每一条公交卡数据的信息包含公交卡编号、刷卡日期和刷卡机ID。
本实施例中,由于出租车数据、公交卡数据和公交车数据在一定程度上均能反映出该城市各个功能区域的人群出行分布情况,通过对出租车数据、公交卡数据和公交车数据中的至少一种进行获取和分析即可实现对该城市的人群出行分布规律进行识别,进而为智慧城市的建设提供依据。同时在分析过程中,由于工作日和周末以及每一天的不同时间段均存在相应差距,因此,通过获取工作日和周末的不同时间段的人群出行数据进而进行分析,极大程度上保证了最终识别出来的城市人群出行分布规律的准确性。在其他实施例中,所述出租车数据、公交车数据和公交卡数据的信息并不局限于上述所述的信息,还可以包括其它相关的信息,如GPS响应时间、速度和状态等。
以上对本发明所提供的一种基于多源数据驱动的城市人群出行识别方法进行了详细介绍。本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也落入本发明权利要求的保护范围内。

Claims (9)

1.一种基于多源数据驱动的城市人群出行识别方法,其特征在于,所述方法包括以下步骤:
S1、爬取城市POI数据并对所爬取的城市POI数据中的公交站点POI数据进行聚类,然后确定公交站点POI数据聚类的簇中心点,并根据所确定的公交站点POI数据聚类的簇中心点构建对应的城市Voronoi图;
S2、基于所述步骤S1中城市POI数据、公交站点POI数据聚类的簇中心点和城市Voronoi图对该城市的功能区域进行划分,具体实现方式为:首先以公交站台的每个簇中心点为中心并设定一个半径值,然后收集每个簇中心点周围的城市POI数据并构建文档,分析各个簇中心点周围出现的POI数量和种类,最后利用权重概率算法并基于城市Voronoi图确定该城市的功能区域,其中权重概率算法用公式表示为:
Figure DEST_PATH_IMAGE001
(2)
Figure 365625DEST_PATH_IMAGE002
(3)
式(2)和式(3)中,
Figure DEST_PATH_IMAGE003
表示城市POI数据中属性的序号,
Figure 733153DEST_PATH_IMAGE004
表示城市POI数据中第
Figure 974778DEST_PATH_IMAGE003
个属性的概率;
Figure DEST_PATH_IMAGE005
表示城市POI数据中第
Figure 436852DEST_PATH_IMAGE003
个属性在该簇中心点周围出现的数量;
Figure 80323DEST_PATH_IMAGE006
表示在该簇中心点周围所有的城市POI数据出现的数量;
Figure DEST_PATH_IMAGE007
表示城市POI数据中第
Figure 353173DEST_PATH_IMAGE003
个属性的权重,
Figure 82094DEST_PATH_IMAGE008
表示该城市中所有POI数据的数量,
Figure DEST_PATH_IMAGE009
表示城市POI数据中第
Figure 347860DEST_PATH_IMAGE003
个属性的全部数量;
S3、获取所述城市不同时间段的人群出行数据并分别进行聚类,同时确定所述城市不同时间段的人群出行聚类的簇中心点;
S4、将步骤S3中确定的城市不同时间段的人群出行聚类的簇中心点分别展示到所述城市Voronoi图上,从而根据该城市的功能区域划分识别出所述城市不同时间段的人群出行分布规律。
2.如权利要求1所述的基于多源数据驱动的城市人群出行识别方法,其特征在于,所述城市POI数据按照该城市的功能区域进行分类,其包括餐饮服务、旅游景点、公共服务、公司企业、购物服务、科学,教育和文化服务、商务住宿、生活服务、体育娱乐,以及政府机构和社会团体十类功能性类别。
3.如权利要求1或2所述的基于多源数据驱动的城市人群出行识别方法,其特征在于,每一条所述城市POI数据中均包括经度、纬度、POI名称、地址、省份名称、城市名称、经营区域、big_type、meddle_type、small_type和所属辖区十一个属性。
4.如权利要求3所述的基于多源数据驱动的城市人群出行识别方法,其特征在于,所述步骤S1的具体实现方式包括:
S11、利用现有APP软件爬取城市的全部POI数据并对所爬取的全部POI数据进行清洗,然后选取该城市的公交站台POI数据并计算公交站台之间的实际距离,其计算公式表示为:
Figure 845837DEST_PATH_IMAGE010
(1)
式(1)中,
Figure DEST_PATH_IMAGE011
表示半正矢函数,
Figure 555167DEST_PATH_IMAGE012
表示两个公交站台之间的距离,
Figure DEST_PATH_IMAGE013
表示地球赤道半径,
Figure 505806DEST_PATH_IMAGE014
Figure DEST_PATH_IMAGE015
分别表示两个公交站台的纬度,
Figure 575262DEST_PATH_IMAGE016
Figure DEST_PATH_IMAGE017
分别表示两个公交站台的经度;
S12、设定一个DBSCAN算法的半径参数和邻域密度阈值并进行聚类,然后将DBSCAN算法聚类后的簇的总数作为K-means算法中的K进行聚类,并确定K-means算法中公交站台POI数据聚类的簇中心点;
S13、根据K-means算法中公交站台POI数据聚类的簇中心点和城市POI数据构建对应的城市Voronoi图。
5.如权利要求4所述的基于多源数据驱动的城市人群出行识别方法,其特征在于,所述步骤S12中的半径参数为500米,邻域密度阈值为5。
6.如权利要求1所述的基于多源数据驱动的城市人群出行识别方法,其特征在于,所述步骤S3中的人群出行数据包括出租车数据、公交卡数据和公交车数据中的至少一种。
7.如权利要求6所述的基于多源数据驱动的城市人群出行识别方法,其特征在于,所述步骤S3中不同时间段的人群出行数据需要删除重复和异常的数据之后再分别进行聚类。
8.如权利要求7所述的基于多源数据驱动的城市人群出行识别方法,其特征在于,所述步骤S3中的不同时间段为每天均等的十二个时间段。
9.如权利要求8所述的基于多源数据驱动的城市人群出行识别方法,其特征在于,每一条所述出租车数据和公交车数据的信息包含车辆ID、设备号、方向角、经度、维度和处理时间,每一条公交卡数据的信息包含公交卡编号、刷卡日期和刷卡机ID。
CN202011573263.3A 2020-12-28 2020-12-28 一种基于多源数据驱动的城市人群出行识别方法 Active CN112288048B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011573263.3A CN112288048B (zh) 2020-12-28 2020-12-28 一种基于多源数据驱动的城市人群出行识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011573263.3A CN112288048B (zh) 2020-12-28 2020-12-28 一种基于多源数据驱动的城市人群出行识别方法

Publications (2)

Publication Number Publication Date
CN112288048A CN112288048A (zh) 2021-01-29
CN112288048B true CN112288048B (zh) 2021-03-26

Family

ID=74426476

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011573263.3A Active CN112288048B (zh) 2020-12-28 2020-12-28 一种基于多源数据驱动的城市人群出行识别方法

Country Status (1)

Country Link
CN (1) CN112288048B (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112800210B (zh) * 2021-04-06 2021-06-18 湖南师范大学 基于海量公交数据的人群画像算法
CN113312469B (zh) * 2021-04-29 2022-11-04 东南大学 一种基于lda主题模型的居民出行规律分析方法
CN113806419B (zh) * 2021-08-26 2024-04-12 西北大学 基于时空大数据的城市区域功能识别模型及识别方法
CN114495484B (zh) * 2021-12-17 2023-10-27 北京航空航天大学杭州创新研究院 基于多源数据层次图聚类算法的公交站点位置推荐方法
CN114661393B (zh) * 2022-03-01 2024-03-22 重庆邮电大学 基于流动人口数据特征聚类的城市集聚效应可视分析方法
CN114722276A (zh) * 2022-03-29 2022-07-08 河南图真智能科技有限公司 一种用于智慧城市服务的数据管理及分析方法
CN115100394B (zh) * 2022-06-24 2023-11-03 南京大学 基于兴趣点Voronoi图的城市街区功能识别方法
CN115423047B (zh) * 2022-11-03 2023-03-24 京华信息科技股份有限公司 一种综合区域群体特征识别方法及系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111507879A (zh) * 2020-04-15 2020-08-07 北京交通大学 一种城市空间结构识别方法
CN111931998A (zh) * 2020-07-27 2020-11-13 大连海事大学 一种基于移动定位数据的个体出行模式预测方法及系统

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10547971B2 (en) * 2015-11-04 2020-01-28 xAd, Inc. Systems and methods for creating and using geo-blocks for location-based information service
CN109101559B (zh) * 2018-07-12 2022-02-11 青岛理工大学 一种基于poi和公交刷卡数据的城市功能区识别方法
EP3637303B1 (en) * 2018-10-09 2024-02-14 Naver Corporation Methods for generating a base of training images, for training a cnn and for detecting a poi change in a pair of inputted poi images using said cnn
US11700356B2 (en) * 2018-10-26 2023-07-11 AutoBrains Technologies Ltd. Control transfer of a vehicle
CN111046937A (zh) * 2019-12-05 2020-04-21 南京智慧交通信息有限公司 一种融合公交数据和poi数据的两段式乘客人群出行目的分析方法
CN111612206B (zh) * 2020-03-30 2022-09-02 清华大学 一种基于时空图卷积神经网络的街区人流预测方法及系统

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111507879A (zh) * 2020-04-15 2020-08-07 北京交通大学 一种城市空间结构识别方法
CN111931998A (zh) * 2020-07-27 2020-11-13 大连海事大学 一种基于移动定位数据的个体出行模式预测方法及系统

Also Published As

Publication number Publication date
CN112288048A (zh) 2021-01-29

Similar Documents

Publication Publication Date Title
CN112288048B (zh) 一种基于多源数据驱动的城市人群出行识别方法
Xing et al. Exploring travel patterns and trip purposes of dockless bike-sharing by analyzing massive bike-sharing data in Shanghai, China
Liu et al. Characterizing mixed-use buildings based on multi-source big data
Yin et al. Depicting urban boundaries from a mobility network of spatial interactions: A case study of Great Britain with geo-located Twitter data
Li et al. Exploring urban taxi ridership and local associated factors using GPS data and geographically weighted regression
Wang et al. Identification and analysis of urban functional area in Hangzhou based on OSM and POI data
Yang et al. Scalable space-time trajectory cube for path-finding: A study using big taxi trajectory data
Hong et al. Hierarchical community detection and functional area identification with OSM roads and complex graph theory
CN106503714B (zh) 一种基于兴趣点数据识别城市功能区的方法
US20090088967A1 (en) Systems, techniques, and methods for providing location assessments
Cai et al. Design and application of an attractiveness index for urban hotspots based on GPS trajectory data
Kong et al. RMGen: A tri-layer vehicular trajectory data generation model exploring urban region division and mobility pattern
Zhang et al. Green travel mobility of dockless bike-sharing based on trip data in big cities: A spatial network analysis
Hu et al. Exploring urban taxi drivers’ activity distribution based on GPS data
Yuan et al. Recognition of functional areas based on call detail records and point of interest data
Zhang et al. Detecting taxi travel patterns using GPS trajectory data: A case study of Beijing
CN111563666B (zh) 一种基于网络热度的城市公共服务设施空间配置评价方法
Wang et al. X-index: A novel flow-based locational measure for quantifying centrality
Ma et al. The analysis of spatio-temporal characteristics and determinants of dockless bike-sharing and metro integration
Tu et al. Uncovering online sharing vehicle mobility patterns from massive GPS trajectories
Cui et al. Research on the driving forces of urban hot spots based on exploratory analysis and binary logistic regression model
Chen et al. Detecting urban commercial patterns using a latent semantic information model: A case study of spatial-temporal evolution in Guangzhou, China
Zhou et al. Commuting versus consumption: The role of core city in a metropolitan area
Liang et al. Spatial pattern and influencing factors of tourism based on POI data in Chengdu, China
Xie et al. Uncovering urban mobility and city dynamics from large-scale taxi origin-destination (OD) trips: Case study in Washington DC Area

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant