CN114141008A - 一种基于手机信令数据的新型共享公共交通服务区域选取方法 - Google Patents

一种基于手机信令数据的新型共享公共交通服务区域选取方法 Download PDF

Info

Publication number
CN114141008A
CN114141008A CN202111269287.4A CN202111269287A CN114141008A CN 114141008 A CN114141008 A CN 114141008A CN 202111269287 A CN202111269287 A CN 202111269287A CN 114141008 A CN114141008 A CN 114141008A
Authority
CN
China
Prior art keywords
traffic
base station
point
time
signaling data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202111269287.4A
Other languages
English (en)
Other versions
CN114141008B (zh
Inventor
陆振波
何静
王宇璐
周臣
张改
刘娟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Southeast University
Original Assignee
Southeast University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Southeast University filed Critical Southeast University
Priority to CN202111269287.4A priority Critical patent/CN114141008B/zh
Publication of CN114141008A publication Critical patent/CN114141008A/zh
Application granted granted Critical
Publication of CN114141008B publication Critical patent/CN114141008B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • G08G1/0104Measuring and analyzing of parameters relative to traffic conditions
    • G08G1/0137Measuring and analyzing of parameters relative to traffic conditions for specific applications
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/906Clustering; Classification
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • G08G1/0104Measuring and analyzing of parameters relative to traffic conditions
    • G08G1/0108Measuring and analyzing of parameters relative to traffic conditions based on the source of data
    • G08G1/012Measuring and analyzing of parameters relative to traffic conditions based on the source of data from other sources than vehicle or roadside beacons, e.g. mobile networks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/02Services making use of location information
    • H04W4/021Services related to particular areas, e.g. point of interest [POI] services, venue services or geofences
    • H04W4/022Services related to particular areas, e.g. point of interest [POI] services, venue services or geofences with dynamic range variability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/02Services making use of location information
    • H04W4/023Services making use of location information using mutual or relative location information between multiple location based services [LBS] targets or of distance thresholds
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/02Services making use of location information
    • H04W4/029Location-based management or tracking services
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/20Services signaling; Auxiliary data signalling, i.e. transmitting data via a non-traffic channel
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

本发明公开了一种基于手机信令数据的新型共享公共交通服务区域选取方法,具体包括:1)基于通信运营商处获取的手机用户信令数据特征,运用数据挖掘算法获取居民完整出行特征数据;2)通过提取连续多个工作日的手机用户信息,对其在特定时段周期性出现的基站进行职住地判别和通勤行为识别;3)通过计算工作日不同时段基站活跃度,结合基站富含的地理位置信息和交通信息,利用改进的DBSCAN方法对基站进行标定和分类,划分交通小区;4)根据各交通小区人口密度,交通小区OD对间出行量、质心距离、现有公交线网供给情况、道路条件,利用定性定量综合分析的方式选取新型共享公共交通服务区域。

Description

一种基于手机信令数据的新型共享公共交通服务区域选取 方法
技术领域
本发明属于通信技术领域及公共交通领域,具体涉及一种基于手机信令数据的新型共享公共交通服务区域选取方法。
背景技术
手机通讯技术与互联网技术的发展与普及应用,促使手机信令数据成为城市交通数据的主要来源之一。其具有可获取性强、样本量大、可靠度高、可连续观测等特点,由此吸引了大量学者的关注。
传统的新型共享公共交通需求获取方式主要是通过居民出行调查获取,包括家访调查、电话调查等方式,这一过程需要消耗大量的人力、物力、精力完成调查并进行数据整合与处理工作。近年来通信设备设施不断更新,自动获取居民出行信息的手段也不断丰富,如通过公交IC卡数据、浮动车GPS数据、地铁票务数据等进行出行信息挖掘,但这些数据样本量仍然较低,无法适用于普遍广泛的人群出行分析。而移动通信技术的发展,通信基站定位精度的提高,给研究大规模人群出行需求提供了新的契机。
现阶段国内外普遍依据天然屏障、行政区、用地性质等客观特性为原则划分交通小区,如何基于手机基站服务特性针对研究问题尽可能有效地划分交通小区是选取新型共享公共交通服务区域时面临的一个重要问题。当前利用手机信令数据进行的交通研究,通常都是根据手机基站覆盖区域,遵循传统交通小区划分原则进行划分交通小区。传统交通小区划分原则在多数研究中有较高的普适性,但是在特定科学问题的研究中针对性不强。
现有的新型公共交通服务区域选取方法主要通过从用户上传数据中挖掘出行需求点,再对需求点进行合并形成出行需求区域,即为新型公共交通服务区域。由于新型公共交通主要是为了适应居民个性化、多元化出行需求,因此以响应出行需求为目的对服务区域进行规划与选取无可厚非。而城市发展带来的个性化交通出行需求持续增加,需求响应式新型公共交通系统设计无益于城市公共交通系统整体水平的提升,甚至可能导致城市交通压力进一步增大,服务质量也将受到影响。
发明内容
发明目的:为解决背景技术中存在的问题,本发明利用低成本手机通信数据,提出了一种定性与定量相结合的新型共享公共交通服务区域选取方法。
技术方案:本发明为解决上述技术问题采用以下技术方案:一种基于手机信令数据的新型公共交通服务区域选取方法,包括以下步骤:
S1、获取手机用户信令数据并进行数据预处理,基于手机用户信令数据识别停驻点,判断停驻点构成的出行段是否属于一次出行,形成用户出行链;
S2、基于手机信令数据分别对用户居住地和工作地进行判别,根据用户出行链中的起点/端点位置信息,判断用户的出行是否为通勤出行;
S3、根据手机基站的空间位置属性、活跃度属性对基站进行标定和分类,基于基站服务范围和交通小区划分原则,将研究区域划分成若干个交通小区;
S4、结合新型公共交通系统的特性设计服务区域筛选指标,筛选出满足指标要求的交通小区OD对,筛除公交无法通行的交通小区,并最终确定服务区域。
作为优选,步骤S1基于手机用户信令数据的出行停驻点识别,包括以下步骤:
S11、设用户K某天的信令数据集合为PK={p1,p2,...pk...,pn},其中pk表示用户K的第k条信令数据,每条数据包含字段:用户编码MSID、位置区编码LAC、小区编码CellID、基站编码stationID、到达时刻begin_time、离去时刻end_time,通信时间duration,且该用户当天共产生n条信令数据;
S12、从第一条数据k=1开始,当pk-duration>T1时,标记该基站点为停驻点;当pk-duration<T2时,标记该基站点为位移点;当T2≤pk-duration≤T1时,标记该基站点为可疑点;其中,T1,T2分别为停驻点阈值和位移点阈值;
S13、当第k个基站点与第k+1个基站点均被标记为停驻点时,计算两个基站的距离D,若D≤Dth,则将这两个基站点合并为一个停驻点,合并这两个基站点数据为一条数据,并标记为停驻点;其中Dth为空间阈值;
S14、对于每个可疑点,计算其与上一个识别为停驻点的基站的空间距离,当该距离大于空间阈值Dth时,该可疑点被确定为停驻点;
S15、循环步骤S12~S14,直到所有基站点均完成标记;
S16、若连续两个停驻点间的距离大于空间阈值Dth,则这两个停驻点之间构成一个出行段;计算每个出行段的出行时间及出行距离,当出行时间或出行距离小于一定值,则判定不属于一次出行,删除此出行段。
作为优选,步骤S2基于手机信令数据的通勤出行判别,包括以下步骤:
S21、首先提取在研究日期范围内出现天数大于1的用户编码MSID每天[t1,t2]时段的信令数据,按字段排序,选取前一日最后一条信令数据、[t1,t2]、t1时间前一条信令数据及t2时间后一条信令数据,设该集合为NI={ni0,ni1,ni2,...nij...,nim},其中nij表示日期i下第j条信令数据,共m条信令数据,ni0为日期i的前一日最后一条信令数据;
S22、若ni1-begin_time>t1,且ni0存在,判断ni0-stationID与ni1-stationID之间的距离D,若D≤Dth1,则二者在同一位置,同时计算[t1,t2]在n(i-1)m-stationID上的逗留时间;若ni0不存在或D>Dth1,则二者不在同一位置,该MSID在[t1,ni1-begin_time]间数据缺失;
S23、统计在该时间段每个基站逗留的总时间ΔT1,以及基站出现的天数X1,若ΔT1>2X1,则标记该基站为用户的居住地所处基站;
S24、根据步骤S21~S23记载的方法,选取工作日的工作时段,统计用户在基站j上的总逗留时间,当出现天数大于1天且日均逗留时长大于一定值,判别基站j为用户的工作地;
S25、在对用户居住地和工作地判别后,根据用户出行链中的起点/端点位置信息,判断用户的出行是否为通勤出行。
作为优选,步骤S3基于手机基站多维特性对基站进行标定和分类,并将研究区域划分成若干个交通小区,包括以下步骤:
S31、计算工作日不同时段基站活跃度以及基站经纬度对应地理位置的语义信息和停驻点基站的交通语义信息,初步对基站进行标定;
S32、根据基站的空间位置信息,利用基于密度的DBSCAN聚类算法将位置间隔一定范围内、属性相同的基站分为一类,同时不断更新聚类中心点,直到所有的基站被划分到不同的聚类簇,且聚类效果的评价指标达到收敛;
S33、将聚类簇集合映射到空间区域,利用泰森多边形法划分聚类簇基站服务范围,同时考虑交通小区划分原则,将天然屏障作为分区界限,优化交通小区边界,将研究区域划分为若干个交通小区。
进一步的,步骤S31初步标定方法如下:
计算某工作日各基站每td分钟内连接的用户数量,筛选各基站一天中连接用户最多的时间区间并对连接用户数量进行排序,将排在前p1%的基站初步标定为活跃基站;
再根据各基站连接的各用户的停留时长,统计用户数量最多的停留时长,若该停留时长大于一定值,则将该基站补充标定为活跃基站,其余基站标记为不活跃基站。
进一步的,步骤S32利用DBSCAN聚类算法划分基站流程如下:
①遍历基站样本数据集,预设邻域半径ε以及最小核心对象数MinPts,将所有基站标记为未访问点;
②从未访问点集中任意选择一个点p,将其标记为已访问点,如果点p的ε邻域内至少有MinPts个对象,则创建一个新簇C,并将点p添加到簇C中,否则将点p标记为噪音点;
③令N为点p的ε邻域中对象集合,遍历集合N,将其中未访问的点p*标记为已访问点,如果点p*的ε邻域内至少有MinPts个对象,则将这些对象添加至集合N,此时如果点p*不属于任何簇集合,则将p*添加至C中;
④重复步骤②-③至没有未访问点;
⑤计算出各聚类簇的质心位置坐标;
⑥分别遍历各聚类簇,计算簇内各点到其质心的空间距离,将簇内最大空间距离大于一定值的聚类簇记为待修改聚类簇;
⑦将各基站的交通发生量与交通吸引量作为基站属性添加至样本数据集,重新设置邻域半径ε及最小核心对象数MinPts的取值,并将待修改聚类簇的所有样本点标记为未访问点;
⑧分别对所有待修改聚类簇重复步骤②-⑦,至无待修改聚类簇,然后将各聚类簇的质心坐标作为聚类簇中心。
作为优选,步骤S4结合新型公共交通系统的特性设计服务区域筛选指标并最终确定服务区域,包括以下步骤:
S41、统计基站上连接的居住人口数和工作人口数,并将其映射到所属的交通小区内,计算交通小区居住人口密度和工作人口密度,选取人口密度大于均值的交通小区为城市交通出行产生区域与出行吸引区域;
S42、提取出行产生区域与出行吸引区域间各交通小区间高峰时段出行量;
S43、将S41筛选出的交通小区间出行量由高到低进行排序,并且根据交通小区间出行量的集中分布情况,剔除出行量低于一定值的交通小区OD对;
S44、计算S43筛选出的交通小区OD对质心之间的距离,剔除距离小于一定值的交通小区OD对,筛选出满足距离要求的交通小区OD对;
S45、基于交通小区OD对间现有公交线网供给情况,筛选现有公交线路行距比大于均值且行时比大于一定值的交通小区OD对;
S46、根据筛选出的交通小区OD对之间的道路等级及道路条件,筛除公交无法通行的交通小区,最终确定新型共享公共交通服务区域。
进一步的,步骤S44中距离计算使用经纬度距离公式,如下:
Figure BDA0003328101930000041
其中,dij为交通小区i与交通小区j之间的空间距离;R为地球半径;lati为交通小区i质心的纬度坐标;loni为交通小区i质心的经度坐标。
进一步的,步骤S45中行距比与行时比计算方法如下:
将公交与步行出行距离比值定义为行距比,以及公交与小汽车出行时间比值定义为行时比;行距比与行时比的计算公式如下:
Figure BDA0003328101930000042
式中
Figure BDA0003328101930000051
为交通小区i→j的公交车与步行的行距比;
Figure BDA0003328101930000052
为交通小区i→j的公交车出行距离;
Figure BDA0003328101930000053
为交通小区i→j的步行出行距离;
Figure BDA0003328101930000054
式中
Figure BDA0003328101930000055
为交通小区i→j的公交车与小汽车的行时比;
Figure BDA0003328101930000056
为交通小区i→j的公交车出行时间;
Figure BDA0003328101930000057
为交通小区i→j的小汽车出行时间。
有益效果:本发明采用以上技术方案与现有技术相比,具有以下技术效果:
1、在数据源方面:本发明将手机信令数据作为数据源,通过对大样本、连续性的手机信令数据进行多角度、深层次的挖掘,尽可能全面地挖掘到全样本居民对新型共享公共交通系统的服务需求,较为准确地确定服务区域,从而为公共交通线路规划布设及政策引导提供有效支持,有利于提高城市公共交通系统整体服务水平。
2、在交通小区划分方面:本发明基于手机信令数据,同时考虑基站活跃度时空分布特性、基站地理位置语义信息、基站定位环境特性与基站自身属性,通过改进的DBSCAN密度聚类算法聚类手机基站覆盖区域,针对研究问题有效划分交通小区。
3、在新型共享公共交通服务区域选取方面:本发明利用交通大数据进行新型共享公交通需求主动辨识,极大地提高了新型共享公共交通系统的服务效用,为公共交通线路规划布设及政策引导提供有效支持;同时,定性与定量相结合的服务区域选取方法将促进新型共享公共交通系统、常规交通系统和轨道交通系统协同运作,提高城市公共交通系统整体水平,缓解城市交通压力。
附图说明
图1为本发明的整体流程图;
图2为实施例中昆山市城市用地性质图;
图3为实施例中昆山市手机基站空间分布情况;
图4为实施例中交通小区划分结果图;
图5为实施例中交通小区居住人口密度图;
图6为实施例中交通小区工作人口密度图;
图7为实施例中交通小区间出行量频数直方图;
图8为实施例中筛选后的交通小区间出行OD量分布图;
图9为实施例中交通小区OD对间行距比频数直方图;
图10为实施例中交通小区OD对间行时比频数直方图;
图11为实施例中最终确定的新型共享公共交通服务区域图。
具体实施方式
下面结合实施例对本发明作进一步说明。
本发明所述的基于手机信令数据的新型公共交通服务区域选取方法,整体流程如图1所示,具体包括以下步骤:
S1、获取手机用户信令数据并进行数据预处理,基于手机用户信令数据识别停驻点,判断停驻点构成的出行段是否属于一次出行,形成用户出行链。具体包括:
S11、设用户K某天的信令数据集合为PK={p1,p2,...pk...,pn},其中pk表示用户K的第k条信令数据,每条数据包含字段:用户编码MSID(Mobile Subscriber IdentityDocument)、位置区编码LAC(Location Area Code)、小区编码CellID、基站编码stationID、到达时刻begin_time、离去时刻end_time,通信时间duration,且该用户当天共产生n条信令数据。
数据预处理包括缺失数据剔除、乒乓数据剔除、漂移数据剔除;缺失数据剔除:删除缺少LAC和CellID的信令数据;乒乓数据剔除:识别基站切换顺序为A-B-A和A-B-C-A的信令数据组,若该数据组的通信时间duration之和小于120s,则合并该数据组为一条数据,保留首条数据的stationID、begin_time,保留末条数据的end_time,通信时间duration相加;漂移数据剔除:计算相邻两条数据pk与pk+1的基站的空间距离,除以数据pk+1的通信时间duration,获得相邻两条数据的切换速度Vk;若切换速度Vk大于150km/h,则删除数据pk+1,合并数据pk与pk+2为一条数据,合并方法同前。
S12、获取预处理后的数据,从第一条数据k=1开始,当pk-duration>T1时,标记该基站点为停驻点;当pk-duration<T2时,标记该基站点为位移点;
当T2≤pk-duration≤T1时,标记该基站点为可疑点;其中,T1,T2分别为停驻点阈值和位移点阈值;T1,T2取值分别为40min和10min。
S13、当第k个基站点与第k+1个基站点均被标记为停驻点时,计算两个基站的距离D,若D≤Dth,则将这两个基站点合并为一个停驻点,合并这两个基站点数据为一条数据,合并方法同前,并标记为停驻点;其中Dth为空间阈值,取值为500m。
S14、对于每个可疑点,计算其与上一个识别为停驻点的基站的空间距离,当该距离大于空间阈值Dth时,该可疑点被确定为停驻点;
S15、循环步骤S12~S14,直到所有基站点均完成标记;
S16、若连续两个停驻点间的距离大于空间阈值Dth,则这两个停驻点之间构成一个出行段;计算每个出行段的出行时间及出行距离,当出行时间或出行距离小于一定值(如:出行时间小于600秒),则判定不属于一次出行,删除此出行段。
S2、基于手机信令数据分别对用户居住地和工作地进行判别,根据用户出行链中的起点/端点位置信息,判断用户的出行是否为通勤出行;具体包括:
S21、首先提取在研究日期范围内出现天数大于1的用户编码MSID每天[t1,t2]时段的信令数据,按字段排序,选取前一日最后一条信令数据、[t1,t2]、t1时间前一条信令数据及t2时间后一条信令数据,设该集合为NI={ni0,ni1,ni2,...nij...,nim},其中nij表示日期i下第j条信令数据,共m条信令数据,ni0为日期i的前一日最后一条信令数据,每条数据包含字段同前;本实施例中,选取每天1:00~7:00的数据;即t1=1:00,t2=7:00;
S22、若ni1-begin_time>t1,且ni0存在,判断ni0-stationID与ni1-stationID之间的距离D,若D≤Dth,则二者在同一位置,同时计算[t1,t2]在n(i-1)m-stationID上的逗留时间;若ni0不存在或D>Dth,则二者不在同一位置,该MSID在[t1,ni1-begin_time]间数据缺失;
S23、统计在该时间段每个基站逗留的总时间ΔT1,以及基站出现的天数X1,若ΔT1>2X1,则标记该基站为用户的居住地所处基站;
S24、根据步骤S21~S23记载的方法,选取工作日典型的工作时段(比如:[9:00-11:30]、[14:00-16:30]),统计用户在基站j上的总逗留时间,当出现天数大于1天且日均逗留时长大于2小时,判别基站j为用户的工作地;
S25、在对用户居住地和工作地判别后,根据用户出行链中的起点/端点位置信息,判断用户的出行是否为通勤出行。
S3、根据手机基站的空间位置属性、活跃度属性对基站进行标定和分类,基于基站服务范围和交通小区划分原则,将研究区域划分成若干个交通小区。具体如下:
S31、计算工作日不同时段基站活跃度以及基站经纬度对应地理位置的语义信息和停驻点基站的交通语义信息,初步对基站进行标定;标定方法如下:
计算某工作日各基站每5min内连接的用户数量,筛选各基站一天中连接用户最多的时间区间并对连接用户数量进行排序,将排在前50%的基站初步标定为活跃基站;
再根据各基站连接的各用户的停留时长,统计用户数量最多的停留时长,若该停留时长大于60min,则将该基站补充标定为活跃基站,其余基站标记为不活跃基站。
S32、根据基站的空间位置信息,利用基于密度的DBSCAN聚类算法将位置间隔一定范围内、属性相同的基站分为一类,同时不断更新聚类中心点,直到所有的基站被划分到不同的聚类簇,且聚类效果的评价指标达到收敛;聚类算法流程如下:
①遍历基站样本数据集,预设邻域半径ε以及最小核心对象数MinPts,将所有基站标记为未访问点;
②从未访问点集中任意选择一个点p,将其标记为已访问点,如果点p的ε邻域内至少有MinPts个对象,则创建一个新簇C,并将点p添加到簇C中,否则将点p标记为噪音点;
③令N为点p的ε邻域中对象集合,遍历集合N,将其中未访问的点p*标记为已访问点,如果点p*的ε邻域内至少有MinPts个对象,则将这些对象添加至集合N,此时如果点p*不属于任何簇集合,则将p*添加至C中;
④重复步骤②-③至没有未访问点;
⑤计算出各聚类簇的质心位置坐标;
⑥分别遍历各聚类簇,计算簇内各点到其质心的空间距离,将簇内最大空间距离大于一定值的聚类簇记为待修改聚类簇;
⑦将各基站的交通发生量与交通吸引量作为基站属性添加至样本数据集,重新设置邻域半径ε及最小核心对象数MinPts的取值,并将待修改聚类簇的所有样本点标记为未访问点;
⑧分别对所有待修改聚类簇重复步骤②-⑦,至无待修改聚类簇,然后将各聚类簇的质心坐标作为聚类簇中心。
S33、将聚类簇集合映射到空间区域,(结合ArcGIS平台)利用泰森多边形法(Voronoi图)划分聚类簇基站服务范围,同时考虑交通小区划分原则,将天然屏障(铁路、河流、山林、道路等)作为分区界限,逐步优化交通小区边界,最终将研究区域划分为若干个交通小区。
S4、结合新型公共交通系统的特性设计服务区域筛选指标,本实施例中采用的指标包括:交通小区人口密度,交通小区OD对间出行量、质心距离、现有公交线网供给情况、道路条件;筛选出满足指标要求的交通小区OD对,筛除公交无法通行的交通小区,并最终确定服务区域;具体如下:
S41、识别研究区域内交通出行产生与出行吸引交通小区:统计基站上连接的居住人口数和工作人口数,并将其映射到所属的交通小区内,计算交通小区居住人口密度和工作人口密度,选取人口密度大于均值的交通小区为城市交通出行产生区域与出行吸引区域;
S42、提取出行产生区域与出行吸引区域间各交通小区间高峰时段出行量;一般选取早上7:00-9:00期间为高峰时段;
S43、将S41筛选出的交通小区间出行量由高到低进行排序,并且根据交通小区间出行量的集中分布情况,剔除出行量低于30人次的交通小区OD对(Origin andDestination);
S44、计算S43筛选出的交通小区OD对质心之间的距离,剔除距离小于一定值的交通小区OD对,筛选出满足距离要求的交通小区OD对;
距离计算使用经纬度距离公式,如下:
Figure BDA0003328101930000081
其中,dij为交通小区i与交通小区j之间的空间距离,单位为m;R为地球半径,单位为km;lati为交通小区i质心的纬度坐标;loni为交通小区i质心的经度坐标;
S45、基于交通小区OD对间现有公交线网供给情况,筛选现有公交线路行距比大于均值且行时比大于2(说明公交线路的直达性较差)的交通小区OD对;具体如下:
通过调用地图导航路径规划API,输入交通小区OD对质心的经纬度坐标,获取其公交车、小汽车以及步行三种不同出行方式的可能出行方案,包括出行距离、出行时间以及出行费用等信息,其中公交车出行方案还包括起点到公交车站与公交车站到终点的总步行距离以及相关换乘信息;
将公交与步行出行距离比值定义为行距比,以及公交与小汽车出行时间比值定义为行时比,来反映出公交线路的直达性;
行距比与行时比计算方法如下:
Figure BDA0003328101930000091
式中
Figure BDA0003328101930000092
为交通小区i→j的公交车与步行的行距比;
Figure BDA0003328101930000093
为交通小区i→j的公交车出行距离,单位为m;
Figure BDA0003328101930000094
为交通小区i→j的步行出行距离,单位为m;
Figure BDA0003328101930000095
式中
Figure BDA0003328101930000096
为交通小区i→j的公交车与小汽车的行时比;
Figure BDA0003328101930000097
为交通小区i→j的公交车出行时间,单位为s;
Figure BDA0003328101930000098
为交通小区i→j的小汽车出行时间,单位为s;
当公共交通出行时间超过小汽车出行时间两倍时,公众乘车体验感将急剧下降,因此选取行距比大于均值且行时比大于2的交通小区为现有公共交通供给薄弱区域,将相应的交通小区OD对视为有新型共享公共交通需求的区域;
S46、根据筛选出的交通小区OD对之间的道路等级及道路条件,筛除公交无法通行的交通小区,最终确定新型共享公共交通服务区域。
具体以江苏省昆山市手机用户信令数据为例,其中信令轨迹点状态识别如表1所示:
表1信令轨迹点状态识别
Figure BDA0003328101930000099
步骤S2基于提取的手机用户信令数据,识别各用户的居住地和工作地,判别其通勤出行行为,用于为后续服务区域选取过程提供人口密度数据。
在传统的交通小区划分基础上,步骤S31中综合考虑基站连接手机用户的时空特性、以及基站服务范围的地理语义信息和基站之间的交通语义信息,将研究区域划分为若干个交通小区。
首先,通过分别提取手机基站在不同时段内连接用户数量情况和统计用户在基站停留时长,来描述不同基站的活跃程度,具体字段如表2和表3所示。
表2手机基站各时段用户分布情况
Figure BDA0003328101930000101
表3手机基站用户停留时长统计
Figure BDA0003328101930000102
其次,由于城市的用地属性和功能在空间上存在差异性,因此不同基站覆盖范围内用地属性也不尽相同,代表着不同的地理语义特征。
根据城市居民日常活动规律可知,分布范围较为广泛的居住区,相应基站在工作日日间活跃程度较低,夜间活跃度较高。而包含大型商超、写字楼等工作场所的商业区则相反,相应基站在日间活跃度较高,夜间活跃度较低。
此外,由于工业用地大多占地面积广,且分布集中在郊区位置,根据基站布设分布情况,郊区基站覆盖密度较低,且郊区人员活动量较少,因此可以适当加大交通小区面积。而城区内人口密度较高,人流量活动较大,划分小区时需考虑实际出行量适当细化。昆山市城市用地性质图如图2所示。
随后,结合步骤S1中识别的停驻点和位移点结果,提取所有停驻点的基站信息,代表着城市居民出行的起讫点,初步对基站进行标定。提取的手机基站空间分布情况如图3所示。
在此基础上,步骤S32利用改进的基于密度的DBSCAN聚类算法对基站进行聚类;步骤S33借助ArcGIS平台将聚类簇集合映射到空间区域,划分聚类簇基站服务范围,最终将昆山市域划分为1034个交通小区,划分结果如图4所示。
基于提取的2019年5月22日昆山市手机用户信令数据,步骤S4运用新型公共交通服务区域筛选指标及方法,最终确定服务区域;具体如下:
首先,根据步骤S2各用户的居住地和工作地的判别结果,步骤S41统计各个交通小区内居住人口数及工作人口数,用各类人口数除以其单元面积,得到居住人口密度和工作人口密度,计算结果如图5和图6所示。选取人口密度大于均值的交通小区为城市交通出行产生和出行吸引区域,即新型共享公共交通需覆盖的城市核心功能区。
其次,将步骤S42提取的高峰时段交通小区间出行量由高到低进行排序,获得交通小区间出行量集中分布情况,如图7所示。
步骤S43剔除出行量过低的交通小区OD对(低于30人次),获得符合出行量指标的交通小区OD对,其分布及相应出行OD量分布如图8所示。
步骤S44中计算交通小区OD对质心距离,并根据步行和自行车出行的优势运距,剔除距离过近(dij<2km)的交通小区OD对,获得符合出行距离指标的交通小区OD对。
步骤S45中计算交通小区OD对间行时比与行距比,统计分布情况如图9与图10所示。其中,行距比平均值为1.35,行时比平均值为4。选取行距比大于1.35且行时比大于2的交通小区OD对为公共交通供给薄弱区域。
步骤S46根据筛选出的交通小区OD对之间的道路等级及道路条件,进一步筛选具备公交通行条件的交通小区,最终确定新型共享公共交通服务区域如图11所示。
以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明技术原理的前提下,还可以做出若干改进和变形,这些改进和变形也应视为本发明的保护范围。

Claims (9)

1.一种基于手机信令数据的新型公共交通服务区域选取方法,其特征在于,所述方法包括以下步骤:
S1、获取手机用户信令数据并进行数据预处理,基于手机用户信令数据识别停驻点,判断停驻点构成的出行段是否属于一次出行,形成用户出行链;
S2、基于手机信令数据分别对用户居住地和工作地进行判别,根据用户出行链中的起点/端点位置信息,判断用户的出行是否为通勤出行;
S3、根据手机基站的空间位置属性、活跃度属性对基站进行标定和分类,基于基站服务范围和交通小区划分原则,将研究区域划分成若干个交通小区;
S4、结合新型公共交通系统的特性设计服务区域筛选指标,筛选出满足指标要求的交通小区OD对,筛除公交无法通行的交通小区,并最终确定服务区域。
2.根据权利要求1所述的基于手机信令数据的新型公共交通服务区域选取方法,其特征在于,步骤S1基于手机用户信令数据的出行停驻点识别,包括以下步骤:
S11、设用户K某天的信令数据集合为PK={p1,p2,...pk...,pn},其中pk表示用户K的第k条信令数据,每条数据包含字段:用户编码MSID、位置区编码LAC、小区编码CellID、基站编码stationID、到达时刻begin_time、离去时刻end_time,通信时间duration,且该用户当天共产生n条信令数据;
S12、从第一条数据k=1开始,当pk-duration>T1时,标记该基站点为停驻点;当pk-duration<T2时,标记该基站点为位移点;当T2≤pk-duration≤T1时,标记该基站点为可疑点;其中,T1,T2分别为停驻点阈值和位移点阈值;
S13、当第k个基站点与第k+1个基站点均被标记为停驻点时,计算两个基站的距离D,若D≤Dth,则将这两个基站点合并为一个停驻点,合并这两个基站点数据为一条数据,并标记为停驻点;其中Dth为空间阈值;
S14、对于每个可疑点,计算其与上一个识别为停驻点的基站的空间距离,当该距离大于空间阈值Dth时,该可疑点被确定为停驻点;
S15、循环步骤S12~S14,直到所有基站点均完成标记;
S16、若连续两个停驻点间的距离大于空间阈值Dth,则这两个停驻点之间构成一个出行段;计算每个出行段的出行时间及出行距离,当出行时间或出行距离小于一定值,则判定不属于一次出行,删除此出行段。
3.根据权利要求2所述的基于手机信令数据的新型公共交通服务区域选取方法,其特征在于,步骤S2基于手机信令数据的通勤出行判别,包括以下步骤:
S21、首先提取在研究日期范围内出现天数大于1的用户编码MSID每天[t1,t2]时段的信令数据,按字段排序,选取前一日最后一条信令数据、[t1,t2]、t1时间前一条信令数据及t2时间后一条信令数据,设该集合为NI={ni0,ni1,ni2,...nij...,nim},其中nij表示日期i下第j条信令数据,共m条信令数据,ni0为日期i的前一日最后一条信令数据;
S22、若ni1-begin_time>t1,且ni0存在,判断ni0-stationID与ni1-stationID之间的距离D,若D≤Dth1,则二者在同一位置,同时计算[t1,t2]在n(i-1)m-stationID上的逗留时间;若ni0不存在或D>Dth1,则二者不在同一位置,该MSID在[t1,ni1-begin_time]间数据缺失;
S23、统计在该时间段每个基站逗留的总时间ΔT1,以及基站出现的天数X1,若ΔT1>2X1,则标记该基站为用户的居住地所处基站;
S24、根据步骤S21~S23记载的方法,选取工作日的工作时段,统计用户在基站j上的总逗留时间,当出现天数大于1天且日均逗留时长大于一定值,判别基站j为用户的工作地;
S25、在对用户居住地和工作地判别后,根据用户出行链中的起点/端点位置信息,判断用户的出行是否为通勤出行。
4.根据权利要求1-3任一所述的基于手机信令数据的新型公共交通服务区域选取方法,其特征在于,步骤S3基于手机基站多维特性对基站进行标定和分类,并将研究区域划分成若干个交通小区,包括以下步骤:
S31、计算工作日不同时段基站活跃度以及基站经纬度对应地理位置的语义信息和停驻点基站的交通语义信息,初步对基站进行标定;
S32、根据基站的空间位置信息,利用基于密度的DBSCAN聚类算法将位置间隔一定范围内、属性相同的基站分为一类,同时不断更新聚类中心点,直到所有的基站被划分到不同的聚类簇,且聚类效果的评价指标达到收敛;
S33、将聚类簇集合映射到空间区域,利用泰森多边形法划分聚类簇基站服务范围,同时考虑交通小区划分原则,将天然屏障作为分区界限,优化交通小区边界,将研究区域划分为若干个交通小区。
5.根据权利要求4所述的基于手机信令数据的新型公共交通服务区域选取方法,其特征在于,步骤S31初步标定方法如下:
计算某工作日各基站每td分钟内连接的用户数量,筛选各基站一天中连接用户最多的时间区间并对连接用户数量进行排序,将排在前p1%的基站初步标定为活跃基站;
再根据各基站连接的各用户的停留时长,统计用户数量最多的停留时长,若该停留时长大于一定值,则将该基站补充标定为活跃基站,其余基站标记为不活跃基站。
6.根据权利要求4所述的基于手机信令数据的新型公共交通服务区域选取方法,其特征在于,步骤S32利用DBSCAN聚类算法划分基站流程如下:
①遍历基站样本数据集,预设邻域半径ε以及最小核心对象数MinPts,将所有基站标记为未访问点;
②从未访问点集中任意选择一个点p,将其标记为已访问点,如果点p的ε邻域内至少有MinPts个对象,则创建一个新簇C,并将点p添加到簇C中,否则将点p标记为噪音点;
③令N为点p的ε邻域中对象集合,遍历集合N,将其中未访问的点p*标记为已访问点,如果点p*的ε邻域内至少有MinPts个对象,则将这些对象添加至集合N,此时如果点p*不属于任何簇集合,则将p*添加至C中;
④重复步骤②-③至没有未访问点;
⑤计算出各聚类簇的质心位置坐标;
⑥分别遍历各聚类簇,计算簇内各点到其质心的空间距离,将簇内最大空间距离大于一定值的聚类簇记为待修改聚类簇;
⑦将各基站的交通发生量与交通吸引量作为基站属性添加至样本数据集,重新设置邻域半径ε及最小核心对象数MinPts的取值,并将待修改聚类簇的所有样本点标记为未访问点;
⑧分别对所有待修改聚类簇重复步骤②-⑦,至无待修改聚类簇,然后将各聚类簇的质心坐标作为聚类簇中心。
7.根据权利要求1-3任一所述的基于手机信令数据的新型公共交通服务区域选取方法,其特征在于,步骤S4结合新型公共交通系统的特性设计服务区域筛选指标并最终确定服务区域,包括以下步骤:
S41、统计基站上连接的居住人口数和工作人口数,并将其映射到所属的交通小区内,计算交通小区居住人口密度和工作人口密度,选取人口密度大于均值的交通小区为城市交通出行产生区域与出行吸引区域;
S42、提取出行产生区域与出行吸引区域间各交通小区间高峰时段出行量;
S43、将S41筛选出的交通小区间出行量由高到低进行排序,并且根据交通小区间出行量的集中分布情况,剔除出行量低于一定值的交通小区OD对;
S44、计算S43筛选出的交通小区OD对质心之间的距离,剔除距离小于一定值的交通小区OD对,筛选出满足距离要求的交通小区OD对;
S45、基于交通小区OD对间现有公交线网供给情况,筛选现有公交线路行距比大于均值且行时比大于一定值的交通小区OD对;
S46、根据筛选出的交通小区OD对之间的道路等级及道路条件,筛除公交无法通行的交通小区,最终确定新型共享公共交通服务区域。
8.根据权利要求7所述的基于手机信令数据的新型公共交通服务区域选取方法,其特征在于,步骤S44中距离计算使用经纬度距离公式,如下:
Figure FDA0003328101920000041
其中,dij为交通小区i与交通小区j之间的空间距离;R为地球半径;lati为交通小区i质心的纬度坐标;loni为交通小区i质心的经度坐标。
9.根据权利要求7所述的基于手机信令数据的新型公共交通服务区域选取方法,其特征在于,步骤S45中行距比与行时比计算方法如下:
将公交与步行出行距离比值定义为行距比,以及公交与小汽车出行时间比值定义为行时比;行距比与行时比的计算公式如下:
Figure FDA0003328101920000042
式中
Figure FDA0003328101920000043
为交通小区i→j的公交车与步行的行距比;
Figure FDA0003328101920000044
为交通小区i→j的公交车出行距离;
Figure FDA0003328101920000045
为交通小区i→j的步行出行距离;
Figure FDA0003328101920000046
式中
Figure FDA0003328101920000047
为交通小区i→j的公交车与小汽车的行时比;
Figure FDA0003328101920000048
为交通小区i→j的公交车出行时间;
Figure FDA0003328101920000049
为交通小区i→j的小汽车出行时间。
CN202111269287.4A 2021-10-29 2021-10-29 一种基于手机信令数据的共享公共交通服务区域选取方法 Active CN114141008B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111269287.4A CN114141008B (zh) 2021-10-29 2021-10-29 一种基于手机信令数据的共享公共交通服务区域选取方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111269287.4A CN114141008B (zh) 2021-10-29 2021-10-29 一种基于手机信令数据的共享公共交通服务区域选取方法

Publications (2)

Publication Number Publication Date
CN114141008A true CN114141008A (zh) 2022-03-04
CN114141008B CN114141008B (zh) 2023-05-12

Family

ID=80395863

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111269287.4A Active CN114141008B (zh) 2021-10-29 2021-10-29 一种基于手机信令数据的共享公共交通服务区域选取方法

Country Status (1)

Country Link
CN (1) CN114141008B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114724407A (zh) * 2022-03-25 2022-07-08 中电达通数据技术股份有限公司 一种道路拟合中基于多数据源的正确车道识别方法
CN118134111A (zh) * 2024-05-06 2024-06-04 清华大学 一种基于手机信令数据的社区生活圈规划现状评价方法

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104484993A (zh) * 2014-11-27 2015-04-01 北京交通大学 用于交通小区划分的手机信令信息的处理方法
CN106503843A (zh) * 2016-10-20 2017-03-15 上海萃图数字科技有限公司 一种基于手机信令数据的常规公交线网优化与调整方法
CN108492565A (zh) * 2018-04-20 2018-09-04 广东亿迅科技有限公司 基于用户出行数据分析的公共交通控制方法和系统
CN109583640A (zh) * 2018-11-23 2019-04-05 东南大学 一种基于多源定位数据的城市出行客流属性识别方法
CN110753307A (zh) * 2019-10-24 2020-02-04 南京瑞栖智能交通技术产业研究院有限公司 一种基于居民调查数据获取带有标签的手机信令轨迹数据方法
CN111653093A (zh) * 2020-05-29 2020-09-11 南京瑞栖智能交通技术产业研究院有限公司 一种基于手机信令数据的城市出行方式综合识别方法
CN111681421A (zh) * 2020-06-10 2020-09-18 南京瑞栖智能交通技术产业研究院有限公司 基于手机信令数据的对外客运枢纽集疏空间分布分析方法
CN112133090A (zh) * 2020-08-14 2020-12-25 南京瑞栖智能交通技术产业研究院有限公司 一种基于手机信令数据的多方式交通分布模型构建方法
CN112150796A (zh) * 2020-07-20 2020-12-29 南京瑞栖智能交通技术产业研究院有限公司 基于手机信令数据的定制公交站点布局方法

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104484993A (zh) * 2014-11-27 2015-04-01 北京交通大学 用于交通小区划分的手机信令信息的处理方法
CN106503843A (zh) * 2016-10-20 2017-03-15 上海萃图数字科技有限公司 一种基于手机信令数据的常规公交线网优化与调整方法
CN108492565A (zh) * 2018-04-20 2018-09-04 广东亿迅科技有限公司 基于用户出行数据分析的公共交通控制方法和系统
CN109583640A (zh) * 2018-11-23 2019-04-05 东南大学 一种基于多源定位数据的城市出行客流属性识别方法
CN110753307A (zh) * 2019-10-24 2020-02-04 南京瑞栖智能交通技术产业研究院有限公司 一种基于居民调查数据获取带有标签的手机信令轨迹数据方法
CN111653093A (zh) * 2020-05-29 2020-09-11 南京瑞栖智能交通技术产业研究院有限公司 一种基于手机信令数据的城市出行方式综合识别方法
CN111681421A (zh) * 2020-06-10 2020-09-18 南京瑞栖智能交通技术产业研究院有限公司 基于手机信令数据的对外客运枢纽集疏空间分布分析方法
CN112150796A (zh) * 2020-07-20 2020-12-29 南京瑞栖智能交通技术产业研究院有限公司 基于手机信令数据的定制公交站点布局方法
CN112133090A (zh) * 2020-08-14 2020-12-25 南京瑞栖智能交通技术产业研究院有限公司 一种基于手机信令数据的多方式交通分布模型构建方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
徐硕等: "基于手机信令数据的大型交通枢纽出租车接续运输需求特征研究", 《科学技术创新》 *
陆振波等: "基于手机信令数据的昆山市职住分布与通勤特征分析", 《现代城市研究》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114724407A (zh) * 2022-03-25 2022-07-08 中电达通数据技术股份有限公司 一种道路拟合中基于多数据源的正确车道识别方法
CN118134111A (zh) * 2024-05-06 2024-06-04 清华大学 一种基于手机信令数据的社区生活圈规划现状评价方法

Also Published As

Publication number Publication date
CN114141008B (zh) 2023-05-12

Similar Documents

Publication Publication Date Title
CN108564226B (zh) 一种基于出租车gps及手机信令数据的公交线路优化方法
CN111653099B (zh) 基于手机信令数据的公交客流od获取方法
CN112150796B (zh) 基于手机信令数据的定制公交站点布局方法
CN112133090A (zh) 一种基于手机信令数据的多方式交通分布模型构建方法
CN103279534B (zh) 基于智能公交系统数据的公交卡乘客通勤od分布估计方法
CN106096631A (zh) 一种基于手机大数据的流动人口分类识别分析方法
CN109583640A (zh) 一种基于多源定位数据的城市出行客流属性识别方法
Srinivasan A spatial exploration of the accessibility of low-income women: Chengdu, China and Chennai, India
CN110555544B (zh) 一种基于gps导航数据的交通需求估计方法
CN105677804A (zh) 权威站点的确定以及权威站点数据库的建立方法和装置
CN105142106A (zh) 基于手机信令数据的出行者职住地识别与出行链刻画方法
CN110796337B (zh) 一种评价城市公交站点服务可达性的系统
CN105809962A (zh) 一种基于手机数据的交通出行方式划分的方法
CN114141008B (zh) 一种基于手机信令数据的共享公共交通服务区域选取方法
CN104732756A (zh) 一种利用移动通信数据挖掘进行公交规划的方法
CN109729518B (zh) 基于手机信令的城市交通早高峰拥堵源头识别方法
CN113569977B (zh) 一种基于手机信令数据的出行目的识别方法
CN112000755B (zh) 一种基于手机信令数据的区域出行廊道识别方法
CN106373384B (zh) 边远地区客运班车线路实时生成方法
CN111341135B (zh) 基于兴趣点及导航数据的手机信令数据出行方式识别方法
CN113079463A (zh) 一种基于手机信令数据的旅游景点游客出行活动识别方法
CN112784000A (zh) 基于出租车轨迹数据的寻客方法
CN116233757A (zh) 一种基于手机信令数据的居民出行碳排放量计算方法
CN110245774A (zh) 一种根据员工家庭住址进行班车线路优化的方法
CN112711576A (zh) 一种识别手机信令数据高铁、飞机城际出行方式的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant