CN114390458B - 一种应用手机信令数据辨识个体地铁乘候车行为的方法 - Google Patents

一种应用手机信令数据辨识个体地铁乘候车行为的方法 Download PDF

Info

Publication number
CN114390458B
CN114390458B CN202111503835.5A CN202111503835A CN114390458B CN 114390458 B CN114390458 B CN 114390458B CN 202111503835 A CN202111503835 A CN 202111503835A CN 114390458 B CN114390458 B CN 114390458B
Authority
CN
China
Prior art keywords
subway
station
waiting
time
behaviors
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111503835.5A
Other languages
English (en)
Other versions
CN114390458A (zh
Inventor
朱蓓媚
何兆成
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sun Yat Sen University
Original Assignee
Sun Yat Sen University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sun Yat Sen University filed Critical Sun Yat Sen University
Priority to CN202111503835.5A priority Critical patent/CN114390458B/zh
Publication of CN114390458A publication Critical patent/CN114390458A/zh
Application granted granted Critical
Publication of CN114390458B publication Critical patent/CN114390458B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/20Services signaling; Auxiliary data signalling, i.e. transmitting data via a non-traffic channel
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Train Traffic Observation, Control, And Security (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明提出一种应用手机信令数据辨识个体地铁乘候车行为的方法,涉及轨道交通数据分析的技术领域,首先对地铁出行乘客进行个体地铁出行链重构,还原乘客的乘车候车行为,同时反映地铁站点、区段、线路的客流情况,然后利用聚类的方法,根据某天地铁出行起始站相同的用户的手机信令数据,以辨识同乘用户为出发点,细粒度、精细化地分析个体的地铁出行行为,包括乘车行为、候车行为的辨识分析,作为地铁站点拥堵情况的判断依据,根据不同线路的拥堵情况及旅行时间,进行合理的出行诱导,从而支撑地铁线网运营的精准辨识、精准溯源及精准治理。

Description

一种应用手机信令数据辨识个体地铁乘候车行为的方法
技术领域
本发明涉及轨道交通数据分析的技术领域,更具体地,涉及一种应用手机信令数据辨识个体地铁乘车行为的方法。
背景技术
手机信令数据是一种由手机信号发射和接收所产生的数据,通常指通讯运营商为维持移动通讯的正常运行而搜集和回收的数据,是一种新型的大数据源,与其他类型的数据相比,其具有实时性、完整性、出行时空全覆盖性等其他数据源所不拥有的优势。近年来,随着个人手机的广泛普及ICT技术的发展,手机信令数据越来越丰富,其样本量大、多维度、细粒度、动态连续,且具有较强的时空持续性,能够较完整地识别手机用户的出行轨迹及时间,在各类规划中尤其是交通大数据分析中具有独特的应用优势。
地铁作为公共交通的一个重要组成部分,承担了城市里很大一部分的公共出行运输任务,在中国的一些主要城市中,地铁建设已经趋于成熟,线路呈网络状,用户的地铁出行路径选择愈加丰富,而随着大城市的人口自改革开放以来地不断增长,逐渐暴露了地铁内个体出行的不便追踪性,地铁调度不够灵活、早晚高峰整个线网客流分布极其不平衡,出现部分站点、区段拥堵异常,运营系统容易失效等治理盲区,给城市的地铁客流管控带来了很大的挑战和压力。现有技术中公开了一种分析轨道交通乘客旅行时间的方案,该方案提出利用AFC数据对乘客的平均拥挤延误时间、广义滞留次数和滞留人数三个指标评价车站的运营状态及服务水平,然而,该方案的分析粒度仅到OD(交通起止点,又称OD交通量),若从目前地铁建设的层面考量,地铁线网断面不可溯源、时效性低,未来的地铁线路呈网状趋势发展,相同OD间可以选择路径更多,则方案中分析AFC数据的方法不足以支撑地铁内个体级的出行行为分析,无法对个体真实的出行路径选择以及乘车候车行为进行分析,准确辨识个体的出行路径。而且当前,在面临疫情这种重大公共卫生事件时,地铁作为一种在封闭空间进行的出行工具,往往需要最先进行管控和人流追踪限制,因此,进行精细的城市个体地铁出行行为辨识分析是十分必要的。
发明内容
为解决传统轨道交通数据分析的方式无法精细化实现个体地铁出行行为辨识分析的问题,本发明提出一种应用手机信令数据辨识个体地铁乘车行为的方法,细粒度、精细化地分析个体的地铁出行行为,从而支撑地铁线网运营的精准辨识、精准溯源及精准治理。
为了达到上述技术效果,本发明的技术方案如下:
一种应用手机信令数据辨识个体地铁乘候车行为的方法,包括以下步骤:
S1.将地铁站点与地下基站匹配,基于用户的手机原始信令数据,重构多区段时间的个体地铁出行链;
S2.提取某天地铁出行起始站相同的用户的手机信令数据,在个体地铁出行链中,选定研究站点,确定地铁到达研究站点的到站时刻;
S3.根据所有经过研究站点的用户的到站时刻进行聚类,辨识研究站点所在线路的同乘用户群;
S4.分析同乘用户群自进入起始站时刻起的候车次数和候车时间,从而对同乘用户群中候车行为相同的用户进行辨识。
在本技术方案中,基于手机信令数据做出针对性的处理和分析,搭建基于手机信令数据的基础地铁线网数据库和完整的个体地铁出行行为辨识分析技术框架,首先对地铁出行乘客进行个体地铁出行链重构,还原乘客的乘车候车行为,同时反映地铁站点、区段、线路的客流情况,利用聚类的方法,根据某天地铁出行起始站相同的用户的手机信令数据,以辨识同乘用户为出发点,细粒度、精细化地分析个体的地铁出行行为,包括乘车行为、候车行为的辨识分析,作为地铁站点拥堵情况的判断依据,以根据不同线路的拥堵情况及旅行时间,进行合理的出行诱导,从而支撑地铁线网运营问题的精准辨识、精准溯源及精准治理。
优选地,在地铁封闭场景内,每个地下基站均存在对应的地铁站点,地下基站的信息存储在基站信息表中,通过文字描述字段表示,在步骤S1中,位于某一地铁站点的用户发起基站扫描连接,扫描后形成基站序列,基站序列与基站信息表中存储的地下基站的文字描述字段匹配,地铁站点登记于对应的地下基站,完成一个地铁站点与一个地下基站的匹配。
在此,地铁在行驶过程中,地铁上的车载台进入一个新地下基站区域内时,会发生旧地下基站向新地下基站的越区切换,并自动登记,车载台注册到新的地下基站后,将自动从上一个旧的地下基站注销,每个地铁站点都安装独立的地下基站,每个地下基站都有明确的对应地铁站点的信息,根据基站描述可以对地铁线网站点对应的基站进行标定。
优选地,在步骤S1中,当用户的手机原始信令数据中记录有两个地铁站点以上的对应地下基站连接记录时,则用户存在地铁出行行为,基于手机信令数据对用户的地铁出行基站时空序列数据字段进行提取,并对用户在两个地铁站点之间的时间间隔进行划分,划分为进站、候车、乘车、出站四个地铁出行区段时间,对每个区段时间里的标志性行为进行辨识,以提取标志性行为的时间节点,然后进行数据清洗,构建出个体地铁出行链。由用户的手机信令数据指导重构的个体地铁出行链的轨迹在时空上是准确的,是辨识个体地铁乘候车行为的基础。
优选地,在所述的数据清洗过程中去除数据字段缺失或错误的数据。
优选地,进站区段的标志性行为及时间节点包括:起始站名称、进站时刻;候车区段的标志性行为的时间节点包括:起始候车时间;乘车区段的标志性行为及时间节点包括:上车时刻、直达或换乘、下车时刻,换乘包括换乘候车时间、换乘时刻及换乘站点名称;出站区段的标志性行为及时间节点包括:离站时间、终点站名称及离站时刻。
优选地,设用户进入起始站的时刻为
Figure BDA0003402659640000031
i为地铁班次,j为同班次用户标签,在i班次地铁行驶中,选定研究站点为起始站之后的第二站,用户到达第二站时刻为ti,在步骤S2中,通过提取的地铁出行用户真实的手机信令数据,确认用户在地铁出行中连接第二站地下基站的时间,从而确认地铁在第二站真实的到站时间ti
在此,考虑个体进入起始站点收到站台站厅的管控和拥挤程度的影响,同一起始站的用户进站时间差异大,但根据地铁运行特点,没有特殊故障时,地铁会准时到达下一站点,因此,车厢内的乘客到达第二站的时刻集中,选定起始站之后的第二站为研究站点。
优选地,在步骤S3中,根据所有经过研究站点的用户的到站时刻进行聚类的方法为MeanShift算法,所述的研究站点为起始站之后的第二站,通过MeanShift算法辨识出研究站点所在线路的同乘用户群。MeanShift算法利用真实的出行时间,不需要指定类别个数,可以在没有任何先验知识的情况下,还原地铁线网的运行信息,同时辨识出某地铁线路某趟班次的同乘人群。
优选地,根据同乘用户群进入起始站时刻的重合情况分析同乘用户群自进入起始站时刻起的候车次数,过程为:
设同乘用户群j在i班次地铁的起始站的最小进站时刻为
Figure BDA0003402659640000041
在第i+1班次地铁的起始站的最小进站时刻为
Figure BDA0003402659640000042
Figure BDA0003402659640000043
设同乘用户群j在i班次地铁的起始站的最大进站时刻为
Figure BDA0003402659640000044
在第i+1班次地铁的起始站的最大进站时刻为
Figure BDA0003402659640000045
Figure BDA0003402659640000046
设同乘用户群j在i班次地铁的起始站的最小进站时刻为
Figure BDA0003402659640000047
在第i+2班次地铁的起始站的最小进站时刻为
Figure BDA0003402659640000048
Figure BDA0003402659640000049
设同乘用户群j在i班次地铁的起始站的最大进站时刻为
Figure BDA00034026596400000410
在第i+2班次地铁的起始站的最大进站时刻为
Figure BDA00034026596400000411
Figure BDA00034026596400000412
Figure BDA00034026596400000413
满足:
Figure BDA00034026596400000414
时,第i+1班次地铁的同乘用户群j一次候车;
Figure BDA00034026596400000415
满足:
Figure BDA00034026596400000416
时,第i+2班次地铁的同乘用户群j二次候车。
在此,考虑若同乘班次ti的用户与同乘班次ti+1或者ti+2的用户在起始进站的时刻有重合,则说明在重合时段进站的同乘人群分别乘坐了不同的地铁班次,即同时进站的人群中有部分用户是有等候行为的,进一步根据用户进站时刻的重合情况来判断用户的候车频次,以便于得出地铁站点的拥堵情况。
优选地,在确认了同乘用户群自进入起始站时刻起的候车次数后,根据同乘用户群自进入起始站时刻起的候车次数确定其实际进入起始站的时刻,与地铁运行班次时刻表比较,得到同乘用户群自进入起始站时刻起的候车时间。
优选地,步骤S4之后还包括:对个体出行链的乘车区段时间中所述的换乘时同乘用户群的候车次数及候车时间进行分析,以确认用户在个体出行链地铁站点的候车次数总占比。以此操作来普及到任何一个地铁站点的拥堵判断以及站点调控,从而实现对客流的管控,有效缓解拥堵。
与现有技术相比,本发明技术方案的有益效果是:
本发明提出一种应用手机信令数据辨识个体地铁乘候车行为的方法,首先对地铁出行乘客进行个体地铁出行链重构,还原乘客的乘车候车行为,同时反映地铁站点、区段、线路的客流情况,利用聚类的方法,根据某天地铁出行起始站相同的用户的手机信令数据,以辨识同乘用户为出发点,细粒度、精细化地分析个体的地铁出行行为,包括乘车行为、候车行为的辨识分析,作为地铁站点拥堵情况的判断依据,整体上搭建了基于手机信令数据的基础地铁线网数据库和完整的个体地铁出行行为辨识分析技术框架,根据不同线路的拥堵情况及旅行时间,进行合理的出行诱导,支撑地铁线网运营的调控和治理。
附图说明
图1表示本发明实施例1中提出的应用手机信令数据辨识个体地铁乘候车行为的方法的流程示意图;
图2表示本发明实施例1中提出的个体地铁出行链的示意图;
图3表示利用本发明实施例1中提出的MeanShift算法辨识研究站点所在线路的同乘用户群的结果示意图;
图4表示本发明实施例3中使用的广州市地铁线路网示意图;
图5表示本发明实施例3中提到的三号线大石-三号线厦滘区段的线路示意图;
图6表示本发明实施例3中提到的利用实施例2中提出的MeanShift算法在07:00:00-08:00:00进行同乘聚类的结果示意图;
图7表示本发明实施例3中提出的07:00:00-08:00:00同乘用户候车行为的辨识结果示意图。
具体实施方式
附图仅用于示例性说明,不能理解为对本专利的限制;
为了更好地说明本实施例,附图某些部位会有省略、放大或缩小,并不代表实际尺寸;
对于本领域技术人员来说,附图中某些公知内容说明可能省略是可以理解的。
附图中描述位置关系的用于仅用于示例性说明,不能理解为对本专利的限制;
下面结合附图和实施例对本发明的技术方案做进一步的说明。
实施例1
目前地铁建设中地铁线网断面不可溯源、时效性低,未来的地铁线路呈网状趋势发展,相同OD间可以选择路径更多,而传统轨道交通数据分析的粒度仅到交通起止点OD,不足以支撑地铁内个体级的出行行为分析,无法对个体真实的出行路径选择以及乘车候车行为进行分析,准确辨识个体的出行路径,不利于地铁运营的管控以及客流量的精准分析,基于此,在传统轨道交通数据分析的基础上,在实施例1中提出一种应用手机信令数据辨识个体地铁乘车行为的方法,流程图参见图1,包括以下步骤:
S1.将地铁站点与地下基站匹配,基于用户的手机原始信令数据,重构多区段时间的个体地铁出行链;
S2.提取某天地铁出行起始站相同的用户的手机信令数据,在个体地铁出行链中,选定研究站点,确定地铁到达研究站点的到站时刻;
S3.根据所有经过研究站点的用户的到站时刻进行聚类,辨识研究站点所在线路的同乘用户群;
S4.分析同乘用户群自进入起始站时刻起的候车次数和候车时间,从而对同乘用户群中候车行为相同的用户进行辨识。
整体上,基于手机信令数据做出针对性的处理和分析,搭建基于手机信令数据的基础地铁线网数据库和完整的个体地铁出行行为辨识分析技术框架,首先对地铁出行乘客进行个体地铁出行链重构,还原乘客的乘车候车行为,同时反映地铁站点、区段、线路的客流情况,利用聚类的方法,根据某天地铁出行起始站相同的用户的手机信令数据,以辨识同乘用户为出发点,细粒度、精细化地分析个体的地铁出行行为,包括乘车行为、候车行为的辨识分析,作为地铁站点拥堵情况的判断依据,以根据不同线路的拥堵情况及旅行时间,进行合理的出行诱导,从而支撑地铁线网运营问题的精准辨识、精准溯源及精准治理。
在本实施例中,考虑地铁在行驶过程中,地铁上的车载台进入一个新地下基站区域内时,会发生旧地下基站向新地下基站的越区切换,并自动登记,车载台注册到新的地下基站后,将自动从上一个旧的地下基站注销,每个地铁站点都安装独立的地下基站,每个地下基站都有明确的对应地铁站点的信息,根据基站描述可以对地铁线网站点对应的基站进行标定。在地铁封闭场景内,每个地下基站均存在对应的地铁站点,地下基站的信息存储在基站信息表中,通过文字描述字段表示,在步骤S1中,位于某一地铁站点的用户发起基站扫描连接,扫描后形成基站序列,基站序列与基站信息表中存储的地下基站的文字描述字段匹配,地铁站点登记于对应的地下基站,完成一个地铁站点与一个地下基站的匹配。
在本实施例中,在步骤S1中,当用户的手机原始信令数据中记录有两个地铁站点以上的对应地下基站连接记录时,则用户存在地铁出行行为,基于手机信令数据对用户的地铁出行基站时空序列数据字段进行提取,数据字段中包括离散型和连续型两种格式的数据,并对用户在两个地铁站点之间的时间间隔进行划分,划分为进站、候车、乘车、出站四个地铁出行区段时间,对每个区段时间里的标志性行为进行辨识,以提取标志性行为的时间节点,然后进行数据清洗,在所述的数据清洗过程中去除数据字段缺失或错误的数据,构建出个体地铁出行链。个体地铁出行链的示意图如图2所示,其中,进站区段的标志性行为及时间节点包括:起始站名称(标志性行为记录)、进站时刻(标志性行为的时间节点);候车区段的标志性行为的时间节点包括:起始候车时间(标志性行为:候车);乘车区段的标志性行为及时间节点包括:上车时刻(标志性行为的时间节点)、直达(标志性行为)或换乘(标志性行为)、下车时刻(标志性行为的时间节点),换乘(标志性行为)包括换乘候车时间(标志性行为的时间节点)、换乘时刻(标志性行为的时间节点)及换乘站点名称(标志性行为);出站区段的标志性行为及时间节点包括:离站时间(标志性行为的时间节点)、终点站名称(标志性行为)及离站时刻(标志性行为的时间节点)。
由用户的手机信令数据指导重构的个体地铁出行链的轨迹在时空上是准确的,是辨识个体地铁乘候车行为的基础,而地铁的运行具有稳定性,乘坐同一线路班次的人群到达同一站点的时刻是非常接近的,在以上的基础上,使用合适的聚类算法挖掘同乘的人群是可行的,可以利用合适的聚类算法在没有地铁相关部门提供准确的时刻表的情况下,仍然可以利用同乘人群的辨识结果,计算出可供参考的地铁线网的发班时刻表。考虑个体进入起始站点收到站台站厅的管控和拥挤程度的影响,同一起始站的用户进站时间差异大,但根据地铁运行特点,没有特殊故障时,地铁会准时到达下一站点,因此,车厢内的乘客到达第二站的时刻集中,选定起始站之后的第二站为研究站点,设用户进入起始站的时刻为
Figure BDA0003402659640000071
i为地铁班次,j为同班次用户标签,在i班次地铁行驶中,选定研究站点为起始站之后的第二站,用户到达第二站时刻为ti,在步骤S2中,通过提取的地铁出行用户真实的手机信令数据,确认用户在地铁出行中连接第二站地下基站的时间,从而确认地铁在第二站真实的到站时间ti
在本实施来中,根据所有经过研究站点的用户的到站时刻进行聚类的方法为MeanShift算法,研究站点为起始站之后的第二站,通过MeanShift算法辨识出研究站点所在线路的同乘用户群,同乘用户群辨识结果如图3所示,如图3所示,在i班次地铁行驶中,设i分别取1,2,3;标签j对应的用户在第1班次地铁的起始站的最小进站时刻为
Figure BDA0003402659640000081
在第2班次地铁的起始站的最小进站时刻为
Figure BDA0003402659640000082
在第3班次地铁的起始站的最小进站时刻为
Figure BDA0003402659640000083
第1班次地铁的起始站的最大进站时刻为
Figure BDA0003402659640000084
第2班次地铁的起始站的最大进站时刻为
Figure BDA0003402659640000085
t1,t2,t3都可以视为地铁到某研究站点的到站时刻,根据所有经过该站点的用户的到站时刻进行MeanShift聚类,即可辨识该站点所在线路的同乘用户群,图2中的“●”表示聚类的用户,MeanShift算法利用真实的出行时间,不需要指定类别个数,可以在没有任何先验知识的情况下,还原地铁线网的运行信息,同时辨识出某地铁线路某趟班次的同乘人群。
考虑若同乘班次ti的用户与同乘班次ti+1或者ti+2的用户在起始进站的时刻有重合,则说明在重合时段进站的同乘人群分别乘坐了不同的地铁班次,即同时进站的人群中有部分用户是有等候行为的,进一步根据用户进站时刻的重合情况来判断用户的候车频次,以便于得出地铁站点的拥堵情况,根据同乘用户群进入起始站时刻的重合情况分析同乘用户群自进入起始站时刻起的候车次数,过程为:
设同乘用户群j在i班次地铁的起始站的最小进站时刻为
Figure BDA0003402659640000086
在第i+1班次地铁的起始站的最小进站时刻为
Figure BDA0003402659640000087
Figure BDA0003402659640000088
设同乘用户群j在i班次地铁的起始站的最大进站时刻为
Figure BDA0003402659640000089
在第i+1班次地铁的起始站的最大进站时刻为
Figure BDA00034026596400000810
Figure BDA00034026596400000811
设同乘用户群j在i班次地铁的起始站的最小进站时刻为
Figure BDA00034026596400000812
在第i+2班次地铁的起始站的最小进站时刻为
Figure BDA00034026596400000813
Figure BDA00034026596400000814
设同乘用户群j在i班次地铁的起始站的最大进站时刻为
Figure BDA00034026596400000815
在第i+2班次地铁的起始站的最大进站时刻为
Figure BDA00034026596400000816
Figure BDA00034026596400000817
Figure BDA00034026596400000818
满足:
Figure BDA00034026596400000819
时,第i+1班次地铁的同乘用户群j一次候车;结合图3所示的辨识结果图,在图3中,自下而上的虚线框中,相邻第一班次与第二班次的聚类虚线框在横轴重合的部分即表示一次候车;
Figure BDA00034026596400000820
满足:
Figure BDA00034026596400000821
时,第i+2班次地铁的同乘用户群j二次候车,结合图3所示的辨识结果图,在图3中,自下而上的虚线框中,相邻第二班次与第三班次的聚类虚线框在横轴重合的部分即表示二次候车。
在确认了同乘用户群自进入起始站时刻起的候车次数后,根据同乘用户群自进入起始站时刻起的候车次数确定其实际进入起始站的时刻,与地铁运行班次时刻表比较,得到同乘用户群自进入起始站时刻起的候车时间。
在本实施例中,考虑对任何一个地铁站点的拥堵判断以及站点调控的普及,从而实现对客流的管控,有效缓解拥堵,步骤S4之后还包括:对个体出行链的乘车区段时间中所述的换乘时同乘用户群的候车次数及候车时间进行分析,以确认用户在个体出行链地铁站点的候车次数总占比。具体的,基于图2所示的个体地铁出行链的示意图,在换乘时刻,对于换乘站点中的第一站,相当于前述的起始站,基于用户的手机信令数据,重复前述具体的聚类以及分析过程,可得出用户在个体出行链地铁换乘站点的候车次数总占比。
实施例2
基于实施例1所述的根据所有经过研究站点的用户的到站时刻进行MeanShift聚类,在本实施例中,对辨识该研究站点所在线路的同乘用户群的具体过程展开描述。
在传统的K-Means算法中,最终的聚类效果受初始的聚类中心的影响,K-Means++算法的提出,为选择较好的初始聚类中心提供了依据,但是算法中,聚类的类别个数k仍需事先制定,对于类别个数事先未知的数据集,K-Means和K-Means++将很难对其精确求解。
在地铁同乘人群辨识的应用场景下,事先无法知道当天的地铁运营班次数,对此,本实施例应用改进的聚类算法MeanShift,来处理聚类个数k未知的情形,MeanShift算法不需要事先制定类别个数k。具体步骤为:
1:在未被标记的用户数据点中随机选择一个点作为起始中心点center;
2:找出以center为中心半径为radius的区域中出现的所有数据点,认为这些点同属于一个聚类C。同时在该聚类中记录数据点出现的次数加1。
3:以center为中心点,计算从center开始到集合M中每个元素的向量,将这些向量相加,得到向量shift。
4:center=center+shift。即center沿着shift的方向移动,移动距离是||shift||。
5:重复步骤2、3、4,直到shift的很小(就是迭代到收敛),记住此时的center。注意,这个迭代过程中遇到的点都应该归类到簇C。
6:如果收敛时当前簇C的center与其它已经存在的簇C2中心的距离小于阈值,那么把C2和C合并,数据点出现次数也对应合并。否则,把C作为新的聚类。
7:重复1、2、3、4、5直到所有的点都被标记为已访问。
8:分类:根据每个类,对每个点的访问频率,取访问频率最大的那个类,作为当前点集的所属类。
实施例3
在本实施例中,基于实施例1和实施例2所提出的方法,在个体地铁出行链重构、候车行为辨识的基础上,从点、线、面三个层面对广州线网进行分析,其中,
点:计算起始站点候车次数/换乘站点候车次数,分析站点候车次数占比,作为站点拥堵情况判断依据。
线:对线网拥堵区段识别,对断面客流量的分时段统计,提取拥堵高峰时段及拥堵区段。进行拥堵预警,并寻找拥堵区段可替代出行方案。
面:1)拥堵区段溯源站点调控,对拥堵区段进行客源站点溯源,从源站点进行客流管控,从而有效缓解拥堵,提高运行效率;2)基于重OD的线路调控,针对大流量OD挖掘用户真实的出行选择,进行途经线路情况分析,根据不同线路的拥堵情况及旅行时间,进行合理的出行诱导。在本实施例中,使用的广州市地铁线路网示意图如图4所示。
具体的数据集为:广州市电信信令数据总体情况:基于2021年某工作日日活用户数5,953,229人;4G基站数量18,504个;单日4G信令切换数据1,515,683,712条;4G基站天线数量83,484个。在此实施例中,共包括以下三个分析目的:
1)同乘分析:将地铁乘客群关联至不同地铁线路班次;
2)候车行为分析:用动态判断代替固定时间间隔计算候车次数;
3)同候分析:将同乘乘客群进一步划分为不同次候车群体。
采用的实验环境为:Hadoop分布式计算集群环境、hiveql、Python 3.8。
实验设置:为了验证本发明实施例1和实施例2的技术可行性与合理性,实验利用广州市某天的全量手机信令数据,进行地铁出行用户的个体地铁出行链重构,并且在早高峰7:00:00-8:00:00两个不同客流量的地铁站点场景下进行了乘候车行为辨识:早高峰大客流地铁站点和早高峰中小客流地铁站点,在每一种场景下利用Meanshift调参获得较合理的聚类结果,还原该早高峰小时内研究站点的地铁到站时刻表,进一步进行了候车行为辨识分析,以该天某用户为例,表1为该用户的原始手机信令数据。
表1
Figure BDA0003402659640000111
Figure BDA0003402659640000121
基于保密原则,信令数据中用户的唯一标识由跟手机号码对应的id表示,procedure_start_time为跟某基站的连接时刻,eci为基站的序号,这里做了保密处理。地铁封闭场景内,每个eci都可以一一对应到相应的地铁站。
对于原始的手机信令数据数据,除了地下基站与地铁站点匹配外,还基于两站电之间的时间间隔做了出行次数的划分,以下的乘候车行为分析都是以单次出行为基础进行的,具体参见如表2。
表2
Figure BDA0003402659640000122
Figure BDA0003402659640000131
通过在个体用户出行链重构的基础上,推出地铁在某站真实的到站时间,对乘坐同一趟地铁的用户进行辨识,对同乘行为的辨识,可以进行个性化精细化调控治理、疫情期间重点人员轨迹辨识追踪、甚至是一些APP的好友推荐、针对同质人群提供个性化服务等。
针对07:00:00-08:00:00的三号线大石-三号线厦滘区段如图5所示,利用上实施例1及实施例2中提到的MeanShift聚类方法,对同候行为进行辨识如图6。由聚类结果图6可知,07:00:00-08:00:00三号线大石-三号线厦滘区段,有19批同候用户,进一步对聚类结果中心进行提取,也可以看作是这一小时内有19班地铁班次经过厦滘,19班次地铁经过厦滘时刻表如表3所示。
表3
Figure BDA0003402659640000132
Figure BDA0003402659640000141
同样针对07:00:00-08:00:00的三号线大石-三号线厦滘区段,在同候行为辨识的基础上,对相邻班次同候人员的进站时间进行交集计算,通过同一起始站所有用户的真实的进站时间,计算地铁出行用户在起始站的候车次数,对同乘候车行为相同的用户进行辨识如图7所示。
由图7可知,07:00:00-08:00:00中乘坐第五趟地铁的乘客与乘坐第三趟、第四趟地铁的部分乘客在起始进站时间上有重合,即可判断与第三趟地铁在大石起始进站时间重合的乘客为二次候车,与第四趟地铁在大石起始进站时间重合的部分乘客为一次候车,通过这种群体聚类特征来判断个体的候车频次。根据以上分析可以对这一小时内在三号线大石站上车的乘客的候车频次比例进行计算,结果如表4所示,进一步说明在07:00:00-08:00:00三号线大石站的服务水平和用户的出行体验。
表4
一次候车比例 138/340=40.6%
二次候车比例 49/340=14.4%
三次候车比例 4/340=1.2%
起始站候车比例 191/340=56.2%
综上,基于手机信令数据这一有别于传统地铁客流数据提出来个体地铁出行链重构、乘侯车行为辨识分析方法是一个有效、准确且可迁移至任一线网的分析方法。
显然,本发明的上述实施例仅是为清楚地说明本发明所作的举例,而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明权利要求的保护范围之内。

Claims (7)

1.一种应用手机信令数据辨识个体地铁乘候车行为的方法,其特征在于,包括以下步骤:
S1.将地铁站点与地下基站匹配,基于用户的手机原始信令数据,重构多区段时间的个体地铁出行链;
在步骤S1中,当用户的手机原始信令数据中记录有两个地铁站点以上的对应地下基站连接记录时,则用户存在地铁出行行为,基于手机信令数据对用户的地铁出行基站时空序列数据字段进行提取,并对用户在两个地铁站点之间的时间间隔进行划分,划分为进站、候车、乘车、出站四个地铁出行区段时间,对每个区段时间里的标志性行为进行辨识,以提取标志性行为的时间节点,然后进行数据清洗,构建出个体地铁出行链;
进站区段的标志性行为及时间节点包括:起始站名称、进站时刻;候车区段的标志性行为的时间节点包括:起始候车时间;乘车区段的标志性行为及时间节点包括:上车时刻、直达或换乘、下车时刻,换乘包括换乘候车时间、换乘时刻及换乘站点名称;出站区段的标志性行为及时间节点包括:离站时间、终点站名称及离站时刻;
S2.提取某天地铁出行起始站相同的用户的手机信令数据,在个体地铁出行链中,选定研究站点,确定地铁到达研究站点的到站时刻;
S3.根据所有经过研究站点的用户的到站时刻进行聚类,辨识研究站点所在线路的同乘用户群;
S4.分析同乘用户群自进入起始站时刻起的候车次数和候车时间,从而对同乘用户群中候车行为相同的用户进行辨识;
根据同乘用户群进入起始站时刻的重合情况分析同乘用户群自进入起始站时刻起的候车次数,过程为:
设同乘用户群j在i班次地铁的起始站的最小进站时刻为
Figure QLYQS_1
在第i+1班次地铁的起始站的最小进站时刻为
Figure QLYQS_2
Figure QLYQS_3
设同乘用户群j在i班次地铁的起始站的最大进站时刻为
Figure QLYQS_4
在第i+1班次地铁的起始站的最大进站时刻为
Figure QLYQS_5
Figure QLYQS_6
设同乘用户群j在i班次地铁的起始站的最小进站时刻为
Figure QLYQS_7
在第i+2班次地铁的起始站的最小进站时刻为
Figure QLYQS_8
Figure QLYQS_9
设同乘用户群j在i班次地铁的起始站的最大进站时刻为
Figure QLYQS_10
在第i+2班次地铁的起始站的最大进站时刻为
Figure QLYQS_11
Figure QLYQS_12
Figure QLYQS_13
满足:
Figure QLYQS_14
时,第i+1班次地铁的同乘用户群j一次候车;
Figure QLYQS_15
满足:
Figure QLYQS_16
时,第i+2班次地铁的同乘用户群j二次候车。
2.根据权利要求1所述的应用手机信令数据辨识个体地铁乘候车行为的方法,其特征在于,在地铁封闭场景内,每个地下基站均存在对应的地铁站点,地下基站的信息存储在基站信息表中,通过文字描述字段表示,在步骤S1中,位于某一地铁站点的用户发起基站扫描连接,扫描后形成基站序列,基站序列与基站信息表中存储的地下基站的文字描述字段匹配,地铁站点登记于对应的地下基站,完成一个地铁站点与一个地下基站的匹配。
3.根据权利要求1所述的应用手机信令数据辨识个体地铁乘候车行为的方法,其特征在于,在所述的数据清洗过程中去除数据字段缺失或错误的数据。
4.根据权利要求1所述的应用手机信令数据辨识个体地铁乘候车行为的方法,其特征在于,设用户进入起始站的时刻为
Figure QLYQS_17
i为地铁班次,j为同班次用户标签,在i班次地铁行驶中,选定研究站点为起始站之后的第二站,用户到达第二站时刻为ti,在步骤S2中,通过提取的地铁出行用户真实的手机信令数据,确认用户在地铁出行中连接第二站地下基站的时间,从而确认地铁在第二站真实的到站时间ti
5.根据权利要求1所述的应用手机信令数据辨识个体地铁乘候车行为的方法,其特征在于,在步骤S3中,根据所有经过研究站点的用户的到站时刻进行聚类的方法为MeanShift算法,所述的研究站点为起始站之后的第二站,通过MeanShift算法辨识出研究站点所在线路的同乘用户群。
6.根据权利要求1所述的应用手机信令数据辨识个体地铁乘候车行为的方法,其特征在于,在确认了同乘用户群自进入起始站时刻起的候车次数后,根据同乘用户群自进入起始站时刻起的候车次数确定其实际进入起始站的时刻,与地铁运行班次时刻表比较,得到同乘用户群自进入起始站时刻起的候车时间。
7.根据权利要求6所述的应用手机信令数据辨识个体地铁乘候车行为的方法,其特征在于,步骤S4之后还包括:对个体出行链的乘车区段时间中所述的换乘时同乘用户群的候车次数及候车时间进行分析,以确认用户在个体出行链地铁站点的候车次数总占比。
CN202111503835.5A 2021-12-09 2021-12-09 一种应用手机信令数据辨识个体地铁乘候车行为的方法 Active CN114390458B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111503835.5A CN114390458B (zh) 2021-12-09 2021-12-09 一种应用手机信令数据辨识个体地铁乘候车行为的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111503835.5A CN114390458B (zh) 2021-12-09 2021-12-09 一种应用手机信令数据辨识个体地铁乘候车行为的方法

Publications (2)

Publication Number Publication Date
CN114390458A CN114390458A (zh) 2022-04-22
CN114390458B true CN114390458B (zh) 2023-06-30

Family

ID=81195716

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111503835.5A Active CN114390458B (zh) 2021-12-09 2021-12-09 一种应用手机信令数据辨识个体地铁乘候车行为的方法

Country Status (1)

Country Link
CN (1) CN114390458B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116033069B (zh) * 2022-07-15 2023-10-20 荣耀终端有限公司 通知消息的显示方法、电子设备及计算机可读存储介质
CN115587503B (zh) * 2022-11-23 2023-04-07 深圳市城市交通规划设计研究中心股份有限公司 基于多模式仿真的个体出行链还原方法
CN117528423B (zh) * 2024-01-05 2024-03-19 北京航空航天大学 基于手机信令的地铁乘客实时乘车状态计算方法及系统

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108055645A (zh) * 2018-01-19 2018-05-18 深圳技术大学(筹) 一种基于手机信令数据的路径识别方法及系统

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7236799B2 (en) * 2002-06-14 2007-06-26 Cingular Wireless Ii, Llc Apparatus and systems for providing location-based services within a wireless network
US20140094197A1 (en) * 2012-10-03 2014-04-03 Fisoc, Inc. Speed and topology relevant dynamic geo search
CN103179509A (zh) * 2013-03-11 2013-06-26 北京工业大学 基于手机定位信息的地铁乘客出行路径辨识方法
CN109190685A (zh) * 2018-08-15 2019-01-11 西南交通大学 融合空间聚类和基站序列规则的轨道出行特征提取方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108055645A (zh) * 2018-01-19 2018-05-18 深圳技术大学(筹) 一种基于手机信令数据的路径识别方法及系统

Also Published As

Publication number Publication date
CN114390458A (zh) 2022-04-22

Similar Documents

Publication Publication Date Title
CN114390458B (zh) 一种应用手机信令数据辨识个体地铁乘候车行为的方法
CN111681421B (zh) 基于手机信令数据的对外客运枢纽集疏空间分布分析方法
CN108961134B (zh) 基于手机信令数据的机场旅客出行od识别方法
CN111121796B (zh) 一种通勤路线规划方法及装置、计算机设备
Holleczek et al. Traffic measurement and route recommendation system for mass rapid transit (mrt)
Wang et al. Aggregated metro trip patterns in urban areas of Hong Kong: Evidence from automatic fare collection records
CN110084402A (zh) 一种基于站点优选和蚂蚁寻迹的公交自适应调度方法
Kato et al. Latest urban rail demand forecast model system in the Tokyo Metropolitan Area
Tian et al. Using smart card data to model commuters’ responses upon unexpected train delays
KR102126677B1 (ko) 교통수요분석을 위한 통신빅데이터 기반 db 구축 방법
Li et al. Estimating crowd flow and crowd density from cellular data for mass rapid transit
CN113221472B (zh) 一种基于lstm的客流预测方法
Cui et al. Usage demand forecast and quantity recommendation for urban shared bicycles
CN116933958B (zh) 一种基于刷卡数据的地铁换乘站换乘客流估计方法
Klimek et al. Towards a better understanding and behavior recognition of inhabitants in smart cities. A public transport case
CN117494864A (zh) 一种基于rsalgcn的城市轨道交通短时客流预测方法
CN108960684B (zh) 一种基于不完全轨迹片段的公交乘客闭合出行链挖掘方法
Namiot et al. On mobility patterns in Smart City
Yao et al. Trip segmentation and mode detection for human mobility data
CN114245329B (zh) 通行方式识别方法、装置、设备及存储介质
Batran et al. Urban travel time estimation in greater maputo using mobile phone big data
Wang et al. Travel patterns analysis of urban residents using automated fare collection system
CN114862001A (zh) 一种基于区域功能增强特征的城市人群流量预测方法及系统
CN112866934A (zh) 地铁用户识别方法与系统
Tian et al. Crowding prediction of In-Situ metro passengers using smart card data

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant