CN113573238A - 一种基于手机信令的联程旅客出行链识别方法 - Google Patents

一种基于手机信令的联程旅客出行链识别方法 Download PDF

Info

Publication number
CN113573238A
CN113573238A CN202110654185.8A CN202110654185A CN113573238A CN 113573238 A CN113573238 A CN 113573238A CN 202110654185 A CN202110654185 A CN 202110654185A CN 113573238 A CN113573238 A CN 113573238A
Authority
CN
China
Prior art keywords
travel
trip
data
time
station
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110654185.8A
Other languages
English (en)
Other versions
CN113573238B (zh
Inventor
姚恩建
李义罡
卢天伟
郇宁
陈琳
杨扬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Jiaotong University
Original Assignee
Beijing Jiaotong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Jiaotong University filed Critical Beijing Jiaotong University
Priority to CN202110654185.8A priority Critical patent/CN113573238B/zh
Publication of CN113573238A publication Critical patent/CN113573238A/zh
Application granted granted Critical
Publication of CN113573238B publication Critical patent/CN113573238B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/02Services making use of location information
    • H04W4/021Services related to particular areas, e.g. point of interest [POI] services, venue services or geofences
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/40Business processes related to the transportation industry
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/02Services making use of location information
    • H04W4/029Location-based management or tracking services
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/20Services signaling; Auxiliary data signalling, i.e. transmitting data via a non-traffic channel
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/30Services specially adapted for particular environments, situations or purposes
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Economics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Traffic Control Systems (AREA)

Abstract

本发明提供了一种基于手机信令的联程旅客出行链识别方法。该方法包括:以多源数据融合的方法判定与出行人手机发生交互的通信基站是否位于与联程出行相关联的枢纽站的地理坐标范围内,获取相应的手机信令数据;使用时空聚类方法从手机信令数据中识别出枢纽间联程旅客,获取所有联程旅客的时序出行链;用隶属度乘法运算合成规则构建联程旅客出行链中出行阶段的各交通方式的隶属度函数,计算各出行阶段的各交通方式隶属度,根据各交通方式隶属度确定联程旅客出行链中各出行阶段的交通方式。本发明可以对联程旅客的出行链进行精准识别,提供了枢纽站间运力调度的数据支撑。

Description

一种基于手机信令的联程旅客出行链识别方法
技术领域
本发明涉及旅客联程运输控制技术领域,尤其涉及一种基于手机信令的联程旅客出行链识别方法。
背景技术
旅客联程运输是通过对旅客不同运输方式的行程进行统筹规划和一体化运输组织,实现旅客便捷高效出行的运输组织模式。
联程运输旅客的出行过程具有经过多个交通枢纽,采用多种交通方式,经历多次换乘衔接的特点。因此如何精准识别联程运输旅客出行链,是交通管理单位在枢纽间进行运力优化过程中亟待解决的关键问题。一方面,受困于现行法规和各运输企业的体制机制制约,不同运输方式的票务数据无法互相关联,直接通过各出行方式票务数据匹配得到联程旅客的出行链无法实现,联程旅客的精准辨识存在相当的困难;另一方面,由于联程旅客在枢纽间的换乘往往涉及多种交通方式的衔接,换乘出行行为也相较一般旅客更加复杂,其在各出行阶段采用的交通方式难以确定。
目前,现有技术中的出行链识别方法存在如下的缺点:对交通大数据的利用存在明显不足,在进行识别的过程中往往仅从时间或空间的单一维度进行出行链识别,缺乏综合考虑出行链时间与空间两个维度的识别方法,带来了多源数据融合效果不佳、出行链识别方法精度较低、出行链中出行阶段划分较粗糙等问题,成为了交通管理单位应用联程旅客出行链识别结果的技术阻碍。
发明内容
本发明的实施例提供了一种基于手机信令的联程旅客出行链识别方法,以实现对联程旅客的出行链进行精准识别。
为了实现上述目的,本发明采取了如下技术方案。
一种基于手机信令的联程旅客出行链识别方法,包括:
S1、以多源数据融合的方法判定与出行人手机发生交互的通信基站是否位于与联程出行相关联的枢纽站的地理坐标范围内,并确定枢纽站的有效地理坐标范围;
S2、获取位于与联程出行相关联的枢纽站的地理坐标范围内的通信基站记录的手机信令数据,判定手机信令数据是否满足取值要求,如果满足取值要求,则进入步骤S3;
S3、根据枢纽站的有效地理坐标范围使用时空聚类方法从手机信令数据中识别出枢纽间联程旅客,获取所有联程旅客的时序出行链,识别并标记联程旅客的各个停留点;
S4、根据联程旅客的各个停留点确定联程旅客出行链中的各出行阶段,用隶属度乘法运算合成规则构建出行阶段的各交通方式的隶属度函数,根据各交通方式的隶属度函数计算各出行阶段的各交通方式隶属度,根据各出行阶段的各交通方式隶属度确定联程旅客出行链中各出行阶段的交通方式。
优选地,所述S1具体包括:
S1.1从手机信令数据库平台中获取出行人信息数据,从地理信息系统数据库中获取n个枢纽站的地理坐标范围数据,所述出行人信息数据包括出行人唯一用户身份识别号、当前信令产生的时间、与出行人手机发生交互的通信基站编号和通信基站的地理坐标,所述枢纽站的地理坐标范围数据包括最大纬度数据、最大经度数据、最小纬度数据和最小经度数据;
S1.2根据所述出行人信息数据和枢纽站的地理坐标范围数据,建立出行人信息和枢纽站的地理坐标范围的映射关系,根据与出行人手机发生交互的的通信基站的地理坐标判断通信基站是否在枢纽站的地理坐标范围内;
S1.3利用枢纽站的进出站客流数据对在枢纽站的地理坐标范围内的通信基站记录的出行人唯一用户身份识别号数量进行比较,根据比较结果确定枢纽站的有效地理坐标范围。
优选地,所述S1.2分为两种情况:
第一种,若与出行人手机发生交互的通信基站不在枢纽站的地理坐标范围内,排除该条出行人信息数据,排除含有该通信基站编号的出行人信息数据,更新手机信令数据库平台数据,进入步骤S1.1;
第二种,若与出行人手机发生交互的通信基站在枢纽站的地理坐标范围内,记录含有该出行人唯一用户身份识别号的出行人信息数据,对记录的出行人唯一用户身份识别号数量进行计数统计,进入步骤S1.3;
优选地,所述S1.3分为两种情况:
第一种,若枢纽站的进出站客流数据与记录的出行人唯一用户身份识别号数量的差距小于旅客识别最大可接受误差值emax,确定枢纽站的经纬度数据所覆盖的地理坐标范围为枢纽站的有效地理坐标范围,并记录出行人信息数据;
第二种,若枢纽站的进出站客流数据与记录的出行人唯一用户身份识别号数量的差距大于旅客识别最大可接受误差值emax,以通信基站最大覆盖半径 rmax为单次放大单位放大当前枢纽站的地理坐标范围,将放大后的枢纽站的地理坐标范围确定为枢纽站的有效地理坐标范围,进入步骤S1.1。
优选地,所述S2具体包括:
S2.1获取位于与联程出行相关联的枢纽站的地理坐标范围内的通信基站记录的手机信令数据集合,将所述手机信令数据集合中具有相同出行人唯一用户身份识别号的出行人信息存入相同的信令轨迹数据集,按信令产生的时间排序,信令轨迹数据集的每一条信令定义为一个轨迹点;
S2.2对目标出行人的信令轨迹数据集,利用约束条件判定目标出行人的信令轨迹数据集中的轨迹数据是否属于重复点集合,所述约束条件为:
Point*={point|lati=lati-1,loni=loni-1,timei-timei-1<tmin}
式中,Point*为重复点集合;point为属于重复点集合的轨迹数据;lati为信令轨迹数据集中当前轨迹点的纬度;lati-1为信令轨迹数据集中前一轨迹点的纬度;loni为信令轨迹数据集中当前轨迹点的经度;loni-1为信令轨迹数据集中前一轨迹点的经度;timei为信令轨迹数据集中当前轨迹点的信令产生时间;timei-1为信令轨迹数据集中前一轨迹点的信令产生时间,tmax为通信公司设定的最长被动呼叫间隔时间;
利用约束条件判定目标信令轨迹数据集中的轨迹数据是否属于重复点集合的判定结果分为两种情况:
第一种,若目标出行人的信令轨迹数据集中的轨迹数据属于重复点集合,将轨迹数据归入驻留点数据集合,按信令产生的时间进行排序;
第二种,若目标出行人的信令轨迹数据集中的轨迹数据不属于重复点集合,将轨迹数据归入出行点数据集合,按信令产生的时间进行排序。
S2.3对出行点数据集合中的轨迹数据,若连续多个轨迹点的出行速度大于时间阈值δ,则这些连续的多个轨迹点为异常切换点,在异常切换点中仅保留第一个轨迹点和最后一个轨迹点,将非异常切换点的剩余点归入非异常切换点数据集合。
优选地,所述S3具体包括:
S3.1对非异常切换点数据集合中的轨迹点数据,按照枢纽站的有效地理坐标范围筛选出与m个枢纽站j1、j2、……jm的有效地理坐标范围内的通信基站均发生交互的出行人唯一用户身份识别号;
S3.2根据所述出行人唯一用户身份识别号信息,在非异常切换点数据集合中筛选出相应出行信息,按信令产生的时间进行排序,将具有同一出行人唯一用户身份识别号的出行信息数据归入同一联程出行初始数据集;
S3.3对所述联程出行初始数据集中的出行信息数据基于ST-DBSCAN算法在时间和空间维度进行聚类;
S3.4对已完成聚类的出行信息数据进行统计,计算每个簇的平均行程速度,公式为:
Figure RE-GDA0003270810530000051
式中,
Figure RE-GDA0003270810530000052
为簇Ck的平均行程速度;DC为簇Ck中每一轨迹点与下一轨迹点间的距离之和;TC为簇Ck中每一轨迹点与下一轨迹点间的时间之和;μ为
Figure RE-GDA0003270810530000053
的误差项,服从均值为0方差为σ2的标准正态分布,以反映联程旅客出行速度的随机波动特性;
S3.5设定平均速度阈值V,将平均速度低于阈值V的簇判定为站点簇,利用站点簇中数据构成联程站点数据集合,将平均速度高于阈值V的簇判定为路段簇,利用路段簇中数据构成联程路段数据集合;
S3.6对联程站点数据集合中的出行信息数据,将枢纽站j的有效地理坐标范围内的第一个信令产生时间命名为到达站点时间
Figure RE-GDA0003270810530000054
将枢纽站j的有效地理坐标范围内的最后一个信令产生时间命名为离开站点时间
Figure RE-GDA0003270810530000055
S3.7逐一对m个枢纽站中每一枢纽站的离开时间
Figure RE-GDA0003270810530000056
与下一枢纽站的到达时间
Figure RE-GDA0003270810530000057
作差,得到手机信令行程时间,逐一使用在线地图信息分别获取 m个枢纽站中每一枢纽站与下一枢纽站之间的实时最短行程时间和实时最长行程时间,利用约束条件判定手机信令行程时间是否符合实际状况,手机信令行程时间的约束条件为:
Figure RE-GDA0003270810530000058
式中,
Figure RE-GDA0003270810530000061
为枢纽站j与枢纽站j+1间的手机信令行程时间;
Figure RE-GDA0003270810530000062
为枢纽站j与枢纽站j+1间的实时最短行程时间;
Figure RE-GDA0003270810530000063
为枢纽站j与枢纽站j+1 间的实时最长行程时间;κj,j+1为枢纽站j与枢纽站j+1间的行程时间误差阈值;
S3.8对联程站点数据集合中的出行信息数据,将满足步骤3.7中约束条件的出行信息数据标记为停留点数据。
优选地,所述S3.3具体包括:
S3.3.1初始化联程旅客出行段时空核心对象集合Ω为空集,初始化类别 k为0,空间邻域参数为通信基站最大覆盖半径rmax,时间邻域参数为通信公司设定的最长被动呼叫间隔时间tmax,核心对象邻域内最少样本数为 MinPts;
S3.3.2遍历联程出行初始数据集中的出行信息数据,对于任一出行数据,利用约束条件判定该出行数据是否为核心对象,如果是,则加入联程旅客出行段时空核心对象集合Ω,核心对象的约束条件为:
|Nε(xi)|≥MinPts
式中,xi为联程出行初始数据集中的任一出行信息数据;ε为与xi的时间、空间距离小于对应时间、空间邻域参数的邻域范围;Nε(xi)为出行数据 xi在领域ε范围内对应的集合;MinPts核心对象邻域内最少样本数;
S3.3.3若联程旅客出行段时空核心对象集合Ω中的元素都已被访问,则步骤S3.3结束,否则进入步骤S3.3.4;
S3.3.4在联程旅客出行段时空核心对象集合Ω中随机选择一个未访问的核心对象ο;
S3.3.5将选中的核心对象ο标记为已访问数据,将ο标记类别k,将ο的领域ε中未访问的数据放入预备聚类集合H中。
优选地,所述S3.3.5分为两种情况:
第一种,逐一访问并标记预备聚类集合H中数据,如果预备聚类集合H 中不含联程旅客出行段时空核心对象,则当前联程出行类簇Ck生成完毕,且 k=k+1,进入步骤S3.3.3;
第二种,逐一访问并标记预备聚类集合H中数据,如果预备聚类集合H 中含有联程旅客出行段时空核心对象,从H中选出此核心对象s,进入步骤 S3.3.4;
优选地,所述S4具体包括:
S4.1将联程旅客出行链中各出行阶段划分为飞机出行、火车出行、小汽车出行、公共交通出行和慢行出行5类交通方式;
S4.2使用隶属度乘法运算合成规则构建出行距离隶属度函数,表示为:
Figure RE-GDA0003270810530000071
Figure RE-GDA0003270810530000072
Figure RE-GDA0003270810530000073
Figure RE-GDA0003270810530000074
Figure RE-GDA0003270810530000075
式中,
Figure RE-GDA0003270810530000081
为飞机出行距离隶属度函数;
Figure RE-GDA0003270810530000082
为火车出行距离隶属度函数;
Figure RE-GDA0003270810530000083
为小汽车出行距离隶属度函数;
Figure RE-GDA0003270810530000084
为公共交通出行距离隶属度函数;
Figure RE-GDA0003270810530000085
为慢行出行距离隶属度函数;d为联程旅客出行链中各出行阶段的出行距离;
S4.3使用隶属度乘法运算合成规则构建出行时耗隶属度函数,表示为:
Figure RE-GDA0003270810530000086
Figure RE-GDA0003270810530000087
Figure RE-GDA0003270810530000088
Figure RE-GDA0003270810530000089
Figure RE-GDA00032708105300000810
式中,
Figure RE-GDA00032708105300000811
为飞机出行时耗隶属度函数;
Figure RE-GDA00032708105300000812
为火车出行时耗隶属度函数;
Figure RE-GDA00032708105300000813
为小汽车出行时耗隶属度函数;
Figure RE-GDA00032708105300000814
为公共交通出行时耗隶属度函数;
Figure RE-GDA00032708105300000815
为慢行出行时耗隶属度函数;t为联程旅客出行链中各出行阶段的出行时耗;
S4.4使用隶属度乘法运算合成规则构建出行平均速度隶属度函数,表示为:
Figure RE-GDA0003270810530000091
Figure RE-GDA0003270810530000092
Figure RE-GDA0003270810530000093
Figure RE-GDA0003270810530000094
Figure RE-GDA0003270810530000095
式中,
Figure RE-GDA0003270810530000096
为飞机出行平均速度隶属度函数;
Figure RE-GDA0003270810530000097
为火车出行平均速度隶属度函数;
Figure RE-GDA0003270810530000098
为小汽车出行平均速度隶属度函数;
Figure RE-GDA0003270810530000099
为公共交通出行平均速度隶属度函数;
Figure RE-GDA00032708105300000910
为慢行出行平均速度隶属度函数;v为联程旅客出行链中各出行阶段的出行平均速度;
S4.5确定联程旅客出行链中各出行阶段的各种出行方式的隶属度由出行距离隶属度、出行时耗隶属度和平均出行速度隶属度综合判定,各种出行方式的隶属度为:
Figure RE-GDA0003270810530000101
式中,fi为各种出行方式的隶属度;
Figure RE-GDA0003270810530000102
为各种出行方式的出行距离隶属度函数;
Figure RE-GDA0003270810530000103
为各种出行方式的出行时耗隶属度函数;
Figure RE-GDA0003270810530000104
为各种出行方式的出行平均速度隶属度函数;i为各种出行方式,包括飞机出行、火车出行、小汽车出行、公共交通出行和慢行出行;
S4.6求取各方式隶属度最大值,将隶属度最大值所对应的交通方式确定为联程旅客出行链中该出行阶段的交通出行方式,公式为:
X=max(fplane,ftrain,fcar,fpublic,fslow)
式中,X为各交通方式隶属度最大值;fplane为飞机出行的隶属度;ftrain为火车出行的隶属度;fcar为小汽车出行的隶属度;fpublic为公共交通出行的隶属度;fslow为慢行出行的隶属度。
由上述本发明的实施例提供的技术方案可以看出,本发明实施例综合了利用手机信令数据、枢纽站进出站客流数据和在线地图信息数据,对联程旅客的出行链进行了识别,可以对联程旅客的出行链进行精准识别,提供了枢纽站间运力调度的数据支撑,为旅客联程运输方面的交通工程实践提供了专用的方法指导。
本发明附加的方面和优点将在下面的描述中部分给出,这些将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种基于手机信令的联程旅客出行链识别方法的流程图;
图2为本发明实施例提供的一种确定当前枢纽站的有效地理坐标范围的处理过程示意图。
具体实施方式
下面详细描述本发明的实施方式,所述实施方式的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施方式是示例性的,仅用于解释本发明,而不能解释为对本发明的限制。
本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本发明的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解,当我们称元件被“连接”或“耦接”到另一元件时,它可以直接连接或耦接到其他元件,或者也可以存在中间元件。此外,这里使用的“连接”或“耦接”可以包括无线连接或耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的任一单元和全部组合。
本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语 (包括技术术语和科学术语)具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样定义,不会用理想化或过于正式的含义来解释。
为便于对本发明实施例的理解,下面将结合附图以几个具体实施例为例做进一步的解释说明,且各个实施例并不构成对本发明实施例的限定。
本发明实施例提供了一种基于手机信令的联程旅客出行链识别方法的处理流程,包括以下的处理步骤:
步骤S1、以多源数据融合的方法确定枢纽站的通信基站范围选定规则,根据通信基站范围选定规则获得与联程出行相关联枢纽的通信基站信息。
S1.1从手机信令数据库平台中获取出行人信息数据,从地理信息系统数据库中获取n个枢纽站地理坐标范围数据,所述出行人信息数据包括出行人唯一用户身份识别号、当前信令产生的时间、与出行人手机发生交互的通信基站编号和通信基站地理坐标,所述枢纽站的地理坐标范围数据包括最大纬度数据、最大经度数据、最小纬度数据和最小经度数据。
S1.2根据所述出行人信息数据和枢纽站地理坐标范围数据,建立出行人信息和枢纽站地理坐标范围的映射关系,根据与出行人手机发生交互的通信基站的地理坐标判定通信基站是否在枢纽站的地理坐标范围内。
判定结果分为两种情况:
第一种,若与出行人手机发生交互的通信基站不在枢纽站地理坐标范围内,排除该条出行人信息数据,排除含有该通信基站编号的出行人信息数据,更新手机信令数据库平台数据,进入步骤S1.1;
第二种,若与出行人手机发生交互的通信基站在枢纽站地理坐标范围内,记录含有该出行人唯一用户身份识别号的出行人信息数据,对记录的出行人唯一用户身份识别号数量进行计数统计,进入步骤S1.3。
S1.3利用枢纽站的进出站客流数据对在枢纽站的地理坐标范围内的通信基站记录的出行人唯一用户身份识别号数量进行比较,根据比较结果确定当前枢纽站的有效地理坐标范围,图2为本发明实施例提供的一种确定当前枢纽站的有效地理坐标范围的处理过程示意图。
判定结果分为两种情况:
第一种,若枢纽站的进出站客流数据与记录的出行人唯一用户身份识别号数量的差距小于旅客识别最大可接受误差值emax,确定枢纽站的经纬度数据所覆盖的地理坐标范围为枢纽站的有效地理坐标范围,并记录出行人信息数据;
第二种,若枢纽站的进出站客流数据与记录的出行人唯一用户身份识别号数量的差距大于旅客识别最大可接受误差值emax,以通信基站最大覆盖半径 rmax为单次放大单位放大当前枢纽站的地理坐标范围,将放大后的枢纽站的地理坐标范围确定为枢纽站的有效地理坐标范围,进入步骤S1.1。
步骤S2、获取位于与联程出行相关联的枢纽站的地理坐标范围内的通信基站记录的手机信令数据,判定手机信令数据是否存在噪声并对噪声数据进行剔除。判定去噪后数据是否满足使用要求,信令数据满足取值要求的,进入步骤S3。
S2.1在位于与联程出行相关联的枢纽站的地理坐标范围内的通信基站记录的手机信令数据集合中,将具有相同出行人唯一用户身份识别号的出行人信息存入相同的信令轨迹数据集,按信令产生的时间排序,信令轨迹数据集的每一条信令数据定义为一个轨迹点。
S2.2对目标出行人的信令轨迹数据集,利用约束条件判定目标出行人的信令轨迹数据集中的轨迹数据是否属于重复点集合,上述约束条件为:
Point*={point|lati=lati-1,loni=loni-1,timei-timei-1<tmin}
式中,Point*为重复点集合;point为属于重复点集合的轨迹数据;lati为信令轨迹数据集中当前轨迹点的纬度;lati-1为信令轨迹数据集中前一轨迹点的纬度;loni为信令轨迹数据集中当前轨迹点的经度;loni-1为信令轨迹数据集中前一轨迹点的经度;timei为信令轨迹数据集中当前轨迹点的信令产生时间;timei-1为信令轨迹数据集中前一轨迹点的信令产生时间,tmax为通信公司设定的最长被动呼叫间隔时间。
利用约束条件判定目标信令轨迹数据集中的轨迹数据是否属于重复点集合的判定结果分为两种情况:
第一种,若目标出行人的信令轨迹数据集中的轨迹数据属于重复点集合,将轨迹数据归入驻留点数据集合,按信令产生的时间进行排序;
第二种,若目标出行人的信令轨迹数据集中的轨迹数据不属于重复点集合,将轨迹数据归入出行点数据集合,按信令产生的时间进行排序。
S2.3对出行点数据集合中的轨迹数据,若连续多个轨迹点的出行速度大于时间阈值δ,则这些连续的多个轨迹点为异常切换点,在异常切换点中仅保留第一个轨迹点和最后一个轨迹点,将剩余点归入非异常切换点数据集合。
步骤S3、根据枢纽站的有效地理坐标范围使用时空聚类方法从手机信令数据中识别出枢纽间联程旅客,获取城市群范围内所有联程旅客个人的完整时序出行链,识别并标记联程旅客的停留点。
S3.1对非异常切换点数据集合中的轨迹点数据,按照枢纽站的地理坐标范围筛选出与m个枢纽站j1、j2、……jm的地理坐标范围内的通信基站均发生交互的出行人唯一用户身份识别号。
S3.2根据所述出行人唯一用户身份识别号信息,在非异常切换点数据集合中筛选出相应出行信息,按信令产生的时间进行排序,将具有同一出行人唯一用户身份识别号的出行信息数据归入同一联程出行初始数据集。
S3.3对联程出行初始数据集中的出行信息数据基于ST-DBSCAN(SpatialTemporal-DBSCAN)算法在时间和空间维度进行聚类;具体包括:
S3.3.1初始化联程旅客出行段时空核心对象集合Ω为空集,初始化类别 k为0,空间邻域参数为通信基站最大覆盖半径rmax,时间邻域参数为通信公司设定的最长被动呼叫间隔时间tmax,核心对象邻域内最少样本数为 MinPts;
S3.3.2遍历联程出行初始数据集中的出行信息数据,对于任一出行数据,利用约束条件判定该出行数据是否为核心对象,如果是,则将该出行数据加入联程旅客出行段时空核心对象集合Ω,核心对象的约束条件为:
|Nε(xi)|≥MinPts
式中,xi为联程出行初始数据集中的任一出行信息数据;ε为与xi的时间、空间距离小于对应时间、空间邻域参数的邻域范围;Nε(xi)为出行数据 xi在领域ε范围内对应的集合;MinPts核心对象邻域内最少样本数;
S3.3.3若联程旅客出行段时空核心对象集合Ω中的元素都已被访问,则步骤S3.3结束,否则进入步骤S3.3.4;
S3.3.4在联程旅客出行段时空核心对象集合Ω中随机选择一个未访问的核心对象ο;
S3.3.5将选中的核心对象ο标记为已访问数据,将ο标记类别k,将ο的领域ε中未访问的数据放入预备聚类集合H中,处理结果分为两种情况:
第一种,逐一访问并标记预备聚类集合H中数据,如果预备聚类集合H 中不含联程旅客出行段时空核心对象,则当前联程出行类簇Ck生成完毕,且 k=k+1,进入步骤S3.3.3;
第二种,逐一访问并标记预备聚类集合H中数据,如果预备聚类集合H 中含有联程旅客出行段时空核心对象,从H中选出此核心对象s,进入步骤 S3.3.4。
S3.4对已完成聚类的出行信息数据进行统计,计算每个簇的平均行程速度,公式为:
Figure RE-GDA0003270810530000151
式中,
Figure RE-GDA0003270810530000152
为簇Ck的平均行程速度;DC为簇Ck中每一轨迹点与下一轨迹点间的距离之和;TC为簇Ck中每一轨迹点与下一轨迹点间的时间之和;μ为
Figure RE-GDA0003270810530000153
的误差项,服从均值为0方差为σ2的标准正态分布,以反映联程旅客出行速度的随机波动特性。
S3.5人为设定平均速度阈值V,平均速度低于阈值V的簇判定为站点簇,站点簇中数据构成联程站点数据集合,平均速度高于阈值V的簇判定为路段簇,路段簇中数据构成联程路段数据集合。
S3.6对联程站点数据集合中的出行信息数据,将枢纽站j地理坐标范围内的第一个信令产生时间命名为到达站点时间
Figure RE-GDA0003270810530000161
将枢纽站j地理坐标范围内的最后一个信令产生时间命名为离开站点时间
Figure RE-GDA0003270810530000162
S3.7逐一对m个枢纽站中每一枢纽站的离开时间
Figure RE-GDA0003270810530000163
与下一枢纽站的到达时间
Figure RE-GDA0003270810530000164
作差,得到手机信令行程时间,逐一使用在线地图信息分别获取 m个枢纽站中每一枢纽站与下一枢纽站之间的实时最短行程时间和实时最长行程时间,利用约束条件判定手机信令行程时间是否符合实际状况,手机信令行程时间的约束条件为:
Figure RE-GDA0003270810530000165
式中,
Figure RE-GDA0003270810530000166
为枢纽站j与枢纽站j+1间的手机信令行程时间;
Figure RE-GDA0003270810530000167
为枢纽站j与枢纽站j+1间的实时最短行程时间;
Figure RE-GDA0003270810530000168
为枢纽站j与枢纽站j+1 间的实时最长行程时间;κj,j+1为枢纽站j与枢纽站j+1间的行程时间误差阈值。
S3.8对联程站点数据集合中的出行信息数据,将满足步骤3.7中约束条件的出行信息数据标记为停留点数据。
步骤S4、根据联程旅客的各个停留点确定联程旅客出行链中的各出行阶段,用隶属度乘法运算合成规则构建出行阶段的各交通方式的隶属度函数,根据各交通方式的隶属度函数计算各出行阶段的各交通方式隶属度,根据各出行阶段的各交通方式隶属度确定联程旅客出行链中各出行阶段的交通方式。
S4.1将联程旅客出行链中各出行阶段划分为飞机出行、火车出行、小汽车出行、公共交通出行和慢行出行5类交通方式。
S4.2使用隶属度乘法运算合成规则构建出行距离隶属度函数,可表示为:
Figure RE-GDA0003270810530000171
Figure RE-GDA0003270810530000172
Figure RE-GDA0003270810530000173
Figure RE-GDA0003270810530000174
Figure RE-GDA0003270810530000175
式中,
Figure RE-GDA0003270810530000176
为飞机出行距离隶属度函数;
Figure RE-GDA0003270810530000177
为火车出行距离隶属度函数;
Figure RE-GDA0003270810530000178
为小汽车出行距离隶属度函数;
Figure RE-GDA0003270810530000179
为公共交通出行距离隶属度函数;
Figure RE-GDA00032708105300001710
为慢行出行距离隶属度函数;d为联程旅客出行链中各出行阶段的出行距离。
S4.3使用隶属度乘法运算合成规则构建出行时耗隶属度函数,可表示为:
Figure RE-GDA0003270810530000181
Figure RE-GDA0003270810530000182
Figure RE-GDA0003270810530000183
Figure RE-GDA0003270810530000184
Figure RE-GDA0003270810530000185
式中,
Figure RE-GDA0003270810530000186
为飞机出行时耗隶属度函数;
Figure RE-GDA0003270810530000187
为火车出行时耗隶属度函数;
Figure RE-GDA0003270810530000188
为小汽车出行时耗隶属度函数;
Figure RE-GDA0003270810530000189
为公共交通出行时耗隶属度函数;
Figure RE-GDA00032708105300001810
为慢行出行时耗隶属度函数;t为联程旅客出行链中各出行阶段的出行时耗。
S4.4使用隶属度乘法运算合成规则构建出行平均速度隶属度函数,可表示为:
Figure RE-GDA00032708105300001811
Figure RE-GDA0003270810530000191
Figure RE-GDA0003270810530000192
Figure RE-GDA0003270810530000193
Figure RE-GDA0003270810530000194
式中,
Figure RE-GDA0003270810530000195
为飞机出行平均速度隶属度函数;
Figure RE-GDA0003270810530000196
为火车出行平均速度隶属度函数;
Figure RE-GDA0003270810530000197
为小汽车出行平均速度隶属度函数;
Figure RE-GDA0003270810530000198
为公共交通出行平均速度隶属度函数;
Figure RE-GDA0003270810530000199
为慢行出行平均速度隶属度函数;v为联程旅客出行链中各出行阶段的出行平均速度。
S4.5各种出行方式的隶属度由出行距离隶属度、出行时耗隶属度和平均出行速度隶属度综合判定,各种出行方式的隶属度为:
Figure RE-GDA00032708105300001910
式中,fi为各种出行方式的隶属度;
Figure RE-GDA00032708105300001911
为各种出行方式的出行距离隶属度函数;
Figure RE-GDA00032708105300001912
为各种出行方式的出行时耗隶属度函数;
Figure RE-GDA00032708105300001913
为各种出行方式的出行平均速度隶属度函数;i为各种出行方式,包括飞机出行、火车出行、小汽车出行、公共交通出行和慢行出行。
S4.6求取各方式隶属度最大值,将隶属度最大值所对应的交通方式确定为联程旅客出行链中该出行阶段的交通出行方式,公式为:
X=max(fplane,ftrain,fcar,fpublic,fslow)
式中,X为各方式隶属度最大值;fplane为飞机出行的隶属度;ftrain为火车出行的隶属度;fcar为小汽车出行的隶属度;fpublic为公共交通出行的隶属度;fslow为慢行出行的隶属度。
综上所述,本发明实施例综合了利用手机信令数据、枢纽站进出站客流数据和在线地图信息数据,对联程旅客的出行链进行了识别,重点解决了联程旅客不易识别、联程出行换乘行为复杂的独特需求;此外,所提出的联程旅客各出行阶段的交通出行方式判别方法,能够充分利用有限的数据条件,以手机信令数据所得到的出行数据为驱动高效判别联程旅客各出行阶段的交通出行方式,极大地降低了识别方法在现实中的应用难度。
本发明通过对联程旅客出行链的精准识别,提供了枢纽站间运力调度的数据支撑,为旅客联程运输方面的交通工程实践提供了专用的方法指导。
本领域普通技术人员可以理解:附图只是一个实施例的示意图,附图中的模块或流程并不一定是实施本发明所必须的。
通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本发明可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例或者实施例的某些部分所述的方法。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置或系统实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的装置及系统实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。

Claims (9)

1.一种基于手机信令的联程旅客出行链识别方法,其特征在于,包括:
S1、以多源数据融合的方法判定与出行人手机发生交互的通信基站是否位于与联程出行相关联的枢纽站的地理坐标范围内,并确定枢纽站的有效地理坐标范围;
S2、获取位于与联程出行相关联的枢纽站的地理坐标范围内的通信基站记录的手机信令数据,判定手机信令数据是否满足取值要求,如果满足取值要求,则进入步骤S3;
S3、根据枢纽站的有效地理坐标范围使用时空聚类方法从手机信令数据中识别出枢纽间联程旅客,获取所有联程旅客的时序出行链,识别并标记联程旅客的各个停留点;
S4、根据联程旅客的各个停留点确定联程旅客出行链中的各出行阶段,用隶属度乘法运算合成规则构建出行阶段的各交通方式的隶属度函数,根据各交通方式的隶属度函数计算各出行阶段的各交通方式隶属度,根据各出行阶段的各交通方式隶属度确定联程旅客出行链中各出行阶段的交通方式。
2.如权利要求1所述的一种基于手机信令数据的联程旅客出行链识别方法,其特征在于,所述S1具体包括:
S1.1从手机信令数据库平台中获取出行人信息数据,从地理信息系统数据库中获取n个枢纽站的地理坐标范围数据,所述出行人信息数据包括出行人唯一用户身份识别号、当前信令产生的时间、与出行人手机发生交互的通信基站编号和通信基站的地理坐标,所述枢纽站的地理坐标范围数据包括最大纬度数据、最大经度数据、最小纬度数据和最小经度数据;
S1.2根据所述出行人信息数据和枢纽站的地理坐标范围数据,建立出行人信息和枢纽站的地理坐标范围的映射关系,根据与出行人手机发生交互的的通信基站的地理坐标判断通信基站是否在枢纽站的地理坐标范围内;
S1.3利用枢纽站的进出站客流数据对在枢纽站的地理坐标范围内的通信基站记录的出行人唯一用户身份识别号数量进行比较,根据比较结果确定枢纽站的有效地理坐标范围。
3.如权利要求2所述的一种基于手机信令数据的联程旅客出行链识别方法,其特征在于,所述S1.2分为两种情况:
第一种,若与出行人手机发生交互的通信基站不在枢纽站的地理坐标范围内,排除该条出行人信息数据,排除含有该通信基站编号的出行人信息数据,更新手机信令数据库平台数据,进入步骤S1.1;
第二种,若与出行人手机发生交互的通信基站在枢纽站的地理坐标范围内,记录含有该出行人唯一用户身份识别号的出行人信息数据,对记录的出行人唯一用户身份识别号数量进行计数统计,进入步骤S1.3。
4.如权利要求2所述的一种基于手机信令数据的联程旅客出行链识别方法,其特征在于,所述S1.3分为两种情况:
第一种,若枢纽站的进出站客流数据与记录的出行人唯一用户身份识别号数量的差距小于旅客识别最大可接受误差值emax,确定枢纽站的经纬度数据所覆盖的地理坐标范围为枢纽站的有效地理坐标范围,并记录出行人信息数据;
第二种,若枢纽站的进出站客流数据与记录的出行人唯一用户身份识别号数量的差距大于旅客识别最大可接受误差值emax,以通信基站最大覆盖半径rmax为单次放大单位放大当前枢纽站的地理坐标范围,将放大后的枢纽站的地理坐标范围确定为枢纽站的有效地理坐标范围,进入步骤S1.1。
5.如权利要求1所述的一种基于手机信令数据的联程旅客出行链识别方法,其特征在于,所述S2具体包括:
S2.1获取位于与联程出行相关联的枢纽站的地理坐标范围内的通信基站记录的手机信令数据集合,将所述手机信令数据集合中具有相同出行人唯一用户身份识别号的出行人信息存入相同的信令轨迹数据集,按信令产生的时间排序,信令轨迹数据集的每一条信令定义为一个轨迹点;
S2.2对目标出行人的信令轨迹数据集,利用约束条件判定目标出行人的信令轨迹数据集中的轨迹数据是否属于重复点集合,所述约束条件为:
Point*={point|lati=lati-1,loni=loni-1,timei-timei-1<tmin}
式中,Point*为重复点集合;point为属于重复点集合的轨迹数据;lati为信令轨迹数据集中当前轨迹点的纬度;lati-1为信令轨迹数据集中前一轨迹点的纬度;loni为信令轨迹数据集中当前轨迹点的经度;loni-1为信令轨迹数据集中前一轨迹点的经度;timei为信令轨迹数据集中当前轨迹点的信令产生时间;timei-1为信令轨迹数据集中前一轨迹点的信令产生时间,tmax为通信公司设定的最长被动呼叫间隔时间;
利用约束条件判定目标信令轨迹数据集中的轨迹数据是否属于重复点集合的判定结果分为两种情况:
第一种,若目标出行人的信令轨迹数据集中的轨迹数据属于重复点集合,将轨迹数据归入驻留点数据集合,按信令产生的时间进行排序;
第二种,若目标出行人的信令轨迹数据集中的轨迹数据不属于重复点集合,将轨迹数据归入出行点数据集合,按信令产生的时间进行排序。
S2.3对出行点数据集合中的轨迹数据,若连续多个轨迹点的出行速度大于时间阈值δ,则这些连续的多个轨迹点为异常切换点,在异常切换点中仅保留第一个轨迹点和最后一个轨迹点,将非异常切换点的剩余点归入非异常切换点数据集合。
6.如权利要求5所述的一种基于手机信令数据的联程旅客出行链识别方法,其特征在于,所述S3具体包括:
S3.1对非异常切换点数据集合中的轨迹点数据,按照枢纽站的有效地理坐标范围筛选出与m个枢纽站j1、j2、……jm的有效地理坐标范围内的通信基站均发生交互的出行人唯一用户身份识别号;
S3.2根据所述出行人唯一用户身份识别号信息,在非异常切换点数据集合中筛选出相应出行信息,按信令产生的时间进行排序,将具有同一出行人唯一用户身份识别号的出行信息数据归入同一联程出行初始数据集;
S3.3对所述联程出行初始数据集中的出行信息数据基于ST-DBSCAN算法在时间和空间维度进行聚类;
S3.4对已完成聚类的出行信息数据进行统计,计算每个簇的平均行程速度,公式为:
Figure FDA0003111953210000041
式中,
Figure FDA0003111953210000042
为簇Ck的平均行程速度;DC为簇Ck中每一轨迹点与下一轨迹点间的距离之和;TC为簇Ck中每一轨迹点与下一轨迹点间的时间之和;μ为
Figure FDA0003111953210000043
的误差项,服从均值为0方差为σ2的标准正态分布,以反映联程旅客出行速度的随机波动特性;
S3.5设定平均速度阈值V,将平均速度低于阈值V的簇判定为站点簇,利用站点簇中数据构成联程站点数据集合,将平均速度高于阈值V的簇判定为路段簇,利用路段簇中数据构成联程路段数据集合;
S3.6对联程站点数据集合中的出行信息数据,将枢纽站j的有效地理坐标范围内的第一个信令产生时间命名为到达站点时间
Figure FDA0003111953210000044
将枢纽站j的有效地理坐标范围内的最后一个信令产生时间命名为离开站点时间
Figure FDA0003111953210000045
S3.7逐一对m个枢纽站中每一枢纽站的离开时间
Figure FDA0003111953210000046
与下一枢纽站的到达时间
Figure FDA0003111953210000047
作差,得到手机信令行程时间,逐一使用在线地图信息分别获取m个枢纽站中每一枢纽站与下一枢纽站之间的实时最短行程时间和实时最长行程时间,利用约束条件判定手机信令行程时间是否符合实际状况,手机信令行程时间的约束条件为:
Figure FDA0003111953210000051
式中,
Figure FDA0003111953210000052
为枢纽站j与枢纽站j+1间的手机信令行程时间;
Figure FDA0003111953210000053
为枢纽站j与枢纽站j+1间的实时最短行程时间;
Figure FDA0003111953210000054
为枢纽站j与枢纽站j+1间的实时最长行程时间;κj,j+1为枢纽站j与枢纽站j+1间的行程时间误差阈值;
S3.8对联程站点数据集合中的出行信息数据,将满足步骤3.7中约束条件的出行信息数据标记为停留点数据。
7.如权利要求6所述的一种基于手机信令数据的联程旅客出行链识别方法,其特征在于,所述S3.3具体包括:
S3.3.1初始化联程旅客出行段时空核心对象集合Ω为空集,初始化类别k为0,空间邻域参数为通信基站最大覆盖半径rmax,时间邻域参数为通信公司设定的最长被动呼叫间隔时间tmax,核心对象邻域内最少样本数为MinPts;
S3.3.2遍历联程出行初始数据集中的出行信息数据,对于任一出行数据,利用约束条件判定该出行数据是否为核心对象,如果是,则加入联程旅客出行段时空核心对象集合Ω,核心对象的约束条件为:
|Nε(xi)|≥MinPts
式中,xi为联程出行初始数据集中的任一出行信息数据;ε为与xi的时间、空间距离小于对应时间、空间邻域参数的邻域范围;Nε(xi)为出行数据xi在领域ε范围内对应的集合;MinPts核心对象邻域内最少样本数;
S3.3.3若联程旅客出行段时空核心对象集合Ω中的元素都已被访问,则步骤S3.3结束,否则进入步骤S3.3.4;
S3.3.4在联程旅客出行段时空核心对象集合Ω中随机选择一个未访问的核心对象ο;
S3.3.5将选中的核心对象ο标记为已访问数据,将ο标记类别k,将ο的领域ε中未访问的数据放入预备聚类集合H中。
8.如权利要求7所述的一种基于手机信令数据的联程旅客出行链识别方法,其特征在于,所述S3.3.5分为两种情况:
第一种,逐一访问并标记预备聚类集合H中数据,如果预备聚类集合H中不含联程旅客出行段时空核心对象,则当前联程出行类簇Ck生成完毕,且k=k+1,进入步骤S3.3.3;
第二种,逐一访问并标记预备聚类集合H中数据,如果预备聚类集合H中含有联程旅客出行段时空核心对象,从H中选出此核心对象s,进入步骤S3.3.4。
9.如权利要求1所述的一种基于手机信令数据的联程旅客出行链识别方法,其特征在于,所述S4具体包括:
S4.1将联程旅客出行链中各出行阶段划分为飞机出行、火车出行、小汽车出行、公共交通出行和慢行出行5类交通方式;
S4.2使用隶属度乘法运算合成规则构建出行距离隶属度函数,表示为:
Figure FDA0003111953210000061
Figure FDA0003111953210000062
Figure FDA0003111953210000063
Figure FDA0003111953210000071
Figure FDA0003111953210000072
式中,
Figure FDA0003111953210000073
为飞机出行距离隶属度函数;
Figure FDA0003111953210000074
为火车出行距离隶属度函数;
Figure FDA0003111953210000075
为小汽车出行距离隶属度函数;
Figure FDA0003111953210000076
为公共交通出行距离隶属度函数;
Figure FDA0003111953210000077
为慢行出行距离隶属度函数;d为联程旅客出行链中各出行阶段的出行距离;
S4.3使用隶属度乘法运算合成规则构建出行时耗隶属度函数,表示为:
Figure FDA0003111953210000078
Figure FDA0003111953210000079
Figure FDA00031119532100000710
Figure FDA00031119532100000711
Figure FDA00031119532100000712
式中,
Figure FDA0003111953210000081
为飞机出行时耗隶属度函数;
Figure FDA0003111953210000082
为火车出行时耗隶属度函数;
Figure FDA0003111953210000083
为小汽车出行时耗隶属度函数;
Figure FDA0003111953210000084
为公共交通出行时耗隶属度函数;
Figure FDA0003111953210000085
为慢行出行时耗隶属度函数;t为联程旅客出行链中各出行阶段的出行时耗;
S4.4使用隶属度乘法运算合成规则构建出行平均速度隶属度函数,表示为:
Figure FDA0003111953210000086
Figure FDA0003111953210000087
Figure FDA0003111953210000088
Figure FDA0003111953210000089
Figure FDA00031119532100000810
式中,
Figure FDA00031119532100000811
为飞机出行平均速度隶属度函数;
Figure FDA00031119532100000812
为火车出行平均速度隶属度函数;
Figure FDA00031119532100000813
为小汽车出行平均速度隶属度函数;
Figure FDA00031119532100000814
为公共交通出行平均速度隶属度函数;
Figure FDA0003111953210000091
为慢行出行平均速度隶属度函数;v为联程旅客出行链中各出行阶段的出行平均速度;
S4.5确定联程旅客出行链中各出行阶段的各种出行方式的隶属度由出行距离隶属度、出行时耗隶属度和平均出行速度隶属度综合判定,各种出行方式的隶属度为:
Figure FDA0003111953210000092
式中,fi为各种出行方式的隶属度;
Figure FDA0003111953210000093
为各种出行方式的出行距离隶属度函数;
Figure FDA0003111953210000094
为各种出行方式的出行时耗隶属度函数;
Figure FDA0003111953210000095
为各种出行方式的出行平均速度隶属度函数;i为各种出行方式,包括飞机出行、火车出行、小汽车出行、公共交通出行和慢行出行;
S4.6求取各方式隶属度最大值,将隶属度最大值所对应的交通方式确定为联程旅客出行链中该出行阶段的交通出行方式,公式为:
X=max(fplane,ftrain,fcar,fpublic,fslow)
式中,X为各交通方式隶属度最大值;fplane为飞机出行的隶属度;ftrain为火车出行的隶属度;fcar为小汽车出行的隶属度;fpublic为公共交通出行的隶属度;fslow为慢行出行的隶属度。
CN202110654185.8A 2021-06-11 2021-06-11 一种基于手机信令的联程旅客出行链识别方法 Active CN113573238B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110654185.8A CN113573238B (zh) 2021-06-11 2021-06-11 一种基于手机信令的联程旅客出行链识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110654185.8A CN113573238B (zh) 2021-06-11 2021-06-11 一种基于手机信令的联程旅客出行链识别方法

Publications (2)

Publication Number Publication Date
CN113573238A true CN113573238A (zh) 2021-10-29
CN113573238B CN113573238B (zh) 2022-08-26

Family

ID=78161929

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110654185.8A Active CN113573238B (zh) 2021-06-11 2021-06-11 一种基于手机信令的联程旅客出行链识别方法

Country Status (1)

Country Link
CN (1) CN113573238B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114501419A (zh) * 2021-12-30 2022-05-13 中国联合网络通信集团有限公司 信令数据处理方法、装置和存储介质
CN115206104A (zh) * 2022-07-25 2022-10-18 南京师范大学 一种基于手机信令数据的城市居民交通出行方式识别方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111222744A (zh) * 2019-11-18 2020-06-02 西南交通大学 基于信令数据的建成环境与轨道客流分布关系确定方法
CN111681421A (zh) * 2020-06-10 2020-09-18 南京瑞栖智能交通技术产业研究院有限公司 基于手机信令数据的对外客运枢纽集疏空间分布分析方法
CN112732778A (zh) * 2020-12-28 2021-04-30 江苏欣网视讯软件技术有限公司 基于手机信令的交通枢纽客流流向识别方法、计算机系统、服务器与存储介质

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111222744A (zh) * 2019-11-18 2020-06-02 西南交通大学 基于信令数据的建成环境与轨道客流分布关系确定方法
CN111681421A (zh) * 2020-06-10 2020-09-18 南京瑞栖智能交通技术产业研究院有限公司 基于手机信令数据的对外客运枢纽集疏空间分布分析方法
CN112732778A (zh) * 2020-12-28 2021-04-30 江苏欣网视讯软件技术有限公司 基于手机信令的交通枢纽客流流向识别方法、计算机系统、服务器与存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
丁敬安等: "基于手机信令数据的地铁乘客路径识别研究", 《中国电子科学研究院学报》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114501419A (zh) * 2021-12-30 2022-05-13 中国联合网络通信集团有限公司 信令数据处理方法、装置和存储介质
CN114501419B (zh) * 2021-12-30 2023-05-12 中国联合网络通信集团有限公司 信令数据处理方法、装置和存储介质
CN115206104A (zh) * 2022-07-25 2022-10-18 南京师范大学 一种基于手机信令数据的城市居民交通出行方式识别方法
CN115206104B (zh) * 2022-07-25 2024-04-23 南京师范大学 一种基于手机信令数据的城市居民交通出行方式识别方法

Also Published As

Publication number Publication date
CN113573238B (zh) 2022-08-26

Similar Documents

Publication Publication Date Title
Kondor et al. Estimating savings in parking demand using shared vehicles for home–work commuting
Gurumurthy et al. Analyzing the dynamic ride-sharing potential for shared autonomous vehicle fleets using cellphone data from Orlando, Florida
CN112133090A (zh) 一种基于手机信令数据的多方式交通分布模型构建方法
CN111681421B (zh) 基于手机信令数据的对外客运枢纽集疏空间分布分析方法
CN113256987B (zh) 基于多源数据融合的居民出行链生成方法及共乘查询方法
CN110298500B (zh) 一种基于出租车数据和城市路网的城市交通轨迹数据集生成方法
CN110472999B (zh) 基于地铁和共享单车数据的客流模式分析方法及装置
AU2016298981A1 (en) Method and system for determining transport service fee
CN113573238B (zh) 一种基于手机信令的联程旅客出行链识别方法
CN113763700B (zh) 信息处理方法、装置、计算机设备及存储介质
CN113763712B (zh) 基于出行事件知识图谱的区域交通拥堵溯因方法
CN110545558A (zh) 基于Wi-Fi数据的高速服务区人群密度估计系统
CN113516500A (zh) 一种基于大数据商旅运营平台的实现方法和系统
CN112036757A (zh) 基于手机信令和浮动车数据的停车换乘停车场的选址方法
CN114358808A (zh) 基于多源数据融合的公交od估计及分配方法
CN111190891A (zh) 一种多语义轨迹数据分段存储方法
Chen et al. An analysis of movement patterns between zones using taxi GPS data
Deng et al. Heterogenous Trip Distance‐Based Route Choice Behavior Analysis Using Real‐World Large‐Scale Taxi Trajectory Data
Guerra et al. The relationship between urban form and mode choice in US and Mexican cities
Yao et al. Analysis of key commuting routes based on spatiotemporal trip chain
Jang et al. Pedestrian mode identification, classification and characterization by tracking mobile data
Wu et al. Customized bus scheme design of large transport terminals with jointly optimization of departure time, vehicle allocation and routing
CN116129643B (zh) 一种公交车出行特征识别方法、装置、设备及介质
Cardell-Oliver et al. Profiling urban activity hubs using transit smart card data
Yao et al. Trip segmentation and mode detection for human mobility data

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant