CN106297288B - 一种公交乘客客流数据采集与分析方法 - Google Patents

一种公交乘客客流数据采集与分析方法 Download PDF

Info

Publication number
CN106297288B
CN106297288B CN201610710845.9A CN201610710845A CN106297288B CN 106297288 B CN106297288 B CN 106297288B CN 201610710845 A CN201610710845 A CN 201610710845A CN 106297288 B CN106297288 B CN 106297288B
Authority
CN
China
Prior art keywords
bus
passenger flow
station
time
passenger
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610710845.9A
Other languages
English (en)
Other versions
CN106297288A (zh
Inventor
施莉娟
欧冬秀
李玮
唐茂杰
闫黄
陈丽璇
阳扬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tongji University
Original Assignee
Tongji University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tongji University filed Critical Tongji University
Priority to CN201610710845.9A priority Critical patent/CN106297288B/zh
Publication of CN106297288A publication Critical patent/CN106297288A/zh
Application granted granted Critical
Publication of CN106297288B publication Critical patent/CN106297288B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • G08G1/0104Measuring and analyzing of parameters relative to traffic conditions
    • G08G1/0125Traffic data processing

Landscapes

  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Traffic Control Systems (AREA)

Abstract

本发明提出了一种公交乘客客流数据采集与分析方法,包括以下步骤:追踪用户在公交无线网络接入点的出现时刻与消失时刻;将公交车GPS数据与站点信息进行匹配,得到公交车在各站点的停靠时刻;判断用户是否为公交车乘客;剔除不是公交车乘客的用户信息,保留判断为公交车乘客的用户信息,并得到作为公交车乘客的用户的上车站点和下车站点;计算得到各站点的客流,并按线路行驶方向累加得到站点间的断面客流;前述得到的客流与人工实际统计的客流进行比较,计算客流误差;对客流误差的分布进行假设检验,对前述得到的客流进行修正。该方法操作简单、涉及数据量大,能够有效排除跟车干扰,准确性高且适应范围广。

Description

一种公交乘客客流数据采集与分析方法
技术领域
本发明属于道路交通信息服务与运营管理领域,涉及一种数据采集与分析方法,尤其是一种乘客客流数据采集与分析方法。
背景技术
目前,公交公司、交通管理部门所需的乘客站点上下客与站间断面客流信息的主要数据来源有人工抽样、交通IC卡以及车门视频数据。其中,人工抽样具有高精准度、人力成本大、样本过小的特点;交通IC卡则具有用户多、数据量大、使用频率高等特点,但由于大量公交只需上车刷卡,导致IC卡无法准确获知乘客的下车站点;视频数据能够较准确地识别各车门的上下客人数,但人流高峰时识别精度会明显下降,且无法获知乘客的出行OD(起讫点)。
公开号为CN105096601A的中国专利申请“基于公交移动WiFi热点的线路满载率实时计算方法”中,根据公交车牌ID数据提取对应该公交车牌ID的链接WiFi的实时手机用户数目,从而计算单个公交车车辆上的实际乘客总数,结合承载定员人数计算单个公交车车辆满载率。该方法通过满载率来判断线路设计合理性,最终达到公交车辆分配调度的最优化平衡目的。公开号为CN103700174A的中国专利申请“一种基于WiFi身份识别的公交客流数据采集及OD分析方法”中,通过公交AP热点读取乘客所持有WiFi设备的MAC地址,识别乘客身份再通过对列表中MAC地址的统计获取公交车上下车及断面持有WiFi乘客总人数。该方法建立乘客信息数据库,得到整个城市所有公交站点之间的OD矩阵。但上述技术都没有考虑公交车,包括小汽车、公交车等临近车辆的干扰,同时城区与郊区的道路交通流存在很大差异,不同的公交上下客流也存在不同分布的误差,具体的修正或扩样方法不可一概而论。
发明内容
本发明的目的在于提供一种能够极大地排除干扰,有效修正的公交乘客客流数据采集与分析方法。
为了达到上述目的,本发明的解决方案是:
一种公交乘客客流数据采集与分析方法,包括以下步骤:
(1)初步采集:追踪用户在公交无线网络接入点的出现时刻ts与消失时刻te
(2)匹配:将公交车GPS数据与站点信息进行匹配,得到公交车在各站点的停靠时刻,构建公交车在各站点的停靠信息,至少包括公交车在各站点的停靠时刻和对应站点的名称;
(3)筛除干扰:结合用户的出现时刻ts与消失时刻te、公交车GPS数据和所述步骤(2)匹配得到的公交车在各站点的停靠信息,以设定的时间阈值Δt和距离阈值Δs为约束条件,判断用户是否为公交车乘客;
剔除不是公交车乘客的用户信息,保留判断为公交车乘客的用户信息,并得到作为公交车乘客的用户的上车站点和下车站点;
(4)客流推导:根据所述步骤(3)得到的作为公交车乘客的用户的上车站点和下车站点,计算得到各站点的客流,并按线路行驶方向累加得到站点间的断面客流;
(5)数据修正:将所述步骤(4)得到的客流与人工实际统计的客流进行比较,计算客流误差;对客流误差的分布进行假设检验,建立客流误差修正算法对所述步骤(4)中得到的客流进行修正。
所述步骤(1)基于IEEE802.11的通信机制,用户的移动终端通过WIFI方式传输信息帧,公交车AP终端对用户的移动终端进行无认证感知并采集,记录用户信息,并进行帧类型的识别。
优选地,所述用户信息包括用户MAC地址、信息传输时间、信息帧类型和信号强度。
所述步骤(2)中将公交车GPS数据与站点信息进行匹配的方法为:
(21)查询目标线路每个站点的经纬度坐标;
(22)换算每条GPS数据记录的经纬度坐标与每个站点的经纬度坐标换对应位置的距离djw;每条GPS数据均至少包括记录时刻、在所述记录时刻公交车所处的经纬度坐标以及公交车的速度;
(23)筛选出每个站点半径阈值dr范围内的所有GPS数据,从中筛选出公交车的速度最小且最小的速度小于速度阈值的记录点作为公交车在该站点的停车点,记录停靠时刻tb;半径阈值dr和所述速度阈值均为设定的;
(24)将各站点的站点名称、站点的经纬度坐标、对应的停车点处的经纬度坐标、站点和对应的停车点的距离、对应的最小的公交车的速度构成匹配结果。
优选地,所述距离djw的计算公式为:
C=sin(LatA)*sin(LatB)+cos(LatA)*cos(LatB)*cos(MLonA-MLonB);
djw=R*Arccos(C)*π/180
其中:LonA和LatA为站点的经纬度坐标;LonB和LatB为GPS记录点的经纬度坐标;R为地球半径;Mlon表示对东经取正,对西经取负后得到的新经度。
优选地,所述速度阈值为10km/h。
所述步骤(3)中的时间阈值Δt的计算方法为:
根据上一部公交车GPS数据与站点信息匹配的结果,计算所在线路各站点之间公交车的行驶时间集合TI;再提取所述行驶时间集合TI的85%分位数tI85,把大于tI85的行驶时间剔除,保留剩余的行驶时间得到行驶时间集合TI’,并求得TI’的均值则时间阈值Δt根据下式计算得到:
所述步骤(3)中的距离阈值Δs为:
Δs=db2
其中,b2为若乘客下车后往与公交车的行驶方向相同的方向行走,公交车AP终端最后一次接收到乘客的数据时,公交车距离站点的距离。
所述步骤(3)包括以下步骤:
(31)对每个用户,计算消失时刻te与出现时刻ts之差得到持续时间Tse
(32)若持续时间Tse小于时间阈值Δt,则认定对应的用户不是公交车乘客,直接删除对应的用户的数据;否则,进入步骤(33);
(33)在公交车GPS数据中,寻找在出现时刻ts公交车的经纬度坐标和在消失时刻te公交车的经纬度坐标;
(34)基于所述步骤(2)匹配得到的公交车在各站点的停靠信息,将离出现时刻ts公交车的经纬度坐标最近的同方向的站点设定为用户的上车站点,将离消失时刻te公交车的经纬度坐标最近的同方向的站点设定为用户的下车站点;
(35)计算出现时刻ts公交车的经纬度坐标与设定的上车站点之间的距离d1,以及消失时刻te公交车的经纬度坐标与设定的下车站点之间的距离d2;当所述距离d1和所述距离d2均小于所述距离阈值Δs时,判定对应的用户为公交车乘客,所述步骤(34)中设定的上车站点和下车站点为用户实际的上车站点和下车站点。
所述步骤(5)中对客流误差进行假设检验和修正包括:
假设客流误差服从正态分布,对样本进行参数估计,拟合得到客流误差的正态分布,称为拟合正态分布;
通过正态假设检验判断所述拟合正态分布的合理性;
将通过检验的拟合正态分布的期望值作为客流的修正值,将所述修正值加上所述步骤(4)推断得到的客流,得到修正后的客流。
优选的,所述拟合采用MATLAB软件进行。
所述检验的方法为利用T检验进行显著性水平为0.05的假设检验。
所述检验的方法为皮尔逊卡方检验。
优选地,所述检验的方法包括以下步骤:
将需要检验的数据分为等量的m组;
依次计算以下各式:
npi=Xmax*pi
其中:pi为正态概率;npi为理论频数;n表示所用于检验的样本量;Xmax表示分成m组中,每组的上限;μ表示利用样本计算的均值;α表示利用样本计算的标准差;ni表示每组中的样本数;χ2表示计算的卡方值;
如果算得的χ2趋向于自由度为l-k-1的χ2分布,则假设检验成立,样本数据符合假设的正态分布;
如果算得的χ2大于自由度为l-k-1的χ2分布时,假设检验不成立;
其中,l表示检验的分组数量,等于上述的m;k表示需要估计的未知参数的个数,此处等于2。
所述步骤(5)中,对客流误差的分布进行假设检验前,对客流误差进行分段,且后续假设检验和修正针对分段后的各段客流误差及所对应的客流进行。
优选地,所述分段根据线路的不同、和/或时间段的不同、和/或公交站点群的不同进行。
由于采用上述方案,本发明的有益效果是:本发明提出了一种基于公交车内无线局域网数据传输和公交车GPS数据融合的公交车乘客客流数据采集与分析方法,该方法自动化程度高,操作简单;能够采集的数据量大,用户多,范围广;同时,能够综合考虑临近行人、车辆等多方面的干扰,所得结果更贴合实际情况,精度高。该方法不仅适用于人流密集的城区,同样适用于人流稀疏的郊区,适用范围广,能够作为当前公交客流采集的有效的补充方法。
附图说明
图1为本发明一实施例中乘客客流数据采集与分析方法的流程图;
图2为该实施例中所采用的IEEE802.11通信协议数据包格式;
图3为本发明实施例中用户往公交车行驶相反方向运行示例;
图4为本发明实施例中用户往公交车行驶相同方向运行示例;
图5a为本发明实施例中算法推导的站点上下客流;
图5b为本发明实施例中算法推导的站间断面客流与实际断面客流对比图;
图5c为本发明实施例中修正过后的断面客流与实际断面客流对比图;
图6a-图6f为本发明实施例中修正前后的断面客流误差对比图(包含6个班次)。
具体实施方式
以下结合附图所示实施例对本发明作进一步的说明。
本发明提出了一种乘客客流数据采集与分析方法。本实施例中,该方法充分利用公交车的WIFI覆盖,在设置有AP终端(AP即WirelessAccessPoint,表示访问接入点)的公交车上,利用乘客无线移动终端例如手机开启WIFI功能后,基于IEEE802.11的通信机制,对用户的WIFI设备(即前述无线移动终端,在本实施例中为乘客手机)进行无认证感知并采集,结合公交车GPS等信息,实现公交线路与站点的客流采集与分析。
首先当用户出现在公交车AP终端覆盖范围内且手机WIFI功能开启时,公交车AP终端能够嗅探到用户手机;根据WIFI无认证感知技术获取用户的WIFI信息;利用算法推导(当前现有公交AP终端已经具有记录用户手机(终端)收发WIFI信息帧的帧头的功能,即前述嗅探功能)出用户的出现时刻与消失时刻,根据用户上下车的行为,建立用户上下车的数据模型;当用户满足上下车应有的行为特征时,认为该用户确实是乘车的乘客;根据得到的乘客上下站信息推算公交车客流,并建立客流修正模型,即用于修正客流的模型,并利用该客流修正模型对此次得到的乘客客流数据进行修正。
本实施例中,该利用公交车WIFI数据与GPS数据融合的客流采集与分析方法(图1为其流程图),主要可分为以下四个阶段:
(1)初步采集阶段:公交车AP终端利用IEEE802.11的通信机制,抓取周边用户手机通过WIFI方式传输的信息帧头并进行解析,记录用户MAC地址mac、信息传输时间datetime、信息帧类型type、信号强度rssi等信息,并进行帧类型的识别。根据IEEE802.11通信协议,数据结构如附图2,根据控制帧Frame Control字节来解析用户传输的信息类型。2个字节为:4bit(Subtype)+2bit(Type)+2bit(Protocol Version,默认为00)。在本发明中,主要解析的信息帧类型为0x40、0x48、0x88,得到用户出现时刻ts与消失时刻te。图2中,该数据包只用第一帧,即Frame Control控制帧,其余帧为加密报文;本发明仅获取信息帧中的控制帧,图2中从左到右分别为:控制帧、报文标识ID、地址1,地址2、地址3、序列控制、地址4、QoS(Quality of Service服务质量)控制、HT(High Throughput频宽控制)、信息报文、FCS(Frame Check Sequence)报文校验位。
(2)公交车GPS数据与站点信息的匹配阶段:将公交车GPS数据与站点信息进行匹配。公交车在行驶时,GPS设备每隔一定时间间隔就会记录下公交车所处经纬度、速度以及对应的时刻。根据公交车距离站点的距离djw与实时速度v来作为判别公交车是否到站的条件,得到每趟公交车在各站点的停靠时刻tb,构建公交车在各站点停靠信息。上述公交车在各站点停靠信息包括公交车在各站点的停靠时刻、对应站点的名称、对应站点的经纬度等;在本实施例中,可将其制作为公交车到站时刻表。
(3)筛除干扰阶段:结合用户的出现时刻ts与消失时刻te、公交车GPS数据和步骤(2)匹配得到的公交车在各站点的停靠信息,以设定的时间阈值Δt和距离阈值Δs为约束条件,判断用户是否为公交车乘客。
剔除不是公交车乘客的用户信息,保留判断为公交车乘客的用户信息,并得到用户的上车站点和下车站点。
(4)客流推导阶段:根据步骤(3)得到的各用户的上车站点与下车站点,计算得到各站点的上下车客流;更进一步,并按线路行驶方向累加得到站点间的断面客流。
(5)数据修正:根据推算的客流与人工实际统计的客流进行比较,计算客流误差;分析不同条线路、不同时间段、不同公交站点群的误差情况,对误差分布进行假设检验,建立误差分段修正算法对推算得到的客流进行修正。
上述步骤(2)中,公交车GPS数据与站点信息匹配的具体方法如下:
GPS设备每一秒钟进行一次关于公交车的记录,记录包括当前日期与时刻(精确到秒)、公交车所处的经度、纬度、朝向、当前速度、海拔等。其中,当前对应的时刻、经度、纬度、当前速度是本发明所需的关键数据。GPS设备采集数据时在其内部实时存储,可在采集结束后将数据由常规数据文件格式(如CSV格式)导出,数据格式如表1所示。
表1
表1中,INDEX表示数据编号、TRACK NUMBER表示线路编号、UTC DATE与UTC TIME表示协调世界时间中的日期与时间、LOCAL DATE与LOCAL TIME表示北京时区日期与时间、LATITUDE表示纬度、N/S表示南/北半球、LONGITUDE表示经度、E/W表示东/西半球、ALTITUDE表示海拔,SPEED表示速度。
将公交车GPS数据与公交车站点信息进行匹配时,首先,在线查询目标线路每一站的真实经纬度;然后,计算每一条GPS数据记录的经纬度坐标与每个站点的经纬度坐标对应地点之间的距离djw(单位为KM);计算公式如下:
C=sin(LatA)*sin(LatB)+cos(LatA)*cos(LatB)*cos(MLonA-MLonB);
djw=R*Arccos(C)*π/180;
式中第一点A的经纬度为(LonA,LatA),第二点B的经纬度为(LonB,LatB),R代表地球半径。A和B分别为站点以及GPS记录点。MLon是对经度进行处理后得到的新经度,具体为对东经取正,对西经取负。
接着筛选出每一个站点半径阈值dr范围内的所有GPS数据记录(本实施例中,dr取30m,这是因为:对于港湾式停靠站而言,站台长度至少要有两个车位长(大约30米));再从中筛选出速度最小且该最小的速度小于速度阈值(本实施例中,该速度阈值为10km/h)的记录点作为车辆在该站点的停车点,停靠时刻为tb。之后将站点名称、站点经纬度坐标、停车点处的经纬度坐标、站点和停车点间的距离、最小速度构成一张新的表作为匹配结果,如表2所示。
表2中,longitude表示匹配时刻的车辆经度、latitude表示匹配时刻的车辆纬度、stop表示匹配的停靠站点名、s_longitude表示站点经度、s_latitude表示站点纬度、date_time表示匹配时刻、speed表示车辆瞬时速度、dis表示车辆距离站点距离。
表2
longitude latitude stop s_longitude s_latitude date_time speed dis
121.218872 31.289391 老宅 121.2188409 31.28925781 2016/5/16 08:17:03 0.001116 0.015102183
121.217583 31.304266 马南 121.2175624 31.30449793 2016/5/16 08:20:29 20.297735 0.02586357
121.217712 31.310661 东赵巷 121.2176124 31.31054493 2016/5/16 08:22:08 0.129056 0.016003578
121.212212 31.321674 方泰 121.2121619 31.32148136 2016/5/16 08:26:56 0.041543 0.02194342
121.202271 31.333355 三里桥 121.2020057 31.33344374 2016/5/16 08:31:39 57.995197 0.027063072
121.195694 31.340294 沙港桥 121.1958837 31.34010174 2016/5/16 08:34:20 20.887901 0.027955843
121.200348 31.345905 桃园 121.2005143 31.3459993 2016/5/16 08:36:24 0.212023 0.01895952
121.209412 31.353659 六里桥 121.2095447 31.35374857 2016/5/16 08:38:14 30.793118 0.016064005
121.224113 31.366531 现龙 121.2239396 31.36633327 2016/5/16 08:41:53 17.763853 0.027468328
121.227448 31.368883 嘉安公路胜辛路 121.2271701 31.36882723 2016/5/16 08:43:14 14.781719 0.027098682
121.234497 31.37418 塔城路沪宜公路 121.234444 31.37443175 2016/5/16 08:45:47 5.698274 0.028442291
121.242088 31.380753 塔城路梅园路 121.242183 31.38065575 2016/5/16 08:48:26 0.146163 0.014079269
121.241646 31.386711 城中路清河路 121.2418008 31.38653534 2016/5/16 08:53:58 0.04446 0.024440646
121.23465 31.391605 嘉定中心医院 121.2343427 31.39162038 2016/5/16 09:01:15 4.583105 0.029218506
121.23217 31.393064 招呼站19 121.2319594 31.39312933 2016/5/16 09:02:04 0.195959 0.021265096
121.232361 31.394772 公交嘉定北站 121.2320814 31.39475833 2016/5/16 09:03:13 29.812695 0.02657817
上述步骤(3)中,用户公交乘车行为判别阈值界定的具体方法如下:
时间阈值Δt的大小与公交车各站之间行驶时间密切相关。根据上一部公交车GPS的匹配结果,计算在该条线路各站点之间公交车的行驶时间集合TI。再提取该时间集合的85%分位数tI85,把大于tI85的行驶时间剔除,得到剩余的行驶时间集合为TI’,并求得TI’的的均值根据乘客出行习惯以及大量跟车试验的观察,绝大多数乘客会乘坐两站及两站以上,极少部分乘客只乘坐一站。因此Δt根据下式计算得到:
距离阈值Δs的作用在于筛选掉一些通过时间阈值Δt无法排除的长时间跟车干扰,即公交车周围长时间跟车的车辆,如果这些长时间跟车的车辆中手机开启WIFI功能,会对采集产生干扰。若手机用户确实存在乘车行为,那么用户WIFI数据出现与消失时,该公交车的位置应处在距离站点的一定范围Δs内。
因为公交车AP终端存在一个约100m的嗅探范围,WIFI数据集中用户手机最后一条信息帧的发送或接收时间并不能完全等同于该用户的下车时间,上车时同理。
假如一乘客下车后往与公交相反的方向步行,示意图如图3。图3表示的是一种最极端情况。假设乘客行走速度为vp1,本实施例中为1.5m/s,公交车辆行驶速度为vb,本实施例中为5m/s。则经过一段时间(本实施例中为15s)后,公交车与该乘客相距100米,乘客走出公交车AP终端的嗅探范围。此刻公交车AP终端获取到该乘客所携移动设备的最后一条广播帧,乘客离站台dp1米,本实施例中为22.5m,公交车离站台db1米,本实施例中为77.5m。
假如一乘客下车后往与公交相同的方向步行,示意图如图4。图4表示的也是一种最极端情况。假设乘客行走速度为vp,本实施例中为1.5m/s,公交车辆行驶速度为vb,本实施例中为5m/s。则经过一段时间(本实施例中为29s)后,公交车与该乘客相距100米,乘客走出公交车AP终端的嗅探范围。此刻公交车AP终端获取到该乘客所携移动设备的最后一条广播帧,此时乘客离站台dp2米,本实施例中为43m,公交车离站台db2米,本实施例中为143m。
那么应有:
dp1+db1=100;
db2-dp2=100;
那么Δs的推算方法如下:
Δs=max(db1,db2);
其中,100指的是WIFI嗅探范围为100m;db1为若乘客下车后往与公交车相反的方向行走,公交车AP终端最后一次接收到乘客的数据时,公交车距离站台的距离;db2为若乘客下车后往与公交车相同的方向行走,公交车AP终端最后一次接收到乘客的数据时,公交车距离站台的距离。
显然,db2大于db1,因此Δs=db2
时间阈值Δt与距离阈值Δs的作用如下:
(1)将mac地址随机跳变的用户从数据源中筛除。一般功能上能够实现跳变的用户,在其手机设备锁定或唤醒的时候,会产生跳变,在设备锁定两分钟之后,也会跳变。其跳变间隔时间多在两分钟及以下。
(2)将车外静止行人干扰设备和车外运动行人的干扰设备从数据源中剔除。无论车外行人是静止还是运动,它在公交车AP终端扫描范围内的持续被扫描时间都小于一分钟。
(3)将车外跟车的其他车辆内的干扰设备从数据源中剔除。对于跟车时间较短的干扰车辆,通过设定时间阈值Δt可直接剔除;而对于跟车时间较长的干扰车辆,相关数据可结合设定距离阈值Δs剔除。
上述步骤(3)中,进行筛选的具体方法如下:
首先获取公交车AP终端所探测的用户携带设备的mac地址、信号强度、扫描时间等,即公交车AP终端捕获的源数据;其次获取用户mac出现时刻ts和消失时刻te,相减计算持续时间Tse
接着,判断持续时间Tse是否大于或等于时间阈值Δt。如果小于,则认定该用户不是该趟公交车的乘客,直接删除其数据。如果大于或等于,则根据该用户mac的出现时刻和消失时刻,在公交车GPS数据中找到在出现时刻ts公交车的经纬度坐标和在消失时刻te公交车的经纬度坐标;再根据步骤(2)得到的公交车站点停靠信息,即前文提到的公交站点停靠时刻表,匹配最近的同方向站点为设定的上车站点和设定的下车站点。
最后,若在出现时刻ts公交车的位置与设定的上车站点的距离d1与在消失时刻te公交车的位置与设定的下车站点的距离d2均小于距离阈值Δs,则表示上下车站点匹配有效,即该用户为该趟公交车的乘客,设定的上车站点为其实际的上车站点,设定的下车站点为其实际的下车站点。否则,则认定该用户不是该趟公交车的乘客,该用户的数据为干扰数据,将其删除。
上述步骤(4)中,进行客流推导的具体方法如下:
基于上述得到的各用户的上车站点与下车站点,累计得到各站点的上下车客流,更进一步地,累计得到任意两个站点之间的断面客流。
例如,第一站的上车人数为A1,下车人数为B1,则第一站与第二站间的断面客流为A1-B1。同理,若第n-1站到第n站的断面客流为Dn-1,第n站上车人数为An,下车人数为Bn,则可推算第n站到第n+1站的推导断面客流为Dn=Dn-1+An-Bn
上述步骤(5)中,进行客流修正的具体方法如下:
基于已有线路及班次的原始数据,利用各线路推导的断面客流与真实断面客流(通过人工调研得到真实断面客流)之差,探求客流误差的统计规律,从而对探测断面客流进行分阶段修正。上述人工调研的总采样量中包含的班次越多,修正结果越准确。
假设客流误差整体服从正态分布,对样本进行参数估计,通过MATLAB软件拟合得到客流误差符合均值为μ和方差为α的正态分布。再通过正态假设检验该正态分布的合理性。检验方法有两种:一种是利用T检验进行显著性水平为0.05的假设检验。一种是将需检验的数据分为大致等量的m组,通过正态概率pi和理论频数npi算得χ2值,从而验证服从正态分布的均值μ的合理性。具体公式如下:
npi=Xmax*pi
其中:n表示所用于检验的样本量(即样本的个数);m表示将n个样本分成组的组数;Xmax表示每组的上限;μ表示利用样本计算的均值;α表示利用样本计算的标准差;ni表示每组中的样本数;χ2表示计算的卡方值。
如果算得的χ2趋向于自由度为l-k-1(其中,l表示检验的分组数量,即上述的m值,k表示有几个需要估计的未知参数,此处未μ与α即2个)的χ2分布时,假设检验成立,样本数据符合正态分布。如果χ2大于自由度为l-k-1的χ2分布时,假设检验不成立。
在针对误差分布进行假设检验时,需要对推导的客流进行分段,不同线路区段、不同时段、不同的推导客流对应的误差会有不同分布,对于公交线路首末段,一般客流较小,可将一定范围内的几个站点进行合并,以减小推导客流存在误差的可能变化范围,利于后期修正。
本实施例中,选取一条上海市郊区线路作为本发明的检验对象,测试时间为工作日上午早高峰至午间,共采集了12趟公交WIFI数据。共采集到约18万条WIFI数据记录,平均每趟公交为1.5万条。
对公交车GPS数据与公交站点信息进行匹配,对于dr的确定,因为公交大多采取港湾式停靠站,站台长度至少要有两个车位长(大约30米),取±15米。再加上车站所查询到的经纬度坐标与真实坐标间有15米左右的误差,所以,在此选择dr=30m作为阈值,即离某一站真实经纬度坐标30米之内的速度最小且该最小速度小于速度阈值的点为公交停靠点,匹配结果如表2所示。
之后根据计算得到站点间时长的85分位数tI85为4分47秒,小于等于85分位数的剩余时间集合的均值为2分23秒,因此时间阈值Δt为4分46秒;距离阈值Δs设为200米(由于实际测试中,WIFI嗅探达不到高频率采样(小于等于10s),所以导致距离计算会产生误差,实际实施时距离阈值需要放大,故设为200m)。通过时间阈值和距离阈值对WIFI数据进行筛选,得到的公交站点OD出行表如表3所示。推算得到的公交线路站点上下客流与断面客流如图5a和图5b所示。
由于目前乘客的手机WIFI功能不会高频率向周边广播信息(一般时间大于30s),所以通过该时间戳对用户的出现与消失时间进行定位有一定误差,会对最终的匹配结果产生影响,且公交上不同客流时的误差比例相差较大,故通过实地采集的数据与推导断面客流结果的差值对其进行分段修正,分别为[0,10]、(10,20]、(20,30]以及(30,∞),修正结果如图5c示。(本实施例中假设检验时,利用了6个班次的断面客流推导结果与人工调研结果,对上述4个分段分别进行客流误差分布的假设检验,可求得各分段客流误差正态分布函数,并将该正态分布的期望值作为各分段断面客流数据的修正值,采取推断值加上修正值的操作完成修正。)修正后的误差与修正前的误差对比如图6a-图6f所示(图6a-图6f中,每个图显示一个班次的修正情况),由图6a-图6f可知修正后的线路中部断面客流数据误差明显减小,准确度达70~80%。图6a-图6f中,横坐标表示站点序号,纵坐标表示客流。
表3
综上所述,本发明提出了一种基于公交车内无线局域网数据传输和公交车GPS数据融合的公交车乘客客流数据采集与分析方法,该方法自动化程度高,操作简单;能够采集的数据量大,用户多,范围广;同时,能够综合考虑临近行人、车辆等多方面的干扰,所得结果更贴合实际情况,精度高。该方法不仅适用于人流密集的城区,同样适用于人流稀疏的郊区,适用范围广,能够作为当前公交客流采集的有效的补充方法。
上述的对实施例的描述是为便于该技术领域的普通技术人员能理解和应用本发明。熟悉本领域技术的人员显然可以容易地对这些实施例做出各种修改,并把在此说明的一般原理应用到其他实施例中而不必经过创造性的劳动。因此,本发明不限于这里的实施例,本领域技术人员根据本发明的揭示,不脱离本发明范畴所做出的改进和修改都应该在本发明的保护范围之内。

Claims (16)

1.一种公交乘客客流数据采集与分析方法,其特征在于:包括以下步骤:
(1)初步采集:追踪用户在公交无线网络接入点的出现时刻ts与消失时刻te
(2)匹配:将公交车GPS数据与站点信息进行匹配,得到公交车在各站点的停靠时刻,构建公交车在各站点的停靠信息,至少包括公交车在各站点的停靠时刻和对应站点的名称;
(3)筛除干扰:结合用户的出现时刻ts与消失时刻te、公交车GPS数据和所述步骤(2)匹配得到的公交车在各站点的停靠信息,以设定的时间阈值Δt和距离阈值Δs为约束条件,判断用户是否为公交车乘客;
剔除不是公交车乘客的用户信息,保留判断为公交车乘客的用户信息,并得到作为公交车乘客的用户的上车站点和下车站点;
(4)客流推导:根据所述步骤(3)得到的作为公交车乘客的用户的上车站点和下车站点,计算得到各站点的客流,并按线路行驶方向累加得到站点间的断面客流;
(5)数据修正:将所述步骤(4)得到的客流与人工实际统计的客流进行比较,计算客流误差;对客流误差的分布进行假设检验,建立客流误差修正算法对所述步骤(4)中得到的客流进行修正。
2.根据权利要求1所述的公交乘客客流数据采集与分析方法,其特征在于:所述步骤(1)基于IEEE802.11的通信机制,用户的移动终端通过WIFI方式传输信息帧,公交车AP终端对用户的移动终端进行无认证感知并采集,记录用户信息,并进行帧类型的识别。
3.根据权利要求2所述的公交乘客客流数据采集与分析方法,其特征在于:所述用户信息包括用户MAC地址、信息传输时间、信息帧类型和信号强度。
4.根据权利要求1所述的公交乘客客流数据采集与分析方法,其特征在于:所述步骤(2)中将公交车GPS数据与站点信息进行匹配的方法为:
(21)查询目标线路每个站点的经纬度坐标;
(22)换算每条GPS数据记录的经纬度坐标与每个站点的经纬度坐标对应位置的距离djw;每条GPS数据均至少包括记录时刻、在所述记录时刻公交车所处的经纬度坐标以及公交车的速度;
(23)筛选出每个站点半径阈值dr范围内的所有GPS数据,从中筛选出公交车的速度最小且最小的速度小于速度阈值的记录点作为公交车在该站点的停车点,记录停靠时刻tb;半径阈值dr和所述速度阈值均为设定的;
(24)将各站点的站点名称、站点的经纬度坐标、对应的停车点处的经纬度坐标、站点和对应的停车点的距离、对应的最小的公交车的速度构成匹配结果。
5.根据权利要求4所述的公交乘客客流数据采集与分析方法,其特征在于:所述距离djw的计算公式为:
C=sin(LatA)*sin(LatB)+cos(LatA)*cos(LatB)*cos(MLonA-MLonB);
djw=R*Arccos(C)*π/180
其中:LonA和LatA为站点的经纬度坐标;LonB和LatB为GPS记录点的经纬度坐标;R为地球半径;Mlon表示对东经取正,对西经取负后得到的新经度。
6.根据权利要求4所述的公交乘客客流数据采集与分析方法,其特征在于:所述速度阈值为10km/h。
7.根据权利要求1所述的公交乘客客流数据采集与分析方法,其特征在于:所述步骤(3)中的时间阈值Δt的计算方法为:
根据上一部公交车GPS数据与站点信息匹配的结果,计算所在线路各站点之间公交车的行驶时间集合TI;再提取所述行驶时间集合TI的85%分位数tI85,把大于tI85的行驶时间剔除,保留剩余的行驶时间得到行驶时间集合TI’,并求得TI’的均值则时间阈值Δt根据下式计算得到:
8.根据权利要求1所述的公交乘客客流数据采集与分析方法,其特征在于:所述步骤(3)中的距离阈值Δs为:
Δs=db2
其中,db2为若乘客下车后往与公交车的行驶方向相同的方向行走,公交车AP终端最后一次接收到乘客的数据时,公交车距离站点的距离。
9.根据权利要求1所述的公交乘客客流数据采集与分析方法,其特征在于:所述步骤(3)包括以下步骤:
(31)对每个用户,计算消失时刻te与出现时刻ts之差得到持续时间Tse
(32)若持续时间Tse小于时间阈值Δt,则认定对应的用户不是公交车乘客,直接删除对应的用户的数据;否则,进入步骤(33);
(33)在公交车GPS数据中,寻找在出现时刻ts公交车的经纬度坐标和在消失时刻te公交车的经纬度坐标;
(34)基于所述步骤(2)匹配得到的公交车在各站点的停靠信息,将离出现时刻ts公交车的经纬度坐标最近的同方向的站点设定为用户的上车站点,将离消失时刻te公交车的经纬度坐标最近的同方向的站点设定为用户的下车站点;
(35)计算出现时刻ts公交车的经纬度坐标与设定的上车站点之间的距离d1,以及消失时刻te公交车的经纬度坐标与设定的下车站点之间的距离d2;当所述距离d1和所述距离d2均小于所述距离阈值Δs时,判定对应的用户为公交车乘客,所述步骤(34)中设定的上车站点和下车站点为用户实际的上车站点和下车站点。
10.根据权利要求1所述的公交乘客客流数据采集与分析方法,其特征在于:所述步骤(5)中对客流误差进行假设检验和修正包括:
假设客流误差服从正态分布,对样本进行参数估计,拟合得到客流误差的正态分布,称为拟合正态分布;
通过正态假设检验判断所述拟合正态分布的合理性;
将通过检验的拟合正态分布的期望值作为客流的修正值,将所述修正值加上所述步骤(4)推断得到的客流,得到修正后的客流。
11.根据权利要求10所述的公交乘客客流数据采集与分析方法,其特征在于:所述拟合采用MATLAB软件进行。
12.根据权利要求10所述的公交乘客客流数据采集与分析方法,其特征在于:所述检验的方法为利用T检验进行显著性水平为0.05的假设检验。
13.根据权利要求10所述的公交乘客客流数据采集与分析方法,其特征在于:所述检验的方法为皮尔逊卡方检验。
14.根据权利要求13所述的公交乘客客流数据采集与分析方法,其特征在于:所述检验的方法包括以下步骤:
将需要检验的数据分为等量的m组;
依次计算以下各式:
npi=Xmax*pi
其中:pi为正态概率;φ为标准正态分布的分布法则,φ(x)表示标准正态分布的分布函数;npi为理论频数;n表示所用于检验的样本量;Xmax表示分成m组中,每组的上限;μ表示利用样本计算的均值;α表示利用样本计算的标准差;ni表示每组中的样本数;χ2表示计算的卡方值;
如果算得的χ2趋向于自由度为l-k-1的χ2分布,则假设检验成立,样本数据符合假设的正态分布;
如果算得的χ2大于自由度为l-k-1的χ2分布时,假设检验不成立;
其中,l表示检验的分组数量,等于上述的m;k表示需要估计的未知参数的个数,此处等于2。
15.根据权利要求1所述的公交乘客客流数据采集与分析方法,其特征在于:所述步骤(5)中,对客流误差的分布进行假设检验前,对客流误差进行分段,且后续假设检验和修正针对分段后的各段客流误差及所对应的客流进行。
16.根据权利要求15所述的公交乘客客流数据采集与分析方法,其特征在于:所述分段根据线路的不同、和/或时间段的不同、和/或公交站点群的不同进行。
CN201610710845.9A 2016-08-23 2016-08-23 一种公交乘客客流数据采集与分析方法 Active CN106297288B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610710845.9A CN106297288B (zh) 2016-08-23 2016-08-23 一种公交乘客客流数据采集与分析方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610710845.9A CN106297288B (zh) 2016-08-23 2016-08-23 一种公交乘客客流数据采集与分析方法

Publications (2)

Publication Number Publication Date
CN106297288A CN106297288A (zh) 2017-01-04
CN106297288B true CN106297288B (zh) 2019-06-11

Family

ID=57615766

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610710845.9A Active CN106297288B (zh) 2016-08-23 2016-08-23 一种公交乘客客流数据采集与分析方法

Country Status (1)

Country Link
CN (1) CN106297288B (zh)

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106951520A (zh) * 2017-03-02 2017-07-14 内蒙古大学 一种公交乘客出行数据采集系统及其应用
CN107845259B (zh) * 2017-10-24 2021-02-09 东南大学 公交运行情况实时反馈系统及公交实时运行数据处理方法
CN107564292B (zh) * 2017-10-24 2020-03-31 东南大学 基于站点WiFi和车载移动终端的乘客等车时间规律估计方法
CN107766981B (zh) * 2017-10-24 2021-05-11 东南大学 基于站点WiFi的公交客流OD估计及短时预测方法
CN107844856B (zh) * 2017-10-24 2021-05-11 东南大学 基于车载GPS和站点WiFi的公交车客流预测方法
CN107767669B (zh) * 2017-10-24 2020-11-20 东南大学 基于WiFi和蓝牙识别的公交线路客流OD估计方法
CN107798869B (zh) * 2017-10-24 2020-09-11 东南大学 基于站点WiFi和车载GPS的公交乘客客流采集与分析方法
CN107945352A (zh) * 2017-11-10 2018-04-20 同济大学 公交客流数据采集设备及od分析系统
CN107730893B (zh) * 2017-11-30 2019-08-09 大连理工大学 一种基于乘客出行多维特征的共享巴士站点客流预测方法
CN112154473A (zh) * 2018-05-28 2020-12-29 北京嘀嘀无限科技发展有限公司 用于推荐上车点的系统和方法
CN109035770B (zh) * 2018-07-31 2022-01-04 上海世脉信息科技有限公司 一种大数据环境下公交载客量实时分析预测方法
CN111083658A (zh) * 2018-10-19 2020-04-28 北京全路通信信号研究设计院集团有限公司 一种区域人员统计方法及系统
CN109462830B (zh) * 2018-11-08 2021-07-27 中国联合网络通信集团有限公司 基于终端信令的客流统计方法、装置及设备
CN109579864B (zh) * 2018-12-30 2022-06-07 张鸿青 导航方法及装置
CN109951804B (zh) * 2019-02-26 2020-09-22 北京莱利时空科技有限公司 一种人流量估计方法及装置
CN110246330A (zh) * 2019-05-29 2019-09-17 佛山市慧城信息科技有限公司 一种公交线路客流量预估方法、电子设备和存储介质
CN110428631B (zh) * 2019-09-30 2020-01-10 武汉元光科技有限公司 确定用户乘坐的公交车辆的方法及装置
CN111179589B (zh) * 2019-12-06 2021-06-29 北京中交兴路信息科技有限公司 车辆od预测的方法、装置、设备及存储介质
CN111161534A (zh) * 2019-12-19 2020-05-15 南京行者易智能交通科技有限公司 一种基于WiFi探针的公交精准OD数据的采集系统及方法
CN111027524B (zh) * 2020-01-03 2023-09-01 成都中科大旗软件股份有限公司 在线客流监测分析数据误差修正方法
CN112528867B (zh) * 2020-12-14 2021-07-20 上海工程技术大学 一种地铁车站突发大客流预警方法及其应用
CN112419731B (zh) * 2021-01-22 2021-06-22 深圳市都市交通规划设计研究院有限公司 公交满载率预测方法及系统
CN114944076A (zh) * 2021-02-09 2022-08-26 武汉小码联城科技有限公司 一种公交调度方法、系统及相关设备

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101470946A (zh) * 2007-12-25 2009-07-01 厦门雅迅网络股份有限公司 城市公交系统gps和客流数据处理方法
JP2010061321A (ja) * 2008-09-03 2010-03-18 Railway Technical Res Inst 乗客流動予測システム
CN102097002A (zh) * 2010-11-22 2011-06-15 东南大学 一种基于ic卡数据获取公交站点od的方法及系统
JP2013242665A (ja) * 2012-05-18 2013-12-05 Railway Technical Research Institute 鉄道輸送障害発生時における旅客流動推定システム及びその旅客流動推定方法
CN103700174A (zh) * 2013-12-26 2014-04-02 中国电子科技集团公司第三十三研究所 一种基于wifi身份识别的公交客流数据采集及od分析方法
CN105046962A (zh) * 2015-08-18 2015-11-11 安徽四创电子股份有限公司 基于公交移动wifi热点的车辆满载率实时计算方法
CN105869388A (zh) * 2016-05-31 2016-08-17 苏州朗捷通智能科技有限公司 一种公交客流数据采集及起讫点的分析方法及系统

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101470946A (zh) * 2007-12-25 2009-07-01 厦门雅迅网络股份有限公司 城市公交系统gps和客流数据处理方法
JP2010061321A (ja) * 2008-09-03 2010-03-18 Railway Technical Res Inst 乗客流動予測システム
CN102097002A (zh) * 2010-11-22 2011-06-15 东南大学 一种基于ic卡数据获取公交站点od的方法及系统
JP2013242665A (ja) * 2012-05-18 2013-12-05 Railway Technical Research Institute 鉄道輸送障害発生時における旅客流動推定システム及びその旅客流動推定方法
CN103700174A (zh) * 2013-12-26 2014-04-02 中国电子科技集团公司第三十三研究所 一种基于wifi身份识别的公交客流数据采集及od分析方法
CN105046962A (zh) * 2015-08-18 2015-11-11 安徽四创电子股份有限公司 基于公交移动wifi热点的车辆满载率实时计算方法
CN105869388A (zh) * 2016-05-31 2016-08-17 苏州朗捷通智能科技有限公司 一种公交客流数据采集及起讫点的分析方法及系统

Also Published As

Publication number Publication date
CN106297288A (zh) 2017-01-04

Similar Documents

Publication Publication Date Title
CN106297288B (zh) 一种公交乘客客流数据采集与分析方法
CN107845259B (zh) 公交运行情况实时反馈系统及公交实时运行数据处理方法
CN107767669B (zh) 基于WiFi和蓝牙识别的公交线路客流OD估计方法
CN107798869B (zh) 基于站点WiFi和车载GPS的公交乘客客流采集与分析方法
CN104217592B (zh) 人流量统计方法、设备及系统
CN111091720B (zh) 基于信令数据和浮动车数据的拥堵路段识别方法及装置
CN104200667B (zh) 一种基于手机信号数据的交通拥堵分级检测方法
CN104376729B (zh) 一种基于车车通信的高速公路对向车道拥塞提示方法
CN110298516B (zh) 一种基于客流od数据的拆分过长公交线路的方法、装置、移动端设备及服务器
CN110516866B (zh) 一种用于城市轨交列车拥挤度的实时估计方法
CN111882867A (zh) 一种基于物联网的城市智慧交通预警系统
CN107240289A (zh) 一种公交车线路优化管理方法及系统
CN110969861B (zh) 一种车辆识别方法、装置、设备及计算机存储介质
Pascale et al. Motorway speed pattern identification from floating vehicle data for freight applications
Kianfar et al. Placement of roadside equipment in connected vehicle environment for travel time estimation
CN112770278B (zh) 手机信令分析方法、装置、计算机设备及存储介质
CN111161534A (zh) 一种基于WiFi探针的公交精准OD数据的采集系统及方法
CN105096584A (zh) 一种交通决策支持方法、装置及系统
CN108665084B (zh) 一种对驾驶风险的预测方法及系统
Li et al. A feature-based approach to large-scale freeway congestion detection using full cellular activity data
CN208673523U (zh) 公共交通车辆发车间隔控制装置
KR101112191B1 (ko) 에이전트 기반 실시간 통행시간 산정장치 및 그 방법
Bánhalmi et al. Extracting information from Wi-fi traffic on public transport
CN111931968B (zh) 一种应用手机gps数据来优化公共自行车站点布局的方法
CN111586654B (zh) 基于蓝牙嗅探装置检测地铁上下车客流量的方法及其应用

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant