CN108257385B - 一种基于公共交通的异常事件的甄别方法 - Google Patents

一种基于公共交通的异常事件的甄别方法 Download PDF

Info

Publication number
CN108257385B
CN108257385B CN201810222646.2A CN201810222646A CN108257385B CN 108257385 B CN108257385 B CN 108257385B CN 201810222646 A CN201810222646 A CN 201810222646A CN 108257385 B CN108257385 B CN 108257385B
Authority
CN
China
Prior art keywords
time
abnormal
space
diffusion
state
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810222646.2A
Other languages
English (en)
Other versions
CN108257385A (zh
Inventor
王立春
王文婷
张勇
赵霞
刘浩
尹宝才
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing University of Technology
Original Assignee
Beijing University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing University of Technology filed Critical Beijing University of Technology
Priority to CN201810222646.2A priority Critical patent/CN108257385B/zh
Publication of CN108257385A publication Critical patent/CN108257385A/zh
Application granted granted Critical
Publication of CN108257385B publication Critical patent/CN108257385B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • G08G1/0104Measuring and analyzing of parameters relative to traffic conditions
    • G08G1/0137Measuring and analyzing of parameters relative to traffic conditions for specific applications
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/29Graphical models, e.g. Bayesian networks
    • G06F18/295Markov models or related models, e.g. semi-Markov models; Markov random fields; Networks embedding Markov models

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Train Traffic Observation, Control, And Security (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开一种基于公共交通的异常事件的甄别方法,包括:步骤S1、相关数据集的构造,所述数据集是公交和地铁刷卡数据;步骤S2、基于隐马尔科夫链的站点异常状态的识别;步骤S3:基于时空扩散模型的异常事件的甄别。采用本发明的技术方案、可以挖掘出异常事件的扩散模式和发生区域。

Description

一种基于公共交通的异常事件的甄别方法
技术领域
本发明属于交通检测的技术领域,尤其涉及一种基于公共交通的异常事件的甄别方法。
背景技术
近年来,随着交通一卡通的普及,以及计算机科学技术的发展,城市的行人出行数据被大量的采集。在这种情况下,对于行人出行行为的研究,进入了大数据的时代。通过对一卡通数据的分析,本发明可以更深一步的了解行人出行行为的规律,结合交通部门的其他大数据,可以通过某些方法研究乘客的行为,从而为城市安全管理部门提供决策帮助。由于公交一卡通的使用量巨大,覆盖了绝大部分出行人员,所以克服了传统调查问卷方式的众多缺点,结果更加接近真实的出行行为。
北京交通一卡通大数据对了解站点的流量模式和城市的动态非常有价值,但是目前还没有根据交通一卡通大数据,甄别站点流量的异常,找出流量变化大的站点。
发明内容
公交和地铁是人们出行的重要出行工具,北京城市一卡通记录了乘客的上下车时间、站点等出行信息,对研究城市的动态很有价值。本发明旨在发现公交和地铁站点流量的异常状态,使用时空扩散算法挖掘出异常事件的发生。并研究异常通过站点的连接关系进行时空扩散的模式。
本发明提供一种基于公交和地铁刷卡数据的异常事件的甄别方法,使用隐马尔科夫链和时空扩散模型的异常事件识别,根据站点的流量特点,提出改进的隐马尔科夫链来甄别站点流量的异常,找出流量变化大的站点,针对这些异常状态的站点扩散检测,这些站点的异常状态可能是拥堵、大型活动的举办、或者是恶劣天气等造成的。检测异常状态在站点之间的扩散(这种扩散可能是空间、时间、也可能是时空两方面的)能帮助了解事件的发生过程、站点之间的时空关系。
为实现上述目的,本发明采用如下的技术方案:
一种基于公共交通的异常事件的甄别方法,包括以下步骤:
步骤S1、相关数据集的构造
构造乘客出行的出行链、构造站点流量序列、构造站点的流量等级序列、取部分天数构造流量等级集合L、建立站点之间的拓扑连接关系;
步骤S2、基于隐马尔科夫链的站点异常状态的识别
建立的隐马尔科夫模型异常检测的状态空间只包含两个状态,采用0表示正常状态,采用1表示异常状态,观测概率矩阵是一个2×11的矩阵,其中,2代表隐状态0或1,11表示流量等级的个数,定义站点si在d天的时间t的观测概率矩阵是Bt=[bi,j]N×M,N=2,M=11:
Figure BDA0001600400020000011
矩阵的每一行满足条件
Figure BDA0001600400020000012
且0≤bi,j≤1其中i=0,1,
形成观测概率矩阵的思路是:si在t时刻的流量等级ot与si.Lt中的所有元素差值和越大则状态为异常的概率越大。相反,差值和越小则状态为异常的概率越小,观测概率矩阵的每个元素定义为:
Figure BDA0001600400020000021
其中,Lt.pj是Lt中流量等级j的频数。
最后使用维特比算法计算隐状态序列,最终得到站点si的上车和下车流量等级异常的时间段。
步骤S3:基于时空扩散模型的异常事件的甄别
从上面步骤筛选出各个站点中上车或下车流量的等级序列的状态值为1的时间段定义为异常时空点,设d天时站点si的时空异常点为set(ANOMi,t),其中,i表示站点编号,t表示时间点,即在d天的时刻t,si的流量监测为异常,
站点之间通过公交或者地铁线路相连,假设异常也是通过线路之间传播或体现出来的,定义扩散包括空间和时间的扩散,扩散的规则如下:即在空间上与si相邻的点是sm,smi,sm″。对于si本发明可以认为si可以t时刻空间相邻的点扩散,也可以向t+1时刻的的si,sm,smi,sm″扩散。同理,t+1时刻的si可以向同时刻的sm,smi,sm″,也可向t+2时刻的si,sm,smi,sm″扩散,以此类推。
附图说明
图1为乘客出行的出行链的结构示意图;
图2为站点流量序列的结构示意图;
图3为流量等级集合的结构示意图;
图4为隐马尔科夫模型的结构示意图;
图5为时空扩散的结构示意图。
具体实施方式
本发明提供一种基于公共交通的异常事件的甄别方法,包括以下步骤:
步骤1.相关数据集的构造
(1)构造乘客出行的出行链。根据乘客IC刷卡数据得到出行链,有下列字段:乘客卡号、进站站点编号、出站站点编号、进站时间、出站时间、换乘次数,如图1所示。
(2)构造站点流量序列。站点表示为si(i=1,2,…NUM),将第d(d=1,2,…M)天分成N个时间段,时间间隔为10分钟,即每天有N=144个时间段。统计每个时间段内的上下车流量,si.fad,t,si.fad,t分别表示站点si在d天时的第t个时间段内上车流量和下车流量。其中N=144,M=28,NUM=4145,如图2所示。
(3)构造站点的流量等级序列。si在d天的第t时间段的上车流量si.fad,t,,下车流量si.fad,t。将站点的si,fαd,t、si.fad,t,分别并将其归一化后离散化为11个等级Levels={0,1,…10}。定义si在d天中的上车流量等级序列为si.OAd={oi∈Levels|i=1,2,...,N},上车流量等级序列为si.OBd={oi∈Levels|i=1,2,...,N}。
(4)取部分天数构造流量等级集合L。本发明有一个月共28天的数据。将前两周的数据取出,检测后两周的异常状态。在此本发明以工作日为例,28天中工作日为1~5,8~12,15~19,22~26,取前10个工作日(1~5,9~12),统计10天在相同时刻t的各流量等级,前十个工作日称为非检验天数,剩余工作日称为检验天数。站点si在时间段t的上车流量等级集合Lt={mj∈Levels|j=1,2,...,10},如图3所示。
(5)建立站点之间的拓扑连接关系。通过各条公交线路或地铁线路站点与其他站点直接相连,与站点si有连接关系的站点的集合表示为Ri={sj|si直接相连于sj,j∈{1,2,NUM}}。
步骤2、基于隐马尔科夫链的异常状态的甄别
研究发现相同站点在各天(以工作日为例)的流量等级呈现出周期性。根据日周期性的特点,本发明假设站点si在时间段t的流量等级相似于站点si非检验天数中相同时段的流量等级。本发明定义的观测概率矩阵不同于传统的隐马尔科夫链中的观测概率矩阵,它是一个随时间段t变化的矩阵。建立的隐马尔科夫模型异常检测的状态空间只包含两个状态。为了表达方便,本发明用0表示正常状态,用1表示异常状态。观测概率矩阵是一个2×11的矩阵,其中2代表隐状态0或1,11表示流量等级的个数。定义站点si在d天的时间t的观测概率矩阵是Bt=[bi,j]N×M,N=2,M=11:
Figure BDA0001600400020000041
矩阵的每一行满足条件
Figure BDA0001600400020000042
且0≤bi,j≤1其中i=0,1。
形成观测概率矩阵的思路是:si在t时刻的流量等级ot与si.Lt中的所有元素差值和越大则状态为异常的概率越大。相反,差值和越小则状态为异常的概率越小。观测概率矩阵的每个元素定义为:
Figure BDA0001600400020000043
其中Lt.pj是Lt中流量等级j的频数。
建立的隐马尔科夫模型中,观测序列是站点si上下车流量序列si.OAd,si.OBd。每次的观测值都有可能属于正常状态,也可能属于异常状态,如图4所示。
以流量序列si.OAd为例,建立的隐马尔科夫模型如下:
1.状态空间Φ={0,1},用0表示正常状态,1表示异常状态,状态数N=2;
2.观测序列O(t)=si.OAd
3.状态转移概率分布:
Figure BDA0001600400020000044
其中ai,j=P{下一步处于状态j|当前处于状态i},i,j∈Φ。本发明设
Figure BDA0001600400020000045
4.观测概率矩阵:站点si在d天的时间t的观测概率矩阵是Bt=[bi,j]N×M,N=2,M=11。
5.初始状态分布:π={π01},πi=P{第一步处于状态i},i∈Φ;
对于给定的观测序列O(t),t=1,2…T,和模型λ=(A,B,π),计算其隐状态序列,即找出一个序列使P{0|λ}最大化,本发明采用维特比算法计算隐状态序列,最终得到站点si的上车和下车流量等级异常的时间段。
步骤3、基于时空扩散模型的异常事件甄别
从上面步骤筛选出各个站点中上车或下车流量的等级序列的状态值为1的时间段定义为异常时空点,设d天时站点si的时空异常点为set(ANOMi,t),其中i表示站点编号,t表示时间点,即在d天的时刻t,si的流量监测为异常。
站点之间通过公交或者地铁线路相连,假设异常也是通过线路之间传播或体现出来的。定义扩散包括空间和时间的扩散,扩散的规则如下:即在空间上与si相邻的点是sm,sm′,sm″。对于si可以认为si可以t时刻空间相邻的点扩散,也可以向t+1时刻的的si,sm,sm′,sm″扩散,同理,t+1时刻的si可以向同时刻的sm,sm',sm″,也可向t+2时刻的si,sm,sm',sm″扩散,以此类推。如图5所示。
采用时空扩散算法来检测异常点的扩散行为,具体为:首先,给每个时空异常点ANOMi,t赋一个flag变量,变量初始为0,表示未被访问;依次遍历时间段为n时的每个时空异常点,对于每个时空异常点找出空间上直接或间接相连的时空异常点,检测在n+1时间段是否存在与这些异常点时间连接的异常点,若是存在,则继续进行按照以上提到的规则做时空扩散检验;若是不存在则输出这个异常点集合。
时空扩散算法步骤:
Figure BDA0001600400020000051
Figure BDA0001600400020000061
时空扩散算法在检验不同事件导致的异常时,各自的优点在于:
1)拥堵事件。此算法能确定拥堵影响的路段、范围,能够推测出拥堵的过程。
2)聚集事件。能有效的检测出聚集事件发生的规模、聚集时涉及到的站点、和聚集人群逗留的时间。

Claims (2)

1.一种基于公共交通的异常事件的甄别方法,其特征在于,包括以下步骤:
步骤S1、相关数据集的构造
构造乘客出行的出行链、构造站点流量序列、构造站点的流量等级序列、取部分天数构造流量等级集合L、建立站点之间的拓扑连接关系;
步骤S2、基于隐马尔科夫链的站点异常状态的识别
建立的隐马尔科夫模型异常检测的状态空间只包含两个状态,采用0表示正常状态,采用1表示异常状态,观测概率矩阵是一个2×11的矩阵,其中,2代表隐状态0或1,11表示流量等级的个数,定义站点si在d天的时间t的观测概率矩阵是Bt=[bi,j]N×M,N=2,M=11:
Figure FDA0002846868560000011
矩阵的每一行满足条件
Figure FDA0002846868560000012
且0≤bi,j≤1其中i=0,1,
所述观测概率矩阵的每个元素定义为:
Figure FDA0002846868560000013
其中,Lt.pj是Lt中流量等级j的频数;
最后使用维特比算法计算隐状态序列,最终得到站点si各时间段的01状态序列;
步骤S3:基于时空扩散模型的异常事件的甄别
从上面步骤筛选出各个站点中上车或下车流量的等级序列的状态值为1的时间段定义为异常时空点,设d天时站点si的时空异常点为set(ANOMi,t),其中,i表示站点编号,t表示时间点,即在d天的时刻t,si的流量监测为异常;
采用时空扩散算法来检测异常点的扩散行为,具体为:首先,给每个时空异常点ANOMi,t赋一个flag变量,变量初始为0,表示未被访问;依次遍历时间段为n时的每个时空异常点,对于每个时空异常点找出空间上直接或间接相连的时空异常点,检测在n+1时间段是否存在与这些异常点时间连接的异常点,若是存在,则继续进行时空扩散检验;若是不存在则输出这个异常点集合。
2.如权利要求1所述的基于公共交通的异常事件的甄别方法,其特征在于,步骤3中站点之间通过公交或者地铁线路相连,异常也是通过线路之间传播或体现出来的,定义扩散包括空间和时间的扩散,扩散的规则如下:即在空间上与si相邻的点是sm,sm′,sm″;对于si可以认为si可以t时刻空间相邻的点扩散,也可以向t+1时刻的的si,sm,sm′,sm″扩散,同理,t+1时刻的si可以向同时刻的sm,sm′,sm″,也可向t+2时刻的si,sm,sm′,sm″扩散,以此类推。
CN201810222646.2A 2018-03-19 2018-03-19 一种基于公共交通的异常事件的甄别方法 Active CN108257385B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810222646.2A CN108257385B (zh) 2018-03-19 2018-03-19 一种基于公共交通的异常事件的甄别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810222646.2A CN108257385B (zh) 2018-03-19 2018-03-19 一种基于公共交通的异常事件的甄别方法

Publications (2)

Publication Number Publication Date
CN108257385A CN108257385A (zh) 2018-07-06
CN108257385B true CN108257385B (zh) 2021-03-16

Family

ID=62747130

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810222646.2A Active CN108257385B (zh) 2018-03-19 2018-03-19 一种基于公共交通的异常事件的甄别方法

Country Status (1)

Country Link
CN (1) CN108257385B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111476177B (zh) * 2020-04-10 2023-08-18 科航(苏州)信息科技有限公司 嫌疑人检测方法及装置
CN112347906B (zh) * 2020-11-04 2023-06-27 北方工业大学 公交车内异常聚集行为的检测方法
CN112434564B (zh) * 2020-11-04 2023-06-27 北方工业大学 公交车内异常聚集行为的检测系统
CN114021632B (zh) * 2021-10-28 2023-09-12 国网安徽省电力有限公司营销服务中心 一种基于马尔科夫链的实验室用电测量设备测试策略评价方法、电子设备及存储介质

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101405679B1 (ko) * 2011-10-11 2014-06-13 현대자동차주식회사 차량 위치 정보 기반 비정상 운전 판정 및 경보 시스템
CN102881162B (zh) * 2012-09-29 2015-03-11 北京市交通信息中心 大规模交通信息的数据处理及融合方法
CN106919953B (zh) * 2017-02-23 2021-03-16 北京工业大学 一种基于轨道交通数据分析的异常出行群体识别方法
CN107123265B (zh) * 2017-06-12 2020-01-10 东南大学 一种基于并行计算的高速公路交通状态估计方法

Also Published As

Publication number Publication date
CN108257385A (zh) 2018-07-06

Similar Documents

Publication Publication Date Title
CN108257385B (zh) 一种基于公共交通的异常事件的甄别方法
CN107610469B (zh) 一种考虑多因素影响的日维度区域交通指数预测方法
Hoseinzadeh et al. Quality of location-based crowdsourced speed data on surface streets: A case study of Waze and Bluetooth speed data in Sevierville, TN
Coifman Vehicle re-identification and travel time measurement in real-time on freeways using existing loop detector infrastructure
Kuang et al. Detecting traffic anomalies in urban areas using taxi GPS data
Cui et al. Identifying mismatch between urban travel demand and transport network services using GPS data: A case study in the fast growing Chinese city of Harbin
CN102521965B (zh) 基于车牌识别数据的交通需求管理措施效果评价方法
Xie et al. Spatial analysis of highway incident durations in the context of Hurricane Sandy
CN104778245A (zh) 基于海量车牌识别数据的相似轨迹挖掘方法及装置
CN111076096B (zh) 燃气管网泄漏识别方法和装置
Kong et al. Huad: Hierarchical urban anomaly detection based on spatio-temporal data
Shi et al. Detecting anomalies in spatio-temporal flow data by constructing dynamic neighbourhoods
Zhang et al. Vulnerability assessment and visualization of large-scale bus transit network under route service disruption
Zhu et al. Spatio-temporal point processes with attention for traffic congestion event modeling
Ou et al. A data‐driven approach to determining freeway incident impact areas with fuzzy and graph theory‐based clustering
Al-Dogom et al. Spatio-temporal analysis and machine learning for traffic accidents prediction
Sun et al. Floating Car Data mining: Identifying vehicle types on the basis of daily usage patterns
Wei et al. Turn-level network traffic bottleneck identification using vehicle trajectory data
CN116631195B (zh) 一种基于城市子区域热点路口挖掘的区域异常检测方法
Kwee et al. Traffic-cascade: Mining and visualizing lifecycles of traffic congestion events using public bus trajectories
Kaur et al. Analyzing and displaying of crime hotspots using fuzzy mapping method
CN117251722A (zh) 一种基于大数据的智慧交通管理系统
CN111931974A (zh) 排水管网资产评估、故障预测和管养决策的方法和平台
CN117275215A (zh) 一种基于图过程神经网络的城市道路拥堵时空预测方法
CN116434361A (zh) 一种基于etc交易数据的高速公路拥堵识别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant