CN108257385B - 一种基于公共交通的异常事件的甄别方法 - Google Patents
一种基于公共交通的异常事件的甄别方法 Download PDFInfo
- Publication number
- CN108257385B CN108257385B CN201810222646.2A CN201810222646A CN108257385B CN 108257385 B CN108257385 B CN 108257385B CN 201810222646 A CN201810222646 A CN 201810222646A CN 108257385 B CN108257385 B CN 108257385B
- Authority
- CN
- China
- Prior art keywords
- time
- abnormal
- space
- diffusion
- state
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G1/00—Traffic control systems for road vehicles
- G08G1/01—Detecting movement of traffic to be counted or controlled
- G08G1/0104—Measuring and analyzing of parameters relative to traffic conditions
- G08G1/0137—Measuring and analyzing of parameters relative to traffic conditions for specific applications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/29—Graphical models, e.g. Bayesian networks
- G06F18/295—Markov models or related models, e.g. semi-Markov models; Markov random fields; Networks embedding Markov models
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Analytical Chemistry (AREA)
- Train Traffic Observation, Control, And Security (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开一种基于公共交通的异常事件的甄别方法,包括:步骤S1、相关数据集的构造,所述数据集是公交和地铁刷卡数据;步骤S2、基于隐马尔科夫链的站点异常状态的识别;步骤S3:基于时空扩散模型的异常事件的甄别。采用本发明的技术方案、可以挖掘出异常事件的扩散模式和发生区域。
Description
技术领域
本发明属于交通检测的技术领域,尤其涉及一种基于公共交通的异常事件的甄别方法。
背景技术
近年来,随着交通一卡通的普及,以及计算机科学技术的发展,城市的行人出行数据被大量的采集。在这种情况下,对于行人出行行为的研究,进入了大数据的时代。通过对一卡通数据的分析,本发明可以更深一步的了解行人出行行为的规律,结合交通部门的其他大数据,可以通过某些方法研究乘客的行为,从而为城市安全管理部门提供决策帮助。由于公交一卡通的使用量巨大,覆盖了绝大部分出行人员,所以克服了传统调查问卷方式的众多缺点,结果更加接近真实的出行行为。
北京交通一卡通大数据对了解站点的流量模式和城市的动态非常有价值,但是目前还没有根据交通一卡通大数据,甄别站点流量的异常,找出流量变化大的站点。
发明内容
公交和地铁是人们出行的重要出行工具,北京城市一卡通记录了乘客的上下车时间、站点等出行信息,对研究城市的动态很有价值。本发明旨在发现公交和地铁站点流量的异常状态,使用时空扩散算法挖掘出异常事件的发生。并研究异常通过站点的连接关系进行时空扩散的模式。
本发明提供一种基于公交和地铁刷卡数据的异常事件的甄别方法,使用隐马尔科夫链和时空扩散模型的异常事件识别,根据站点的流量特点,提出改进的隐马尔科夫链来甄别站点流量的异常,找出流量变化大的站点,针对这些异常状态的站点扩散检测,这些站点的异常状态可能是拥堵、大型活动的举办、或者是恶劣天气等造成的。检测异常状态在站点之间的扩散(这种扩散可能是空间、时间、也可能是时空两方面的)能帮助了解事件的发生过程、站点之间的时空关系。
为实现上述目的,本发明采用如下的技术方案:
一种基于公共交通的异常事件的甄别方法,包括以下步骤:
步骤S1、相关数据集的构造
构造乘客出行的出行链、构造站点流量序列、构造站点的流量等级序列、取部分天数构造流量等级集合L、建立站点之间的拓扑连接关系;
步骤S2、基于隐马尔科夫链的站点异常状态的识别
建立的隐马尔科夫模型异常检测的状态空间只包含两个状态,采用0表示正常状态,采用1表示异常状态,观测概率矩阵是一个2×11的矩阵,其中,2代表隐状态0或1,11表示流量等级的个数,定义站点si在d天的时间t的观测概率矩阵是Bt=[bi,j]N×M,N=2,M=11:
形成观测概率矩阵的思路是:si在t时刻的流量等级ot与si.Lt中的所有元素差值和越大则状态为异常的概率越大。相反,差值和越小则状态为异常的概率越小,观测概率矩阵的每个元素定义为:
其中,Lt.pj是Lt中流量等级j的频数。
最后使用维特比算法计算隐状态序列,最终得到站点si的上车和下车流量等级异常的时间段。
步骤S3:基于时空扩散模型的异常事件的甄别
从上面步骤筛选出各个站点中上车或下车流量的等级序列的状态值为1的时间段定义为异常时空点,设d天时站点si的时空异常点为set(ANOMi,t),其中,i表示站点编号,t表示时间点,即在d天的时刻t,si的流量监测为异常,
站点之间通过公交或者地铁线路相连,假设异常也是通过线路之间传播或体现出来的,定义扩散包括空间和时间的扩散,扩散的规则如下:即在空间上与si相邻的点是sm,smi,sm″。对于si本发明可以认为si可以t时刻空间相邻的点扩散,也可以向t+1时刻的的si,sm,smi,sm″扩散。同理,t+1时刻的si可以向同时刻的sm,smi,sm″,也可向t+2时刻的si,sm,smi,sm″扩散,以此类推。
附图说明
图1为乘客出行的出行链的结构示意图;
图2为站点流量序列的结构示意图;
图3为流量等级集合的结构示意图;
图4为隐马尔科夫模型的结构示意图;
图5为时空扩散的结构示意图。
具体实施方式
本发明提供一种基于公共交通的异常事件的甄别方法,包括以下步骤:
步骤1.相关数据集的构造
(1)构造乘客出行的出行链。根据乘客IC刷卡数据得到出行链,有下列字段:乘客卡号、进站站点编号、出站站点编号、进站时间、出站时间、换乘次数,如图1所示。
(2)构造站点流量序列。站点表示为si(i=1,2,…NUM),将第d(d=1,2,…M)天分成N个时间段,时间间隔为10分钟,即每天有N=144个时间段。统计每个时间段内的上下车流量,si.fad,t,si.fad,t分别表示站点si在d天时的第t个时间段内上车流量和下车流量。其中N=144,M=28,NUM=4145,如图2所示。
(3)构造站点的流量等级序列。si在d天的第t时间段的上车流量si.fad,t,,下车流量si.fad,t。将站点的si,fαd,t、si.fad,t,分别并将其归一化后离散化为11个等级Levels={0,1,…10}。定义si在d天中的上车流量等级序列为si.OAd={oi∈Levels|i=1,2,...,N},上车流量等级序列为si.OBd={oi∈Levels|i=1,2,...,N}。
(4)取部分天数构造流量等级集合L。本发明有一个月共28天的数据。将前两周的数据取出,检测后两周的异常状态。在此本发明以工作日为例,28天中工作日为1~5,8~12,15~19,22~26,取前10个工作日(1~5,9~12),统计10天在相同时刻t的各流量等级,前十个工作日称为非检验天数,剩余工作日称为检验天数。站点si在时间段t的上车流量等级集合Lt={mj∈Levels|j=1,2,...,10},如图3所示。
(5)建立站点之间的拓扑连接关系。通过各条公交线路或地铁线路站点与其他站点直接相连,与站点si有连接关系的站点的集合表示为Ri={sj|si直接相连于sj,j∈{1,2,NUM}}。
步骤2、基于隐马尔科夫链的异常状态的甄别
研究发现相同站点在各天(以工作日为例)的流量等级呈现出周期性。根据日周期性的特点,本发明假设站点si在时间段t的流量等级相似于站点si非检验天数中相同时段的流量等级。本发明定义的观测概率矩阵不同于传统的隐马尔科夫链中的观测概率矩阵,它是一个随时间段t变化的矩阵。建立的隐马尔科夫模型异常检测的状态空间只包含两个状态。为了表达方便,本发明用0表示正常状态,用1表示异常状态。观测概率矩阵是一个2×11的矩阵,其中2代表隐状态0或1,11表示流量等级的个数。定义站点si在d天的时间t的观测概率矩阵是Bt=[bi,j]N×M,N=2,M=11:
形成观测概率矩阵的思路是:si在t时刻的流量等级ot与si.Lt中的所有元素差值和越大则状态为异常的概率越大。相反,差值和越小则状态为异常的概率越小。观测概率矩阵的每个元素定义为:
其中Lt.pj是Lt中流量等级j的频数。
建立的隐马尔科夫模型中,观测序列是站点si上下车流量序列si.OAd,si.OBd。每次的观测值都有可能属于正常状态,也可能属于异常状态,如图4所示。
以流量序列si.OAd为例,建立的隐马尔科夫模型如下:
1.状态空间Φ={0,1},用0表示正常状态,1表示异常状态,状态数N=2;
2.观测序列O(t)=si.OAd;
4.观测概率矩阵:站点si在d天的时间t的观测概率矩阵是Bt=[bi,j]N×M,N=2,M=11。
5.初始状态分布:π={π0,π1},πi=P{第一步处于状态i},i∈Φ;
对于给定的观测序列O(t),t=1,2…T,和模型λ=(A,B,π),计算其隐状态序列,即找出一个序列使P{0|λ}最大化,本发明采用维特比算法计算隐状态序列,最终得到站点si的上车和下车流量等级异常的时间段。
步骤3、基于时空扩散模型的异常事件甄别
从上面步骤筛选出各个站点中上车或下车流量的等级序列的状态值为1的时间段定义为异常时空点,设d天时站点si的时空异常点为set(ANOMi,t),其中i表示站点编号,t表示时间点,即在d天的时刻t,si的流量监测为异常。
站点之间通过公交或者地铁线路相连,假设异常也是通过线路之间传播或体现出来的。定义扩散包括空间和时间的扩散,扩散的规则如下:即在空间上与si相邻的点是sm,sm′,sm″。对于si可以认为si可以t时刻空间相邻的点扩散,也可以向t+1时刻的的si,sm,sm′,sm″扩散,同理,t+1时刻的si可以向同时刻的sm,sm',sm″,也可向t+2时刻的si,sm,sm',sm″扩散,以此类推。如图5所示。
采用时空扩散算法来检测异常点的扩散行为,具体为:首先,给每个时空异常点ANOMi,t赋一个flag变量,变量初始为0,表示未被访问;依次遍历时间段为n时的每个时空异常点,对于每个时空异常点找出空间上直接或间接相连的时空异常点,检测在n+1时间段是否存在与这些异常点时间连接的异常点,若是存在,则继续进行按照以上提到的规则做时空扩散检验;若是不存在则输出这个异常点集合。
时空扩散算法步骤:
时空扩散算法在检验不同事件导致的异常时,各自的优点在于:
1)拥堵事件。此算法能确定拥堵影响的路段、范围,能够推测出拥堵的过程。
2)聚集事件。能有效的检测出聚集事件发生的规模、聚集时涉及到的站点、和聚集人群逗留的时间。
Claims (2)
1.一种基于公共交通的异常事件的甄别方法,其特征在于,包括以下步骤:
步骤S1、相关数据集的构造
构造乘客出行的出行链、构造站点流量序列、构造站点的流量等级序列、取部分天数构造流量等级集合L、建立站点之间的拓扑连接关系;
步骤S2、基于隐马尔科夫链的站点异常状态的识别
建立的隐马尔科夫模型异常检测的状态空间只包含两个状态,采用0表示正常状态,采用1表示异常状态,观测概率矩阵是一个2×11的矩阵,其中,2代表隐状态0或1,11表示流量等级的个数,定义站点si在d天的时间t的观测概率矩阵是Bt=[bi,j]N×M,N=2,M=11:
所述观测概率矩阵的每个元素定义为:
其中,Lt.pj是Lt中流量等级j的频数;
最后使用维特比算法计算隐状态序列,最终得到站点si各时间段的01状态序列;
步骤S3:基于时空扩散模型的异常事件的甄别
从上面步骤筛选出各个站点中上车或下车流量的等级序列的状态值为1的时间段定义为异常时空点,设d天时站点si的时空异常点为set(ANOMi,t),其中,i表示站点编号,t表示时间点,即在d天的时刻t,si的流量监测为异常;
采用时空扩散算法来检测异常点的扩散行为,具体为:首先,给每个时空异常点ANOMi,t赋一个flag变量,变量初始为0,表示未被访问;依次遍历时间段为n时的每个时空异常点,对于每个时空异常点找出空间上直接或间接相连的时空异常点,检测在n+1时间段是否存在与这些异常点时间连接的异常点,若是存在,则继续进行时空扩散检验;若是不存在则输出这个异常点集合。
2.如权利要求1所述的基于公共交通的异常事件的甄别方法,其特征在于,步骤3中站点之间通过公交或者地铁线路相连,异常也是通过线路之间传播或体现出来的,定义扩散包括空间和时间的扩散,扩散的规则如下:即在空间上与si相邻的点是sm,sm′,sm″;对于si可以认为si可以t时刻空间相邻的点扩散,也可以向t+1时刻的的si,sm,sm′,sm″扩散,同理,t+1时刻的si可以向同时刻的sm,sm′,sm″,也可向t+2时刻的si,sm,sm′,sm″扩散,以此类推。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810222646.2A CN108257385B (zh) | 2018-03-19 | 2018-03-19 | 一种基于公共交通的异常事件的甄别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810222646.2A CN108257385B (zh) | 2018-03-19 | 2018-03-19 | 一种基于公共交通的异常事件的甄别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108257385A CN108257385A (zh) | 2018-07-06 |
CN108257385B true CN108257385B (zh) | 2021-03-16 |
Family
ID=62747130
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810222646.2A Active CN108257385B (zh) | 2018-03-19 | 2018-03-19 | 一种基于公共交通的异常事件的甄别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108257385B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111476177B (zh) * | 2020-04-10 | 2023-08-18 | 科航(苏州)信息科技有限公司 | 嫌疑人检测方法及装置 |
CN112347906B (zh) * | 2020-11-04 | 2023-06-27 | 北方工业大学 | 公交车内异常聚集行为的检测方法 |
CN112434564B (zh) * | 2020-11-04 | 2023-06-27 | 北方工业大学 | 公交车内异常聚集行为的检测系统 |
CN114021632B (zh) * | 2021-10-28 | 2023-09-12 | 国网安徽省电力有限公司营销服务中心 | 一种基于马尔科夫链的实验室用电测量设备测试策略评价方法、电子设备及存储介质 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101405679B1 (ko) * | 2011-10-11 | 2014-06-13 | 현대자동차주식회사 | 차량 위치 정보 기반 비정상 운전 판정 및 경보 시스템 |
CN102881162B (zh) * | 2012-09-29 | 2015-03-11 | 北京市交通信息中心 | 大规模交通信息的数据处理及融合方法 |
CN106919953B (zh) * | 2017-02-23 | 2021-03-16 | 北京工业大学 | 一种基于轨道交通数据分析的异常出行群体识别方法 |
CN107123265B (zh) * | 2017-06-12 | 2020-01-10 | 东南大学 | 一种基于并行计算的高速公路交通状态估计方法 |
-
2018
- 2018-03-19 CN CN201810222646.2A patent/CN108257385B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN108257385A (zh) | 2018-07-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108257385B (zh) | 一种基于公共交通的异常事件的甄别方法 | |
CN107610469B (zh) | 一种考虑多因素影响的日维度区域交通指数预测方法 | |
Hoseinzadeh et al. | Quality of location-based crowdsourced speed data on surface streets: A case study of Waze and Bluetooth speed data in Sevierville, TN | |
Coifman | Vehicle re-identification and travel time measurement in real-time on freeways using existing loop detector infrastructure | |
Kuang et al. | Detecting traffic anomalies in urban areas using taxi GPS data | |
Cui et al. | Identifying mismatch between urban travel demand and transport network services using GPS data: A case study in the fast growing Chinese city of Harbin | |
CN102521965B (zh) | 基于车牌识别数据的交通需求管理措施效果评价方法 | |
Xie et al. | Spatial analysis of highway incident durations in the context of Hurricane Sandy | |
CN104778245A (zh) | 基于海量车牌识别数据的相似轨迹挖掘方法及装置 | |
CN111076096B (zh) | 燃气管网泄漏识别方法和装置 | |
Kong et al. | Huad: Hierarchical urban anomaly detection based on spatio-temporal data | |
Shi et al. | Detecting anomalies in spatio-temporal flow data by constructing dynamic neighbourhoods | |
Zhang et al. | Vulnerability assessment and visualization of large-scale bus transit network under route service disruption | |
Zhu et al. | Spatio-temporal point processes with attention for traffic congestion event modeling | |
Ou et al. | A data‐driven approach to determining freeway incident impact areas with fuzzy and graph theory‐based clustering | |
Al-Dogom et al. | Spatio-temporal analysis and machine learning for traffic accidents prediction | |
Sun et al. | Floating Car Data mining: Identifying vehicle types on the basis of daily usage patterns | |
Wei et al. | Turn-level network traffic bottleneck identification using vehicle trajectory data | |
CN116631195B (zh) | 一种基于城市子区域热点路口挖掘的区域异常检测方法 | |
Kwee et al. | Traffic-cascade: Mining and visualizing lifecycles of traffic congestion events using public bus trajectories | |
Kaur et al. | Analyzing and displaying of crime hotspots using fuzzy mapping method | |
CN117251722A (zh) | 一种基于大数据的智慧交通管理系统 | |
CN111931974A (zh) | 排水管网资产评估、故障预测和管养决策的方法和平台 | |
CN117275215A (zh) | 一种基于图过程神经网络的城市道路拥堵时空预测方法 | |
CN116434361A (zh) | 一种基于etc交易数据的高速公路拥堵识别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |