CN108710637B - 基于时空关系的出租车异常轨迹实时检测方法 - Google Patents
基于时空关系的出租车异常轨迹实时检测方法 Download PDFInfo
- Publication number
- CN108710637B CN108710637B CN201810321282.3A CN201810321282A CN108710637B CN 108710637 B CN108710637 B CN 108710637B CN 201810321282 A CN201810321282 A CN 201810321282A CN 108710637 B CN108710637 B CN 108710637B
- Authority
- CN
- China
- Prior art keywords
- time
- point
- distance
- driving
- track
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000002159 abnormal effect Effects 0.000 title claims abstract description 32
- 238000000034 method Methods 0.000 title claims abstract description 25
- 238000011897 real-time detection Methods 0.000 title claims abstract description 7
- 230000006870 function Effects 0.000 claims description 17
- 230000001186 cumulative effect Effects 0.000 claims description 11
- 238000007476 Maximum Likelihood Methods 0.000 claims description 6
- 239000013598 vector Substances 0.000 claims description 6
- 238000001514 detection method Methods 0.000 description 8
- 230000029305 taxis Effects 0.000 description 4
- 230000008901 benefit Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 239000002904 solvent Substances 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W4/00—Services specially adapted for wireless communication networks; Facilities therefor
- H04W4/02—Services making use of location information
- H04W4/025—Services making use of location information using location based information parameters
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
- G06Q50/265—Personal security, identity or safety
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W4/00—Services specially adapted for wireless communication networks; Facilities therefor
- H04W4/30—Services specially adapted for particular environments, situations or purposes
- H04W4/40—Services specially adapted for particular environments, situations or purposes for vehicles, e.g. vehicle-to-pedestrians [V2P]
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- General Health & Medical Sciences (AREA)
- Strategic Management (AREA)
- Development Economics (AREA)
- Health & Medical Sciences (AREA)
- Economics (AREA)
- Computer Security & Cryptography (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Educational Administration (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Traffic Control Systems (AREA)
- Devices For Checking Fares Or Tickets At Control Points (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供了一种基于时空关系的出租车异常轨迹实时检测方法,包括如下步骤:通过学习训练数据集中出发点到当前点的直线距离与行驶距离和驾驶时间之间的关系,并建立时空模型;通过时空模型计算出当前点到出发点直线距离所对应的行驶距离和驾驶时间的正常范围;判断出租车当前点的行驶距离和驾驶时间是否均超出了正常范围,如果是,则被判定为异常点。本发明通过学习轨迹中的时空关系来对轨迹进行检测,更为通用,所需要的轨迹也相对较少,这样产生的误报也相对较低;本发明在检测异常点时,只需要记录当前的模型的参数即可进行判断,因此相较于现有技术带来的时间和内存更低。
Description
技术领域
本发明涉及机器学习的异常检测技术领域,具体地,涉及一种基于时空关系的出租车异常轨迹实时检测方法。
背景技术
随着GPS技术的发展和普及,大量的出租车轨迹记录被收集和储存。为了促进出租车服务的标准化以及保护乘客的利益,许多检测和分析出租车异常轨迹的新方法被提出。然而,大多数现有的方法通常采用基于计数的策略来区分正常轨迹和异常轨迹,这些方法认为正常的轨迹会被大量的历史轨迹支持,而那些只有很少历史轨迹支持的轨迹被判定为异常的。通过这种策略来检测异常轨迹需要大量的历史轨迹,并且许多正常轨迹也会因为没有大量历史轨迹作支持而被误判定为异常轨迹,因此使用这样的方法会导致较高的误报率。
目前没有发现同本发明类似技术的说明或报道,也尚未收集到国内外类似的资料。
发明内容
针对现有技术中存在的上述不足,本发明的目的是提供一种基于时空关系的出租车异常轨迹实时检测方法,该方法针对当前出租车异常轨迹检测算法误报率较高、所需历史轨迹多的问题,通过相对少的历史轨迹就能产生较低的误报率。
本发明是通过以下技术方案实现的。
一种基于时空关系的出租车异常轨迹实时检测方法,包括如下步骤:
通过学习训练数据集中出发点到当前点的直线距离与行驶距离和驾驶时间之间的关系,并建立时空模型;
通过时空模型计算出当前点到出发点直线距离所对应的行驶距离和驾驶时间的正常范围;
判断出租车当前点的行驶距离和驾驶时间是否均超出了正常范围,如果是,则被判定为异常点。
优选地,所述训练数据集,采用以下方式进行提取:
从轨迹数据库中提取出经过待测轨迹起点和终点的历史轨迹集合,并将历史轨迹集合中行驶距离或者行驶时间小于中位数的轨迹作为正常轨迹集合;
在正常轨迹集合中选择包含出发时间点以及出发时间点前后一小时以内的轨迹集合;
在所选取出来的轨迹集合的基础上,提取出每条轨迹中所有点到起点的直线距离、行驶时间以及行驶距离作为训练数据集。
优选地,建立的时空模型,形式如下:
其中,ddi、dti分别表示训练数据集中第i个点到起点的行驶距离和行驶时间,ldi表示训练数据集中第i个点到起点的直线距离向量,wd、wt分别表示函数(1)、(2)中的参数向量,其中,n为参数的个数,∈d、∈t分别表示服从正态分布的随机变量,σd、σt分别表示上述正态分布中的标准差;
在时空模型当中,采用最大似然估计的方法,确定参数wd、wt、σd以及σt的取值;对于训练数据集中的每个ldi,应当使训练数据集中对应的ddi和dti在时空模型当中的概率最大,即使如下似然函数(3)和(4)的值最大:
其中:Ld、Lt分别表示行驶距离和行驶时间对应的似然函数;
通过似然函数(3)和(4),求wd、wt、σd和σt的偏导,进而确定参数wd、wt、σd和σt的取值:
得到:
其中,LD=[ld1,ld2,…,ldN]T,dd=[dd1,dd2,…,ddN]T,dt=[dt1,dt2,…,dtN]T。
优选地,对异常点判定,包括如下步骤:
计算出租车当前点到出发点的直线距离ldi、行驶路程ddi以及行驶时间dti;
通过关于D和T的概率密度函数,分别计算关于ddi和dti的累积概率,即P(D<ddi)和P(T<dti),其中,累积概率P(D<ddi)和P(T<dti)分别反映了行驶路程ddi和行驶时间dti的大小,记为当前点到出发点直线距离所对应的行驶距离和驾驶时间的正常范围;
设定阈值θd和θt,通过比较累积概率P(D<ddi)与阈值θd以及累积概率P(T<dti)与阈值θt的大小,检测异常点,即,当累积概率P(D<ddi)大于阈值θd并且累积概率P(T<dti)大于阈值θt时,则认为出租车当前点为异常点。
本发明提供的基于时空关系的出租车异常轨迹实时检测方法,基于时空关系,通过学习出发点到当前点的直线距离与行驶距离和驾驶时间之间的关系来建立模型,然后通过模型来计算出当前点到出发点直线距离所对应的行驶距离和驾驶时间的正常范围,如果出租车当前所在点的行驶距离和驾驶时间都超出了正常范围,则被判定为异常点。
与现有技术相比发明具有如下有益效果:
1、通过学习轨迹中的时空关系来对轨迹进行检测,更为通用,所需要的轨迹也相对较少,这样产生的误报也相对较低。
2、传统的方法在进行检测时,需要维护一个工作空间来储存当前出租车经过的轨迹以及历史轨迹集合,并通过两者的比较来判断异常,本发明在检测异常点时,只需要记录当前的模型的参数即可进行判断,因此相较于现有技术带来的时间和内存更低。
附图说明
通过阅读参照以下附图对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1为本发明一实施例的方法流程图。
具体实施方式
下面对本发明的实施例作详细说明:本实施例在以本发明技术方案为前提下进行实施,给出了详细的实施方式和具体的操作过程。应当指出的是,对本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。
实施例
本实施例提供了一种基于时空关系的出租车异常轨迹实时检测方法,包括如下步骤:
通过学习训练数据集中出发点到当前点的直线距离与行驶距离和驾驶时间之间的关系,并建立时空模型;
通过时空模型计算出当前点到出发点直线距离所对应的行驶距离和驾驶时间的正常范围;
判断出租车当前点的行驶距离和驾驶时间是否均超出了正常范围,如果是,则被判定为异常点。
具体地,
一、训练数据集提取:
首先从轨迹数据库中提取出经过待测轨迹起点和终点的历史轨迹集合,把其中行驶距离或者行驶时间小于中位数的轨迹作为正常轨迹集合,另外考虑到时空关系会受到时间点影响,比如上下班高峰时段和夜间时段的时空关系会有一定的差异,为了使训练出来的时空模型更为准确,在正常轨迹集合中选择包含出发时间点及出发时间点前后一小时之内的轨迹集合。在上述所选取出来的轨迹集合的基础上,提取出每条轨迹中所有点到起点的直线距离、行驶时间以及行驶距离作为训练数据集。
二、建立模型
时空模型的形式如下:
其中,ddi、dti分别表示训练集中第i个点到起点的行驶距离和行驶时间,ldi表示训练数据集中第i个点到起点的直线距离向量,wd、wt分别表示函数(1)、(2)中的参数向量,n为参数的个数,∈n、∈t分别表示服从正态分布的随机变量,σd、σt分别表示上述正态分布中的标准差;
在时空模型当中,wd、wt、σd以及σt都是需要确定的参数。为了确定这些参数,本实施例使用最大似然估计的方法,对于训练数据集中的每个ldi,应当使训练数据集中对应的ddi和dti在时空模型当中的概率最大,即使如下似然函数(3)和(4)的值最大。
其中,Ld、Lt分别表示分别表示行驶距离和行驶时间对应的似然函数;
然后通过似然函数(3)和(4)求wd、wt、σd和σt的的偏导,来确定参数wd、wt、σd和σt的的取值。
通过:
得到:
其中LD=[ld1,ld2,…,ldN]T,dd=[dd1,dd2,…,ddN]T,dt=[dt1,dt2,…,dtN]T。
在本实施例中,运用最大似然轨迹法来学习模型的参数;最大似然估计提供了一种给定观察数据来评估模型参数的方法,简单来说,最大似然估计的基本原理就是对于一个有多种可能的事件,我们总是认为,我们看到的那些结果(样本),是该事件概率最大的可能。
三、异常检测
接下来利用学习好的时空模型进行轨迹的异常检测,对于出租车上传的一个当前点(待测点),首先计算出这个点到出发点的直线距离ldi、行驶路程ddi以及行驶时间dti,然后将ldi输入模型,得到一个关于当前点到出发点行驶距离的随机变量以及行驶时间的随机变量由此不难得到关于D和T的概率密度函数,通过这两个概率密度函数分别计算出关于ddi和dti的累积概率,即P(D<ddi)和P(T<dti)。P(D<ddi)和P(T<dti)分别反映了ddi和dti的大小,如果ddi比较小,说明这辆出租车到达直线距离ldi所经过的路程比大多数的出租车的路程短,同理,如果dti比较小,说明这辆出租车到达直线距离ldi所花费的时间比大多数的出租车的时间短。对于那些行驶距离远和花费时间长的车辆,则有较大的把握认为其可能绕了远路。因此,为了检测出这些异常的出租车,我们在检测时设定两个阈值θd和θt。通过比较累积概率P(D<ddi)与阈值θd以及P(T<dti)与阈值θt的大小来检测异常。如果P(D<ddi)大于阈值θd并且P(T<dti)大于θt,则认为该出租车在这个点是异常的,否则正常。
本实施例提出的一种基于时空关系的出租车异常轨迹实时检测方法,通过学习出发点到当前点的直线距离与行驶距离和驾驶时间之间的关系来建立模型,然后通过模型来计算出当前点到出发点直线距离所对应的行驶距离和驾驶时间的正常范围,那些行驶距离和驾驶时间都超出正常范围的点被判定为异常点。针对当前出租车异常轨迹检测算法误报率较高、所需历史轨迹多的问题,通过相对少的历史轨迹就能产生较低的误报率。
以上对本发明的具体实施例进行了描述。需要理解的是,本发明并不局限于上述特定实施方式,本领域技术人员可以在权利要求的范围内做出各种变形或修改,这并不影响本发明的实质内容。
Claims (2)
1.一种基于时空关系的出租车异常轨迹实时检测方法,其特征在于,包括如下步骤:
通过学习训练数据集中出发点到当前点的直线距离与行驶距离和驾驶时间之间的关系,并建立时空模型;
通过时空模型计算出当前点到出发点直线距离所对应的行驶距离和驾驶时间的正常范围;
判断出租车当前点的行驶距离和驾驶时间是否均超出了正常范围,如果是,则被判定为异常点;
所述训练数据集,采用以下方式进行提取:
从轨迹数据库中提取出经过待测轨迹起点和终点的历史轨迹集合,并将历史轨迹集合中行驶距离或者行驶时间小于中位数的轨迹作为正常轨迹集合;
在正常轨迹集合中选择包含出发时间点以及出发时间点前后一小时以内的轨迹集合;
在所选取出来的轨迹集合的基础上,提取出每条轨迹中所有点到起点的直线距离、行驶时间以及行驶距离作为训练数据集;
建立的时空模型,形式如下:
其中,ddi、dti分别表示训练数据集中第i个点到起点的行驶距离和行驶时间,ldi表示训练数据集中第i个点到起点的直线距离向量,wd、wt分别表示函数(1)、(2)中的参数向量,其中,n为参数的个数,∈d、∈t分别表示服从正态分布的随机变量,σd、σt分别表示上述正态分布中的标准差;
在时空模型当中,采用最大似然估计的方法,确定参数wd、wt、σd以及σt的取值;对于训练数据集中的每个ldi,应当使训练数据集中对应的ddi和dti在时空模型当中的概率最大,即使如下似然函数(3)和(4)的值最大:
其中:Ld、Lt分别表示行驶距离和行驶时间对应的似然函数;
通过似然函数(3)和(4),求wd、wt、σd和σt的偏导,进而确定参数wd、wt、σd和σt的取值:
得到:
其中,LD=[ld1,ld2,...,ldN]T,dd=[dd1,dd2,...,ddN]T,dt=[dt1,dt2,...,dtN]T。
2.根据权利要求1所述的基于时空关系的出租车异常轨迹实时检测方法,其特征在于,对异常点判定,包括如下步骤:
计算出租车当前点到出发点的直线距离ldi、行驶路程ddi以及行驶时间dti;
通过关于D和T的概率密度函数,分别计算关于ddi和dti的累积概率,即P(D<ddi)和P(T<dti),其中,累积概率P(D<ddi)和P(T<dti)分别反映了行驶路程ddi和行驶时间dti的大小,记为当前点到出发点直线距离所对应的行驶距离和驾驶时间的正常范围;
设定阈值θd和θt,通过比较累积概率P(D<ddi)与阈值θd以及累积概率P(T<dti)与阈值θt的大小,检测异常点,即,当累积概率P(D<ddi)大于阈值θd并且累积概率P(T<dti)大于阈值θt时,则认为出租车当前点为异常点。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810321282.3A CN108710637B (zh) | 2018-04-11 | 2018-04-11 | 基于时空关系的出租车异常轨迹实时检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810321282.3A CN108710637B (zh) | 2018-04-11 | 2018-04-11 | 基于时空关系的出租车异常轨迹实时检测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108710637A CN108710637A (zh) | 2018-10-26 |
CN108710637B true CN108710637B (zh) | 2021-06-04 |
Family
ID=63866674
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810321282.3A Active CN108710637B (zh) | 2018-04-11 | 2018-04-11 | 基于时空关系的出租车异常轨迹实时检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108710637B (zh) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111222666B (zh) * | 2018-11-26 | 2024-08-09 | 金篆信科有限责任公司 | 一种数据计算方法和装置 |
CN109949030B (zh) * | 2019-02-14 | 2022-12-02 | 深圳云游四海信息科技有限公司 | 一种出租车绕路和计价异常的检测方法和装置 |
CN111598372A (zh) * | 2019-02-21 | 2020-08-28 | 北京嘀嘀无限科技发展有限公司 | 一种风险防范的方法和系统 |
CN110765369B (zh) * | 2019-09-11 | 2022-03-29 | 安徽先兆科技有限公司 | 基于时空属性的实时监测数据处理方法和系统 |
CN111882873B (zh) * | 2020-07-22 | 2022-01-28 | 平安国际智慧城市科技股份有限公司 | 轨迹异常检测方法、装置、设备及介质 |
CN113111093B (zh) * | 2021-03-22 | 2022-05-24 | 浙江工业大学 | 一种基于时空成本融合框架的出租车驾驶欺诈检测方法 |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101206644B (zh) * | 2006-12-18 | 2010-05-12 | 厦门雅迅网络股份有限公司 | 车辆行驶轨迹数据处理方法 |
CN102592453B (zh) * | 2012-02-27 | 2014-02-26 | 东南大学 | 一种基于时间窗口的实时交通状况判别方法 |
CN103593361B (zh) * | 2012-08-14 | 2017-02-22 | 中国科学院沈阳自动化研究所 | 感应网络环境下移动时空轨迹分析方法 |
US9347779B1 (en) * | 2014-12-10 | 2016-05-24 | Here Global B.V. | Method and apparatus for determining a position of a vehicle based on driving behavior |
CN104573116B (zh) * | 2015-02-05 | 2017-11-03 | 哈尔滨工业大学 | 基于出租车gps数据挖掘的交通异常识别方法 |
CN104700646B (zh) * | 2015-03-31 | 2016-09-14 | 南京大学 | 一种基于在线gps数据的出租车异常轨迹实时检测方法 |
US9934688B2 (en) * | 2015-07-31 | 2018-04-03 | Ford Global Technologies, Llc | Vehicle trajectory determination |
US10621214B2 (en) * | 2015-10-15 | 2020-04-14 | Verizon Patent And Licensing Inc. | Systems and methods for database geocoding |
FR3044402B1 (fr) * | 2015-11-27 | 2021-04-02 | Thales Sa | Procede de calcul de la representation de la trajectoire d'un aeronef en vol |
CN106649656B (zh) * | 2016-12-13 | 2020-03-17 | 中国科学院软件研究所 | 一种面向数据库的时空轨迹大数据存储方法 |
CN106767873B (zh) * | 2016-12-30 | 2019-08-06 | 浙江大学 | 一种基于时空的地图匹配方法 |
CN107730873A (zh) * | 2017-09-14 | 2018-02-23 | 王淑芳 | 一种重点营运车辆异常行为监控方法和系统 |
CN107590250A (zh) * | 2017-09-18 | 2018-01-16 | 广州汇智通信技术有限公司 | 一种时空轨迹生成方法及装置 |
-
2018
- 2018-04-11 CN CN201810321282.3A patent/CN108710637B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN108710637A (zh) | 2018-10-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108710637B (zh) | 基于时空关系的出租车异常轨迹实时检测方法 | |
CN109410586B (zh) | 一种基于多元数据融合的交通状态检测方法 | |
CN109215347B (zh) | 一种基于众包轨迹数据的交通数据质量控制方法 | |
CN106314438B (zh) | 一种司机驾驶轨迹中异常轨迹的检测方法和系统 | |
CN103184719B (zh) | 道路表面调查装置 | |
CN110176139B (zh) | 一种基于dbscan+的道路拥堵识别可视化方法 | |
CN108345666A (zh) | 一种基于时间-空间孤立点的车辆异常轨迹检测方法 | |
CN103473540B (zh) | 智能交通系统车辆轨迹增量式建模与在线异常检测方法 | |
CN107146409B (zh) | 路网中设备检测时间异常的识别和真实时差估算方法 | |
CN104670155A (zh) | 基于云端车联网的车辆防盗报警系统 | |
CN116246492B (zh) | 一种基于时空注意力lstm和超阈值模型的车辆换道碰撞风险预测方法 | |
CN113743455A (zh) | 目标检索方法、装置、电子设备及存储介质 | |
US20210080616A1 (en) | Flood detection device, flood detection system, flood detection program storage medium, and flood detection method | |
Thiruppathiraj et al. | Automatic pothole classification and segmentation using android smartphone sensors and camera images with machine learning techniques | |
CN115361224A (zh) | 基于强扰动检测与模型再训练的深度强化学习交通信号控制中毒防御方法 | |
CN114238502A (zh) | 基于区块链技术的缺陷汽车信息分析平台 | |
CN113212244A (zh) | 一种新能源车辆动力电池寿命预测方法及系统 | |
CN117315943B (zh) | 一种超限运输违法监测分析与预警方法及系统 | |
CN112084185B (zh) | 车载边缘设备基于关联学习的受损电子控制单元定位方法 | |
Zhang et al. | Diagnostics of Road Conditions Using Acceleration Sensor: Machine Learning-LSTM autoencoder and Gaussian Mixture Model | |
CN118430216B (zh) | 一种用于充电桩的多种通信协议烟雾预警系统 | |
CN117826763B (zh) | 一种基于车联网的汽车信息智能采集管控系统及方法 | |
CN117765727B (zh) | 一种汽车路面规划智能控制系统 | |
CN118822283A (zh) | 融合路面表征的道路多要素塌陷风险动态评估方法及系统 | |
Xie et al. | CNN-LSTM Method for Vehicle Motion Behavior Recognition |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |