CN104156579A - 一种动态交通异常数据检测与修复方法 - Google Patents

一种动态交通异常数据检测与修复方法 Download PDF

Info

Publication number
CN104156579A
CN104156579A CN201410375544.6A CN201410375544A CN104156579A CN 104156579 A CN104156579 A CN 104156579A CN 201410375544 A CN201410375544 A CN 201410375544A CN 104156579 A CN104156579 A CN 104156579A
Authority
CN
China
Prior art keywords
data
minpts
lof
sigma
abnormal data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410375544.6A
Other languages
English (en)
Inventor
陈志勇
黄�俊
杨乐
彭力
莫子兴
蔡岗
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiangnan University
Traffic Management Research Institute of Ministry of Public Security
Original Assignee
Jiangnan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiangnan University filed Critical Jiangnan University
Priority to CN201410375544.6A priority Critical patent/CN104156579A/zh
Publication of CN104156579A publication Critical patent/CN104156579A/zh
Pending legal-status Critical Current

Links

Abstract

本发明公开了一种动态交通异常数据检测与修复方法,包括异常数据检测和修复两部分,异常数据检测采用一种基于密度的局部异常孤立点发现的方法,异常数据修复采用一种基于灰色系统理论的修复方法。本发明实时有效地对动态交通中车辆运行数据中的异常数据进行了检测和修复,提高了数据质量,从而最终保障交通安全。

Description

一种动态交通异常数据检测与修复方法
技术领域
本发明涉及一种数据检测与修复方法,具体是一种动态交通异常数据检测与修复方法,属于动态交通中异常数据的检测与修复技术领域,
背景技术
动态交通车辆在运营过程中,由于受到道路环境、天气、车辆自身设备故障、甚至一些人为因素的影响,其车载系统采集到的车辆运营和运行状况等数据可能会出现丢失、错误、冗余等异常状况。异常数据的出现可能会给客运车辆的动态监管带来困难,并可能威胁到交通安全。
传统的处理方法是:首先采用基于统计、基于距离和基于偏差等传统的方法来对异常数据进行检测,或者采用聚类、支持向量机和神经网络等基于学习的算法来对异常数据进行检测,并在此基础上,采用相应的修复方法来对异常数据进行修复。然而,这些方法需要大量的统计数据或者需要大量的高质量的数据来对模型进行训练,实际操作中难以推广。
因此,需要设计一种局部异常孤立点发现方法来对异常数据进行检测,并采用实时修复方法来对异常数据进行实时修复,以保证运营企业和政府相关部门对车辆进行准确、有效地监控,提高车辆运营的效率和保障交通安全。
发明内容
为解决上述技术问题,本发明提供一种动态交通异常数据检测与修复方法,利用采集的车辆数据的密度信息与局部异常因子之间的关系对异常数据进行检测,并利用异常数据的偶然性和模糊性与灰色系统理论的相关性来实现对检测出的异常数据进行修复,能够有效保证运营企业和政府相关部门对车辆进行准确、有效地监控,提高车辆运营的效率和保障交通安全。
为了实现上述目的,本发明一种动态交通异常数据检测与修复方法,包括以下步骤:
(S1)将动态交通中实时采集的数据按照时间顺序通过长度为N的滑动窗(SlidingWindow)模型;
(S2)滑动窗中接收到新采集的交通数据后,立即开始计算滑动窗中所有数据对象的MinPts-距离邻域NminPts,并计算其到领域中每个对象的距离,其中,MinPts-距离邻域的计算式为:
NMinPts(p)={q∈D\p|d(p,q)≤k-distance(p)}   (1)
(S3)计算滑动窗中所有数据点的可达密度lrdMinPts,其计算式为:
lrd MinPts ( p ) = 1 / ( Σ o ∈ N MinPts ( p ) reach - dist MinPts ( p , o ) | N MinPts ( p ) | ) - - - ( 2 )
(S4)计算滑动窗中所有数据点的局部异常因子LOFMinPts,其计算式为:
LOF MinPts ( p ) = Σ o ∈ N MinPts ( p ) lrd MinPts ( o ) lrd MinPts ( p ) | N MinPts ( p ) | - - - ( 3 )
(S5)计算局部异常因子的标准差σLOF其计算式为:
σ LOF ( T ) = Σ o o ` Y ( LOF ( o ) - Σ i = 1 N LOF ( i ) N ) 2 N - - - ( 4 )
(S6)计算数据更新前后局部异常因子标准差的比值R,其计算式为:
R = σ LOF ( T + 1 ) σ LOF ( T ) - - - ( 5 )
(S7)当R的值小于阈值时,新更新的交通数据不是异常数据,不需要对数据进行修复,返回步骤(S1),直接等待新的交通数据的到来;当R的值等于或大于阈值时,新更新的交通数据是异常数据,需要对其进行修复,进入异常数据修复。
(S8)提取滑动窗中除去新更新的数据,构成一个原始数据序列X(0),数据序列形式为:
X(0)=(X(0)(1),X(0)(2),...,X(0)(n))   (6)
(S9)计算原始序列的邻均值等权生成序列Z(1),其计算式为:
Z ( 1 ) ( k ) = 1 2 ( X ( 1 ) ( k ) + X ( 1 ) ( k - 1 ) ) , k = 2,3 , . . . , n - - - ( 7 )
(S10)计算原始序列的一次累加X(1),其计算式为:
X(1)=(X(1)(1),X(1)(2),...,X(1)(n))   (8)
(S11)建立灰色模型GM(1,1)的矩阵形式Y:
Y = B α ^ - - - ( 9 )
(S12)求解在式(9)中的最小化问题,灰色模型GM(1,1)参数的估计值为:
α ^ = [ a , u ] T = ( B T B ) - 1 B T Y - - - ( 10 )
(S13)计算出异常数据的修复值X(0),异常数据得到修复:
X ( 0 ) ( k + 1 ) = X ^ ( 1 ) ( k + 1 ) - X ^ ( 1 ) ( k ) = ( 1 - e a ) [ X ( 0 ) ( 1 ) - u a ] e - ak , k = 1,2 , . . . , n - - - ( 11 )
(S14)若车辆继续行驶,则返回步骤(S1),若车辆停止,则结束;
所述步骤(S1)中的滑动窗模型中的数据包括已处理的数据和待辨识的数据;
所述步骤(S2)中的MinPts-距离定义为:任意的自然数k,定义对象p的k-距离(k-distance(p))为p和集合中D中某个对象o之间的距离;所述对象o至少存在k个对象使得并且至多存在k-1个对象使得
所述步骤(S5)中局部异常因子的标准差σLOF的初始值取0。
作为优选,步骤(S7)中数据更新前后局部异常因子标准差的比值R的阈值的实验取值为2.5。
与现有技术相比,本发明采用基于密度的局部异常孤立点发现方法和基于灰色系统理论的异常数据修复方法,所处理的数据是在一个滑动窗模型下进行的,滑动窗中的原始数据均是正常数据,新更新的数据为待辨识的数据,通过计算更新交通数据前后局部异常因子方差的比值来确定该数据是否为异常数据,若为异常数据则通过采用滑动窗中的原始数据,应用灰色系统理论计算对异常数据进行修复,从而实时有效地对动态交通中车辆运行数据中的异常数据进行检测和修复,提高了数据质量,从而最终保障交通安全。
附图说明
图1是本发明流程图;
图2是本发明数据流流向图。
具体实施方式
下面结合附图对本发明作进一步说明。
如图1和图2所示,本发明一种动态交通异常数据检测与修复方法,其特征在于,包括以下步骤:
(S1)将动态交通中实时采集的数据按照时间顺序通过长度为N的滑动窗(SlidingWindow)模型;
(S2)滑动窗中接收到新采集的交通数据后,立即开始计算滑动窗中所有数据对象的MinPts-距离邻域NminPts,并计算其到领域中每个对象的距离,其中,MinPts-距离邻域的计算式为:
NMinPts(p)={q∈D\p|d(p,q)≤k-distance(p)}   (1)
(S3)计算滑动窗中所有数据点的可达密度lrdMinPts,其计算式为:
lrd MinPts ( p ) = 1 / ( Σ o ∈ N MinPts ( p ) reach - dist MinPts ( p , o ) | N MinPts ( p ) | ) - - - ( 2 )
(S4)计算滑动窗中所有数据点的局部异常因子LOFMinPts,其计算式为:
LOF MinPts ( p ) = Σ o ∈ N MinPts ( p ) lrd MinPts ( o ) lrd MinPts ( p ) | N MinPts ( p ) | - - - ( 3 )
(S5)计算局部异常因子的标准差σLOF其计算式为:
σ LOF ( T ) = Σ o o ` Y ( LOF ( o ) - Σ i = 1 N LOF ( i ) N ) 2 N - - - ( 4 )
(S6)计算数据更新前后局部异常因子标准差的比值R,其计算式为:
R = σ LOF ( T + 1 ) σ LOF ( T ) - - - ( 5 )
(S7)当R的值小于阈值时,新更新的交通数据不是异常数据,不需要对数据进行修复,返回步骤(S1),直接等待新的交通数据的到来;当R的值等于或大于阈值时,新更新的交通数据是异常数据,需要对其进行修复,进入异常数据修复。
(S8)提取滑动窗中除去新更新的数据,构成一个原始数据序列X(0),数据序列形式为:
X(0)=(X(0)(1),X(0)(2),...,X(0)(n))   (6)
(S9)计算原始序列的邻均值等权生成序列Z(1),其计算式为:
Z ( 1 ) ( k ) = 1 2 ( X ( 1 ) ( k ) + X ( 1 ) ( k - 1 ) ) , k = 2,3 , . . . , n - - - ( 7 )
(S10)计算原始序列的一次累加X(1),其计算式为:
X(1)=(X(1)(1),X(1)(2),...,X(1)(n))   (8)
(S11)建立灰色模型GM(1,1)的矩阵形式Y:
Y = B α ^ - - - ( 9 )
(S12)求解在式(9)中的最小化问题,灰色模型GM(1,1)参数的估计值为:
α ^ = [ a , u ] T = ( B T B ) - 1 B T Y - - - ( 10 )
(S13)计算出异常数据的修复值X(0),异常数据得到修复:
X ( 0 ) ( k + 1 ) = X ^ ( 1 ) ( k + 1 ) - X ^ ( 1 ) ( k ) = ( 1 - e a ) [ X ( 0 ) ( 1 ) - u a ] e - ak , k = 1,2 , . . . , n - - - ( 11 )
(S14)若车辆继续行驶,则返回步骤(S1),若车辆停止,则结束;
所述步骤(S1)中的滑动窗模型中的数据包括已处理的数据和待辨识的数据;
所述步骤(S2)中的MinPts-距离定义为:任意的自然数k,定义对象p的k-距离(k-distance(p))为p和集合中D中某个对象o之间的距离;所述对象o至少存在k个对象使得并且至多存在k-1个对象使得
如图2所示,所述步骤(S1)中的滑动窗模型中的数据包括已处理的数据和待辨识的数据即新更新的交通数据;
所述步骤(S2)中的MinPts表示p的邻域中最小的对象个数;
所述步骤(S2)中的MinPts-距离定义为:任意的自然数k,定义对象p的k-距离(k-distance(p))为p和集合中D中某个对象o之间的距离;所述对象o至少存在k个对象使得并且至多存在k-1个对象使得
所述步骤(S5)中局部异常因子的标准差σLOF的初始值取0。
作为本发明对上述技术方案的优选方式,所述步骤(S7)中数据更新前后局部异常因子标准差的比值R的阈值的实验取值为2.5,实验的准确率最高,当然也可以选取其他的实验值进行对比。
工作时,将动态交通中实时采集的数据按照时间顺序通过长度为N的滑动窗(SlidingWindow)模型;使用式(1)计算所有数据的对象的MinPts-距离邻域;然后依次使用式(3)、(4)和(5)分别计算数据对象的可达密度、局部异常因子和局部异常因子的方差;再使用式(6)计算更新交通数据前后的局部异常因子的比值,根据比值大小判断新更新的数据是否为异常数据,如不是异常数据,则等待判断下一个交通数据,如是异常数据,进入数据修复流程;如新更新的数据位异常数据,依次使用式(8)、(9)、(10)、(11)和(12)计算灰色模型GM(1,1)的参数a和u;最后使用式(13)来对异常数据进行修复。
本发明通过采用基于密度的局部异常孤立点发现方法和基于灰色系统理论的异常数据修复方法,实时有效地对动态交通中车辆运行数据中的异常数据进行检测和修复,提高了数据质量,从而最终保障交通安全。

Claims (2)

1.一种动态交通异常数据检测与修复方法,其特征在于,包括以下步骤:
(S1)将动态交通中实时采集的数据按照时间顺序通过长度为N的滑动窗(SlidingWindow)模型;
(S2)滑动窗中接收到新采集的交通数据后,立即开始计算滑动窗中所有数据对象的MinPts-距离邻域NminPts,并计算其到领域中每个对象的距离,其中,MinPts-距离邻域的计算式为:
NMinPts(p)={q∈D\p|d(p,q)≤k-distance(p)}   (1)
(S3)计算滑动窗中所有数据点的可达密度lrdMinPts,其计算式为:
lrd MinPts ( p ) = 1 / ( Σ o ∈ N MinPts ( p ) reach - dist MinPts ( p , o ) | N MinPts ( p ) | ) - - - ( 2 )
(S4)计算滑动窗中所有数据点的局部异常因子LOFMinPts,其计算式为:
LOF MinPts ( p ) = Σ o ∈ N MinPts ( p ) lrd MinPts ( o ) lrd MinPts ( p ) | N MinPts ( p ) | - - - ( 3 )
(S5)计算局部异常因子的标准差σLOF其计算式为:
σ LOF ( T ) = Σ o o ` Y ( LOF ( o ) - Σ i = 1 N LOF ( i ) N ) 2 N - - - ( 4 )
(S6)计算数据更新前后局部异常因子标准差的比值R,其计算式为:
R = σ LOF ( T + 1 ) σ LOF ( T ) - - - ( 5 )
(S7)当R的值小于阈值时,新更新的交通数据不是异常数据,不需要对数据进行修复,返回步骤(S1),直接等待新的交通数据的到来;当R的值等于或大于阈值时,新更新的交通数据是异常数据,需要对其进行修复,进入异常数据修复。
(S8)提取滑动窗中除去新更新的数据,构成一个原始数据序列X(0),数据序列形式为:
X(0)=(X(0)(1),X(0)(2),...,X(0)(n))   (6)
(S9)计算原始序列的邻均值等权生成序列Z(1),其计算式为:
Z ( 1 ) ( k ) = 1 2 ( X ( 1 ) ( k ) + X ( 1 ) ( k - 1 ) ) , k = 2,3 , . . . , n - - - ( 7 )
(S10)计算原始序列的一次累加X(1),其计算式为:
X(1)=(X(1)(1),X(1)(2),...,X(1)(n))   (8)
(S11)建立灰色模型GM(1,1)的矩阵形式Y:
Y = B α ^ - - - ( 9 )
(S12)求解在式(9)中的最小化问题,灰色模型GM(1,1)参数的估计值为:
α ^ = [ a , u ] T = ( B T B ) - 1 B T Y - - - ( 10 )
(S13)计算出异常数据的修复值X(0),异常数据得到修复:
X ( 0 ) ( k + 1 ) = X ^ ( 1 ) ( k + 1 ) - X ^ ( 1 ) ( k ) = ( 1 - e a ) [ X ( 0 ) ( 1 ) - u a ] e - ak , k = 1,2 , . . . , n - - - ( 11 )
(S14)若车辆继续行驶,则返回步骤(S1),若车辆停止,则结束;
所述步骤(S1)中的滑动窗模型中的数据包括已处理的数据和待辨识的数据;
所述步骤(S2)中的MinPts-距离定义为:任意的自然数k,定义对象p的k-距离(k-distance(p))为p和集合中D中某个对象o之间的距离;所述对象o至少存在k个对象使得并且至多存在k-1个对象使得
步骤(S5)中局部异常因子的标准差σLOF的初始值取0。
2.根据权利要求1所述的一种动态交通异常数据检测与修复方法,其特征在于,所述步骤(S7)中数据更新前后局部异常因子标准差的比值R的阈值的实验取值为2.5。
CN201410375544.6A 2014-07-31 2014-07-31 一种动态交通异常数据检测与修复方法 Pending CN104156579A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410375544.6A CN104156579A (zh) 2014-07-31 2014-07-31 一种动态交通异常数据检测与修复方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410375544.6A CN104156579A (zh) 2014-07-31 2014-07-31 一种动态交通异常数据检测与修复方法

Publications (1)

Publication Number Publication Date
CN104156579A true CN104156579A (zh) 2014-11-19

Family

ID=51882077

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410375544.6A Pending CN104156579A (zh) 2014-07-31 2014-07-31 一种动态交通异常数据检测与修复方法

Country Status (1)

Country Link
CN (1) CN104156579A (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104504901A (zh) * 2014-12-29 2015-04-08 浙江银江研究院有限公司 一种基于多维数据的交通异常点检测方法
CN104537225A (zh) * 2014-12-19 2015-04-22 银江股份有限公司 一种交通数据修复的云处理方法及其系统
CN105893515A (zh) * 2016-03-30 2016-08-24 腾讯科技(深圳)有限公司 一种信息处理方法及服务器
CN106096302A (zh) * 2016-06-22 2016-11-09 江苏迪纳数字科技股份有限公司 基于时间和路段相关性的数据修复方法
CN107978147A (zh) * 2017-10-31 2018-05-01 上海工程技术大学 一种基于knn算法的交通流异常数据双向检测修复方法
CN108197254A (zh) * 2017-12-29 2018-06-22 清华大学 一种基于近邻的数据修复方法
CN108682152A (zh) * 2018-05-31 2018-10-19 重庆大学 一种基于前车数据的公交车异常数据修复方法
CN109409519A (zh) * 2018-10-16 2019-03-01 三星(中国)半导体有限公司 一种数据异常检测方法、装置及设备
CN112380206A (zh) * 2020-11-25 2021-02-19 浙江浙大中控信息技术有限公司 一种交通时序数据的诊断和修复方法
CN113190997A (zh) * 2021-04-29 2021-07-30 贵州数据宝网络科技有限公司 一种大数据终端数据修复方法及系统

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
李循律等: "基于密度的异常检测算法在入侵检测系统中的应用", 《江南大学学报(自然科学版)》 *
翁小清等: "基于滑动窗口的多变量时间序列异常数据的挖掘", 《计算机工程》 *
肖建琼等: "基于时间序列数据流的孤立点自适应异常检测", 《电脑知识与技术》 *
郭敏等: "基于灰色残差GM(1,N)模型的交通流数据恢复算法", 《交通运输系统工程与信息》 *
黄光球等: "基于密度的异常挖掘方法研究与应用", 《微电子学与计算机》 *

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104537225A (zh) * 2014-12-19 2015-04-22 银江股份有限公司 一种交通数据修复的云处理方法及其系统
CN104537225B (zh) * 2014-12-19 2017-07-28 银江股份有限公司 一种交通数据修复的云处理方法及其系统
CN104504901B (zh) * 2014-12-29 2016-06-08 浙江银江研究院有限公司 一种基于多维数据的交通异常点检测方法
CN104504901A (zh) * 2014-12-29 2015-04-08 浙江银江研究院有限公司 一种基于多维数据的交通异常点检测方法
CN105893515A (zh) * 2016-03-30 2016-08-24 腾讯科技(深圳)有限公司 一种信息处理方法及服务器
CN106096302A (zh) * 2016-06-22 2016-11-09 江苏迪纳数字科技股份有限公司 基于时间和路段相关性的数据修复方法
CN107978147B (zh) * 2017-10-31 2021-05-11 上海工程技术大学 一种基于knn算法的交通流异常数据双向检测修复方法
CN107978147A (zh) * 2017-10-31 2018-05-01 上海工程技术大学 一种基于knn算法的交通流异常数据双向检测修复方法
CN108197254A (zh) * 2017-12-29 2018-06-22 清华大学 一种基于近邻的数据修复方法
CN108197254B (zh) * 2017-12-29 2018-12-28 清华大学 一种基于近邻的数据修复方法
CN108682152A (zh) * 2018-05-31 2018-10-19 重庆大学 一种基于前车数据的公交车异常数据修复方法
CN108682152B (zh) * 2018-05-31 2021-01-15 重庆大学 一种基于前车数据的公交车异常数据修复方法
CN109409519B (zh) * 2018-10-16 2020-11-27 三星(中国)半导体有限公司 一种数据异常检测方法、装置及设备
CN109409519A (zh) * 2018-10-16 2019-03-01 三星(中国)半导体有限公司 一种数据异常检测方法、装置及设备
CN112380206A (zh) * 2020-11-25 2021-02-19 浙江浙大中控信息技术有限公司 一种交通时序数据的诊断和修复方法
CN113190997A (zh) * 2021-04-29 2021-07-30 贵州数据宝网络科技有限公司 一种大数据终端数据修复方法及系统

Similar Documents

Publication Publication Date Title
CN104156579A (zh) 一种动态交通异常数据检测与修复方法
US20190285517A1 (en) Method for evaluating health status of mechanical equipment
CN104091070B (zh) 一种基于时间序列分析的轨道交通故障诊断方法和系统
CN102855638B (zh) 基于谱聚类的车辆异常行为检测方法
CN107480440A (zh) 一种基于两阶段随机退化建模的剩余寿命预测方法
CN103971520A (zh) 一种基于时空相关性的交通流量数据恢复方法
CN103500365A (zh) 光伏发电功率预测方法和系统
CN103745477A (zh) 基于机器视觉的建筑结构裂缝检测及修复方法
CN111563524A (zh) 一种多站融合系统运行态势异常监测和告警合并方法
CN110781266B (zh) 一种基于时空因果关系的城市感知数据处理方法
CN104504400A (zh) 一种基于在线行为建模的驾驶员异常行为检测方法
CN105468866A (zh) 一种轨道车辆led驱动电源剩余寿命预测方法
CN106709816A (zh) 基于非参数回归分析的电力负荷异常数据识别与修正方法
CN103345637A (zh) 输电线路复合绝缘子憎水性在线检测系统及方法
CN104463165A (zh) 一种融合Canny算子与Vibe算法的目标检测方法
Min et al. Traffic flow data recovery algorithm based on gray residual GM (1, N) model
CN114881381B (zh) 基于改进卷积神经网络的城市积水水位预测方法及系统
CN106570651A (zh) 一种输电线路绝缘子污闪风险评估方法
CN102622883B (zh) 判定交通事件解除的方法及装置
CN110942221A (zh) 一种基于物联网的变电站故障快速修复方法
CN115638833A (zh) 一种监控数据处理方法及系统
CN107862863B (zh) 一种交通数据质量提升的方法及装置
CN103810392A (zh) 基于支持向量机和rbf神经网络的退化数据缺失插补方法
Wang et al. Classification of ship trajectories by using naive Bayesian algorithm
CN113516406B (zh) 一种基于实时观测分析的高铁沿线降水测点布置方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C41 Transfer of patent application or patent right or utility model
TA01 Transfer of patent application right

Effective date of registration: 20160108

Address after: No. 1800 road 214000 Jiangsu Lihu Binhu District City of Wuxi Province

Applicant after: Jiangnan University

Applicant after: Traffic Management Science Inst., Security Ministry

Address before: No. 1800 road 214000 Jiangsu Lihu Binhu District City of Wuxi Province

Applicant before: Jiangnan University

RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20141119