CN107862866B - 基于平均偏移量平移的数据噪音点检测方法 - Google Patents
基于平均偏移量平移的数据噪音点检测方法 Download PDFInfo
- Publication number
- CN107862866B CN107862866B CN201711077817.9A CN201711077817A CN107862866B CN 107862866 B CN107862866 B CN 107862866B CN 201711077817 A CN201711077817 A CN 201711077817A CN 107862866 B CN107862866 B CN 107862866B
- Authority
- CN
- China
- Prior art keywords
- data
- traffic flow
- noise
- offset
- moment
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000001514 detection method Methods 0.000 title abstract description 7
- 238000000034 method Methods 0.000 claims description 12
- 238000013473 artificial intelligence Methods 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000035772 mutation Effects 0.000 description 2
- 230000000737 periodic effect Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000007621 cluster analysis Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000000714 time series forecasting Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G1/00—Traffic control systems for road vehicles
- G08G1/01—Detecting movement of traffic to be counted or controlled
- G08G1/0104—Measuring and analyzing of parameters relative to traffic conditions
- G08G1/0125—Traffic data processing
- G08G1/0129—Traffic data processing for creating historical data or processing based on historical data
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G1/00—Traffic control systems for road vehicles
- G08G1/065—Traffic control systems for road vehicles by counting the vehicles in a section of the road or in a parking area, i.e. comparing incoming count with outgoing count
Landscapes
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Chemical & Material Sciences (AREA)
- Analytical Chemistry (AREA)
- Traffic Control Systems (AREA)
Abstract
本发明公开了一种基于平均偏移量平移的交通流量数据噪声点检测方法。本发明主要结合历史数据与邻近数据进行噪声判断以便后续进行相应处理。历史数据指在某一时刻,前几个周期该时刻车流量数据的平均值,邻近数据指待被判定点周围的车流量数据。结合历史数据与邻近数据解算出偏移量,再用周期内的数据与偏移量去拟合历史数据,最后根据拟合的数据与历史数据的偏差来判断数据是否为噪声数据。本发明能够更加准确的定位交通车流量数据中存在的噪声,促进智能交通更精准处理。
Description
技术领域
本发明属于交通流量数据噪声处理技术领域,具体涉及一种基于平均偏移量平移的交通数据噪声点检测方法。
背景技术
随着计算机硬件和软件的成熟化,人工智能技术逐渐引起社会关注。人工智能在交通领域的应用,即智能交通,对人们生活有着至关重要的影响。交通智能化解决了人们出行的许多难题,如交通流量的预测能有效的规避交通拥堵的现象。通过深度学习的方法对历史的交通流量变化规律进行学习,利用所学的权重值对未来某一时刻的交通流量情况进行预测,便于提前决策来避免交通拥堵的情况。
深度学习对于基于时间序列预测的交通流量数据预测问题有着良好的性能。但是可能因为收集的数据存在较多的噪声从而降低模型的预测性能。在交通流量数据中,噪声数据指在实现交通智能的过程中难以被机器正确理解和翻译的数据。少量的噪声数据对模型的性能几乎没有影响,而噪声数据量达到一定的程度的时候,对模型的影响就比较大。引起噪声数据的原因有交通流量数据本身具有高突变型、外部条件突发改变等。
当前对噪音数据判断的常用的方法有聚类、低阶多项式滑动拟合、人工检测于计算机的结合等。聚类:适用于数据差异不大,但是交通流量数据差异较大,聚类分析效果较差。低阶多项式滑动拟合法:该方法应用统计方法判断异常值,但交通流具有高突变性,对于突变的噪声此方法并不能很好的检测。然而这些解决噪声的方法针对交通流量数据中的噪声不能有良好的性能,从而影响机器学习算法对交通流量的预测性能。
针对交通流量数据的分析,发现交通流量数据易受外部环境影响,交通管制、恶劣天气、节假日等均很容易造成交通流量数据突变。而且很多研究表明,交通流量具有周期性,时间周期为星期,如星期一某时刻的车流量数据与上周星期一对应时刻的车流量数据相差不大。并且交通数据中相邻数据有较大的关联,在不发生突变的情况下,相邻数据数值差异并不会很大。
发明内容
本发明针对传统的噪声判断方法无法处理高突变性、周期性、时序性的交通流量数据,提出了一种创新型的基于平均偏移量平移的数据噪声点检测方法。
本发明检测噪声主要结合历史数据与邻近数据进行噪声判断以便后续进行相应处理。历史数据指在某一时刻,前几个周期该时刻车流量数据的平均值,邻近数据指待被判定点周围的车流量数据。结合历史数据与邻近数据解算出偏移量,再用周期内的数据与偏移量去拟合历史数据,最后根据拟合的数据与历史数据的偏差来判断数据是否为噪声数据。
本发明的有益效果:本发明能够解决高突变性、周期性、时序性数据的噪检测问题。结合了交通车流量的某时刻的历史平均值与该时刻邻近数据,更加准确的定位交通车流量数据中存在的噪声,促进智能交通更精准处理。
附图说明
图1.噪声检测示意图。
具体实施方式
以下结合附图对本发明作进一步说明
如图1所示,本发明包括以下步骤:
步骤一:假设车流量的真实数据为T,周期为N,Ti表示某周期内第i个时刻对应的交通流量数据。假设共有M个周期,则此时刻的车流量的历史值为H={Ti1,Ti2,…,Tij},j=1,…M。Tij表示第j个周期第i条车流量数据。先计算出周期内某时刻平均值,再计算出该时刻的偏移量Di如下,i=1,…N。
步骤二:将偏移量D进行排序记为D′,单周期车流量数据共有N条。过滤掉较小和较大的1/5数据,将剩下3/5的数据进行取平均值。这样可以过滤掉偏移量过大或者过小的数据,防止过大或者过小的数据拉高或者拉低平均值。再设置一个阈值A,通过调整阈值A的大小来决定拟合过后的数据是否有效。高于(低于)阈值说明该时刻的车流量数据的值异常偏高(偏低)。而这些无效的车流量数据对智能交通中车流量预测有很大的影响,降低了智能交通车流量数据的预测的准确度,这些点就被定义为噪声点。噪声点的判断如公式(2)所示:
步骤三:由于阈值A可以自定义,因此可以结合数据质量来调节A的大小,将噪声点记录下来。一般来说,噪声数据不会超过数据量的5%,最后再用一定的方法将噪声平滑。
Claims (1)
1.基于平均偏移量平移的交通流量数据噪声点检测方法,其特征在于该方法包括以下步骤:
步骤一:假设车流量的真实数据为T,周期为N,Ti表示某周期内第i个时刻对应的交通流量数据,i=1,…N;假设共有M个周期,则此时刻的车流量的历史值为H={Ti1,Ti2,…,Tij},j=1,…M;Tij表示第j个周期第i条车流量数据;先计算出周期内某时刻平均值,再计算出该时刻的偏移量Di如下:
步骤二:将偏移量D进行排序记为D′,单周期车流量数据共有N条;过滤掉较小和较大的1/5数据,将剩下3/5的数据进行取平均值;设置一个阈值A,通过调整阈值A的大小来决定拟合过后的数据是否有效;噪声点的判断如下:
步骤三:结合数据质量来调节阈值A的大小,将噪声点记录下来并将噪声平滑。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711077817.9A CN107862866B (zh) | 2017-11-06 | 2017-11-06 | 基于平均偏移量平移的数据噪音点检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711077817.9A CN107862866B (zh) | 2017-11-06 | 2017-11-06 | 基于平均偏移量平移的数据噪音点检测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107862866A CN107862866A (zh) | 2018-03-30 |
CN107862866B true CN107862866B (zh) | 2020-10-16 |
Family
ID=61701019
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711077817.9A Active CN107862866B (zh) | 2017-11-06 | 2017-11-06 | 基于平均偏移量平移的数据噪音点检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107862866B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111143169B (zh) * | 2019-12-30 | 2024-02-27 | 杭州迪普科技股份有限公司 | 异常参数检测方法及装置、电子设备、存储介质 |
CN116611620B (zh) * | 2023-07-18 | 2023-09-19 | 厚德智能技术(山东)有限公司 | 一种智慧城市安全协同管理信息系统 |
CN116824867B (zh) * | 2023-08-30 | 2023-11-17 | 山东华夏高科信息股份有限公司 | 一种多源公路设施数据信号优化收集处理方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101783075A (zh) * | 2010-02-05 | 2010-07-21 | 北京科技大学 | 一种城市环形道路交通流预测系统 |
CN102014031A (zh) * | 2010-12-31 | 2011-04-13 | 湖南神州祥网科技有限公司 | 一种网络流量异常检测方法及系统 |
CN103441982A (zh) * | 2013-06-24 | 2013-12-11 | 杭州师范大学 | 一种基于相对熵的入侵报警分析方法 |
CN105336163A (zh) * | 2015-10-26 | 2016-02-17 | 山东易构软件技术股份有限公司 | 一种基于三层k近邻的短时交通流预测方法 |
CN105355049A (zh) * | 2015-11-05 | 2016-02-24 | 北京航空航天大学 | 一种基于宏观基本图的高速公路运行状态评价方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20010052087A1 (en) * | 1998-04-27 | 2001-12-13 | Atul R. Garg | Method and apparatus for monitoring a network environment |
-
2017
- 2017-11-06 CN CN201711077817.9A patent/CN107862866B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101783075A (zh) * | 2010-02-05 | 2010-07-21 | 北京科技大学 | 一种城市环形道路交通流预测系统 |
CN102014031A (zh) * | 2010-12-31 | 2011-04-13 | 湖南神州祥网科技有限公司 | 一种网络流量异常检测方法及系统 |
CN103441982A (zh) * | 2013-06-24 | 2013-12-11 | 杭州师范大学 | 一种基于相对熵的入侵报警分析方法 |
CN105336163A (zh) * | 2015-10-26 | 2016-02-17 | 山东易构软件技术股份有限公司 | 一种基于三层k近邻的短时交通流预测方法 |
CN105355049A (zh) * | 2015-11-05 | 2016-02-24 | 北京航空航天大学 | 一种基于宏观基本图的高速公路运行状态评价方法 |
Non-Patent Citations (1)
Title |
---|
基于数据挖掘技术的城市交通流短时预测研究;王娜;《中国优秀硕士学位论文全文数据库 工程科技Ⅱ辑》;20170315(第3期);第10-12页 * |
Also Published As
Publication number | Publication date |
---|---|
CN107862866A (zh) | 2018-03-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111813084B (zh) | 一种基于深度学习的机械装备故障诊断方法 | |
CN103729550B (zh) | 基于传播时间聚类分析的多模型集成洪水预报方法 | |
CN103730006B (zh) | 一种短时交通流量的组合预测方法 | |
CN101814149B (zh) | 一种基于在线学习的自适应级联分类器训练方法 | |
CN107862866B (zh) | 基于平均偏移量平移的数据噪音点检测方法 | |
WO2019080367A1 (zh) | 一种机械设备健康状态评估方法 | |
CN110175416A (zh) | 基于主成分分析和神经网络的三峡水库水温预测方法 | |
CN103699771B (zh) | 一种冷负荷预测的情景-聚类方法 | |
CN108898251A (zh) | 考虑气象相似性和功率波动的海上风电场功率预测方法 | |
CN107705556A (zh) | 一种基于支持向量机和bp神经网络结合的交通流预测方法 | |
CN104715292A (zh) | 基于最小二乘支持向量机模型的城市短期用水量预测方法 | |
CN106384300B (zh) | 基于大数据和模糊模型的建筑异常用能检测方法及系统 | |
CN103530893A (zh) | 相机抖动场景下基于背景差和运动信息的前景检测方法 | |
CN106152387B (zh) | 一种用于室内热舒适度的检测方法 | |
CN110675430B (zh) | 一种基于运动和表观适应融合的无人机多目标跟踪方法 | |
CN110135623A (zh) | 基于层次聚类和神经网络的负荷预测输入特征筛选方法 | |
CN113434989A (zh) | 一种基于注意力机制和lstm的管网漏损量预测方法及系统 | |
CN114519651A (zh) | 基于电力大数据的智能配电方法 | |
CN116494493A (zh) | 一种注塑集中供料系统智能监测方法 | |
CN101872482B (zh) | 一种基于免疫遗传粒子滤波的智能视频跟踪方法 | |
CN104916131B (zh) | 高速公路事件检测的数据清洗方法 | |
CN107808209A (zh) | 基于加权kNN距离的风电场异常数据辨识方法 | |
CN108984851B (zh) | 一种带时延估计的加权高斯模型软测量建模方法 | |
CN112052551A (zh) | 一种风机喘振运行故障识别方法及系统 | |
CN102999760A (zh) | 投票权值在线自适应调整的目标图像区域跟踪方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |