CN106530685B - 一种交通数据短时预测方法及装置 - Google Patents
一种交通数据短时预测方法及装置 Download PDFInfo
- Publication number
- CN106530685B CN106530685B CN201510579073.5A CN201510579073A CN106530685B CN 106530685 B CN106530685 B CN 106530685B CN 201510579073 A CN201510579073 A CN 201510579073A CN 106530685 B CN106530685 B CN 106530685B
- Authority
- CN
- China
- Prior art keywords
- traffic data
- dimension
- historical
- group
- historical traffic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Landscapes
- Traffic Control Systems (AREA)
Abstract
本发明实施例公开了一种交通数据短时预测方法及装置,包括:根据该当前时间段及该当前时间段之前的每个时间段监测的交通数据,在历史数据库中查找与该当前时间段及该当前时间段之前的每个时间段监测的交通数据距离临近的K组历史交通数据,其中历史数据库中基于K维树K‑d树保存有多个该设定时间长度内每个维度对应监测到的历史交通数据,根据该当前时间段下一时间段的第一维度,及查找到的K组历史交通数据中该第一维度对应的历史交通数据,预测下一时间段的交通数据。由于本发明实施例中历史数据库中是基于K‑d树保存的每个维度对应的监测到的历史交通数据,因此可以提高搜索的效率,降低KNN运算的耗时,提高交通数据短时预测的效率。
Description
技术领域
本发明涉及数据挖掘技术领域,特别涉及一种交通数据短时预测方法及装置。
背景技术
随着我国城市化进程的加快和汽车保有量的增加,城市交通拥堵日益加剧,而先进的交通信息服务系统(ATIS)是缓解交通拥堵的一种有效途径。交通数据预测是先进的交通信息服务系统应用的基础和关键,而且,交通数据预测不仅可以帮助出行者在多方出行方案中制定合理的出行计划,减少出行时间和旅游延误,还可以提高交通系统的运行效率,有效的缓解交通拥堵。同时,对违法次数的预测,可以通过及时布控,提高交通运行的安全性。
目前,交通数据预测大致可以分为两类:高速公路数据预测和城市交通数据预测。对于高速公路交通数据预测的研究是非常丰富的,然而对于城市交通数据预测的研究是非常有限的。相对于高速公路交通数据预测,城市交通数据预测更具有挑战性,主要是因为:城市交通的波动性很大,车辆多、驾驶行为差异很大。因此需要针对交通数据预测提供一种准确、可靠的预测方案。
发明内容
本发明实施例公开了一种交通数据短时预测方法及装置,用以提供一种准确、可靠的交通数据短时预测方案。
为达到上述目的,本发明实施例公开了一种交通数据短时预测方法,用于预测监测地点的交通数据,所述方法包括:
根据设定时间长度内时间段的划分规则,确定当前时间段、当前时间段之前的每个时间段对应的维度;
采用K近邻KNN算法在历史数据库中,查找与该当前时间段及该当前时间段之前的每个时间段监测的交通数据距离临近的K组历史交通数据,其中所述历史数据库中基于K维K-d树保存有多个该设定时间长度内每个维度对应监测到的历史交通数据,K为大于零的整数;
根据当前时间段的维度,确定该当前时间段的下一时间段的第一维度;
根据K组历史交通数据中该第一维度对应监测到的历史交通数据,及所述K组历史交通数据对应的权重系数,预测该当前时间段的下一时间段的交通数据。
进一步地,生成基于K-d树保存的多个该设定时间长度内每个维度对应监测到的历史交通数据包括:
针对每个维度,根据该维度对应的每个历史交通数据,确定该维度的中位数,其中每个时间段监测的历史交通数据作为该K-d树的一个维度保存;
针对每个维度,根据每组历史交通数据中该维度对应的历史交通数据与该维度的中位数的大小,将每组历史交通数据的该维度对应的交通数据保存在所述中位数的左子树或右子树中,并分别记录每个历史交通数据所在组的标识信息,其中每个设定时间长度的每个时间段监测的历史交通数据作为一组历史交通数据。
进一步地,所述查找与该当前时间段及该当前时间段之前的每个时间段监测的交通数据距离临近的K组历史交通数据包括:
根据针对该K-d树记录的每个维度的区分度,该当前时间段及该当前时间段之前的时间段对应的维度,查找该当前时间段及该当前段之前的时间段对应的维度的区分度最大的至少一个维度;
根据该至少一个维度,将该维度对应的交通数据与历史数据库中对应维度的中位数进行比较,确定该交通数据在该维度的中位数的左子树或右子树中,并确定该中位数的左子树或右子树中记录的每个历史交通数据对应组的标识信息;
确定该至少一个维度对应的组的标识信息的交集,根据该交集中每个组的标识信息,在每个组对应的历史交通数据中查找与该当前时间段及该当前时间段之前的每个时间段监测的交通数据距离临近的K组历史交通数据。
进一步地,确定所述K-d树中每个维度的区分度包括:
针对每个维度,确定所述K-d树中该维度的历史交通数据的方差;
根据所述方差的大小,确定每个维度的区分度。
进一步地,所述方法还包括:
按照设定的时间间隔,对所述历史数据库中以K-d树保存的多个该设定时间长度内每个维度对应监测到的历史交通数据进行更新。
进一步地,所述根据K组历史交通数据中该第一维度对应监测到的交通数据,及所述K组历史交通数据对应的权重系数,预测该当前时间段的下一时间段的交通数据包括:
根据该K组历史交通数据与该当前时间段及该当前时间段之前的每个时间段监测的交通数据的距离的倒数,确定每组历史交通数据对应的权重系数;
根据确定的每组历史交通数据对应的权重系数,及每组历史交通数据中该第一维度对应监测到的历史交通数据,预测该当前时间段的下一时间段的交通数据。
进一步地,所述根据K组历史交通数据与该当前时间段及该当前时间段之前的每个时间段监测的交通数据的距离的倒数,确定每组历史交通数据对应的权重系数包括:
根据确定每组历史交通数据对应的权重系数,其中,βi为第i组历史交通数据对应的权重系数,di为第i组历史交通数据与该当前时间段及该当前时间段之前的每个时间段监测的交通数据的距离,K为大于1的整数。
进一步地,所述交通数据包括:交通流量数据,或交通违法车辆的数据。
本发明实施例提供了一种交通数据短时预测装置,用于预测监测地点的交通数据,所述装置包括:
第一确定模块,用于根据设定时间长度内时间段的划分规则,确定当前时间段、当前时间段之前的每个时间段对应的维度;
查找模块,用于采用K近邻KNN算法在历史数据库中,查找与该当前时间段及该当前时间段之前的每个时间段监测的交通数据距离临近的K组历史交通数据,其中所述历史数据库中基于K维K-d树保存有多个该设定时间长度内每个维度对应监测到的历史交通数据,K为大于零的整数;
第二确定模块,用于根据当前时间段的维度,确定该当前时间段的下一时间段的第一维度;
预测模块,用于根据K组历史交通数据中该第一维度对应的监测到的历史交通数据,及所述K组历史交通数据对应的权重系数,预测该当前时间段的下一时间段的交通数据。
进一步地,所述装置还包括:
生成模块,用于针对每个维度,根据该维度对应的每个历史交通数据,确定该维度的中位数,其中每个时间段监测的历史交通数据作为该K-d树的一个维度保存;针对每个维度,根据每组历史交通数据中该维度对应的历史交通数据与该维度的中位数的大小,将每组历史交通数据的该维度对应的历史交通数据保存在所述中位数的左子树或右子树中,并分别记录每个历史交通数据所在组的标识信息,其中每个设定时间长度的每个时间段监测的交通数据作为一组历史交通数据。
进一步地,所述查找模块,具体用于根据针对该K-d树记录的每个维度的区分度,该当前时间段及该当前时间段之前的时间段对应的维度,查找该当前时间段及该当前段之前的时间段对应的维度的区分度最大的至少一个维度;根据该至少一个维度,将该维度对应的交通数据与历史数据库中对应维度的中位数进行比较,确定该交通数据在该维度的中位数的左子树或右子树中,并确定该中位数的左子树或右子树中记录的每个历史交通数据对应组的标识信息;确定该至少一个维度对应组的标识信息的交集,根据该交集中每个组的标识信息,在每个组对应的历史交通数据中查找与该当前时间段及该当前时间段之前的每个时间段监测的交通数据距离临近的K组历史交通数据。
进一步地,所述生成模块,还用于针对每个维度,确定所述K-d树中该维度的历史交通数据的方差;根据所述方差的大小,确定每个维度的区分度。
进一步地,所述装置还包括:
更新模块,用于按照设定的时间间隔,对所述历史数据库中以K-d树保存的多个该设定时间长度内每个维度对应监测到的历史交通数据进行更新。
进一步地,所述预测模块,具体用于根据K组历史交通数据与该当前时间段及该当前时间段之前的每个时间段监测的交通数据的距离的倒数,确定每组历史交通数据对应的权重系数;
根据确定的每组历史交通数据对应的权重系数,及每组历史交通数据中该第一维度对应监测到的历史交通数据,预测该当前时间段的下一时间段的交通数据。
进一步地,所述预测模块,具体用于根据确定每组历史交通数据对应的权重系数,其中,βi为第i组历史交通数据对应的权重系数,di为第i组历史交通数据与该当前时间段及该当前时间段之前的每个时间段监测的交通数据的距离,K为大于1的整数。
本发明实施例提供了一种交通数据短时预测方法及装置,用于预测监测地点的交通数据,该方法包括:根据该当前时间段及该当前时间段之前的每个时间段监测的交通数据,在历史数据库中查找与该当前时间段及该当前时间段之前的每个时间段监测的交通数据距离临近的K组历史交通数据,其中所述历史数据库中基于K维树K-d树保存有多个该设定时间长度内每个维度对应监测到的历史交通数据,根据该当前时间段下一时间段的第一维度,及查找到的K组历史交通数据中该第一维度对应的监测到的历史交通数据,预测该当前时间段的下一时间段的交通数据。由于在本发明实施例中采用KNN算法进行预测,避免了参数设置等问题,可以保证预测的准确性,另外,历史数据库中是基于K-d树保存的每个维度对应的监测到的历史交通数据,因此在对进行交通数据邻近搜索时,可以提高搜索的效率,降低KNN运算的耗时,提高交通数据短时预测的效率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种交通数据短时预测过程;
图2为本发明另一实施例提供的一种交通数据短时预测过程;
图3为本发明实施例提供的该K-d树的构建及区分度记录过程;
图4为本发明实施例提供的一种交通数据短时预测装置结构示意图。
具体实施方式
为了提高交通数据短时预测的准确性,并提高短时预测的效率,本发明实施例提供了一种交通数据短时预测方法及装置。
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1为本发明实施例提供的一种交通数据短时预测过程,该过程包括以下步骤:
S101:根据设定时间长度内时间段的划分规则,确定当前时间段、当前时间段之前的每个时间段对应的维度。
在本发明实施例中针对该设定时间长度内的交通数据进行预测,该设定时间长度是固定的,可以是一天,也可以是一天里的一个时间段,例如10:00-15:00,或者是高峰时段7:00-9:00、17:00-19:00等。相应的历史数据库中保存有预先采集有多组交通数据,每组交通数据为该设定时间长度内监测的交通数据,其中每个设定时间长度的每个时间段监测的交通数据作为一组交通数据。
为了方便预测,将该设定时间长度按照划分规则,划分为多个时间段,其中该划分规则可以是按照时间段的长度进行划分,例如按照每5分钟、10分钟为一个时间段,将该设定时间长度划分为多个时间段。为了便于后续的计算,该设定时间长度相同,时间段的划分规则相同,因此可以为每一时间段赋予唯一的维度,例如将一天按照每5分钟划分为一个时间段,则一天可以划分为288个时间段,则每个时间段的维度分别为1、2、3、……、288等。
S102:采用K近邻KNN算法在历史数据库中,查找与该当前时间段及该当前时间段之前的每个时间段监测的交通数据距离临近的K组历史交通数据,其中所述历史数据库中基于K-d树保存有多个该设定时间长度内每个维度对应监测到的历史交通数据,K为大于零的整数。
在本发明实施例中在历史数据库中保存有大量的历史交通数据,该历史交通数据为设定时间长度内按照划分规则,划分得到的每个时间段监测的历史交通数据。为了提高交通数据预测的效率,该历史交通数据是以K-d树形式保存的。因为设定时间长度被划分为了多个时间段,因此可以将每个时间段监测的历史交通数据,作为该K-d树的一个维度来保存。
该交通数据可以是交通流量数据,也可以是交通违法车辆的数据。当交通数据为交通流量数据时,该每个时间段监测的交通流量数据可以是车辆的数量,当该交通数据为交通违法车辆的数据时,该每个时间段监测的交通违法车辆的数据可以是交通违法车辆的数量。
另外,由于本发明实施例的交通数据短时预测方案用于预测监测地点的交通数据,当监测地点较多时,可以针对每个监测地点分别建立其对应的历史数据库;或者将针对每个监测地点的历史数据都保存在同一历史数据库中,每个监测地点的历史数据采用该监测地点的标识信息进行标识。当针对某一监测地点进行交通数据短时预测时,根据该监测地点的标识信息到历史数据库中查找该标识信息的历史交通数据。
S103:根据当前时间段的维度,确定该当前时间段的下一时间段的第一维度。
本发明实施例提供的预测方法适用于短时预测,短时预测又称为实时预测。交通数据的短时预测能够对输入的交通数据进行实时处理后,预测未来一段时间内的交通数据。
在设定时间长度内根据时间段的划分规则,将该设定时间长度划分为多个时间段,并确定每个时间段对应的维度。无论是预测的过程,还是针对采集的历史交通数据,对设定时间长度都是按照相同的划分规则进行划分的,并且每个对应时间段的维度都是相同的。因此确定了该当前时间段的下一时间段的第一维度后,即可确定该历史数据库中该监测地点对应的该第一维度监测的历史交通数据。
为了便于区分,在本发明实施例以及之后的实施例中,将历史数据库中保存的交通数据称为历史交通数据。
S104:根据K组历史交通数据中该第一维度对应的监测到的历史交通数据,及所述K组历史交通数据对应的权重系数,预测该当前时间段的下一时间段的交通数据。
具体的,为了实现对交通数据的短时预测,并且提高预测的准确性,根据确定的K组历史交通数据与该当前时间段及该当前时间段之前的时间段监测的交通数据的距离,距离较小的每组历史交通数据对应的权重系数较大,相应的距离较大的每组历史交通数据对应的权重系数较小。
由于在本发明实施例中采用KNN算法进行预测,避免了参数设置等问题,可以保证预测的准确性,另外,历史数据库中是基于K-d树保存的每个维度对应的监测到的历史交通数据,因此在对进行交通数据邻近搜索时,可以提高搜索的效率,降低KNN运算的耗时,提高交通数据短时预测的效率。
在本发明实施例中为了实现对交通数据的短时预测,需要根据在每个时间段监测的交通数据来预测。因此为了实现对交通数据的监测,需要在每个监测地点安装进行交通数据监测的摄像机,该监测地点可以选择在交通枢纽的交通路口。为了对本发明实施例进行详细说明,引入卡口的概念,卡口以设置在交通枢纽交通路口的摄像机为依托,获取相应的交通数据。卡口一般作为道路交通部门监管的系统使用,可以监测车流量、进行断面车辆计数、车辆特征检索以及抓拍违章等信息。
为了能够准确的进行交通数据短时预测,在进行历史数据库的生成时,针对进行交通数据短时预测的监测地点,获取相应卡口监测的交通数据,历史交通数据中包括该交通数据,以及该监测该交通数据的时刻。为了保证预测的准确性,可以在历史交通数据库中收集大量的历史交通数据,该历史交通数据最好能够包括该监测地点的各种交通状况下的交通数据。
针对获取的每个历史交通数据,针对设定时间长度,确定该历史交通数据中每个设定时间长度监测的历史交通数据,当该设定时间长度为一天时,即确定每天监测的历史交通数据。针对每个设定时间长度监测的历史交通数据,按照设定时间长度内时间段的划分规则,将该设定时间长度划分为多个时间段,根据监测每个历史交通数据的时刻,确定每个时间段监测的历史交通数据。
另外,为了提高交通数据短时预测的效率,在本发明实施例中历史数据库中的每个历史交通数据是基于K-d树保存的。K-d树是一种分割k维数据空间以便快速检索的树形的数据结构。主要应用于多维空间关键数据的搜索(如:范围搜索和最近邻搜索)。K-d树从本质上来说是二叉树,表示为对K维空间的一个划分。构造K-d树相当于不断地用垂直于坐标轴的超平面切分K维空间,构成一系列的K维超矩形区域,K-d树的每一个结点都对应于一个超矩形区域,非叶结点的左、右子树分别表示划分得到的两个区域。
例如,可以将该设定时间长度设置为一天,划分规则是按照时间段的长度进行划分,每个时间段的长度为5分钟,则可以将一天划分为288个时间段,根据监测每个历史交通数据的时刻,确定每个时间段监测的历史交通数据。将每个时间段监测的历史交通数据作为K-d树的一个维度保存在K-d树中。如下表所示:每个的时间段与维度的对应关系。
时间段 | 00:00:00--00:04:59 | 00:05:00--00:09:59 | …… | 23:55:00--23:59:59 |
维度 | 1 | 2 | …… | 288 |
已知K-d树的维度,以及每个维度对应的历史交通数据,构建K-d树的过程属于现有技术,本发明实施例对该过程不进行赘述。
本发明实施例基于KNN算法对交通数据进行短时预测,KNN算法是一种数据挖掘方法,KNN算法的核心思想是如果一个样本的特征空间中的K个最相邻的样本中的大多数属于某一个类别,则该样本也属于这个类别,并具有该类别所属的特征。
采用KNN算法在历史数据库中,查找与该当前时间段及该当前时间段之前的每个
时间段监测的交通数据距离临近的K组历史交通数据时,将每个设定时间长度的每个时间
段监测的交通数据称为一组历史交通数据,确定该组历史交通数据的标识信息,即该组的
标识信息,确定该当前时间段及该当前时间段之前的每个时间段监测的交通数据及历史数
据库中每组历史交通数据的欧式距离,即可查找到与该当前时间段及该当前时间段之前的
每个时间段监测的交通数据距离临近的K组历史交通数据,可以根据其中Dk为与第K组历史交通数据的距离,hi k
为第K组历史交通数据的第i维历史交通数据,Ci为第i个时间段监测的交通数据,当前时间
段为第m个时间段。
在本发明的另一实施例中,为了提高预测的准确性,在本发明实施例中,所述根据K组历史交通数据中该第一维度对应的监测到的交通数据,及所述K组历史交通数据对应的权重系数,预测该当前时间段的下一时间段的交通数据包括:
根据K组历史交通数据与该当前时间段及该当前时间段之前的每个时间段监测的交通数据的距离的倒数,确定每组历史交通数据对应的权重系数;
根据确定的每组历史交通数据对应的权重系数,及每组历史交通数据中该第一维度对应的监测到的历史交通数据,预测该当前时间段的下一时间段的交通数据。
所述根据K组历史交通数据与该当前时间段及该当前时间段之前的每个时间段监测的交通数据的距离的倒数,确定每组历史交通数据对应的权重系数包括:
根据确定每组历史交通数据对应的权重系数,其中,βi为第i组历史交通数据对应的权重系数,di为第i组历史交通数据与该当前时间段及该当前时间段之前的每个时间段监测的交通数据的距离,K为大于1的整数。
每个时间段监测的交通数据与历史数据库中对应组的历史交通数据的距离越小,说明两者之间的相似度越高,相应的,在预测时,该组在预测过程中所在组的权重系数应该较大,因此可以用该距离值的倒数来表示该组的权重系数。
确定了每组历史交通数据对应的权重系数,对该当前时间段的下一时间段的交通数据进行预测,可以根据预测该当前时间段的下一时间段的交通数据,βi为第i组历史交通数据对应的权重系数,该当前时间段的维度为t,该当前时间段的下一时间段的维度为t+1,预测的下一时间段的交通数据为v(t+1),vhi(t+1)为历史数据库该K组中第i组历史交通数据的第t+1维历史交通数据。
图2为本发明另一实施例提供的一种交通数据短时预测过程,该过程包括以下步骤:
S201:根据设定时间长度内时间段的划分规则,确定当前时间段、当前时间段之前的每个时间段对应的维度。
S202:采用KNN算法在历史数据库中,查找与该当前时间段及该当前时间段之前的每个时间段监测的交通数据距离临近的K组历史交通数据,其中所述历史数据库中基于K-d树保存有多个该设定时间长度内每个维度对应监测到的历史交通数据,K为大于零的整数。
S203:根据当前时间段的维度,确定该当前时间段的下一时间段的第一维度。
S204:根据该K组历史交通数据与该当前时间段及该当前时间段之前的每个时间段监测的交通数据的距离的倒数,确定每组历史交通数据对应的权重系数。
S205:根据确定的每组历史交通数据对应的权重系数,及每组历史交通数据中该第一维度的时间段监测的历史交通数据,预测该当前时间段的下一时间段的交通数据。
为了降低KNN运算的耗时,进一步的提高交通数据短时预测的效率,在本发明的另一实施例中,生成基于K-d树保存的多个该设定时间长度内每个维度对应的监测到的历史交通数据包括:
针对每个维度,根据该维度对应的每个历史交通数据,确定该维度的中位数,其中每个时间段监测的历史交通数据作为该K-d树的一个维度保存;
针对每个维度,根据每组历史交通数据中该维度对应的历史交通数据与该维度的中位数的大小,将每组历史交通数据的该维度对应的历史交通数据保存在所述中位数的左子树或右子树中,并分别记录每个历史交通数据所在组的标识信息,其中每个设定时间长度的每个时间段监测的历史交通数据作为一组交通数据。
具体的,在本发明的上述实施例中,针对每个维度,根据该维度的历史交通数据,确定该维度的中位数,针对该维度记录其中位数。这样针对每个维度,该维度中历史交通数据较该中位数小的将保存在该中位数的左子树中,较该中位数大的历史交通数据将保存在该中位数的右子树中。为了便于后续距离的计算,针对每个维度中保存的每个历史交通数据,记录有该历史交通数据对应组的标识信息。
在查找与该当前时间段及该当前时间段之前的每个时间段监测的交通数据距离临近的K组历史交通数据时,针对每个时间段采集的交通数据,确定该交通数据对应的维度,根据记录的该维度的中位数,确定该交通数据位于该中位数的左子树还是右子树中,并确定该K-d中位于该左子树或右子树中的历史交通数据对应组的标识信息。例如某一交通数据为20,其对应的维度的中位数为32,则确定该交通数据位于该中位数的左子树中,左子树中记录的每个历史交通数据对应的标识信息分别为A、B、C、……。
另外,在本发明的另一实施例中,为了进一步提高预测的效率,查找与该当前时间段及该当前时间段之前的每个时间段监测的交通数据距离临近的K组历史交通数据包括:
根据怎对该K-d树记录的每个维度的区分度,该当前时间段及该当前时间段之前的时间段对应的维度,查找该当前时间段及该当前段之前的时间段对应的维度的区分度最大的至少一个维度;
根据该至少一个维度,将该维度对应的交通数据与历史数据库中对应维度的中位数进行比较,确定该交通数据在该维度的中位数的左子树或右子树中,并确定该中位数的左子树或右子树中记录的每个历史交通数据对应组的标识信息;
确定该至少一个维度对应的组的标识信息的交集,根据该交集中每个组的标识信息,在每个组对应的历史交通数据中查找与该当前时间段及该当前时间段之前的每个时间段监测的交通数据距离临近的K组历史交通数据。
其中,确定所述K-d树中每个维度的区分度包括:
针对每个维度,确定所述K-d树中该维度的历史交通数据的方差;
根据所述方差的大小,确定每个维度的区分度。
在本发明的上述实施例中针对K-d树中每个维度保存的历史交通数据,记录有每个维度的区分度。每个维度的区分度根据每个维度的历史交通数据的方差的大小确定,方差大的其区分度大。还以上述例子中K-d树中记录有288个维度进行说明,确定A、B、C、D四个维度的历史交通数据的方差分别为32、48、57和20,则可知四个维度的区分度从大到小的顺序为C、B、A、D。
在本发明的上述实施方式中,还包括:按照设定的时间间隔,对所述历史数据库中以K-d树保存的多个该设定时间长度内每个维度对应监测到的历史交通数据进行更新。
当对历史数据库中的历史交通数据进行更新后,需要重新确定每个维度的历史交通数据对应的区分度。该设定的时间间隔可以是一天、10天、半个月、三个月等。
图3为本发明实施例提供的该K-d树的构建及区分度记录过程,该过程包括以下步骤:
S301:针对每个维度,根据该维度对应的每个历史交通数据,确定该维度的中位数,其中,每个时间段监测的历史交通数据作为该K-d树的一个维度保存。
S302:针对每个维度,根据每组历史交通数据中该维度对应的交通数据与该维度的中位数的大小,将每组历史交通数据的该维度对应的历史交通数据保存在所述中位数的左子树或右子树中,并分别记录每个历史交通数据所在组的标识信息。
S303:针对每个维度,确定所述K-d树中每个维度的历史交通数据的方差;根据所述方差的大小,确定每个维度的区分度。
确定每个维度的区分度,可以在临近距离查找时,尽快的确定出距离临近的历史交通数据所在组的标识信息,根据区分度最大的维度的中位数与该维度对应的时间段监测的交通数据,确定该交通数据位于该中位数的左子树还是右子树,如果该交通数据位于该中位数的左子树中,则根据该左子树中记录的每个历史交通数据对应组的标识信息,可以在该对应组中查找与该当前时间段及该当前时间段之前的每个时间段监测的历史交通数据距离临近的K组历史交通数据。
相应的,也可以在查找与该当前时间段及该当前时间段之前的每个时间段监测的交通数据距离临近的K组历史交通数据时,根据该K-d树中记录的每个维度的区分度,该当前时间段及该当前时间段之前的时间段对应的维度,查找该当前时间段及该当前段之前的每个时间段对应的维度的区分度最大的至少一个维度。针对该至少一个维度,确定对应该维度的时间段的交通数据,位于该维度的中位数的左子树或右子树中,从而可以确定该中位数的左子树或右子树记录的每个历史交通数据对应组的标识信息。根据该至少一个维度对应的组的标识信息的交集,在该交集中查找与该当前时间段及该当前时间段之前的每个时间段监测的交通数据距离临近的K组历史交通数据。
例如该当前时间段为需要为1到5的时间段,对应K-d树中的1-5维,K-d树中1-5维的区分度从大到小的顺序分别为4、5、2、1、3,则相应的可以根据该区分度的大小顺序确定1-5维的区分度。在查找与该当前时间段及该当前时间段之前的每个时间段监测的交通数据距离临近的K组历史交通数时,可以只根据维度4、或者维度4、5,或者维度4、5、2,当然也可以是维度1-5,查找与该当前时间段及该当前时间段之前的每个时间段监测的交通数据距离临近的K组历史交通数据。
图4为本发明实施例提供的一种交通数据短时预测装置结构示意图,用于预测监测地点的交通数据,该装置包括:
第一确定模块41,用于根据设定时间长度内时间段的划分规则,确定当前时间段、当前时间段之前的每个时间段对应的维度;
查找模块42,用于采用K近邻KNN算法在历史数据库中,查找与该当前时间段及该当前时间段之前的每个时间段监测的交通数据距离临近的K组历史交通数据,其中所述历史数据库中基于K维K-d树保存有多个该设定时间长度内每个维度对应监测到的历史交通数据,K为大于零的整数;
第二确定模块43,用于根据当前时间段的维度,确定该当前时间段的下一时间段的第一维度;
预测模块44,用于根据K组历史交通数据中该第一维度对应的监测到的历史交通数据,及所述K组历史交通数据对应的权重系数,预测该当前时间段的下一时间段的交通数据。
所述装置还包括:
生成模块45,用于针对每个维度,根据该维度对应的每个历史交通数据,确定该维度的中位数,其中每个时间段监测的历史交通数据作为该K-d树的一个维度保存;针对每个维度,根据每组历史交通数据中该维度对应的历史交通数据与该维度的中位数的大小,将每组历史交通数据的该维度对应的历史交通数据保存在所述中位数的左子树或右子树中,并分别记录每个历史交通数据所在组的标识信息,其中每个设定时间长度的每个时间段监测的交通数据作为一组历史交通数据。
所述查找模块42,具体用于根据针对该K-d树记录的每个维度的区分度,该当前时间段及该当前时间段之前的时间段对应的维度,查找该当前时间段及该当前段之前的时间段对应的维度的区分度最大的至少一个维度;根据该至少一个维度,将该维度对应的交通数据与历史数据库中对应维度的中位数进行比较,确定该交通数据在该维度的中位数的左子树或右子树中,并确定该中位数的左子树或右子树中记录的每个历史交通数据对应组的标识信息;确定该至少一个维度对应组的标识信息的交集,根据该交集中每个组的标识信息,在每个组对应的历史交通数据中查找与该当前时间段及该当前时间段之前的每个时间段监测的交通数据距离临近的K组历史交通数据。
所述生成模块45,还用于针对每个维度,确定所述K-d树中该维度的历史交通数据的方差;根据所述方差的大小,确定每个维度的区分度。
所述装置还包括:
更新模块46,用于按照设定的时间间隔,对所述历史数据库中以K-d树保存的多个该设定时间长度内每个维度对应监测到的历史交通数据进行更新。
所述预测模块44,具体用于根据K组历史交通数据与该当前时间段及该当前时间段之前的每个时间段监测的交通数据的距离的倒数,确定每组历史交通数据对应的权重系数;
根据确定的每组历史交通数据对应的权重系数,及每组历史交通数据中该第一维度对应监测到的历史交通数据,预测该当前时间段的下一时间段的交通数据。
所述预测模块44,具体用于根据确定每组历史交通数据对应的权重系数,其中,βi为第i组历史交通数据对应的权重系数,di为第i组历史交通数据与该当前时间段及该当前时间段之前的每个时间段监测的交通数据的距离,K为大于1的整数。
本发明实施例提供了一种交通数据短时预测方法及装置,用于预测监测地点的交通数据,该方法包括:根据该当前时间段及该当前时间段之前的每个时间段监测的交通数据,在历史数据库中查找与该当前时间段及该当前时间段之前的每个时间段监测的交通数据距离临近的K组历史交通数据,其中所述历史数据库中基于K维树K-d树保存有多个该设定时间长度内每个维度对应监测到的历史交通数据,根据该当前时间段下一时间段的第一维度,及查找到的K组历史交通数据中该第一维度对应的监测到的历史交通数据,预测该当前时间段的下一时间段的交通数据。由于在本发明实施例中采用KNN算法进行预测,避免了参数设置等问题,可以保证预测的准确性,另外,历史数据库中是基于K-d树保存的每个维度对应的监测到的历史交通数据,因此在对进行交通数据邻近搜索时,可以提高搜索的效率,降低KNN运算的耗时,提高交通数据短时预测的效率。
对于系统/装置实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本领域普通技术人员可以理解实现上述方法实施方式中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,所述的程序可以存储于计算机可读取存储介质中,这里所称得的存储介质,如:ROM/RAM、磁碟、光盘等。
以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。
Claims (13)
1.一种交通数据短时预测方法,其特征在于,用于预测监测地点的交通数据,所述方法包括:
根据设定时间长度内时间段的划分规则,确定当前时间段、当前时间段之前的每个时间段对应的维度;
采用K近邻KNN算法在历史数据库中,根据针对K-d树记录的每个维度的区分度,所述当前时间段及所述当前时间段之前的每个时间段对应的维度,查找所述当前时间段及所述当前段之前的每个时间段对应的维度的区分度最大的至少一个维度;其中,所述历史数据库中基于K-d树保存有多个该设定时间长度内每个维度对应监测到的历史交通数据,K为大于零的整数;
根据所述至少一个维度,将所述至少一个维度对应的交通数据与所述历史数据库中对应维度的中位数进行比较,确定该交通数据在该维度的中位数的左子树或右子树中,并确定该中位数的左子树或右子树中记录的每个历史交通数据对应组的标识信息;其中,所述历史数据库中每个维度的中位数是根据所述历史数据库该维度对应的每个历史交通数据确定的;
确定所述至少一个维度对应的组的标识信息的交集,根据所述交集中每个组的标识信息,在每个组对应的历史交通数据中查找与所述当前时间段及所述当前时间段之前的每个时间段监测的交通数据距离临近的K组历史交通数据;根据当前时间段的维度,确定该当前时间段的下一时间段的第一维度;
根据K组历史交通数据中该第一维度对应监测到的历史交通数据,及所述K组历史交通数据对应的权重系数,预测该当前时间段的下一时间段的交通数据。
2.如权利要求1所述的方法,其特征在于,生成基于K-d树保存的多个该设定时间长度内每个维度对应监测到的历史交通数据包括:
针对每个维度,根据该维度对应的每个历史交通数据,确定该维度的中位数,其中每个时间段监测的历史交通数据作为该K-d树的一个维度保存;
针对每个维度,根据每组历史交通数据中该维度对应的历史交通数据与该维度的中位数的大小,将每组历史交通数据的该维度对应的交通数据保存在所述中位数的左子树或右子树中,并分别记录每个历史交通数据所在组的标识信息,其中每个设定时间长度的每个时间段监测的历史交通数据作为一组历史交通数据。
3.如权利要求1所述的方法,其特征在于,确定所述K-d树中每个维度的区分度包括:
针对每个维度,确定所述K-d树中该维度的历史交通数据的方差;
根据所述方差的大小,确定每个维度的区分度。
4.如权利要求1-3任一项所述的方法,其特征在于,所述方法还包括:
按照设定的时间间隔,对所述历史数据库中以K-d树保存的多个该设定时间长度内每个维度对应监测到的历史交通数据进行更新。
5.如权利要求1-3任一项所述的方法,其特征在于,所述根据K组历史交通数据中该第一维度对应监测到的交通数据,及所述K组历史交通数据对应的权重系数,预测该当前时间段的下一时间段的交通数据包括:
根据该K组历史交通数据与该当前时间段及该当前时间段之前的每个时间段监测的交通数据的距离的倒数,确定每组历史交通数据对应的权重系数;
根据确定的每组历史交通数据对应的权重系数,及每组历史交通数据中该第一维度对应监测到的历史交通数据,预测该当前时间段的下一时间段的交通数据。
6.如权利要求5所述的方法,其特征在于,所述根据K组历史交通数据与该当前时间段及该当前时间段之前的每个时间段监测的交通数据的距离的倒数,确定每组历史交通数据对应的权重系数包括:
根据确定每组历史交通数据对应的权重系数,其中,βi为第i组历史交通数据对应的权重系数,di为第i组历史交通数据与该当前时间段及该当前时间段之前的每个时间段监测的交通数据的距离,K为大于0的整数。
7.如权利要求1所述的方法,其特征在于,所述交通数据包括:交通流量数据,或交通违法车辆的数据。
8.一种交通数据短时预测装置,其特征在于,用于预测监测地点的交通数据,所述装置包括:
第一确定模块,用于根据设定时间长度内时间段的划分规则,确定当前时间段、当前时间段之前的每个时间段对应的维度;
查找模块,用于采用K近邻KNN算法在历史数据库中,根据针对K-d树记录的每个维度的区分度,所述当前时间段及所述当前时间段之前的每个时间段对应的维度,查找所述当前时间段及所述当前段之前的每个时间段对应的维度的区分度最大的至少一个维度;根据所述至少一个维度,将所述至少一个维度对应的交通数据与所述历史数据库中对应维度的中位数进行比较,确定该交通数据在该维度的中位数的左子树或右子树中,并确定该中位数的左子树或右子树中记录的每个历史交通数据对应组的标识信息;确定所述至少一个维度对应的组的标识信息的交集,根据所述交集中每个组的标识信息,在每个组对应的历史交通数据中查找与所述当前时间段及所述当前时间段之前的每个时间段监测的交通数据距离临近的K组历史交通数据;其中,所述历史数据库中K维K-d树保存有多个该设定时间长度内每个维度对应监测到的历史交通数据,K为大于零的整数;所述历史数据库中每个维度的中位数是根据所述历史数据库该维度对应的每个历史交通数据确定的;
第二确定模块,用于根据当前时间段的维度,确定该当前时间段的下一时间段的第一维度;
预测模块,用于根据K组历史交通数据中该第一维度对应的监测到的历史交通数据,及所述K组历史交通数据对应的权重系数,预测该当前时间段的下一时间段的交通数据。
9.如权利要求8所述的装置,其特征在于,所述装置还包括:
生成模块,用于针对每个维度,根据该维度对应的每个历史交通数据,确定该维度的中位数,其中每个时间段监测的历史交通数据作为该K-d树的一个维度保存;针对每个维度,根据每组历史交通数据中该维度对应的历史交通数据与该维度的中位数的大小,将每组历史交通数据的该维度对应的历史交通数据保存在所述中位数的左子树或右子树中,并分别记录每个历史交通数据所在组的标识信息,其中每个设定时间长度的每个时间段监测的交通数据作为一组历史交通数据。
10.如权利要求9所述的装置,其特征在于,所述生成模块,还用于针对每个维度,确定所述K-d树中该维度的历史交通数据的方差;根据所述方差的大小,确定每个维度的区分度。
11.如权利要求8-10任一项所述的装置,其特征在于,所述装置还包括:
更新模块,用于按照设定的时间间隔,对所述历史数据库中以K-d树保存的多个该设定时间长度内每个维度对应监测到的历史交通数据进行更新。
12.如权利要求8-10任一项所述的装置,其特征在于,所述预测模块,具体用于根据K组历史交通数据与该当前时间段及该当前时间段之前的每个时间段监测的交通数据的距离的倒数,确定每组历史交通数据对应的权重系数;
根据确定的每组历史交通数据对应的权重系数,及每组历史交通数据中该第一维度对应监测到的历史交通数据,预测该当前时间段的下一时间段的交通数据。
13.如权利要求12所述的装置,其特征在于,所述预测模块,具体用于根据确定每组历史交通数据对应的权重系数,其中,βi为第i组历史交通数据对应的权重系数,di为第i组历史交通数据与该当前时间段及该当前时间段之前的每个时间段监测的交通数据的距离,K为大于0的整数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510579073.5A CN106530685B (zh) | 2015-09-11 | 2015-09-11 | 一种交通数据短时预测方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510579073.5A CN106530685B (zh) | 2015-09-11 | 2015-09-11 | 一种交通数据短时预测方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106530685A CN106530685A (zh) | 2017-03-22 |
CN106530685B true CN106530685B (zh) | 2019-06-21 |
Family
ID=58346692
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510579073.5A Active CN106530685B (zh) | 2015-09-11 | 2015-09-11 | 一种交通数据短时预测方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106530685B (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108680178A (zh) * | 2018-02-22 | 2018-10-19 | 北京交通大学 | 基于定位信息与路径数据分享的未来交通规划系统和方法 |
CN110503822A (zh) * | 2018-05-18 | 2019-11-26 | 杭州海康威视系统技术有限公司 | 确定交通方案的方法和装置 |
CN108764565A (zh) * | 2018-05-25 | 2018-11-06 | 广州有轨电车有限责任公司 | 一种储能式有轨电车最大续航里程的预测方法 |
CN109598933B (zh) * | 2018-12-10 | 2021-09-03 | 南京邮电大学 | 一种基于数据驱动的k邻近非参数回归的交通流预测方法 |
CN109598936B (zh) * | 2018-12-18 | 2020-01-10 | 中国科学院地理科学与资源研究所 | 一种基于动态stknn模型的短时交通预测方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102034350A (zh) * | 2009-09-30 | 2011-04-27 | 北京四通智能交通系统集成有限公司 | 交通流数据短时预测方法及系统 |
CN102693633A (zh) * | 2012-06-07 | 2012-09-26 | 浙江大学 | 一种短时交通流加权组合预测方法 |
CN105469599A (zh) * | 2015-12-01 | 2016-04-06 | 上海交通大学 | 车辆轨迹跟踪和车辆行为预测方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8566030B1 (en) * | 2011-05-03 | 2013-10-22 | University Of Southern California | Efficient K-nearest neighbor search in time-dependent spatial networks |
-
2015
- 2015-09-11 CN CN201510579073.5A patent/CN106530685B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102034350A (zh) * | 2009-09-30 | 2011-04-27 | 北京四通智能交通系统集成有限公司 | 交通流数据短时预测方法及系统 |
CN102693633A (zh) * | 2012-06-07 | 2012-09-26 | 浙江大学 | 一种短时交通流加权组合预测方法 |
CN105469599A (zh) * | 2015-12-01 | 2016-04-06 | 上海交通大学 | 车辆轨迹跟踪和车辆行为预测方法 |
Non-Patent Citations (5)
Title |
---|
Comparison of Parametric and Non-parametric Models for Traffic Flow Forecasting;Smith B L Et al.;《Transportation Research Part C:Emerging Technologies》;20020831;第10卷(第4期);第303-321页 |
Researth on K Nearest Non-parametric Regression Algorithm Based on KD-Tree and Clustering Analysis;Zheng-Wu Yuan Et al.;《2012 Fourth International Conference on Computational and Information Sciences》;20121213;第298-301页 |
一种基于MapReduce的短时交通流预测方法;梁轲等;《计算机工程》;20150131;第41卷(第1期);第174-179页 |
基于遗传算法优化和KD树的交通流非参数回归预测方法;贾宁等;《控制与决策》;20120731;第27卷(第7期);第991-996页 |
短时交通流预测算法研究;王元辉;《中国学位论文全文数据库》;20131231;正文第1-50页 |
Also Published As
Publication number | Publication date |
---|---|
CN106530685A (zh) | 2017-03-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106530685B (zh) | 一种交通数据短时预测方法及装置 | |
CN110245981B (zh) | 一种基于手机信令数据的人群类型识别方法 | |
US20200211374A1 (en) | System, method, and apparatus for analyzing a traffic road condition | |
Li et al. | Traffic density-based discovery of hot routes in road networks | |
CN111081016B (zh) | 一种基于复杂网络理论的城市交通异常识别方法 | |
CN108109382B (zh) | 基于复合网络的拥堵点、拥堵线、拥堵区域的发现方法 | |
Liu et al. | Hydra: A personalized and context-aware multi-modal transportation recommendation system | |
CN104050817B (zh) | 限速信息库生成、限速信息检测的方法和系统 | |
US11305780B2 (en) | Road condition status prediction method, device, and server, and storage medium | |
Deng et al. | Trajectory indexing and retrieval | |
CN110836675B (zh) | 一种基于决策树的自动驾驶搜索决策方法 | |
CN110880238B (zh) | 一种基于手机通信大数据的道路拥堵监测方法 | |
CN104318327A (zh) | 一种车辆轨迹预测分析方法 | |
CN106935030A (zh) | 一种高速公路安全隐患路段识别方法和装置 | |
Ghadi et al. | Integration of probability and clustering based approaches in the field of black spot identification | |
CN104282142B (zh) | 一种基于出租车gps数据的公交站台设置方法 | |
Garg et al. | Mining bus stops from raw GPS data of bus trajectories | |
CN110021161B (zh) | 一种交通流向的预测方法及系统 | |
Wang et al. | Trajectory analysis at intersections for traffic rule identification | |
Yadamjav et al. | Querying recurrent convoys over trajectory data | |
Wan et al. | DBH-CLUS: A hierarchal clustering method to identify pick-up/drop-off hotspots | |
Fujino et al. | Detecting deviations from intended routes using vehicular GPS tracks | |
Qi et al. | Recurrent and non-recurrent bottleneck analysis based on traffic state rank distribution | |
Pincay et al. | Partitioning space to identify en-route movement patterns | |
CN110264725A (zh) | 路段流量的确定方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |