CN110866638A

CN110866638A - 交通量预测模型构建方法、装置、计算机设备和存储介质

Info

Publication number: CN110866638A
Application number: CN201911079251.2A
Authority: CN
Inventors: 肖捡花
Original assignee: Huaihua University
Current assignee: Huaihua University
Priority date: 2019-11-07
Filing date: 2019-11-07
Publication date: 2020-03-06

Abstract

本申请涉及一种交通量预测模型构建方法、装置、计算机设备和存储介质。所述方法包括：根据预设的分类因子对预设的样本数据块集合中样本数据块进行更新，得到目标样本数据块，目标样本数据块包括携带分类标签的样本数据，根据携带分类标签的样本数据进行学习，得到与目标样本数据块对应的分类模型，并确定分类模型的错误率，获取分类模型的模型参数，并根据模型参数、错误率以及预设的核函数式，得到初始交通量预测模型，实时获取概念漂移数据，根据概念漂移数据和初始交通量预测模型，得到交通量预测模型。采用本方法能够得到准确度高的交通量预测模型。

Description

交通量预测模型构建方法、装置、计算机设备和存储介质

技术领域

本申请涉及交通管理技术领域，特别是涉及一种交通量预测模型构建方法、装置、计算机设备和存储介质。

背景技术

随着时代的发展，个人拥有的汽车数量不断增多，给交通管理带来了沉重的压力，其中最棘手的问题就是交通拥堵。常用的缓解交通拥堵的方式为进行交通量预测，根据预测的交通量进行规划管理，交通量预测用于确定未来时间窗口中的交通流量，旨在实现实时控制和引导交通流量。传统的交通量预测方法为构建交通量预测模型，根据历史交通量数据和交通量预测模型进行交通量预测。

然而，因为快速变化的环境，当前交通量预测模型存在准确度低的问题。

发明内容

基于此，有必要针对上述技术问题，提供一种能够提高交通量预测模型准确度的交通量预测模型构建方法、装置、计算机设备和存储介质。

一种交通量预测模型构建方法，所述方法包括：

根据预设的分类因子对预设的样本数据块集合中样本数据块进行更新，得到目标样本数据块，目标样本数据块包括携带分类标签的样本数据；

根据携带分类标签的样本数据进行学习，得到与目标样本数据块对应的分类模型，并确定分类模型的错误率；

获取分类模型的模型参数，并根据模型参数、错误率以及预设的核函数式，得到初始交通量预测模型；

实时获取概念漂移数据，根据概念漂移数据和初始交通量预测模型，得到交通量预测模型。

在其中一个实施例中，预设的分类因子对预设的样本数据块集合中样本数据块进行更新之前，还包括：

获取交通流数据，根据预设的交通量季节模型对交通流数据进行平滑处理，得到已处理交通流数据；

将已处理交通流数据根据预设的数据块大小进行分块处理，得到样本数据块集合。

在其中一个实施例中，根据预设的分类因子对预设的样本数据块集合中样本数据块进行更新，得到目标样本数据块包括：

根据分类因子对样本数据块中各样本数据进行更新，并确定与各样本数据对应的分类标签，得到携带分类标签的样本数据；

根据携带分类标签的样本数据，得到目标样本数据块。

在其中一个实施例中，根据分类因子对样本数据块中各样本数据进行更新，并确定与各样本数据对应的分类标签，得到携带分类标签的样本数据包括：

获取各样本数据中的响应变量，根据分类因子对响应变量进行更新，根据更新后的响应变量对各样本数据进行更新；

确定分类因子对响应变量进行更新的运算符，根据运算符确定与各样本数据对应的分类标签，得到携带分类标签的样本数据。

在其中一个实施例中，根据携带分类标签的样本数据进行学习，得到与目标样本数据块对应的分类模型，并确定分类模型的错误率包括：

将样本数据作为输入，并将分类标签作为输出进行学习，得到与目标样本数据块对应的分类模型；

将目标样本数据块中各样本数据输入分类模型，得到各样本数据的预测输出值；

比对样本数据的预测输出值和与样本数据对应的分类标签；

根据比对结果确定分类模型的错误率。

在其中一个实施例中，获取分类模型的模型参数，并根据模型参数、错误率以及预设的核函数式，得到初始交通量预测模型包括：

获取分类模型的模型参数，根据模型参数和预设的核函数式，得到样本数据块集合的核函数；

根据分类模型的错误率，得到分类模型的权重因子；

根据核函数、权重因子以及样本数据块集合，集成得到样本数据块集合的分类超平面；

根据分类超平面，得到初始交通量预测模型。

在其中一个实施例中，实时获取概念漂移数据，根据概念漂移数据和初始交通量预测模型，得到交通量预测模型包括：

实时获取概念漂移数据，将概念漂移数据输入至初始交通量预测模型中，得到概念漂移数据的预测值；

根据概念漂移数据和概念漂移数据的预测值得到样本概念漂移数据块，根据概念漂移数据块更新样本数据块集合；

对更新后的样本数据块集合进行学习，得到交通量预测模型。

一种交通量预测模型构建装置，所述装置包括：

更新模块，用于根据预设的分类因子对预设的样本数据块集合中样本数据块进行更新，得到目标样本数据块，目标样本数据块包括携带分类标签的样本数据；

学习模块，用于根据携带分类标签的样本数据进行学习，得到与目标样本数据块对应的分类模型，并确定分类模型的错误率；

第一处理模块，用于获取分类模型的模型参数，并根据模型参数、错误率以及预设的核函数式，得到初始交通量预测模型；

第二处理模块，用于实时获取概念漂移数据，根据概念漂移数据和初始交通量预测模型，得到交通量预测模型。

一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，所述处理器执行所述计算机程序时实现以下步骤：

一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现以下步骤：

上述交通量预测模型构建方法、装置、计算机设备和存储介质，根据预设的分类因子对预设的样本数据块集合中样本数据块进行更新，能够得到目标样本数据块，在目标样本数据块中包括携带分类标签的样本数据，通过对携带分类标签的样本数据进行学习，能够得到准确的与目标样本数据块对应的分类模型，并得到分类模型的模型参数和错误率，从而可以根据模型参数、错误率以及预设的核函数式，得到准确的初始交通量预测模型，进而获取因快速变化的环境产生的概念漂移数据，通过概念漂移数据和初始交通量预测模型，得到交通量预测模型，在交通量预测模型中考虑到了快速变化的环境，并及时根据概念漂移数据对准确的初始交通量预测模型进行了更新，所以可以得到准确度高的交通量预测模型。

附图说明

图1为一个实施例中交通量预测模型构建方法的应用场景图；

图2为一个实施例中交通量预测模型构建方法的流程示意图；

图3为另一个实施例中交通量预测模型构建方法的流程示意图；

图4为一个实施例中选取的四个交通量收集站点的示意图；

图5为一个实施例中参数敏感性测试和评估的结果示意图；

图6为一个实施例中性能评估的示意图；

图7为另一个实施例中性能评估的示意图；

图8为一个实施例中交通量预测模型构建装置的结构框图；

图9为一个实施例中计算机设备的内部结构图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行进一步详细说明。应当理解，此处描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。

本申请提供的交通量预测模型构建方法，可以应用于如图1所示的应用环境中。其中，终端102通过网络与服务器104进行通信。终端102采集交通流数，服务器104通过终端102获取交通流数据，根据预设的交通量季节模型对交通流数据进行平滑处理，得到已处理交通流数据，将已处理交通流数据根据预设的数据块大小进行分块处理，得到样本数据块集合，根据预设的分类因子对样本数据块集合中样本数据块进行更新，得到目标样本数据块，目标样本数据块包括携带分类标签的样本数据，根据携带分类标签的样本数据进行学习，得到与目标样本数据块对应的分类模型，并确定分类模型的错误率，获取分类模型的模型参数，并根据模型参数、错误率以及预设的核函数式，得到初始交通量预测模型，实时获取概念漂移数据，根据概念漂移数据和初始交通量预测模型，得到交通量预测模型。其中，终端102可以但不限于是各种设置在道路边的交通流采集设备。服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。

在一个实施例中，如图2所示，提供了一种交通量预测模型构建方法，以该方法应用于图1中的服务器为例进行说明，包括以下步骤：

S202，根据预设的分类因子对预设的样本数据块集合中样本数据块进行更新，得到目标样本数据块，目标样本数据块包括携带分类标签的样本数据。

其中，预设的分类因子可按照需要自行设置，分类因子具体可以为0～1之间的任意值。预设的样本数据块集合是指事先获取的样本数据块集合，在样本数据块集合中包括多个样本数据块，在各样本数据块中包括多个样本数据。目标样本数据块是指根据分类因子进行更新过后的样本数据块。分类标签是指用于区分样本数据的标签，分类标签可以根据进行更新的方式确定，不同的更新方式对应不同的分类标签。

其中，交通流数据是指预设时间段内的历史交通流数据，预设时间段可按照需要自行设置，比如，预设时间段具体可以为一个礼拜。交通量季节模型是指整合的移动平均自回归模型，在其中融入了对交通量变化的特性。比如，融入了对交通量变化的特征具体可以是指，今天当前时刻的交通量，与今天上一时刻的交通、昨天以及上周对应的上一时刻的交通量有关，这就是交通量所拥有的季节特性。根据交通量所拥有的季节特性，可以实现通过今天上一时刻的交通、昨天以及上周对应的上一时刻的交通量等，对今天当前时刻的交通量进行预测。

根据预设的交通量季节模型对交通流数据进行平滑处理，是指将各交通流数据关联起来，形成各交通流数据的关联关系。例如，具体可以是，将今天某一时刻的交通量，与今天该时刻上一时刻的交通量、昨天该时刻的上一时刻交通量以及上周对应的上一时刻的交通量，以及它们的差值关联起来。上周对应的上一时刻是指上周对应的星期数的上一时刻。又例如，若想得到某条路或路口今天(星期三)12点的交通量，就需要得到今天12点上一刻的交通量，以及昨天(星期二)12点上一刻的交通量，以及上一周的星期三12点的上一刻的交通量，以及这三个值两两相减的差值。再例如，得到今天当前时刻的交通量与其他时刻交通量的关联关系具体可以为进行如下处理：

{(X,y)|X＝[v_i-1,v_i-1-v_i-2,v_i-week,v_i-week-v_i-week-1,v_i-day,v_i-day-v_i-day-1]^T,y＝v_i}(1)

其中，属性特征X向量由上一时刻的交通量、上周当天的同一时刻的上一时刻的交通量以及前一天的同一时刻的上一时刻的交通量，以及它们的差值构成，响应变量y是今天当前时刻的交通量的值。

已处理交通流数据是指通过平滑处理后得到的样本数据，在平滑处理后，可以得到今天当前时刻的交通量与其他交通量的关联关系，根据该关联关系可以得到一个由今天当前时刻的交通量以及与它关联的交通量组成的向量。例如，公式(1)对应的向量可以为：S_R＝{(X_i,y_i)|X_i∈Rⁿ,y_i∈R,i＝1,2,...}(2)。预设的数据块大小可以按照需要自行设置，将已处理交通流数据根据预设的数据块大小进行分块处理，就可以得到样本数据块集合。通过这种方式对交通流数据进行平滑处理得到已处理交通流数据，并将已处理交通流数据进行分块处理，能够得到关联性强且合理的样本数据块集合。

根据携带分类标签的样本数据，得到目标样本数据块。

其中，根据分类因子对样本数据块中各样本数据进行更新，是指将分类因子加入各样本数据中，得到更新的样本数据。分类标签与各样本数据对应，不同的样本数据有不同的分类标签，但是由于同一个样本数据块中各样本数据是进行了相同的更新操作，所以同一个样本数据块中各样本数据的分类标签是相同的。与各样本数据对应的分类标签可以根据该样本数据进行的更新操作确定，在确定了分类标签后，就可以得到携带分类标签的样本数据，进而可以根据该携带分类标签的样本数据，得到目标样本数据块。通过引入分类因子，能实现对样本数据的分类，进而实现对样本数据块的分类，从而为训练分类模型提供数据支持。

其中，各样本数据中的响应变量即是指今天当前时刻的交通量，该响应变量可以由与今天当前时刻的交通量相关的其他交通量表示，比如，响应变量可以是公式(2)中的y_i。根据分类因子对响应变量进行更新，是指将分类因子加入响应变量中，得到新的响应变量，进而可以根据新的响应变量对各样本数据进行更新，即将新的响应变量替换原响应变量。具体进行更新的方式可以为将响应变量加上分类因子或者将响应变量减去分类因子。进行更新的运算符是指在进行更新时用的加运算符和减运算符。根据运算符确定与各样本数据对应的分类标签，是指给不同的运算符确定不同的标签，比如，可以确定加运算的分类标签为1，减运算的分类标签为-1。在确定与各样本数据对应的分类标签的时候，即可通过该分类标签标记样本数据，得到携带分类标签的样本数据。通过这种方式，能够实现对携带分类标签的样本数据的获取，从而为训练分类模型提供数据支持。

S204，根据携带分类标签的样本数据进行学习，得到与目标样本数据块对应的分类模型，并确定分类模型的错误率。

其中，根据携带分类标签的样本数据进行学习，是指根据携带标签的样本数据进行有监督学习，通过有监督学习，就可以得到与目标样本数据块对应的分类模型，在得到分类模型后，就可以根据该分类模型的输出结果，确定分类模型的错误率。分类模型的错误率是指在得到分类模型后，根据分类模型对样本数据进行预测时，预测输出值与该样本数据的分类标签不同的概率。比如，当目标样本数据块中存在一百个样本数据时，若在进行预测时，有十个样本数据的预测输出值与该样本数据的分类标签不同时，该分类模型的错误率即为0.1。

比对样本数据的预测输出值和与样本数据对应的分类标签；

根据比对结果确定分类模型的错误率。

其中，进行学习的方式可以为，将样本数据作为输入，并将分类标签作为输出进行学习。分类标签可以用值表示，比如，当进行二分类时，分类标签具体可以为1和-1、0和1等。通过这种有监督学习的方式，就可以得到与目标样本数据块对应的分类模型。在得到目标样本数据块的分类模型后，服务器会将目标样本数据块中各样本数据输入分类模型，得到各样本数据的预测输出值，并通过比对样本数据的预测输出值和与样本数据对应的分类标签，确定该分类模型的错误率，当样本数据的预测输出值与样本数据对应的分类标签不相同时，可认为对该样本数据来说，分类模型的判断是错误的，通过统计被分类模型判断错误的样本数据的数量，并将其与目标样本数据块中样本数据的总量进行比对，就可以得到分类模型的错误率。通过样本数据作为输入，并将分类标签作为输出进行学习的方式，可以得到与目标样本数据块对应的分类模型，进而再根据样本数据和分类标签，可以得到该分类模型的错误率，实现了对分类模型的错误率的获取，从而为得到初始交通量预测模型提供数据支撑。

S206，获取分类模型的模型参数，并根据模型参数、错误率以及预设的核函数式，得到初始交通量预测模型。

其中，分类模型的模型参数是指在进行分类学习后得到的目标样本数据块的分类模型的参数。模型参数包括支持向量、惩罚因子以及偏差值等。核函数式是指核函数的表达式。支持向量机通过某非线性变换

将输入空间映射到高维特征空间。特征空间的维数可能非常高。如果支持向量机的求解只用到内积运算，而在低维输入空间又存在某个函数K(x,x₁)，它恰好等于在高维空间中这个内积，即

那么支持向量机就不用计算复杂的非线性变换，而由这个函数K(x,x₁)直接得到非线性变换的内积，使大大简化了计算，这样的函数K(x,x₁)称为核函数。初始交通量预测模型是指根据样本数据块集合确定的、可用于进行交通量预测的模型。

根据分类模型的错误率，得到分类模型的权重因子；

根据分类超平面，得到初始交通量预测模型。

其中，根据模型参数中的支持向量和预设的核函数式，就可以得到样本数据块集合的核函数。比如，当选择最常用的多项式核函数式来进行公式推导时，其多项式核函数可以为：K(X^S,X)＝(γ(X^S)^TX+r)^d(3)，其中，X^S为支持向量，d表示阶数，γ用来表示类别的倒数，r为控制变量系数，阶数和倒数都是多项式核函数式已预先设定的，控制变量系数是分类模型中预设的。分类模型的权重因子用于表示各目标样本数据块的分类模型在所有目标样本数据块的分类模型中所占的权重。分类模型的权重因子可根据分类模型的错误率决定。比如，根据分类模型的错误率，得到分类模型的权重因子的方式可以为：计算各分类模型的错误率的对数值，以及各分类模型的错误率总和的对数值，根据各分类模型的错误率的对数值以及各分类模型的错误率总和的对数值，确定分类模型的权重因子。

其中，分类超平面是指综合考虑各分类模型的权重因子、核函数以及样本数据块集合得到的超平面。在线性不可分的情况下，需要利用核函数将样本映射到高维空间，然后就可以划分，例如分类平面不是直线，而是曲线或者复杂的曲线，或者曲面的时候。将核函数应用于集成分类回归平面就可以得到

(4)，其中C为模型参数中的惩罚因子，ω_k为分类模型的权重因子，b为模型参数中的偏差值。定义权值向量

则分类超平面都可以用

(5)表示，所以结合公式(4)和公式(5)通过矩阵运算，就可以得到集成分类超平面，该集成分类超平面可以描述如下：

通过求解公式(6)，就可以得到公式化后的回归决策超平面，回归决策超平面就可以表示初始交通量预测模型。具体的，回归决策超平面可以描述如下：

S208，实时获取概念漂移数据，根据概念漂移数据和初始交通量预测模型，得到交通量预测模型。

交通量属性漂移的概念，称为概念漂移。由于许多活动的发生，如道路建设和交通拥堵，交通量数据的分布会不断变化，进而发生概念漂移，因此需要对预测模型进行更新。概念漂移数据就是指最近的交通量数据，根据概念漂移数据和初始交通量预测模型，就可以对预测模型进行更新，从而得到交通量预测模型。进一步地，当再次获取到概念漂移数据时，服务器又会根据新的概念漂移数据对交通量预测模型进行更新，得到新的交通量预测模型。

其中，概念漂移数据的预测值是指概念漂移数据的响应值变量。通过概念漂移数据和概念漂移数据的预测值可以构造概念漂移数据的样本概念漂移数据，进而根据该样本概念漂移数据就可以得到样本概念漂移数据块。根据概念漂移数据块更新样本数据块集合就是指将概念漂移数据块加入至样本数据块集合中，得到更新的样本数据块集合，进而就可以对更新后的样本数据块集合进行学习，得到交通量预测模型。通过这种方式，能够实现根据因快速变化的环境产生的概念漂移数据对初始交通量预测模型的更新，得到准确度高的交通量预测模型。

上述交通量预测模型构建方法，根据预设的分类因子对预设的样本数据块集合中样本数据块进行更新，能够得到目标样本数据块，在目标样本数据块中包括携带分类标签的样本数据，通过对携带分类标签的样本数据进行学习，能够得到准确的与目标样本数据块对应的分类模型，并得到分类模型的模型参数和错误率，从而可以根据模型参数、错误率以及预设的核函数式，得到准确的初始交通量预测模型，进而获取因快速变化的环境产生的概念漂移数据，通过概念漂移数据和初始交通量预测模型，得到交通量预测模型，在交通量预测模型中考虑到了快速变化的环境，并及时根据概念漂移数据对准确的初始交通量预测模型进行了更新，所以可以得到准确度高的交通量预测模型。

在其中一个实施例中，如图3所示，通过一个最具体实施例来说明本申请中的交通量预测模型构建方法。

S302，获取交通流数据，根据预设的交通量季节模型对交通流数据进行平滑处理，得到已处理交通流数据；

S304，将已处理交通流数据根据预设的数据块大小进行分块处理，得到样本数据块集合；

S306，获取各样本数据块的各样本数据中的响应变量，根据分类因子对响应变量进行更新，根据更新后的响应变量对各样本数据进行更新；

S308，确定分类因子对响应变量进行更新的运算符，根据运算符确定与各样本数据对应的分类标签，得到携带分类标签的样本数据；

S310，根据携带分类标签的样本数据，得到目标样本数据块；

S312，将样本数据作为输入，并将分类标签作为输出进行学习，得到与目标样本数据块对应的分类模型；

S314，将目标样本数据块中各样本数据输入分类模型，得到各样本数据的预测输出值；

S316，比对样本数据的预测输出值和与样本数据对应的分类标签；

S318，根据比对结果确定分类模型的错误率；

S320，获取分类模型的模型参数，根据模型参数和预设的核函数式，得到样本数据块集合的核函数；

S322，根据分类模型的错误率，得到分类模型的权重因子；

S324，根据核函数、权重因子以及样本数据块集合，集成得到样本数据块集合的分类超平面；

S326，根据分类超平面，得到初始交通量预测模型；

S328，实时获取概念漂移数据，将概念漂移数据输入至初始交通量预测模型中，得到概念漂移数据的预测值；

S330，根据概念漂移数据和概念漂移数据的预测值得到样本概念漂移数据块，根据概念漂移数据块更新样本数据块集合；

S332，对更新后的样本数据块集合进行学习，得到交通量预测模型。

在其中一个实施例中，结合验证实验来对本申请的方案进行说明。

如图4所示，为验证实验选取的四个交通量收集站点。验证实验所设计的数据集均来自Caltrans Performance Measurement Systems(PeMS)上的公开数据，该系统每隔30s从超过15 000个单独的探测器收集交通量数据。探测器位于加利福尼亚州的高速公路系统中的所有州。在我们的实验中，我们选择了位于4条高速公路上的4个探测器，如图4所示。节点1(Node 1)是一条因其大规模交通拥堵而“臭名昭着”的高速公路。选择节点2(Node 2)是因为其位置靠近交叉道路。节点3(Node 3)是主要道路，节点4(Node 4)是在桥上。选择的时间范围是2016-11-6至2016-12-3，选择的原因是2016-11-23有严重的交通堵塞，这是概念漂移的代表性样本。

图5展示了本申请所提出方法中涉及的四个参数进行敏感性测试和评估，评价指标统一为均方根误差(RMSE)。目的是通过实验验证确定这些参数的最佳值。参数敏感度分析在4个节点的第一周数据上进行交叉验证。首先，我们评估窗口大小(块大小)。窗口大小主要取决于现实场景中的增量数据采集过程，结果如图5-1所示。很明显，四个节点的窗口大小的一般趋势非常相似。通过对四条曲线的分析，可以得出结论，较大的窗口尺寸将提高预测精度，但是窗口尺寸太大会降低空间效率。因此，在本申请所提出的方法的验证实验中，窗口大小将设置为3天。然后，对多项式核函数的参数进行灵敏度分析，即通过对不同的参数进行测试，选取出效果最优的值。多项式核的参数是γ，度d和r，其灵敏度分析实验结果分别如图5-2、5-3和5-4所示。根据多项式参数灵敏度分析的结果，很明显γ设置应大于3以获得稳定的结果。在我们的验证实验中，d只能设置为大约1。r参数对预测精度影响很小，最佳选择难以确定，通常就设为0。

图6和图7展示了在概念漂移环境下评估本申请所提出方法的性能，我们选择2016-11-23这一天，这是“臭名昭着”的大型交通拥堵的一天。由于交通量预测是基于交通量的历史变化，因此从异常历史交通量中恢复的能力直接表示处理概念漂移的能力。比较方法包括经典时间序列预测方法SARIMA，增量学习方法被动攻击回归(PAR)和集成学习方法额外树(ET)。在前一天，即2016-11-23，在8:00(时间指数20)开始出现严重的交通堵塞。随着时间的推移到第二天，交通量数据的统计特征开始逐渐变化，即发生概念漂移。2016-11-24从3:00到12:00的比较方法和本申请所提出的方法的预测结果示于图6和图7中。图6显示了预测模型和实际流量的预测值之间的比较，图7显示了它们的真实差异。从结果中可以看出，本申请所提出的方法在非平稳环境下的交通量预测中比其他方法更准确，并且概率漂移可能在时间索引20附近发生。首先，所提出的方法可以检测漂移并更新模型。因此，实验结果表明其值比其他方法更接近真实值。很明显，SARIMA和ET都受到这一事件的影响，因此从时间指数20开始的预测会减少太多(远离实际流量)。造成这种现象的主要原因是这两种方法无法训练新数据并且不更新模型，这是因为它们缺乏解决异常数据的能力。最后，因为PAR是一种增量方法，它可以训练新数据来更新训练模型，但它在检测分布变化方面没有那么强大。

应该理解的是，虽然图3的流程图中的各个步骤按照箭头的指示依次显示，但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明，这些步骤的执行并没有严格的顺序限制，这些步骤可以以其它的顺序执行。而且，图3中的至少一部分步骤可以包括多个子步骤或者多个阶段，这些子步骤或者阶段并不必然是在同一时刻执行完成，而是可以在不同的时刻执行，这些子步骤或者阶段的执行顺序也不必然是依次进行，而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。

在一个实施例中，如图8所示，提供了一种交通量预测模型构建装置，包括：更新模块802、学习模块804、第一处理模块806和第二处理模块808，其中：

更新模块802，用于根据预设的分类因子对预设的样本数据块集合中样本数据块进行更新，得到目标样本数据块，目标样本数据块包括携带分类标签的样本数据；

学习模块804，用于根据携带分类标签的样本数据进行学习，得到与目标样本数据块对应的分类模型，并确定分类模型的错误率；

第一处理模块806，用于获取分类模型的模型参数，并根据模型参数、错误率以及预设的核函数式，得到初始交通量预测模型；

第二处理模块808，用于实时获取概念漂移数据，根据概念漂移数据和初始交通量预测模型，得到交通量预测模型。

上述交通量预测模型构建装置，根据预设的分类因子对预设的样本数据块集合中样本数据块进行更新，能够得到目标样本数据块，在目标样本数据块中包括携带分类标签的样本数据，通过对携带分类标签的样本数据进行学习，能够得到准确的与目标样本数据块对应的分类模型，并得到分类模型的模型参数和错误率，从而可以根据模型参数、错误率以及预设的核函数式，得到准确的初始交通量预测模型，进而获取因快速变化的环境产生的概念漂移数据，通过概念漂移数据和初始交通量预测模型，得到交通量预测模型，在交通量预测模型中考虑到了快速变化的环境，并及时根据概念漂移数据对准确的初始交通量预测模型进行了更新，所以可以得到准确度高的交通量预测模型。

在其中一个实施例中，交通量预测模型构建装置还包括数据处理模块，数据处理模块用于获取交通流数据，根据预设的交通量季节模型对交通流数据进行平滑处理，得到已处理交通流数据，将已处理交通流数据根据预设的数据块大小进行分块处理，得到样本数据块集合。

在其中一个实施例中，更新模块还用于根据分类因子对样本数据块中各样本数据进行更新，并确定与各样本数据对应的分类标签，得到携带分类标签的样本数据，根据携带分类标签的样本数据，得到目标样本数据块。

在其中一个实施例中，更新模块还用于获取各样本数据中的响应变量，根据分类因子对响应变量进行更新，根据更新后的响应变量对各样本数据进行更新，确定分类因子对响应变量进行更新的运算符，根据运算符确定与各样本数据对应的分类标签，得到携带分类标签的样本数据。

在其中一个实施例中，学习模块还用于将样本数据作为输入，并将分类标签作为输出进行学习，得到与目标样本数据块对应的分类模型，将目标样本数据块中各样本数据输入分类模型，得到各样本数据的预测输出值，比对样本数据的预测输出值和与样本数据对应的分类标签，根据比对结果确定分类模型的错误率。

在其中一个实施例中，第一处理模块还用于获取分类模型的模型参数，根据模型参数和预设的核函数式，得到样本数据块集合的核函数，根据分类模型的错误率，得到分类模型的权重因子，根据核函数、权重因子以及样本数据块集合，集成得到样本数据块集合的分类超平面，根据分类超平面，得到初始交通量预测模型。

在其中一个实施例中，第二处理模块还用于实时获取概念漂移数据，将概念漂移数据输入至初始交通量预测模型中，得到概念漂移数据的预测值，根据概念漂移数据和概念漂移数据的预测值得到样本概念漂移数据块，根据概念漂移数据块更新样本数据块集合，对更新后的样本数据块集合进行学习，得到交通量预测模型。

关于交通量预测模型构建装置的具体限定可以参见上文中对于交通量预测模型构建方法的限定，在此不再赘述。上述交通量预测模型构建装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中，也可以以软件形式存储于计算机设备中的存储器中，以便于处理器调用执行以上各个模块对应的操作。

在一个实施例中，提供了一种计算机设备，该计算机设备可以是服务器，其内部结构图可以如图9所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中，该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储样本数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种交通量预测模型构建方法。

本领域技术人员可以理解，图9中示出的结构，仅仅是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的计算机设备的限定，具体的计算机设备可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

在一个实施例中，提供了一种计算机设备，包括存储器和处理器，该存储器存储有计算机程序，该处理器执行计算机程序时实现以下步骤：

上述交通量预测模型构建计算机设备，根据预设的分类因子对预设的样本数据块集合中样本数据块进行更新，能够得到目标样本数据块，在目标样本数据块中包括携带分类标签的样本数据，通过对携带分类标签的样本数据进行学习，能够得到准确的与目标样本数据块对应的分类模型，并得到分类模型的模型参数和错误率，从而可以根据模型参数、错误率以及预设的核函数式，得到准确的初始交通量预测模型，进而获取因快速变化的环境产生的概念漂移数据，通过概念漂移数据和初始交通量预测模型，得到交通量预测模型，在交通量预测模型中考虑到了快速变化的环境，并及时根据概念漂移数据对准确的初始交通量预测模型进行了更新，所以可以得到准确度高的交通量预测模型。

在一个实施例中，处理器执行计算机程序时还实现以下步骤：

根据携带分类标签的样本数据，得到目标样本数据块。

比对样本数据的预测输出值和与样本数据对应的分类标签；

根据比对结果确定分类模型的错误率。

根据分类模型的错误率，得到分类模型的权重因子；

根据分类超平面，得到初始交通量预测模型。

在一个实施例中，提供了一种计算机可读存储介质，其上存储有计算机程序，计算机程序被处理器执行时实现以下步骤：

上述交通量预测模型构建存储介质，根据预设的分类因子对预设的样本数据块集合中样本数据块进行更新，能够得到目标样本数据块，在目标样本数据块中包括携带分类标签的样本数据，通过对携带分类标签的样本数据进行学习，能够得到准确的与目标样本数据块对应的分类模型，并得到分类模型的模型参数和错误率，从而可以根据模型参数、错误率以及预设的核函数式，得到准确的初始交通量预测模型，进而获取因快速变化的环境产生的概念漂移数据，通过概念漂移数据和初始交通量预测模型，得到交通量预测模型，在交通量预测模型中考虑到了快速变化的环境，并及时根据概念漂移数据对准确的初始交通量预测模型进行了更新，所以可以得到准确度高的交通量预测模型。

在一个实施例中，计算机程序被处理器执行时还实现以下步骤：

根据携带分类标签的样本数据，得到目标样本数据块。

比对样本数据的预测输出值和与样本数据对应的分类标签；

根据比对结果确定分类模型的错误率。

根据分类模型的错误率，得到分类模型的权重因子；

根据分类超平面，得到初始交通量预测模型。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一非易失性计算机可读取存储介质中，该计算机程序在执行时，可包括如上述各方法的实施例的流程。其中，本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限，RAM以多种形式可得，诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。

以上实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本申请的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对发明专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本申请构思的前提下，还可以做出若干变形和改进，这些都属于本申请的保护范围。因此，本申请专利的保护范围应以所附权利要求为准。

Claims

1.一种交通量预测模型构建方法，所述方法包括：

根据预设的分类因子对预设的样本数据块集合中样本数据块进行更新，得到目标样本数据块，所述目标样本数据块包括携带分类标签的样本数据；

根据所述携带分类标签的样本数据进行学习，得到与所述目标样本数据块对应的分类模型，并确定所述分类模型的错误率；

获取所述分类模型的模型参数，并根据所述模型参数、所述错误率以及预设的核函数式，得到初始交通量预测模型；

实时获取概念漂移数据，根据所述概念漂移数据和所述初始交通量预测模型，得到交通量预测模型。

2.根据权利要求1所述的方法，其特征在于，所述预设的分类因子对预设的样本数据块集合中样本数据块进行更新之前，还包括：

获取交通流数据，根据预设的交通量季节模型对所述交通流数据进行平滑处理，得到已处理交通流数据；

将所述已处理交通流数据根据预设的数据块大小进行分块处理，得到样本数据块集合。

3.根据权利要求1所述的方法，其特征在于，所述根据预设的分类因子对预设的样本数据块集合中样本数据块进行更新，得到目标样本数据块包括：

根据所述分类因子对所述样本数据块中各样本数据进行更新，并确定与各所述样本数据对应的分类标签，得到携带分类标签的样本数据；

根据所述携带分类标签的样本数据，得到目标样本数据块。

4.根据权利要求3所述的方法，其特征在于，所述根据所述分类因子对所述样本数据块中各样本数据进行更新，并确定与各所述样本数据对应的分类标签，得到携带分类标签的样本数据包括：

获取各所述样本数据中的响应变量，根据所述分类因子对所述响应变量进行更新，根据更新后的响应变量对各所述样本数据进行更新；

确定所述分类因子对所述响应变量进行更新的运算符，根据所述运算符确定与各所述样本数据对应的分类标签，得到携带分类标签的样本数据。

5.根据权利要求1所述的方法，其特征在于，所述根据所述携带分类标签的样本数据进行学习，得到与所述目标样本数据块对应的分类模型，并确定所述分类模型的错误率包括：

将所述样本数据作为输入，并将所述分类标签作为输出进行学习，得到与所述目标样本数据块对应的分类模型；

将所述目标样本数据块中各样本数据输入所述分类模型，得到各所述样本数据的预测输出值；

比对所述样本数据的预测输出值和与所述样本数据对应的分类标签；

根据比对结果确定所述分类模型的错误率。

6.根据权利要求1所述的方法，其特征在于，所述获取所述分类模型的模型参数，并根据所述模型参数、所述错误率以及预设的核函数式，得到初始交通量预测模型包括：

获取所述分类模型的模型参数，根据所述模型参数和预设的核函数式，得到所述样本数据块集合的核函数；

根据所述分类模型的错误率，得到所述分类模型的权重因子；

根据所述核函数、所述权重因子以及所述样本数据块集合，集成得到所述样本数据块集合的分类超平面；

根据所述分类超平面，得到初始交通量预测模型。

7.根据权利要求1所述的方法，其特征在于，所述实时获取概念漂移数据，根据所述概念漂移数据和所述初始交通量预测模型，得到交通量预测模型包括：

实时获取概念漂移数据，将所述概念漂移数据输入至所述初始交通量预测模型中，得到所述概念漂移数据的预测值；

根据所述概念漂移数据和所述概念漂移数据的预测值得到样本概念漂移数据块，根据所述概念漂移数据块更新所述样本数据块集合；

8.一种交通量预测模型构建装置，其特征在于，所述装置包括：

更新模块，用于根据预设的分类因子对预设的样本数据块集合中样本数据块进行更新，得到目标样本数据块，所述目标样本数据块包括携带分类标签的样本数据；

学习模块，用于根据所述携带分类标签的样本数据进行学习，得到与所述目标样本数据块对应的分类模型，并确定所述分类模型的错误率；

第一处理模块，用于获取所述分类模型的模型参数，并根据所述模型参数、所述错误率以及预设的核函数式，得到初始交通量预测模型；

第二处理模块，用于实时获取概念漂移数据，根据所述概念漂移数据和所述初始交通量预测模型，得到交通量预测模型。

9.一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，其特征在于，所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述方法的步骤。

10.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。